Скрытая геометрия глубокого обучения: новый взгляд на оптимизацию
Исследование показывает, что обучение нейронных сетей с функцией активации ReLU может быть переформулировано как задача выпуклой оптимизации, открывая возможности для более стабильного и интерпретируемого обучения.


