Избавление от «заглядывания в будущее»: Новый подход к оценке языковых моделей

Рассмотрение всех конфигураций гиперпараметров и размеров моделей позволяет оценить взаимосвязь между вычислительными затратами и производительностью, выявляя оптимальные настройки для достижения баланса между точностью и эффективностью.

Исследователи предложили эффективный метод для удаления нежелательных знаний из больших языковых моделей прямо во время работы, что повышает надежность и предсказуемость их ответов.

Фоновый шум или скрытый сигнал: как окружение влияет на зрение нейросетей

На основе шести сгенерированных синтетических наборов данных продемонстрирована возможность создания искусственных данных для обучения и тестирования алгоритмов машинного обучения.

Новое исследование показывает, что внимание нейросетей к фоновым объектам при распознавании дорожных знаков не всегда снижает точность, а требует более глубокого анализа.

Преодолевая границы масштаба: новый подход к сверхразрешению

Анализ частотной характеристики различных архитектур показал, что модели, обученные при разрешении $64 \times 64$, демонстрируют специфические особенности в обработке сигналов разной частоты, определяющие их реакцию на входные данные.

Исследователи предложили метод, позволяющий повысить точность прогнозирования в задачах сверхразрешения и прогнозирования пространственно-временных данных, даже при обучении на низком разрешении.