Наука — Страница 215 — Прогноз курса

Поиск Иголки в Стоге Данных: Оценка Алгоритмов Обнаружения Аномалий

06.01.2026 от Рэй Далио

Новое исследование анализирует эффективность различных методов выявления редких отклонений в промышленных данных, где нормальные события значительно преобладают над аномальными.

Искусственный интеллект под прицелом: Как оценить достоверность ответов больших языковых моделей

06.01.2026 от Рэй Далио

Различие в точности оценки неопределённости между генерацией на основе единичного факта и генерацией на основе множественных фактов демонстрирует, что учёт нескольких источников информации позволяет существенно повысить надёжность прогнозов.

Новое исследование предлагает метод оценки надежности больших языковых моделей при генерации фактов, особенно в ситуациях, когда им задают провокационные или вводящие в заблуждение вопросы.

Адаптация моделей для временных рядов: новый взгляд на обнаружение аномалий

06.01.2026 от Рэй Далио

Зависимость между размером модели и ее способностью к обнаружению аномалий в режиме zero-shot демонстрирует, что увеличение числа параметров модели коррелирует с повышением среднего значения VUS-PR на бенчмарке TSB-AD-U, при этом размер пузырька на графике отражает относительную вычислительную емкость каждой модели.

Исследование сравнивает различные стратегии адаптации современных моделей для анализа временных рядов, позволяющие эффективно выявлять аномалии.

Машинное обучение: как понять, что скрыто внутри?

06.01.2026 от Рэй Далио

Сравнительный анализ рангов, полученных в задачах классификации как на обучающей, так и на тестовой выборках, демонстрирует сопоставимую эффективность модели в обеих условиях.

Новое исследование сравнивает различные методы интерпретируемого машинного обучения, чтобы выяснить, как они работают на разных типах данных.

Иллюзия озарения: как языковые модели «думают»

05.01.2026 от Рэй Далио

$В процессе логических рассуждений модели Qwen2.5 и Llama демонстрируют моменты внезапного озарения, когда фраза, подобная «Подождите… давайте переоценим», сигнализирует о переходе от неэффективной стратегии ([latex]k \in \{1,2\}[/latex]) к успешной ([latex]k=3[/latex]), что позволяет систематически изучать и настраивать процесс рассуждений посредством GRPO-оптимизации.$

Новое исследование ставит под сомнение способность больших языковых моделей к истинному самоисправлению в процессе рассуждений, выявляя редкие моменты «эврики» и их связь с неуверенностью.