Наука — Страница 34 — Прогноз курса

Финансовые таблицы: где большие языковые модели терпят неудачу

10.03.2026 от Рэй Далио

Несмотря на прогресс в развитии больших языковых моделей, даже самые современные из них допускают примерно одну ошибку на шесть вопросов при решении задач, связанных с финансовыми таблицами, при этом увеличение размера модели и внедрение механизмов рассуждения лишь незначительно повышают точность, как показывает анализ времени ответа и результатов, представленных в таблице 4.

Новый бенчмарк FinSheet-Bench выявил слабые места современных моделей искусственного интеллекта при работе с финансовыми данными и сложными расчетами в электронных таблицах.

Финансовые модели и предвзятость: поиск общих точек

10.03.2026 от Рэй Далио

Новое исследование показывает, что предвзятость присутствует в финансовых языковых моделях, и предлагает способ ее эффективного выявления.

Искусственный интеллект и финансы: кто на самом деле разбирается в деньгах?

10.03.2026 от Рэй Далио

Сравнительный анализ возможностей модели по ключевым финансовым показателям выявляет расхождения в эффективности различных подходов к оценке и прогнозированию, подчеркивая важность выбора метрик, соответствующих конкретным задачам и контексту.

Новое исследование оценивает способности крупных языковых моделей анализировать финансовые данные и принимать инвестиционные решения, выявляя существенные различия в их компетенциях.

Раскрывая Аномалии Финансовых Рынков: Новый Подход

10.03.2026 от Рэй Далио

Модель ReGEN-TAD демонстрирует способность к точной локализации аномалий во времени и определению ключевых экономических факторов, влияющих на них, что подтверждается анализом аномалий, внедренных в различные сектора экономики (финансы, технологии, промышленность и защитные активы), и выделением наиболее значимых факторов на основе отклонения от базового уровня и чувствительности к реконструкции.

Исследователи предлагают инновационную систему, позволяющую не только выявлять отклонения в финансовых данных, но и понимать причины их возникновения.

Проверка на правдивость: как оценить научные отчеты, созданные ИИ

10.03.2026 от Рэй Далио

DeepFact-Eval демонстрирует превосходство над традиционными системами проверки фактов, такими как VeriScore, FactCheck-GPT и SAFE, за счет упрощенного рабочего процесса, позволяющего более эффективно оценивать достоверность информации.

Новый подход позволяет более надежно оценивать достоверность информации в научных отчетах, генерируемых большими языковыми моделями, решая проблему устаревших тестов и субъективности экспертов.