Орион-RAG: Поиск знаний сквозь фрагментацию данных

Новая система поиска и генерации знаний объединяет различные источники информации, даже если они не связаны напрямую, для повышения точности и масштабируемости.

Новая система поиска и генерации знаний объединяет различные источники информации, даже если они не связаны напрямую, для повышения точности и масштабируемости.
Новое исследование посвящено оценке способности детектировать тексты, созданные искусственным интеллектом с целью убеждения, и сравнению их лингвистических особенностей с текстами, написанными людьми.
![В исследовании продемонстрировано, что методика FaST превзошла другие подходы в прогнозировании на длительный горизонт - до 672 шагов на основе анализа 96 предыдущих, причем она показала наилучшие результаты в 16 задачах, опередив как методы, ориентированные на временные ряды ([latex]T[/latex]), так и пространственно-временные ([latex]ST[/latex]).](https://arxiv.org/html/2601.05174v1/x3.png)
Исследователи предлагают инновационную систему FaST для точного и эффективного долгосрочного прогнозирования в сложных системах, представленных в виде пространственно-временных графов.
![Разработанный двухэтапный фреймворк GRPO, включающий генерацию цепочек рассуждений моделью DeepSeek-VL2 и фильтрацию GPT-4 с порогом [latex]\tau = 8.0/10.0[/latex], в сочетании с обучением на основе политики GRPO, использующим пятиуровневое нечёткое сопоставление для обработки лингвистического разнообразия и трёхкомпонентную функцию вознаграждения (формат + ответ + рассуждение) с нормализацией относительного преимущества группы ([latex]n=3[/latex] образца), позволяет 3B модели эффективно обучаться надежному рассуждению на синтезированных данных.](https://arxiv.org/html/2601.04672v1/figure1_construct_image.jpg)
Исследователи разработали систему, позволяющую моделям компьютерного зрения и обработки естественного языка эффективно анализировать изображения сельскохозяйственных культур и выявлять признаки заболеваний.
Исследование показывает, как злоумышленники используют скрытые возможности API TensorFlow для маскировки вредоносного ПО внутри моделей, и предлагает новый метод обнаружения, основанный на больших языковых моделях.