Когда языковые модели «придумывают»: Обнаружение галлюцинаций по частоте внимания
![Для выявления галлюцинаций предлагается модель внимания, чувствительная к частоте, извлекающая веса внимания из каждого слоя и каждой головы (общее количество слоёв и голов - LLlayers и HHheads соответственно), рассматривающая их как токено-уровневые сигналы и применяющая высокочастотную фильтрацию [latex]\mathcal{F}\_{\text{high}}[/latex] для выделения высокочастотных вариаций, энергия которых агрегируется для обнаружения галлюцинаций.](https://arxiv.org/html/2602.18145v1/x3.png)
Новое исследование предлагает способ выявлять ложные утверждения в больших языковых моделях, анализируя колебания в механизмах внимания.
![Для выявления галлюцинаций предлагается модель внимания, чувствительная к частоте, извлекающая веса внимания из каждого слоя и каждой головы (общее количество слоёв и голов - LLlayers и HHheads соответственно), рассматривающая их как токено-уровневые сигналы и применяющая высокочастотную фильтрацию [latex]\mathcal{F}\_{\text{high}}[/latex] для выделения высокочастотных вариаций, энергия которых агрегируется для обнаружения галлюцинаций.](https://arxiv.org/html/2602.18145v1/x3.png)
Новое исследование предлагает способ выявлять ложные утверждения в больших языковых моделях, анализируя колебания в механизмах внимания.

Новое исследование демонстрирует, как сверточные нейронные сети помогают отделить слабые сигналы экзопланет от активности звезд, открывая путь к обнаружению планет земного типа.
![В предложенной схеме классификации, основанной на операторах, входные данные подвергаются индивидуальным преобразованиям вдоль различных осей для создания расширенных представлений, которые затем сопоставляются в общее пространство признаков, где обратные операторы [latex]\varphi^{-k}[/latex] приводят встраивания к канонической позе, позволяя модели восстанавливать каноническое представление для классификации даже при сложных композитных преобразованиях [latex]T\_{x,y}(k\_{1},k\_{2})[/latex].](https://arxiv.org/html/2602.18406v1/x9.png)
Новый подход к построению нейронных сетей позволяет им надежно распознавать объекты даже в условиях незнакомых изменений и искажений.

Исследователи разработали масштабируемый подход к моделированию динамики магнитных материалов, использующий возможности машинного обучения для значительного повышения эффективности расчетов.

Новый подход использует «атакующие» вопросы для выявления и устранения слабых мест в логике специализированных языковых моделей, значительно повышая их эффективность.