Наука — Страница 231 — Прогноз курса

Языковые модели в противостоянии: как обеспечить безопасность?

28.12.2025 от Рэй Далио

В предложенной схеме состязательного обучения языковых моделей, одна модель (Атакующий) генерирует вариации исходного запроса, а другая (Защитник) отвечает на них, стремясь к безопасности, при этом обе оптимизируются на основе оценок, учитывающих достоверность, соответствие и способность уклоняться от нежелательных ответов.

Новый подход к обучению языковых моделей использует принципы теории игр, чтобы сделать их более устойчивыми к враждебным атакам и гарантировать соответствие этическим нормам.

Генерация текста без задержки: новый подход к языковым моделям

28.12.2025 от Рэй Далио

$В предложенном методе паралледного предсказания токенов, в отличие от традиционных авторегрессионных моделей, предсказывающих распределение следующего токена [latex] t_{i} [/latex] с использованием вспомогательной переменной [latex] u_{i} [/latex], обеспечивается совместное предсказание нескольких токенов путём непосредственной подачи этих вспомогательных переменных в модель, что позволяет моделировать распределение каждого токена параллельно и эффективно.$

Исследователи предлагают инновационную схему, позволяющую значительно ускорить процесс генерации текста, не жертвуя качеством и выразительностью.

Путь к четкости: Оптимизация генерации в диффузионных моделях

28.12.2025 от Рэй Далио

$Оценка неопределённости пути в моделях принятия решений с использованием шумоподавляющей энтропии показывает, что меньшее значение общей энтропии пути [latex]HDEH_{\texttt{DE}}[/latex], вычисляемой на основе средней энтропии Шеннона для всех замаскированных позиций, указывает на более качественный выход, предоставляя надежный внутренний сигнал для оценки генерации.$

Новый подход позволяет повысить качество изображений, создаваемых диффузионными моделями, за счет анализа и оптимизации процесса генерации.

Злоумышленники не дремлют: новый взгляд на анализ вызовов функций в Android

28.12.2025 от Рэй Далио

Удаление дубликатов APK-файлов из наборов данных MalNet-Tiny и CICMalDroid привело к резкому снижению производительности всех протестированных методов, что указывает на критическую зависимость эффективности анализа от разнообразия входных данных.

Исследователи представили масштабный набор данных, демонстрирующий, что существующие методы классификации вредоносного ПО для Android на основе графов вызовов функций устарели и дают завышенные оценки эффективности.

Глубокое обучение без обратного распространения: новый подход к нейросетям

27.12.2025 от Рэй Далио

Глубина нейронной сети, исследованная на наборе данных CIFAR-100, демонстрирует зависимость производительности от частоты ортогонализации и обновления FF-матрицы, указывая на возможность оптимизации архитектуры за счет регулирования этих параметров.

Исследователи предложили инновационный алгоритм FOTON, позволяющий обучать глубокие нейронные сети, избегая традиционного процесса обратного распространения ошибки.