Трансформеры, которые учатся думать: новый подход к сложному анализу

Автор: Денис Аветисян

Исследователи представили архитектуру рекуррентных трансформеров, способную к многошаговому логическому выводу и обобщению знаний, превосходя стандартные модели в задачах, требующих сложного анализа.

☕️

Читаем отчёты, пьём кофе, ждём дивиденды. Если тебе надоел хайп и ты ищешь скучную, но стабильную гавань — добро пожаловать.

Телеграм канал

Повторяющаяся архитектура рекуррентной глубины, основанная на многократно применяемом блоке Transformer, использует общие веса для слоя внедрения и языковой модели, что позволяет создать простую циклическую структуру, аналогичную подходу Saunshiet al. (2025), без усложнений, таких как инъекция входных данных, управляемая остановка или промежуточное замыкание цикла.

Рекуррентные трансформеры демонстрируют способность к композиционному обобщению и адаптивному завершению вычислений, эффективно работая с параметрическими знаниями и преодолевая ограничения стандартных моделей.

Несмотря на впечатляющий объем знаний и правил, хранящихся в современных больших языковых моделях, они часто демонстрируют слабость в задачах, требующих комбинирования этих знаний для многошагового логического вывода. В работе ‘Loop, Think, & Generalize: Implicit Reasoning in Recurrent-Depth Transformers’ исследуется возможность улучшения этой способности с помощью рекуррентных трансформаторов, позволяющих итеративно применять слои модели. Показано, что такие трансформаторы превосходят традиционные модели в обобщении на новые комбинации знаний и экстраполяции на более глубокие логические цепочки, демонстрируя переход от запоминания к систематическому обобщению через трехэтапный процесс. Какие новые архитектурные решения позволят еще более эффективно использовать параметрические знания для сложных задач логического вывода?

Пределы Параметрического Знания

Несмотря на огромный объем знаний, заложенный в параметрах, стандартные архитектуры Transformer испытывают трудности при решении сложных, многоступенчатых задач, демонстрируя неспособность к систематической обобщающей способности. Исследования показывают, что модели, обученные на больших объемах данных, часто терпят неудачу при столкновении с новыми комбинациями известных фактов, требующими последовательного применения логических правил. Эта проблема проявляется в ограниченной способности к экстраполяции знаний за пределы непосредственно увиденных в обучающей выборке сценариев, что препятствует надежному решению задач, требующих планирования, дедукции или абстрактного мышления. В результате, эффективность таких моделей значительно снижается при решении задач, где требуется не просто запоминание, а активное использование и комбинирование имеющихся знаний.

Неспособность стандартных трансформаторных архитектур к надежному выполнению неявного рассуждения, то есть к решению задач, требующих логических выводов без явного указания шагов, существенно ограничивает их потенциал. Эта проблема проявляется в необходимости использования метода “Chain-of-Thought”, когда модели требуется явное предоставление последовательности рассуждений для достижения корректного ответа. Отсутствие такой способности приводит к значительным провалам в производительности по сравнению с архитектурами, способными к экстраполяции глубины, то есть к обобщению знаний на новые, более сложные случаи, не требующие детального прописывания каждого шага логических операций. Фактически, модели испытывают трудности с выводами, которые кажутся очевидными для человека, и нуждаются в «подсказках» в виде пошаговых объяснений для успешного решения задач.

Анализ логит-линзы показывает, что предсказание связей между сущностями моста и цели достигается с одинаковой точностью как в рекуррентной модели глубины <span class="katex-eq" data-katex-display="false">R=2</span>, так и в 8-слойном ванильном трансформере. — Анализ логит-линзы показывает, что предсказание связей между сущностями моста и цели достигается с одинаковой точностью как в рекуррентной модели глубины $R=2$ , так и в 8-слойном ванильном трансформере.

Рекуррентная Глубина: За Пределами Статического Рассуждения

Трансформер с рекуррентной глубиной (Recurrent-Depth Transformer) представляет собой расширение архитектуры Transformer, достигаемое путем итеративного применения одних и тех же слоев. В отличие от стандартных трансформеров, где обработка данных происходит за один проход, данная архитектура позволяет осуществлять динамический процесс рассуждений, последовательно уточняя представления на каждой итерации. Такая итеративная обработка приводит к существенному улучшению производительности в задачах, требующих сложных логических выводов и анализа, по сравнению с традиционными трансформерами, поскольку модель имеет возможность пересматривать и уточнять свои выводы на каждой итерации обработки входных данных.

Архитектура Recurrent-Depth Transformer обеспечивает возможность экстраполяции глубины рассуждений, позволяя модели обобщать данные на глубину рассуждений, не встречавшуюся в процессе обучения. Производительность модели масштабируется с увеличением количества итераций во время инференса, что позволяет ей выполнять более сложные рассуждения. Однако следует учитывать, что существует предел этой масштабируемости, обусловленный потенциальной “перегрузкой” модели, когда избыточные итерации приводят к ухудшению результатов из-за избыточного анализа и снижения точности.

Трансформеры с рекуррентной глубиной (Recurrent-Depth Transformers) демонстрируют улучшенную обобщающую способность при обработке последовательностей, превышающих длину тех, на которых они обучались. В отличие от стандартных трансформеров, которые испытывают трудности с последовательностями большей длины из-за квадратичной сложности внимания, рекуррентное применение слоев позволяет модели динамически адаптироваться к входным данным переменной длины. Это достигается за счет итеративной обработки, где выход предыдущей итерации используется в качестве входных данных для следующей, что позволяет эффективно обрабатывать длинные последовательности без значительного увеличения вычислительных затрат или снижения производительности. Экспериментальные данные показывают, что такая архитектура значительно превосходит стандартные трансформеры при экстраполяции на последовательности, которые не встречались в обучающем наборе данных.

На точность моделей с рекуррентной глубиной при многошаговом композировании влияет как фиксированная, так и динамическая рекуррентность, при этом максимальная обобщающая способность достигается при адаптивной остановке рекурсии <span class="katex-eq" data-katex-display="false">r^<i>r^{\</i>}</span>, как показано на графике зависимости точности от сложности переходов. — На точность моделей с рекуррентной глубиной при многошаговом композировании влияет как фиксированная, так и динамическая рекуррентность, при этом максимальная обобщающая способность достигается при адаптивной остановке рекурсии $r^<i>r^{\</i>}$ , как показано на графике зависимости точности от сложности переходов.

Контроль над Рекурсивным Процессом

Неконтролируемая рекурсия в рекуррентных моделях приводит к феномену, условно называемому “передумыванием” ( $Overthinking$ ), который характеризуется избыточной вычислительной нагрузкой и снижением производительности. Данное явление возникает из-за того, что модель продолжает обрабатывать информацию даже после достижения достаточного уровня уверенности или понимания, что приводит к увеличению времени вычислений и потребления ресурсов. Кроме того, “передумывание” ограничивает способность модели к обобщению, поскольку избыточные вычисления могут привести к запоминанию специфических деталей обучающей выборки вместо извлечения общих закономерностей, что негативно сказывается на ее производительности на новых, ранее не встречавшихся данных.

Адаптивная остановка (Adaptive Halting) представляет собой метод динамического прекращения рекуррентного процесса, когда дальнейшие вычисления не приносят существенной пользы. В отличие от фиксированного числа шагов рекуррентности, данный подход позволяет модели самостоятельно определять момент, когда дальнейшая обработка информации становится контрпродуктивной или не улучшает качество результата. Это достигается путем мониторинга изменений в выходных данных или внутренней активации модели на каждом шаге рекурсии и остановки процесса, если изменения становятся незначительными или достигается определенный порог уверенности. Применение адаптивной остановки позволяет снизить вычислительные затраты, предотвратить переобучение и улучшить обобщающую способность рекуррентных моделей.

Метод Logit Lens предоставляет возможность анализа процесса рассуждений рекуррентных моделей путем визуализации изменений в выходных логарифмических вероятностях (logits) на каждом шаге рекурсии. Этот подход позволяет идентифицировать моменты, когда модель перестает генерировать информативные признаки или начинает повторять одни и те же рассуждения, что является индикатором “overthinking”. Анализ динамики логарифмических вероятностей помогает определить оптимальную глубину рекурсии, позволяя остановить процесс вычислений до возникновения неэффективных итераций и, таким образом, улучшить производительность и обобщающую способность модели. Практически, Logit Lens позволяет отслеживать, какие признаки модель считает наиболее важными на каждом шаге, и выявлять случаи, когда эти признаки перестают меняться или становятся противоречивыми.

Адаптивное прекращение рекурсии позволяет снизить среднее количество итераций по сравнению с ростом сложности выборки.

Формирование Надежных Представлений о Знаниях

Систематическая генерализация, способность комбинировать знания новыми способами, является ключевым признаком истинного интеллекта, однако её достижение требует тщательной подготовки. Исследования показывают, что модели демонстрируют чёткий путь развития от простого запоминания к композиционному мышлению, проходя последовательные этапы: заучивание, обобщение в рамках известных данных и, наконец, систематическую генерализацию. Этот процесс не является мгновенным; модели сначала осваивают отдельные факты, затем учатся применять их в знакомых ситуациях, и только после этого способны к творческому комбинированию знаний для решения принципиально новых задач. Наблюдаемая последовательность этапов подтверждает, что способность к обобщению — это не просто увеличение объёма заученного материала, а качественно иной уровень понимания и применения информации.

Для целенаправленного улучшения способности к обобщению информации исследователи используют синтетические наборы данных, созданные на основе направленных графов знаний. Такой подход позволяет конструировать контролируемые эксперименты, где структура данных и взаимосвязи между понятиями четко определены. Вместо использования неструктурированных, реальных данных, направленные графы знаний обеспечивают возможность точного управления сложностью и разнообразием примеров, что необходимо для оценки и улучшения способности моделей к переносу знаний на новые, ранее не встречавшиеся ситуации. Благодаря этому, можно более эффективно выявлять и устранять слабые места в алгоритмах, а также разрабатывать более надежные и универсальные системы искусственного интеллекта, способные к действительно интеллектуальному обобщению.

Использование графов знаний, основанных на перестановках, играет ключевую роль в предотвращении обучения моделей «быстрым решением» и способствует развитию надежной систематической обобщающей способности. В традиционных подходах модели часто эксплуатируют статистические закономерности в данных, позволяющие достичь высокой точности на тренировочном наборе, но не обеспечивающие устойчивость к незначительным изменениям в структуре задачи. Перестановка элементов в графе знаний, напротив, вынуждает модель овладевать фундаментальными принципами, лежащими в основе взаимосвязей, а не просто запоминать конкретные примеры. Такой подход гарантирует, что модель сможет успешно применять полученные знания к новым, ранее не встречавшимся комбинациям, демонстрируя подлинную способность к обобщению и решению задач, требующих логического мышления и понимания структуры данных.

Исследования динамики обучения, в частности, феномен, известный как “Grokking”, демонстрируют важный переход от простого запоминания информации к настоящему обобщению. Данный процесс показывает, что модели, проходящие обучение, сначала запоминают обучающие примеры, но лишь после продолжительного обучения способны выявить и усвоить базовые принципы, лежащие в основе данных. Это позволяет им успешно применять полученные знания к новым, ранее не встречавшимся ситуациям. Установлено, что продолжительное обучение является ключевым фактором для достижения настоящего обобщения, поскольку позволяет моделям преодолеть этап простого запоминания и перейти к пониманию и применению абстрактных правил и закономерностей. Наблюдаемый переход от запоминания к обобщению подчеркивает, что истинный интеллект требует не только способности хранить информацию, но и способности извлекать из неё знания и применять их в новых контекстах.

Набор данных, подвергнутый перестановкам, демонстрирует выраженную способность к глубокой композиционной обобщающей способности.

К Более Эффективному и Надежному Рассуждению

Сочетание рекуррентных трансформеров с переменной глубиной и методов вроде активационного патчинга открывает уникальные возможности для детального анализа процесса рассуждений искусственного интеллекта. Данный подход позволяет не просто получить конечный результат, но и проследить логическую цепочку, лежащую в основе принятия решения, выявляя узкие места и возможности для оптимизации. Активационный патчинг, в частности, позволяет целенаправленно модифицировать внутренние представления модели, улучшая её способность к обобщению и повышая устойчивость к различным входным данным. В результате, появляется возможность не только повысить эффективность работы ИИ, но и сделать его рассуждения более прозрачными и понятными, что является ключевым шагом на пути к созданию действительно интеллектуальных систем.

Возможность регулировать глубину рекурсии и использовать надежные представления знаний представляет собой важный шаг на пути к созданию более эффективного и обобщенного искусственного интеллекта. Традиционные модели часто сталкиваются с трудностями при обработке сложных, многоступенчатых рассуждений, поскольку глубина рекурсии может быстро выйти из-под контроля, приводя к вычислительным затратам и ошибкам. Однако, контролируя этот параметр, исследователи могут оптимизировать процесс рассуждения, фокусируясь на наиболее важных этапах и избегая избыточной обработки. Наряду с этим, надежные представления знаний, основанные на структурированных данных и семантических связях, позволяют модели более точно понимать и использовать информацию, повышая ее способность к логическому выводу и решению проблем. Такой подход способствует созданию систем, которые не просто запоминают шаблоны, а действительно понимают суть задачи и могут адаптироваться к новым ситуациям, открывая перспективы для более интеллектуальных и универсальных приложений искусственного интеллекта.

Дальнейшие исследования в области искусственного интеллекта направлены на изучение новых парадигм обучения, которые позволят системам углублять свои способности к рассуждению. Особое внимание уделяется разработке инновационных структур графов знаний, способных эффективно кодировать и использовать сложные взаимосвязи между понятиями. Подобные структуры, в сочетании с усовершенствованными методами обучения, потенциально способны вывести алгоритмы рассуждения на качественно новый уровень, позволяя им решать более сложные задачи и демонстрировать более гибкое и адаптивное поведение. Исследователи предполагают, что освоение этих направлений позволит создать системы, способные не просто обрабатывать информацию, но и понимать её, делая логические выводы и генерируя новые знания.

Анализ активаций показывает, что модель полагается на упрощенные связи, а не на полноценный многошаговый поиск, поскольку значительные изменения в вероятности правильного ответа возникают в конце последовательности отношений →.

Исследование демонстрирует, что рекуррентные модели с глубиной трансформации способны к композиционному обобщению, эффективно оперируя параметрическими знаниями. Это особенно важно в задачах, требующих многошагового вывода, где стандартные трансформаторы демонстрируют ограниченные возможности. Авторы показывают, что подобный подход позволяет преодолеть ограничения в обобщении, что является ключевым для достижения истинной интеллектуальной системы. Как однажды заметила Грейс Хоппер: «Лучший способ предсказать будущее — это создать его». Эта фраза отражает суть представленной работы: вместо того, чтобы полагаться на существующие модели, исследователи создали новую архитектуру, способную к более сложным формам рассуждений и обобщения, тем самым формируя будущее искусственного интеллекта.

Куда Далее?

Представленная работа, демонстрируя способность рекуррентных трансформеров к композиционному обобщению, поднимает вопрос не столько о достигнутом прогрессе, сколько о фундаментальных ограничениях подхода. Успех в манипулировании параметрическими знаниями не является доказательством истинного рассуждения; скорее, это изящная форма интерполяции, способная воспроизводить известные закономерности, но не обязательно способная к независимому открытию. Недостаточно просто “работать на тестах”; необходимо доказательство внутренней согласованности алгоритма.

Особое внимание следует уделить исследованию границ применимости данной архитектуры. Способность к адаптивной остановке — важный шаг, но является ли она достаточной для моделирования сложных, нелинейных процессов, происходящих в реальных системах знаний? Проблема “грокинга” — внезапного появления обобщающей способности — остаётся загадкой, требующей глубокого математического анализа, а не эмпирических наблюдений.

Будущие исследования должны быть направлены на разработку формальных методов верификации алгоритмов рассуждения, а не на увеличение объёма обучающих данных. Истинная элегантность заключается в простоте и доказуемости, а не в сложности и эмпирическом успехе. Необходимо стремиться к созданию систем, способных не просто “отвечать” на вопросы, а “понимать” лежащие в их основе принципы.

Оригинал статьи: https://arxiv.org/pdf/2604.07822.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-04-11 16:51