ИИ «видит» то, чего нет: галлюцинации в моделях динамики жидкостей

Автор: Денис Аветисян

Новое исследование показывает, что модели искусственного интеллекта, предсказывающие поведение неустойчивых потоков, могут выдавать правдоподобные, но физически нереалистичные результаты — так называемые «галлюцинации».

☕️

Читаем отчёты, пьём кофе, ждём дивиденды. Если тебе надоел хайп и ты ищешь скучную, но стабильную гавань — добро пожаловать.

Телеграм канал

Архитектура DeepFingers демонстрирует стабильное и реалистичное моделирование движения пальцев, точно отражающее физическую эволюцию, в то время как ViT страдает от появления нефизичных артефактов («черных островов») на поздних стадиях, а DAE-LSTM выдает размытые контуры и ложные образования на ранних, при этом вязкость среды, обозначенная как $M$ , является ключевым параметром, влияющим на поведение систем.

Предложена архитектура DeepFingers, объединяющая DeepONet и Fourier Neural Operators, для снижения влияния «галлюцинаций» и обеспечения сбалансированного обучения в задачах моделирования динамики вязкого вытеснения.

Несмотря на успехи в моделировании гидродинамических процессов, нейросетевые модели демонстрируют неожиданные артефакты при решении задач с неустойчивыми течениями. В работе, озаглавленной ‘AI models of unstable flow exhibit hallucination’, впервые выявлены «галлюцинации» в моделях искусственного интеллекта, предсказывающих динамику вязкого вытеснения — явления, характеризующегося сложными, быстро меняющимися структурами. Эти галлюцинации проявляются в виде нефизичных интерфейсов и нарушении законов сохранения, обусловленных спектральным смещением моделей. Может ли новая архитектура DeepFingers, сочетающая DeepONet и Fourier Neural Operators, обеспечить более надежное и физически корректное моделирование неустойчивых течений, открывая путь к глубокому пониманию ограничений ИИ в физических системах?

Вязкое Вытеснение: Танец Неустойчивостей

Явление вязкого вытеснения, или «пальцевидного» вытеснения, широко распространено в пористых средах и возникает, когда более текучая жидкость вытесняет более вязкую. Эта нестабильность проявляется в образовании тонких, вытянутых «пальцев» менее вязкой жидкости, проникающих в вытесняемый объем. Причина кроется в разнице сил поверхностного натяжения и вязких сил: небольшие возмущения на границе раздела жидкостей усиливаются, приводя к формированию этих характерных структур. Данный процесс существенно влияет на эффективность различных технологий, включая добычу нефти и очистку подземных вод, поскольку неравномерное распределение вытесняющей жидкости снижает коэффициент извлечения полезных ископаемых или эффективность очистки загрязненных участков. Изучение механизмов, лежащих в основе вязкого вытеснения, необходимо для разработки более эффективных стратегий управления потоками жидкости в пористых средах.

Точное моделирование явления вискозного прорыва имеет решающее значение для ряда практических задач, включая повышение эффективности извлечения нефти и очистку загрязненных подземных вод. В процессе нефтедобычи, когда менее вязкая закачиваемая жидкость вытесняет нефть, неустойчивости приводят к образованию «пальцев» — узких потоков вытесняющей жидкости, снижающих эффективность вытеснения и оставляющих значительные запасы нефти в пласте. Аналогичные процессы происходят при очистке грунта от загрязнений, где недостаточное моделирование может привести к неполному удалению вредных веществ. Однако, высокая сложность явления и необходимость учета микроскопических особенностей пористой среды делают численное моделирование чрезвычайно ресурсоемким, требующим огромных вычислительных мощностей и времени, особенно при моделировании больших областей и сложных геологических структур. Поиск эффективных и точных методов моделирования остается актуальной задачей современной гидродинамики и прикладной математики.

Традиционные методы моделирования вязкого вытеснения, основанные на прямом решении соответствующих $\partialP/\partialt$ уравнений в частных производных, сталкиваются со значительными трудностями при стремлении к высокой детализации и моделировании сложных геометрических форм. По мере увеличения разрешения симуляции, количество вычислений экспоненциально растет, что приводит к непрактичным затратам времени и вычислительных ресурсов. Сложность обусловлена нелинейным характером гидродинамической нестабильности и необходимостью точного отслеживания интерфейса между вытесняющей и вытесняемой жидкостями, особенно в пористых средах с неоднородной проницаемостью. Подобные ограничения существенно затрудняют применение традиционных подходов для задач, требующих детального анализа, например, при оптимизации методов увеличения нефтеотдачи или прогнозировании распространения загрязнений в подземных водах.

Архитектура DeepFingers использует FNO в разветвляющейся сети и полносвязный слой в основной, объединяя их результаты для последующей обработки в двух U-FNO слоях и проекционном слое <span class="katex-eq" data-katex-display="false">\mathcal{Q}</span> с целью прогнозирования карты концентрации вытесняемой жидкости (желтый) в более вязкой среде (черный). — Архитектура DeepFingers использует FNO в разветвляющейся сети и полносвязный слой в основной, объединяя их результаты для последующей обработки в двух U-FNO слоях и проекционном слое $\mathcal{Q}$ с целью прогнозирования карты концентрации вытесняемой жидкости (желтый) в более вязкой среде (черный).

Нейронные Операторы: Новый Взгляд на Функциональное Моделирование

В отличие от традиционных методов глубокого обучения, которые оперируют дискретными точками данных, подходы на основе нейронных операторов (Neural Operators) обучают отображение непосредственно между функциональными пространствами. Это означает, что вместо аппроксимации функции через отдельные значения, нейронный оператор учится моделировать взаимосвязь между целыми функциями, рассматривая их как объекты. Такой подход позволяет обрабатывать и предсказывать поведение непрерывных систем, не требуя предварительной дискретизации данных или большого объема обучающих примеров. По сути, нейронный оператор изучает правило, которое преобразует одну функцию в другую, что принципиально отличается от интерполяции или регрессии на дискретных данных.

В отличие от традиционных методов, требующих дискретизации области решения и большого объема данных для обучения, нейронные операторы позволяют аппроксимировать непрерывные решения $\partialu/\partialt = F(u)$ дифференциальных уравнений в частных производных (ДУЧП) напрямую. Это достигается за счет обучения отображению между функциями, представляющими решения ДУЧП, без необходимости явного представления сетки или дискретизации пространственной области. Следовательно, для обучения модели требуется значительно меньше данных, а полученные решения могут быть получены в любой точке области без дополнительных вычислений, что особенно важно для задач, где получение данных является дорогостоящим или невозможным.

Методы, такие как DeepONet и Fourier Neural Operator, представляют собой эффективные инструменты для аппроксимации сложных нелинейных операторов, управляющих динамикой вытеснения вязкой жидкости (viscous fingering). DeepONet использует архитектуру, состоящую из глубокой нейронной сети, обрабатывающей входные данные, и другой сети, обрабатывающей выходные данные, что позволяет моделировать операторы, отображающие функции в функции. Fourier Neural Operator, в свою очередь, использует преобразование Фурье для представления функций в частотной области, что позволяет эффективно аппроксимировать операторы, сохраняющие структуру решения ∇. Оба подхода демонстрируют высокую точность и эффективность в моделировании и предсказании поведения нестабильных фронтов при вытеснении вязких жидкостей, требуя при этом значительно меньше вычислительных ресурсов и данных обучения по сравнению с традиционными численными методами.

Сравнение среднего спектральной энергии, полученной методами DNS, DeepFingers, ViT и DAE-LSTM при различных значениях вязкости, показывает, что DeepFingers точно соответствует результатам DNS во всех масштабах, в то время как ViT систематически завышает энергию в модах 2-6, а DAE-LSTM демонстрирует зависимость от вязкости: завышая энергию при <span class="katex-eq" data-katex-display="false">M=13</span>, он недооценивает ее при <span class="katex-eq" data-katex-display="false">M=28</span> и <span class="katex-eq" data-katex-display="false">M=55</span>, что обусловлено меньшим количеством 'пальцев' и размытыми границами. — Сравнение среднего спектральной энергии, полученной методами DNS, DeepFingers, ViT и DAE-LSTM при различных значениях вязкости, показывает, что DeepFingers точно соответствует результатам DNS во всех масштабах, в то время как ViT систематически завышает энергию в модах 2-6, а DAE-LSTM демонстрирует зависимость от вязкости: завышая энергию при $M=13$ , он недооценивает ее при $M=28$ и $M=55$ , что обусловлено меньшим количеством ‘пальцев’ и размытыми границами.

DeepFingers: Гибридная Архитектура для Точного Прогнозирования Вязкого Вытеснения

Архитектура $DeepFingers$ представляет собой гибридный подход, объединяющий возможности $DeepONet$ и $U-FNO$ . $DeepONet$ эффективно моделирует локальные зависимости между входными данными и выходными параметрами, в то время как $U-FNO$ обеспечивает захват глобальных характеристик и долгосрочных взаимодействий в физической системе. Комбинирование этих двух архитектур позволяет $DeepFingers$ использовать преимущества каждой из них, обеспечивая более точное и всестороннее моделирование физических процессов, в частности, в задачах предсказания прорыва вязких пальцев.

Архитектура DeepFingers обеспечивает повышенную точность предсказания поля концентрации при вязком вытеснении за счет эффективного захвата как локальных, так и глобальных характеристик течения. В отличие от традиционных методов, которые часто фокусируются только на одном аспекте, DeepFingers объединяет возможности моделирования локальных деталей и глобального контекста, что позволяет более адекватно описывать сложные взаимодействия жидкости и вытесняющей среды. Такой подход позволяет учитывать влияние как микроскопических неоднородностей, так и макроскопических особенностей течения, что критически важно для точного предсказания поведения фронта вытеснения и распределения концентрации вытесняемого флюида.

В сравнительном анализе архитектура DeepFingers показала значительное снижение ошибок предсказания по сравнению с базовыми моделями DAE-LSTM и Vision Transformer. Достигнутая точность приближается к результатам, получаемым методом прямого численного моделирования (DNS), что подтверждено анализом спектрального распределения энергии. В частности, анализ показывает, что спектральные моды, предсказанные DeepFingers, тесно соответствуют спектральным модам, полученным с использованием DNS, во всем диапазоне частот, что свидетельствует о высокой точности моделирования динамики вязкого вытеснения.

Сравнение спектральных мод DNS, DeepFingers, ViT и DAE-LSTM показывает, что DeepFingers наиболее точно воспроизводит ожидаемое перераспределение от крупных к мелким масштабам, в отличие от ViT, который завышает вклад мелких масштабов, и DAE-LSTM, подавляющего их из-за ограниченного количества признаков, что позволяет DeepFingers наиболее адекватно моделировать многомасштабную динамику.

Устранение «Галлюцинаций» ИИ и Количественная Оценка Неопределенности Прогнозов

В ходе исследований были выявлены случаи так называемых “галлюцинаций” в базовых моделях искусственного интеллекта, когда предсказания отклоняются от физически реалистичного поведения. Данное явление часто обусловлено спектральным смещением — тенденцией моделей отдавать предпочтение высокочастотным компонентам данных, что может приводить к неправдоподобным результатам. Например, при моделировании вязкого прорыва пальцев, модели могли предсказывать нестабильные и нефизичные структуры жидкости. Выявление и понимание причин этих “галлюцинаций” критически важно для повышения надежности и точности моделей, особенно в задачах, где требуется предсказание поведения сложных физических систем. Устранение спектрального смещения и разработка методов, позволяющих моделям учитывать физические ограничения, являются ключевыми направлениями в улучшении качества предсказаний.

Методика DeepFingers обеспечивает надежную оценку достоверности прогнозов благодаря внедрению техник распространения неопределенности. Это позволяет не только повысить точность моделирования динамики вязкого просачивания, но и предоставить критически важную информацию для принятия решений, поскольку количественная оценка неопределенности позволяет оценить риски, связанные с предсказаниями. Успешность распространения неопределенности подтверждается согласованием функций плотности вероятности (PDF) измеряемых параметров смешивания с результатами прямого численного моделирования (DNS), что свидетельствует о высокой степени надежности и предсказуемости модели DeepFingers в сложных физических сценариях.

Разработанная система DeepFingers представляет собой надежный и заслуживающий доверия инструмент для моделирования динамики вязкого вытеснения, благодаря уникальному сочетанию повышенной точности предсказаний и возможности количественной оценки неопределенности. В отличие от традиционных методов, DeepFingers не просто предоставляет прогноз, но и оценивает степень его достоверности, что критически важно для принятия обоснованных решений в сложных инженерных задачах. Возможность вычисления вероятностных распределений, подтвержденная соответствием функций плотности вероятности (PDF) параметров смешения результатам прямого численного моделирования (DNS), позволяет пользователям учитывать потенциальные риски и ограничения, связанные с предсказаниями модели, и тем самым повышает надежность и безопасность применения в практических сценариях. Такое сочетание точности и уверенности в предсказаниях делает DeepFingers ценным активом для исследователей и инженеров, работающих в области гидродинамики и смежных дисциплин.

Анализ эволюции вероятностных распределений (<span class="katex-eq" data-katex-display="false">\overline{c}</span>, <span class="katex-eq" data-katex-display="false">\overline{c}_{out}</span>, <span class="katex-eq" data-katex-display="false">\sigma_{c}^{2}</span>, <span class="katex-eq" data-katex-display="false">\epsilon_{c}</span>) показывает, что модель DeepFingers успешно распространяет неопределенность, вызванную вариативностью начальных условий, что подтверждается сравнением с результатами прямого численного моделирования (DNS). — Анализ эволюции вероятностных распределений ( $\overline{c}$ , $\overline{c}_{out}$ , $\sigma_{c}^{2}$ , $\epsilon_{c}$ ) показывает, что модель DeepFingers успешно распространяет неопределенность, вызванную вариативностью начальных условий, что подтверждается сравнением с результатами прямого численного моделирования (DNS).

Исследование демонстрирует, что даже сложные модели машинного обучения, обученные на данных о вязком вытеснении, способны генерировать «галлюцинации» — визуально правдоподобные, но физически невозможные решения. Это не ошибка, а закономерный результат стремления системы найти наиболее «удобный» путь, даже если он ведет к искажению реальности. Как отмечал Эрвин Шрёдингер: «Нельзя проникать в сущность вещей, не признавая их относительности». Именно это относительное понимание, усиленное спектральным смещением и ограниченностью данных, приводит к появлению этих артефактов. Разработанная архитектура DeepFingers пытается нивелировать эту проблему, навязывая модели более сбалансированное восприятие различных масштабов, тем самым приближая её к физической корректности.

Куда же дальше?

Представленная работа выявила склонность моделей глубокого обучения, предназначенных для предсказания неустойчивых течений, к своеобразным “галлюцинациям” — генерации визуально убедительных, но физически несостоятельных решений. Это не ошибка, а закономерный побочный эффект попытки взломать систему динамики жидкости посредством численных аппроксимаций. Архитектура DeepFingers, комбинирующая DeepONet и Fourier Neural Operators, представляет собой элегантную попытку обуздать эту склонность, навязав баланс обучения по пространственным масштабам. Однако, истинный вопрос не в смягчении симптомов, а в понимании первопричины.

Следующим шагом видится не просто улучшение архитектур, а переосмысление самого подхода к моделированию. Необходимо исследовать, как встроенные априорные знания о физике течений могут быть органично интегрированы в структуру нейронных сетей, а не просто наложены сверху как регуляризация. Интересно, можно ли создать модели, способные к самокоррекции, обнаруживающие и устраняющие физически невозможные решения на основе внутренних критериев согласованности.

В конечном итоге, задача заключается не в создании идеального предсказателя, а в создании инструмента, способного выявить границы применимости существующих моделей и указать на области, где требуются новые теоретические разработки. По сути, это поиск эксплойта в самой реальности, позволяющего понять её устройство глубже, чем это возможно традиционными методами.

Оригинал статьи: https://arxiv.org/pdf/2604.20372.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-04-24 01:43