Глубокое обучение в геотехнике: иллюзии и реальность

Автор: Денис Аветисян


Обзор показывает, что, несмотря на растущий интерес, традиционные численные методы пока превосходят нейросети в решении большинства задач геотехнического моделирования.

☕️

Читаем отчёты, пьём кофе, ждём дивиденды. Если тебе надоел хайп и ты ищешь скучную, но стабильную гавань — добро пожаловать.

Бесплатный Телеграм канал
Архитектура глубокой операторной сети (DeepONet) позволяет отображать целые функции в другие функции, обучаясь сопоставлять произвольные схемы нагрузок с соответствующими деформациями балки посредством комбинирования латентных представлений входной функции, дискретизированной в фиксированных точках, и точек, в которых требуется предсказание, посредством скалярного произведения, что обеспечивает быстрое предсказание деформаций после внесетевого обучения.
Архитектура глубокой операторной сети (DeepONet) позволяет отображать целые функции в другие функции, обучаясь сопоставлять произвольные схемы нагрузок с соответствующими деформациями балки посредством комбинирования латентных представлений входной функции, дискретизированной в фиксированных точках, и точек, в которых требуется предсказание, посредством скалярного произведения, что обеспечивает быстрое предсказание деформаций после внесетевого обучения.

Критический анализ перспектив применения Physics-Informed Neural Networks и Deep Operator Networks для решения задач геотехнической инженерии, с акцентом на ограничения в области экстраполяции.

Несмотря на растущий интерес к применению методов глубокого обучения в инженерной геологии, их эффективность и надежность остаются под вопросом. В работе «Deep Learning in Geotechnical Engineering: A Critical Assessment of PINNs and Operator Learning» проведена критическая оценка таких подходов, как физически обоснованные нейронные сети (PINNs) и сети глубоких операторов (DeepONet), в сравнении с традиционными численными методами. Полученные результаты демонстрируют, что, несмотря на перспективность, современные нейросетевые модели уступают традиционным решателям по скорости, точности и способности к экстраполяции за пределы обучающих данных. Возможно ли найти нишу для эффективного применения глубокого обучения в геотехнике, где преимущества новых методов перевешивают их недостатки?


Традиционные методы и их ограничения: взгляд рационалиста

В области геотехнического проектирования широко используются численные методы, в частности, метод конечных разностей, для моделирования сложного поведения грунтов. Этот подход позволяет инженерам анализировать деформации, напряжения и устойчивость грунтов под различными нагрузками, что критически важно при проектировании фундаментов, насыпей, тоннелей и других сооружений. Метод конечных разностей разбивает рассматриваемую область грунта на небольшие элементы, в каждом из которых вычисляются приближенные решения уравнений, описывающих поведение материала. Точность моделирования напрямую зависит от размера этих элементов и сложности используемых моделей материала, что требует значительных вычислительных ресурсов и глубокого понимания геологических условий площадки. Несмотря на свою устоявшуюся позицию, данный подход подвергается критике из-за вычислительной сложности и ограничений в обработке нелинейных задач.

Устоявшиеся численные методы в геотехнической инженерии, такие как метод конечных разностей, несмотря на свою давнюю историю применения, зачастую сталкиваются с серьезными ограничениями при моделировании сложных нелинейных процессов в грунтах. Вычислительные затраты при решении подобных задач могут быть чрезвычайно высокими, требуя значительных ресурсов и времени. Это особенно актуально при анализе деформирования и разрушения грунтов под нагрузкой, где даже небольшие изменения в начальных условиях или свойствах материала могут привести к существенным отклонениям в прогнозах. Ограниченная способность традиционных методов адекватно учитывать сложные нелинейности снижает точность предсказаний, что может приводить к неоптимальным или даже небезопасным инженерным решениям. Таким образом, потребность в более эффективных и точных подходах к моделированию нелинейного поведения грунтов остается актуальной задачей современной геотехники.

Традиционные численные методы в геотехнической инженерии, несмотря на свою устоявшуюся практику, зачастую требуют значительной ручной калибровки для достижения приемлемой точности моделирования. Эта необходимость в тонкой настройке параметров снижает их применимость к новым, ранее не встречавшимся условиям, ограничивая возможности прогнозирования поведения грунтов в реальных сценариях. Однако, несмотря на эти ограничения, конечно-разностные решатели демонстрируют впечатляющую скорость работы: моделирование волновых процессов, требующее огромных вычислительных ресурсов, выполняется ими за секунды, в то время как альтернативные подходы, такие как физически информированные нейронные сети (PINNs), могут потребовать в 90 000 раз больше времени для решения той же задачи. Данный факт подчеркивает, что, несмотря на недостатки, традиционные методы остаются конкурентоспособными в задачах, требующих высокой скорости вычислений.

Для получения достоверной оценки обобщающей способности модели при анализе геотехнических данных необходимо использовать пространственно независимое разделение на обучающую и тестовую выборки, избегая попадания тестовых точек в область корреляции с обучающими, учитывая типичные для почв горизонтальные длины корреляции в 50-100 м.
Для получения достоверной оценки обобщающей способности модели при анализе геотехнических данных необходимо использовать пространственно независимое разделение на обучающую и тестовую выборки, избегая попадания тестовых точек в область корреляции с обучающими, учитывая типичные для почв горизонтальные длины корреляции в 50-100 м.

Нейронные сети: обещания и подводные камни

Многослойные персептроны (MLP) представляют собой альтернативный подход к решению задач, основанный на их способности аппроксимировать сложные функциональные зависимости и обучаться на основе предоставленных данных. В основе MLP лежит последовательное соединение нескольких слоев искусственных нейронов, что позволяет модели улавливать нелинейные взаимосвязи в данных. Процесс обучения MLP включает в себя настройку весов соединений между нейронами с целью минимизации ошибки между предсказанными и фактическими значениями. Благодаря своей универсальной аппроксимационной способности, MLP могут быть применены для решения широкого спектра задач, включая регрессию, классификацию и прогнозирование, при условии наличия достаточного объема обучающих данных.

Многослойные персептроны (MLP) подвержены проблеме экстраполяции, заключающейся в неспособности точно предсказывать поведение системы за пределами диапазона данных, использованных для обучения. В контексте геотехнических задач, где условия грунта и нагрузки могут значительно отличаться от тех, что были представлены в обучающей выборке, это является критическим недостатком. Например, модель, обученная на данных о деформациях грунта при определенных уровнях напряжения, может давать неточные результаты при значительно более высоких или низких напряжениях, что приводит к неверным инженерным оценкам и потенциально небезопасным конструкциям. Точность предсказаний MLP резко снижается при выходе за пределы области, определенной обучающими данными.

Использование различных функций активации, таких как ReLU, tanh и Sigmoid, в многослойных перцептронах (MLP) может влиять на производительность модели, однако не решает проблему экстраполяции. Несмотря на способность MLP к обучению, точность, достигнутая с помощью физически информированных нейронных сетей (PINN), составляет 10-3, что значительно ниже, чем точность 10-15, обеспечиваемая методами конечных разностей. Таким образом, при решении задач, требующих высокой точности и надежной экстраполяции, методы конечных разностей остаются предпочтительным выбором по сравнению с PINN и стандартными MLP.

Несмотря на высокую точность обучения (RMSE менее 2 мм в течение первых 2 лет), многослойные персептроны с различными функциями активации демонстрируют катастрофический провал при экстраполяции на 10 лет: ReLU приводит к неограниченному линейному росту (<span class="katex-eq" data-katex-display="false">RMSE = 87.6</span> мм), в то время как tanh и sigmoid преждевременно насыщаются (<span class="katex-eq" data-katex-display="false">RMSE = 31</span> мм), в то время как истинное решение асимптотически приближается к 100 мм.
Несмотря на высокую точность обучения (RMSE менее 2 мм в течение первых 2 лет), многослойные персептроны с различными функциями активации демонстрируют катастрофический провал при экстраполяции на 10 лет: ReLU приводит к неограниченному линейному росту (RMSE = 87.6 мм), в то время как tanh и sigmoid преждевременно насыщаются (RMSE = 31 мм), в то время как истинное решение асимптотически приближается к 100 мм.

Физически информированное машинное обучение: гибридный подход

Сети, обусловленные физическими принципами (PINN), представляют собой гибридный подход, объединяющий возможности нейронных сетей с использованием управляющих физических уравнений, таких как волновое уравнение. Этот метод позволяет улучшить точность предсказаний и обобщающую способность модели, поскольку в процесс обучения интегрируются априорные знания о физической системе. Вместо того, чтобы полагаться исключительно на данные, PINN используют физические законы в качестве регуляризаторов, что особенно полезно при ограниченном объеме обучающих данных или для экстраполяции за пределы области данных. В результате, PINN способны решать сложные задачи, такие как моделирование дифференциальных уравнений в частных производных, с большей эффективностью и надежностью.

Нейронные сети, обусловленные физикой (PINN), используют автоматическое дифференцирование для вычисления производных функции потерь, что позволяет эффективно оптимизировать как управляемые данными, так и основанные на физических законах компоненты. Этот процесс позволяет PINN учитывать физические уравнения непосредственно в процессе обучения, вычисляя производные неявно, без необходимости ручного вывода аналитических выражений. Автоматическое дифференцирование обеспечивает точное и эффективное вычисление градиентов \frac{\partial L}{\partial u} (где L — функция потерь, а u — решение), необходимых для обновления весов нейронной сети посредством алгоритмов оптимизации, таких как стохастический градиентный спуск. В отличие от традиционных методов, требующих дискретизации уравнений и ручного вычисления производных, автоматическое дифференцирование позволяет использовать непрерывные функции и точно вычислять производные любого порядка, что повышает точность и эффективность обучения.

Несмотря на перспективность, сети, обусловленные физическими принципами (PINN), могут быть вычислительно затратными и не всегда превосходить традиционные методы, требуя тщательного рассмотрения деталей реализации. Сравнение производительности показывает, что для обработки 10 000 случаев, DeepONet требует 258 секунд, в то время как прямое решение методом конечных разностей завершается всего за 1,1 секунды, что демонстрирует 235-кратное отставание по скорости. Таким образом, при выборе подхода необходимо учитывать вычислительные ресурсы и сравнивать эффективность PINN с альтернативными методами для конкретной задачи.

Сравнение методов решения обратной задачи показывает, что автоматическое дифференцирование обеспечивает более быструю и надежную реконструкцию профилей скорости <span class="katex-eq" data-katex-display="false"> (RMSE = 3.18 \times 10^{-2}) </span> по сравнению с обратной PINN, что делает его предпочтительным выбором для решения подобных задач.
Сравнение методов решения обратной задачи показывает, что автоматическое дифференцирование обеспечивает более быструю и надежную реконструкцию профилей скорости (RMSE = 3.18 \times 10^{-2}) по сравнению с обратной PINN, что делает его предпочтительным выбором для решения подобных задач.

Динамическое моделирование с использованием графовых сетей и глубоких операторов

Глубокие операторные сети (DONs) представляют собой инновационный подход к моделированию динамических систем, отличающийся от традиционных методов, которые обычно аппроксимируют решения дифференциальных уравнений. Вместо этого, DONs обучаются непосредственно отображать функции входных данных в функции выходных, позволяя захватывать сложные зависимости и нелинейности, присущие реальным процессам. Этот подход особенно эффективен при работе с функциями, представляющими динамическое поведение системы во времени или пространстве. Обучение происходит путем предоставления сети пар входных и выходных функций, что позволяет ей выучить оператор, преобразующий первую во вторую. В отличие от традиционных нейронных сетей, которые предсказывают значения в дискретных точках, DONs способны генерировать целые функции, что существенно расширяет возможности моделирования и анализа сложных динамических систем, таких как физические процессы или поведение материалов.

Сочетание сетей глубоких операторов (DONs) с упрощенными физическими моделями, такими как фундамент Винклера, позволяет существенно повысить эффективность обучения и обобщающую способность системы. Использование предварительно заданных физических ограничений, встроенных в модель, снижает потребность в огромных объемах обучающих данных и ускоряет процесс сходимости. Вместо того чтобы DONs самостоятельно изучали все аспекты динамики, они фокусируются на изучении отклонений от базового физического поведения, что приводит к более робастным и точным результатам. Такой подход особенно полезен при моделировании сложных систем, где полное представление динамики требует значительных вычислительных ресурсов и данных, а упрощенная модель служит надежной основой для обучения и экстраполяции.

Современные методы моделирования, основанные на дискретных частицах, такие как метод материальных точек (Material Point Method), в сочетании с графовыми нейронными сетями, открывают новые возможности для симуляции гранулированных материалов и изучения сложных законов их взаимодействия. Использование автоматического дифференцирования в процессе обучения демонстрирует впечатляющую точность восстановления параметров модели, подтвержденную относительными ошибками в пределах 0.56% и 6.8%. Данный подход позволяет не только эффективно моделировать поведение различных сыпучих сред, но и выявлять скрытые закономерности в их физических свойствах, что имеет важное значение для широкого спектра приложений — от разработки строительных материалов до моделирования геологических процессов.

Модель, обученная на схлопывании гранулярной колонны с одним барьером, демонстрирует обобщение на невидимые ранее граничные условия, точно предсказывая динамику потока при наличии нескольких барьеров и различных конфигураций, что указывает на усвоение локальных законов взаимодействия, а не глобальных соответствий вход-выход.
Модель, обученная на схлопывании гранулярной колонны с одним барьером, демонстрирует обобщение на невидимые ранее граничные условия, точно предсказывая динамику потока при наличии нескольких барьеров и различных конфигураций, что указывает на усвоение локальных законов взаимодействия, а не глобальных соответствий вход-выход.

Исследование, представленное в статье, подчеркивает важность критического подхода к применению методов машинного обучения в геотехнике. Авторы справедливо отмечают, что традиционные численные методы зачастую демонстрируют превосходство в скорости, точности и, что особенно важно, в способности к экстраполяции за пределы обучающих данных. В этом контексте вспоминается высказывание Сергея Соболева: «Гипотеза — это не вера, а приглашение к сомнению». Действительно, не стоит слепо доверять результатам, полученным с помощью любой модели, будь то нейронная сеть или метод конечных разностей. Каждая гипотеза требует тщательной проверки и осмысления, особенно когда речь идет о задачах, где надежность и предсказуемость играют ключевую роль, как в геотехническом моделировании.

Что дальше?

Представленные результаты, несмотря на всю привлекательность идеи обучения нейронных сетей решению задач геотехники, указывают на необходимость осторожного подхода. Увлечение «магией» глубокого обучения не должно заслонять собой фундаментальную истину: когда требуется предсказание поведения системы за пределами обучающей выборки, традиционные численные методы, пусть и более трудоёмкие в реализации, демонстрируют превосходство в надёжности и точности. Если результат не воспроизводится на независимом наборе данных, это не научное открытие, а, скорее, забавный артефакт.

Перспективы развития, вероятно, лежат не в прямой замене конечных разностей на нейронные сети, а в их гибридном использовании. Например, нейронные сети могут быть применены для ускорения итерационных процессов в численных схемах или для построения более точных конститутивных моделей грунтов. Однако, любые утверждения о превосходстве новой методики должны быть подкреплены строгими количественными оценками и верификацией на широком спектре задач.

Необходимо также уделить внимание вопросам интерпретируемости полученных результатов. «Черный ящик» нейронной сети может выдать правильный ответ, но без понимания механизма этого ответа, сложно говорить о научном прогрессе. В конечном итоге, геотехника — это не просто цифры, а понимание физических процессов, происходящих в грунте, и любые инструменты, даже самые современные, должны служить этой цели.


Оригинал статьи: https://arxiv.org/pdf/2512.24365.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-01-02 08:11