Нейронные сети предсказывают поведение сложных систем

Автор: Денис Аветисян


В новой работе исследователи предлагают методы глубокого обучения для точного моделирования нелинейных динамических систем и оценки неопределенностей в прогнозах.

🐢

Ищешь ракеты? Это не к нам. У нас тут скучный, медленный, но надёжный, как швейцарские часы, фундаментальный анализ.

Телеграм канал
Стальная двумерная рама, подверженная гистеретическому поведению, моделируется с использованием модели Бука-Вэна, что позволяет исследовать деформацию конструкции как в целом, так и в упрощенной модели «сдвигового здания».
Стальная двумерная рама, подверженная гистеретическому поведению, моделируется с использованием модели Бука-Вэна, что позволяет исследовать деформацию конструкции как в целом, так и в упрощенной модели «сдвигового здания».

Представлены три архитектуры глубокого обучения — MLP-LSTM, MPNN-LSTM и AE-LSTM — для моделирования динамического отклика нелинейных структур с одновременной количественной оценкой эпистемической и алеаторной неопределенности.

Моделирование нелинейных стохастических динамических систем, особенно при учете неопределенностей как в параметрах конструкций, так и во внешних воздействиях, представляет собой сложную вычислительную задачу. В работе, озаглавленной ‘Deep Learning-Based Metamodeling of Nonlinear Stochastic Dynamic Systems under Parametric and Predictive Uncertainty’, предложены и исследованы три фреймворка метамоделирования на основе глубокого обучения — MLP-LSTM, MPNN-LSTM и AE-LSTM — для точного прогнозирования динамического ответа нелинейных конструкций при неопределенности. Полученные результаты демонстрируют низкую погрешность прогнозирования и корреляцию между дисперсией прогноза и фактической ошибкой, что подтверждает применимость предложенных подходов для стратегий активного обучения. Смогут ли эти фреймворки стать основой для разработки надежных и эффективных систем мониторинга и управления состоянием строительных конструкций в реальном времени?


Неизбежность Неопределенности: Основа Прогнозирования Конструкций

Точность прогнозирования поведения конструкций существенно ограничена присущими им неопределенностями, затрагивающими свойства материалов, условия нагружения, известные как стохастическое возбуждение, и параметры самой модели. Эти неопределенности возникают из-за естественной изменчивости материалов, неполного знания внешних воздействий и упрощений, неизбежно вносимых при создании математических представлений реальных систем. Вследствие этого, даже при использовании самых передовых методов моделирования, всегда существует вероятность отклонения фактического поведения конструкции от прогнозируемого, что требует учета этих неопределенностей для обеспечения надежности и безопасности инженерных сооружений. Игнорирование этих факторов может привести к недооценке рисков и, как следствие, к авариям и разрушениям, подчеркивая важность разработки методов, способных эффективно идентифицировать, оценивать и учитывать влияние неопределенностей на поведение конструкций.

Традиционные методы анализа конструкций часто оказываются неспособными адекватно оценить и распространить влияние неопределенностей в параметрах материалов и геометрии, что приводит к потенциально опасным ошибкам в проектировании и оценке надежности. Неспособность точно учесть разброс значений параметров, таких как модуль упругости или пределы прочности, может приводить к занижению несущей способности конструкции или к переоценке ее долговечности. В результате, проектировщики вынуждены прибегать к консервативным предположениям, что увеличивает стоимость и вес сооружений, либо рискуют столкнуться с неожиданными отказами и авариями. Поэтому разработка и внедрение более совершенных методов, способных эффективно учитывать и распространять структурные неопределенности, является критически важной задачей для обеспечения безопасности и надежности инженерных сооружений.

Сложные модели структур, такие как метод дискретизации по волокнам (Fiber-Discretized Frame) и модель Бука-Вэна (Bouc-Wen Model), несмотря на свою способность детально описывать поведение конструкций, предъявляют повышенные требования к учету вариаций параметров. Их точность напрямую зависит от способности адекватно отразить влияние незначительных изменений в исходных данных на конечный результат. Необходимость разработки надежных методов, способных количественно оценивать и распространять эти неопределенности, обусловлена тем, что даже небольшие отклонения в параметрах модели могут приводить к существенным различиям в прогнозируемом отклике конструкции. Эффективный анализ чувствительности и статистическое моделирование становятся критически важными инструментами для обеспечения достоверности и надежности прогнозов, особенно в задачах, связанных с оценкой безопасности и долговечности сооружений.

Сравнение различных схем показало, что средняя квадратичная ошибка (MSE) смещения в направлении X для модели Бука-Вэна позволяет оценить их точность и стабильность.
Сравнение различных схем показало, что средняя квадратичная ошибка (MSE) смещения в направлении X для модели Бука-Вэна позволяет оценить их точность и стабильность.

Глубокое Обучение как Инструмент Прогнозирования Временных Рядов

Рекуррентные нейронные сети (RNN), в частности, сети с долгой краткосрочной памятью (LSTM), эффективно обрабатывают временные зависимости в данных временных рядов. В отличие от традиционных нейронных сетей, LSTM имеют архитектуру, позволяющую сохранять информацию о прошлых состояниях, что критически важно для анализа последовательных данных. Это достигается за счет использования «ячеек памяти» и «вентилей» (gate), регулирующих поток информации. В контексте прогнозирования структурных ответов, LSTM способны учитывать предыдущие значения параметров конструкции во времени, что позволяет более точно предсказывать их поведение в будущем и учитывать инерционные эффекты, что делает их превосходящими по точности по сравнению с моделями, не учитывающими временную зависимость.

Для повышения точности и эффективности прогнозирования временных рядов применяется вейвлет-преобразование (Wavelet Transform) для снижения размерности входных данных перед подачей в LSTM-сеть. Вейвлет-преобразование позволяет разложить сигнал на различные частотные компоненты, выделяя наиболее значимые для прогнозирования и отбрасывая шумовые составляющие или менее информативные частоты. Это приводит к уменьшению вычислительной нагрузки на LSTM-сеть и снижению риска переобучения, особенно при работе с большими объемами данных или сигналами высокой частоты. В результате достигается более быстрая сходимость модели и повышение её обобщающей способности.

В основе предлагаемого подхода лежит использование комбинаций LSTM с другими архитектурами нейронных сетей, такими как MLP-LSTM, AE-LSTM и MPNN-LSTM. MLP-LSTM объединяет LSTM с многослойным персептроном (MLP) для улучшения обработки нелинейных зависимостей и повышения точности прогнозирования. AE-LSTM использует автоэнкодер (AE) для снижения размерности входных данных и извлечения наиболее значимых признаков перед подачей в LSTM. MPNN-LSTM интегрирует Message Passing Neural Networks (MPNN) для моделирования взаимосвязей между различными временными точками и улучшения способности сети к обобщению. Комбинирование LSTM с этими архитектурами позволяет улавливать более широкий спектр характеристик и взаимосвязей в данных временных рядов, что приводит к повышению качества прогнозов.

Анализ показал, что существует сильная корреляция между максимальной абсолютной ошибкой (MAE) и максимальной дисперсией на тестовых данных для всех рассмотренных схем <span class="katex-eq" data-katex-display="false">MLP-LSTM</span>, <span class="katex-eq" data-katex-display="false">MPNN-LSTM</span> и <span class="katex-eq" data-katex-display="false">AE-LSTM</span>, что визуализируется на логарифмической шкале.
Анализ показал, что существует сильная корреляция между максимальной абсолютной ошибкой (MAE) и максимальной дисперсией на тестовых данных для всех рассмотренных схем MLP-LSTM, MPNN-LSTM и AE-LSTM, что визуализируется на логарифмической шкале.

Различение Сути Неопределенности: Алеаторная и Эпистемическая Природа

В контексте оценки неопределенности выделяют два основных типа: алеаторную и эпистемическую. Алеаторная неопределенность ( \sigma^2 ) отражает присущую системе случайность и необратимость процессов, например, шум в сенсорах или естественную вариативность данных. В отличие от неё, эпистемическая неопределенность обусловлена недостатком знаний о системе или модели, включая неполноту данных, неточность параметров или упрощения в модели. Таким образом, алеаторная неопределенность является неотъемлемой частью самой системы, в то время как эпистемическая неопределенность связана с ограничениями в нашем понимании этой системы.

Алеаторная неопределенность, обусловленная внутренним шумом в системе, минимизируется посредством функции потерь отрицательного логарифмического правдоподобия (Negative Log-Likelihood Loss). Данный подход позволяет модели не просто предсказывать значения, но и оценивать распределение вероятностей этих значений, учитывая присущую системе случайность. Минимизация NLL эквивалентна максимизации вероятности наблюдаемых данных при заданном распределении, что, по сути, означает обучение модели определять параметры этого распределения шума. Это позволяет более адекватно оценивать дисперсию предсказаний и, следовательно, количественно оценивать алеаторную неопределенность.

Оценка эпистемической неопределенности осуществляется с использованием метода ‘Monte Carlo Dropout’, который заключается во введении стохастичности (случайности) на этапе инференса (предсказания) модели. В процессе обучения, слои Dropout случайным образом отключают нейроны, предотвращая переобучение. Во время инференса, вместо использования средних весов слоев, Dropout продолжает применяться, создавая несколько немного отличающихся предсказаний. Разброс этих предсказаний и является мерой эпистемической неопределенности, отражающей степень неуверенности модели, вызванной недостатком знаний или данных. Чем больше разброс предсказаний, тем выше эпистемическая неопределенность, что указывает на необходимость сбора дополнительных данных или улучшения модели.

Компонент автокодировщика (Autoencoder) в архитектуре AE-LSTM выполняет роль извлечения устойчивых признаков и снижения размерности входных данных. Это достигается путем обучения автокодировщика реконструировать входные данные из сжатого представления, отбрасывая шум и выделяя наиболее значимые характеристики. Уменьшение размерности упрощает последующую обработку данных рекуррентной нейронной сетью (LSTM), а выделение устойчивых признаков повышает надежность оценки неопределенности, поскольку модель становится менее чувствительной к случайным колебаниям во входных данных и более сосредоточенной на существенных закономерностях. Более точное представление данных, полученное благодаря автокодировщику, напрямую влияет на улучшение точности оценки как алеаторной, так и эпистемической неопределенности.

Анализ показал сильную корреляцию между максимальной абсолютной ошибкой (MAE) и максимальной дисперсией на тестовых данных для всех рассмотренных схем <span class="katex-eq" data-katex-display="false">MLP-LSTM</span>, <span class="katex-eq" data-katex-display="false">MPNN-LSTM</span> и <span class="katex-eq" data-katex-display="false">AE-LSTM</span>, что визуализируется в логарифмическом масштабе для лучшей наглядности.
Анализ показал сильную корреляцию между максимальной абсолютной ошибкой (MAE) и максимальной дисперсией на тестовых данных для всех рассмотренных схем MLP-LSTM, MPNN-LSTM и AE-LSTM, что визуализируется в логарифмическом масштабе для лучшей наглядности.

Влияние на Проектирование Надежных Конструкций: Новый Взгляд на Безопасность

Сочетание прогностической силы глубокого обучения с явным количественным определением неопределенности позволяет получить более полное понимание поведения конструкций, чем это возможно при использовании традиционных методов. Подходы, основанные исключительно на детерминированных моделях, часто игнорируют вариативность, присущую материалам и нагрузкам, что приводит к неполной оценке рисков и потенциально недостаточно надежным проектам. Предложенный подход, напротив, позволяет не только предсказывать реакцию конструкции, но и оценивать доверие к этим предсказаниям, предоставляя информацию о диапазоне возможных результатов и позволяя инженерам принимать более обоснованные решения. Это особенно важно при проектировании критически важных инфраструктур, где даже небольшие отклонения могут привести к серьезным последствиям, и позволяет создавать конструкции, более устойчивые к неожиданным воздействиям и вариациям параметров.

Разработка надежных конструкций, менее восприимчивых к неопределенностям в свойствах материалов и условиях нагрузки, становится возможной благодаря представленному подходу. Традиционные методы проектирования зачастую не учитывают в полной мере влияние случайных факторов, что приводит к избыточному запасу прочности или, наоборот, к риску разрушения. Предложенная методология, сочетающая в себе возможности глубокого обучения и количественной оценки неопределенности, позволяет более точно прогнозировать поведение конструкции в различных сценариях. Это, в свою очередь, дает возможность оптимизировать конструкцию, минимизируя вес и стоимость, при сохранении требуемого уровня надежности и безопасности даже при колебаниях параметров и нагрузок. Таким образом, достигается повышение устойчивости и долговечности строительных сооружений, а также снижение эксплуатационных расходов.

Интеграция графовых нейронных сетей (MPNN) в архитектуру MPNN-LSTM позволяет модели эффективно учитывать взаимосвязи между элементами в сложных конструкциях. В отличие от традиционных подходов, которые рассматривают каждый элемент изолированно, MPNN-LSTM способен анализировать структурные зависимости, например, как нагрузка на один элемент влияет на деформацию соседних. Это особенно важно при прогнозировании нелинейного поведения, где локальные взаимодействия определяют общую устойчивость и реакцию системы. Благодаря способности MPNN моделировать отношения между узлами в графе, MPNN-LSTM демонстрирует превосходство в предсказании поведения сложных конструкций, учитывая, что структурные элементы не функционируют независимо друг от друга, а образуют взаимосвязанную сеть.

Исследование продемонстрировало высокую эффективность метамоделей на основе LSTM — MLP-LSTM, MPNN-LSTM и AE-LSTM — в точном предсказании нелинейных динамических реакций. В частности, MPNN-LSTM показала превосходство при моделировании сложных структур. При анализе примера модели Бука-Вэна значения средней квадратичной ошибки MSE оказались сопоставимыми для всех трех методов, однако при моделировании рамной конструкции, дискретизированной по волокнам, MPNN-LSTM и AE-LSTM значительно превзошли MLP-LSTM по точности прогнозирования, что свидетельствует о способности данных моделей эффективно учитывать взаимосвязи между элементами сложной системы и обеспечивать более надежные результаты.

В ходе исследований была выявлена умеренная положительная корреляция между абсолютной величиной ошибки предсказания и пиковым значением прогностической дисперсии в обоих рассмотренных случаях. Это указывает на то, что прогностическая дисперсия может служить полезным индикатором погрешности предсказания, предоставляя информацию о надежности полученных результатов. По сути, более высокая дисперсия свидетельствует о большей неопределенности в предсказании, что, в свою очередь, может указывать на более высокую вероятность значительной ошибки. Такая взаимосвязь позволяет не только оценивать точность модели, но и использовать дисперсию как меру доверия к предсказаниям, что особенно важно при принятии критических инженерных решений и разработке надежных конструкций.

Исследование демонстрирует, что предложенные фреймворки, использующие глубокое обучение — MLP-LSTM, MPNN-LSTM и AE-LSTM — способны эффективно моделировать нелинейные динамические системы при наличии неопределенностей. Данный подход позволяет не только предсказывать динамический отклик структур, но и количественно оценивать как эпистемическую, так и алеаторную неопределенности предсказаний. Как отмечал Алан Тьюринг: «Существенное препятствие для решения любой практической задачи — не недостаток знаний, а недостаток организации этих знаний». В контексте данной работы, эффективная организация и обработка данных, обеспечиваемая предложенными моделями, является ключом к преодолению сложностей, связанных с моделированием нелинейных систем и прогнозированием их поведения во времени.

Куда Ведет Эта Дорога?

Представленная работа, как и любая попытка обуздать хаос нелинейных систем, лишь обозначила границы известного. Созданные модели, несомненно, демонстрируют способность к прогнозированию, но следует помнить: время — не метрика, а среда, в которой ошибки неизбежны. Успех предсказания не означает устранения неопределенности, лишь её временное ограничение. Вопрос в том, насколько долго система сможет поддерживать эту иллюзию контроля.

Следующим шагом представляется не столько повышение точности, сколько разработка методов, позволяющих системе извлекать уроки из собственных ошибок. Модели, способные к самокоррекции и адаптации к меняющимся условиям, представляются более перспективными, чем те, что стремятся к недостижимому идеалу абсолютной точности. Необходимо сместить фокус с предсказания будущего на понимание механизмов возникновения ошибок.

Инциденты, неизбежно возникающие в любой сложной системе, следует рассматривать не как провалы, а как шаги на пути к зрелости. Попытки полностью исключить неопределенность — утопичны. Гораздо важнее научиться жить с ней, извлекая из неё ценную информацию и используя её для улучшения системы. В конечном счете, ценность модели определяется не ее способностью предсказывать будущее, а ее способностью адаптироваться к настоящему.


Оригинал статьи: https://arxiv.org/pdf/2603.12012.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-03-15 08:50