Предсказывая спрос как экономист: новый подход к точности моделей

Автор: Денис Аветисян

Исследователи показали, что обучение моделей прогнозирования временных рядов на синтетических данных, имитирующих рациональное поведение потребителей, значительно повышает точность прогнозов.

🐢

Ищешь ракеты? Это не к нам. У нас тут скучный, медленный, но надёжный, как швейцарские часы, фундаментальный анализ.

Телеграм канал

Для GARP 50K при <span class="katex-eq" data-katex-display="false">H=10</span>, наблюдается корреляция между потребительской оценкой эффективности (CCEI) и пригодностью пакета данных, при этом точные прохождения GARP (с <span class="katex-eq" data-katex-display="false">CCEI=1</span>) четко выделяются оранжевыми маркерами, что позволяет оценить качество и соответствие данных. — Для GARP 50K при $H=10$ , наблюдается корреляция между потребительской оценкой эффективности (CCEI) и пригодностью пакета данных, при этом точные прохождения GARP (с $CCEI=1$ ) четко выделяются оранжевыми маркерами, что позволяет оценить качество и соответствие данных.

В статье представлен метод GARP-EFM, использующий обобщенный аксиоматический подход к выявленным предпочтениям (GARP) для улучшения работы фундаментальных моделей, таких как Chronos-2, с применением адаптации LoRA и синтетических данных.

Несмотря на впечатляющие возможности современных предварительно обученных моделей временных рядов, они часто упускают из виду базовые принципы экономического поведения. В работе ‘GARP-EFM: Improving Foundation Models with Revealed Preference Structure’ показано, что обучение модели основам экономической логики значительно повышает точность прогнозирования спроса. Авторы использовали метод тонкой настройки модели Amazon Chronos-2 на синтетических данных, сгенерированных на основе агентов, максимизирующих полезность, с применением обобщенного аксиомы выявленных предпочтений (GARP), что позволяет создать рационально ограниченный прогнозный априорный механизм. Возможно ли дальнейшее расширение применения экономических теорий для генерации структурированных синтетических данных, улучшающих производительность фундаментальных моделей в различных областях?

Рациональность как Основа Прогнозирования Спроса

Точное прогнозирование спроса является основополагающим фактором эффективного распределения ресурсов, однако существующие методы зачастую испытывают трудности при моделировании сложного поведения потребителей. Традиционные подходы, как правило, полагаются на статистические закономерности, игнорируя глубинные экономические мотивы, определяющие выбор потребителя. Это приводит к неточностям, особенно в условиях динамично меняющихся рынков и непредсказуемых внешних факторов. Неспособность адекватно предсказать спрос влечет за собой избыточные запасы, дефицит товаров, снижение прибыли и потерю конкурентоспособности. В связи с этим, возрастает потребность в более совершенных моделях, учитывающих рациональность потребителя и позволяющих создавать реалистичные сценарии развития событий.

В основе прогнозирования спроса лежит сложная задача — моделирование рациональности потребителей, то есть предположение о том, что люди последовательно делают выбор, стремясь к максимальной полезности. Непоследовательность в потребительском поведении часто возникает не из иррациональности, а из сложности учета всех факторов, влияющих на принятие решений. Попытки упростить эту сложность, игнорируя внутреннюю логику выбора, приводят к неточным прогнозам. Понимание того, как потребители оценивают альтернативы и делают выбор, основываясь на своих предпочтениях и ограничениях, имеет решающее значение для создания эффективных моделей прогнозирования. Более того, принятие во внимание того, что потребительские предпочтения могут меняться со временем, и учет этих изменений в моделях, значительно повышает точность прогнозов спроса и позволяет более эффективно планировать ресурсы.

Предлагаемый подход к прогнозированию спроса основывается на принципах экономической рациональности. В его основе лежит концепция выявленных предпочтений, позволяющая реконструировать предпочтения потребителей на основе их наблюдаемого выбора. Для преодоления ограничений стандартной модели, используется обобщенный аксиом выявленных предпочтений $GARP$ , который позволяет учитывать более сложные паттерны поведения и несовершенства в принятии решений. Благодаря этому, создается синтетический набор данных, реалистично отражающий поведение потребителей и позволяющий обучать и оценивать точность прогностических моделей в контролируемой среде, минуя зависимость от неполных или искаженных данных реальных продаж. Такой подход обеспечивает более надежную и точную основу для прогнозирования спроса, учитывая фундаментальные принципы экономической теории.

Предложенный подход позволяет обучать и оценивать модели прогнозирования спроса в контролируемой среде, что существенно расширяет возможности анализа по сравнению с использованием исключительно наблюдательных данных. Традиционные методы часто сталкиваются с трудностями при работе с неполными или зашумленными данными, а также с проблемой выявления истинных предпочтений потребителей. Создание синтетических данных, основанных на принципах экономической рациональности и, в частности, на обобщенном аксиоме выявленных предпочтений (GARP), позволяет генерировать наборы данных, в которых можно точно контролировать параметры и тестировать различные сценарии. Это дает возможность не только повысить точность прогнозов, но и глубже понять факторы, влияющие на поведение потребителей, а также оценить устойчивость моделей к различным типам искажений и шумов, что особенно важно в условиях высокой волатильности рынка.

Chronos-2: Трансформерная Модель для Вероятностного Прогнозирования

Модель Chronos-2, являющаяся основой нашего подхода, представляет собой вероятностную модель прогнозирования, построенную на архитектуре Transformer. Использование Transformer позволяет эффективно моделировать временные зависимости в данных, учитывая как прошлые значения, так и взаимосвязи между различными временными точками. В отличие от традиционных рекуррентных нейронных сетей, Transformer использует механизм внимания (attention), который позволяет модели концентрироваться на наиболее релевантных частях входной последовательности, что особенно важно для прогнозирования спроса с учетом сезонности и трендов. Гибкость архитектуры Chronos-2 позволяет адаптировать модель к различным типам временных рядов и прогнозировать спрос на широкий спектр товаров и услуг.

Модель Chronos-2 использует два механизма внимания для повышения точности прогнозирования. Механизм Внимания ко времени (Time Attention) предназначен для выявления и моделирования последовательных зависимостей во временных рядах, что позволяет учитывать исторические тенденции и сезонность. Параллельно, механизм Группового внимания (Group Attention) анализирует взаимосвязи между различными товарами в потребительской корзине. Это позволяет учитывать, что спрос на один товар может быть связан со спросом на другие товары, и моделировать эти корреляции для повышения общей точности прогнозов.

Для решения вычислительных задач и обеспечения эффективной тонкой настройки модели, используется LoRA — метод адаптации с низкой ранговостью. LoRA замораживает предварительно обученные веса модели и вводит небольшое количество обучаемых параметров, представляющих низкоранговые разложения матриц весов. Это значительно снижает количество обучаемых параметров, что уменьшает потребность в памяти и вычислительных ресурсах при обучении, особенно при работе с большими языковыми моделями. Вместо обновления всех параметров модели, LoRA обновляет только эти низкоранговые матрицы, что позволяет добиться сопоставимой производительности при значительно меньших затратах.

Комбинация архитектурных решений в Chronos-2 обеспечивает возможность изучения сложных паттернов спроса при сохранении вычислительной эффективности. Использование механизма Time Attention позволяет модели эффективно захватывать последовательные зависимости во временных рядах, в то время как Group Attention моделирует взаимосвязи между различными товарами в потребительской корзине. Применение техники LoRA (Low-Rank Adaptation) для адаптации модели снижает количество обучаемых параметров, что существенно уменьшает вычислительные затраты и позволяет эффективно проводить тонкую настройку модели даже на больших объемах данных. Это позволяет Chronos-2 успешно обрабатывать сложные временные зависимости и обеспечивать точные прогнозы спроса, не требуя при этом чрезмерных вычислительных ресурсов.

Сравнение Chronos-2 и GARP 50K показывает, что Chronos-2 демонстрирует более высокие значения пригодности пакетов потребительского уровня к горизонту <span class="katex-eq" data-katex-display="false">H=10</span>, что указывает на его превосходство в данном сценарии. — Сравнение Chronos-2 и GARP 50K показывает, что Chronos-2 демонстрирует более высокие значения пригодности пакетов потребительского уровня к горизонту $H=10$ , что указывает на его превосходство в данном сценарии.

Оценка Точности Прогноза: Синтетические и Эмпирические Данные

Для оценки способности модели прогнозировать рациональный выбор потребителей был сгенерирован синтетический набор данных, основанный на принципах максимизации полезности и обобщенной аксиомы рациональности (GARP). Данный подход позволяет создать “истинный” результат (ground truth), поскольку поведение потребителей в синтетических данных моделируется в соответствии с экономическими принципами рациональности. Это позволяет объективно оценить точность прогнозов модели путем сравнения предсказанных выборов с выборами, основанными на максимизации полезности и соответствующих аксиомам рациональности, что обеспечивает контролируемую среду для тестирования и калибровки модели.

Тонкая настройка модели Chronos-2 на синтетических данных, сгенерированных на основе принципов максимизации полезности и GARP, позволила снизить ошибку предсказания наборов товаров (bundle prediction error) на 17-18% при горизонте прогнозирования 5, 10 и 15, и на 31% при горизонте в 1, по сравнению с исходным вариантом модели без дополнительного обучения (zero-shot baseline). Данное улучшение демонстрирует эффективность использования синтетических данных для повышения точности прогнозирования потребительского выбора в задачах, связанных с формированием наборов товаров.

Для оценки способности модели обобщать результаты, была проведена валидация на данных, полученных в ходе эксперимента Ан и др. — сценария выбора портфеля в реальных условиях. В данном эксперименте участники принимали решения о распределении бюджета между различными активами, что позволило оценить производительность модели в контексте, приближенном к реальным потребительским предпочтениям. Использование данных из независимого эксперимента позволило подтвердить, что улучшения, достигнутые на синтетических данных, переносятся на реальные сценарии принятия решений.

Анализ экспериментальных данных, включающий индекс критической экономической эффективности (CCEI) в качестве меры рациональности потребительского выбора, показал корреляцию между CCEI и соответствием предсказанного набора товаров (bundle fitness) на уровне 0.456. Данный показатель указывает на умеренную взаимосвязь между степенью рациональности, определяемой CCEI, и точностью прогнозирования предпочтений потребителей моделью. Умеренная корреляция предполагает, что рациональность является одним из факторов, влияющих на предсказуемость выбора, но не единственным, и другие факторы также могут играть значительную роль.

При <span class="katex-eq" data-katex-display="false">H=10</span>, доля потребителей, достигших каждого порога соответствия комплекту, указывает на то, что порог 0.75 является значимым рубежом для достижения удовлетворительного соответствия. — При $H=10$ , доля потребителей, достигших каждого порога соответствия комплекту, указывает на то, что порог 0.75 является значимым рубежом для достижения удовлетворительного соответствия.

Влияние и Перспективы Развития

Данное исследование демонстрирует значительный потенциал интеграции экономических принципов и современных методов машинного обучения для повышения точности прогнозирования спроса. Вместо использования исключительно статистических закономерностей, предложенный подход учитывает рациональное поведение потребителей, что позволяет модели более эффективно экстраполировать данные и предсказывать спрос в новых, ранее не встречавшихся ситуациях. Результаты показывают, что подобный симбиоз позволяет не только улучшить краткосрочные прогнозы, но и обеспечить более надежные долгосрочные оценки, что особенно важно для оптимизации логистики, управления запасами и планирования производства. Таким образом, сочетание экономического моделирования и машинного обучения открывает новые возможности для повышения эффективности бизнес-процессов и принятия обоснованных управленческих решений.

Основываясь на принципах рационального поведения потребителей, разработанная модель демонстрирует повышенную способность к обобщению и прогнозированию спроса на новых, ранее не встречавшихся данных. В отличие от традиционных алгоритмов машинного обучения, которые часто полагаются на обнаружение статистических закономерностей без учета экономических основ, данный подход позволяет модели не просто запоминать прошлые тренды, но и понимать логику, лежащую в основе потребительских решений. Это приводит к более устойчивым и точным прогнозам, особенно в условиях меняющейся рыночной конъюнктуры и непредсказуемых внешних факторов. Учет рациональности позволяет модели экстраполировать полученные знания на новые ситуации, минимизируя риск ошибок и повышая надежность планирования спроса.

Предложенная методика прогнозирования спроса обладает значительным потенциалом для расширения. Помимо базовых экономических принципов, в модель можно интегрировать дополнительные факторы, существенно влияющие на потребительское поведение. В частности, учет сезонности, рекламных кампаний и внешних событий, таких как праздники или экономические потрясения, позволит повысить точность прогнозов. Интеграция данных о маркетинговых активностях и макроэкономических показателях не только улучшит способность модели адаптироваться к меняющимся условиям, но и предоставит более детальное понимание динамики спроса, что особенно важно для оптимизации запасов и планирования производства.

Дальнейшие исследования направлены на изучение границ рациональности в потребительском поведении. Существующие модели часто исходят из предположения о полностью рациональных агентах, однако реальные потребители принимают решения в условиях ограниченной информации, времени и когнитивных способностей. Поэтому, особое внимание будет уделено разработке моделей, учитывающих концепцию “ограниченной рациональности”, когда решения принимаются на основе упрощенных правил и эвристик, а не путем полной оптимизации. Исследование влияния когнитивных искажений, таких как эффект привязки или неприятие потерь, на процесс формирования спроса позволит создать более реалистичные и точные прогнозы, учитывающие сложность и иррациональность человеческого поведения. Такой подход обещает не только улучшить качество прогнозирования, но и углубить понимание механизмов принятия решений потребителями.

Исследование демонстрирует, что даже при работе с нерациональным поведением потребителей, использование принципов максимизации полезности позволяет значительно улучшить точность прогнозирования спроса. Этот подход, основанный на генерации синтетических данных, подчеркивает важность последовательной проверки гипотез и учета аномалий. Как однажды заметил Давид Юм: «Мудрость состоит не в том, чтобы избежать ошибок, а в том, чтобы исправлять их». Данное исследование, фокусируясь на применении GARP (обобщенного аксиомы выявленных предпочтений) для тонкой настройки моделей, подтверждает, что истина рождается не из единой, идеальной модели, а из непрерывного цикла анализа и корректировки, особенно когда дело касается сложных систем, таких как поведение потребителей.

Куда двигаться дальше?

Представленная работа демонстрирует, что навязывание принципов, пусть и не всегда строго соблюдаемых, рациональности агентов при генерации синтетических данных способно улучшить точность прогнозирования временных рядов. Однако, не стоит забывать старую истину: даже самая элегантная модель — лишь упрощение реальности. Вопрос в том, насколько оправдано такое упрощение, и где кроются границы применимости данного подхода. Успех метода, зависящий от способности модели «выучить» рациональность, подчеркивает необходимость более глубокого изучения взаимосвязи между предположениями о поведении агентов и качеством прогнозов.

Очевидным направлением дальнейших исследований является расширение класса используемых аксиом. Если обобщенный аксиом предпочтений (GARP) оказался полезным, то не стоит ли исследовать другие варианты, учитывающие когнитивные искажения или поведенческую инерцию? Или, возможно, более перспективным путем окажется отказ от жестких аксиом в пользу более гибких, вероятностных моделей, описывающих степень рациональности агентов? Ошибка в прогнозе, в конце концов, не проблема, а информация — сигнал о том, что модель нуждается в пересмотре.

Кроме того, заслуживает внимания вопрос о масштабируемости подхода. Способность модели эффективно использовать структуру предпочтений может оказаться ограниченной в условиях высокой размерности данных или сложной динамики временных рядов. Необходимо исследовать, какие методы адаптации и регуляризации позволят сохранить преимущества подхода при работе с более сложными и реалистичными данными. И, наконец, всегда стоит помнить: модель хороша не тогда, когда она идеально соответствует данным, а когда она позволяет делать полезные прогнозы, даже если эти прогнозы не всегда оказываются верными.

Оригинал статьи: https://arxiv.org/pdf/2603.23993.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-03-26 14:12