Автор: Денис Аветисян
Исследование предлагает машинное обучение для оценки эффективности рынка, используя лишь данные из биржевого стакана.
Предложенная экспериментальная методика позволяет прогнозировать аллокативную эффективность рынка на основе анализа данных биржевых торгов.
Несмотря на растущую важность цифровых рынков как ключевого элемента современной инфраструктуры, оценка их эффективности затруднена из-за отсутствия надежных методов анализа. В работе ‘An `Inverse’ Experimental Framework to Estimate Market Efficiency’ предложен новый подход, основанный на машинном обучении и экспериментальных данных, позволяющий прогнозировать эффективность распределения ресурсов (аллокативную эффективность) исключительно на основе данных из книги заявок. Разработанная модель позволяет оценивать потенциальную эффективность рынка, не требуя информации о скрытых резервных ценах участников, что открывает возможности для анализа реальных рынков. Возможно ли, используя предложенный фреймворк, создать инструменты для оперативной оценки и повышения эффективности работы различных цифровых платформ?
Эффективность Рынка: Теория и Практика
Понимание эффективности рынка — степени, в которой цены отражают доступную информацию — имеет фундаментальное значение как для теоретической экономики, так и для практической деятельности. Эффективность рынка не просто академический вопрос; она определяет, насколько точно цены сигнализируют об истинной стоимости активов, влияя на решения инвесторов, распределение капитала и общее экономическое благосостояние. Высокая эффективность рынка подразумевает, что информация быстро и полно включается в цены, делая практически невозможным систематическое получение прибыли за счет использования общедоступной информации. Изучение этой эффективности позволяет оценивать функционирование финансовых систем, прогнозировать рыночные тенденции и разрабатывать более совершенные инвестиционные стратегии, а также выявлять потенциальные аномалии и несоответствия, требующие дальнейшего анализа.
Традиционные экономические модели, стремящиеся объяснить поведение участников рынка, часто опираются на предположение о знании ими так называемых «резервных цен» — минимальной цены, по которой продавец готов продать актив, или максимальной цены, которую покупатель готов заплатить. Однако, на практике, полное знание резервных цен другими участниками рынка — явление крайне редкое. Это незнание создает значительные трудности при моделировании и прогнозировании рыночных процессов, поскольку поведение каждого участника зависит не только от его собственных предпочтений, но и от его представлений о предпочтениях других. Неполная информация о резервных ценах приводит к неопределенности и может объяснять некоторые аномалии, наблюдаемые на финансовых рынках, ставя под вопрос степень их эффективности и рациональности.
Недостаток информации о реальных резервных ценах участников рынка создает существенные трудности при прогнозировании и оценке его эффективности, особенно в сложных средах. Традиционные модели зачастую предполагают полное знание этих цен, что является упрощением, не отражающим реальность. В условиях неполной информации, поведение участников становится менее предсказуемым, что затрудняет точную оценку рыночных процессов и потенциальных рисков. Сложность ситуации усиливается в высокочастотной торговле и других современных рыночных структурах, где скорость и объем транзакций требуют более совершенных моделей, учитывающих ограниченность знаний участников и их влияние на ценообразование. Таким образом, оценка рыночной эффективности требует разработки более реалистичных подходов, способных учитывать информационную асимметрию и ее последствия для функционирования рынка.
Обратный Подход: Прогнозирование Эффективности по Данным
Инновационный “Обратный Экспериментальный Фреймворк” представляет собой новый подход к оценке аллокативной эффективности рынка. В отличие от традиционных методов, требующих оценки резервных цен участников, данный фреймворк напрямую прогнозирует эффективность, используя исключительно данные из книги ордеров. Это позволяет избежать сложностей и погрешностей, связанных с оценкой индивидуальных резервных цен, и предоставляет более прямой и оперативный способ анализа эффективности распределения ресурсов на рынке.
В основе предложенного подхода лежит анализ динамики рынка двойного аукциона, где покупатели и продавцы взаимодействуют напрямую, формируя цены посредством выставления заявок. Эффективность рынка выводится из наблюдаемых характеристик этих взаимодействий, таких как объемы торгов и изменения цен, без необходимости оценки резервных цен участников. Метод использует данные о заявках, чтобы определить, насколько полно реализуется потенциальная выгода от сделок, и, следовательно, оценить уровень эффективности распределения ресурсов на данном рынке. Анализ структуры заявок и последовательности их исполнения позволяет косвенно судить о том, насколько близки цены к равновесным значениям и насколько эффективно рынок способствует достижению оптимального распределения активов.
Метод предсказания аллокативной эффективности, основанный на анализе данных биржевых стаканов, демонстрирует работоспособность даже в условиях “черного ящика”. Это означает, что участники рынка не имеют доступа к информации о других заявках на покупку или продажу, и алгоритм способен эффективно оценивать эффективность распределения ресурсов, опираясь исключительно на наблюдаемые сделки и динамику цен. Отсутствие прозрачности в отношении скрытых заявок не влияет на точность прогнозов, что делает данный подход применимым в реальных рыночных условиях, где полная информация о намерениях других участников недоступна.
Машинное Обучение для Прогнозирования Эффективности
В качестве основной прогностической модели используется алгоритм градиентного бустинга деревьев. Этот метод позволяет эффективно анализировать данные из биржевого стакана, включающие информацию о ценах, объемах заявок на покупку и продажу, а также глубину рынка. Использование градиентного бустинга обеспечивает высокую точность прогнозирования эффективности, поскольку алгоритм последовательно строит ансамбль из слабых моделей (деревьев решений), корректируя ошибки предыдущих итераций. Особенностью является способность модели учитывать сложные нелинейные зависимости, характерные для динамики биржевых рынков, и эффективно извлекать информацию из многомерных данных биржевого стакана.
Для предобработки данных перед обучением модели машинного обучения используется квантильная нормализация. Этот метод позволяет уменьшить влияние выбросов, приводящих к нестабильности модели и снижению точности прогнозирования. В отличие от min-max нормализации или стандартизации, квантильная нормализация нечувствительна к экстремальным значениям в данных, поскольку преобразует признаки на основе их ранга, а не абсолютных значений. Это достигается путем сопоставления каждого значения с его квантилем в распределении, что приводит к более устойчивому и надежному процессу обучения.
Для повышения устойчивости и точности прогнозирования аллокативной эффективности используется функция потерь Хабера. В отличие от среднеквадратичной ошибки, функция Хабера менее чувствительна к выбросам в данных, что позволяет модели более стабильно работать с нетипичными значениями. Применение функции Хабера позволило достичь средней абсолютной процентной ошибки (MAPE) в диапазоне от 0.107 до 0.136 при оценке аллокативной эффективности. MAPE = \frac{1}{n} \sum_{i=1}^{n} |\frac{y_i - \hat{y}_i}{y_i}| \times 100 , где y_i — фактическое значение, а \hat{y}_i — прогнозируемое значение.
Интерпретируемые Прогнозы и Валидация Модели
Для объяснения результатов модели градиентного бустинга использовался метод TreeSHAP, позволивший выявить наиболее влиятельные признаки в данных биржевого стакана, определяющие предсказание эффективности. Анализ с помощью TreeSHAP продемонстрировал, какие конкретно параметры ордербука оказывают наибольшее влияние на конечный прогноз, предоставляя ценную информацию о механизмах формирования рыночной эффективности. Это позволяет не только оценить значимость отдельных факторов, но и глубже понять динамику рынка, выявляя ключевые индикаторы, определяющие его функционирование. Полученные результаты позволяют исследователям и практикам, работающим с финансовыми рынками, более точно интерпретировать прогнозы модели и использовать их для принятия обоснованных решений.
Анализ предсказывающей способности модели градиентного бустинга, в сочетании с методом TreeSHAP, позволяет получить глубокое понимание динамики рыночных процессов и выявлять потенциальные неэффективности. Модели демонстрируют высокую точность прогнозирования равновесной цены, достигая средней абсолютной процентной ошибки (MAPE) в диапазоне от 0.047 до 0.165. Такая степень точности позволяет не только прогнозировать ценовые колебания, но и идентифицировать факторы, оказывающие наибольшее влияние на формирование цены, что открывает возможности для оптимизации рыночных механизмов и выявления аномалий, требующих внимания регуляторов. Полученные результаты указывают на перспективность применения данного подхода для повышения прозрачности и эффективности функционирования финансовых рынков.
Статистические тесты однозначно подтверждают превосходство разработанной модели в прогнозировании равновесной цены. Полученные значения p-value, не превышающие 0.01 (подробные данные представлены в Приложении 7), свидетельствуют о статистической значимости полученных результатов и высокой надежности предсказаний. Данный комплексный подход, сочетающий в себе мощь алгоритмов машинного обучения и методы интерпретации, формирует эффективный инструмент для специалистов, занимающихся проектированием и регулированием рынков. Возможность не только прогнозировать, но и понимать факторы, влияющие на ценообразование, позволяет выявлять потенциальные неэффективности и совершенствовать структуру торговых площадок.
Исследование демонстрирует, что даже в контролируемой экспериментальной среде, предсказание эффективности рынка, основанное исключительно на данных из книги ордеров, возможно. Это не отменяет фундаментальных проблем с оценкой реальных рынков, но указывает на закономерности, которые можно использовать для приблизительной оценки. Как заметил Джон фон Нейманн: «В науке не бывает принципиально новых идей; есть лишь старые идеи, переоткрытые новыми поколениями». В данном случае, старые принципы машинного обучения применяются к новым данным, чтобы вновь оценить, насколько быстро рынок достигает оптимального распределения ресурсов. В конечном итоге, как и всегда, прод найдет способ использовать эти предсказания для получения небольшой, но стабильной прибыли, игнорируя все теоретические изыски об «эффективности».
Что дальше?
Представленная работа, безусловно, элегантна в своей попытке оценить эффективность рынка исключительно по данным стакана заказов. Однако, стоит помнить: каждая «революционная» метрика — это всего лишь ещё один способ отложить неизбежное столкновение с реальными данными. Оценка аллокативной эффективности в контролируемой экспериментальной среде — это одно, а предсказание поведения рынка, где каждый участник преследует свои, часто иррациональные, цели — совсем другое. Всё, что сейчас называют «scalable», очень скоро окажется не протестированным под нагрузкой.
Наиболее вероятным развитием представляется не поиск всё более сложных алгоритмов машинного обучения, а возвращение к фундаментальным вопросам рыночного дизайна. Попытки «угадать» эффективность по косвенным признакам — это, в лучшем случае, временное решение. Иногда лучше монолит, чем сто микросервисов, каждый из которых врёт. Вполне вероятно, что значительный прогресс будет достигнут не за счёт улучшения моделей, а за счёт создания более прозрачных и предсказуемых рыночных механизмов.
И, конечно, стоит помнить о неизбежном накоплении технического долга. Каждая новая функция, каждое улучшение модели — это ещё один слой абстракции, который рано или поздно потребует переработки. В конечном итоге, все эти сложные алгоритмы — лишь способ отсрочить момент, когда рынок просто начнёт вести себя непредсказуемо.
Оригинал статьи: https://arxiv.org/pdf/2604.18130.pdf
Связаться с автором: https://www.linkedin.com/in/avetisyan/
Смотрите также:
- БИТКОИН ПРОГНОЗ. BTC криптовалюта
- ПРОГНОЗ ДОЛЛАРА К ШЕКЕЛЮ
- SIREN ПРОГНОЗ. SIREN криптовалюта
- SAROS ПРОГНОЗ. SAROS криптовалюта
- ЭФИРИУМ ПРОГНОЗ. ETH криптовалюта
- MYX ПРОГНОЗ. MYX криптовалюта
- SOL ПРОГНОЗ. SOL криптовалюта
- ORDI ПРОГНОЗ. ORDI криптовалюта
- ПРОГНОЗ ЕВРО К ШЕКЕЛЮ
- ZEC ПРОГНОЗ. ZEC криптовалюта
2026-04-21 14:55