Время решает всё: Анализ выживаемости в DeFi

Автор: Денис Аветисян


Новое исследование демонстрирует, как учет временных факторов и истории пользователей повышает точность прогнозирования в сфере децентрализованных финансов.

☕️

Читаем отчёты, пьём кофе, ждём дивиденды. Если тебе надоел хайп и ты ищешь скучную, но стабильную гавань — добро пожаловать.

Телеграм канал

В статье представлен бенчмарк FinSurvival 2025, демонстрирующий важность моделирования временной динамики и цензурирования данных для анализа времени до события в DeFi.

Несмотря на растущий объем данных, генерируемых децентрализованными платформами Web3, отсутствует единый стандарт для оценки методов анализа временных рядов в этой области. В работе ‘Benchmarking Temporal Web3 Intelligence: Lessons from the FinSurvival 2025 Challenge’ представлен бенчмарк FinSurvival 2025, основанный на 21.8 миллионах транзакций протокола Aave v3, который демонстрирует важность разработки признаков, учитывающих историю пользователей, и явного моделирования временной динамики для точного прогнозирования времени наступления событий. Результаты показывают, что учет специфики предметной области значительно превосходит универсальные подходы к моделированию. Может ли Web3 стать высокоточной платформой для изучения фундаментальных задач временного анализа, таких как отток клиентов, оценка рисков и эволюция систем, актуальных для всего Web?


Иллюзия Временной Точности в Финансах

Традиционные финансовые модели зачастую игнорируют ключевую роль времени, что приводит к неточным оценкам рисков и упущенным возможностям. В то время как финансовые инструменты подвержены влиянию временных факторов — таких как сезонность, цикличность и внезапные изменения рыночных настроений — стандартные подходы часто предполагают стационарность данных, то есть неизменность их статистических свойств во времени. Это упрощение может привести к недооценке волатильности, неправильному определению корреляций и, как следствие, к принятию неоптимальных инвестиционных решений. В результате, финансовые институты и инвесторы могут упускать возможности для получения прибыли или подвергаться неоправданным убыткам, поскольку модели не отражают динамичную природу финансовых рынков и не учитывают влияние временных задержек и изменений в поведении участников.

Децентрализованные финансы (DeFi) создают беспрецедентный объем данных о транзакциях, отмеченных точным временем совершения — данные блокчейна. В отличие от традиционных финансовых систем, где временные метки часто утеряны или неточны, блокчейн предоставляет полную и неизменяемую историю каждой операции. Этот поток данных открывает новые возможности для анализа временных закономерностей, позволяя выявлять тренды, предсказывать изменения ликвидности и оценивать риски с невиданной ранее точностью. Благодаря детальной хронологии транзакций, становится возможным не только отслеживание движения капитала, но и понимание поведения участников рынка, а также выявление аномалий, которые могли бы остаться незамеченными в традиционных системах. В конечном итоге, богатство временных данных, генерируемых DeFi, является ключевым фактором, стимулирующим развитие нового поколения финансовых аналитических инструментов.

Данные, генерируемые децентрализованными финансами (DeFi) и основанные на блокчейне, обладают уникальной характеристикой — нестационарностью. Это означает, что статистические закономерности, наблюдаемые в определенный момент времени, не сохраняются постоянно и подвержены изменениям. Традиционные методы статистического анализа, предполагающие стабильность данных, оказываются неэффективными при работе с такими потоками информации. Например, корреляции между различными криптовалютами или паттерны транзакций, успешно предсказывающие ценовые движения вчера, могут оказаться совершенно бесполезными сегодня. Следовательно, для адекватного анализа и прогнозирования на основе блокчейн-данных требуются инновационные подходы, учитывающие динамику временных рядов и способные адаптироваться к постоянно меняющимся условиям рынка.

Для адекватного анализа финансовых данных, особенно в контексте децентрализованных финансов, требуется применение сложных методов моделирования времени до события. Традиционные статистические подходы зачастую оказываются неэффективными из-за нестационарности данных — постоянно меняющихся закономерностей. Современные техники, такие как модели выживаемости, рекуррентные нейронные сети и динамические байесовские сети, позволяют учитывать временную зависимость транзакций и предсказывать будущие события с большей точностью. Это открывает возможности для оптимизации стратегий управления рисками, выявления мошеннических операций и разработки более эффективных алгоритмов торговли, тем самым существенно расширяя границы финансовой аналитики и позволяя извлекать ценную информацию из потока временных меток.

Анализ Времени до События: Статистическая Основа

Анализ выживаемости (Survival Analysis) представляет собой статистическую основу для моделирования времени до наступления определенных событий. Этот подход позволяет оценивать вероятность наступления события в заданный момент времени, учитывая длительность наблюдения за каждым субъектом. В отличие от традиционных регрессионных моделей, анализ выживаемости специально разработан для работы с данными, где время является ключевым фактором, и где не все субъекты наблюдаются до момента наступления события. Основные компоненты анализа выживаемости включают функцию выживания S(t), функцию риска h(t) и функцию плотности вероятности наступления события. Эти функции используются для описания распределения времени до события и для сравнения различных групп населения.

В моделях анализа времени до события, цензурирование представляет собой значительную статистическую проблему. Цензурирование возникает, когда информация о времени до события недоступна для некоторых испытуемых на момент окончания исследования, либо потому, что событие не произошло, либо потому, что испытуемый выбыл из исследования до его наступления. Существуют различные типы цензурирования, включая цензурирование справа (когда известно, что время до события превышает определенный порог), цензурирование слева (когда событие произошло до начала наблюдения) и произвольное цензурирование. Игнорирование цензурирования при анализе данных может привести к смещенным оценкам и неверным выводам, поэтому статистические методы, такие как функции выживания Каплана-Мейера и модель пропорциональных рисков Кокса, специально разработаны для корректной обработки цензурированных данных.

Модель пропорциональных рисков Кокса является широко используемым полупараметрическим методом для оценки скорости наступления события (hazard rate) и выявления факторов, влияющих на время до события. В отличие от параметрических моделей, она не требует предположений о конкретном распределении времени до события, что делает её более гибкой. Модель выражается как h(t) = h_0(t) \cdot exp(\beta_1x_1 + \beta_2x_2 + ... + \beta_px_p), где h(t) — функция риска для индивида в момент времени t, h_0(t) — базовая функция риска, x_i — значения ковариат, а \beta_i — коэффициенты, оценивающие влияние каждой ковариаты на риск. Предположение о пропорциональности рисков предполагает, что влияние каждой ковариаты на риск остается постоянным во времени, что проверяется с помощью специальных тестов.

Современные алгоритмы машинного обучения, такие как XGBoost, успешно интегрируются с анализом выживаемости для повышения прогностической силы и обработки сложных наборов данных. В отличие от традиционных методов, XGBoost позволяет учитывать нелинейные зависимости и взаимодействия между признаками, что особенно важно при моделировании времени до события. Комбинирование XGBoost с функциями, полученными из анализа выживаемости (например, оценка функции риска h(t)), позволяет строить более точные прогнозы, а также эффективно обрабатывать данные с большим количеством предикторов и нелинейными взаимосвязями. При этом, XGBoost может быть обучен непосредственно на данных, включающих цензурированные наблюдения, что позволяет избежать необходимости применения сложных статистических процедур для учета цензурирования.

Построение Признаков для Улавливания Временной Динамики

Эффективная разработка признаков (feature engineering) играет критически важную роль в преобразовании необработанных данных о транзакциях в осмысленные входные данные для моделей времени до события (Time-to-Event Models). Непосредственно сырые данные, такие как даты транзакций и суммы покупок, редко содержат достаточно информации для точного прогнозирования. Процесс разработки признаков включает в себя создание новых переменных, отражающих закономерности и зависимости в данных. Примеры включают в себя вычисление частоты транзакций, среднего интервала между покупками, суммы покупок за определенный период, и других статистических показателей. Качество разработанных признаков напрямую влияет на производительность модели, определяя ее способность выявлять ключевые факторы, влияющие на время наступления целевого события.

Иерархическая разработка признаков представляет собой расширение традиционных методов, заключающееся в построении признаков на различных уровнях абстракции. Этот подход позволяет выявлять скрытые временные закономерности, которые могут быть не видны при анализе только исходных данных. Вместо обработки транзакционных данных как плоского списка, иерархическая разработка признаков создает признаки, обобщающие информацию на разных временных масштабах — от отдельных транзакций до агрегированных показателей за периоды времени, такие как неделя или месяц. Это позволяет модели учитывать не только непосредственные события, но и тенденции, формирующиеся на более длительных временных интервалах, что существенно повышает точность прогнозирования временных характеристик и выявления ключевых факторов, влияющих на временное поведение.

Иерархическое конструирование признаков особенно эффективно при работе с последовательными данными, поскольку позволяет выявлять сложные взаимодействия и зависимости между отдельными точками во временном ряду. Традиционные методы часто рассматривают каждый элемент последовательности изолированно, упуская информацию о том, как изменения в одном элементе влияют на последующие. Иерархический подход, напротив, строит признаки, агрегирующие информацию на разных уровнях временной шкалы, что позволяет модели улавливать нелинейные зависимости и контекстуальные эффекты, возникающие в динамических процессах. Это особенно важно для выявления скрытых закономерностей, которые невозможно обнаружить при анализе отдельных признаков, и для повышения точности прогнозирования временных характеристик событий.

Использование разработанных признаков значительно повышает точность прогнозирования длительности событий в моделях анализа временных рядов. Это достигается за счет того, что признаки, отражающие сложные взаимодействия и зависимости в последовательных данных, позволяют модели более эффективно учитывать факторы, влияющие на временные характеристики. В частности, инженерные признаки помогают выявлять ключевые драйверы поведения, определяющие продолжительность событий, и тем самым улучшают интерпретируемость и прогностическую силу модели. Примером может служить выявление корреляции между определенными признаками и сокращением или увеличением времени до наступления целевого события.

FinSurvival Challenge: Проверка На Прочность Временного Интеллекта

Задача FinSurvival 2025 представляет собой уникальную площадку для исследователей, стремящихся усовершенствовать и протестировать методы моделирования времени до наступления события в реальных условиях децентрализованных финансов (DeFi). Данная инициатива позволяет специалистам применять и оценивать различные алгоритмы прогнозирования, например, для определения времени до ликвидации залога или изменения статуса пользователя в DeFi-протоколе. Используя данные из Aave v3, одной из ведущих платформ DeFi, участники получают возможность проверить эффективность своих моделей на реальных транзакциях и рыночных условиях, что существенно отличает её от традиционных академических исследований, зачастую оторванных от практического применения. Это способствует развитию более надежных и точных инструментов для оценки рисков и принятия решений в динамично развивающейся сфере децентрализованных финансов.

В рамках соревнований FinSurvival 2025 участники используют данные из Aave v3 — одного из ведущих протоколов децентрализованных финансов (DeFi). Задача заключается в прогнозировании времени до наступления определенных событий внутри этой экосистемы, таких как ликвидации залогов или изменения в кредитных позициях. Анализ данных Aave v3 предоставляет уникальную возможность для оценки и улучшения моделей анализа временных рядов, поскольку протокол генерирует большой объем информации о транзакциях, ликвидности и рисках, отражающих динамику финансового поведения в DeFi пространстве. Успешное предсказание этих событий имеет критическое значение для управления рисками и оптимизации стратегий в сфере децентрализованных финансов.

Для обеспечения прозрачности и сопоставимости результатов, соревнование FinSurvival 2025 использует платформу Codabench, предоставляющую участникам удобный доступ к данным Aave v3. Через Codabench происходит не только получение необходимых данных для построения моделей прогнозирования времени до наступления определенных событий в DeFi-экосистеме, но и непосредственная отправка разработанных решений на оценку. Ключевым показателем эффективности, используемым для ранжирования моделей, является индекс Конкорданса (C-index), позволяющий оценить способность модели правильно ранжировать временные точки наступления событий. Высокое значение C-index, демонстрируемое лучшими решениями, свидетельствует о точности и надежности предложенных подходов к моделированию временных рядов в динамичной среде децентрализованных финансов.

В рамках состязания FinSurvival 2025 команда Balancehero India продемонстрировала выдающиеся результаты, достигнув показателя C-индекса в 0.914. Этот результат значительно превзошел показатели моделей глубокого обучения, построенных “end-to-end”, что подчеркивает важность использования специализированных знаний предметной области при разработке моделей прогнозирования. Второе и третье места заняли решения с C-индексами 0.849 и 0.847 соответственно, что свидетельствует о высокой конкуренции и прогрессе в области моделирования времени до события в сфере децентрализованных финансов. Успех Balancehero India подтверждает, что тщательный отбор и обработка признаков, основанных на глубоком понимании экосистемы Aave v3, являются ключевыми факторами для создания точных и надежных прогностических моделей.

Горизонты Расширяются: Продольные Данные и Будущие Применения

Принципы моделирования времени до события и продвинутая разработка признаков, изначально разработанные для финансового анализа, находят все более широкое применение в других областях. В здравоохранении, например, эти методы позволяют анализировать время до наступления определенных событий, таких как рецидив заболевания или наступление летального исхода, что помогает в прогнозировании рисков и оптимизации стратегий лечения. В сфере веб-аналитики, моделирование времени до события позволяет оценить, как долго пользователю требуется для совершения целевого действия — например, совершения покупки или заполнения формы — и выявить факторы, влияющие на эту скорость. Использование расширенного набора признаков, включающего поведенческие данные и контекстную информацию, значительно повышает точность прогнозов и позволяет более эффективно адаптировать онлайн-сервисы к потребностям пользователей, тем самым максимизируя вовлеченность и конверсию.

Данные, собранные в течение продолжительного времени, играют ключевую роль в выявлении временных тенденций и индивидуальных траекторий развития. Исследования, основанные на продольных данных, позволяют не только отследить изменения параметров во времени, но и установить причинно-следственные связи, которые невозможно обнаружить при однократных измерениях. Например, анализ динамики поведения пользователей на веб-сайте в течение нескольких месяцев позволяет выявить закономерности в их активности, предсказать отток клиентов и оптимизировать контент для повышения вовлеченности. Подобный подход применим и в других областях, таких как здравоохранение, где отслеживание состояния пациентов в течение длительного периода позволяет оценить эффективность лечения и спрогнозировать риск развития заболеваний. Именно поэтому сбор и анализ продольных данных становятся все более важными для принятия обоснованных решений и понимания сложных процессов.

Веб-архивы представляют собой бесценный источник данных для изучения эволюции интернета и выявления закономерностей в поведении пользователей. Эти архивы, аккумулируя снимки веб-сайтов на протяжении длительного времени, позволяют исследователям отследить изменения в контенте, дизайне и функциональности сайтов. Анализ этих данных открывает возможности для понимания того, как веб-ресурсы адаптируются к меняющимся потребностям аудитории, как распространяются новые технологии и как меняется пользовательский опыт. Например, изучение изменений в структуре новостных сайтов может выявить тенденции в журналистике, а отслеживание эволюции интернет-магазинов — закономерности в электронной коммерции. Такой подход, основанный на анализе исторических данных веб-сайтов, позволяет не только реконструировать прошлое интернета, но и прогнозировать его будущее.

Временной веб-анализ, объединяя данные из различных источников, таких как веб-архивы и поведенческие метрики пользователей, открывает принципиально новые возможности для понимания вовлеченности аудитории. Этот подход позволяет не просто фиксировать текущие тренды, но и прогнозировать будущее поведение пользователей на основе анализа их прошлых действий и изменений в структуре веб-сайтов во времени. Используя методы моделирования событий во времени и продвинутую разработку признаков, исследователи и маркетологи могут выявлять закономерности в пользовательском опыте, предсказывать отток клиентов, оптимизировать контент и персонализировать взаимодействие, значительно повышая эффективность онлайн-стратегий. Такой анализ предоставляет ценные сведения о динамике веб-пространства и позволяет адаптироваться к быстро меняющимся потребностям пользователей, обеспечивая конкурентное преимущество в цифровой среде.

Наблюдатель отмечает, что стремление к предсказанию времени до наступления критического события в DeFi, как это демонстрируется в FinSurvival 2025, неизбежно наталкивается на проблему нестанционарности данных. Всё, что кажется закономерностью сегодня, завтра может стать лишь шумом. Бертранд Рассел как-то заметил: «Чем больше я узнаю людей, тем больше мне нравится собаки». Подобно этому, чем глубже погружаешься в анализ временных рядов в децентрализованных финансах, тем яснее осознаёшь, что любая модель — лишь упрощение сложной реальности, обреченное на устаревание. Учёт истории пользователя и явное моделирование временной динамики, как предложено в задаче, — это лишь попытка задержать неизбежное, построить более устойчивый, но всё же временный замок на песке.

Что дальше?

Представленное исследование, демонстрируя важность учета временной динамики в анализе данных децентрализованных финансов, лишь констатирует очевидное: каждая «революционная» архитектура неизбежно сталкивается с прозой эксплуатации. Успешное прогнозирование времени до события, даже с применением сложного feature engineering, — это не победа над энтропией, а лишь отсрочка неизбежного. Появление новых DeFi-протоколов и механизмов потребует постоянной перекалибровки моделей и, скорее всего, изобретения новых способов борьбы с не-стационарностью данных.

Важно помнить, что «MVP» — это всего лишь эвфемизм для «подождите, мы исправим позже». Поэтому, несмотря на достигнутый прогресс в benchmark-инге, не стоит ожидать появления «идеальной» модели. Любая система прогнозирования будет подвержена ошибкам, а производительность на тестовом наборе данных не гарантирует успех в реальном времени. Если код выглядит идеально — значит, его ещё никто не деплоил.

Будущие исследования, вероятно, сосредоточатся на автоматизации feature engineering, разработке более устойчивых к не-стационарности алгоритмов и, возможно, на применении методов активного обучения для адаптации моделей к изменяющимся условиям. Однако, в конечном итоге, любой прогресс в этой области будет лишь временным облегчением, за которым последует новая волна проблем и технических долгов.


Оригинал статьи: https://arxiv.org/pdf/2602.23159.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-02-28 06:59