Взгляд внутрь трансформеров: как понять, что ими движет

Подходы к интерпретируемости моделей машинного обучения не являются взаимоисключающими и могут служить различным целям в зависимости от конкретной задачи, при этом, например, визуализация внимания может использоваться как для простого наблюдения, так и в рамках механического анализа, а такие методы, как абляция внимания, предоставляют контрфактические объяснения, в то время как сама визуализация внимания - фактические, хотя и может быть применена для контрфактического анализа при сравнении паттернов, что позволяет проследить дискуссию о достоверности объяснений.

Новое исследование предлагает методику определения роли отдельных «голов внимания» в работе трансформерных моделей, переходя от простого наблюдения к установлению причинно-следственных связей.

Угадывая связь: Нейросети предсказывают корреляцию акций

В ходе анализа исторических данных о корреляции между акциями установлено, что предложенная модель THGNN демонстрирует меньшую абсолютную разницу между прогнозируемыми и фактическими значениями корреляции на 10-дневный период, по сравнению с базовым показателем, рассчитанным на основе скользящего окна.

Новая модель, объединяющая графовые нейронные сети и трансформеры, демонстрирует повышенную точность прогнозирования корреляции между акциями, открывая возможности для более эффективного управления портфелем.

Искусственный интеллект на финансовых рынках: проверка на прочность

Новая платформа FinDeepForecast позволяет оценить возможности и ограничения современных алгоритмов глубокого обучения в прогнозировании финансовых рынков в реальном времени.