Оптимальное исполнение ордеров: обучение с подкреплением в моделировании биржевых очередей

Тепловая карта демонстрирует относительное изменение средней награды агента, обученного с подкреплением, по сравнению с эталонным алгоритмом TWAP, рассчитанное на основе 10 000 симуляций, что позволяет оценить эффективность стратегии агента в различных сценариях.

Новое исследование демонстрирует, как алгоритмы обучения с подкреплением могут значительно улучшить стратегии оптимального исполнения ордеров на финансовых рынках.

Синтез табличных данных: от универсальных решений к адаптивным нейросетям

Модель MargNet инициализируется с использованием всех однонаправленных маржинальных распределений, после чего осуществляется адаптивный отбор маржинальных распределений и подгонка модели, что позволяет синтезировать данные.

Новый подход к генерации конфиденциальных табличных данных позволяет превзойти существующие методы, особенно при работе со сложными, сильно коррелированными наборами.

Искусственный интеллект и манипуляции: как алгоритмы справедливого распределения становятся уязвимыми

Новое исследование показывает, что системы, призванные обеспечить честное разделение ресурсов, могут быть подвержены координированным манипуляциям с помощью современных языковых моделей.