Искусственный интеллект и манипуляции: как алгоритмы справедливого распределения становятся уязвимыми

Новое исследование показывает, что системы, призванные обеспечить честное разделение ресурсов, могут быть подвержены координированным манипуляциям с помощью современных языковых моделей.

Поиск аномалий во временных рядах: новый подход с обучением с подкреплением

В предложенном методе, динамическая система вознаграждений комбинирует ошибку реконструкции, полученную из автоэнкодера, и классификационные вознаграждения, генерируемые LSTM-сетью с алгоритмом обучения с подкреплением, используя адаптивный коэффициент $ \lambda(t) $ для балансировки между исследованием новых данных и использованием уже известных, при этом активный цикл обучения запрашивает разметку наиболее неопределенных фрагментов данных для минимизации объема необходимой ручной разметки.

Исследователи предлагают инновационную систему, сочетающую вариационные автокодировщики и обучение с подкреплением для точного выявления отклонений в многомерных временных данных.