Обучение зрения и логики: как направить исследования ИИ

Предложен метод селективного вмешательства на основе энтропии (SaEI), заключающийся в направленном воздействии на энтропию политики посредством антагонистической выборки (EgAS), использующей энтропию как цель для искажения визуальных данных с помощью градиентов, и отбрасывании токенов с экстремальными значениями энтропии (TsEC) для фокусировки вычислений на умеренно информативных областях.

Новый подход позволяет значительно улучшить способность искусственного интеллекта рассуждать, используя специально подобранные примеры для расширения возможностей обучения с подкреплением.