Иллюзии и обходные пути: Как метафоры взламывают генераторы изображений

Предложенный подход вдохновлен игрой в «Табу», где один игрок описывает понятие метафорически, косвенно передавая его смысл другому; в данном случае, большая языковая модель выступает в роли первого игрока, а модель преобразования текста в изображение - во втором, что позволяет осуществить обход ограничений безопасности системы.

Новое исследование демонстрирует, что использование образных выражений позволяет обходить встроенные фильтры безопасности в моделях, создающих изображения по текстовому описанию.