Обучение самоанализу: как «настроить» языковую модель на понимание себя
Новое исследование показывает, что способность к самоанализу — то есть, обнаружению внедренных концепций — может быть надежно индуцирована в языковых моделях с помощью тонкой настройки.



