Рекомендации с характером: как KYC и социальные связи повышают эффективность систем

Автор: Денис Аветисян


Новое исследование показывает, что учет детального профиля пользователя и использование социальных графов значительно улучшают качество и разнообразие рекомендаций.

☕️

Читаем отчёты, пьём кофе, ждём дивиденды. Если тебе надоел хайп и ты ищешь скучную, но стабильную гавань — добро пожаловать.

Бесплатный Телеграм канал
Сравнительный анализ эффективности пяти категорий демонстрирует, что базовая проверка личности (зеленый цвет) и расширенная проверка личности (красный цвет) обеспечивают более высокую производительность по сравнению с базовым уровнем (синий цвет) и отсутствием проверки личности (оранжевый цвет), при этом сочетание расширенной проверки личности и дополнительных мер безопасности (фиолетовый цвет) демонстрирует наилучшие результаты.
Сравнительный анализ эффективности пяти категорий демонстрирует, что базовая проверка личности (зеленый цвет) и расширенная проверка личности (красный цвет) обеспечивают более высокую производительность по сравнению с базовым уровнем (синий цвет) и отсутствием проверки личности (оранжевый цвет), при этом сочетание расширенной проверки личности и дополнительных мер безопасности (фиолетовый цвет) демонстрирует наилучшие результаты.

Сравнительный анализ влияния KYC, мультимодального анализа данных и кросс-доменного обучения на производительность агентных рекомендательных систем, оцениваемого с помощью метрик nDCG и serendipity.

Несмотря на растущую популярность рекомендательных систем, обеспечение их эффективности и адаптации к индивидуальным потребностям пользователей остается сложной задачей. В данной работе, ‘An Comparative Analysis about KYC on a Recommendation System Toward Agentic Recommendation System’, представлен сравнительный анализ агентных рекомендательных систем, использующих данные “Знай своего клиента” (KYC) для повышения точности и разнообразия выдачи в различных областях контента. Эксперименты показали, что интеграция KYC, мультимодальных данных и социальных графов значительно улучшает показатели точности, серандипити и общую удовлетворенность пользователей. Какие перспективы открывает применение агентных систем для персонализации рекомендаций и создания более интеллектуальных пользовательских интерфейсов?


За пределами кликов: Ограничения традиционных рекомендаций

Современные системы рекомендаций, как правило, ориентированы на немедленное вовлечение пользователя, измеряемое в основном количеством кликов — так называемый «Click-Through Rate». Такой подход, хотя и эффективен для краткосрочного увеличения активности, часто игнорирует более важные аспекты — долгосрочную удовлетворенность и возможность открытия нового контента. В погоне за мгновенной реакцией алгоритмы склонны предлагать пользователю то, что, с высокой вероятностью, уже соответствует его текущим предпочтениям, что приводит к формированию «пузырей фильтров» и ограничению кругозора. В результате, потенциально интересные и полезные материалы, выходящие за рамки привычного, остаются незамеченными, снижая общую ценность взаимодействия с платформой и препятствуя расширению интересов пользователя.

Современные рекомендательные системы, стремясь к максимальному вовлечению пользователя, зачастую формируют так называемые “информационные пузыри”. Вместо того чтобы предлагать разнообразный контент, они усиливают существующие предпочтения, ограничивая возможности для открытия нового и ценного. Данный феномен препятствует истинному исследованию, поскольку алгоритмы отдают приоритет предсказуемым, но однообразным предложениям, лишая пользователя возможности случайно наткнуться на контент, который мог бы значительно расширить его кругозор или предложить неожиданные решения. В результате, пользователь оказывается в замкнутом цикле, где алгоритм постоянно подтверждает его текущие интересы, не стимулируя к поиску нового и расширению горизонтов.

Традиционные методы рекомендаций, такие как коллаборативная фильтрация и поиск по схожести контента, демонстрируют ограниченную эффективность в ситуациях, когда необходимо предложить принципиально новый контент или работать с пользователями, о которых еще мало информации. Коллаборативная фильтрация, полагаясь на предпочтения других пользователей, испытывает трудности, когда новинка еще не получила достаточного количества оценок. Аналогично, системы, основанные на схожести контента, могут зацикливаться на уже известных пользователю типах материалов, не предлагая ничего действительно неожиданного. Эта неспособность адаптироваться к новым данным и холодным стартам приводит к тому, что пользователи остаются в рамках привычного, лишаясь возможности обнаружить ценный, но незнакомый контент, что снижает долгосрочную удовлетворенность и ограничивает возможности для расширения интересов.

Агентные рекомендации: Оркестровка контентных путешествий

Представляется новая система рекомендаций — Агентная система рекомендаций, принципиально отличающаяся от традиционных подходов. Вместо простого предсказания наиболее релевантного контента на основе текущего запроса, система рассматривает процесс рекомендации как планирование пути потребления контента интеллектуальным агентом. Этот агент определяет последовательность контента, направленную на достижение долгосрочных целей пользователя, формируя индивидуальную траекторию, а не просто выдавая список наиболее вероятных предпочтений. Такой подход позволяет не только повысить релевантность рекомендаций, но и создать более персонализированный и вовлекающий пользовательский опыт, учитывая динамически меняющиеся интересы и потребности.

Система агентных рекомендаций использует многоступенчатую архитектуру (Multi-Stage Architecture) и модели двухвышечных нейронных сетей (Two-Tower Neural Network) для эффективного поиска и ранжирования контента. Двухвышечные модели позволяют предварительно вычислить эмбеддинги для пользователей и элементов контента, что значительно ускоряет процесс поиска релевантного контента. Многоступенчатая архитектура включает этапы грубого отбора (recall) и точного ранжирования (ranking). На этапе recall, используя предварительно вычисленные эмбеддинги, быстро отбирается большой набор потенциально релевантного контента. Затем, на этапе ranking, более сложные модели оценивают отобранный контент, определяя наиболее подходящий для конкретного пользователя, что позволяет оптимизировать производительность и масштабируемость системы.

В системе агентных рекомендаций ключевым элементом является слой «Глобальной Логики», координирующий долгосрочную стратегию формирования контент-путей. Он обеспечивает согласованность рекомендаций на протяжении всей сессии пользователя, учитывая его долгосрочные интересы и цели. Для балансировки между использованием известных предпочтений пользователя и поиском нового релевантного контента, применяется механизм «Наград за Исследование». Эти награды стимулируют систему предлагать контент, который не соответствует текущему профилю пользователя, но потенциально может расширить его интересы. Величина наград динамически регулируется для оптимизации баланса между эксплуатацией (предложение контента, похожего на ранее потребленный) и исследованием (предложение нового контента), что позволяет избежать «пузыря фильтров» и повысить разнообразие предоставляемого контента.

Контекстуальное обогащение: Понимание контента и намерений пользователя

В нашей системе реализовано мультимодальное объединение данных, которое заключается в сопоставлении семантических векторных представлений изображений (Visual Semantic Embedding) с текстовыми данными. Этот процесс позволяет создать комплексное представление контента, учитывающее как визуальные, так и текстовые характеристики. Сопоставление векторов позволяет системе понимать взаимосвязи между визуальным контентом и его текстовым описанием, что значительно улучшает качество анализа и обработки информации. В результате формируется единое, многогранное представление, используемое для различных задач, включая поиск, рекомендации и анализ контента.

Для повышения релевантности рекомендаций система использует интеграцию социальных графов на основе графовых нейронных сетей (Graph Neural Networks). Данный подход позволяет учитывать связи между пользователями и их социальный контекст, анализируя структуру взаимоотношений. Графовые нейронные сети обрабатывают данные о социальных связях, представляя пользователей и их взаимодействия в виде графа, что позволяет выявлять скрытые закономерности и предпочтения, основанные на влиянии и поведении других пользователей в сети. Это позволяет системе формировать более персонализированные и точные рекомендации, учитывая не только индивидуальные предпочтения пользователя, но и предпочтения его социальных связей.

В нашей системе, традиционный процесс KYC (Знай своего клиента) переосмыслен как динамический модуль памяти и контекста, встроенный непосредственно в агент. Это позволяет агенту сохранять и использовать информацию о предпочтениях и целях каждого конкретного пользователя, выходя за рамки статических профилей. Вместо однократной проверки, система непрерывно обновляет контекст пользователя на основе его взаимодействия с платформой, формируя детализированное представление его интересов и намерений. Данный подход обеспечивает персонализацию взаимодействия и повышает релевантность предоставляемых услуг, поскольку агент способен учитывать индивидуальные особенности каждого пользователя при принятии решений.

Решение проблемы «холодного старта» и максимизация «серендипности»

Для решения проблемы «холодного старта» и обеспечения релевантных рекомендаций для новых пользователей, была разработана система, объединяющая контекстное понимание и возможности планирования агента. Вместо случайного выбора контента, система анализирует доступную информацию о пользователе — даже минимальную — и сопоставляет её с общим профилем интересов. Это позволяет агенту формировать начальный план рекомендаций, основанный не на истории взаимодействий (которой ещё нет), а на вероятных предпочтениях, выведенных из контекста. Такой подход значительно снижает вероятность предоставления нерелевантного контента новым пользователям, способствуя более быстрому и эффективному формированию положительного пользовательского опыта и повышению вовлеченности в систему.

Внедрение системы вознаграждений за исследование и глобальной логики направлено на активное стимулирование серендипности — способности системы предлагать пользователям неожиданный, но ценный контент. Данный подход выходит за рамки традиционных рекомендаций, основанных исключительно на истории взаимодействия, и позволяет открывать для пользователей новые, потенциально интересные материалы, которые они могли бы упустить при использовании стандартных алгоритмов. Вознаграждение за исследование побуждает систему отклоняться от предсказуемых паттернов, а глобальная логика обеспечивает, чтобы эти отклонения оставались релевантными и полезными для пользователя, расширяя его горизонты и способствуя обнаружению скрытых сокровищ информации.

Оценка предложенного подхода проводилась с использованием метрики nDCG (Normalized Discounted Cumulative Gain), позволяющей количественно оценить качество ранжирования и вовлеченность пользователей. Результаты демонстрируют значительное улучшение по сравнению с традиционными методами: достигнут показатель nDCG@1 равный 0.652, что почти в 4.4 раза выше базового значения. Особенно заметный эффект наблюдается в категории «Совместное использование» (Sharing), где показатель nDCG@5 достиг значения 0.724, подтверждая эффективность предложенной системы в предоставлении релевантного и неожиданного контента, способствующего повышению пользовательской активности.

К проактивному открытию: Будущее рекомендаций

Разработанная система рекомендаций, основанная на принципах автономного агента, закладывает основу для создания индивидуальных образовательных траекторий и динамической подборки контента. В отличие от традиционных подходов, система не просто реагирует на прошлые действия пользователя, но и активно прогнозирует его будущие потребности и интересы. Это достигается благодаря способности агента к самообучению и адаптации, что позволяет ему постоянно совершенствовать свои рекомендации, предлагая контент, наиболее релевантный текущему состоянию и долгосрочным целям пользователя. Такой подход обеспечивает не только повышение вовлеченности, но и способствует непрерывному обучению и развитию, предоставляя персонализированный опыт, адаптирующийся к меняющимся потребностям.

Развитие возможностей агента рекомендаций направлено на интеграцию различных источников информации посредством технологии кросс-доменного синтеза. Этот подход позволит системе не просто предлагать контент из одной области, но и выявлять взаимосвязи между, казалось бы, несвязанными данными. Например, анализ истории просмотров образовательных видеороликов может быть сопоставлен с данными о профессиональных интересах пользователя, полученными из его профиля в LinkedIn, что приведет к формированию более релевантных и персонализированных рекомендаций. В результате, система сможет предлагать не только следующий урок в текущем курсе, но и материалы, способствующие развитию смежных навыков или углублению знаний в интересующей области, обеспечивая тем самым более целостный и эффективный процесс обучения и развития.

В дальнейшем исследовании планируется внедрение многозадачного обучения с использованием архитектур, подобных MMoE (Mixture-of-Experts), для оптимизации сразу нескольких целей. Данный подход позволит системе рекомендаций не только повышать вовлеченность пользователей и удерживать их внимание, но и учитывать их благополучие. Архитектура MMoE, используя специализированные «эксперты» для каждой задачи, обеспечит более точную и персонализированную адаптацию рекомендаций, учитывая индивидуальные предпочтения и долгосрочные интересы пользователя. Это позволит перейти от простой максимизации кликов к созданию действительно полезного и позитивного пользовательского опыта, способствующего устойчивому взаимодействию с платформой.

Исследование, представленное в данной работе, подчеркивает важность глубокого понимания пользователя для построения эффективных рекомендательных систем. Авторы демонстрируют, что использование детального контекста, полученного посредством процедур «Знай своего клиента» (KYC), в сочетании с многомодальными данными и анализом социальных связей, позволяет значительно улучшить показатели точности, разнообразия и неожиданности рекомендаций. Как однажды заметил Дональд Дэвис: «Простота — это высшая степень совершенства». Эта фраза отражает суть стремления к ясности и эффективности, которые проявляются в предложенном подходе к построению рекомендательных систем, где сложные алгоритмы служат для достижения простой цели — предоставления пользователю наиболее релевантной и полезной информации.

Что дальше?

Представленная работа, несмотря на демонстрируемые улучшения в точности и непредсказуемости рекомендаций, лишь слегка приоткрывает завесу над истинной сложностью взаимодействия человека и системы. Попытка «узнать клиента» посредством сбора данных, пусть и мультимодальных, неизбежно сталкивается с проблемой репрезентации — насколько адекватно полученный профиль отражает реальные предпочтения, а не лишь их статистическую тень? Нельзя забывать: каждая дополнительная характеристика — это еще один способ исказить картину.

Дальнейшее развитие агентных рекомендательных систем требует пересмотра самой концепции оценки. nDCG и подобные метрики измеряют лишь поверхностное соответствие, игнорируя более тонкие аспекты — удовольствие от открытия, когнитивное обогащение, формирование долгосрочных предпочтений. Истинный критерий — не точность предсказания, а способность системы расширить горизонты пользователя, предоставить ему нечто неожиданное, но ценное.

Особое внимание следует уделить проблеме кросс-доменного обучения. Перенос знаний между различными областями интересов — задача нетривиальная, требующая не просто статистической корреляции, а глубокого понимания лежащих в основе принципов. Иначе, система рискует стать всезнающим, но бессмысленным попугаем, повторяющим чужие идеи. И в этом — парадокс прогресса: чем больше мы знаем, тем больше осознаем свое незнание.


Оригинал статьи: https://arxiv.org/pdf/2512.23961.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-01-01 20:26