Искусственный интеллект на службе поиска: как повысить точность выдачи в интернет-магазинах

Автор: Денис Аветисян

Новая методика, основанная на генерации синтетических данных, позволяет значительно улучшить поиск товаров по сложным и редким запросам.

🐢

Ищешь ракеты? Это не к нам. У нас тут скучный, медленный, но надёжный, как швейцарские часы, фундаментальный анализ.

Телеграм канал

Предлагаемая схема синтеза данных, ориентированная на сложные запросы, требующие глубоких знаний, состоит из двух этапов: многовариантной перефразировки запроса и автономного поиска продуктов, где ключевым элементом является перефразировка, а модели релевантности запроса-продукта, оптимизированные для производственной системы, сочетаются с общедоступными LLM, не прошедшими специализированной доработки для конкретной предметной области.

В статье представлена система, использующая большие языковые модели и перефразировку запросов для повышения релевантности результатов поиска в электронной коммерции.

Несмотря на значительные успехи в оптимизации поиска в электронной коммерции, системы по-прежнему испытывают трудности с обработкой специфических запросов из «длинного хвоста», особенно требующих глубокого понимания предметной области. В работе ‘Synthetic Data Powers Product Retrieval for Long-tail Knowledge-Intensive Queries in E-commerce Search’ предложен эффективный фреймворк синтеза данных, использующий большие языковые модели для улучшения поиска по таким сложным запросам. Ключевая идея заключается в дистилляции возможностей мощной модели перефразировки запросов в эффективную систему онлайн-поиска, что позволяет значительно повысить релевантность результатов. Сможет ли данный подход стать основой для нового поколения поисковых систем, способных понимать и удовлетворять потребности пользователей в любой предметной области?

Понимание Невыраженного: Вызовы Поиска в Эпоху Информации

Традиционные методы поиска информации зачастую испытывают трудности при обработке сложных запросов, требующих глубокого понимания предметной области и выходящих за рамки распространенных поисковых паттернов. Эти запросы, как правило, включают в себя множество условий, неявных предположений и требуют от поисковой системы не просто сопоставления ключевых слов, а анализа смысла и установления логических связей между различными понятиями. В отличие от простых запросов, для которых существует достаточное количество обучающих данных, сложные, «знание-интенсивные» запросы часто остаются без адекватного ответа, поскольку алгоритмы поиска не способны эффективно извлекать и синтезировать необходимую информацию из доступных источников. Данное ограничение существенно снижает полезность поисковых систем для пользователей, нуждающихся в решении сложных задач или получении специализированных знаний.

Особенностью обработки сложных поисковых запросов, относящихся к так называемому “длинному хвосту”, является дефицит обучающих данных. Такие запросы, часто включающие негативные ограничения (“исключая X”) или поиск более доступных вариантов (“аналоги дешевле Y”), реже встречаются в стандартных наборах данных, используемых для обучения поисковых систем. Вследствие этого, алгоритмы испытывают затруднения с корректным пониманием намерений пользователя и выдачей релевантных результатов, поскольку не располагают достаточной информацией для обобщения и экстраполяции знаний на подобные, менее распространенные ситуации. Это особенно заметно при обработке сложных вопросов, требующих анализа контекста и применения логических умозаключений, что подчеркивает необходимость разработки специализированных методов обучения и сбора данных для повышения эффективности поиска в подобных случаях.

Успешное решение сложных, нестандартных запросов имеет решающее значение для повышения удовлетворенности пользователей поисковыми системами и расширения возможностей доступа к информации. Традиционные методы поиска часто терпят неудачу, когда сталкиваются с запросами, выходящими за рамки распространенных паттернов, особенно если они включают негативные ограничения или поиск доступных альтернатив. Повышение способности поисковых систем понимать и корректно обрабатывать такие запросы не только улучшает пользовательский опыт, но и делает информацию более доступной для широкой аудитории, включая тех, кто формулирует вопросы нестандартным образом или имеет ограниченный доступ к ресурсам. По сути, это способствует созданию поисковых систем, которые действительно служат потребностям всех пользователей, а не только тех, чьи запросы легко предсказуемы.

Синтез Знаний: Создание Данных для Невидимых Запросов

Наш фреймворк синтеза данных эффективно генерирует обучающие данные, специально адаптированные для обработки длинных запросов (long-tail queries) и запросов, требующих значительного объема знаний (knowledge-intensive queries). Этот процесс включает в себя создание синтетических примеров, отражающих специфические характеристики таких запросов — низкую частоту встречаемости и необходимость доступа к обширной базе знаний. В отличие от традиционных методов, полагающихся на существующие наборы данных, наш фреймворк позволяет создавать данные, точно соответствующие потребностям обучения моделей для обработки сложных и редких запросов, повышая их точность и надежность в реальных сценариях использования.

Предлагаемый фреймворк обеспечивает генерацию данных для различных типов запросов, включая вопросы и ответы (question-answering), запросы с негативными ограничениями (negative constraint) и поиск доступных альтернатив (affordable alternative searches). Поддержка этих разнообразных типов запросов позволяет существенно расширить охват обучающих данных и повысить эффективность моделей в обработке сложных и специфических пользовательских запросов. Это особенно важно для сценариев, где доступ к реальным данным ограничен или отсутствует, обеспечивая возможность создания синтетических данных, отражающих реальные паттерны запросов.

В рамках разработанной системы синтеза данных реализована генерация множественных вариантов перефразировки запроса. Данный механизм позволяет создавать несколько интерпретаций исходного пользовательского намерения, что необходимо для расширения обучающей выборки и повышения устойчивости модели к вариативности формулировок. Каждый сгенерированный вариант запроса рассматривается как отдельный обучающий пример, что обеспечивает более полное покрытие семантического пространства и позволяет модели учитывать различные способы выражения одного и того же информационного запроса. Это особенно важно для запросов с неоднозначными формулировками или требующих учета контекста.

Оптимизация модели перефразирования осуществляется с использованием многокритериальной оценки, объединяющей релевантность, соответствие и разнообразие сгенерированных вариантов, что позволяет формировать итоговую награду для обновления модели.

Оптимизация Перефразировок: Многогранная Система Вознаграждений

Для оптимизации модели перефразировки запросов используется алгоритм REINFORCE++, максимизирующий функцию вознаграждения, учитывающую несколько целей. Данный алгоритм позволяет обучать модель, подстраивая параметры таким образом, чтобы генерируемые перефразировки соответствовали нескольким критериям одновременно. Функция вознаграждения формируется как взвешенная сумма отдельных компонентов, каждый из которых оценивает определенный аспект качества перефразировки, что обеспечивает баланс между различными целями оптимизации и позволяет добиться более эффективного обучения модели.

Для оптимизации процесса перефразирования запросов используется многокомпонентная система вознаграждений, включающая в себя оценку семантической релевантности запроса (Query Semantic Relevance, QSR) и соответствие языка продукта (Product-side Distribution Alignment, PDA). QSR обеспечивает генерацию осмысленных перефразировок, сохраняющих исходный смысл запроса пользователя. PDA, в свою очередь, нацелена на адаптацию языка перефразировки к лексике, используемой в описаниях товаров, что повышает вероятность успешного сопоставления запроса с релевантными продуктами. Обе эти метрики позволяют модели генерировать перефразировки, которые не только семантически корректны, но и соответствуют языковым особенностям товарного каталога.

Для повышения разнообразия генерируемых перефразировок запросов и более полного охвата спектра пользовательских интенций используется дополнительная награда за разнообразие (Diversity Reward). Данная награда стимулирует модель к генерации различных вариантов перефразировок, избегая повторения схожих формулировок. Механизм оценки разнообразия основан на измерении семантической дистанции между сгенерированными перефразировками, обеспечивая, что каждая новая перефразировка вносит уникальный вклад в покрытие возможных интерпретаций исходного запроса. Это позволяет модели генерировать более полные и всесторонние наборы перефразировок, что, в свою очередь, улучшает качество поиска и повышает вероятность предоставления пользователю релевантных результатов.

Для эффективной генерации пар «запрос-продукт» при обучении и оценке модели перефразирования запросов используется метод оффлайн-извлечения продуктов. Этот подход позволяет создавать большой объем данных без необходимости онлайн-взаимодействия с поисковой системой или каталогом продуктов в реальном времени. В рамках метода, существующий набор данных запросов сопоставляется с соответствующими продуктами, используя предварительно построенный индекс и алгоритмы поиска релевантности. Полученные пары используются для расчета наград в алгоритме обучения REINFORCE++, что позволяет оптимизировать модель перефразирования и улучшить ее способность генерировать релевантные и разнообразные варианты запросов.

Оценка Эффективности: Метрики и Экспертная Оценка

Для количественной оценки эффективности поиска используется комплекс автоматизированных метрик, включающий в себя Query Goodrate@N, Item Goodrate и GSB Metric. Query Goodrate@N оценивает долю релевантных результатов среди первых N найденных, позволяя судить о точности ранжирования. Item Goodrate, в свою очередь, измеряет долю релевантных элементов в полученном наборе результатов, отражая общую полезность выдачи. GSB Metric, представляя собой более сложный показатель, учитывает различные аспекты релевантности и качества результатов, предоставляя всестороннюю оценку эффективности алгоритмов поиска. Комбинация этих метрик позволяет всесторонне оценить качество работы поисковой системы и выявить области для улучшения.

Для обеспечения надежной оценки качества поисковой выдачи, автоматические метрики, такие как Query Goodrate@N и Item Goodrate, дополняются методом Side-By-Side (SBS) оценки, проводимой экспертами-аннотаторами. В рамках SBS оценки, специалисты непосредственно сравнивают результаты, полученные из контрольной и экспериментальной систем, выявляя предпочтительные варианты и оценивая релевантность предложенных товаров запросам пользователей. Такой подход позволяет учесть нюансы, которые сложно формализовать в автоматических метриках, и обеспечить более точную и объективную оценку качества работы поискового алгоритма, особенно в случаях, когда требуется учитывать сложность и неоднозначность запросов, а также специфику пользовательских предпочтений.

В основе разработанной системы поиска лежит тандем из двух ключевых компонентов: плотного извлекателя (Dense Retriever, Tbstars-3B) и классификатора релевантности запроса и товара (Query-Product Relevance Classifier, Tbstars-42B-A3B). Плотный извлекатель преобразует запросы и товары в векторные представления, позволяя эффективно находить семантически близкие соответствия, даже если отсутствует лексическое совпадение. Классификатор, в свою очередь, оценивает релевантность каждого найденного товара запросу, отфильтровывая нерелевантные результаты и повышая точность поиска. Взаимодействие этих компонентов обеспечивает не только быстрое, но и интеллектуальное извлечение информации, особенно актуальное для обработки сложных и нечетких запросов, характерных для электронной коммерции.

Классификатор релевантности перефразировок запросов, основанный на модели Qwen3-30B-A3B, играет ключевую роль в повышении точности системы поиска. Данный компонент осуществляет фильтрацию нерелевантных перефразировок, генерируемых для исходных запросов. Это позволяет исключить из рассмотрения варианты, которые отклоняются от первоначального смысла или не соответствуют потребностям пользователя. Благодаря этой фильтрации, система фокусируется на наиболее релевантных перефразировках, что, в свою очередь, значительно улучшает качество поиска и позволяет выдавать более точные и полезные результаты, особенно для сложных и неоднозначных запросов.

Разработанная система синтеза данных продемонстрировала заметное повышение эффективности поиска на платформе Taobao, увеличив показатель релевантности запросов (Query Goodrate) до 8.62 процентных пунктов в ходе онлайн A/B тестирования. Данное улучшение особенно заметно при обработке длинных, сложных запросов, требующих доступа к обширным знаниям, и позволяет более точно удовлетворять потребности пользователей, сталкивающихся с трудностями при формулировании своих запросов. Такой подход существенно повышает качество результатов поиска, особенно в случаях, когда традиционные методы оказываются недостаточно эффективными для обработки нестандартных или малораспространенных запросов, что, в свою очередь, способствует повышению удовлетворенности пользователей и улучшению общей эффективности платформы.

В ходе проведенных исследований зафиксировано значительное повышение качества выдачи по определенным типам запросов. В частности, показатель Item Goodrate, отражающий релевантность предложенных товаров, увеличился на 6.97 процентных пункта для запросов, выражающих отрицание или нежелание (“Negative” queries). Одновременно, показатель Query Goodrate, оценивающий качество самих запросов, продемонстрировал прирост в 8.62 процентных пункта для альтернативных формулировок одного и того же запроса (“Alternative” queries). Эти результаты свидетельствуют об эффективности разработанного подхода к поиску, особенно в случаях, когда пользователи формулируют свои потребности неявно или используют разнообразные варианты одного и того же вопроса.

Офлайн-оценка продемонстрировала значительное улучшение качества выдачи при обработке сложных поисковых запросов. В частности, показатель Item Goodrate, отражающий релевантность предложенных товаров, увеличился на 12.95% для запросов, не содержащих явного намерения (так называемых «Negative queries»). Еще более заметный прогресс — 10.73% — был достигнут для запросов, требующих знания предметной области («Knowledge queries»). Эти результаты указывают на то, что разработанная система эффективно справляется с поиском релевантной информации даже в случаях, когда запрос сформулирован нечетко или требует специальных знаний, что особенно важно для улучшения пользовательского опыта на платформах с обширным каталогом товаров и услуг.

К Надежному Поиску: Обобщение и Перспективы Развития

Разработанная платформа демонстрирует способность генерировать данные для широкого спектра поисковых запросов, включая запросы общего характера, что открывает новые возможности для создания более устойчивых и всесторонних поисковых систем. Этот подход позволяет преодолеть ограничения, связанные с нехваткой размеченных данных для редких или сложных запросов, обеспечивая более точные и релевантные результаты даже в случаях, когда традиционные методы терпят неудачу. Благодаря возможности синтезировать данные, имитирующие разнообразные пользовательские намерения, система способна адаптироваться к различным формулировкам запросов и предоставлять информацию, соответствующую потребностям каждого пользователя, значительно улучшая общий опыт поиска.

Исследования направлены на преодоление сложностей, связанных с пониманием “длинного хвоста” поисковых запросов — тех редких и специфических формулировок, которые часто остаются без должного внимания со стороны традиционных систем. Успешное решение этой задачи позволит значительно расширить доступность информации для более широкой аудитории, поскольку пользователи смогут получать релевантные ответы даже на сложные и узкоспециализированные вопросы. Повышение точности обработки таких запросов напрямую влияет на удовлетворенность пользователей, предоставляя им более полный и эффективный доступ к знаниям и ресурсам, что в конечном итоге способствует более продуктивному поиску и исследованию.

Дальнейшие исследования направлены на масштабирование процесса синтеза данных, что позволит значительно увеличить объем генерируемой информации для обучения поисковых систем. Параллельно изучаются передовые методы перефразирования запросов — преобразования исходного вопроса для более точного соответствия релевантным ответам. Особое внимание уделяется усовершенствованию алгоритмов ранжирования, которые определяют порядок выдачи результатов, чтобы наиболее полезная информация всегда оказывалась на первом месте. Эти усовершенствования позволят создавать поисковые системы, способные эффективно обрабатывать сложные запросы и предоставлять пользователям наиболее полные и точные ответы.

Для дальнейшего повышения эффективности системы поиска планируется расширение ее возможностей за счет интеграции более сложных источников знаний и механизмов логического вывода. Это предполагает не просто поиск информации, но и способность к анализу, сопоставлению и синтезу данных из различных областей, включая базы знаний, онтологии и даже неструктурированные тексты. Углубленная обработка семантики запросов и контекста позволит системе не только находить релевантные ответы, но и делать обоснованные выводы, предсказывать потребности пользователя и предоставлять информацию в наиболее удобном и понятном формате. Внедрение таких функций значительно повысит точность и полноту поиска, а также откроет новые возможности для интеллектуального анализа и поддержки принятия решений.

Исследование демонстрирует, что синтез данных, основанный на больших языковых моделях, позволяет эффективно решать проблему «длинного хвоста» в e-commerce поисковых системах. Этот подход, по сути, создает искусственную «память» для системы, позволяя ей обрабатывать сложные, информационно-насыщенные запросы, которые ранее оставались за пределами ее возможностей. Как точно заметил Алан Тьюринг: «Я считаю, что машина может сделать что угодно, что может сделать человек, но это не обязательно означает, что она должна». В данном контексте, машина не заменяет человеческое понимание, а расширяет его, позволяя системе эффективно обрабатывать огромный объем информации и предоставлять релевантные результаты даже для самых сложных запросов. Версионирование данных, как форма сохранения опыта, позволяет системе адаптироваться и улучшать свои результаты с течением времени.

Что дальше?

Представленная работа, безусловно, демонстрирует потенциал синтетических данных в улучшении поиска по длинному хвосту запросов. Однако, не стоит обольщаться: система лишь отсрочила неизбежность. Проблема не в ошибках алгоритмов, а в самой природе информации — её бесконечной фрагментации и субъективности. Синтез данных — это, по сути, попытка навести порядок в хаосе, создать иллюзию полноты там, где её быть не может.

Будущие исследования, вероятно, будут сосредоточены на преодолении ограничений, связанных с качеством и разнообразием синтетических данных. Но истинный прорыв потребует не столько совершенствования алгоритмов, сколько переосмысления самой концепции релевантности. Что значит “соответствовать запросу”, когда сам запрос — это лишь приблизительное выражение потребности, завуалированное в словах? Стабильность ранжирования — это не признак успеха, а лишь задержка момента, когда система столкнется с запросом, который она не в состоянии понять.

В конечном счете, поиск информации — это не техническая задача, а экзистенциальный поиск смысла. И никакие синтетические данные не смогут заполнить пустоту, образовавшуюся между знанием и пониманием. Система стареет, и её задача — не продлить свою жизнь, а достойно принять неизбежность увядания.

Оригинал статьи: https://arxiv.org/pdf/2602.23620.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-03-03 05:45