Голос перемен: Анализ социальных движений в эпоху цифровых медиа

Автор: Денис Аветисян


Новый инструмент позволяет отслеживать дискуссии вокруг ключевых событий, выявляя особенности реакции различных онлайн-платформ и демонстрируя ограниченность оценки влияния только по объему публикаций.

☕️

Читаем отчёты, пьём кофе, ждём дивиденды. Если тебе надоел хайп и ты ищешь скучную, но стабильную гавань — добро пожаловать.

Бесплатный Телеграм канал
Наблюдения за частотой упоминаний движений #MeToo и BLM в новостных источниках и на Reddit показали, что периоды повышенной активности, отделенные порогом в два стандартных отклонения от среднего, отражают общие тенденции, выявляемые с помощью кривых плотности ядра.
Наблюдения за частотой упоминаний движений #MeToo и BLM в новостных источниках и на Reddit показали, что периоды повышенной активности, отделенные порогом в два стандартных отклонения от среднего, отражают общие тенденции, выявляемые с помощью кривых плотности ядра.

Исследование представляет SMART — систему для анализа дискурса социальных движений, основанную на обработке естественного языка и анализе временных рядов, с примерами использования на данных движений #MeToo и #BlackLivesMatter.

Несмотря на важность социальных движений в достижении целей устойчивого развития, журналистам зачастую не хватает инструментов для оперативного анализа динамики общественной дискуссии. В данной работе представлена система ‘SMART: A Social Movement Analysis & Reasoning Tool with Case Studies on #MeToo and #BlackLivesMatter’, предназначенная для отслеживания и прогнозирования эмоционального фона в социальных сетях вокруг ключевых событий. Система, использующая анализ данных из Reddit и новостных источников, демонстрирует возможность раннего выявления сдвигов в дискурсе, связанных с политическими событиями, в частности, выборами в США 2024 года. Способна ли подобная аналитика обеспечить журналистов более глубоким пониманием социальных процессов и повысить качество новостного освещения?


Понимание Движений: От Реакции к Прогнозированию

Понимание и реагирование на социальные движения является ключевым фактором в решении глобальных проблем, однако традиционные методы анализа зачастую оказываются фрагментированными и носят реактивный характер. Вместо комплексного подхода, позволяющего выявить зарождающиеся тенденции и предвидеть потенциальные последствия, существующие системы часто концентрируются на изучении уже произошедших событий. Это приводит к тому, что возможности для проактивного вмешательства и формирования эффективной политики оказываются упущенными. Неспособность оперативно отслеживать изменения в общественном мнении и понимать мотивации участников социальных движений затрудняет разработку адекватных стратегий для решения сложных социальных, экономических и политических вызовов, стоящих перед современным миром.

Для эффективного отслеживания социальных изменений требуется интеграция данных из разнообразных онлайн-источников, что предъявляет высокие требования к созданию надежной и масштабируемой системы обработки больших объемов текстовой информации. Такая система должна не просто собирать данные из социальных сетей, форумов, новостных сайтов и блогов, но и обеспечивать их структурирование, анализ и интерпретацию. Способность обрабатывать петабайты текстовых данных в реальном времени, выявлять ключевые темы и тенденции, а также отслеживать изменения в общественном дискурсе является критически важной для понимания динамики социальных процессов и своевременного реагирования на возникающие вызовы. Разработка подобных систем требует применения передовых методов машинного обучения, включая обработку естественного языка и анализ тональности, а также использования высокопроизводительных вычислительных ресурсов и облачных технологий.

Существующие методы анализа общественного мнения часто оказываются неспособны уловить тонкие изменения в дискурсе, что существенно затрудняет своевременное реагирование на социальные тенденции и разработку эффективной политики. Проблема заключается в том, что традиционные подходы склонны к упрощению сложных явлений, игнорируя нюансы, иронию, сарказм и другие лингвистические особенности, которые могут кардинально изменить смысл высказывания. В результате, важные сигналы о зарождающихся проблемах или изменении общественного настроения остаются незамеченными, что препятствует принятию обоснованных решений и снижает эффективность превентивных мер. Для преодоления этой проблемы необходимы более совершенные системы анализа, способные учитывать контекст, семантику и эмоциональную окраску текста, а также выявлять скрытые связи и закономерности в больших объемах данных.

Накопительное распределение документов по слоям фильтрации показывает, что к слою <span class="katex-eq" data-katex-display="false">L_5</span> основная масса документов из источников #MeToo (новости и Reddit) и BLM (новости и Reddit) проходит фильтрацию, что позволяет использовать этот слой для дальнейшего анализа.
Накопительное распределение документов по слоям фильтрации показывает, что к слою L_5 основная масса документов из источников #MeToo (новости и Reddit) и BLM (новости и Reddit) проходит фильтрацию, что позволяет использовать этот слой для дальнейшего анализа.

SMART: Система для Анализа Дискурса в Реальном Времени

Система SMART представляет собой комплексное решение, предназначенное для отслеживания социальных движений, поддерживающих Цели устойчивого развития (ЦУР). Она интегрирует данные из различных онлайн-источников, включая новостные медиа и платформу Reddit, для обеспечения широкого охвата информации. Данные собираются и анализируются с целью выявления тенденций, ключевых участников и общего настроения вокруг движений, ориентированных на достижение ЦУР. Использование разнообразных источников позволяет SMART получать наиболее полную и актуальную картину развития событий, связанных с поддержкой целей устойчивого развития в онлайн-пространстве.

Система SMART использует многоуровневую фильтрацию для выделения релевантного дискурса, последовательно сужая фокус на контент, связанный с социальными движениями. Первичная фильтрация осуществляется на основе ключевых слов и источников, определяющих общую тематику. Последующие уровни фильтрации применяют более сложные критерии, такие как анализ контекста и выявление специфических фраз, связанных с социальными движениями. Этот итеративный процесс позволяет отсеивать нерелевантную информацию и повышать точность выделения контента, непосредственно относящегося к поддержке целей устойчивого развития (ЦУР).

Сбор данных для системы SMART осуществляется посредством использования специализированных инструментов, таких как WorldNewsAPI и PRAW. WorldNewsAPI обеспечивает доступ к новостному контенту из различных источников, позволяя отслеживать освещение в СМИ событий, связанных с социальными движениями. PRAW (Python Reddit API Wrapper) предназначен для сбора данных непосредственно с платформы Reddit, включая комментарии и публикации, релевантные исследуемой тематике. Комбинация этих инструментов гарантирует непрерывный и автоматизированный поток данных, необходимых для проведения анализа дискурса в режиме реального времени.

В основе системы SMART лежит обработка естественного языка (NLP), включающая в себя методы извлечения ключевых слов и анализа эмоциональной окраски текста. Извлечение ключевых слов позволяет идентифицировать наиболее важные темы и понятия, обсуждаемые в онлайн-дискурсе, что способствует фильтрации релевантного контента. Анализ эмоциональной окраски, в свою очередь, позволяет оценить тональность высказываний — позитивную, негативную или нейтральную — и выявить преобладающие настроения в обсуждениях, связанных с социальными движениями. Комбинация этих методов обеспечивает получение ценных данных о содержании и эмоциональном фоне онлайн-конверзаций, необходимых для анализа поддержки Целей устойчивого развития.

Архитектура SMART-системы включает в себя модули восприятия, планирования и управления для обеспечения автономной работы.
Архитектура SMART-системы включает в себя модули восприятия, планирования и управления для обеспечения автономной работы.

Выявление Исторических Тенденций и Эмоционального Ландшафта

Система SMART использует ретроспективный анализ для выявления временных закономерностей в дискурсе социальных движений, позволяя отследить, как онлайн-разговоры изменяются с течением времени. Этот подход включает в себя анализ исторических данных, полученных из различных онлайн-источников, для определения тенденций и изменений в объеме дискуссий, преобладающих темах и эмоциональной окраске. Ретроспективный анализ позволяет исследователям не только констатировать факты, но и установить взаимосвязи между событиями и изменениями в онлайн-дискурсе, выявляя, как определенные события или факторы влияют на формирование и эволюцию онлайн-разговоров вокруг социальных движений. Это достигается посредством анализа временных рядов данных, позволяющего идентифицировать пики и спады активности, а также отслеживать изменения в ключевых темах и настроениях, характерных для онлайн-дискуссий.

Анализ дискурса в рамках SMART контекстуализируется ключевыми политическими событиями, что позволяет исследователям выявлять влияние внешних факторов на онлайн-разговоры. Это предполагает сопоставление изменений в объеме и эмоциональной окраске онлайн-дискуссий с конкретными политическими событиями, такими как принятие законов, протесты или публичные заявления. Подобный подход позволяет определить, как эти события инициируют, усиливают или изменяют онлайн-дискурс, предоставляя данные о причинно-следственных связях между внешними факторами и динамикой социальных движений в цифровом пространстве. Например, анализ показывает, что объемы дискуссий в новостных медиа значительно увеличиваются во время определенных политических событий, в то время как активность на Reddit может демонстрировать обратную динамику.

Система использует анализ эмоциональной окраски (Emotion Analysis) для количественной оценки интенсивности эмоций в онлайн-дискурсе. Этот анализ позволяет выявить преобладающие настроения, движущие социальными движениями, и служит основой для измерения объема дискурса (Discourse Volume). Количественная оценка эмоциональной составляющей позволяет отслеживать динамику настроений во времени, выявлять пики эмоциональной активности, связанные с конкретными событиями, и устанавливать взаимосвязь между эмоциональным фоном и общим объемом онлайн-обсуждений. Полученные данные предоставляют возможность для более глубокого понимания мотиваций участников социальных движений и факторов, влияющих на их активность.

Функциональность семантического поиска в SMART расширяется за счет использования ChromaDB, векторной базы данных, предназначенной для хранения текстовых эмбеддингов. Эмбеддинги, представляющие собой числовые векторы, кодирующие семантическое значение текста, позволяют системе выполнять быстрый и точный поиск релевантной информации. ChromaDB оптимизирована для хранения и поиска этих векторов, обеспечивая эффективное извлечение данных и анализ больших объемов текстовой информации. В отличие от традиционных методов поиска по ключевым словам, семантический поиск на основе векторных эмбеддингов позволяет находить тексты, близкие по смыслу, даже если они не содержат заданные ключевые слова, значительно повышая точность и полноту результатов анализа.

Анализ данных показал существенные различия в динамике дискурса между новостными медиа и Reddit во время ключевых политических событий. В частности, объём дискурса в новостных медиа увеличивался на 78.1% в ответ на эти события. Одновременно с этим, активность на Reddit демонстрировала снижение, что подтверждается значением Cohen’s d, равным -0.51 для темы #MeToo. Для движения Black Lives Matter (BLM) наблюдался значительный рост освещения в новостных медиа во время ключевых событий, с большим размером эффекта (Cohen’s d = 1.17). Эти данные указывают на расхождение в способах распространения и обсуждения социально-политических тем на различных онлайн-платформах.

Анализ 36 ключевых политических событий, связанных с движением #MeToo на Reddit, выявил значительные изменения в объеме обсуждений до и после этих событий в 20 случаях (p < 0.001). Данный результат указывает на статистически значимую корреляцию между определенными политическими событиями и активностью обсуждений темы #MeToo на платформе Reddit, что позволяет предположить, что внешние факторы оказывают существенное влияние на динамику онлайн-дискуссий.

Анализ объема дискурса до и после ключевых политических событий (КПС) показывает, что большинство событий (обозначены точками) характеризуются преобладанием предвкушающих дискуссий (синий цвет) или реактивных ответов (оранжевый цвет), при этом диагональная линия указывает на равный объем обсуждения до и после события.
Анализ объема дискурса до и после ключевых политических событий (КПС) показывает, что большинство событий (обозначены точками) характеризуются преобладанием предвкушающих дискуссий (синий цвет) или реактивных ответов (оранжевый цвет), при этом диагональная линия указывает на равный объем обсуждения до и после события.

Прогнозирование Будущего Социальных Движений

Система SMART использует компонент “Прогнозирующей аналитики” для предсказания будущих состояний дискурса социальных движений, опираясь на анализ исторических данных и информации, поступающей в режиме реального времени. Этот подход позволяет выявлять закономерности в развитии общественных настроений и прогнозировать возможные изменения в тематике обсуждений, интенсивности эмоциональной окраски и общей вовлеченности аудитории. Используя сложные алгоритмы, система не просто фиксирует текущую ситуацию, но и экстраполирует тенденции, позволяя оценить вероятность эскалации конфликтов, появления новых лидеров мнений или изменения фокуса внимания общественности к конкретным проблемам. Такой прогноз позволяет заинтересованным сторонам не только понимать происходящее, но и заблаговременно разрабатывать стратегии реагирования и коммуникации, повышая эффективность их воздействия на общественное мнение и способствуя более конструктивному развитию социальных процессов.

Система позволяет заинтересованным сторонам не просто реагировать на происходящее, но и формировать повестку дня, предвосхищая возможные кризисы и конфликты в общественном дискурсе. Анализируя данные о социальных движениях, она предоставляет возможность заблаговременно выявлять зарождающиеся проблемы и разрабатывать эффективные стратегии коммуникации, направленные на смягчение негативных последствий или даже предотвращение эскалации напряженности. Такой проактивный подход позволяет организациям и ведомствам не только адаптироваться к изменяющейся обстановке, но и активно влиять на общественное мнение и формировать благоприятный контекст для решения важных социальных задач. Возможность прогнозирования позволяет перейти от реактивного управления кризисами к стратегическому планированию и построению конструктивного диалога с обществом.

Система SMART способна выявлять критические моменты в развитии социальных движений, анализируя динамику дискурса — как объем обсуждений, так и эмоциональную окраску сообщений. Отслеживая резкие изменения в этих показателях, система способна прогнозировать потенциальные точки невозврата, когда движение может резко набрать обороты или, наоборот, пойти на спад. Такой анализ позволяет заинтересованным сторонам разрабатывать превентивные меры и стратегии коммуникации, направленные на смягчение конфликтов или, наоборот, на поддержку позитивных изменений, что способствует более эффективному реагированию на возникающие социальные процессы и минимизации рисков эскалации.

Аналитические возможности системы применимы к широкому спектру социальных движений, включая такие значимые явления, как `#MeToo` и `Black Lives Matter`. Исследование динамики этих и других движений позволяет выявить закономерности в формировании общественного мнения, распространении информации и мобилизации участников. Изучение объемов дискуссий, эмоциональной окраски сообщений и ключевых тем, поднимаемых в социальных сетях, способствует более глубокому пониманию факторов, определяющих успех или неуспех подобных инициатив, а также их долгосрочного влияния на общество. Такой подход открывает возможности для прогнозирования дальнейшего развития событий и разработки эффективных стратегий взаимодействия с различными социальными группами.

Анализ интенсивности эмоций до и после событий ключевых политических деятелей (KPE) показывает, что для внутренней политики (зеленый) преобладают предвосхищающие закономерности, а для выборов (красный) и внешней политики (синий) - реактивные, при этом эффекты, значимые для FDR, выделены на графике.
Анализ интенсивности эмоций до и после событий ключевых политических деятелей (KPE) показывает, что для внутренней политики (зеленый) преобладают предвосхищающие закономерности, а для выборов (красный) и внешней политики (синий) — реактивные, при этом эффекты, значимые для FDR, выделены на графике.

Исследование демонстрирует, что анализ социальных движений требует не просто фиксации объемов информации, но и глубокого понимания контекста и специфики различных платформ. Инструмент SMART, разработанный авторами, позволяет выявить эти нюансы, предоставляя возможность для более точной интерпретации данных. В этой связи вспоминается высказывание Андрея Николаевича Колмогорова: «Математика — это искусство видеть невидимое». Подобно тому, как математик ищет закономерности в абстрактных структурах, так и данное исследование стремится выявить скрытые связи и закономерности в потоках социальной информации, позволяя лучше понять динамику протестных движений и их отражение в цифровом пространстве. Редукция к сути, выявление ключевых событий и их влияния на общественное мнение — вот что отличает данный подход.

Куда же дальше?

Представленный инструмент, стремящийся уловить сложность общественных движений, неизбежно сталкивается с проблемой избыточности. Попытка оцифровать коллективное негодование, сведя его к временным рядам и частоте упоминаний, — это, по сути, признание собственной неспособности постичь его суть. Будущие исследования должны сместить фокус с простого обнаружения событий на понимание качества дискурса — не сколько говорят, а как говорят, и что остается за словами. Простота — не ограничение, а доказательство понимания, и здесь поле для работы огромно.

Очевидным направлением является углубление семантического анализа. Обнаружение событий — лишь первый шаг; необходимо уметь различать искреннее сочувствие от циничного использования трендов, конструктивную критику от деструктивной риторики. Иными словами, необходимо создать инструменты, способные улавливать не только что происходит, но и почему это происходит, и какие последствия это несет.

В конечном итоге, задача не в создании всеобъемлющей модели общественного мнения, а в разработке инструментов, которые позволят исследователям задавать более осмысленные вопросы. Сложность — это тщеславие. Истинная ценность заключается в способности увидеть простоту, скрытую за кажущимся хаосом, и признать, что полное понимание всегда останется недостижимым идеалом.


Оригинал статьи: https://arxiv.org/pdf/2601.20986.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-02-01 10:11