О чем могут поведать социальные сети? Доступность Интернет и рост популярности социальных сетей позволяют рассматривать социальные сети как новый источник данных в маркетинге, политических исследованиях и других сферах деятельности. Методология анализа социальных сетей, его ограничения находятся в стадии формирования. Ниже представлен подход, который, на наш взгляд, помогает проиллюстрировать перспективы использования данных социальных сетей в решении коммерческих и управленческих задач. В качестве предмета анализа может выступать бренд, политик, компания, товар и т.д. Хотя предмет анализа (далее «Интерес пользователей») является коммерческой тайной, структура представленной методологии достаточно ясно показывает возможности в исследовании социальных сетей. Методология состоит из двух составляющих: анализа контекста сообщений, то есть того, о чем пишут пользователи, и структуры социальных сетей с пострением и анализом социальных графов, их сегментации и исследования особенностей взаимодействия в сети. Контент анализ социальных медиа предполагает получение краткой информации о темах, интересующих пользователей, из сотен и тысяч страниц текста. Помимо получения общепринятых метрик: числа подписчиков, потенциальной аудитории, географического распределения и уровня вовлеченности в обсуждение, – он позволяет оценить эмоциональный тон высказываний, то как упоминается «Интерес пользователей». На его основе можно показать, насколько медиа поле интересуется товарными свойствами вообще и конкретным брендом в частности, выявить скрытые PR акции конкурирующего «Интереса пользователей». Помимо этого, контент анализ социальных сетей позволяет исследовать динамику проявляемого интереса (или лояльности к «Интересу пользователей»): проявлялся ли интерес к объекту в течение времени или появился внезапно, ситуативно; переключился ли интерес с какого-то другого бренда, оценить регулярность интереса к объекту по частоте сообщений в единицу времени и т.д. Анализ структуры социальных сетей предполагает исследование взаимодействия пользователей-акторов между собой. Изучение пользователей и сообществ, сегментация акторов на основе проявляемых интересов и характера внутрисетевого взаимодействия – это те уникальные возможности, которые предоставляют соцсети. В частности, можно сделать выводы о передаче информации в социальных сообществах, сравнить их между собой, как информационные каналы, оценить их эффективность. Модельное исследование охватывает 800 участников одной из популярнвх социальных сетей, проживающих в 150 городах, объединенных общим «Интересом пользователей». Анализ охватывает 2010-2015 гг. Пользователи, являясь членами различных групп, получали рассылку от 50 тыс. сообществ, имели 150 тыс. друзей и разместили на своих страницах почти 3 млн собщений. Исследование проведено в статистическом пакете R и состоит из следующих этапов. 1. По названиям социальных групп и случайной подвыборке из 5000 сообщений проводится частотный анализ с целью выявления наиболее популярных тематик и определения поисковых тегов. Таких тематик выделено 20. 2. Проведен частотный анализ контента на содержание слов и словоформ, характерных той или иной группе интересов по участникам соцсетей. 3. По итогам частотного анализа подведены итоги и сформулированы гипотезы о предпочтениях участников социальных сетей и их сегментации. 4. Гипотезы проверены с помощью кластерного и регрессионного анализа. Сделаны выводы о том, как «Интерес пользователей» ассоциируется с другими темами, влияет ли пол и возраст на это распределение, определено географическое распределение, установлена важность роли (вовлеченности) в социальной сети (положение актора в сети) в распространении информации «Интересе пользователей». 5. Анализ каналов передачи информации проведен с построением графов взаимодействия в социальных сетях, расчета показателей, характеризующих их в целом и по акторам в отдельности. Сделаны выводы о характере передачи информации. Асимметрия в распространении информации проиллюстрирована с использованием индекса Джини и кривой Лоренца. Анализ позволяет сделать вывод, что подавляющая доля участников, ассоциированных с «Интересом пользователей», - женщины (80%). Для большинства членов соцсетей, попавших в выборку, «Интерес пользователей» является важной темой обсуждений в Интернете на протяжении 2010-2015 гг., занимая до 22% контента у женщин, но только 2% у мужчин. В 2015 г. доля сообщений по теме «Интерес пользователей» незначительно возросла (30% женщины, 2% мужчины). Подавляющая часть 80% сообщений, распространена 10% участников. Это подтверждается и с помощью индекса Джини (0,9), что может трактоваться как незрелость социальной сети. Анализ каналов передачи информации позволяет сделать вывод оо том, что среди 50 тыс. сообществ нет лидеров в ее распространении по сети. Сообщества как каналы представлены относительно равномерно. Максимальное число подписчиков одного канала, вошедших в выборку, – 30. Из 150 тыс. друзей наибольшее число друзей имеет пользователь с 121 контактом. Установлено, что сообщества нарушают политику размещения контента только по тематике, соответствующей интересам сообщества. Таким образом потенциально они могут быть использованы для распространения маркетинговой или политической информации. Анализ сети как социального графа свидетельствует о том, что плотность этой сети весьма мала 0,0005 с низкой централизацией по числу входящих и выходящих потоков информации. Таким образом, пользователи относительно равноправны в сети как приемники и передатчики сообщений. В ядре из 380 пользователей, знакомых между собой, 99% могут получить информацию через одного посредника (транзитивность). При этом общая доля акторов, каким-либо образом соединенных между собой, всего 61%. Половозрастные характеристики на оказывают влияния на установление контактов. В то же время, контакты локализуются по географическому признаку. Для оценки того, насколько «Интерес пользователей» и другие популярные темы ассоциированы друг с другом, проведен регрессионный анализ. При построении модели сделано предположение, что «Интерес пользователей» отражает некий стабильный во времени профиль пользователя, объясняется сложившимся в сети социальным статусом – числом друзей, частотой обмена информацией и социальнодемографическими характеристиками. Установлены темы, положительно или отрицательно ассоциированные с «Интерес пользователей» на статистическом уровне значимости 99%. Установлено, что положение актора в сети является доминантным фактором в распространении иинформации.