"Количественные методы и автоматическая обработка данных в

реклама
Количественные методы и
автоматическая обработка данных
в изучении актуального фольклора
А.С Архипова, Д.А Радченко
Лаборатория теоретического фольклора
ШАГИ РАНХиГС
Актуальный фольклор: к определению понятия
• совокупность фольклорных текстов,
которые комментирует актуальные
события, и для понимания которых
требуется знание новостной топики и,
нередко, выразительных средств
массовой коммуникации [Frank 2011:7]
• выражен в различных жанрах:
анекдоты, городские легенды,
«фотожабы», пародии, плакаты на
митинге, слухи и проч.)
Ньюслор/Актуальный фольклор: литература
•
•
•
•
•
•
•
•
Ellis 2002 - Ellis, Bill. Making a Big Apple Crumble: The Role of Humor in
Constructing a Global Response to Disaster.// New Directions in Folklore 6 (June
2002). URL:
<http://www.temple.edu/english/isllc/newFolk/journal_archive.html#sixth>
Fahey, Warren. SHOCK HORROR: The Folklore of Disaster.
http://warrenfahey.com/fc_humour-shock6.html
Fialkova 2001 – Fialkova, Larisa. Chornobyl’s Folklore: Vernacular Commentary on
Nuclear Disaster// Journal of Folklore Research. 2001. Vol. 38, No. 3. P.181-204.
Frank 2011- Frank, Russell. Newslore: Contemporary Folklore on the Internet.
Jackson: University Press of Mississippi, 2011. 224 p.
Hathaway 2005 - Hathaway Rosemary V.. "'Life in the TV': The Visual Nature of
9/11 Lore and Its Impact on Vernacular Response." Journal of Folklore Research
42.1 (2005): 33-56.
Kuipers 2005 - Kuipers, Giselinde. ‘‘Where Was King Kong When We Needed
Him?’’ Public Discourse, Digital Disaster Jokes, and the Functions of Laughter after
9/11 //T he Journal of American Culture. 2005. Volume 28, Number 1. P.70-84.
Laineste 2002 - Laineste, Liisi. Take It With A Grain Of Salt: The Kernel Of Truth In
Topical Jokes // Electronic Journal of Folklore. 2002. Issue 20-22. P.7-25.
Oring 1987 - Oring, Elliot. Jokes and the discourse of disaster //The Journal of
American Folklore. 1987. Vol.100. #397. P. 276-286.
ИССЛЕДОВАНИЯ
ОТДЕЛЬНЫХ
КЕЙСОВ
Ключевые особенности актуального фольклора
•
•
•
•
•
Топика
Скорость реакции на событие
Объем производимых текстов
Длина жизненного цикла
Цитатность
НЕОБХОДИМОСТЬ
ПОСЛЕДОВАТЕЛЬНОГО
МОНИТОРИНГА
Функции актуального фольклора
• отражает реакцию общества на актуальные
события
• является реакцией и в этом качестве является как
средством адаптации/компенсации, так и
способствует становлению групповой
идентичности.
• формирует представление сообщества о текущих
событиях/процессах и нормирует отношение к
ним.
Основные гипотезы проекта
 топика и динамика функционирования текстов
коррелирует с интенсивностью развития событий и их
освещением;
 с другой стороны, она также отражает изменение
установок определенных общественных групп => может
служить диагностическим признаком восприятия их
носителями [медиа]-реальности
 и => гипотетически позволяет построение прогностических
моделей
Текущие проекты «Мониторинга актуальных форм городского
фольклора»:
 Актуальный политический
фольклор и антропология протеста
 Мониторинг формирования
коллективной идентичности в
фольклоре
 Фольклор катастроф и современная
эсхатология
Специфика исследования актуального фольклора
Скорость
возникновения
текстов
Объем
корпуса
текстов
Объем сетей
трансмиссии
текстов
BIG
DATA
+ неоднородность текстов
Объем
контекстуальной
информации
WARNING!
ПРОЦЕДУРЫ В СОСТОЯНИИ РАЗРАБОТКИ
Количественные методы в исследовании актуального фольклора
 Data Mining
 Дескриптивная статистика
 Семантический анализ
 Контент-анализ
 Метод социальных сетей
Инструментарий автоматической обработки данных
 Получение данных: Yandex.Блоги, Google
Analytics, Python Social Chain Mining Scripts
(Д.Николаев)
 Обработка данных: Microsoft Excel, R statistics
 Создание моделей социальной сети: NodeXL
 Семантический анализ: SEO-инструментарий
Измеряемые показатели
• Скорость фольклорной реакции
• Период бытования текста
• География распространения текста (физическая,
социальная)
• Семантический состав текста
Измеряемые формы фольклорной реакции
• Генерирование [фольклорного]
текста
• Участие в трансмиссии ФТ путем его
воспроизведения в любой форме
• Косвенное выражение одобрения,
выраженной в фольклорном тексте
• Участие в обсуждении
фольклорного текста
Корпус текстов
Устное или
письменное
воспроизведение
Перепост
«лайк»
комментарий
Проверка данных
Отклонение индивидуальных распределений от средних значений по первому
параметру составила 15%, по второму – около 5%: фотографы уделяли
одинаковое внимание участникам шествия обоих полов, но по-разному
относились к фиксации невербальных средств.
ТРЕБУЕТСЯ КОРРЕКЦИЯ ПОЛЕВОЙ РАБОТЫ
Социальные сети: Демографический профиль носителей фольклора
Сдвиг
f>m
Сдвиг к
молоде
жи
1. Отражает ситуацию протеста (СПБ – несанкционированное мероприятие)
2. Изменяет профиль текстов (МСК – больше цитатных мемов,
инфантилизации текстов)
Социальные сети: Демографический профиль носителей фольклора
1. Основные распространители анекдотов, содержащих ПЛ – мужчины, чаще –
москвичи или жители регионов
2. Пользователи, связанные с Украиной и Крымом, менее склонны к
распространению таких текстов
Полевые данные: топика и выразительные средства плаката
Количество вербальных и Вербальные
невербальных знаков
Невербальные
(% от общего количества в каждой
группе)
80
С кем мы разговариваем?
(% от количества вербальных лозунгов по
35
группам)
30
70
25
60
20
50
40
15
30
10
20
5
10
0
0
Москва
Санкт-Петербург
Сторонники
Новороссии
?ИСТОЧНИКИ?
Москва
Санкт-Петербург
Сторонники
Новороссии
Семантический анализ: источники топики и средств выражения
Измерение эксплицитной напряженности конфликта
Уровень "антиукраинской" лексики по отношению к
"антироссийской”
Гипотеза
ФОН
(av1-6.13)
С учетом количества пользователей в РФ и Украине «антиукраинской»
лексики должно быть в 4,7 раза больше, чем «антироссийской».
Реальный фоновый уровень - 1,25.
Максимальный уровень в период конфликта – 4,00(март 2014)
Жизненный цикл текста: что такое «катастрофа»
dataSource: Yandex.Поиск по блогам
Диагностика развития конфликтной лексики: естественный и
искусственный жизненный цикл
Количество употребления
лексем в % к сумме
употреблений в 2014 г.
Диагностика характера употребления конфликтной лексики
Анекдот «Путин,
Порошенко и
Золотая Рыбка»
•
•
Пик перепостов текста следует за пиком употребления лексемы
В течение flat-периода лексемы текст периодически проникает на
популярные ресурсы, вызывает одобрение, которое не отражается на
активности трансмиссии:
ПЕРИОД ПАССИВНОГО СОГЛАСИЯ С ТЕКСТОМ
Определение прагматики текста
В первой половине 2014 г. в социальных сетях
активно размещаются фотографии объявлений
об «ответных санкциях».
43% - владельцами малого бизнеса как
информационный/PR-повод. По отдельным
свидетельствам, клиенты точек продаж охотно
фотографируют эти материалы
24% - людьми, лично видевшими размещенные
листовки в точках продаж/обслуживания, иногда
специально посещавшими эти точки, чтобы
увидеть листовки/сфотографироваться с ними
33% - перепосты
Наибольшее количество публикаций - четвергпятница: материал понимается скорее как
юмористический, чем как серьезная
публицистика.
Спасибо за внимание!
Скачать