1 МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ГОУ ВПО Томский государственный университет УТВЕРЖДАЮ Декан исторического факультета ________________В.П. Зиновьев «____»___________________20___г. КОНТЕНТ-АНАЛИЗ В ГУМАНИТАРНЫХ НАУКАХ Рабочая программа Направление 030600.62 – История Направление 034700.62 – Документоведение и архивоведение Квалификация (степень) выпускника Бакалавр Форма обучения очная Томск 2011 2 1. Цели освоения учебной дисциплины Выработать навыки аналитических компетенций в области формализации обработки неструктурированной текстовой информации в различных предметных областях. Сформировать понимание междисциплинарных теоретических основ контент-анализа, Дать представление о новейших тенденциях применения кантент-анализа в различных отраслях профессиональной информационной деятельности, Познакомить с возможностями использования компьютерных экспертных систем автоматизированной обработки текстовой информации. 2. Место учебной дисциплины в структуре ООП бакалавриата Данная дисциплина входит в раздел СД.Ф.05 – Цикл специальных дисциплин. Федеральный компонент. Для изучения дисциплины необходимы компетенции, сформированные у обучающихся в средней общеобразовательной школе по математике, русскому языку, литературе и обществознанию. Контент-анализ является полидисциплинарным методом, интегрируя в себе теории и методики многих гуманитарных дисциплин на базе прикладного использования математической статистики и лингвистики для изучения любых текстов. В связи с этим, дисциплина «Контент-анализ в гуманитарных науках», преподаваемай на последнем годе бакалавриата, призвана завершить и обобщить цикл изучения всех предшествующих курсов с точки зрения использования прикладных методик для решения практических задач обработки текстовой информации. Полученные знания подготавливают к более глубокому освоению профессиональных компетенций, связанных с услугами аналитического консалтинга, мониторинга СМИ, управления документооборотом, разработки баз данных в области гуманитарных наук. 3. Компетенции дисциплины обучающегося, формируемые в результате освоения В результате освоения дисциплины студент должен: Знать: Основы формализации и алгоритмизации аналитических процедур; Понятийно-терминологический аппарат, связанный с неструктурированной и структурированной текстовой информацией; Особенности разных видов контент-анализа; Современные направления использования контент-анализа. Уметь: Соблюдать требования научной строгости в анализе больших массивов текстов; Использовать различные методики качественно-количественного анализа текстовых архивов; Применять полученные знания о контент-анализе в собственной предметной исследовательской области; Самостоятельно осваивать практические прикладные процедуры «ручного» и автоматизированного контент-анализа; 3 Данная дисциплина способствует формированию следующих компетенций, предусмотренных ФГОС-3 по направлению ВПО 030600 – История, 034700 – Документоведение: А) Общекультурные компетенции (ОК): - Владеет культурой мышления; способность к восприятию, анализу, обобщению информации, постановке целей и путей ее достижения (ОК-1); - Стремится к саморазвитию, повышению квалификации и мастерства, способен изменять при необходимости профиль своей профессиональной деятельности, способен к социальной адаптации (ОК-6); - Владеет способностью использовать в познавательной и профессиональной деятельности базовые знания основ информатики, элементы естественнонаучного и математического знания (ОК-13) Б) Профессиональные компетенции (ПК): Общепрофессиональные: - Владеет способностью использовать теоретические знания и методы исследования на практике (ПК-2); - Владеет базовыми знаниями в области информационных систем (языки и программные алгоритмы, компьютерный практикум) (ПК-4). Научно-исследовательские: - Владеет основами информационно-аналитической деятельности и способностью их применить в профессиональной сфере (ПК-10); - Владеет способностью выявлять и отбирать документы для разных типов и видов публикаций (ПК-21); - Владеет способностью вести научно-методическую работу в государственных, муниципальных архивах и архивах организаций (ПК-22). Технологические: - Владеет способностью совершенствовать технологии документационного обеспечения управления и архивного дела на базе использования средств автоматизации (ПК-38); Проектные: - Владеет принципами и методами упорядочения состава документов и информационных показателей (ПК-44). 4 2 2 1 2 2 2 1 5 2 2 1 7 2 2 5. Метод интент-анализа 1 8 2 2 6. Матрицы данных и статистические методы в контентанализе 1 4 1 1 2 7. Прикладные задачи и методики частотного контент-анализа 1 3 1 1 2 8. Прикладные задачи и методики семантического контент-анализа 1 6 1 1 2 1 9 2 2 1 10 1 2 2. Принципы частотного контентанализа (манифестного кодирования) 3. Принципы семантического контент-анализа (латентного кодирования) 4. Метод контекстно-тематического анализа 9. Использование логических и статистических функций в офисных компьютерных приложениях для автоматизации контент-анализа 10. Компьютерные экспертные системы технологий «data mining» и «text mining» 1 Контрольные работы лекции 1 1. Вводное знакомство с методом контент-анализа текстов С Р С Контрольные работы, проектное исследование Неделя семестра 1 Раздел дисциплины Практические занятия Семестр №2. Методические и прикладные аспекты контент-анализа №1. Теоретические аспекты контент-анализа Номер и название тематического модуля Виды учебной работы (в час.) В том числе Формы текущего контроля успеваемости (по неделям) 4. Структура и содержание учебной дисциплины Общая трудоемкость дисциплины составляет 2 зачетных единицы (по1-й на каждый тематический модуль), 20 часов (по 10 часов на каждый тематический модуль). 5 5. Образовательные технологии Неимитационные методы обучения: Технология лекции-визуализации используется по всем темам спецкурса. Лекциявизуализация учит студента преобразовывать устную и письменную информацию в визуальную форму, для более глубокого понимания сути изучаемого материала и его лучшего запоминания. Кроме того, инфографика – главный способ отображения результатов контент-анализа. В связи с этим демонстрация образцов визуализации данных и задания на самостоятельную оперативную визуализацию имеют также прикладную цель освоения технологических навыков. В ходе показа авторских слайд-презентаций, посвящённых теории и практике контент-анализа, значительная часть тезисов или вопросов сопровождается постепенным поэлементным демонстрированием образцов инфографики (схемы, диаграммы, SmartArt). На основе этих образцов студентам предлагается в их конспектах графически отображать ту часть лекционного материала, которая, даётся только в устной форме и текстовом виде (на слайдах). Авторские образцы инфографики для вводной лекции показаны на сайте ИФ ТГУ по адресу http://klio.tsu.ru/content-analysis.pps. В рамках учебной дисциплины технология лекциивизуализации должна формировать следующие компетенции: ОК-1, ОК-6, ПК-10. Технология проблемной лекции используется по всем темам учебного Модуля №2. «Методические и прикладные аспекты контент-анализа». Проблемная лекция начинается с вопросов, с постановки практических проблем обработки неструктурированной или слабоструктурированной текстовой информации. Эти проблемы студенты с помощью преподавателя должны решить в ходе изложения материала. Лекция строится таким образом, что деятельность студента по ее усвоению приближается к поисковой, исследовательской. Обязателен диалог преподавателя и студентов. В рамках учебной дисциплины технология проблемной лекции должна формировать следующие компетенции: ОК-1, ОК-13, ПК-2, ПК-10, ПК-21, ПК-44. Имитационные методы обучения: Практические задания для тематического модуль №1. «Теоретические аспекты контентанализа» для получения первой зачётной единицы. Методологический анализ научной статьи или монографии, с описанием применения и результатов контент-анализа. Статья должна быть найдена студентом самостоятельно по библиографическим обзорам. Методологический анализ должен формировать следующие компетенции: ОК-1, ОК-6, ПК-2, ПК-10, ПК-21. Анализ должен проводиться по следующим критериям: 1. Объект исследования: определить, какой конкретный текст или выборка текстов анализируется в исследовании. 2. Цели и задачи, связанные предметной областью. 3. Учитываемые и анализируемые лингвистические единицы текста. 4. Учитываемые единицы счёта, относительно которых выявляется встречаемость лингвистических или семантических единиц текста. 5. Внетекстовые явления предметной области базовой дисциплины (исторические, психологические, социальные, литературные, политические и др.), отождествляемые с учитываемыми лингвистическими единицами или выводимые из них. 6. Вид контент-анализа и обоснование использования именно этого вида. 7. Описание (или моделирование в случае отсутствия описания) матрицы данных, на которой основано исследование. 8. Описание и обоснование использованных математических методов. 9. Описание приведённых либо возможных форм и способов представления эмпирических числовых результатов контент-анализа. 10. Обобщающие выводы и выявленные закономерности для предметной области базовой дисциплины. 6 Составление тематического тезауруса-классификатора единиц контент-анализа для предложенной преподавателем комбинации выборки текстов любого жанра, дискурсивнолингвистической тенденции и предметно-тематической области. Примеры и образцы тезаурусов-классификаторов демонстрируются преподавателем на лекциях. Это задание должно формировать следующие компетенции: ОК-1, ОК-6, ПК-2, ПК-21, ПК-22, ПК-44. Практические задания для тематического модуля №2. «Методические и прикладные аспекты контент-анализа» для получения второй зачётной единицы. Разработка проекта контент-аналитического исследования (исследовательской модели) изучения выборки однотипных текстов (сообщений СМИ и публицистики, политических речей и заявлений, архивных документов или текстов любого иного типа и жанра). Выборка может, как собираться студентом (по желанию), так и предлагаться преподавателем. В случае выбора источниковой базы студентом, она должна быть связана с темой курсовой работы. Этапы и пункты проекта соответствуют критериям методологического анализа научной статьи или монографии из учебного тематического модуля №1. Кроме этого, обязательна презентации и разбор пробного примера карточки фиксации единиц контент-анализа для единицы счёта (одного небольшого текста или фрагмента большого текста). Это задание должно формировать следующие компетенции: ОК-1, ОК-13, ПК-2, ПК-10, ПК-21, ПК-22, ПК-44. Автоматизация контент-анализа в офисных компьютерных приложениях c использованием макросов, логических и статистических функций, элементов управления GUI. С помощью средств автоматизации нужно сгенерировать матрицу данных контентанализа выборки тектов, сгенерировать таблицы и графики, с обобщающие результаты анализа, а затем кратко проанализировать статистические характеристики и параметры шкал данных. Выборка текстов должна быть обязательно связана с темой курсовой работы. Это задание должно формировать следующие компетенции: ОК-13, ПК-4, ПК-38, ПК-44. Освоение и аннотированное описание компьютерной экспертной контентаналитической программы из предложенного списка Интернет-ресурсов (см. пример списка по адресу http://academic.csuohio.edu/kneuendorf/content/cpuca/ccap.htm ). Это задание призвано обобщить все знания, полученные в учебно-тематическом модуле №2, и должно формировать следующие компетенции: ОК-6, ОК-13, ПК-10, ПК-38. Оценочные средства для текущего контроля успеваемости. Для получения зачёта необходимо выполнить все контрольные задания на уровне не ниже удовлетворительного (минимально возможный допустимый уровень знаний). В случае если большинство задание будет выполнено на «отлично с плюсом» (выдающийся уровень знаний, превышающий объем обязательного материала, с творческим подходом к дисциплине), для получения зачёта может быть необязательным выполнения одного из заданий (по выбору студента). 7 6. Учебно-методическое и информационное обеспечение дисциплины Основная литература: 1. Аверьянов Л.Я. Контент-анализ. М., 2007 2. Баранов А.Н. Введение в прикладную лингвистику. М., 2001 3. Белянин В.П. Психолингвистика: Учебник. М., 2003 4. Ермаков А.Е. Автоматизация онтологического инжиниринга в системах извлечения знаний из текста // Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог'2008. М., 2008 5. Зверев В.М. Социологическое прочтение философских идей России XVIII века: контентанализ. С.-Пб., 1998 6. Здравомыслов А.Г. Немцы о русских. Контент-анализ. М., 2003 7. Зильберт Б.А. Социопсихолингвистическое исследование текстов радио, телевидения, газет. Саратов, 1986 8. Кузнецов И.Н. Информация: сбор, защита, анализ. Учебник по информационноаналитической работе. М., 2001 9. Курилович Н.В. Контент-анализ: логика развития метода // Методология исследования политического дискурса: актуальные проблемы содержательного анализа общественнополитических текстов. Вып. 2. Мн.: БГУ, 2000 10. Латынов В.В. Исследование социальных представлений методом интент-анализа. // Языковое сознание: формирование и функционирование. Сб. ст. / Отв. ред. Н.В. Уфимцева. М., 1998 11. Миронов Б.Н. История в цифрах: Математика в исторических исследованиях. Л., 1991 12. Речевое воздействие в сфере массовой коммуникации / Отв.ред.Ф.М.Березин, Е.Ф.Тарасов. М., 1990 13. Чураков А.Н. Компьютерный контент-анализ. М.: Институт социологии РАН, 1996 14. Яковлев И. Компьютерные технологии контент-анализа прессы в планировании президентских избирательных кампаний // Электоральные технологии и президентские выборы. – Кишинев: CAPTES, 2000 Дополнительная литература: 1. Аверьянов Л.Я. Контент-анализ. М., 2007 2. Асеев Ю.А. Фирсов Б.М. Контент-анализ и изучение понимание текста аудиторией // Иностранная психология. Т.1. №2, 1993 3. Баранов А. Н., Караулов Ю. Н. Словарь русских политических метафор. М., 1994 4. Баранов А.Н. Введение в прикладную лингвистику. М., 2001 5. Барсамов В.А. Контент-анализ газетных материалов (события в Беслане) // Социс №2, 2006 6. Белянин В.П. Психолингвистика: Учебник. М., 2003 7. Богомолова Н.Н. Контент-анализ. М., 1992 8. Бородкин Л.И., Морозова Л.Е. Опыт использования математических моделей и ЭВМ в текстологических исследованиях // Количественные методы в гуманитарных науках. М., 1981 9. Брагина Л.М. Опыт исследования философского трактата XV в. методом количественного анализа // Математические методы в исторических исследованиях. М., 1972 10. Васильев А.Д. Слово в российском телеэфире: Очерки новейшего словоупотребления. М., 2003 8 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. Верховская А.И. Методы анализа писем в редакционной работе. М., 1984 Волков С.В. Социальный состав высшего чиновничества Кореи периода Корё (X - XIV вв.) // Математические методы и ЭВМ в исторических исследованиях. Под. ред. И.Д.Ковальченко. М., 1985 Давлетшина Н.В. Массивы материалов СМИ как исторический источник по российской истории новейшего времени // Круг идей: историческая информатика в информационном обществе.Труды VII конференции АИК. М., 2001 Ильин М.В. Политический дискурс как объект лингвистического анализа // Полис, 2004, №3 Кучумов Д.О. Семантический анализ информационной войны (на примере осетиноингушского конфликта). Дис. канд. полит. наук. Ростов-на-Дону, 2007 Лапшова О.А. Психологическое содержание текста и его оценивание методами интентанализа и психосемантики. Дис. канд. психол. наук.. М., 2003 Ласко М.В. Резвицкая Ж.И. Определение эмоционального состояния методом контентанализа речи // Речь и эмоции. Л., 1975 Луков В.Б., Сергеев В.М. Опыт моделирования мышления исторических деятелей: Отто Фон Бисмарк, 1866-1876 гг. Вопросы кибернетики. Логика рассуждений и её моделирование. М., 1983 Лурия А.Р. Язык и сознание. М., 1979 Маджаров А.С. К вопросу о применении контент-анализа к источникам личного происхождения. // Источниковедение и историография истории Восточной Сибири. – Иркутск,1982. Мазырин В.М. Применение методов контент-анализа к материалам прессы // Количественные методы в гуманитарных науках. М., Изд. МГУ., 1981 Малкина Г.Ю. Контент-анализ автобиографических рассказов в изучении личностных свойств. Дис. канд. психол. наук. М., 2005 Манаев О.Т. Опыт контент-анализа альтернативной прессы Белоруссии // Социологические исследования, 1991. №8. Мангейм Дж.Б., Рич Р.К. Политология. Методы исследования: Пер. с англ. / М.: Издательство “Весь Мир”, 1997 Мансуров В.А., Семёнов А.В. «Московский комсомолец»: контент-анализ публикаций о терактах 2004 года и терроризме // Социс №8, 2007 Математика в изучении средневековых повествовательных источников. М., 1986. Математические методы и ЭВМ в историко-типологических исследованиях. Сборник научных статей АН СССР / Отв. ред. И.Д.Ковальченко. М., 1989 Методологические и методические проблемы контент-анализа (Тезисы докладов рабочего совещания социологов). Выпуск 1. Москва-Ленинград, 1973 Методы анализа документов в социологических исследованиях / Под ред.: В.Г.Андреенкова, О.М.Масловой. М., 1985 Методы количественного анализа текстов нарративных источников. М., 1983 Мещерякова Э.И. Текст в психодиагностике и консультировании. - Томск: Изд-во Том. ун-та, 2001 Миронов Б.Н. История в цифрах: Математика в исторических исследованиях. Л., 1991 Можаева Г.В., Мишанкина Н.А. Историко-лингвистический анализ в изучении русской историографии второй половины XVIII века // Гуманитарная информатика: Сб. статей. Томск: Изд-во Том. ун-та, 2005. Налимов В.В. Вероятностная модель языка. О соотношении естественных и искусственных языков. — М.: Наука, 1974; 2-е изд. — 1979. 9 Негрышев А.А., Мокеева А.В. Аспекты речевого воздействия в радиотекстах "Немецкой волны" // Актуальные проблемы содержания и методики обучения иностранным языкам. Владимир, 2001 36. Оберемко О.А. Чикагская традиция и политическая наука Гарольда Ласуэлла // Социологический журнал, 1994. № 1. 37. Павлова Н.Д. Интент-анализ телеинтервью // Языковое сознание: формирование и функционирование. Сб. ст. / Отв. ред. Н.В. Уфимцева. М., 1998 38. Паршин П.Б. Об оппозиции системоцентричности и антропоцентричности применительно к политической лингвистике // Диалог, 2000. № 1 (http://www.dialog21.ru/Archive/2000/Dialogue% 202000-1/229.htm) 39. Почепцов Г. Теория и практика коммуникации. М., 1998 40. Проблемы психологии дискурса (под ред. Павловой Н.Д., Зачесовой И.А.), 2005 41. Расторгуев С.П. Введение в формальную теорию информационной войны. М., 2002. 42. Репьев А.П. «По-ВААЛ-яем дурака, господа!» http://www.repiev.ru/articles/VAAL.htm 43. Речевое воздействие в сфере массовой коммуникации / Отв.ред. Ф.М.Березин, Е.Ф.Тарасов. М., 1990 44. Романовский Н.В. НЭП, контент-анализ и князь Кропоткин // СОЦИС. 2001. № 3 45. Рыбаков Б.А. Русские летописцы и автор "Слова о полку Игореве". М., 1972 46. Свинцов В. И. Смысловой анализ и обработка текста. М., 1979 47. Семенов В.Е. Применение метода контент-анализа в социально-психологических исследованиях. Л., 1975 48. Слово в действии. Интент-анализ политического дискурса / Под. ред Ушакова Т.Н., Павловой Н.Д. - С.-Пб., 2000 49. Сорокин Ю.А. Психолингвистические аспекты изучения текста. М., 1985 50. Сэлтон Г. Автоматическая обработка, хранение и поиск информации. Нью-Йорк, 1968, Пер. с англ. М., 1973 51. Топка Р.В. Контент-анализ: семантический или документалистический? Опыт применения на материале крестьянских наказов от южноукраинских губерний в I Государственную Думу // Круг идей: историческая информатика в информационном обществе.Труды VII конференции АИК. М., 2001 52. Федотова Л.Н. Анализ содержания - социологический метод изучения средств массовой коммуникации. М., 2001 53. Федотова Л.Н. Контент-аналитические исследования средств массовой информации и пропаганды. М.: Изд-во Моск. ун-та, 1988 54. Французов С.А. Антропонимика Райбуна: опыт количиственного и качественного анализа. Вестник древней истории. №3 (262). М., 2007 55. Хьетсо Г., Густавсон С., Бекман Б., Гил С. Кто написал "Тихий Дон"? - М., 1989 56. Черепанова И.Ю. Заговор народа. Как создать сильный политический текст. М.: «КСП+», 2002 57. Чудинов А.П. Россия в метафорическом зеркале: когнитивное исследование политической метафоры (1991-2000). Екатеринбург, 2001 58. Шумилина Т.В. Методы сбора информации в журналистике. М., 1983 59. Эпштейн М.Н. Информационный взрыв и травма постмодерна // "Русский Журнал" 1998. http://old.russ.ru/journal/travmp/98-10-08/epsht.htm 60. Ядов В.А. Стратегия социологического исследования. Описание, объяснение, понимание социальной реальности. М., 1998 61. Язык и моделирование социального взаимодействия. М., 1987 35. 10 Материально техническое обеспечение дисциплины: Оргтехника: компьютерный класс, проектор, выход в Интернет, авторский комплект мультимедиа презентаций. Автор: Бочаров Алексей Владимирович – кандидат исторических наук, доцент кафедры истории древнего мира, средних веков и методологии истории ИФ ТГУ Рецензент: Ларьков Николай Семёнович – доктор исторических наук, профессор кафедры истории кафедры истории и документоведения ИФ ТГУ ТГУ Программа одобрена на заседании методической комиссии исторического факультета Председатель комиссии, доцент______________В.Ю. Соколов Протокол №___ от «___» __________________2010 г.