Министерство экономического развития и торговли Российской Федерации Государственный университет – Факультет прикладной политологии Программа дисциплины Компьютерные технологии в политической науке и образовании для направления 030200.68 «Политология» (третья ступень высшего профессионального образования - магистратура) Авторы Белоусова С.Н. и Бессонова И.А. Одобрена на заседании кафедры основ информатики и прикладного программного обеспечения Зав. кафедрой _____________ “___” _____ _____ 2007 г. «Утверждаю» Проректор _______________________ “___” __________ 2007 г. Москва 2007 2 Требования к студентам Приступая к изучению дисциплины, слушатель должен быть знаком с основами математической статистики и теории вероятностей. Данный курс не заменяет стандартного курса статистики. Дисциплина рассчитана на 42 учебных часа, которые включают в себя лекционную часть (24 часов), практическую работу с пакетом SPSS (18 часов) и самостоятельные занятия (28 часов). На практических занятиях слушатели учатся анализировать статистические данные с помощью пакета SPSS для решения задач политологии. Цель изучения дисциплины: 1) познакомить слушателей с основными понятиями и областью применения системы SPSS; 2) дать слушателям целостное представление о возможностях анализа данных в системе SPSS; 3) научить основам работы с различными типами исходной информации, исследованию взаимосвязей между данными и проведению анализа данных. Учебная задача дисциплины В результате изучения дисциплины слушатель должен 1) иметь представление о возможностях пакета SPSS в части решения задач с использованием различных методов статистического анализа; 2) знать способы анализа статистических данных с помощью регрессионного, кластерного и факторного анализа данных; 3) уметь самостоятельно проводить обработку информации для дальнейшей работы с ней в SPSS и анализировать скрытые закономерности в данных; 4) обладать навыками работы в SPSS для решения проблем, возникающих при проведении анализа информации. Формы контроля Текущий контроль - Работа на практических занятиях (выполнение заданий на компьютере) - Эссе сдается для проверки на последнем занятии данного модуля (20 часов самостоятельных занятий) 3 Аудиторные часы Формы текущего контроля Самостоятельная работа Всего часов Курс, семестр, модуль Лекции Сем. и практ. занятия Всего 15 9 24 работа на занятии, домашнее задание 33 57 1,1,1 9 9 18 работа на занятии, 1 контрольная работа, домашнее задание 33 51 1,1,2 II. Тематический расчет часов Самост. Всего работа часов 2 0 2 Аудиторные занятия Номера и наименования тем Тема 1. Системы анализа Лекции Практическ. занятия 2 Всего учебных часов политических данных. Характеристика SPSS. Тема 2. Подготовка данных к 3 2 5 7 12 4 3 7 12 19 4 4 8 12 20 5 5 10 19 29 3 2 5 8 13 анализу. Редактирование данных. Тема 3. Описательные статистики.* Тема 4. Исследование взаимосвязей между данными. Проверка гипотез. Тема 5. Регрессионный анализ данных. Тема 6. Факторный анализ данных. 4 Аудиторные занятия Номера и наименования тем Лекции Тема 7. Кластерный анализ Практическ. занятия Самост. Всего работа часов Всего учебных часов 3 2 5 8 13 24 18 42 66 108 данных. Итого часов Формы контроля Текущий контроль - работа на практических занятиях; Промежуточный контроль - промежуточное тестирование по завершении первой части -25 мин. - эссе (30 часов самостоятельных занятий) Итоговый контроль Зачет. Структура итоговой оценки по учебной дисциплине: Формы работы Вклад в итоговую оценку (%) Работа на практических занятиях 30 Промежуточный тест 10 Эссе 30 Зачет 30 Все формы текущего, промежуточного и итогового контроля оцениваются по 10балльной шкале: 8-10 — «отлично» 6—7 — «хорошо» 4—5 —«удовлетворительно» 1—3 —«неудовлетворительно» 5 Структура учебного курса. Тема 1. Системы анализа данных. Характеристика SPSS. Обзор существующих систем хранения и анализа данных. Назначение и оболочка SPSS. Состав пакета, учебник, система помощи. Содержание и разделы главного меню. Окна вывода, окно редактирования данных. Панели инструментов. Характеристика диалоговых окон. Набор статистических методов, типы графиков. Тема 2. Подготовка данных к анализу. Редактирование данных.. Сбор данных. Выборка. Влияние объемов выборки на точность оценки. Подготовка данных к обработке: rодирование и кодировочные таблицы, создание матриц данных. Типы переменных. Загрузка данных в систему. Ввод данных, экспорт данных их других систем. Обнаружение ошибок ввода. Проверка данных на состоятельность. Модификация данных: вычисление переменных, аггрегирование данных, ранговые преобразования. Тема 3. Описательные статистики Исследование данных и их свойств: математическое ожидание, дисперсия и стандартное отклонение, вариации и формы распределения. Медиана. Вычисление описательных статистик для генеральной совокупности. Правило Бьенамэ-Чебышева. Тема 4. Исследование взаимосвязей между данными. Проверка гипотез. Разведочный анализ. Сравнение средних. Таблица сопряженности. Анализ множественных ответов. Непараметрические тесты. Измерение линейных связей, парная и частная корреляция. Тема 5. Регрессионный анализ данных Простая линейная регрессия. Множественная регрессия. Результаты множественной регрессии. Остатки и выбросы. Тема 6. Факторный анализ данных. Метод главных компонент. Метод главных факторов. Интерпретация факторов. Тема 7. Кластерный анализ данных. 6 Кластеризация наблюдений. Иерархические методы кластерного анализа. Партиционные методы кластерного анализа. Тематика заданий по различным формам текущего контроля: Примерное содержание заданий 1) Построить диаграмму Steam and Leaf, 2) Проанализировать основные характеристики распределения (мода, смещение и т.д.); 3) Построить и проанализировать ящичковую диаграмму, определить наличие выбросов и экстремумов; 4) Оценить близость распределения к нормальному на основе графика Normal Q-Q Plot, Q-Q Plot Detrended, критерия Колмогорова-Смирнова и следующих характеристик распределения: остроты пика, смещения и соотношения их величин и ошибок; 5) Оценить гетероскедастичность на основе графика Spread-versus-level и статистики Ливиня; 6) Построить таблицу сопряженности и определить наличие зависимости между переменными, тесноту и направление связи. 7) Построить уравнение регрессии и оценить параметры уравнения. 8) Найти факторы наиболее полно объясняющие наблюдаемые связи между перменными, имеющимися в наличии. 9) Сформировать группы наблюдений с помощью кластерного анализа. Тема эссе: На основе найденных в Интернет социологических данных по конкретному региону и проведенного по ним статистического анализа провести политический анализ этого региона. Базовой учебник 1. SPSS: искусство обработки информации. Анализ статичстических данных и восстановление скрытых закономерностей: Пер. с нем./ Ахим Бююль, Петер Цефель – СПб.: ООО «ДиаСофтЮП», 2002. Основная литература 1. Крыштановский А.О. Анализ социологических данных с помощью пакета SPSS - М.: Изд.дом ГУ ВШЭ, 2006. 2. Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы – М.: Финансы и статистика, 2000. 7 3. Макаров А.А., Тюрин Ю.Н. Статистический анализ на компьютере.- М.: Наука, 1997. Методические рекомендации (материалы) преподавателю: Методические материалы оформлены в виде приложения к программе. Методические указания студентам: Методические указания студентам приводятся в вариантах классных заданий домашнего задания. Автор программы: _____________________________/Белоусова С.Н../ Автор программы: _____________________________/Бессонова И.А./