Анализ данных - 1 - Высшая школа экономики

реклама
Министерство экономического развития и торговли
Российской Федерации
Государственный Университет
Высшая школа экономики
Программа дисциплины
АНАЛИЗ СОЦИОЛОГИЧЕСКИХ ДАННЫХ-1
Для направления 040200.62 "Социология"
(подготовки бакалавра)
Автор программы: Рыжова А.В.
Рекомендована секцией УМС
__Социология_______________
Председатель
_Ледяев В.Г.________________
«_20__» __ноября_______ 2008 г.
Одобрена на заседании кафедры
Методов сбора и анализа социологической
информации
Зав. кафедрой
д.с.н., проф. Толстова Ю.Н.
«_09__» _сентября______ 2008 г.
Утверждена УС
факультета Социологии
Ученый секретарь
______________________________
«_____» __________________ 200 г.
Москва
ОРГАНИЗАЦИОННО-МЕТОДИЧЕСКИЙ РАЗДЕЛ
1.1. ЦЕЛИ КУРСА:
- изучение современных математико-статистических методов анализа
данных;
- освоение программных средств обработки и анализа социологической
информации на компьютере;
- анализ специфики использования методов математики и статистики для
изучения социальных явлений и особенности интерпретации результатов
анализа социологических данных.
1.2. ЗАДАЧИ КУРСА:
- разбор возможностей и ограничений основных методов одномерного и
многомерного статистического анализа социологических данных;
- формирование у студентов практических навыков использования
компьютерных программ анализа социологических данных на примерах
конкретных массивов результатов социологических исследований..
1.3. МЕТОДИЧЕСКАЯ НОВИЗНА КУРСА (НОВЫЕ МЕТОДИКИ, ФОРМЫ РАБОТЫ,
АВТОРСКИЕ ПРИЕМЫ В ПРЕПОДАВАНИИ КУРСА)
В рамках курса каждый из математико-статистических методов анализа
данных рассматривается с точки зрения возможности решения тех или иных
социологических задач. Разбор всех рассматриваемых методов в процессе
лекционных занятий происходит и использованием мультимедийной техники на
основе данных конкретных социологических исследований.
В целях освоения технических приемов работы с компьютерными
программами статистического анализа данных (SPSS) после каждой лекции
студентам дается небольшое задание для самостоятельной работы. Выполнение
этих заданий контролируется в ходе семинарских занятий.
1.4. МЕСТО КУРСА В СИСТЕМЕ СОЦИОГУМАНИТАРНОГО ОБРАЗОВАНИЯ
Курс
читается студентам бакалавриата направления “Социология” в 4-5
семестрах. Курс рассчитан на студентов, прослушавших базовые курсы
математики, теории вероятностей и математической статистики, а также основ
социологии и методов социологических исследований с целью углубления
теоретических и практических знаний в области интерпретации и анализа
социологической информации.
1.5. ПРЕДВАРИТЕЛЬНЫЙ УРОВЕНЬ ПОДГОТОВКИ.
Для успешного освоения материала данного курса студенты должны
прослушать следующие курсы:
-
математический анализ и линейная алгебра;
информатика;
теория вероятностей и математическая статистика;
математико-статистические модели в социологии;
основы социологии.
1.6. ТРЕБОВАНИЯ К УРОВНЮ ОСВОЕНИЯ СОДЕРЖАНИЯ КУРСА
По окончании данного курса студенты должны уметь применять
следующие методы и методики анализа и интерпретации социологической
информации:
1. Построение и анализ таблиц сопряженности с помощью различных
коэффициентов связи.
2. Анализ взаимосвязи качественных и количественных переменных с
помощью теста Стьюдента и модели однофакторного дисперсионного
анализа.
3. Построение моделей множественной и логистической регрессии.
4. Использование подходов поиска «латентных переменных» методами
факторного анализа и главных компонент.
5. Обработка данных с целью получения многомерных группировок с
помощью кластерного анализа.
6. Знание основных приемов и подходов в модели неметрического
многомерного шкалирования.
По каждому из перечисленных методов студенты должны уметь:
1. Выбрать наиболее адекватный метод для решения поставленной
социологической задачи.
2. Определить и обосновать необходимый формат предлагаемой
математической модели.
3. Проанализировать выполнение ограничений модели и предложить
схему преодоления в случае нарушения этих ограничений.
4. Выполнить расчеты модели на компьютере.
5. Проанализировать математико-статистический смысл полученных
результатов.
6. Дать социологическую интерпретацию построенной модели.
3
ТЕМАТИЧЕСКИЙ ПЛАН УЧЕБНОЙ ДИСЦИПЛИНЫ
NN
Тема 1
Тема 2
Тема 3
Тема 4
Тема 5
Тема 6
НАЗВАНИЯ ТЕМ
Подготовка к анализу
данных. Описательная
статистика.
Анализ статистических
взаимосвязей
Анализ взаимосвязей
качественных и
количественных
переменных.
Использование моделей
множественной регрессии
для анализа
социологических данных
Модели латентных
переменных.
Модели многомерной
классификации в
социологии.
Итого
ВСЕГО
(ЧАСОВ)
АУДИТОРНЫЕ ЗАНЯТИЯ
(В ЧАСАХ)
САМОСТОЯТЕЛЬНАЯ
РАБОТА
лекции
семинары
22
8
8
6
25
9
10
6
18
6
6
6
32
12
10
10
30
12
10
8
35
162
14
61
14
58
7
43
БАЗОВЫЙ УЧЕБНИК
Крыштановский А.О. Анализ социологических данных. Москва, Изд-во ГУВШЭ, 2006
ФОРМЫ ИТОГОВОГО КОНТРОЛЯ.
В процессе работы над курсом студенты должны будут выполнить серию
домашних заданий; в конце 4 модуля (т.е. после двух третей курса)
предполагается зачет, в конце 5модуля (т.е. после окончания курса) - экзамен.
Оценка за зачет и экзамен складывается следующим образом:
- общий балл за домашние задания и активность на семинарах
50%;
- оценка за зачет (экзамен)
50%.
4
СОДЕРЖАТЕЛЬНЫЙ РАЗДЕЛ
2.1. ТЕМЫ И КРАТКОЕ СОДЕРЖАНИЕ.
ЧАСТЬ
1. ПОДГОТОВКА К АНАЛИЗУ ДАННЫХ. ОПИСАТЕЛЬНАЯ
СТАТИСТИКА.
Тема 1. Основные понятия измерения данных в социологии. Уровни измерения:
номинальный, порядковый и интервальный. Примеры измерения с помощью
различных шкал.
Тема 2 . Данные на мониторе компьютера. Элементы описания переменной:
имя переменной, метка переменной, метки значений, коды пропущенных
значений, тип переменной, формат записи ответов.
Тема 3. Меры средней тенденции. Их содержательный смысл. Меры средней
тенденции и их точечные оценки (математическое ожидание, процентили,
мода).
Тема 4. Меры разброса и их точечные оценки (дисперсия, среднее квадратичное
отклонение, среднее абсолютное отклонение, квантильный размах,
коэффициент качественной вариации, энтропия). Возможность расчета тех и
других для признаков, измеренных по разным шкалам.
Тема 5. Переход от точечных к интервальным оценкам. Принципы построения
интервальных оценок.
Основная литература
1. Крыштановский А.О. Анализ социологических данных. Москва, Изд-во ГУВШЭ, 2006. с. 10-38
2. Девятко И.Ф. Методы социологического исследования. Екатеринбург, Изд-во
Урал. ун-та, 1998, с. 158-171.
3. Татарова Г.Г. Методология анализа данных в социологии. М., Издательский
дом “Стратегия”, 1998, с.126-143.
4. Толстова Ю.Н. Измерение в социологии. М.: Инфра-М, 1998
5
5.
Толстова
Ю.Н.
Анализ
социологических
данных:
Методология,
дескриптивная статистика, изучение связей между номинальными признаками:
Учеб. пособие. - М.: Научный мир, 2000. Дополнительная литература:
1.
Статистические
методы
анализа
информации
в
социологических
исследованиях. М., 1979, Наука, с.41-68.
2. Паниотто В.И., Максименко В.С. Количественные методы в социологических
исследованиях, Киев: Наукова думка, 1982
3. Cramer D. Introducing Statistics for Social Research. 1994
4. Dometrius N.C. Social Statistics Using SPSS., 1992
5. Marsh C. Exploring Data. Polity Press, 1988
ЧАСТЬ 2. АНАЛИЗ СТАТИСТИЧЕСКИХ ВЗАИМОСВЯЗЕЙ.
Тема 1. Таблица сопряженности как инструмент анализа взаимосвязи. Методы
получения различных типов процентов, их познавательные возможности.
Тема 2. Коэффициент хи-квадрат и производные от него. Ограничения
возможности работы с хи-квадрат. Коэффициенты сопряженности ГудменаКраскала.
Тема 3. Коэффициенты ранговой корреляции, их специфика и познавательные
возможности.
Основная литература:
1. Крыштановский А.О. Анализ социологических данных. Москва, Изд-во ГУВШЭ, 2006. с. 39-82
2. Аптон Г. Анализ таблиц сопряженности. М., Финансы и статистика, 1982,
с.16-40
3. Интерпретация и анализ данных в социологических исследованиях. М.,
Наука, 1987, с.25-52.
6
4.
Толстова
Ю.Н.
Анализ
социологических
данных:
Методология,
дескриптивная статистика, изучение связей между номинальными признаками:
Учеб. пособие. - М.: Научный мир, 2000. Дополнительная литература:
1.
Статистические
методы
анализа
информации
в
социологических
исследованиях. М., 1979, Наука, с.92-128.
2. Татарова Г.Г. Методология анализа данных в социологии. М., Издательский
дом “Стратегия”, 1998, с.144-186.
3. Gibbons J.D. Nonparametric measures of association. //Sage univ. paper, N91,
1993
4. Marsh C. Exploring Data. 1988, pp.123-142
5. Walsh A. Statistics for the Social Sciences. 1990, Chapter 10, pp. 188-212
6. Cramer D. Introducing Statistics for Social Research. 1994, Chapter 9, pp.186-215
ЧАСТЬ
3.
АНАЛИЗ
ВЗАИМОСВЯЗЕЙ
КАЧЕСТВЕННЫХ
И
КОЛИЧЕСТВЕННЫХ ПЕРЕМЕННЫХ.
Тема 1. Сопоставление средних значений количественной переменной в
нескольких подвыборках. Проверка статистических гипотез о равенстве
средних. Тест Стьюдента в ситуациях одинаковых и различающихся дисперсий.
Тема 2. Статистическая модель однофакторного дисперсионного анализа.
Познавательные
возможности
и
специфика
использования
метода
дисперсионного анализа в социологии.
Тема 3. Возможности работы с методами множественных сравнений. Влияние
предположения о равенстве дисперсий на работу методов множественных
сравнений.
Тема 4. Статистические модели многофакторного дисперсионного анализа.
Основная литература:
7
1. Крыштановский А.О. Анализ социологических данных. Москва, Изд-во ГУВШЭ, 2006. с. 82-114
2. Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ.,
М., Мир, 1982, с.222-308
3.
Статистические
методы
анализа
информации
в
социологических
исследованиях. М., 1979, Наука, с.178-194.
4. Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютере.
М., “ИНФРА-М”, 1998, с.191-244.
Дополнительная литература:
1. Iversen G.I., Norpoth H. Analysis of variance. /Sage Univ. paper, 1, 1976
2. Bray J.H., Maxwell S.E. Multivariate analysis of variance. /Sage Univ. paper,
54, 1985
ЧАСТЬ 4. ИСПОЛЬЗОВАНИЕ МОДЕЛЕЙ МНОЖЕСТВЕННОЙ РЕГРЕССИИ
ДЛЯ АНАЛИЗА СОЦИОЛОГИЧЕСКИХ ДАННЫХ.
Тема
1.
Общее
описание
модели
парной
регрессии.
Интерпретация
регрессионных коэффициентов. Оценка качества модели. Ограничения модели
регрессии: нормальность распределения остатков и гомоскедастичность.
Возможности выявления выпадающих наблюдений (“выбросов”).
Тема 2. Общее описание модели множественной регрессии. Проверка
значимости влияния на отклик отдельных предикторов и их групп.
Стандартизованные коэффициенты регрессии. Ограничения модели регрессии:
мультиколлинеарность.
Тема 3. . Регрессионная модель с использованием фиктивных переменных.
Интерпретация регрессионных коэффициентов для фиктивных переменных.
Понятие контрольной группы. Интерпретация регрессионной модели при
одновременном использовании метрических и фиктивных переменных.
Тема 4. Логистическая регрессия (логит-анализ). Линейная вероятностная
модель. Отношение преобладаний и логит.
Регрессионное уравнение с
8
использованием логита. Интерпретация регрессионных коэффициентов. Оценка
качества модели с помощью метода максимума правдоподобия.
Основная литература:
1. Крыштановский А.О. Анализ социологических данных. Москва, Изд-во ГУВШЭ, 2006. с. 115-190
2. Доугерти К. Введение в эконометрику. М., ИНФРА-М, 1999, с.53-114, с.134217, с.262-287.
3. Интерпретация и анализ данных социологических исследований. М., Наука,
1987, с.153-172.
4. Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютере.
М., “ИНФРА-М”, 1998, с.245-284.
Дополнительная литература:
1.
Статистические
методы
анализа
информации
в
социологических
исследованиях. М., 1979, Наука, с.178-194.
2. Schroeder D.S., Sjoquist D.L., Stephan P.E. Understanding Regression Analysis.
Sage University Paper series on Quantitative Applications in the Social Sciences, N57
3. Berry W.D. Understanding Regression Assumptions. Sage University Paper series
on Quantitative Applications in the Social Sciences, N92
4. Hardy M.A. Regression with dummy variables. Sage University Paper series on
Quantitative Applications in the Social Sciences, N93
5. Walsh A. Statistics for the Social Sciences. 1990, pp.273-284
ЧАСТЬ 5. МОДЕЛИ ЛАТЕНТНЫХ ПЕРЕМЕННЫХ.
Тема 1. Модель факторного анализа как модель латентных переменных.
Различные подходы к определению числа факторов. Процент объясненной
дисперсии как показатель качества факторной модели.
Тема 2. Сравнение различных моделей факторного анализа - метод главных
компонент, метод альфа, метод максимального правдоподобия.
9
Тема 3. Индивидуальные значения факторов. Сохранение факторов как новых
переменных. Вращение матрицы факторных нагрузок. Ортогональные и
неортогональные методы вращения.
Основная литература:
1. Крыштановский А.О. Анализ социологических данных. Москва, Изд-во ГУВШЭ, 2006. с. 191-205
2.
Статистические
методы
анализа
информации
в
социологических
исследованиях. М., 1979, Наука, с.212-266.
3. Факторный, дискриминантный и кластерный анализ. М., Финансы и
статистика, 1989.
4. Интерпретация и анализ данных социологических исследований. М., Наука,
1987, с.215-251.
Дополнительная литература:
1. Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ.,
М., Мир, 1982, с.354-379.
2. Харман Г. Современный факторный анализ. М., Статистика, 1972.
3. Kim, Muller.
Factor analysis //Sage University Paper series on Quantitative
Applications in the Social Sciences, N14
4. Dunteman. Principle Component Analysis //Sage University Paper series on
Quantitative Applications in the Social Sciences, N69
5. Walsh A. Statistics for the Social Sciences. 1990, pp.329-337
6. Kline P. An easy guide to factor analysis. //Routledge, London & N.Y., 1994
ЧАСТЬ 6. МОДЕЛИ МНОГОМЕРНОЙ КЛАССИФИКАЦИИ В СОЦИОЛОГИИ.
Тема 1. Возможности использования моделей кластерного анализа в
социологии. Особенности работы алгоритмов CLUSTER и QUICK CLUSTER.
Проблемы выбора расстояния и формы кластера. Иерархические алгоритмы
кластеризации.
Тема 2. Проблемы выбора расстояния и формы кластера. Целесообразность
выбора
различных
функций
расстояния
для
решения
различных
социологических задач.
10
Тема 3. Сохранение номера кластера как новой переменной. Проблема
устойчивости кластеризации. Методы оценки устойчивости. Описание и
интерпретация результатов кластеризации.
Тема 4. Кластеризация переменных. Сопоставление метода кластеризации
переменных с факторным анализом.
Тема 5. Модель дискриминантного анализа как метод классификации.
Тема 6. Возможности использования многомерного шкалирования для решения
социологических задач. Характеристика метода, необходимые параметры.
Метрическое и неметрическое многомерное шкалирование.
Основная литература:
1. Крыштановский А.О. Анализ социологических данных. Москва, Изд-во ГУВШЭ, 2006. с. 205-223
2. Анализ и интерпретация данных в социологических исследованиях. М.,
Наука, 1987, с.173-214.
3.
Статистические
методы
анализа
информации
в
социологических
исследованиях. М., 1979, Наука, с.195-211.
4. Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ.,
М., Мир, 1982, с.344-354.
Дополнительная литература:
1. Факторный, дискриминантный и кластерный анализ. М., Финансы и
статистика, 1989.
2. Aldenderfer M.S., Blashfield R.K. Cluster analysis. //Sage univ.paper, N44 1984.
3. Afifi A.A., Clark V. Computer-Aided multivariate analysis //2-nd ed., 1990, pp.
429-462.
4. Arabie P., Carroll J.D., DeSabro W.S. Three-way scaling and clustering.//Sage
univ. paper, N65, 1987.
Автор программы: ___________________________/Рыжова А.В./
11
Скачать