Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Национальный исследовательский университет "Высшая школа экономики" Факультет экономики Отделение статистики, анализа данных и демографии Программа дисциплины Прикладной экономический анализ на основе статистических пакетов SPSS, Stata и R для направления 080100.62 Экономика подготовки бакалавра Автор программы: Меликян Алиса Валерьевна, магистр, старший преподаватель, amelikyan@hse.ru Одобрена на заседании Департамента программной инженерии « Руководитель Департамента » __________ 2014 г. С.М. Авдошин Утверждена УС факультета экономики « » _____________ 2014 г. Ученый секретарь ________________________ Москва, 2014 Настоящая программа не может быть использована другими подразделениями университета и другими вузами без разрешения кафедры-разработчика программы. Национальный исследовательский университет «Высшая школа экономики» Программа дисциплины Прикладной экономический анализ на основе статистических пакетов SPSS, Stata и R для направления 080100.62 Экономика подготовки бакалавра Область применения и нормативные ссылки Настоящая программа учебной дисциплины устанавливает минимальные требования к знаниям и умениям студента и определяет содержание и виды учебных занятий и отчетности. Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления подготовки 080100.62 Экономика по специализациям «Демография» и «Статистика», изучающих дисциплину «Прикладной экономический анализ на основе статистических пакетов SPSS, Stata и R». Программа разработана в соответствии с: Рабочим учебным планом университета по направлению подготовки 080100.62 Экономика, утвержденным в 2014 г. 1 Цели освоения дисциплины Целями освоения дисциплины являются: - формирование у слушателей представления о некоторых возможностях анализа статистических данных посредством программ SPSS, Stata и R; - формирование практических навыков работы со статистическими данными в программах SPSS, Stata и R. 2 Компетенции обучающегося, формируемые в результате освоения дисциплины В результате освоения дисциплины студент должен: Знать - существующие в программах SPSS, Stata и R возможности анализа статистических данных. Уметь - осуществлять ввод данных и импорт данных в SPSS, Stata и R из разных источников; - осуществлять предварительную проверку и подготовку данных для последующей работы с ними в SPSS, Stata и R; - проводить анализ данных в SPSS, Stata и R; - экспортировать результаты анализа данных в другие программы; - интерпретировать результаты анализа в SPSS, Stata и R и представлять их в доступном для широкой аудитории виде. В результате освоения дисциплины студент осваивает следующие компетенции: Компетенция Способен самостоятельно работать на компьютере с использованием современного общего и профессионального прикладного ПО. Готов работать с информацией из различных источников. Код по Дескрипторы – основные признаки ФГОС/ освоения (показатели достижения НИУ результата) Формы и методы обучения, способствующие формированию и развитию компетенции ИК-1 Способен анализировать статистические данные с использованием программ SPSS, Stata и R. Практическая работа на компьютере с программами SPSS, Stata и R ИК- 4 Способен находить статистическую информацию в базах данных, обрабатывать данные для последующей работы с ними в Практическая работа по скачиванию статистической информации из некоторых баз данных, её об- Национальный исследовательский университет «Высшая школа экономики» Программа дисциплины Прикладной экономический анализ на основе статистических пакетов SPSS, Stata и R для направления 080100.62 Экономика подготовки бакалавра Код по Дескрипторы – основные признаки ФГОС/ освоения (показатели достижения НИУ результата) Компетенция SPSS, Stata и R. Способен собрать и проанализировать исходные данные, необходимые для расчета экономических и социально-экономических показателей, характеризующих деятельность хозяйствующих субъектов. 3 ПК-1 Способен осуществлять расчёт различного рода показателей на основе «сырых» данных. Формы и методы обучения, способствующие формированию и развитию компетенции работки в программах MS Excel, SPSS, Stata и R. Практическая работа на компьютере с программами SPSS, Stata и R Место дисциплины в структуре образовательной программы Настоящая дисциплина относится к циклу факультативных дисциплин. Для освоения учебной дисциплины, студенты должны владеть следующими знаниями и компетенциями: Знания основ математической статистики и теории вероятностей; Знания в объёме курса «Информатика» бакалаврской подготовки; Владение английским языком на среднем уровне. 4 Тематический план учебной дисциплины № Название раздела Всего часов Аудиторные часы ПрактиЛекСемические ции нары занятия 3 1 Самостоятельная работа 1 Введение в SPSS Statistics 8 2 Введение в Stata 8 1 3 4 3 Введение в R 8 1 3 4 4 Описательный анализ данных в SPSS, Stata иR Графический анализ данных в SPSS, Stata иR Эффективные приемы работы в SPSS и Stata Итого: 13 1 6 6 13 1 6 6 12 1 5 6 62 6 26 30 5 6 4 Национальный исследовательский университет «Высшая школа экономики» Программа дисциплины Прикладной экономический анализ на основе статистических пакетов SPSS, Stata и R для направления 080100.62 Экономика подготовки бакалавра 5 Формы контроля знаний студентов Тип контроля Текущий (неделя) Итоговый Форма контроля Контрольная работа 1 год 2 * Домашнее задание * Зачет + Параметры Работа на компьютере продолжительностью 60 минут Проведение анализа данных на основе предоставленной базы статистических данных Работа на компьютере продолжительностью 60 минут. Оценка результатов работы в течение 3ех дней. Критерии оценки знаний, навыков На текущем контроле студент должен продемонстрировать навыки редактирования данных в SPSS, Stata и R и навыки работы с методами анализа данных, рассмотренными за пройденный период обучения. 5.1 На итоговом контроле студент должен продемонстрировать навыки самостоятельного поиска метода анализа в SPSS, Stata и R , который должен быть применим для решения поставленного вопроса, интерпретации и представления результатов анализа, формулировки выводов на основе проведённого анализа данных. Оценки по всем формам текущего контроля выставляются по 10-ти балльной шкале. При проведении контроля студентам раздаются задания и пересылаются по электронной почте базы статистических данных. Анализ данных в SPSS, Stata и R позволит сформулировать ответы на вопросы задания. 6 Содержание дисциплины Раздел 1. Введение в SPSS Statistics В разделе рассматривается реализация в SPSS различных задач посредством активации команд через меню и с использованием синтаксиса. ♦ Содержание раздела: Версии статистического пакета SPSS; Среда SPSS (редактор данных, окно вывода, разделы меню, панели инструментов, открытие и сохранение файлов); Встроенный в программу учебник и система помощи. Ввод данных; Кодирование данных, кодировочная таблица, характеристики и типы переменных; Национальный исследовательский университет «Высшая школа экономики» Программа дисциплины Прикладной экономический анализ на основе статистических пакетов SPSS, Stata и R для направления 080100.62 Экономика подготовки бакалавра Экспорт/импорт данных; Слияние и расщепление файлов данных; Проверка данных; Редактирование данных; Подготовка данных к анализу; Модификация данных (перекодирование, вычисление новых переменных, агрегирование данных, ранговые преобразования); Создание наборов переменных; Отбор данных; Сортировка данных; Работа с выходными результатами, преобразование таблиц и графиков для оформления отчетов в текстовых редакторах; Работа с мобильными таблицами. Раздел 2. Введение в Stata В разделе рассматривается реализация в Stata различных задач посредством активации команд через меню и через командную строку. ♦ Содержание раздела: Версии статистического пакета Stata; Среда Stata; Встроенный в программу учебник и система помощи. Ввод данных; Кодирование данных, кодировочная таблица, характеристики и типы переменных; Экспорт/импорт данных; Слияние и расщепление файлов данных; Проверка данных; Редактирование данных; Подготовка данных к анализу; Модификация данных (перекодирование, вычисление новых переменных, агрегирование данных, ранговые преобразования); Создание наборов переменных; Отбор данных; Сортировка данных; Работа с выходными результатами, преобразование таблиц и графиков для оформления отчетов в текстовых редакторах. Раздел 3 Введение в R ♦ Содержание раздела: Среда R; Ввод данных; Подготовка данных в работе; Сохранение результатов работы; Типы данных в R и принципы работы с ними; Экспорт/импорт данных; Редактирование данных; Модификация данных; Работа с выходными результатами, преобразование таблиц и графиков для оформления отчетов в текстовых редакторах. Национальный исследовательский университет «Высшая школа экономики» Программа дисциплины Прикладной экономический анализ на основе статистических пакетов SPSS, Stata и R для направления 080100.62 Экономика подготовки бакалавра Раздел 4 Описательный анализ данных в SPSS, Stata и R В разделе рассматривается проведение описательного анализа данных в статистических пакетах SPSS, Stata и R. ♦ Содержание раздела: Частотный анализ; Подсчёт статистических характеристик (мода, медиана, среднее арифметическое, дисперсия и среднее квадратичное отклонение, стандартная ошибка среднего, доверительный интервал, квартили, межквартальная широта, симметричность и заострённость распределения); Основные типы шкал и соответствующие им меры средней тенденции и меры разброса; Нормальное распределение, Z-стандартизация, тест Колмогорова-Смирнова; Работа с многовариантными вопросами. Формулировка гипотез. Этапы проверки гипотез; Уровень значимости и ошибка первого рода; Таблица сопряжённости; Исследование взаимосвязи между переменными с помощью критерия Хи-квадрат. Раздел 5 Графический анализ данных в SPSS, Stata и R В разделе рассматривается создание и редактирование различных типов графиков в статистических пакетах SPSS, Stata и R. ♦ Содержание раздела: Cтолбчатая диаграмма: простая, кластеризованная, состыкованная; Линейчатая диаграмма: простая, сложная, связанная; Диаграмма с областями: простая и состыкованная; Круговая диаграмма; Диаграмма максимальных и минимальных значений; Простая биржевая диаграмма — потолок-пол-закрытие; Кластеризованная диаграмма — максимум-минимум-закрытие; Линейчатая диаграмма разностей; Простые интервальные столбцы; Кластеризованные интервальные столбцы; Коробчатая диаграмма: простая и кластеризованная; Столбики ошибок: простые диаграммы величины ошибки и кластеризованные величины ошибки; Диаграммы рассеяния: простая, матричная, наложенная и трёхмерная; Диаграмма Парето; Контрольные карты; Гистограмма (с кривой нормального распределения); Диаграммы нормального распределения; Кривые ROC; Временные диаграммы и графики последовательностей; Диаграмма «ствол-лист»; Cетевой график. Национальный исследовательский университет «Высшая школа экономики» Программа дисциплины Прикладной экономический анализ на основе статистических пакетов SPSS, Stata и R для направления 080100.62 Экономика подготовки бакалавра Раздел 6 Эффективные приемы работы в SPSS и Stata В разделе рассматривается, как можно оптимизировать работу в SPSS и Stata с помощью командного языка. ♦ Содержание раздела: Автоматизация выполнения задач с помощью командного языка SPSS: работа с файлами при помощи синтаксиса, дополнительные возможности, доступные через синтаксис; Управление параметрами работы в SPSS; Полезные возможности в SPSS; Представление данных в SPSS Custom Tables: построение простых и сложных таблиц с помощью визуального конструктора таблиц, создание сложных таблиц с комбинированными статистиками, управление внешним видом таблиц; Использование *.do-файлов для автоматизации работы в Stata; Построение циклов в Stata. 7 Образовательные технологии Работа с реальными базами данных, интерпретация результатов анализа данных в статистических пакетах SPSS, Stata и R. В рамках курса используются следующие ресурсы: - Российский мониторинг экономического положения и здоровья населения; - Единый архив экономических и социологических данных; - Всемирное исследование ценностей (World Values Survey); - Базы данных ОЭСР и Всемирного банка. 8 Порядок формирования оценок по дисциплине Преподаватель оценивает работу студентов на семинарских и практических занятиях: активность при ответе на вопросы преподавателя, правильность выполнения заданий на семинарах. Оценки за работу на семинарских и практических занятиях преподаватель выставляет в рабочую ведомость. Накопленная оценка по 10-ти балльной шкале за работу на семинарских и практических занятиях определяется перед промежуточным или итоговым контролем - Оаудиторная. Преподаватель оценивает самостоятельную работу студентов: правильность выполнения домашних работ. Оценки за самостоятельную работу студента преподаватель выставляет в рабочую ведомость. Накопленная оценка по 10-ти балльной шкале за самостоятельную работу определяется перед промежуточным или итоговым контролем – Осам. работа. Накопленная оценка за текущий контроль учитывает результаты студента по текущему контролю следующим образом: Отекущий = 0,5 * Ок/р + 0,5 * Одз; Способ округления накопленной оценки текущего контроля: в пользу студента. Результирующая оценка за итоговый контроль в форме зачета выставляется по следующей формуле, где Озачет – оценка за работу непосредственно на зачете: Национальный исследовательский университет «Высшая школа экономики» Программа дисциплины Прикладной экономический анализ на основе статистических пакетов SPSS, Stata и R для направления 080100.62 Экономика подготовки бакалавра Оитоговый = 0,4·Озачет + 0,2·Отекущий + 0,2·Осам. работа + 0,2·Оаудиторная) Способ округления накопленной оценки итогового контроля в форме зачета: в пользу студента. На пересдаче студенту не предоставляется возможность получить дополнительный балл для компенсации оценки за текущий контроль. На зачете студент может получить дополнительную практическую задачу, которая оценивается в 1 балл. Таким образом, результирующая оценка за итоговый контроль в форме зачета, получаемая на пересдаче, выставляется по формуле Оитоговый = (0,4·Озачет + 0,2·Отекущий + 0,2·Осам. работа + 0,2·Оаудиторная) + Одоп.вопрос В диплом выставляет результирующая оценка по учебной дисциплине, которая формируется по следующей формуле: Одисциплина = Оитоговый Способ округления результирующей оценки по учебной дисциплине: в пользу студента. В диплом ставится оценка за итоговый контроль, которая является результирующей оценкой по учебной дисциплине. 9 9.1 Учебно-методическое и информационное обеспечение дисциплины Основная литература Бююль А., Цефель П. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. СПб.: ООО «ДиаСофтЮП», 2002. Крыштановский А.О. Анализ социологических данных с помощью пакета SPSS - М.: Изд.дом ГУ ВШЭ, 2006. Колесников С., “Прикладной эконометрический анализ в статистическом пакете Stata”, КЛ/2001/003, в 2-ч частях, РЭШ, 2001. Таганов Д.Н. SPSS: Статистический анализ в маркетинговых исследованиях. – СПб.: Питер, 2005 Шипунов, Алексей Борисович et al. (2012). Наглядная статистика. Используем R! Москва: ДМК Пресс. Field A. Discovering Statistics Using SPSS (2nd edition). London: Sage, 2005. Kremelberg D. Practical statistics: a quick and easy guide to IBM SPSS Statistics, STATA, and other statistical software. Los Angeles [etc.]: Sage Publications, 2011. 9.2 Дополнительная литература Доугерти К. Введение в эконометрику: Учебник. М.: ИНФРА-М, 1999. Гл. 2. С. 53–72. Моосмюллер, Г. Маркетинговые исследования с SPSS. М. ИНФРА-М, 2011. - 199 с. Национальный исследовательский университет «Высшая школа экономики» Программа дисциплины Прикладной экономический анализ на основе статистических пакетов SPSS, Stata и R для направления 080100.62 Экономика подготовки бакалавра Ратникова Т.А. Анализ панельных данных в пакете STATA. Методические указания к компьютерному практикуму по курсу «Эконометрический анализ панельных данных». М.: ГУ ВШЭ, 2005. Baum, C. An Introduction to Modern Econometrics Using Stata, Stata Press, 2006. Bivand, R. S. Applied spatial data analysis with R. Springer, 2008. Burns R., Burns R. Research Methods http://www.uk.sagepub.com/burns/chapters.htm and Statistics using SPSS Cameron C., Trivedi P. Microeconometrics Using Stata. A Stata Press Publication, 2009. Cohen, Y. Statistics and data with R. John Wiley & Sons, 2008. Greasley P. Quantitative Data Analysis Using SPSS. An Introduction for Health & Social Science. New York: Open University Press, 2008. Griffith A. SPSS For Dummies (2nd Edition). Wiley Publishing Inc., 2010. Hamilton, L. Statistics with Stata. Updated for Version 10. Brooks/Cole Cencage Learning, 2009. Maindonald, J. Data analysis and graphics using R. Cambridge [etc.] Cambridge University Press, 2010. Marija J. Norušis. IBM SPSS Statistics http://www.norusis.com/pdf/SPC_v19.pdf 19 Statistical Procedures Companion Mitchell, M. N. Data management using Stata: a practical handbook. Stata press, 2010. Morgan, G. A. IBM SPSS for introductory statistics. London; New York Routledge, 2011. Longest, K. C. Using Stata for quantitative analysis. Los Angeles [etc.] SAGE Publications, 2012. Robert H. Handbook of Univariate and Multivariate Data Analysis and Interpretation with SPSS. Chapman & Hall/CRC Taylor & Francis Group, 2006. Wagner III, W. E. Using SPSS for social statistics and research methods. London Pine Forge Press, 2010. Программные средства Для успешного освоения дисциплины, студент использует статистические пакеты SPSS, Stata и R. 9.3 Автор программы: _______________________/Меликян А.В./ amelikyan@hse.ru