Статистика и анализ данных Arkadi Bojaršinov arkadi.bojarsinov@mail.ee Программа курса • Объём курса: 5 контактных часов (1 EAP) • Основные темы: Введение в статистику. Coздание анкет. Типы вопросов, оценочные шкалы. Занесение данных в таблицу, кодирование данных. Обработка данных с помощью программы MS Excel. • Оценивание: Успешное выполнение домашней работы (свыше 50%) даёт зачёт. Чем занимается статистика? 1) Статистика занимается сбором, обработкой и анализом данных. 2) Статистика не только описывает нынешнюю ситуацию, но и даёт вероятный прогноз как ситуация будет развиваться в дальнейшем. 3) «Закон больших чисел» Методы сбора статистической информации КАЧЕСТВЕННЫЙ КОЛИЧЕСТВЕННЫЙ Методы Эксперимент, интервью, наблюдение, анализ документов Анкета, тест Философия Субъективная – исследователь оценивает явление или объект Данные Данные представлены словами, изображениями, объектами Объективная – исследуемое явление независимо от исследователя Данные представлены числами, в статистической форме Анализ результатов Трудоёмкий, вручную С помощью компьютерых программ Описательная и аналитическая статистики • Описательная статистика занимается описанием и анализом выборки (т.е. непосредственно исследуемых объектов) • Аналитическая статистика распространяет результаты измерения выборки на всю популяцию. Популяция и выборка • Популяция – все объекты, в отношении которых должны действовать установленные исследователем гипотезы и предположения. • Выборка – малая часть популяции, которая отбирается для исследования. Что считает выборка? (описательная статистика) ? Вероятность ошибки (0-5%) Какова вероятность что популяция считает так же? (аналитическая статистика) Аналитическая статистика… • Переносит результаты исследования выборки на всю популяцию. • Основной вопрос: насколько точно такое обобщение от малой части к целому? • Основные термины: статистическая вероятность, статистическая ошибка. Cohen & Manion, 2001 Популяция Размер выборки (5% ошибка) 50 44 100 79 200 132 500 217 1000 278 2000 322 5000 357 10 000 370 20 000 377 50 000 381 100 000 383 1000 000 384 Описательная и аналитическая статистики АНАЛИТИЧЕСКАЯ ОПИСАТЕЛЬНАЯ СТАТИСТИКА (анализ собранных данных) ! Составление анкет Создание е-анкет • • • • • Google form (www.google.ru) Webanketa (www.webanketa.com) E-formular (www.e-formular.com) www.connect.ee ZohoCreator (www.zohocreator.com) arvutiope.blogspot.com Открытые vs Закрытые вопросы • Ваше место жительства: ………………………………………………………………………………… ………………………………………………………………………………… • Ваше место жительства: город вне города Открытые vs Закрытые вопросы • Ваша зарплата: ………………………………………………… • Ваша зарплата до 300 EUR от 300 до 600 от 600 до 900 свыше 900 Открытые vs Закрытые вопросы Ваше любимое время года Зима Весна Лето Осень Ваше любимое блюдо: …………………………………………………………………………………….. Оценочные шкалы Правильная шкала Как оцениваете своё здоровье: 1 2 3 4 5 6 очень плохо 7 очень хорошо NB! Правильная оценочная шкала должна быть с равными интервалами, последовательна и симметрична Правильная шкала Как оцениваете своё здоровье: 1 2 очень плохо плохо 3 4 5 6 7 скорее плохо средне скорее хорошо хорошо очень хорошо Правильная шкала Как оцениваете своё здоровье: 1 плохо 2 скорее плохо 3 скорее хорошо 4 хорошо В чём проблема? Как оцениваете своё здоровье: 1 плохо 2 скорее плохо 3 скорее хорошо 4 очень хорошо В чём проблема? Как оцениваете своё здоровье: 1 2 3 4 5 очень плохо - плохо - затрудняюсь ответить – хорошо - очень хорошо В чём проблема? Как оцениваете своё здоровье: 1 2 3 4 средне скорее хорошо хорошо очень хорошо В чём проблема? Как оцениваете своё здоровье: 1 2 3 4 очень хорошо хорошо средне плохо 5 очень плохо Методы представления статистических данных 1. Текст – используйте текст, если вы хотите представить один-два числовых значения. 2. Таблицы - используйте таблицы, если вы хотите показать большое (или среднее) количество точных числовых данных. 3. Диаграммы – используйте диаграммы, если хотите дать быстрый обзор общих тенденций. Текст, примеры: • В группе 12 девочек и 9 мальчиков. • Было роздано 50 анкет, из них вернулуось 40. • Средняя зарплата за июнь 2010 составила 722,5 евро, а за июнь 2011 года 805,5 евро. • Из числа опрошенных мужчины составили 44% и женьщины 56%. Точные данные! Цвет глаз число процент зелёный 36 35,3% сниний 28 27,5% серый 26 25,5% карий 12 11,8% Всего 102 100,0% Общая тенденция! Обработка данных в Excel (таблицы) Стандартный вид таблицы Цвет глаз число процент зелёный 36 35,3% сниний 28 27,5% серый 26 25,5% карий 12 11,8% Всего 102 100,0% Любимое время года число процент лето 41 39,81% весна 23 22,33% зима 21 20,39% осень 18 17,48% Всего 103 60,19% Сопряжённые таблицы Тип темперамента число Женщины Mужчины процент число процент сангвиник 14 32,60% 20 33,90% холерик 13 30,20% 14 23,70% флегматик 9 20,90% 15 25,40% меланхолик 7 16,30% 10 16,90% 43 100,00% 59 100,00% Всего «Порядковая» таблица Строки располагаются в логическом порядке! Как часто смотрите телевизор? число процент часто 45 38,5% иногда 54 46,2% не смотрю 18 15,4% 117 100,0% Всего образование M Ж процент число процент число начальное 21 31,34% 17 34,00% среднее 24 35,82% 18 36,00% высшее 22 32,84% 15 30,00% Всего 67 100,00% 50 100,00% Средняя оценка за тест Пол Средняя оценка M 67,59 Ж 64,66 Спасибо!