«Методы обработки данных в политологии» (2009 – 2010 уч. год) Вопросы и задания к проверочной работе №1 Что такое статистика (не как наука, а в узком смысле: «статистика Уилкоксона», «статистика Стьюдента» и т.п.) Что такое квантиль, квартиль и медиана Найти квартили и медиану по имеющейся выборке Найти межквартильный размах по имеющейся выборке Построить «ящик с усами», различая максимальное/минимальное значения и т.н. “inner fence” Найти выбросы и «подозрительные» наблюдения с помощью «ящика с усами» Что такое функция распределения? Дать определение Написать формулу функции распределения и плотности вероятности произвольного нормального распределения, стандартного нормального распределения. Построить эмпирическую функцию распределения по имеющейся выборке Проверить нормальность выборки с помощью нормальной вероятностной бумаги, применяя обратное преобразование Лапласа Вычислить по имеющейся выборке статистику критерия Колмогорова-Смирнова Дать определение распределению Стьюдента (через стандартные нормальные величины) Дать определение распределению «хи-квадрат» (через стандартные нормальные величины) Вывести распределение среднего арифметического нормальной выборки Выразить несмещенную выборочную оценку дисперсии через саму дисперсию и хиквадрат (в случае нормального распределения) Доказать, что статистика критерия Стьюдента для одной нормальной выборки имеет при верности нулевой гипотезы распределение Стьюдента. Уметь формулировать критерии: Уилкоксона, Стьюдента, Колмогорова-Смирнова Уметь объяснить, почему в мат.статистике гипотезы можно отвергать или не отвергать, но нельзя принимать. Уметь объяснить (словами и формулой), что такое «минимальный уровень значимости» (по-английски “p-value”) Почему критерий Стьюдента для 2 выборок не следует применять, когда выборки не нормальны? Уметь придумать 2 задачи из области социально-гуманитарного знания, в которых требуется применить критерий Стьюдента для 2 выборок. Следует ли ожидать нормальности выборок в Ваших задачах? Почему? (О том, когда следует ожидать нормальность, см. в последнем издании учебника Ю.Н. Тюрина и А.А. Макарова «Анализ данных на компьютере», стр. 68) Часто данные об уровне дохода описываются логнормальным распределением. Что нужно сделать с данными, чтобы можно было сравнить по уровню доходов две группы стран с помощью критерия Стьюдента для 2 выборок? «Методы обработки данных в политологии» (2009 – 2010 уч. год)