НИУ ВШЭ, 2013/14, «Математические основы компьютерной лингвистики» Магистратура отделения лингвистики, 2013/14 уч. год Математические основы компьютерной лингвистики Задачи по статистике (14 января 2014) Д. А. Филимонов Нам потребуется определить 𝛼-квантиль — это часть выборки с самыми маленькими значениями, составляющая долю 𝛼 от всей выборки. Определение 1. Рассмотрим выборку {𝑥0 , 𝑥2 , . . . , 𝑥𝑁 −1 }. (Мы начинаем нумерацию с нуля, в выборке 𝑁 элементов.) Перенумераем элементы в выборке по возрастанию. Обозначим то, что получится, через {𝑣0, 𝑣1, . . . , 𝑣𝑁 −1}. Пусть 𝛼 — доля (число от 0 до 1). Обозначим через 𝐾 нижнее целое от 𝛼 · (𝑁 − 1) (то есть максимальное целое число, не превосходящее 𝛼 · (𝑁 − 1)). Тогда ∙ при 𝐾 + 1 < 𝛼𝑁 , 𝛼-квантиль = 𝑣𝐾+1 ∙ при 𝐾 + 1 = 𝛼𝑁 , 𝛼-квантиль = (𝑣𝑘 + 𝑣𝐾+1 )/2 ∙ при 𝐾 + 1 > 𝛼𝑁 , 𝛼-квантиль = 𝑣𝐾 . Задача 1. Пусть дана выборка {2, 4, 1, 3, 2, 4}. (a) найти медиану и первый и третий квартили; (b) найти 0.3-квантиль и 0.9-квантиль; Задача 2. Пусть дана выборка {−5, −3, 0, 4, 4.1, 4.2, 3.9, 4.4, 3.7, 4}. (a) найти медиану и первый и третий квартили; (b) найти 0.3-квантиль и 0.9-квантиль; Задача 3. Пусть дана выборка {2, 0, 4, 2, 1, 3, 2, 2, 1, 2} из значений биномиальной случайной величины 𝜉. (a) Найти оценки для математического ожидания и дисперсии; (b) Найти оценку для вероятности удачи в одном опыте 𝑝; (c) Найти оценку для количества испытаний; Задача 4. Пусть дана выборка {2, 9; 2, 4; 1, 6; 1, 9; 2, 6; 1, 6; 2, 3; 1; 2, 4; 1, 7} из значений равномерной случайной величины 𝜉. (a) Найти оценки для математического ожидания и дисперсии; (b) Найти оценки для границ отрезка (Подсказка: вспомнить, как выражаются математическое ожидание и дисперсия через границы отрезка для равномерного распределения); Д. А. Филимонов 1