ГЛОССАРИЙ 2 № п/п 1 1 Новые понятия 2 Метод сплошных наблюдений 2 Выборочный метод 3 Непрерывно распределенная величина 4 Плотность распределения вероятностей Генеральная совокупность Выборка (выборочная совокупность) 5 6 7 Репрезентативная выборка 8 9 Повторная выборка (выборка с возвратом) Бесповторная выборка (выборка без возврата) 10 Вариационный ряд 11 Накопленная частота 12 Накопленная относительная (эмпирическая) частота значения х Частота варианта 13 14 Размах вариационного ряда Содержание 3 метод статистического обследования, при котором производится измерение всех элементов совокупности метод статистического обследования, при котором из совокупности выбирают ограниченное число объектов и их подвергают изучению; применяется, когда количество объектов велико или сплошное обследование невозможно в силу того, что обследование может привести к уничтожению объекта (например, чтобы узнать качество консервов, банку надо вскрыть), то есть когда не хотят проводить полное обследование объекта случайная величина , для которой существует неотрицательная функция f(x), такая что для любого интервала (а,b) функция f(x) (см. п. 3 Глоссария) множество всех изучаемых объектов совокупность объектов, отобранных для исследования из генеральной совокупности выборка, которая производится так, что все объекты генеральной совокупности имеют одинаковую вероятность попасть в выборку такая выборка, для которой раз отобранный в выборку объект возвращается в генеральную совокупность и, следовательно, может быть отобран повторно такая выборка, для которой отобранный в выборку объект назад в генеральную совокупность не возвращается значения, которые приняла случайная величина , в n наблюдениях, записанные не в порядке получения, а в порядке возрастания, то есть упорядоченная выборка показывает, сколько наблюдалось вариантов со значением наблюдаемого признака, меньшим х отношение накопленной частоты значения х к общему числу наблюдений числа для каждого полученного значения (варианта) - результат подсчета того, сколько раз значение встретилось в ряде наблюдений расстояние xmax - xmin между крайними членами вариационного ряда 15 16 17 18 19 20 21 Относительная (эмпирическая) частота значения xi; Группировка отношение mi/n, где п - объем выборки, a m i , - число повторения значения xi в выборке состоит в том, что область на оси х, куда попали значения x1,...,xn, разбивают на интервалы I1,...,Ik и подсчитывают частоту попадания значений величины в каждый интервал. Самый простой способ группировки - округление данных i-ая интервальная частота число выборочных значений, попавших в i-ый интервал группировки отношение i–й интервальной частоты к объему выборки i-ая относительная (эмпирическая) интервальная частота вариационный ряд, представленный таблицей, построенной с Интервальный помощью процедуры группировки вариационный ряд таблица из двух строк, в верхней строке которой указаны в Таблица порядке возрастания наблюдаемые значения (для статистического распределения выборки интервального ряда - середины интервалов группировки), а в нижней - соответствующие им относительные частоты. Она задает статистическое (или эмпирическое) распределение выборки графическое изображение вариант, которое строится так: на Полигон для оси абсцисс откладывают принимаемые признаком значения xi; дискретных из значений xi проводят перпендикуляры, длины которых вариационных рядов пропорциональны значениям mi, затем концы соседних перпендикуляров соединяют отрезками прямых 22 Полигон для интервальных вариационных рядов 23 Гистограмма 24 Кумулята 25 Мода графическое изображение вариант, которое строится по гистограмме интервального вариационного ряда следующим образом: середины верхних сторон прямоугольников гистограммы соединяют отрезками прямых. Крайние точки этой ломаной соединяют с серединами соседних интервалов, частоты которых равны 0, а длина равна длине соседнего интервала, так чтобы площадь, ограниченная полигоном и осью X, была равна 1 графическое изображение эмпирической плотности, строится для группированных выборок следующим образом: в случае одинаковых интервалов di на каждом из интервалов значений как на основании строят прямоугольник с высотой, пропорциональной mi; если длины интервалов di разные, то на каждом из интервалов значений как на основании строят прямоугольник с высотой, пропорциональной mi/di количеству, приходящемуся в этом интервале на единицу интервала; если высоты прямоугольников сделать равными mi/din, то гистограмма изображает эмпирическую плотность график накопленных частот, сглаженное графическое изображение эмпирической функции распределения для дискретного вариационного ряда - значение хm, эмпирическая вероятность mi/n которого максимальна; для сгруппированного ряда входит в интервал, у которого эмпирическая вероятность mi/n максимальна; находится графически по гистограмме или с помощью линейной интерполяции 26 Медиана 27 Сходимость случайной величины по вероятности к некоторому значению 28 Статистика 29 30 31 32 33 середина распределения, т.е. такая точка, для которой половина принимаемых значений распределения лежит слева от нее, а половина справа. В случае группированного вариационного ряда эмпирическая медиана делит площадь гистограммы пополам означает, что, несмотря на увеличение числа испытаний, могут встретиться значения случайной величины, довольно сильно отличающиеся от предельного значения, но процент таких испытаний будет с ростом n уменьшаться (вероятность отклонения от предела с ростом n стремится к 0) любая функция (x1,...,xn), зависящая от выборки, и поэтому являющаяся случайной величиной оценка параметра в виде числа - точки на координатной Точечная оценка оси параметра Математическое ожидание "средневзвешенное" значение случайной величины М( )= а математическое ожидание квадрата отклонения случайной Дисперсия случайной величины от еѐ математического ожидания величины £, Среднеквадратическо характеристика распределения, равная корню из дисперсии е отклонение Правило трех (сигм) практически достоверно то, что нормально распределѐнная величина примет значение, отличающееся от еѐ математического ожидания по модулю не более чем на З , иначе говоря, "практически невозможно" появление значения, выходящего за пределы этого интервала 34 Состоятельная оценка параметра оценка, которая при увеличении объѐма выборки сходится по вероятности к истинному значению параметра 35 Несмещенная оценка параметра 36 Метод моментов оценка, математическое ожидание которой по всевозможным выборкам данного объѐма равняется истинному значению определяемого параметра метод получения оценок параметров, который состоит в том, что если оцениваемый параметр распределения является функцией от моментов распределения (в самом простом случае сам является моментом), то в эту функцию подставляются эмпирические значения моментов и полученное значение берется в качестве оценки для параметра (например, оценкой для математического ожидания является - эмпирический первый начальный момент, оценкой для дисперсии S2 эмпирический второй центральный момент) 37 38 Доверительным интервалом с уровнем доверия 3 Критическая область 39 Уровень значимости интервал, накрывающий значение оцениваемого параметра с вероятностью ( - доверительная вероятность) область, при попадании в которую значения статистики критерия, сосчитанной по выборке, основная гипотеза отвергается. В случае, когда проверка гипотезы осуществляется с помощью доверительного интервала, уровень значимости и доверительная вероятность интервала связаны соотношением вероятность попадания в критическую область, в случае, если основная гипотеза истинна 40 41 42 Область допустимых значений Критические значения Распределение Стьюдента с n степенями свободы дополнение критической области точки, разделяющие критическую область и область допустимых значений распределение случайной величины где , ,..., - независимые, стандартные нормальные случайные величины. При n > 20 практически неотличимо от N(0,1) значение uр - верхняя граница интервала, в который с заданной вероятностью р попадает случайная величина, т.е. это uр корень решения уравнения 43 Квантиль уровня р величины 4, имеющей плотность распределения f(x) 44 Ошибка первого рода ошибка , которую совершают, отвергнув основную гипотезу, когда она истинна 45 Ошибка второго рода 46 Мощность критерия ошибка , которую совершают, приняв основную гипотезу, когда она ложна вероятность (1 - ) не допустить ошибку 2-го рода, т.е. отвергнуть гипотезу Н о, когда она неверна (это вероятность попадания критерия в критическую область при условии, что верна конкурирующая гипотеза) 47 48 49 50 Функция правдоподобия плотность вероятности (в дискретной модели просто вероятность) совместного появления результатов выборки x1, x2, …, xn метод, который состоит в том, что в качестве оценки Метод максимального неизвестного параметра принимается такое значение , правдоподобия при котором плотность вероятности (в дискретной модели просто вероятность) совместного появления результатов выборки x1, x2, …, xn максимальна (в котором функция правдоподобия достигает максимума) Отношение вероятностей (отношение функций правдоподобия для конкурирующих гипотез) для n испытаний: Ln Метод последовательного анализа метод, который состоит в том, что необходимое число наблюдений не фиксируется заранее, а определяется в процессе эксперимента; область значений в n-мерном пространстве делится на три части: критическую для гипотезы Но (ее вероятность при условии, что верна гипотеза Н о - ), критическую для гипотезы Н 1 (ее вероятность при условии, что верна гипотеза H1 - ) и область неопределенности. Эксперимент продолжается, пока выборочные значения не попадут в одну из критических областей - или критическую для гипотезы Но, или критическую для гипотезы Н1