Сравнение средних

реклама
Математическая обработка результатов измерения
Лекция 2
Основы теория оценивания
Проверка статистических гипотез
Лектор: ст. преподаватель каф. ИИТ
Вавилова Галина Васильевна
1
Содержание
Статистические оценки
2. Точечная оценка параметров распределения
3. Интервальное оценивание параметров
распределения
4.
Проверка статистических гипотез
1. Сравнение средних
2. Сравнение дисперсий
3. Критерии согласия
1.
2
цель статистического анализа
• исследование свойств случайных
величин
x1, x2, …, xn
3
Задачи статистического анализа
Статистическое
оценивание
Построение
статистических
зависимостей
Проверка
статистических
гипотез
4
Выборочный метод
Генеральная
совокупность
Выборка
Детальное
исследование
выборки
5
Статистические оценки
Выборка x1, x2, …, xn
Оцениваемый параметр Θ
Оценка
6
Требование к оценкам
Несмещенность
• при любом объеме выборки n математическое ожидание
оценки равно истинному значению искомого параметра.
Эффективность
• Оценку, которая при постоянном объеме выборки n
имеет наименьшую возможную дисперсию.
Состоятельность
• Оценка при n →∞ стремится по вероятности к
оцениваемому параметру.
Устойчивость
• Оценка характеризует чувствительность оценки к
промахам и выбросам.
7
Точечная оценка параметров
• числовая
величина, которая и принимается за значение
распределения
искомого параметра
Точечная
оценка
• среднее арифметическое значений признака генеральной
совокупности
Генеральное
среднее
• среднее арифметическое значение признака выборочной
совокупности
Выборочное
• несмещенная оценка
среднее
8
Генеральная и выборочная дисперсии
Генеральная дисперсия Dг
• среднее арифметическое квадратов отклонений значений
признака генеральной совокупности от их среднего значения .
Генеральное среднее квадратическое отклонение
• квадратный корень из генеральной дисперсии.
Выборочная дисперсия Dв
• среднее арифметическое квадратов отклонения
наблюдаемых значений признака от их среднего значения.
Выборочное среднее квадратическое отклонение
• квадратный корень из выборочной дисперсии:
9
Оценка генеральной дисперсии
Выборочная дисперсия
• Смещенная оценкой Dг
«Исправленная дисперсия»
«Исправленное» среднее квадратическое
отклонение
10
Выборочная и исправленная выборочная
дисперсии
Сравним формулы
n
.
Dв 
 (x
i 1
i
 xв )
n
k
2
и
S 
2
 (x
i 1
i
 xв )
2
n 1
11
Методы получения оценок
Cостоятельность
Эффективности
Несмещенность
Метод максимального правдоподобия
Метод моментов
Метод порядковых характеристик
Др.
12
Метод максимального
правдоподобия
1. Доопытное распределение выборки
х = (x1, x2, …, xn)
2. Плотность распределения f(x, Θ)
3. Функцией правдоподобия
достигает максимума
4. Исследование функции правдоподобия на экстремум
13
;
Метод моментов
Эмпирические
моменты

1 n
~
 k   xi  x
n i 1
Теоретические
моменты

k
1 n
k


 k   xi
n i 1
 k   k 1 ,  2 ,...,  n 
 k   k 1 ,  2 ,...,  n 
14
Доверительный интервал и доверительная
вероятность
[Θi1; Θi2]
• Доверительный интервал - интервал , в котором
заключено истинное значение xi, т.е.
P=1–α
• Доверительная вероятность
α
• Уровень значимости
[Θi1; Θi2]
• оценка неизвестного параметра Θi.
р
• 0,90; 0,95; 0,98; 0,99 и реже 0,999
15
Интервальное оценивание
16
 p1     p 2
    t p 
  t p       t p 
17
Интервальное оценивание мат. ожидания
Нормальный закон с известной дисперсией
• среднее арифметическое распределено нормально с
дисперсией
Нормальный закон с неизвестной дисперсией
• среднее арифметическое распределено тоже нормально,
оценка
18
Интервальная оценка дисперсии
Интервальная оценка дисперсии
уравнение относительно σ2
19
Пример
Найти доверительный интервал для оценки с надежностью 0,95 мат. ожидания ь
нормально распределенного признака X генеральной совокупности, если
генеральное среднее квадратическое отклонение σ = 5, выборочная средняя
=
14 и объем выборки n = 25.
Решение.
По условию задачи известно генеральное среднее квадратическое отклонение,
поэтому доверительный интервал представим в виде
Найдем Up из соотношения
. По таблице значений функции
Лапласа находим
. Подставив данные, окончательно получим
Искомый доверительный интервал
20
Пример
Из генеральной совокупности извлечена выборка объема n = 10. Оценить с
надежностью 0,95 мат. ожидание m нормально распределенного признака X
генеральной совокупности по выборочной средней при помощи доверительного
интервала.
xi
-2
1
2
3
4
5
ni
Выборочную среднюю
2
1
2
2
2
1
,
и исправленной среднее квадратическое отклонение
По таблице распределения Стьюдента, по P = 0.95 и n = 10 находим t = 2,26.
Искомый доверительный интервал определяется по формуле
,
Доверительный интервал
0,95.
покрывает мат. ожидание m с надежностью
21
Пример
По данным выборки объема n=16 из генеральной совокупности найдено
«исправленное» среднее квадратическое отклонение S=1. Найти доверительный
интервал, покрывающий генеральное среднее квадратическое отклонение σ с
надежностью 0,95.
Решение.
Задача сводится к отысканию доверительного интервала .
По таблице распределения Пирсона χ2 .
12 p  120.96  5,2 12 p  120.96  28,3
2
2
2
2
Доверительный интервал
покрывает генеральное среднее
квадратическое отклонение σ с надежностью 0,96.
22
Статистические гипотезы
Статистическая гипотеза
• любое предположение о виде неизвестного закона
распределения или о параметрах известных распределений
Параметрические гипотезы
H 0 : m  m0 ;
• Гипотезы о значениях параметров распределений или о
сравнительной величине параметров двух распределений H1 : m  m0
Непараметрические гипотезы
• Гипотезы о виде распределения
23
Где какая гипотеза: параметрическая и
непараметрическая?
Примеры статистических гипотез
генеральная совокупность
подчиняется нормальному закону
распределения
математические ожидания двух
нормальных совокупностей равны
между собой
m1  m2
24
Проверить статистическую гипотезу
• проверить, согласуются ли выборочные данные с
выдвинутой гипотезой
Нулевая (основная
или проверяемая)
гипотеза
Конкурирующая
(альтернативная)
гипотеза
• выдвинутая гипотеза, которая обозначается H0
• гипотеза H1 , которая противоречит нулевой гипотезе
H 0 : m  m0 ; H1 : m  m0 или m  m0 .
25
Пример.
Нулевая и конкурирующая гипотезы
Пусть основная гипотеза
состоит в том, что математическое ожидание
равно . Тогда альтернативная гипотеза может состоять в предположении,
что математическое ожидание m не равно (больше или меньше) значению :
H 0 : m  m0 ; H1 : m  m0 или m  m0 .
26
Ошибки первого и второго рода
Ошибка первого рода
• состоит в том, что будет отвергнута верная гипотеза.
Ошибка второго рода
• состоит в том, что будет принята ложная гипотеза.
Уровень значимости α
• Вероятность совершения ошибки первого рода
β ошибка второго рода
• Вероятность не отклонить ложную гипотезу
27
Критическая область и область принятия
гипотезы
Статистический критерий
• случайная величина (статистика), которую используется
для проверки нулевой гипотезы
Критическая область
• множество возможных значений статистического
критерия, при которых нулевая гипотеза отвергается.
Область принятия гипотезы
• множество возможных значений статистического
критерия, при которых нулевая гипотеза принимается.
Критические точки (квантили)
• точки, которые разграничивают критическую область и
область принятия гипотезы.
28
29
Порядок проверки статистической
гипотезы
задается уровень значимости α, выбирается статистический
критерий К и вычисляется значение Ккр;
по выборке вычисляется Кнабл;
если Кнабл попадает в критическую область, нулевая гипотеза
отвергается;
при попадании Кнабл в область принятия гипотезы нулевая гипотеза
принимается
30
Гипотезы о значениях числовых
характеристик
Гипотезы о равенстве среднего
определенным числам m и  .
0
значения
m
и
дисперсии
σ2
2
0
m0 - номинальное
значение
измеряемого
параметра
Точность прибора
определяется
значением
прибор дает
систематическую
ошибку.
, качество
прибора не
отвечает
стандартным
требованиям
31
Сравнение средних
Сравнение средних — это проверка гипотезы о равенстве средних
значений совокупностей, из которых получены выборки.
32
Сравнение средних
33
Сравнение дисперсий
Дисперсия характеризует
 точность приборов,
 технологических процессов,
 риск, связанный с отклонением доходности от заданного уровня, и т. д.
34
Пример
По результатам n=9 замеров установлено, что выборочное среднее время
(в секундах) изготовления детали
. Предполагая, что время
изготовления – нормально распределенная случайная величина с
дисперсией σ2=9, рассмотреть гипотезу
против конкурирующей
гипотезы
. Доверительная вероятность P = 95%.
Решение.
На уровне P = 0,95 находим по таблицам нормального распределения
(Функция Лапласа) Ukp = 1,96 . По формуле
Так как
, то гипотеза
принимается. Выборка
принадлежит генеральной совокупности со средним значением
35
Пример
По утверждению руководства фирмы, средний размер дебиторского учета равен 187,5
тыс. руб. Ревизор составляет случайную выборку из 10 счетов и обнаруживает, что
средняя арифметическая выборка равна 175 тыс. руб. при среднем квадратичном
отклонении 35 тыс. руб. Может ли оказаться в действительности правильным
объявленный размер дебиторского счета? Доверительная вероятность P=0.95.
Решение.
Здесь m = 187.5 тыс. руб.,
тыс. руб., n=10 , S=35, P=0.95. Так как дисперсия
неизвестна, то для проверки гипотезы воспользуемся распределением Стьюдента.
Тогда
Число степеней свободных
По таблице распределения Стьюдента при P=0.95 находим
. Так как
, то
гипотеза H0 о среднем размере дебиторского счета принимается на уровне доверия
P=0.95.
36
Пример
По независимым данным объемами n1=31 и n2=25 вычислены выборочные
2
2
дисперсии S1  25, 0 и S2  16, 0
Необходимо проверить гипотезу о равенстве дисперсий исходных совокупностей
на уровне значимости α = 0.01 .
Решение.
Так как объемы выборок сравнительно невелики, применим односторонний
критерий Фишера. Вычислим статистику
число степеней свободы k1  n1  1  31  1  30 , k2  n2  1  25  1  24
По таблице распределения Фишера находим критическое значение
Так как
, то гипотеза о равенстве дисперсий принимается.
.
37
Спасибо за внимание!
38
Скачать