Практикум по теме 10 "Статистическое оценивание" Методические указания по выполнению практикума Целью практикума является более глубокое усвоение материала контента темы 10, а также развитие следующих навыков: • вычисление точечных оценок параметров распределения методом моментов; • вычисление точечных оценок параметров распределения методом максимального правдоподобия; • построение доверительных интервалов параметров нормального распределения; • построение доверительного интервала для следующего n + 1-го значения нормальной случайной величины. Перед решением заданий практикума рекомендуется внимательно изучить материал контента темы 10 и провести самостоятельный анализ всех разработанных примеров. Решение типовых задач ТЗ 10.1. Случайная величина ξ (число появлений событий A в n независимых испытаниях) подчинена биномиальному закону распределения с неизвестным параметром p. Ниже приведено эмпирическое распределение числа появлений события A в 10 опытах по 5 испытаний в каждом (в первой строке указано число xi появлений события A в одном опыте; во второй строке указана частота ni – количество опытов, в которых наблюдалось xi событий A): xi 0 1 2 3 4 ni 5 2 1 1 1 Найдите методом моментов точечную оценку параметра p биномиального распределения. Оценить вероятность p0 = P {ξ = 0}. Решение: Математическое ожидание биномиального распределения известно: M ξ = n · p. Приравнивая математическое ожидание к выборочному среднему, получаем уравнение np = x̄, откуда p̂ = nx̄ . Для данного точечного вариационного ряда имеем: x̄ = 0·5+1·2+2·1+3·1+4·1 = 1, 1. 10 1 Тогда 1, 1 = 0, 22; pˆ0 = (1 − 0, 22)5 = 0, 29. 5 ТЗ 10.2. Случайная величина ξ (число поврежденных стеклянных изделий в одном контейнере) распределена по закону Пуассона с неизвестным параметром λ. Ниже приведено эмпирическое распределение числа поврежденных изделий в 500 контейнерах (в первой строке указано количество xi поврежденных изделий в одном контейнере, во второй строке приведена частота ni – число контейнеров, содержащих xi поврежденных изделий): p̂ = xi 0 1 2 3 4 5 6 7 ni 199 169 87 31 9 3 1 1 Найдите методом максимального правдоподобия точечную оценку неизвестного параметра λ распределения Пуассона. Решение: Выпишем функцию правдоподобия в виде L(x1 , x2 , ..., xk , λ) = [p(x1 , λ)]n1 · [p(x2 , λ)]n2 · ... · [p(xk , λ)]nk = · x1 −λ ¸n1 · x2 −λ ¸n2 · xk −λ ¸nk λ ·e λ ·e λ ·e λn1 x1 +n2 x2 +...+nk xx · e−λn = · · = x1 ! x2 ! xk ! (x1 !)n1 · (x2 !)n2 · ... · (xk !)nk Найдем логарифмическую функцию правдоподобия: Ã ln L(x1 , x2 , ..., xk , λ) = k X ! xi ni ln λ − nλ − Ã k X ! ni ln(xi !) . i=1 i=1 Далее найдем точку максимума логарифмической функции правдоподобия, для чего приведем к нулю ее первую производную по λ: k k d ln L 1X 1X = xi ni − n = 0 ⇐⇒ λ̂ = xi ni = x̄. dλ λ i=1 n i=1 Убедимся, что полученное λ̂ является точкой максимума. С этой целью найдем вторую производную: k 1 X d2 ln L(x1 , x2 , ..., xk , λ) =− 2 xi ni . dλ2 λ i=1 Очевидно, что d ln L dλ2 < 0, следовательно, λ̂ = x̄ является точкой максимума. 2 Найдем λ̂ данного точечного вариационного ряда: k 1X 1 xi ni = λ̂ = x̄ = (0·199+1·169+2·87+3·31+4·9+5·3+6·1+7·1) = 1. n i=1 500 ТЗ 10.3. Найдите оценку максимального правдоподобия для параметра θ 1 распределения Коши, заданного плотностью fξ (x) = π(1+(x−θ) 2 ) , по выборке из двух наблюдений x1 = −1, x2 = 1. Решение: Функция правдоподобия для двух данных наблюдений имеет вид L(x1 , x2 , θ) = 1 1 1 · = . π(1 + (−1 − θ)2 ) π(1 + (1 − θ)2 ) π 2 (θ4 + 4) Очевидно, что эта функция достигает своего максимума при θ = 0. Следовательно, оценкой максимального правдоподобия неизвестного параметра θ является θ̂ = 0. ТЗ 10.4. Станок-автомат штампует валики. По выборке объема n = 100 вычислено выборочное среднее диаметров изготовленных валиков. Найдите с надежностью 0, 95 точность ε, с которой выборочное среднее оценивает математическое ожидание диаметров изготовляемых валиков, зная, что их среднее квадратическое отклонение σ = 2 мм. Предполагается, что диаметры валиков распределены нормально. Решение: Точность искомой оценки определяется формулой (10.4.1)(контент темы): tβ σ ε= √ . n Определим µ ¶ −1 0, 95 = 1, 96. tβ = Φ0 2 Тогда 1, 96 · 2 = 0, 392(мм). ε= √ 100 ТЗ 10.5. Из генеральной совокупности извлечена выборка объема n = 10: xi -2 1 2 3 4 5 ni 2 1 2 2 2 1 Оцените с надежностью 0,95 математическое a нормально распределенного признака по выборочному среднему с помощью доверительного интервала. 3 Решение: Для построения доверительного интервала найдем выборочные характеристики распределения: x̄ = (−2 · 2 + 1 · 1 + 2 · 2 + 3 · 2 + 4 · 2 + 5 · 1) · 1 = 2; 10 1 (4 · 2 + 1 · 1 + 4 · 2 + 9 · 2 + 16 · 2 + 25 · 1) − 22 = 9, 2 − 4 = 5, 2; 10 10 s2 = · 5, 2 = 5, 78; =⇒ s = 2, 4. 9 С помощью таблиц критических точек распределения Стьюдента (приложение 6 контента темы 12) найдем tβ,n−1 = 2, 26. Теперь построим доверительный интервал по формуле 10.4.2. (контент темы 10): ¶ µ 2, 4 · 2, 26 2, 4 · 2, 26 a ∈ (aˆ1 ; aˆ2 ) = 2 − √ ;2 + √ = (0, 28; 3, 72). 10 10 DB = ТЗ 10.6. Исправленное среднее квадратическое отклонение ежесуточного дохода случайно выбранных 10 киосков некоторой фирмы оказалось равно 100 ден.ед. Постройте доверительный интервал для среднего квадратического отклонения с надежностью 0,9. Предполагается,что доход – это нормально распределенная величина. Решение: Воспользуемся формулой (10.4.3) (контент, тема 10): ! Ã nD nD B B ; 2 . σ 2 ∈ (σ̂12 ; σ̂22 ) = 2 X 1−β ,n−1 X 1+β ,n−1 2 Тогда 2 √ √ √ √ nDB nDB n − 1 · s n−1·s ;q = q ;q σ ∈ (σ̂1 ; σ̂2 ) = q , 2 2 2 2 X 1−β ,n−1 X 1+β ,n−1 X 1−β ,n−1 X 1+β ,n−1 2 2 2 2 где 1−β 2 = 0, 05 =⇒ X0,05,9 = 16, 9, 2 1+β 2 = 0, 95 =⇒ X0,95,9 = 3, 33. 2 Найдем доверительный интервал. √ µ√ ¶ 10 − 1 · 100 10 − 1 · 100 √ √ σ ∈ (σ̂1 ; σ̂2 ) = ; = (72, 98; 164, 4). 16, 9 3, 33 4 ТЗ 10.7. Данные о производстве зерна в России в 1996-2002 гг. представлены в таблице. Год Производство, млн т 1996 1997 1998 1999 2000 2001 2002 69,3 88,6 47,9 54,7 65,5 85,2 86,6 Оцените с помощью доверительного интервала объем производства зерна в 2003 г. с надежностью 95%, считая распределение нормальным. Решение: Найдем выборочное среднее и исправленную выборочную дисперсию. 1 x̄ = (69, 3 + 88, 6 + 47, 9 + 54, 7 + 65, 5 + 85, 2 + 86, 6) = 71, 11(млн т); 7 1 DB = (69, 32 + 88, 62 + 47, 92 + 54, 72 + 65, 52 + 85, 22 + 86, 62 ) = 227, 34; 7 n 7 s2 = DB = · 227, 34 = 265, 23 ⇐⇒ s = 16, 29. n−1 6 Найдем критическую точку распределения Стьюдента tn−1,β = t6,0,95 = 2, 45. Для построения интервала воспользуемся формулой (10.4.4) (контент, тема 10). ! Ã r r 1 1 = x7 ∈ x̄ − stn−1,β 1 + ; x̄ + stn−1,β 1 + n n ! Ã r r 1 1 = 71, 11 − 16, 29 · 2, 45 · 1 + ; 71, 11 + 16, 29 · 2, 45 · 1 + = 7 7 = (28, 44; 113, 78). Задачи для самостоятельного решения 10.1. Случайная величина ξ (отклонение контролируемого размера изделия от номинала) подчинена нормальному закону распределения с неизвестными параметрами a и σ. Ниже приведена таблица наблюдаемых отклонений от номинала, подвергнутых группировке, для n = 200 изделий (в первой строке указаны середины интервалов xi (мм); во второй строке приведена частота ni – число наблюдений, попадающих в данный интервал): xi 0,3 0,5 0,7 0,9 1,1 1,3 1,5 1,7 1,9 2,2 2,3 ni 6 9 26 25 30 26 21 24 20 8 5 5 Найдите методом моментов точечные оценки неизвестных параметров a и σ нормального распределения. Оценить долю изделий с отклонением менее 1,5 мм в генеральной совокупности. 10.2. Предполагается, выполнение некоторой работы занимает случайное время с равномерным распределением на отрезке [a, b]. Хронометраж 20 испытаний дал среднее время работы 30 мин и исправленную дисперсию 24 мин.2 Оцените параметры a и b методом моментов. Оцените, за какое время работа будет выполнена с вероятностью 0,98. 10.3. Случайная величина ξ (число семян сорняков в пробе зерна) распреm делена по нормальному закону Пуассона: P {ξ = m} = λm! e−λ . Ниже приведено распределение семян сорняков в n = 1000 пробах зерна (в первой строке указано количество xi сорняков в пробе; во второй строке указана частота ni – число проб, содержащих xi семян сорняков): xi 0 1 2 3 4 5 6 ni 405 366 175 40 8 4 2 Найдите методом моментов точечную оценку параметра λ. Оцените вероятность того, что в пробе зерна не будет сорняков. 10.4. Случайная величина ξ (срок службы изделия) имеет показательное распределение ½ 0, x < 0 fξ (x) = αe−αx , x ≥ 0. В таблице приведены сгруппированные данные по срокам службы (в часах) для n = 200 изделий. xi 2,5 7,5 12,5 17,5 4 27,5 ni 133 45 15 4 2 1 Методом моментов найдите точечную оценку неизвестного параметра α показательного распределения. Оцените время, которое изделие служит с вероятностью 0,9. 10.5. Проведено исследование посещаемости популярного интернет-сайта. В течение многих часов регистрируется число посетителей, посетивших сайт в течение данного часа. Результаты исследований представлены в таблице Число 0 1 2 3 4 6 7 8 9 10 11 12 14 посетителей Количество 57 203 383 525 408 275 139 45 27 10 4 1 1 часов 6 В предположении, что случайное число посетителей описывается распределением Пуассона, оцените параметр λ методом моментов. Оцените вероятность того,что в течение часа на сайте не будет ни одного посетителя. 10.6. Случайная величина ξ (число появлений события A в n независимых испытаниях) подчинена биномиальному закону с неизвестным параметром p. Ниже приведено эмпирическое распределение числа появлений события A в 100 наблюдениях (в первой строке указано xi появлений события в одном опыте из n = 10 испытаний; во второй строке приведена частота ni – число опытов, в которых наблюдалось xi появлений события A): xi 0 1 2 3 4 5 6 7 ni 2 3 10 22 26 20 12 5 Найдите методом максимального правдоподобия точечную оценку неизвестного параметра p биномиального распределения. 10.7. Случайная величина ξ (время безотказной работы изделия) имеет показательное распределение. В таблице приведены сгруппированные данные по времени работы (в часах) для 1000 изделий. xi 5 15 25 35 45 55 65 ni 365 245 150 100 70 45 25 Найдите методом максимального правдоподобия точечную оценку неизвестного параметра α показательного распределения. Какова вероятность того, что изделие может прослужить более 60 часов? 10.8. В поселке Полтинниково все жители имеют доход не менее 50 тыс. руб. в месяц. Выборочное обследование доходов 10 человек дало следующие результаты: 54; 60; 59; 79; 71; 92; 53; 54; 78; 56 (тыс.руб.). В предположении, что случайная величина дохода имеет распределение Парето вида ( 0, x < x0 ³ ´−α Fξ (x) = 1 − xx0 , x ≥ x0 , где x0 = 50(тыс. руб), оцените параметр α и средний доход жителей методом максимального правдоподобия. Оцените долю жителей с доходами свыше 100 тыс. руб. на основе оценки максимального правдоподобия. 7 10.9. Известно,что некоторая работа занимает время, состоящее из обязательного периода θ и случайной задержки, распределенной показательно со средним r. Хронометраж рабочего времени в 10 случаях дал следующие результаты: 32; 30; 37; 35; 42; 39; 34; 32; 31; 35 (мин). Оцените срок, за который работа будет выполнена с вероятностью 99 %, на основе оценки максимального правдоподобия. 10.10. Пассажир,приходящий в случайные моменты времени на автобусную остановку, в течение пяти поездок фиксировал свое время ожидания автобуса: 5,1;3,7;1,2;9,2;4,8 (мин). Известно, что автобус ходит с интервалом θ минут. Оценить θ методом максимального правдоподобия. 10.11. Найдите минимальный объем выборки, при котором с надежностью 0, 975 точность оценки математического ожидания a нормальной генеральной совокупности ε = 0, 3, если известно среднее квадратическое отклонение σ = 1, 2. 10.12. Случайная величина ξ имеет нормальное распределение с известным средним квадратическим отклонением σ = 3. Найдите доверительный интервал для неизвестного математического ожидания a по выборочному среднему x̄ = 5, если объем выборки n = 36 и задана надежность оценки β = 0, 95. 10.13. Фирма коммунального хозяйства желает оценить на основе выборки среднюю квартплату за квартиру определенного типа с надежностью не менее 0,99 и погрешностью, меньшей 10 ден. ед. Предполагая, что квартплата имеет нормальное распределение со средним отклонением, не превышающим 35 ден.ед, найдите минимальный объем выборки. 10.14. Импортер упаковывает чай в пакеты номинальным весом 125 г. Известно, что наполняющая машина работает со стандартным отклонением σ, равным 10 г. Выборка из 50 пакетов показала средний вес 125,8 г. Найти доверительный интервал для среднего веса в генеральной совокупности с вероятностью 95%. Генеральная совокупность распределена нормально. Найдите объем выборки n, чтобы с вероятностью 95% точность интервала была равна 2 г. 10.15. За последние 9 лет годовой рост цены актива A составлял в среднем 22% со средним квадратическим отклонением 6%. Постройте доверительный интервал с вероятностью 90% для средней цены актива в конце следующего года, если в начале года она была равна 200 ден. ед. 8 10.16. Случайным бесповторным способом проведено обследование семей района. По результатам обследования определен душевой доход на одного человека, представленный в виде интервального вариационного ряда. Распределение семей по величине месячного дохода на одного члена семьи: Доход, руб. Число семей ≤ 500 500-1000 1000-1500 1500-2000 ≥ 2000 23 36 44 17 10 Считая душевой доход нормальной случайной величиной, с доверительной вероятностью 0,95 определите доверительный интервал, в котором будет находиться средний месячный доход на одного члена семьи по району. 10.17. Для отрасли, включающей 1200 фирм, составлена случайная выборка из 19 фирм. По выборке оказалось, что в фирме в среднем работают x̄ = 77, 5 человека при среднем квадратическом отклонении s = 25 человек. Пользуясь 95%-ным доверительным интервалом, оцените среднее число работающих в фирме по всей отрасли и общее число работающих в отрасли. Предполагается, что количество работников фирмы имеет нормальное распределение. 10.18. По данным 16 независимых равновесных измерений некоторой величины найдены среднее арифметическое результатов измерений и исправленное среднее квадратическое отклонение, равные соответственно 42,8 и 8. Постройте доверительный интервал для истинного значения измеряемой величины с надежностью α = 0, 999. 10.19. По данным выборки объема n из генеральной совокупности нормального распределенного признака найдено исправленное среднее квадратическое отклонение s. Найдите доверительный интервал, покрывающий генеральное среднее квадратическое отклонение σ с надежностью 0,95, если: а) n = 10, s = 5; б)n = 30; s = 14. 10.20. Производитель автомобильных шин заинтересован в получении оценки средней износоустойчивости шин особой модели. Он произвел случайную выборку объемом 10 шин и подверг их специальному испытанию. Средняя износоустойчивость, по данным выборки, оказалась равной 22 500 миль с неисправленным средним квадратическим отклонением 3 000 миль. Постройте доверительный интервал с вероятностью 0,99 для средней износоустойчивости всего выпуска шин этого типа. Генеральная совокупность распределена нормально. 9 10.21. Измерения твердости 16 образцов легированной стали (в условных единицах) дали следующие результаты: 13, 1; 12, 5; 11, 9; 12, 4; 13, 5; 13, 7; 12, 0; 13, 8; 10, 6; 12, 4; 13, 5; 11, 7; 13, 9; 11, 5; 12, 5; 11, 9. В предположении, что выборка измерений получена из нормально распределенной генеральной совокупности, найти доверительный интервал для среднего и дисперсии при доверительной вероятности β = 0, 95. 10.22. Результаты 10 измерений емкости конденсатора прибором, не имеющим систематической ошибки, дали такие отклонения от номинала (пкФ): 5, 4; −13, 9; −11; 7, 2; −15, 6; 29, 2; 1, 4; −0, 3; 6, 6; −9, 9. Найдите 90%-ный доверительный интервал для дисперсии и с.к.о. 10.23. По данным выборки объема n = 16 из генеральной совокупности найдено исправленное среднее квадратическое отклонение s = 1 нормально распределенного признака. Найдите доверительный интервал, покрывающий генеральное среднее квадратическое отклонение σ с надежностью 0,95. 10.24. Произведено 12 измерений одним прибором (без систематической ошибки) некоторой физической величины, причем исправленное среднее квадратическое отклонение s случайных ошибок измерений оказалось равным 0,95. Предполагается, что результаты измерений распределены нормально. 10.25. По выборке из 25 упаковок товара средний вес составляет 101 г с исправленным средним квадратическим отклонением s = 3 г. Постройте доверительный интервал для среднего и дисперсии с вероятностью 90%. 10.26. Данные о производстве пшеницы в России в 1995–2001 гг. представлены в таблице: Год Производство, млн т 1995 1996 1997 1998 1999 2000 2001 30,1 34,9 44,3 27,0 31,0 34,5 47,0 Постройте доверительные интервалы для среднего и для следующего наблюдения с надежностью 95%, используя нормальное приближение. 10 10.27. Урожайность зерновых культур в России 1992-2001 гг. представлена в таблице: Год 1992 1993 1994 1995 1996 1997 1998 999 2000 2001 Урожайность, 18,0 17,1 15,3 13,1 14,9 17,8 12,9 14,4 15,6 19,4 ц/га Постройте доверительные интервалы для среднего и для следующего наблюдения с надежностью 0,95, используя нормальное распределение урожайности. 10.27. В таблице приведены сгруппированные данные о коэффициентах соотношения заемных и собственных средств на 100 малых предприятиях региона. yi ni 5,05-5,15 5,15-5,25 5,25-5,32 5,35-5,45 5 8 12 20 yi ni 5,45-5,55 5,55-5,65 5,65-5,75 5,75-5,85 26 15 10 4 Постройте доверительные интервалы для среднего и для следующего наблюдения с надежностью 0,95, используя нормальное приближение. 11