Задание Для данной случайной выборки объемом п = 100: 1. составить вариационный ряд; 2. составить статистический ряд; 3. построить гистограмму частот; 4. вычислить статистическое среднее и статистическую дисперсию; 5. составить статистическую функцию распределения F(x); 6. построить группированную выборку и с ее помощью: а) вычислить статистическое среднее и статистическую дисперсию; б) составить статистическую функцию распределения F (x) и построить ее график; 7. найти доверительный интервал для математического ожидания и дисперсии; 8. с помощью критерия Пирсона 𝑥 2 проверить гипотезу о нормальном законе распределения данной выборки; 9. составить уравнение линии регрессии (кривой, «сглаживающей» гистограмму частот) и построить ее график. Дана случайная выборка n=100 -1,752 -0,206 -0,266 -0,578 0,035 -0,291 0,092 0,901 0,439 0,106 -0,093 -1.222 -1,433 -0,852 0,199 -0.450 0,065 0,327 0,489 -1,990 0,512 0,183 0,248 0,675 0,710 -0,702 -0.811 -0,401 -1,210 0,340 0,284 -1.019 0,344 0,131 -0,594 -0,509 1,453 0,441 -1,202 -1,527 -1.776 0,759 0,824 0,894 0,362 -0.044 0,287 1,385 -0,780 -0,570 0,263 -0,669 -0,329 -0,195 -1,309 0,986 0,392 0,085 -0,927 1,531 -0,441 -о,зз7 0,130 -1,582 -1,008 -0.866 0,369 -0,244 0,075 0,763 -1.215 1,694 -0,882 1,600 0,788 -0,475 -0,985 0,472 2,904 -0,679 1,2 -1,063 0,039 0,149 -0,824 -0,498 0,033 1,42 1,210 -0,372 -0,743 0,597 -1,033 -0,838 0,049 0,779 -1.601 1,807 0,278 1,320 Таблица 1 Решение: Из данной выборки определяем максимальную варианту x max и минимальную варианту xmin x max =2,904, xmin =-1,99 Расположив варианты в порядке возрастания, начиная с xmin получим вариаионный ряд: -1,99 -0,852 -0,329 0,183 0,71 -1,776 -0,838 -0,291 0,199 0,759 -1,752 -0,824 -0,266 0,248 0,763 -1,601 -0,811 -0,244 0,263 0,779 -1,582 -0,78 -0,206 0,278 0,788 -1,527 -0,743 -0,195 0,284 0,824 -1,433 -0,702 -0,093 0,287 0,894 -1,309 -0,679 -0,044 0,327 0,901 -1,222 -0,669 0,033 0,34 0,986 -1,215 -0,594 0,035 0,344 1,2 -1,21 -0,578 0,039 0,362 1,21 -1,202 -0,57 0,049 0,369 1,32 -1,063 -0,509 0,065 0,392 1,385 -1,033 -0,498 0,075 0,439 1,42 -1,019 -0,475 0,085 0,441 1,453 -1,008 -0,45 0,092 0,472 1,531 -0,985 -0,441 0,106 0,489 1,6 -0,927 -0,401 0,130 0,512 1,694 -0,882 -0,372 0,131 0,597 1,807 -0,866 -0,337 0,149 0,675 2,904 Таблица 2 Для построения статистического ряда разобьем вариационный ряд на конечное число интервалов (зарядов). Длину интервала определим по формуле Стэрджеса: ∆=( x max - xmin )/(1+3,32lgn) где п - объем данной случайной выборки, ∆ - длина интервала; ∆ = (2,904 +1,99)/(7,64) = 0,640 Примем ∆ = 0,7. От xmin отступим влево на 0,01. Величину 0,01 выбрали так, чтобы округлить значение левого конца интервала. Откладываем вправо интервалы длиной ∆ = 0,7 до тех пор, пока не покроется вся выборка, и считаем число вариант, попавших на каждый интервал. В вариационном ряду удобно отделить варианты одного разряда от вариант другого разряда чертой. По результатам разбиения составим таблицу 1. Интервалы I, ( ai , a i 1 ) (-2;-1,31) (-1,31;-0,588) (-0,588;0,116) (0,116;0,79) (0,79;1,46) (1,46;1,81) (1,81;2,91) Число вариант Частоты mi / n mi 8 23 27 27 10 4 1 Таблица 3 0,08 0,23 0,27 0,27 0,1 0,04 0,01 Эта таблица называется статистическим рядом. В таблице 3 тi — это число вариант, попавших в i-й интервал; ai,ai+x — соответственно начало и конец i -го интервала. 3. Для построения графического изображения статистического ряда (гистограммы) отложим на оси Ох интервалы из таблицы 1, и на каждом i -м интервале построим прямоугольник с высотой уi: уi =mi/∆n, тогда y1 = 0,114; у2=0,328; у3 = 0,385; у4 = 0,385; у5 = 0,142; у6= 0,057; у7 = 0,014; На рисунке 1 представлено графическое изображение статистического ряда (гистограмма). Для удобства обозначения гистограммы ее основание должно быть в 1,5 - 2 раза больше высоты. 0.45 0.385 0.4 0.385 0.328 0.35 0.3 0.25 0.2 0.15 0.142 0.114 0.1 0.057 0.05 0.014 0 Рис.1 _ 2 _ 4. Найдем статистическое среднее x и статистичекую дисперсию S : 100 _ 1 x xi 0.01 xi -0,06993 n i 1 2 2 _ 100 1 n S2 ( x x ) 0 . 0101 i ( xi 0.6993) 1.24 n 1 i 1 i 1 n 2 S S — исправленная статистическая дисперсия; n 1 _2 S2 _ 1 n ( x x i ) — выборочная дисперсия. n i 1 5. Составим статистическую функцию распределения. Ее значения, составленные по данной случаной выборке, занесены в таблицу 4. x1 -1,99 -1,77 -1,75 -1,60 -1,58 -1,52 -1,43 -1,30 -1,22 -1,215 -1,21 -1,202 -1,063 -1,033 -1,019 -1,008 -0,985 -0,927 -0,882 -0,866 F(x1) 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,1 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 x1 -0,852 -0,838 -0,824 -0,811 -0,78 -0,743 -0,702 -0,679 -0,669 -0,594 -0,578 -0,57 -0,509 -0,498 -0,475 -0,45 -0,441 -0,401 -0,372 -0,337 F(x1) 0,2 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,3 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 x1 -0,329 -0,291 -0,266 -0,244 -0,206 -0,195 -0,093 -0,044 0,033 0,035 0,039 0,049 0,065 0,075 0,085 0,092 0,106 0,130 0,131 0,149 F(x1) 0,4 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,5 0,51 0,52 0,53 0,54 0,55 0,56 0,57 0,58 0,59 Таблица 4 x1 0,183 0,199 0,248 0,263 0,278 0,284 0,287 0,327 0,34 0,344 0,362 0,369 0,392 0,439 0,441 0,472 0,489 0,512 0,597 0,675 F(x1) 0,6 0,61 0,62 0,63 0,64 0,65 0,66 0,67 0,68 0,69 0,7 0,71 0,72 0,73 0,74 0,75 0,76 0,77 0,78 0,79 x1 0,71 0,759 0,763 0,779 0,788 0,824 0,894 0,901 0,986 1,2 1,21 1,32 1,385 1,42 1,453 1,531 1,6 1,694 1,807 2,904 F(x1) 0,8 0,81 0,82 0,83 0,84 0,85 0,86 0,87 0,88 0,89 0,9 0,91 0,92 0,93 0,94 0,95 0,96 0,97 0,98 0,99 6. Группированная выборка. Так как объем данной случайной выборки велик (n = 100), то удобнее пользоваться группированной выборкой, для построения которой в статистическом ряде (табл. 1) заменим каждый интервал его представителем. В качестве представителя i-го интервала возьмем его середину xi* (табл.5). Число вариант mi 8 23 27 27 10 4 1 Таблица 5 xi * -1,62 -0,825 -0,119 0,508 1,28 1,658 2,904 Частоты mi / n 0,08 0,23 0,27 0,27 0,1 0,04 0,01 _* 1) Вычислим статистическое среднее x и статистическую дисперсию _ 2* по группированной выборке: _* 7 1 x xi* mi 0.01 xi* mi 0,09 n i 1 _ 2* S * 2 * 2 n _ _ 1 n ( xi* x ) mi 0.01 ( xi* x ) =0,079 n i 1 i 1 Здесь к- число интервалов, на которые разбита выборка. С учетом поправок _ 2* _ 2* Шеппарда S _ 2 0,0448, статистическое среднее x =-0,09, 12 * _ 2* статистическая дисперсия =0,0448 . 2) Составим статистическую функцию распределения F*(x): 0, 0,035 0,185 0,43 F * ( x) 0,705 0,895 0,97 1 при x 1,62; при 1,62 x 0,825; при 0,825 x 0,119; при 0,119 x 0,508; при 0,508 x 1,28; при 1,28 x 1,658; при 1,658 x 2,904; при x 2,904; Построим график статистической функции распределения F * ( x) , составленной по сгруппированной выборке F * ( x) 0,97 1 1,658 2,904 0,895 0,705 0,43 0,185 0,035 0 -1,62 -0,825 -0,119 0,508 1,28 X 7. Найдем доверительный интервал для математического ожидания . Воспользуемся формулой z S z S X , ;X n n где z - статистика, распределенная асимптотически по нормальному закону. При n 100 можно считать, что S . Значение статистики z определяем из условия P(| zi | z 2( z ) . Пользуясь таблицей значений функции Лапласа для доверительной вероятности 0,95 находим ( z ) 2 0,475 z 1,96 . Значения X 0,06993 и S 1,24 1,1135529 вычислены ранее по случайной выборке. Подставляя указанные значения в формулу, получаем искомый доверительный интервал для математического ожидания 1,96 1,1135529 1,96 1,1135529 ;0,06993 0,06993 100 100 0,1484;0,148070 . Найдем доверительный интервал для дисперсии . Воспользуемся формулой 2 2 S S , ; 2 2 1 z 1 z n n Ранее было найдено z 1,96 , S 2 1,24 . Подставляя указанные значения в формулу, получаем искомый доверительный интервал для дисперсии 1,24 1,24 0,970;1,7155 . ; 1 1,96 0,02 1 1,96 0,02 8. Предположим, что данная случайная выборка распределена по нормальному закону с параметрами a 0 и 1 . Проверим гипотезу о нормальном законе распределения данной случайной выборки при помощи критерия Пирсона: 8 2 i 1 m i npi . npi 2 Для расчета попадания случайной величины X в интервал x i , x i 1 используем функцию Лапласа в соответствии со свойствами нормального распределения: x X x X l p i P ( x i X x i 1 ) l 1 . 2 0,06993 1,31 0,06993 p1 P(1,31 X 2) 1 , 033 1 , 033 1,86 1,20 0,4973 0,4998 0,0025 2,1 0,06993 2,95 0,06993 p 2 P(2,95 X 2,1) 1,97 2,79 1,033 1,033 0,4756 0,4973 0,0217 1,25 0,06993 2,1 0,06993 p3 P(2,1 X 1,25) 1,14 1,97 1,033 1,033 0,3729 0,4756 0,1027 0,4 0,06993 1,25 0,06993 p 4 P(1,25 X 0,4) 0,32 1,14 1,033 1,033 0,1255 0,3729 0,2474 0,45 0,06993 0,4 0,06993 p5 P(0,4 X 0,45) 0,5 0,32 1,033 1,033 0,1915 0,1255 0,317 1,3 0,06993 0,45 0,06993 p 6 P(0,45 X 1,3) 1,33 0,5 1,033 1,033 0,4082 0,1915 0,2167 2,15 0,06993 1,3 0,06993 p 7 P(1,3 X 2,15) 2,15 1,33 1,033 1,033 0,484 0,4082 0,0758 3 0,06993 2,15 0,06993 p8 P(2,15 X 3) (2,97 ) 2,15 1,033 1,033 0,4984 0,484 0,0144 Составим расчетную таблицу Интервалы ai , ai 1 Частоты Вероятности pi mi Теоретически е частоты np i (-3.8;-2,95) (-2,95;-2,1) (-2,1;-1,25) (-1,25;-0,4) (-0,4;0,45) (0,45;1,3) (1,3;2,15) (2,15;3) 1 0 12 26 32 18 10 1 0,25 2,17 10,27 24,74 31,7 21,67 7,58 1,44 0,0025 0,0217 0,1027 0,2474 0,317 0,2167 0,0758 0,0144 m i npi 2 n i npi npi 2 2,42 9,02 2,0164 2,9929 1,5876 0,09 13,4689 3,9204 сумма 0,83 0,29 0,06 0,003 0,62 0,43 2,233 Таким образом, получаем опытное значение критерия оп2 2,233 Найдем пороговое значение критерия Пирсона п2 . Для этого вычислим число степеней свободы q r s 1 6 2 1 3 . По найденному числу степеней свободы и заданному уровню значимости 0,05 находим пороговое значение критерия Пирсона п2 7,8 .Так как оп2 2,233 п2 7,8 , то гипотеза о нормальном законе распределения данной случайной выборки принимается. 9. Составим уравнение линии регрессии, т.е. уравнение кривой, «сглаживающей» гистограмму частот. Это уравнение будем искать в виде y Ae ( xa )2 b2 . Прологарифмируем последнее выражение по основанию e : ( xa ) ln y ln A e b 2 Обозначим 2 ( x a) 2 x 2 2a a2 ln y ln A ln y ln A 2 2 x 2 2 b b b b z ln y , a0 ln A 2a 1 a2 , a1 2 , a2 2 . 2 b b b В этих обозначениях уравнение регрессии примет вид z a2 x 2 a1 x a0 . Так как объем выборки велик , то для нахождения коэффициентов a 0 , a1 и a 2 воспользуемся группированной выборкой, m дополнив ее значениями yi i и z i ln yi n mi n z i ln yi 0,01 -4,61 0,01 -4,61 0,13 -2,04 0,31 -1,17 0,38 -0,97 0,21 -1,56 0,12 -2,12 0,01 -4,61 a1 и a 2 уравнения находим, решая следующую yi * i mi x -3,375 1 -2,525 1 -1,675 11 -0,825 26 0,025 32 0,875 18 1,725 10 2,575 1 Коэффициенты a 0 , систему линейных алгебраических уравнений a 8 x *4 a 8 x *3 a 8 x *2 8 x *2 z ; i 1 i 0 i i i 2 i 1 i 1 i 1 i 1 8 8 8 8 *3 *2 * * a2 xi a1 xi a0 xi xi zi ; i 1 i 1 i 1 i 1 8 8 8 a x *2 a x * a n z . i 1 i 0 i 2 i 1 i 1 i 1 Составим расчетную таблицу xi* -3,375 -2,525 -1,675 -0,825 0,025 0,875 1,725 z xi* z -4,61 15,55875 -4,61 11,64025 -2,04 3,417 -1,17 0,96525 -0,97 -0,02425 -1,56 -1,365 -2,12 -3,657 xi*2 xi*2 z xi*3 xi*4 11,39063 6,375625 2,805625 0,680625 0,000625 0,765625 2,975625 -52,51078125 -29,39163125 -5,723475 -0,79633125 -0,00060625 -1,194375 -6,308325 -38,44335938 -16,09845313 -4,699421875 -0,561515625 1,5625E-05 0,669921875 5,132953125 129,7463379 40,64859414 7,871531641 0,463250391 0,0000004 0,586181641 8,854344141 2,575 -3,2 сумма -4,61 -11,8708 -21,69 14,66425 6,630625 31,625 -30,56718125 -126,4927063 17,07385938 -36,926 43,96518789 232,1354281 Таким образом, получено, что 8 x i 1 * i 3,2 , 8 x i 1 8 *2 i xi*2 z 126,4927063 , i 1 31,625 , 8 x i 1 8 *3 i 36,926 , xi* z 14,66425 , i 1 8 x i 1 *4 i 232,1354281 , 8 z 21,69 . i 1 В результате получаем систему уравнений 232,1354281 a2 36,926 a1 31,625a0 126,4927063 36,926 a2 31,625a1 3,2a0 14,66425 31,625a 3,2a 8a 21,69 2 1 0 Решая систему методом Гаусса, имеем 232,14 -36,926 31,625 -36,926 31,625 -3,2 31,625 -126,49 -3,2 14,66425 8 -21,69 232,14 -36,926 31,625 0 25,75126227 1,830519 0 1,830519299 3,691649 -126,49 -5,45624 -4,45796 232,14 -36,926 31,625 0 25,75126227 1,830519 0 0 3,561527 -126,49 -5,45624 -4,0701 232,14 -36,926 31,625 0 25,75126227 1,830519 0 0 1 -126,49 -5,45624 -1,1428 232,14 -36,926 0 25,75126227 0 0 0 0 1 -90,349 -3,36432 -1,1428 232,14 0 0 0 1 0 0 0 1 -95,1733 -0,13065 -1,1428 1 0 0 -0,40998 0 0 1 0 0 1 -0,13065 -1,1428 Т.е. a0 1,1428 , a1 0,13065 и a2 0,40998 . В результате находим уравнение параболической регрессии z 0,40998 x 2 0,13065 x 1,1428 . Чтобы вернуться к исходному уравнению регрессии, вычислим коэффициенты A , a и b , решив систему уравнений 1 b 2 0,40998 , b 2 2,44, 2a a 0,159393 , 2 0,13065 , b A 0,322. 2 a ln A 1 , 1428 b2 Таким образом, получаем уравнение регрессии y 0,322 e ( x 0 ,159393) 2 2, 4 . Изобразим график полученной функции