ХАРАКТЕРИСТИКИ ВАРИАЦИОННОГО РЯДА. СТРУКТУРНЫЕ СРЕДНИЕ

реклама
ХАРАКТЕРИСТИКИ ВАРИАЦИОННОГО РЯДА.
СТРУКТУРНЫЕ СРЕДНИЕ
Мода
–
значение
признака,
наиболее
часто
встречающегося в исследуемой совокупности.
Медиана
–
значение
признака,
приходящееся
на
середину ранжированной (упорядоченной) совокупности.
Для дискретных вариационных рядов модой будет значение
варианта с наибольшей частотой. Вычисление медианы в
дискретных рядах распределения имеет специфику. Если такой
ряд распределения имеет нечётное число членов, то медианой
будет вариант, находящийся в середине ранжированного ряда.
Если ранжированный ряд распределения состоит из чётного
числа членов, то медианой будет средняя арифметическая из
двух значений признака, расположенных в середине ряда.
Пример. Рассчитаем моду и медиану по данным табл. 7.10.
Т а б л и ц а 7.10.
Распределение обуви, проданной коммерческой фирмой в
январе 2008г.
40 41 42
44 и
Размер
34 35 36 37 38 39
43
Итого
Me
Mo
более
Количество
проданных
пар, % к
3
5
7
9 10 13 15 14 20
3
8 15 24 34 47 62
3
1
100
итогу
Накопленные
частоты
-
В этом ряду распределения мода равна 42. Именно этот размер обуви в
январе 2008 г. пользовался наибольшим спросом.
Для определения медианы надо подсчитать сумму накопленных частот ряда.
Наращивание продолжается до получения накопленной суммы частот, впервые
превышающей половину. В нашем примере сумма частот составила 100, её
половина – 50. Накопленная сумма частот ряда равна 62. Ей соответствует
значение признака равное 40. Таким образом, 40-й размер обуви является
медианным.
Для интервальных вариационных рядов мода определяется по
формуле:
Mo  x
Mo
i
f
f
Mo1
,
Mo (f
f
)  (f
f
)
Mo
Mo
Mo1
Mo1

Mo
где xMo – нижняя граница значения интервала, содержащего
моду;
iMo – величина модального интервала;
fMo – частота модального интервала;
fMo–1
–
частота
интервала,
предшествующего
модальному;
fMo+1 – частота интервала, следующего за модальным.
Медиана интервального ряда распределения определяется
по формуле:
1
 f  S Me1
Me  x
i
2
Me Me
,
f
Me
где
xMe – нижняя граница значения интервала,
содержащего медиану;
iMe – величина медианного интервала;
∑f – сумма частот;
SMe-1 – сумма накопленных частот, предшествующих
медианному интервалу;
fMe – частота медианного интервала.
Пример. Рассчитаем моду и медиану по данным табл. 7.11.
Mo  700  100 
2500  1700
 772 руб.
(2500  1700)  (2500  2200)
Следовательно, наибольшее число семей имеют среднедушевой доход 772 руб.
1
10000  3000
Me  700  100  2
 780 руб.
2500
Таким образом, половина семей города имеет среднедушевой доход менее 780 руб.,
остальные семьи – более 780 руб.
Т а б л и ц а 7.11.
Распределение семей города по размеру
среднедушевого дохода в январе 1998 г.
Группы
семей по
размеру
дохода, руб.
До 500
Число семей
fi
Накопление
частоты
Накопление
частоты, % к
итогу
600
600
6
500 – 600
700
1300
13
600 – 700Me
170
3000
30
700 – 800
2500
5500
55
800 – 900
2200
7700
77
900 – 1000
1500
9200
92
Свыше 1000
800
10000
100
Итого
10000
-
-
Mo
∑fi
Аналогично с нахождением медианы в вариационных рядах можно отыскать
значение признака у любой по порядку единицы ранжированного ряда. Например,
можно найти значение признака у единиц, делящих ряд на четыре равных части,
десять или сто частей. Эти величины называются «квартили», «децили» и
«перцентили».
Квартили
делящее
представляют собой значение
ранжированную
совокупность
на
признака,
четыре
равновеликие части. Различают квартиль нижний (Q1),
отделяющий ¼ часть совокупности с наименьшим значением
признака, и квартиль верхний (Q3), отсекающий ¼ часть с
наибольшими значениями признака. Это означает, что 25%
единиц будут заключены меньше по величине Q1; 25%
единиц будут заключены между Q1 и Q2; 25% - между Q2 и Q3
и остальные 25% превосходят Q3. Средним квартилем Q2
является медиана.
Для
расчёта
квартилей
по
интервальному
вариационному ряду используют формулы:
1
 f  SQ
4
11
Q  x i
1
Q
f
1
Q
1
3
 f  SQ
4
31
Q  x i
3
Q
f
3
Q
3
;
,
где xQ1 – нижняя граница интервала, содержащего нижний
квартиль (интервал определяется по накопленной частоте,
первой превышающей 25%);
xQ3 – нижняя граница интервала, содержащего верхний
квартиль
(интервал определяется по накопленной частоте,
первой превышающей 75%);
SQ1-1 – накопленная частота интервала, предшествующего
интервалу, содержащему нижний квартиль;
SQ3-1 – накопленная частота интервала, предшествующего
интервалу, содержащему верхний квартиль;
fQ1 – частота интервала, содержащего нижний квартиль;
fQ3 – то же для верхнего квартиля.
Рассмотрим расчёт нижнего и верхнего квартилей по данным табл.
7.11. Нижний квартиль находится в интервале 600-700, накопленная
частота которого равна 30%. Верхний квартиль лежит в интервале 800900 с накопленной частотой 77%. Поэтому получим:
1

 10000  1300 
  671
Q  600  100 4
1


1700
руб.




3
10000  5500
Q  800  100  4
 891 руб.
3
2200
Вывод: 25% семей имеют среднедушевой доход менее 671 руб.,
25% семей – свыше 891 руб., а остальные имеют доход в пределах
671 – 891 руб.
Децили – вариации, делящие ранжированный ряд на десять
равных
частей.
Первый
дециль
d1
делит
совокупность
в
соотношении 1/10 к 9/10; второй дециль d2 – в соотношении 2/10 к
8/10 и т. д.
Вычисляются они по той же схеме, что медиана и квартили:
1
 f i  Sd11
d  x  i 10
1
di
fd
1
2
 f i  Sd21
d  x  i 10
2
di
fd
2
Значения признака, делящие ряд на сто частей, называются
перцентилями.
Характеристики,
применяемые
для
изучения
структуры
вариационного ряда, позволяют глубоко и детально охарактеризовать
совокупность.
Децили
Перцентили
Медиана
Квартили
Моменты распределения
Для характеристики вариационных рядов используют
начальные и центральные моменты k-того порядка.
Начальные моменты обозначаются через m :
 
k
 xi f i
m 
.
k
f
 i
Тогда начальный момент первого порядка:
 xi f i
m1 
x
 fi
(средняя арифметическая);
начальный момент второго порядка:
 xi 

2
m2
 fi
fi
x
2
;
начальный момент третьего порядка:
 xi  f i
3

x
3
m3
Практически
 fi
при
анализе
и т. д.
вариационных
рядов
ограничиваются расчётом моментов первых четырёх порядков.
Центральные моменты
записать в общем виде:
обозначаются через
k,
можно

 xi  x
 
k
 fi

k
fi
,
а моменты первых четырёх порядков в виде:


 xi  x f i
1 
 fi

2
=0;
3
 xi  x f i
3 
 fi
2


x

x
fi
 i

 fi
 xi  x 

4
4
;
 fi
=2;
fi
.
Как видно из записанных формул, центральный момент
второго порядка представляет собой не что иное, как дисперсию.
Центральный момент третьего порядка (3) используется для
характеристики
асимметричности
распределения,
ибо
для
симметричных рядов всегда:
3
 x  x  0 .
Момент k-того порядка mk – это средняя арифметическая kй степени отклонений отдельных вариантов от какой-то
велечины.
Скачать