Пример расчета показателей описательной статистики для заработных плат. Мода Мода – наиболее частое значение, встречающееся в выборке. Пример: 80 000, 82 000, 82 000, 85 000, 85 000, 85 000, 87 000, 90 000, 92 000, 95 000 В приведенном примере модой является «85 000», так как встречается в выборке 3 раза. Медиана Медиана – это серединное значение упорядоченной выборки данных. Важно: перед расчетом медианы выборка всегда упорядочивается по возрастанию, от меньшего значения к большему. Если n – количество наблюдений в выборке, то медиана рассчитывается следующим образом: 𝟏 ∗ (𝒏 + 𝟏) 𝟐 Это дает нам порядковый номер медианы в выборке для выборки, где количество наблюдений n – нечетно. Пример: 80 000, 82 000, 82 000, 85 000, 85 000, 85 000, 87 000, 90 000, 92 000, 95 000, 98 000 n =11 1 ∗ (11 + 1) = 6 2 Таким образом, медианой в примере является наблюдение под номером «6» - 85 000 В случае, когда количество наблюдений n – четно. Считаем все по той же формуле, но берем среднее между центральными значениями в выборке. Пример: 80 000, 82 000, 82 000, 85 000, 85 000, 85 000, 87 000, 90 000, 92 000, 95 000 n=10 1 ∗ (10 + 1) = 5.5 2 Значит, медиана выборки лежит между порядковыми значениями «5» и «6». 85000+85000 Медиана= 2 =85000 Квартили Квартили делят упорядоченную выборку данных на 4 равные части. Q1 – нижняя квартиль, которая представляет данные меньше или равные 25% упорядоченного ряда данных. Q3 – высшая квартиль, которая представляет данные меньше или равные 75% упорядоченного ряда. Q2 всегда соответствует медиане и представляет данные соответственно меньше или равные 50%. Важно: перед расчетом квартилей выборка всегда упорядочивается по возрастанию, от меньшего значения к большему. Чтобы рассчитать квартили, сначала находим их порядковые номера. Если n - количество 1 3 4 4 наблюдений в выборке, то n - это порядковый номер для Q1, а n – это порядковый 1 номер для Q3. Допустим, что n - это r, тогда 𝑦𝑟 – это значение из выборки, которое ему 4 соответствует, а 𝑦𝑟+1 – это следующее значение из выборки. Тоже самое верно и для Q3. Если полученные порядковые номера являются целыми числами, то расчет квартилей делается по следующим формулам: 1 ∗ (𝑦𝑟 + 𝑦𝑟+1 ) 2 1 𝑄3 = ∗ (𝑦𝑟 + 𝑦𝑟+1 ) 2 𝑄1 = Если полученные порядковые номера являются нецелыми числами, то Q1= 𝑦𝑟+1 , Q3= 𝑦𝑟+1 . Значение порядкового номера квартили (r) округляется всегда в большую 1 сторону, то есть, если n = 17.25, Q1 будет значение, соответствующее не 17, а 18. 4 Пример (где r – целые числа) 80 000, 82 000, 82 000, 85 000, 85 000, 85 000, 87 000, 90 000, 92 000, 95 000, 98 000, 100 000 n=12 1 3 1 3 4 4 4 4 Считаем n и n. n =3, n=9. То есть r для Q1 равно 3, а для Q3 равно 9, и это целые числа. Подставляем значения в формулы. 1 1 2 1 2 1 2 2 𝑄1 = ∗ (𝑦3 + 𝑦3+1 )= *(82000+85000)=83500 𝑄1 = ∗ (𝑦9 + 𝑦9+1 )= *(92000+95000)=93500 Пример (где r – нецелые числа) 80 000, 82 000, 82 000, 85 000, 85 000, 85 000, 87 000, 90 000, 92 000, 95 000 n=10 1 3 1 3 4 4 4 4 Считаем n и n. n =2.5, n=7.5. Значения для Q1 и Q3 лежат между r и r+1. Для Q1 это 2 и 3, для Q3 это 7 и 8. Округляем в большую сторону и получаем, что Q1 соответствует значение с порядковым номер 3, а для Q3 с порядковым номером 8. Q1 = 82000, Q3 = 90000