АНАЛИЗ ОСНОВНОЙ БАЗЫ ДАННЫХ (С ПОМОЩЬЮ EXCEL) И ИНТЕРПРЕТАЦИЯ ДАННЫХ

реклама
АНАЛИЗ ОСНОВНОЙ БАЗЫ ДАННЫХ (С
ПОМОЩЬЮ EXCEL) И ИНТЕРПРЕТАЦИЯ
ДАННЫХ
Основные средства: частота, перекрестные
таблицы, среднее значение, медиана, доля и
процент
Частота
Что?
Количество раз появления основных значений и класса значений
Для чего?
Это способ свода данных
Частота
Пример: Количество студентов по уровню МСКО (Международная стандартная
классификация образования) в Италии, 2008
Классификация МСКО
МСКО 0
МСКО 1
МСКО 2
МСКО 3
МСКО 4
МСКО 5 и 6
Итого
Источник: Евростат
Частота
1,655,386
2,865,613
1,756,003
2,847,785
27,094
2,013,856
11,165,737
Относительная частота (пропорции)
Пример: Количество студентов по уровню МСКО в Италии, 2008
Классификация
МСКО
МСКО 0
МСКО 1
МСКО 2
МСКО 3
МСКО 4
МСКО 5 и 6
Итого
Частота
1,655,386
2,865,613
1,756,003
2,847,785
27,094
2,013,856
11,165,737
Относительная
частота
0.15
0.26
0.16
0.26
0.00
0.18
1.00
2,013,856
=0.18
11,165,737
Источник: Евростат
18% студентов в Италии
получили высшее
образование (МСКО 5 и
6) в 2008
Интегральная частота
Пример: Количество студентов по уровню МСКО в Италии, 2008
Классификация
МСКО
МСКО 0
МСКО 1
МСКО 2
МСКО 3
МСКО 4
МСКО 5 и 6
Итого
Частота
1,655,386
2,865,613
1,756,003
2,847,785
27,094
2,013,856
11,165,737
Источник: Евростат
Относительная
частота
0.15
0.26
0.16
0.26
0.00
0.18
1.00
Интегральная
частота
0.15
0.40
0.56
0.82
0.82
1.00
0.40 + 0.16 =0.56
Перекрестные таблицы
• Используются для анализа данных по категориям
(пол, уровень образования и т.д.)
• Двух (или более) мерные таблицы, в которые
записывают количество (частоту) респондентов, со
специфическими характеристиками, указанные в
ячейках таблицы.
Учебное
заведение 1
Учебное
заведение 2
Студенты
женского пола
55%
20%
Студенты
мужского пола
45%
80%
Всего
100%
100%
Среднее значение
Что?
Сумма всех значений разделенное на количество
значений (среднее арифметическое), применительно к
количественным переменным
Для чего?
Для обобщения данных и их сравнения
Недостатки
Среднее значение зависит от крайних значений
(например, от переменных дохода)
Медиана
Что?
Середина данных после классификации (или среднее двух
средних чисел, в случае, если сумма является четной). Таким
образом, количество чисел ниже медианы является таким же как
и выше медианы.
Для чего?
Для обобщения данных и их сравнения
Преимущества
Медиана не зависит от крайних значений
Среднее значение и медиана
Пример: индивидуальная зарплата в год
Персона А
Персона Б
Персона В
Персона Г
Персона Д
Итоговая зарплата в год
8,000 евро
15,000 евро
20,000 евро
30,000 евро
200,000 евро
Среднее:54,600 евро
Медиана:20,000
евро
Cкорость/уровень и доля
Что?
Соотношение между двумя значениями, которое может быть
выражено, например, в процентах.
В чем разница?
Смотрите примеры
Пример: Доля(распределение) занятого населения по уровню образованности (%) в Италии, 2009
МСКО 0-2
МСКО 3-4
МСКО 5-6
Итого
36.7
46.1
17.2
100.0
Описание
Распределение(доля) занятого
населения по уровню
образованности представляет
собой работников на рабочих
местах с определенным
уровнем образования в
процентах от общей
численности занятого
населения.
Пример: Уровень занятости по уровню образованности (15-64, %) в Италии, 2009
МСКО 0-2
МСКО 3-4
МСКО 5-6
Итого
44.5
66.5
77.0
57.5
Определение
Уровень занятости
представляет собой работников
на рабочих местах (с
определенным уровнем
образования) в процентах
населения трудоспособного
возраста (15- 64 лет) (с
определенным уровнем
образования).
Сравнение по всей стране
Пример:
Страна А
Общее число безработных:
Рабочая сила (женщины):
- Безработные (женщины)
- Работающие (женщины)
1,000
10,000
800
9,200
Доля безработных женщин
(из общего числа безработных):
Страна A:
Страна Б:
800/1000 = 80%
800/1000 = 80%
Страна Б
Общее число безработных :
Рабочая сила (женщины):
- Безработные (женщины)
- Работающие (женщины)
1,000
1,600
800
800
Уровень безработицы среди женщин
(соотношение безработных и
работающих женщин):
Страна А: 800/10,000 = 8%
Страна Б: 800/1,600 = 50%
ИНТЕРПРЕТАЦИЯ ОСНОВНЫХ
ДАННЫХ: ПРИМЕРЫ
Пример 1
Пример 1
Интерпретация:
В первом примере, мы видим вопрос о выборе языка для ответов на
вопросник. На этом гипотетическом примере мы видим , что было 8
респондентов, из которых 7 ответивших на этот вопрос и один не
ответивший. График показывает распределение ответов 7 респондентов,
ответивших на вопрос. Мы можем сказать, что 28,57% респондентов
выбрали киргизский язык для заполнения вопросника и 71,43%
респондентов выбрали русский язык для заполнения вопросника.
Пример 2
Пример 2
Интерпретация:
Во втором примере мы видим вопрос «Работаете ли Вы в настоящий
момент?» На этом гипотетическом примере мы видим, что было 8
респондентов, из которых 6 ответили и 2 респондента не ответили.
График показывает распределение ответов 6 респондентов, которые
ответили на вопрос. Мы можем сказать, что 16,67% (то есть 1 человек)
респондентов работали в момент интервью, 33,33% (то есть 2 человека)
из 6 респондентов не работали и искали работу в то же время. И
наконец, 50% респондентов (то есть 3 человека) не работали и не
искали работу во время интервью.
Пример 3
Пример 3
Интерпретация:
Здесь мы анализируем вопрос о выборе профессии. Это был
вопрос с несколькими вариантами ответа. Таким образом,
респонденты могли выбрать несколько вариантов ответа.
Здесь мы видим, что из 8 респондентов, 6 ответили на вопрос.
Из этих шести, 83,33% сами выбрали свою профессию, кроме
того, 16,67% из шести респондентов заявили, что это был
(также) выбор их родителей и т.д.
Пример 4
да
Q2: Мужской
Q2: Женский
Total Respondents
33.33%
1
0%
0
1
нет, но я ищу работу
33.33%
1
50%
1
2
нет и я не ищу работу
33.33%
1
50%
1
2
Total
3
2
5
Пример 4
Интерпретация:
Этот пример имеет дело с составлением таблиц (т.е. мы учитываем
две переменные одновременно – гендерную и нынешнюю ситуацию
занятости). В таблице и на графике в этом гипотетическом примере мы
видим, что есть 2 женщины и 3 мужчин. 50% женщин (т.е. 1 человек) не
работали на момент интервью, но искали работу. Другие 50% (т.е. 1
человек) не работал и не искал работу, в то же время. В случае
мужчин, 33,3% из них работали (т.е.1 из 3 мужчин респондентов) ,
33,3% не работали, но искали работу и другие 33,3% опрошенных
мужчин не работали и не искали работу.
Скачать