АНАЛИЗ ОСНОВНОЙ БАЗЫ ДАННЫХ (С ПОМОЩЬЮ EXCEL) И ИНТЕРПРЕТАЦИЯ ДАННЫХ Основные средства: частота, перекрестные таблицы, среднее значение, медиана, доля и процент Частота Что? Количество раз появления основных значений и класса значений Для чего? Это способ свода данных Частота Пример: Количество студентов по уровню МСКО (Международная стандартная классификация образования) в Италии, 2008 Классификация МСКО МСКО 0 МСКО 1 МСКО 2 МСКО 3 МСКО 4 МСКО 5 и 6 Итого Источник: Евростат Частота 1,655,386 2,865,613 1,756,003 2,847,785 27,094 2,013,856 11,165,737 Относительная частота (пропорции) Пример: Количество студентов по уровню МСКО в Италии, 2008 Классификация МСКО МСКО 0 МСКО 1 МСКО 2 МСКО 3 МСКО 4 МСКО 5 и 6 Итого Частота 1,655,386 2,865,613 1,756,003 2,847,785 27,094 2,013,856 11,165,737 Относительная частота 0.15 0.26 0.16 0.26 0.00 0.18 1.00 2,013,856 =0.18 11,165,737 Источник: Евростат 18% студентов в Италии получили высшее образование (МСКО 5 и 6) в 2008 Интегральная частота Пример: Количество студентов по уровню МСКО в Италии, 2008 Классификация МСКО МСКО 0 МСКО 1 МСКО 2 МСКО 3 МСКО 4 МСКО 5 и 6 Итого Частота 1,655,386 2,865,613 1,756,003 2,847,785 27,094 2,013,856 11,165,737 Источник: Евростат Относительная частота 0.15 0.26 0.16 0.26 0.00 0.18 1.00 Интегральная частота 0.15 0.40 0.56 0.82 0.82 1.00 0.40 + 0.16 =0.56 Перекрестные таблицы • Используются для анализа данных по категориям (пол, уровень образования и т.д.) • Двух (или более) мерные таблицы, в которые записывают количество (частоту) респондентов, со специфическими характеристиками, указанные в ячейках таблицы. Учебное заведение 1 Учебное заведение 2 Студенты женского пола 55% 20% Студенты мужского пола 45% 80% Всего 100% 100% Среднее значение Что? Сумма всех значений разделенное на количество значений (среднее арифметическое), применительно к количественным переменным Для чего? Для обобщения данных и их сравнения Недостатки Среднее значение зависит от крайних значений (например, от переменных дохода) Медиана Что? Середина данных после классификации (или среднее двух средних чисел, в случае, если сумма является четной). Таким образом, количество чисел ниже медианы является таким же как и выше медианы. Для чего? Для обобщения данных и их сравнения Преимущества Медиана не зависит от крайних значений Среднее значение и медиана Пример: индивидуальная зарплата в год Персона А Персона Б Персона В Персона Г Персона Д Итоговая зарплата в год 8,000 евро 15,000 евро 20,000 евро 30,000 евро 200,000 евро Среднее:54,600 евро Медиана:20,000 евро Cкорость/уровень и доля Что? Соотношение между двумя значениями, которое может быть выражено, например, в процентах. В чем разница? Смотрите примеры Пример: Доля(распределение) занятого населения по уровню образованности (%) в Италии, 2009 МСКО 0-2 МСКО 3-4 МСКО 5-6 Итого 36.7 46.1 17.2 100.0 Описание Распределение(доля) занятого населения по уровню образованности представляет собой работников на рабочих местах с определенным уровнем образования в процентах от общей численности занятого населения. Пример: Уровень занятости по уровню образованности (15-64, %) в Италии, 2009 МСКО 0-2 МСКО 3-4 МСКО 5-6 Итого 44.5 66.5 77.0 57.5 Определение Уровень занятости представляет собой работников на рабочих местах (с определенным уровнем образования) в процентах населения трудоспособного возраста (15- 64 лет) (с определенным уровнем образования). Сравнение по всей стране Пример: Страна А Общее число безработных: Рабочая сила (женщины): - Безработные (женщины) - Работающие (женщины) 1,000 10,000 800 9,200 Доля безработных женщин (из общего числа безработных): Страна A: Страна Б: 800/1000 = 80% 800/1000 = 80% Страна Б Общее число безработных : Рабочая сила (женщины): - Безработные (женщины) - Работающие (женщины) 1,000 1,600 800 800 Уровень безработицы среди женщин (соотношение безработных и работающих женщин): Страна А: 800/10,000 = 8% Страна Б: 800/1,600 = 50% ИНТЕРПРЕТАЦИЯ ОСНОВНЫХ ДАННЫХ: ПРИМЕРЫ Пример 1 Пример 1 Интерпретация: В первом примере, мы видим вопрос о выборе языка для ответов на вопросник. На этом гипотетическом примере мы видим , что было 8 респондентов, из которых 7 ответивших на этот вопрос и один не ответивший. График показывает распределение ответов 7 респондентов, ответивших на вопрос. Мы можем сказать, что 28,57% респондентов выбрали киргизский язык для заполнения вопросника и 71,43% респондентов выбрали русский язык для заполнения вопросника. Пример 2 Пример 2 Интерпретация: Во втором примере мы видим вопрос «Работаете ли Вы в настоящий момент?» На этом гипотетическом примере мы видим, что было 8 респондентов, из которых 6 ответили и 2 респондента не ответили. График показывает распределение ответов 6 респондентов, которые ответили на вопрос. Мы можем сказать, что 16,67% (то есть 1 человек) респондентов работали в момент интервью, 33,33% (то есть 2 человека) из 6 респондентов не работали и искали работу в то же время. И наконец, 50% респондентов (то есть 3 человека) не работали и не искали работу во время интервью. Пример 3 Пример 3 Интерпретация: Здесь мы анализируем вопрос о выборе профессии. Это был вопрос с несколькими вариантами ответа. Таким образом, респонденты могли выбрать несколько вариантов ответа. Здесь мы видим, что из 8 респондентов, 6 ответили на вопрос. Из этих шести, 83,33% сами выбрали свою профессию, кроме того, 16,67% из шести респондентов заявили, что это был (также) выбор их родителей и т.д. Пример 4 да Q2: Мужской Q2: Женский Total Respondents 33.33% 1 0% 0 1 нет, но я ищу работу 33.33% 1 50% 1 2 нет и я не ищу работу 33.33% 1 50% 1 2 Total 3 2 5 Пример 4 Интерпретация: Этот пример имеет дело с составлением таблиц (т.е. мы учитываем две переменные одновременно – гендерную и нынешнюю ситуацию занятости). В таблице и на графике в этом гипотетическом примере мы видим, что есть 2 женщины и 3 мужчин. 50% женщин (т.е. 1 человек) не работали на момент интервью, но искали работу. Другие 50% (т.е. 1 человек) не работал и не искал работу, в то же время. В случае мужчин, 33,3% из них работали (т.е.1 из 3 мужчин респондентов) , 33,3% не работали, но искали работу и другие 33,3% опрошенных мужчин не работали и не искали работу.