Преимущества административных данных

реклама
Использование
административных источников
в экономической статистике –
Обзор
Стивен Вэйл
Офис Национальной статистики,
Великобритания
Coдержание
• Определения
• Преимущества использования
административных данных
• Типичные проблемы
• Качество административных данных
• Использование административных
данных на практике
• Выводы
Узкое определение
Data Sources
Primary
(Statistical)
Secondary
(Non-statistical)
Public
Sector
Private
Sector
Широкое определение
Data Sources
Primary
(Statistical)
Secondary
(Non-statistical)
Public
Sector
Private
Sector
Административные источники
это источники содержащие
информацию, которая
собирается преимущественно
не для статистических целей
Аргументы в пользу такого
определения
• Приватизация некоторых
государственных функций
• Распространение частных агенств,
занимающихся перепродажей данных “продавцов добавленной стоимости”
• Интерес пользователей в новых типах
данных
Преимущества
административных данных
• Стоимость
– Статистические обследования /переписи
дороги, административные данные
зачастую “бесплатны”
• Нагрузка на респондентов
- Снижение назрузки на поставщиков
данных
– Статистика может составляться более
часто без дополнителной нагрузки
Полезность административных
данных
• Охват
– Полный охват наблюдаемой популяции
– Отсутствие ошибки обследования и меньший
процент не получения ответов
– Лучшие данные по небольшим
территориальным единицам
• Своевременность (иногда!)
• Восприятие общественностью
– Использование административных данных
может увеличить престиж статистической
организации, так как её работа выглядит
более эффективной
Стоимость переписи населения
2000-2001
• ВБ, €367мл., €6.2 на человека
• Австрия, €56мл., €6.9 на человека
• Финляндия, €0.8мл, €0.2 на
человека
Источник: Евростат – Документы переписей
населения и жилищ 2000 в ЕС, ЕЗСТ и в
странах кандидатах; таблица 22
Типичные проблемы
• Административные единицы невсегда
совпадают со статистическими единицами
• Конверсия с помощью автоматических
правил в простых случаях
• Профилирование в более сложных
случаях
– Даёт лучшее понимание сложных бизнес
структур
– Дорого и требуются подготовленные
сотрудники
Типичные проблемы
• Различные определения и классификации
– Приоритеты административных и
статистических служб зачастую различны
– Конверсионные (ключи) матрицы нужны для
разных классификаций
• Своевременность
– Данные предоставляются слишком поздно
– Данные относятся к различным периодам
времени
Lag in days
1000
950
900
850
800
750
700
650
600
550
500
450
400
350
300
250
200
150
100
50
0
Frequency (thousands)
НДС запаздывания (рождения)
200
180
160
140
120
100
80
60
40
20
0
НДС запаздывания (рождения)
• 2/3 единиц фиксируются в регистре в
течение 2 месяцев после их
возникновения
• Среднее запаздывание = 4 месяца из-за
“крайних значений”
• Медиана = примерно 40 дней
• Некоторые единицы делают
пререгистрацию – негативное
запаздывание
Типичные проблемы
• Изменения в управлении
- Риск изменения в политике правительства,
пороговые значения, определения, охват и
т.п.
– Необходим план на непредвиденные
обстоятельства
• Данные из многочисленных источников
– Приведение в соответствие/проблема смыкания
данных
– Конфликт в данных – правила приоритетности
Качество
административных данных
• Существует много аспектов качества
• Aдминистративные данные могут быть
лучше данных статистических
обследований в одних аспектах, но не в
других
• Важно принимать во внимание общее
качество
• Соответствуют ли данные потребностям
пользователей?
Три аспекта качества
• Качество входящих данных
• Качество обработки (обеспечение
соответствия, объединение, ...)
• Качество выходных данных –
вероятно отличается от
данных, получаемых путём
статистических обследований, но
лучше ли качество последних?
Измерение качества
• Как измерить качество данных,
получаемых из административных
источников?
– Сравнение источников
– Изучение процедур контроля качества
– Знание источников (метаданные)
– Отчеты по качеству/ формы
Образцы форм контроля качества
Companies House Data
• Framework: Contract
• Frequency: Quarterly updates, continuous
on-line access
• Timeliness: Good
• Quality:
Good
• Delivery:
CD-ROM / Internet
• Key content: Legal name, company number
Использование
административных данных
• Приведение к статистическим
концепциям и определениям
• Смыкание данных/Приведение в
соответствие
– Точное соответствие – смыкание данных из
двух или более источников, часто
используя общий идентификатор (код)
– Вероятностное установление соответствия
– определение вероятности того, что
данные из различных источников
соответствуют одно другому, используя
комбинацию переменных
UK Business Register
VAT
Survey
inputs
Satellite
registers
Company
registrations
Business
Register
PAYE
Geographic
information
systems
Dun and
Bradstreet
Сателитные регистры
Примеры сателитных регистров
• Туризм – регистры гостиниц
(категория, число кроватей)
• Tранспорт – регистр транспортных
средств (тип, мощность)
• Распределительная торговля
(размер здания, торговая площадь)
Выводы
• Административные источники следует
определять в широком смысле
• Имеется много полезного в
использовании административных
данных, особенно их низкая стоимость
• Есть также и проблемы с
использованием административных
данных, но обычно можно найти их
решение
Выводы
• Большая часть проблем может
быть снята посредством
эффективного планирования и
детальным изучением источников
• Польза зачастую превышает
затраты
Спасибо за внимание.
Есть ли вопросы?
steve.vale@ons.gov.uk
Скачать