Использование административных источников в экономической статистике – Обзор Стивен Вэйл Офис Национальной статистики, Великобритания Coдержание • Определения • Преимущества использования административных данных • Типичные проблемы • Качество административных данных • Использование административных данных на практике • Выводы Узкое определение Data Sources Primary (Statistical) Secondary (Non-statistical) Public Sector Private Sector Широкое определение Data Sources Primary (Statistical) Secondary (Non-statistical) Public Sector Private Sector Административные источники это источники содержащие информацию, которая собирается преимущественно не для статистических целей Аргументы в пользу такого определения • Приватизация некоторых государственных функций • Распространение частных агенств, занимающихся перепродажей данных “продавцов добавленной стоимости” • Интерес пользователей в новых типах данных Преимущества административных данных • Стоимость – Статистические обследования /переписи дороги, административные данные зачастую “бесплатны” • Нагрузка на респондентов - Снижение назрузки на поставщиков данных – Статистика может составляться более часто без дополнителной нагрузки Полезность административных данных • Охват – Полный охват наблюдаемой популяции – Отсутствие ошибки обследования и меньший процент не получения ответов – Лучшие данные по небольшим территориальным единицам • Своевременность (иногда!) • Восприятие общественностью – Использование административных данных может увеличить престиж статистической организации, так как её работа выглядит более эффективной Стоимость переписи населения 2000-2001 • ВБ, €367мл., €6.2 на человека • Австрия, €56мл., €6.9 на человека • Финляндия, €0.8мл, €0.2 на человека Источник: Евростат – Документы переписей населения и жилищ 2000 в ЕС, ЕЗСТ и в странах кандидатах; таблица 22 Типичные проблемы • Административные единицы невсегда совпадают со статистическими единицами • Конверсия с помощью автоматических правил в простых случаях • Профилирование в более сложных случаях – Даёт лучшее понимание сложных бизнес структур – Дорого и требуются подготовленные сотрудники Типичные проблемы • Различные определения и классификации – Приоритеты административных и статистических служб зачастую различны – Конверсионные (ключи) матрицы нужны для разных классификаций • Своевременность – Данные предоставляются слишком поздно – Данные относятся к различным периодам времени Lag in days 1000 950 900 850 800 750 700 650 600 550 500 450 400 350 300 250 200 150 100 50 0 Frequency (thousands) НДС запаздывания (рождения) 200 180 160 140 120 100 80 60 40 20 0 НДС запаздывания (рождения) • 2/3 единиц фиксируются в регистре в течение 2 месяцев после их возникновения • Среднее запаздывание = 4 месяца из-за “крайних значений” • Медиана = примерно 40 дней • Некоторые единицы делают пререгистрацию – негативное запаздывание Типичные проблемы • Изменения в управлении - Риск изменения в политике правительства, пороговые значения, определения, охват и т.п. – Необходим план на непредвиденные обстоятельства • Данные из многочисленных источников – Приведение в соответствие/проблема смыкания данных – Конфликт в данных – правила приоритетности Качество административных данных • Существует много аспектов качества • Aдминистративные данные могут быть лучше данных статистических обследований в одних аспектах, но не в других • Важно принимать во внимание общее качество • Соответствуют ли данные потребностям пользователей? Три аспекта качества • Качество входящих данных • Качество обработки (обеспечение соответствия, объединение, ...) • Качество выходных данных – вероятно отличается от данных, получаемых путём статистических обследований, но лучше ли качество последних? Измерение качества • Как измерить качество данных, получаемых из административных источников? – Сравнение источников – Изучение процедур контроля качества – Знание источников (метаданные) – Отчеты по качеству/ формы Образцы форм контроля качества Companies House Data • Framework: Contract • Frequency: Quarterly updates, continuous on-line access • Timeliness: Good • Quality: Good • Delivery: CD-ROM / Internet • Key content: Legal name, company number Использование административных данных • Приведение к статистическим концепциям и определениям • Смыкание данных/Приведение в соответствие – Точное соответствие – смыкание данных из двух или более источников, часто используя общий идентификатор (код) – Вероятностное установление соответствия – определение вероятности того, что данные из различных источников соответствуют одно другому, используя комбинацию переменных UK Business Register VAT Survey inputs Satellite registers Company registrations Business Register PAYE Geographic information systems Dun and Bradstreet Сателитные регистры Примеры сателитных регистров • Туризм – регистры гостиниц (категория, число кроватей) • Tранспорт – регистр транспортных средств (тип, мощность) • Распределительная торговля (размер здания, торговая площадь) Выводы • Административные источники следует определять в широком смысле • Имеется много полезного в использовании административных данных, особенно их низкая стоимость • Есть также и проблемы с использованием административных данных, но обычно можно найти их решение Выводы • Большая часть проблем может быть снята посредством эффективного планирования и детальным изучением источников • Польза зачастую превышает затраты Спасибо за внимание. Есть ли вопросы? steve.vale@ons.gov.uk