Бюро переписи США Комплексная система десятилетних данных по переписи населения (КСДДПН) Использование устройств высокоскоростной обработки данных по переписи населения Докладчик: Треси Уэсслер 5 июня 2007г. Часто незамечаемые важные моменты • Соответствует ли структура анкеты структуре системы регистрации данных? • Как система предупреждает потерю данных? • Может ли устройство оптического считывания меток правильно выбирать необходимые ответ в сложных ситуациях? • Считается, что эффективное использование устройства оптического распознавания символов требует значительных инвестиций в процесс настройки и тестирования? • Имеет ли системы возможность контроля и обеспечения качества. Аспекты структуры анкеты • Основная причина ошибок системы • Путаница респондентов приводит к ошибкам регистрации данных • Ориентированность на респондента в сравнении с ориентированностью на систему. • Влияние на точность регистрации данных • Анкеты рассматриваются как исходные данные для системы регистрации, включая аспекты изменчивости данных респондентов. Структура анкет обеспечивает факторы проведения переписи • Создание репрезентативной группы специалистов в области содержания, структуры, печати и рассылки анкет, а также регистрации данных. • Учет производителями устройств всех трудностей, взаимодействий и альтернатив. • Технологически современные системы способны обрабатывать формы, ориентированные на респондента, в отличие от форм, ориентированных на компьютерную обработку. Предупреждение потери данных • Как система обеспечивает контроль данных? • Отслеживание штрих-кода • Выявление двойной подачи во время сканирования • Процесс подтверждения анкет • Подтверждение данных (получение данных) Аспекты ОСМ • Определяется как сбор данных из многорядных клеток анкет • Уделяется внимание оптическому распознаванию ответа. Для Бюро переписи важно знать ответ респондента, а не содержание символов клетки анкеты. • Устройство оптического распознавания ответа является специальной формой ОСМ– многие устройства ОСМ не проводят оптического распознавания ответа Аспекты оптического распознавания символов • Остерегается чрезмерных заявлений продавцов о точности данных • Бюро переписи надеется на получение большого уровня зарегистрированных данных с помощью ОРС (80% или выше) и высокий процент точности (99% или выше, определенный на местах), что требует значительных инвестиций в развитие Аспекты оптического распознавания символов • Для Бюро переписи рентабельность капиталовложений является очень важным для большей части анкет в связи с большими объемами переписи. • Например, до разработки программы по переписи 2000 и использования ОРС, было невозможно зарегистрировать полные имена со всех анкет. Регистрация имен имела большое значение для решения проблемы дублирования. Качество данных • Опыт БП показывает, что многие имеющиеся в продаже приложения не включают соответствующий контроль и обеспечение качества данных. • Основное внимание БП – обеспечение качества всего процесса • Одного тестирования недостаточно для обеспечения качества данных – даже самая тщательная проверка не может полностью воспроизвести реальную ситуацию с переписью населения. • Качество данных оценивается в ходе действительного процесса их обработки, так выявляются и исправляются ошибки