Опыт использования сканеров К.С.Абдиев Агентство Республики Казахстан по статистике Информационно-вычислительный центр Первая национальная перепись населения • Организация 5 кустовых центров обработки данных • Обработано более 3 млн бланков в каждом из центров • ИВЦ (г.Алматы) – создание центральной БД переписи населения Табл.1 Основные показатели по объему обработанных данных Центры обработки Кол-во сканер ов, шт Кол-во переписных бланков, шт Кол-во портфелей шт Кол-во бланков обработанных одним сканером, шт Продолжительность обработки, дни Обработано бланков за один день, шт Алматинский 3 4743300 15800 1581100 102 46503 Актюбинский 2 3402191 11420 1701096 110 30929 ВосточноКазахстанский 2 3000123 10040 1500062 90 33335 Карагандинск. 2 4590000 14027 2295000 120 38250 ЮжноКазахстанский 2 3710657 12847 1855329 90 41230 Всего 11 19446271 64134 Табл.2 Количество работников, участвовавших в обработке данных Центры обработки КоррекОператоры Специалисты тировщики по технического подготовке обслуживания бланков для сканера Всего, чел Алматинский 90 36 3 129 Актюбинский 60 21 3 84 ВосточноКазахстанский 68 12 2 82 Карагандинский 66 16 2 84 ЮжноКазахстанский 68 16 4 88 Всего 352 101 14 467 ScanStar 5045C • Скорость сканирования – до 50 бланков в мин., фактическая – 30 бланков • Формат – А4, разрешимость 200 точек на дюйм • 150 бланков на один лоток (максимально – 300) Программное обеспечение • BUSY • ImagePort • JobScan • RecoStar Схема технологического процесса Задачи кустовых центров • • • • • • • • • Сканирование переписных листов Распознавание содержимого бланков Корректировка в среде BUSY, в три этапа - первичная, основная и с использованием имиджа Контроль на целостность данных - арифметический, логический и межбланочный Автоматическое кодирование, преобразование данных Загрузка преобразованных данных в СУБД Access Корректировка в среде СУБД Access с использованием имиджа Контроль информации в разрезе районов по основным показателям Архивирование, запись на CD-ROM или дискеты и передача в республиканский центр Задачи центрального уровня • • • • • • • • Прием информации с региональных центров Контроль информации на полноту и по основным показателям в разрезе районов (СУБД Access ) Создание базы данных по области (СУБД MS SQL Server ) Формирование таблиц по разделам Резервное копирование Анализ данных и их уточнение с областными управлениями Загрузка базы данных в разрезе областей в центральную базу Формирование сводных таблиц и генерация отчетов Прикладные программы, разработанные для обеспечения этапов обработки Image Port , JobScan, Recostar, BUSY: • • • • Создание описаний документов Разработка системы контроля введенной информации Разработка программ корректировки данных Разработка программ преобразования данных и занесения информации из системы Busy в итоговую базу данных Visual C++ , Access , MS SQL: • Программы контроля, корректировки данных, выгруженных из системы Busy в Access • Разработка вспомогательных программ обработки материалов переписи Прикладные программы, разработанные для обеспечения этапов обработки Комплекс приложений, предназначенных для общего управления потоками информации в системе • Программы преобразования данных • Программы формирования и ведения нормативно-справочной информации • Программы организация процессов учета и передачи информации из филиалов в центр Комплекс программ формирования регламентных таблиц • Разработка программ формирования технологических файлов с агрегированной переписной информацией • Программы генерации отчетов Основные проблемы • Погрешность распознавания сильно зависела от качества переписных бланков • Слишком сжатые сроки • Отсутствие опыта • В пилотной переписи была использована другая технология • Базовое ПО – слишком узкая специализация