Технология создания качественных электронных ресурсов библиотек Г. Е. Евстигнеев, Заместитель директора департамента по работе с библиотеками и ВУЗами Качественный электронный ресурс Качественный электронный ресурс – массив графических образов, полученный путем перевода в электронный вид (оцифровки) исходных материалов Заказчика, полностью удовлетворяющий предъявляемым Заказчиком требованиям для дальнейшего целевого использования. Основные требования, предъявляемые к электронным ресурсам библиотек (при оцифровке книг) Строго упорядоченный выходной массив образов Аутентичность графических образов оригиналу Отсутствие дублей, пропусков, образов с частичной потерей информации, геометрическими искажениями Пригодность электронного ресурса для использования в программах просмотра в читальных залах, интернете и т.п., а также в качестве сохранных копий. Создание качественных электронных ресурсов 2 Этапы создания электронного ресурса Первичный осмотр и структурирование исходных материалов Сканирование (оцифровка) Проверка полученных образов (сканов) Дополнительная обработка графических образов Выходной контроль качества массивов графических образов Создание качественных электронных ресурсов 3 Создание строго упорядоченного выходного массива графических образов Структурирование исходных материалов: Разделение исходных материалов на партии и ящики, привязка каждой книги к ящику Исходный осмотр каждой книги с описанием физических дефектов, присвоение идентификационного номера — штрих-кода Сопровождение книги маршрутным листом автоматическая идентификация по штрих-коду Использование специализированного программного обеспечения слежения за движением исходных материалов: базы данных реестра сканирования материалов Использование АСУ промышленного сканирования Сохранение подробной истории работы с массивом Создание выходного массива с заданными характеристиками Создание качественных электронных ресурсов 4 Сканирование – создание аутентичных графических образов В Техническом задании проекта формулируются требования, предъявляемые к графическим образам: Равномерное освещение без бликов и тени от переплета Равные геометрические размеры образов страниц книги (за исключением вклеек нестандартного размера) Ориентация по тексту (наклон текста не более 0,5 градуса) Отсутствие искажения текста Единообразная глубина и насыщенность цвета страниц Нумерация страниц не должна прерываться (кроме случаев нарушения нумерации в оригинале) Четкая фокусировка изображения Отсутствие переплета Недопустима потеря информации Создание качественных электронных ресурсов 5 При сканировании книг используется профессиональное оборудование ЭЛАРобот, уникальный комплекс полностью автоматического книжного сканирования – высокопроизводительное сканирование при минимальном участии оператора Планетарные сканеры серии ЭЛАР ПланСкан – бесконтактное сканирование, колыбели для размещения книг большой толщины Комплексы высококачественного сканирования ЭЛАР ПауэрСкан – создание сохранных копий книг высокого разрешения (до 800 dpi) фотографического качества Создание качественных электронных ресурсов 6 Бережное сканирование Бесконтактный способ сканирования Безопасное освещение без инфракрасного и ультрафиолетового излучения Минимальное световое воздействие на оригинал, только в момент сканирования Сканирование в естественном освещении Набор аксессуаров для деликатного обращения книжные колыбели для книг различной толщины и веса уголковые держатели для книг с неполным раскрытием сканирование без прижимного стекла автоматическое перелистывание страниц воздушным потоком, а не манипулятором Создание качественных электронных ресурсов 7 Проверка отсканированных образов Проверка на отсутствие пропусков и дублей По сравнению количества образов с количеством страниц по результатам осмотра при внесении книги в базу реестра Визуальный контроль нарушения нумерации Визуальный контроль и удаление дублей Визуальная проверка качества сканов Равномерность цветовых оттенков страниц в книге Автоматизированная проверка качества сканов Контроль расфокуса («размытого» изображения) Отсутствие загибов страниц Определение наклона текста Контроль обрезки текста Наличие полей по краям Наличие посторонних объектов Создание качественных электронных ресурсов 8 Дополнительная обработка проверенных графических образов Точная ориентация по тексту (доворот) Удаление полей, тени от переплета, фрагментов других страниц или части обложки (обрезка) Исправление геометрических искажений текста Выравнивание образов по размеру Удаление пятен, мусора, посторонних предметов Разрезка разворотов с удалением переплета Автоматическая замена или выравнивание фона Прочие виды дополнительной обработки, предусмотренные в Техническом задании Создание качественных электронных ресурсов 9 Система контроля качества образов – четыре уровня контроля Первый уровень контроля – оператор обработки обязан проверить качество сканирования и отметить дефектные образы Второй уровень контроля – руководитель группы выборочно проверяет результаты работы подчиненных операторов (минимум по 100 образов каждого сотрудника) Третий уровень – выборочная проверка массива (минимум 10%) инспектором контроля качества Производственного центра сканирования Четвертый уровень – выборочная проверка выходных массивов графических образов независимой Инспекцией контроля качества Создание качественных электронных ресурсов 10 Система контроля качества образов – действия по результатам проверок Результаты работы оператора поступают на проверку (100 обр.) Есть дефекты? нет Массив образов (10%) поступает на проверку инспектору КК Контроль качества успешно пройден нет Более 2-х дефектов на 1000 обр.? Да Да Сотруднику разъясняют его ошибки, выборку увеличивают еще на 400 образов Массив возвращается на исправление и доработку, выборка контроля качества увеличивается до 30% Создание качественных электронных ресурсов 11 Дополнительные меры по обеспечению качества и сохранности электронного ресурса графических образов Возврат исходных материалов осуществляется согласно Актам приемки теми же партиями Исходные сканы (до обработки) сохраняются до полного прохождения контроля качества и сдачи электронного ресурса Заказчику АСУ сканирования в процессе выгрузки полностью проверяет соответствие формата выгружаемых файлов на соответствие ТЗ по следующим параметрам: размер образа, формат файла, разрешение, глубина цвета, степень сжатия (компрессии). Образы в текущем состоянии хранятся в двух экземплярах (принцип резервного копирования) во избежание утраты вследствие аппаратного сбоя и прочих технических проблем Создание качественных электронных ресурсов 12 Сканирование карточных каталогов Применение высокопроизводительных сканеров ЭЛАР СКАМАКС позволяет сканировать за один проход лицевую и оборотную сторону карточки Автоматические самонаклад и выклад без переворота обеспечивают сохранение порядка следование карточек в массиве ГАК РГБ – 15 000 000 карточек было оцифровано за 100 рабочих дней на территории Заказчика Программа по автоматической проверке/обработке карточек (поворот, обрезка образов по краям) позволила на 40% сэкономить трудозатраты на проекте Создание качественных электронных ресурсов 13 Ретроконверсия Специальная промышленная технология перевода данных из графического формата в электронный: текстовый или базу данных Распознавание текста По полям или полнотекстовое С или без коррекции результата С выгрузкой индексных данных в БД и привязкой изображений к БД Печатный или рукописный текст На русском, европейских или старорусском языках Создание базы данных алфавитного каталога библиотеки Использование существующих справочников Создание качественных электронных ресурсов 14 Заимствование Заимствование – технология оптимизации процесса ретроконверсии библиотечных каталогов, основанная на базе уже имеющихся машиночитаемых библиографических записей из наиболее полных и качественно подготовленных электронных каталогов. технология заимствования позволяет создавать электронные каталоги библиотек быстрее, надежнее и дешевле Создание качественных электронных ресурсов 15 Создание электронных книг PDF Книга без закладок Книга с закладками по имеющемуся оглавлению Книга с закладками по тексту (по заголовкам глав, разделов и т.п.) Книги с возможностью контекстного поиска Слой с автоматически распознанным текстом без верификации, возможность производить контекстный поиск необходимой информации и работать с текстом Электронные полнотекстовые книги Полнотекстовый электронный вариант книги – полнотекстовое распознавание, проверка орфографии, верификация, макетирование текста Создание качественных электронных ресурсов 16 Спасибо за внимание! 127083, Москва Петровско-Разумовская аллея, 12а Тел.: +7 (495) 792-31-31, факс: +7 (495) 251 3603 Интернет: www.elar.ru E-mail: GEvstigneev@elar.ru