Лекция 3. Коммуникативный формат библиографической записи Общее представление о коммуникативных форматах представления библиографической записи: как организованы, зачем нужны, как читать? (На примере группы MARC-форматов) ВНЕДРЕНИЕ автоматизированных технологий в библиотеки переживало разные этапы. Сначала компьютер использовался вместо печатной машинки и библиографическая запись вводилась целиком с клавиатуры и размещалась на отдельном документе. Стало возможным искать книгу по любому элементу библиографической записи (например, по третьему слову в заглавии, по заглавию серии и т.п.), соответственно активизировалась работа по созданию электронных каталогов. Но увеличение объёма такого каталога привело к снижению скорости поиска при отборе заданных записей (поиск автора проводился не только в строке «автор», но и в заглавии, в области выходных данных и т.д.). Поиск в каталоге проводился прямым образом, т.е. аналогично поиску заданного слова в документе (или на странице). На следующем этапе было принято решение разделить запись на отдельные элементы (поля), а знаки между областями ставить автоматически (согласно схеме). Это позволило организовать библиографическую запись как совокупность отдельных индексных файлов, каждый из которых содержал однотипные сведения (автор, заглавие, количественные характеристики и т.п.). Таким образом, каталогизатор при обработке документа должен был разделить элементы библиографической записи по соответствующим полям, а система при поиске обращалась только к тому файлу, по которому задан поиск. В 1960-е годы произошла научно-техническая революция, которая во много раз увеличила информационный и документный поток, и библиотека физически не могла приобрести все документы по заданной теме. В литературе начинают разделять процессы комплектования1 и сбора информации2. В первую очередь процесс сбора информации коснулся крупных научных библиотек, поскольку пользователи-специалисты нуждались в максимально полном информировании о существующих документах независимо от языка, размещения и т.п. Библиотеки приняли решение обмениваться библиографическими описаниями документов, создавать сводные каталоги (в первую очередь – научнотехнической тематики). Для обмена данными в электронном виде (а научные библиотеки к тому моменту активно занимались организацией электронных каталогов) началась разработка специального коммуникативного формата. ФОРМАТ – совокупность правил записи и представления данных. Цель создания формата – стандартизация библиографического описания в машиночитаемой форме и свободный обмен записями. По сути дела, речь идёт о маркировке (разметке) библиографической записи таким образом, чтобы её воспринимала компьютерная программа, – подобно тому, как библиотекарь по знакам предписанной пунктуации (разделительным знакам) отличает область заглавия от серии или выходных данных. По назначению различают: 1. Коммуникативные (обменные) форматы, обеспечивающие возможности обмена данными между системами. Эти форматы являются результатом соглашения, которое касается описания структуры и характера записей в массивах баз данных, предназначенных для обмена. Их принято делить по статусу (области распространения): • Международные (UNIMARC, MARC 21). • Государственные (USMARC, RUSMARC, Monocle, UNISIST). • Корпоративные (обеспечивают обмен данными внутри группы организаций). 2. Внутрисистемные форматы, предназначенные для решения служебных и пользовательских задач конкретной системы. Их принято делить по содержанию записываемых данных: • формат для библиографических записей (данных) – базовый формат, применяемый для описания документов любого вида; формат для авторитетных данных – содержит важнейшую информацию о точках доступа в библиографических записях (имена лиц, унифицированные заглавия, названия организаций, географические и предметные термины); формат для общественной информации – содержит фактические данные (например, описание характера деятельности организации, контактную информацию и т.п.); формат для классификационных данных – содержит информацию о классификационных индексах, присваиваемых документу (сами индексы, пояснительные термины, ссылки и пр.). История создания коммуникативного формата MARC MARC – от английского Machine-Readable Catalogue or Cataloguing (машиночитаемый каталог или каталогизация). Внимание! Сегодня мы встречаем под близкими названиями три совершенно разных понятия, которые путаются в сознании пользователей: – MARC (все буквы латинские) – название коммуникативного формата представления библиографической записи; – МАРК (все буквы русские) – название автоматизированной библиотечно-информационной системы (АБИС), разработанной НПО «Информсистема» (сейчас имеет название «МАРК–SQL», что позволяет легко понять, о чём идёт речь); – МАРС (все буквы русские) – межрегиональная аналитическая роспись статей. Первые машиночитаемые форматы появились в США в начале 1960-х годов. В 1966 году Библиотека Конгресса США создала формат MARC I с целью стандартизации записей в машиночитаемой форме. В 1968 году в результате американо-британского сотрудничества был создан общий коммуникативный формат MARC II. С начала 1970-х и до конца 1990-х годов в мире появилось более 50 MARC-подобных форматов, которые представляют собой как самостоятельные разработки (NORMARC – Норвегия, USMARC – США, UKMARC – Великобритания, CANMARC – Канада, INDIAMARC – Индия), FINMARC – Финляндия и т.д.), так и совместные (например, INTERMARC – Франция, Бельгия и франкоговорящая часть Швейцарии; MARC 21 – США и Канада). Созданные коммуникативные форматы отражают правила каталогизации, принятые в каждой стране, и не совпадают между собой. Кроме того, не все страны работают в формате MARC-группы, в ряде государств разработали свои национальные коммуникативные форматы. Из-за наличия многочисленных форматов возникла необходимость в формате-посреднике – для использования мировым сообществом в целях обмена информацией. В 1977 году Рабочей группой IFLA был создан международный универсальный коммуникативный формат – UNIMARC. Для перевода в международный формат страны-участницы разработали специальные программы-конверторы (переводчики из национального коммуникативного формата). В СССР первой из библиотек, приступившей к научному рассмотрению проблемы форматирования библиографических данных для их автоматизированной обработки, была ГПНТБ СССР. Её деятельность в значительной мере стимулировала интерес России к проблемам информационной коммуникации и интегрированию страны в мировое информационное пространство. Этот интерес нашёл отражение в программе ЛИБНЕТ, а UNIMARC был использован как основа для разработки национального стандарта. Национальная версия России – RUSMARC – создана по заказу Министерства культуры РФ под эгидой Российской библиотечной ассоциации и представлена Российской национальной библиотекой в 1998 году. Семейство MARC-форматов постоянно развивается, дополняется новыми руководствами; помимо библиографических, обеспечивается машиночитаемая обработка данных авторитетного, классификационного и других типов. Имеются изменения коммуникативного формата, связанные с различными процессами, происходящими в области распространения информации: появление новых видов документов, новых носителей информации, усовершенствование автоматизации большого количества библиотечных процессов, способов кодировки данных и обмена информацией, развитие телекоммуникационной инфраструктуры и пр. О влиянии коммуникативного формата на развитие стандартизированных библиотечных процессов свидетельствует, например, следующее: – Появление формата представления библиографической записи по полям привело к изменению правил описания документов (повтор имени первого автора после косой черты в сведениях об ответственности). Это изменение связано с возможностью поиска по любому имени, независимо от того, является автор первым, вторым или, к примеру, пятым. – Создание сводных баз и банков данных и выделение центров каталогизации, откуда можно заимствовать записи для собственных каталогов. Единый коммуникативный формат позволяет активно использовать правило интегрированной системы – однократный ввод и многократное применение. – Создание авторитетных записей, позволяющих расширить информационные возможности автоматизированной системы, учесть принятые методические решения, проследить историю развития предмета (организации) и т.п. Структура маrc-формата Каждая библиографическая запись, подготовленная для обмена, должна содержать: – МАРКЕР ЗАПИСИ, состоящий из 24 символов. Он содержит данные, относящиеся к структуре записи, определения которых даются в стандарте ISO 2709. Эта информация необходима для обработки записи. Например, статус записи (новая запись, исключённая запись), тип записи (звукозапись, компьютерный файл и т.д.). – СПРАВОЧНИК, каждая статья которого состоит из трёх частей: трёхцифровой метки, четырёхзначного числа, указывающего длину поля данных, и пятизначного числа, указывающего начальную символьную позицию. Другие символы в статье справочника не допускаются. Справочник генерируется автоматически. Например: 005001700000100001400017200007200031215001400103225007200146 005 – метка поля (3 символа), 0017 – длина поля (4 символа), 00000 – начальная символьная позиция (5 символов), вычисляется путём прибавления к начальному символу поля значения длины этого поля. Как это прочитать? Поле 005 (идентификатор версии) имеет длину 17 символов (знаков, включая пробелы) и начинается с символа 0. Следующее поле, 100 (данные общей обработки), имеет длину 14 символов и начинается с 17. (Для расчёта берём начальный символ предыдущего поля, к которому прибавляем длину предыдущего поля: 0 + 17 = 17.) Затем следует поле 200 (заглавие и сведения об ответственности), длина которого 72 символа, начинается с 31 (17 + 14 = 31). Далее вы можете посчитать самостоятельно. – ПОЛЯ ДАННЫХ переменной длины, отделённые друг от друга разделителем поля. Каждая библиографическая запись разбита на поля (близкие по делению на области описания: заглавие и сведения об ответственности, выходные данные, физические характеристики и т.д.). Поля могут разбиваться на подполя (как области описания разбиваются на элементы библиографической записи) с той или иной степенью дробности. В полях, содержащих идентификационные данные, подполя могут отсутствовать. Поля принято обозначать с помощью трёхзначной числовой метки (тем более что компьютер понимает числа и плохо понимает связные тексты), а подполя – с помощью цифр и букв латинского алфавита (это компьютеру понятно). В структуре поля переменной длины дополнительно различают: А) Разделитель (заменяющий метку поля, присутствующую в справочнике, например, ^). Следует отметить, что при просмотре библиографической записи в формате MARC пользователь видит метку поля. Б) Индикаторы, предоставляющие дополнительную информацию о поле. Выделяют два индикатора (индикатор 1 и индикатор 2), которые отражают сервисные параметры, характерные для данного поля (например, требование добавочной записи на элемент, правила расстановки и т.д.). Значение индикатора выражает цифра от 0 до 9. Если индикатор отсутствует, то на его месте стоит соответствующий знак (например, #). В) Разделитель подполя (например, $, ^) и метку подполя (может быть буквенной или цифровой). Подполя могут следовать друг за другом и повторяться. Поля данных UNIMARC и RUSMARC создают 10 блоков [3]. 0 – блок идентификации содержит международные стандартные номера. Поле 001 – индикатор записи – является обязательным. 1 – блок кодированной информации содержит коды документа (например, вид, характер, язык и т.п.). Поле 100 – данные общей обработки – является обязательным. 2 – блок описательной информации содержит важнейшие поля, описывающие документ, в том числе 200 – заглавие и сведения об ответственности (обязательное поле, особенно подполе «a»), 205 – сведения об издании, 210 – выходные данные, 215 – физические характеристики, 225 – серия. 3 – блок примечаний, приводимых в свободной форме, в том числе 300 – общие примечания, 320 – примечания о наличии библиографии и (или) вспомогательных указателей, 327 – примечания о содержании. 4 – блок связей записи позволяет связать два документа горизонтальными или вертикальными отношениями. Например, горизонтальная связь устанавливается между разными изданиями одного документа, оригиналом и переводным изданием, текстовой и электронной версиями и т.д. Вертикальная связь характерна для отношений «общее–часть» и связывает журнал и его номер, серию и подсерию, многотомное издание и его том, сборник и статью из него и т.д. 5 – блок связанных заглавий позволяет установить отношения между различными формами заглавия. Наиболее часто используемые поля: 510 – параллельное заглавие, 517 – разночтение заглавий; 541 – перевод заглавия. 6 – блок определения тематики направлен на раскрытие содержания документа – персоналии (600), предметные рубрики (606), ключевые слова (610), классификационные индексы (621 – ББК) и т.д. 7 – блок ответственности содержит имена лиц и названия организаций, принимавших участие в создании документа и несущих ответственность за него. Данные, введённые в это поле, являются точкой доступа. Различают первичную и альтернативную ответственность для авторов (первичная – у первого автора, альтернативная – у второго и третьего) и вторичную – для редакторов, оформителей, художников и т.д. 8 – блок международного использования содержит поля, прошедшие согласование и предназначенные для международного обмена записями. Среди полей обязательными являются 801 – источник составления записи и 856 – местонахождение электронного ресурса и доступ к нему. Последнее поле позволяет при нахождении библиографической записи нужного источника оценить возможность получения его полнотекстовой копии. В поле предусмотрены следующие варианты доступа: через электронную почту, по протоколу передачи данных (ftp), по протоколу гипертекстовой разметки (http), удалённый доступ (telnet), телефонный канал. 9 – блок национального использования. Пример 1 700 $a Баратынский $b Е.А. $g Евгений Абрамович Разберём элементы: 700 – метка поля. В данном случае – первый автор – Заголовок описания. $a – разделитель и метка подполя – фамилия автора. $b – разделитель и метка подполя – инициалы автора. $g – разделитель и метка подполя – расширение инициалов автора. Пример 2 7021# $4220 сост. $a Лебедев $b Ю.А. Разберём элементы: 702 – метка поля. В данном случае – вторичная ответственность – редакторы, составители, композиторы. 1 – индикатор 1 задает заглавие как точку доступа (поисковый элемент). При формировании комплекта карточек в этом случае создаётся добавочная карточка на лицо. # – индикатор 2 отсутствует, т.е. его значения не определены. $4 – разделитель и метка подполя – роль (функция) лица. В данном случае 220 – составитель (рис. 1). $a – разделитель и метка подполя – фамилия лица. $b – разделитель и метка подполя – инициалы лица. Рис. 1. Значения подполя – роль (функция) лица. Из словаря «БИС ИРБИС» Пример 3 2001# $a Библиографоведение $f Г.Н. Диомидова Разберём элементы: 200 – метка поля. В данном случае – область заглавия: заглавие и дополнительные данные. 1 – индикатор 1 задаёт заглавие как точку доступа (поисковый элемент). При формировании комплекта карточек в этом случае создаётся добавочная карточка на заглавие. # – индикатор 2 отсутствует, т.е. его значения не определены. $a – разделитель и метка подполя – заглавие документа. $f – разделитель и метка подполя – первичные сведения об ответственности. Пример 4 215 ##$a373 с.$c ил.$d20 см. $eПрил. (1 л. ил.) Разбёрем элементы: 215 – метка поля. В данном случае – область количественной характеристики. #– индикаторы 1 и 2 отсутствуют, т.е. их значения не определены. $a – разделитель и метка подполя – объём (количество страниц) и единицы измерения. $c – разделитель и метка подполя – наличие иллюстраций. $d – разделитель и метка подполя – размер и единицы измерения. $e – разделитель и метка подполя – сопроводительный материал (наименование и объём). Пример 5 606 0#$aСказка$xВоспитательное значение$2rkp 606 0#$aДетское литературное творчество$2rkp Разберём элементы: 606 – метка поля. В данном случае – наименование темы как предмета. Поле повторяющееся. 0 – индикатор 1 – уровень предметной единицы (0 – означает, что уровень не определён). # – индикатор 2 отсутствует, т.е. их значения не определены. $a – наименование темы. $x – тематический подзаголовок. $2 – код системы (использован рубрикатор РКП). Пример 6 801 #1$aRU$bNLR$c19970630 Разберём элементы: 801 – метка поля. В данном случае – источник записи. # – индикатор 1 отсутствует, т.е. его значения не определены. 1 – индикатор 2 – функция организации, помещённой в подполе $b (0 – означает создателя данных, 1 – организацию, конвертировавшую описания в машиночитаемую форму). $a – разделитель и метка подполя – страна, к которой принадлежит организация (RU – Россия). $b – разделитель и метка подполя – организация (NLR – Российская национальная библиотека). $c – разделитель и метка подполя – дата выполнения действия, указанного в индикаторе 2, в формате ГГГГММДД (30 июня 1997 г.). Пример 7 001 rc\424666 005 20030616170529.6 010 ##$9600 Разберём элементы: 001 – контрольный номер записи. 005 – дата и время последней обработки записи в формате ГГГГММДД ЧЧММСС.С (в нашем случае запись изменена 16 июня 2003 года в 17:05:29.6). 010 – поле ISBN. # – индикаторы 1 и 2 отсутствуют, т.е. их значения не определены. $9 – тираж издания (600 экз.). Использование библиографических записей в marc-формате Использование стандарта MARC помогает библиотекам лучше распорядиться библиотечными ресурсами, приобрести надёжные библиографические данные, представленные в правильной форме. Рассмотрим несколько технологических приёмов использования библиографических записей, представленных в коммуникативном формате. 1. Заполнение полей библиографической записи при создании собственного электронного каталога. Возможность найти в электронных каталогах крупных библиотек качественно созданную библиографическую запись и представить её в формате MARC даёт путь к использованию этой записи при вводе данных для собственной каталожной записи. Это самый простой способ применения коммуникативного формата в библиотеке. Как правило, подобное «перепечатывание» по полям связано с невозможностью применения иных способов заимствования. Здесь уместно провести аналогию с процессом перепечатывания документа с бумажного носителя при отсутствии сканирующего устройства или системы распознавания символов. 2. Заимствование записей (импорт). Современные АБИС позволяют выполнить операцию импорта записей достаточно легко. Например, в ИРБИС (создатель – ГПНТБ России) в АРМ «Каталогизатор» имеются кнопки для заимствования записей из указанных баз данных (ЛИБНЕТ и Web-ИРБИС), а «Руслан» (создатель – «Открытые библиотечные системы») даёт возможность работать с ресурсами консорциума АРБИКОН. Свои электронные каталоги для заимствования предоставляются на возмездной основе (либо за плату, либо через обмен), поскольку библиотеки представляют результаты своих трудов. Стоит отметить, что стоимость заимствования невысока и доступна небольшой библиотеке (для тренировки существует тестовая база данных, которая позволяет попробовать и оценить предлагаемую технологию). Сразу оговоримся, что для удачного заимствования (импортирования) записей необходимо соблюдение двух условий: – настройка вашей библиотечной программы на соответствующий каталог (интернет-адрес в цифровом выражении, его вам подскажет библиотека-«донор» при подключении к её ресурсам); – совпадение коммуникативных форматов и их версий или наличие конвертора (крупные библиотеки и созданные такими библиотеками программные продукты, как правило, их имеют, и ваша задача – узнать, какая версия у вас и у библиотеки-«донора»). Будем считать, что эти вопросы решены системными администраторами той или иной стороны, и опишем технологию заимствования записей из электронных каталогов библиотек (в нашем случае на примере ИРБИС). А) Войдём в библиотечную систему в АРМ «Каталогизатор» и найдём кнопки для импорта записей (рис. 2). Рис. 2. Кнопки для импорта записей из внешнего источника. БИС ИРБИС Б) Выберем источник заимствования (в нашем случае ЛИБНЕТ) и по заложенному в системе интернетадресу попадаем на сайт ЛИБНЕТ – в поисковый бланк электронного каталога (рис. 3). Рис. 3. Бланк запроса – справа, результаты поиска – слева. OPAC-Global Национального информационно-библиотечного центра ЛИБНЕТ В) На правой панели (половине экрана) в бланке запроса установим необходимые параметры (укажем базу данных, формат представления для просмотра результатов отбора), сформируем поисковое предписание (правила формирования запроса см. в предыдущей статье) и выполним поиск (результаты поиска отражаются на левой панели (половине экрана). Г) Просматриваем отобранные по запросу записи на правой панели и возле нужных записей нажимаем на гиперссылку «Скачать запись». По этой команде система подготавливает копирование, помещая отобранные записи в буфер обмена (мы его не видим), о чём и информирует в окне сообщения (рис. 4). Рис. 4. Окно сообщения об удачно скачанной записи Д) После появления данного сообщения становится активной ранее неактивная кнопка «Импорт», нажимаем на неё, чтобы включить скачанные записи в свою базу данных. Е) После удачного импортирования записей в вашу базу данных система выдаст сообщение с порядковым номером закачанной записи и предложит её отредактировать (рис. 5). Рис. 5. Сообщение об успешном импорте записи. БИС ИРБИС Ж) Отредактируем скачанные записи, заполнив уникальные поля библиотеки (инвентарный номер, цена, местонахождение экземпляра и т.п.). Заимствование можно осуществить и через текстовый файл, представляющий библиографические записи в MARC-формате. В этом случае нужно быть предельно внимательным, поскольку разные версии коммуникативного формата, используемые в библиотеках, не позволяют автоматически выполнить заимствование. Если известно, из какой версии коммуникативного формата делается заимствование, то можно использовать соответствующий конвертор; если нет, то задача усложняется. Рис. 6. запись для практического задания 3. Использование записей, созданных издающими или книготорговыми организациями Для издающих и книготорговых организаций создан сокращённый вариант коммуникативного формата, который позволяет при заказе книг включать их описание в автоматизированную систему библиотеки и в дальнейшем использовать как основу для дообработки полученных изданий. Крупные книготорговые фирмы в последнее время объединяются с корпоративными и национальными центрами каталогизации и предоставляют библиотеке полные библиографические описания в MARC-формате. 4. Использование записей, созданных информационными центрами комплектования, например, «Книги в наличии и печати» (РКП), «Комплектование.RU» (ЛИБНЕТ) Коммуникативный формат представления библиографических записей обеспечивает возможность обмена данными между различными библиотеками (российскими и зарубежными), свободу доступа к наиболее качественным библиографическим записям, создаёт расширенное информационное пространство. Использование коммуникативного формата позволило начать работу по созданию единых (сводных) банков данных, которыми могут пользоваться любые библиотеки. ВОПРОСЫ ДЛЯ САМОКОНТРОЛЯ 1. Что такое поле? 2. Какой вид имеет разделительный знак поля (подполя)? 3. Какие виды ответственности за создание документа вы знаете? 4. Как вы думаете, какой вид ответственности у второго автора? 5. В какое поле вводится лицо, ответственное за содержание документа (составитель, редактор)? Каким видом ответственности он обладает? 6. В какое поле вводится год издания? 7. Назовите обязательные поля библиографической записи. ПРАКТИЧЕСКИЕ ЗАДАНИЯ 1. Проанализируйте представленную запись и сформируйте каталожную карточку (рис. 6). 2. На сайте ГПНТБ (www.gpntb.ru) в электронном каталоге найдите книгу Э.Ш.Лобановой [1] и рассмотрите описание книги в MARC-формате. Можно ли догадаться о назначении полей коммуникативного формата, анализируя введённые в поле данные? По каким полям это возможно, по каким – нет? Список рекомендуемой литературы 1. Лобанова Э. Ш. Международные коммуникативные стандарты и форматы : учеб. пособ. / Э. Ш. Лобанова, Е. Е. Фролова ; МГУКИ ; ГПНТБ России. – М., 2007. – 47 с. 2. Национальный информационно-библиотечный центр ЛИБНЕТ [Электронный ресурс] / М-во культуры РФ, Рос. гос. б-ка, Рос. нац. б-ка. – М. : Центр ЛИБНЕТ, 2004. – Режим доступа : http://www.nilc.ru/ Российский коммуникативный формат представления библиографических записей в машиночитаемой форме : (российская версия UNIMARC) [Электронный ресурс] / РНБ // Российская библиотечная ассоциация [сайт]. – 1998–2008. – Режим доступа : http://www.rba.ru:8101/rusmarc/rusmarc/index.html RUSMARC в примерах : учеб. пособие для каталогизаторов: в 3 ч. – М. : Фаир-Пресс ; ЛИБНЕТ, 2003–2005. 1 Комплектование – планомерное приобретение в фонд библиотеки документов. Сбор информации – обеспечение отражения документов по заданной тематике, вне зависимости от их территориального размещения. 2