Некоторые тенденции развития российских информационных ресурсов фундаментальной науки Actual trends in scientific information resources development В.И. Ауссем (НТЦ "Информрегистр") V. Aussem (Russia) Several hundreds of Russian information resources (databases, internet sites and portals, etc.) on basic natural sciences researches were analyzed in STC "Informregistr" in 2004. Two main tendencies are mentioned: - forming large and complicated resources which integrates various information on all the problems of the whole scientific discipline; - constructing web navigation systems and services which allows to find easily the whole scope of specific information on a certain problem dispersed in various resources. Increasing of multimedia information and images in scientific information resources is demonstrated. The role of the branches of RAS and of RFBR in further development of scientific information systems and services is proclaimed. Любое фундаментальное научное исследование насквозь информационно: оно начинается с информации об объектах, явлениях, процессах природы и общества и заканчивается изложением научных выводов, гипотез, моделей, то есть тоже информацией. Поэтому можно говорить о взаимодействии двух информационных процессов: информационного обеспечения фундаментальной науки исходными материалами, сведениями, данными и процесса представления результатов фундаментальных исследований. Граница здесь во многих случаях может быть весьма условной - текст, массив данных и т.д., являющиеся результатом одного исследования, часто становятся исходным материалом для другой работы. При этом для анализа информационных процессов и их влияния на развитие науки основной интерес представляют не отдельные публикации, сообщения, наборы данных (отдельные "информационные продукты"), пусть даже сыгравшие выдающуюся роль в истории науки, а организованные и структурированные собрания информационных продуктов, приспособленные для неоднократного использования относительно широким кругом пользователей, то есть информационные ресурсы. Круг проблем, связанных созданием и использованием информационных ресурсов фундаментальной науки, весьма обширен. Достаточно перечислить, например, вопросы сбора информации и формирования информационных ресурсов, структурных и содержательных особенностей информационных ресурсов и способов представления в них информации в различных научных областях, технологические, организационные, экономические, правовые вопросы их создания и функционирования, проблемы доступности создаваемых информационных ресурсов, чтобы оценить невозможность глубокого анализа их всех в одной ограниченной по объему работе. В 2004 г. в НТЦ "Информрегистр" при поддержке РФФИ была выполнена аналитическая работа, посвященная в первую очередь двум проблемам, связанным с созданием и использованием информационных ресурсов фундаментальной науки. Это проблемы организации поддержки создания информационных ресурсов и распространения сведений о них. Без решения первой проблемы создание большинства информационных ресурсов фундаментальной науки вообще было бы невозможно, так как данная сфера не обеспечивает, как правило, немедленного коммерческого эффекта, который позволил бы развивать информационную деятельность на основе собственных средств. При отсутствии эффективного решения второй проблемы резко уменьшаются реальные возможности доступа к создаваемым информационным ресурсам и, следовательно, использования результатов фундаментальных исследований для развития науки и техники. При этом речь должна идти не об отдельных мероприятиях по распространению сведений (пусть даже весьма ценных и объемных), а об открытой для заинтересованных пользователей системе постоянного сбора, хранения, ведения и представления данных об информационных ресурсах, то есть о системе их учета. Основной материал для анализа составили описания информационных ресурсов, созданных по грантам РФФИ, предоставленным в 2000 - 2003 гг., и ресурсов, зарегистрированных в Государственном регистре баз и банков данных (далее - Регистр). При этом в тематическом отношении было решено ограничиться сферой фундаментальных естественных наук. Были проанализированы по описаниям или непосредственно 330 баз данных, зарегистрированных в Государственном регистре, 107 информационных ресурсов, описанных в отчетах о выполнении работ по грантам РФФИ, и дополнительно около 60 сайтов научных и образовательных организаций в Интернете. Довольно полное описание конкретных особенностей значительного числа анализировавшихся информационных ресурсов по математике, физике, астрономии, химии, биологии и науках о Земле содержится в опубликованном в конце 2004 г. обзоре [1]. Здесь же представляется целесообразным ограничиться обсуждением проявившихся как в упомянутом исследовании, так и в повседневной информационной практике общих тенденций развития научных информационных ресурсов, прежде всего, в связи с двумя обозначенными выше проблемами. Такой общей тенденцией можно считать стремление к интеграции в рамках единого информационного ресурса всех сведений и результатов работ об отдельных объектах исследования и даже о группах объектов, изучаемых целой научной дисциплиной. Такие информационные ресурсы представляют собой множество баз и банков данных, отдельных файлов различных по виду и структуре (фактографическая, реферативная, полнотекстовая информация, изображения и т.д.), связанных между собой глубокими гипертекстовыми связями. Подобная интеграция сведений позволяет развивать на основе таких ресурсов сложные информационно-логические системы, решающие задачи анализа, моделирования, прогнозирования. Второй тенденцией развития информационного обеспечения фундаментальных научных исследований является создание крупных интернет порталов, информационных систем и служб, облегчающих для пользователей доступ ко всему спектру информационных ресурсов по тем или иным научным дисциплинам и целым группам фундаментальных наук. Такие системы позволяю ученому оперативно подбирать и интегрально использовать все накопленные наукой сведения и научные результаты по интересующему его предмету исследования. Обе указанные тенденции являются общемировыми. В большинстве областей они привели к созданию для каждой фундаментальной науки (крупного научного направления) двух-трех международных информационных систем, которые являются основным источником информационного обеспечения специалистов, в том числе российских. Анализ сведений об информационных ресурсах, ознакомление с содержанием сайтов ряда институтов РАН, других научных и образовательных учреждений показывает, что первая из перечисленных тенденций (интеграция разнородной информации о предметах исследований) в значительной мере реализуется и в России. Все чаще разрабатываются сложные комбинированные системы, вычислительные ресурсы которых позволяют не только вводить информацию и хранить ее, но и анализировать, строить на основе анализа модели и прогнозы. Многие созданные за последние годы отечественные информационные ресурсы фактически можно отнести к базам знаний, интегрирующим разнообразную фактографическую, текстовую и иную информацию об объектах исследований. Характерной чертой ряда создаваемых современных информационных ресурсов является их вовлеченность в сеть мировых систем. В то же время, даже поверхностный обзор мировых научных порталов убеждает в том, что степень представленности на них российских информационных ресурсов в совершенно недостаточной мере соответствует потенциалу и уровню российской фундаментальной науки. Значительная часть российских научных информационных ресурсов остается фактически распыленной по многочисленным сайтам научных организаций, страницам их подразделений и персональным страницам ученых, не объединенных эффективными интернет-каталогами, поисковыми системами, другими средствами, облегчающими доступ пользователя к ресурсам. Наиболее многочисленной группой информационных ресурсов, содержащих результаты фундаментальных исследований, являются ресурсы, принадлежащие институтам РАН. Большинство работ представлены для доступа на сайтах институтов. Однако, чтобы быстро найти нужную информацию, пользователю желательно заранее знать каким институтом (а, лучше, и каким подразделением) выполнялись интересующие его исследования. Отделения РАН, как правило, не занимаются учетом и обобщением информационных ресурсов институтов. Сайты отделений РАН дают возможность выхода на сайты институтов, но, как правило, не содержат обобщающих каталогов конкретных информационных ресурсов. Такие каталоги, при условии снабжения их качественными описаниями и поисковым аппаратом, могли бы быть весьма внушительными по объему и очень полезными для широкого круга пользователей. В противном случае сохраняется традиционная ориентация на замкнутый круг "своих" пользователей, которые обычно и так знают, где какие исследования ведутся. Такая ориентация фактически ограничивает распространение фундаментальных знаний и не способствует расширению использования результатов исследований. Большое количество сообщений о проводимых исследованиях размещается на сайте РФФИ. Кроме того, в РФФИ попадает довольно большой объем сведений о научных информационных ресурсах, по крайней мере, о ресурсах, созданных при поддержке фонда или содержащих работы, поддержанные РФФИ. Однако найти эти сведения очень трудно, особенно если пользователь не знает точно, по каким грантам и кем выполнялась та или иная работа. Сведения о "связанных с РФФИ" ресурсах не аккумулируются, их описания систематически не формируются. Представляется возможным поставить вопрос об усилении роли фонда в распространении сведений о российских научных информационных ресурсах. Еще одним возможным источником сведений об отечественных информационных ресурсах является Государственный регистр баз и банков данных, который в настоящее время содержит более 8 тысяч описаний отечественных БД. Регистр носит универсальный характер и лишь 330 из зарегистрированных БД можно отнести к сфере информационного обеспечения фундаментальных естественнонаучных исследований. Из этих данных видно, что определенной проблемой для Регистра остается неполнота охвата научных ресурсов. Организация учета информационных ресурсов во многих научных учреждениях, прежде всего РАН, по ряду причин организована слабо, а Государственный регистр не имеет реальных административных или экономических рычагов для стимулирования такого учета. Это может приводить, в частности, к определенному искажению представления о развитии информационных ресурсов различных научных направлений. Так, наблюдавшееся в ходе упомянутой аналитической работы абсолютное превосходство сферы наук о Земле над другими научными направлениями по числу зарегистрированных БД, свидетельствует не только о реальном росте количества геоинформационных ресурсов, но и, в еще большей степени, о лучшей постановке учета информационных ресурсов в организациях МПР России, которым принадлежит значительная часть геоинформационных ресурсов, по сравнению с учреждениями РАН, являющимися основными держателями ресурсов в других областях фундаментальной науки. Кроме того, неспециализированный характер Государственного регистра в ряде случаев осложняет быстрый и точный отбор сведений о ресурсах в конкретных научных областях. Поэтому в последнее время НТЦ "Информрегистр" вместе с ВИНИТИ и рядом других организаций занимается разработкой и наполнением специализированной Навигационной системы для Государственной системы научной и технической информации (ГСНТИ). Усилия по созданию общенаучных навигационных систем, содержащих метаданные об информационных ресурсах, не отменяют необходимости развития специализированных поисковых порталов, интегрирующих информационные ресурсы по широким научным направлениям. Представляется целесообразным организовать такие порталы на базе сайтов секций РАН. Подобные работы можно проводить как в рамках отдельных проектов, например, при поддержке РФФИ, так и по более общим программам. Интересную навигационную информационную систему, охватывающую большую часть ресурсов фундаментальных наук, можно создать на основе данных об информационных ресурсах, созданных при поддержке РФФИ или содержащих работы, поддержанные фондом. Создание ряда крупных поисковых научных порталов и навигационных систем, позволяющих осуществлять поиск информационных ресурсов по разнообразным поисковым признакам, позволит пользователям, практически независимо от исходной точки поиска (сайты РАН, РФФИ, ГСНТИ), достаточно быстро выходить на необходимые им информационные ресурсы. Это повысит надежность в целом всей системы навигации в сфере научной информации. Помимо решения непосредственных задач навигации в национальном информационном пространстве создание крупных научных порталов может способствовать развитию связей с ведущими международными информационными системами. Для осуществления качественной навигации в информационном пространстве большое значение имеет наличие достаточно полных, адекватных поставленной задаче, стандартизованных описаний информационных ресурсов. К сожалению, в ходе упомянутых аналитических работ и в повседневной практике приходится убеждаться в том, что описания ресурсов (например, в отчетах о работах по грантам РФФИ, да и в других источниках) являются недостаточно полными и четкими. Так иногда трудно понять, даже к какому классу ресурсов принадлежит созданная система или база данных, какие виды информации в ней содержатся. Многие термины в описаниях разными авторами трактуются явно по-разному. Подобные недостатки характерны и для других источников сведений об информационных ресурсах. В связи с этим целесообразно наладить взаимодействие между организациями, заинтересованными в создании навигационных систем, каталогов и других средств интеграции информационных ресурсов науки. Представляется весьма актуальной задача разработки и стандартизации систем метаописаний научных информационных ресурсов. Результаты проводившегося исследования в основном подтвердили важную роль РФФИ в поддержке создания информационных ресурсов фундаментальной науки. Большинство поддержанных РФФИ за последние три года проектов создания информационных ресурсов и систем ставят своей целью интеграцию разнообразной информации об объектах исследований и по целым научным направлениям и предоставление пользователям расширенных возможностей ее интеллектуальной обработки. Достаточно характерной можно считать и видовой состав, поддерживаемых РФФИ информационных ресурсов. Так, если в общем составе охваченных исследованием ресурсов картографическая информация составила 4,5%, а ресурсы, содержащие преимущественно статические и динамические изображения, графики, мультимедийную информацию, - 3,5%, то среди ресурсов, создание которых поддержано РФФИ, доля каждой из этих двух групп ресурсов составила по 16,5%. Это свидетельствует об усиленной поддержке РФФИ работ по созданию информационных ресурсов, содержащих первичную исследовательскую информацию, дающую наглядное представление о предметах исследований. В завершение следует отметить, что развитие российских информационных ресурсов фундаментальной науки в целом соответствует общемировым тенденциям. В усиленной поддержке нуждаются прежде всего разработки систем, интегрирующих весь объем разнородной информации об объектах исследований и предоставляющих развитые возможности ее интеллектуальной обработки, а также работы по интеграции совокупности информационных ресурсов по широким научным направлениям на основе систем информационной навигации, предоставляющих пользователям адекватные описания ресурсов и эффективные средства их поиска. Литература 1. Информационные ресурсы фундаментальной науки. Обзор / Под ред. А.Б. Антопольского. – СПб., 2004. – 44 с.