УДК 004(06) Информатика и процессы управления С.Д. КУЛИК, Д.С. ГУДЗЬ, А.Б. МИРОНОВ, Д.А. НЕСТЕРОВ, М.А. ЯЦКОВ Московский инженерно-физический институт (государственный университет) ФАКТОГРАФИЧЕСКИЙ ПОИСК И СЕТЬ INTERNET Представлены результаты исследования поисковых машин (ПМ), поисковых роботов (ПР) и фактографического поиска (ФП) в сети Internet. Развитие современных средств коммуникации и, в частности, сеть Internet требуют от разработчиков информационно-поисковых систем (ИПС) находить новые решения для построения эффективных ИПС. Исследователи различают среди ИПС класс фактографических ИПС (ФИПС) [2-9]. Среди ФИПС выделяют класс автоматизированных ФИПС (АФИПС) [2,3,4]. Отметим что, АФИПС позволяет получать ответы на фактографические запросы (ФЗ) и выполнять фактографический поиск. Существенное отличие рассматриваемых АФИПС от других систем состоит в том, что при документальном поиске (ДП) система выдает пользователям те же документы, что и поступали когда-то на ее вход. Важно отметить, что при фактографическом поиске, когда обрабатывается фактографический запрос, система может выдать фактографические данные (ФД), созданные в результате аналитикосинтетической переработки входных документов внутри системы. Для синтеза ФД такая система как АФИПС должна иметь специальный инструмент, проверяющий достоверность вновь поступающих ФД, сопоставление их с уже известными, корректировку и пополнение ФД. Так, например, на такой ФЗ "Какие акции фирмы X были проданы фирме Y?" ДП выдаст рекомендательный список, справочников, энциклопедий, каталогов, возможно содержащих ФД о требуемых акциях, а ФП выдаст перечень акций фирмы X, которое были проданы фирме Y. Проект, связанный с исследованием ФП в сети Internet ведется по трем направлениям. Первое — исследование наиболее общих вопросов проектирования, разработки и эксплуатации АФИПС различного назначения [2-4], в том числе, и в сети Internet [5-9]. Второе — исследование поисковых машин и поисковых роботов сети Internet. Третье — исследование и анализ результатов документального поиска [1, 10 и др.] с целью их применения для реализации ФП. Основное внимание на первых этапах исследования было уделено изучению существующих ПМ, ПР и, в частности, поисковой системы ISBN 5-7262-0555-3. НАУЧНАЯ СЕССИЯ МИФИ-2005. Том 12 86 УДК 004(06) Информатика и процессы управления Яndex. На последующих этапах исследовался ДП и те средства, с помощью которых разработчики на практике достигали заданной эффективности своих систем (особенно те средства, что могут быть полностью или частично применены для реализации ФП в сети Internet). Результаты экспериментальных исследований поисковой системы Яndex показали [9], что с ее помощью может быть построена АФИПС с заданной эффективностью. Результаты анализа и исследования существующих ПМ, ПР показали, что их число огромно (более 200 поисковых роботов [1, с.113] и более 2000 поисковых систем [1, с.117]). В целом проведенные исследования позволили предложить подход к построению АФИПС для сети Internet. Для разработчика АФИПС выработаны некоторые предварительные рекомендации, помогающие ему строить системы с требуемой эффективностью. Список литературы 1. Захаров В.П. Информационные системы (документальный поиск): Учебное пособие.– СПб., 2002. 188с. 2. Кулик С.Д. Исследование эффективности фактографического поиска в информационных системах /Изд. “Радиотехника”.–М., 2004.–251с.–Деп. в ВИНИТИ 29.07.2004, №1326-В2004; Библ. указат. №9(204), 2004. 3. Кулик С.Д. Фактографические системы (методы построения, модели, стратегии поиска и программное обеспечение) /Изд. “Радиотехника”.—М., 2003.—325с.—Деп. в ВИНИТИ 23.06.2003, №1205-В2003; Библ. Указат. № 8(378), 2003. 4. Кулик С.Д. Объекты интеллектуальной собственности России (обзор программного обеспечения).-М.: “Компания Спутник+”, 2001.-159с. 5. Кулик С.Д. Аналитическая модель глобальной сети Internet //Вуз-XXI и культура (сборник статей). —Казань: Изд-во КГТУ, 2000. - С.32-36. 6. Кулик С.Д. Аналитическая модель поискового робота, выполняющего фактографический поиск в глобальной сети Internet для обоснования управленческих решений //Актуальные проблемы управления-2000: Материалы международной научнопрактической конференции: Вып.5 — М.: ГУУ, 2000. — С.126-129. 7. Кулик С.Д. Свидетельство на программу №2000610134 Российская Федерация (RU). "Представление фактографических данных издательства в сети Internet" (WEB$ITE)/С.Д. Кулик (Россия).-№ 991021; Заяв. 23.12.1999; Зарегистр. 21.02.2000. 8. Разработка программного обеспечения для поиска фактографических данных в сети Internet. Исследование и разработка модели фактографического поиска данных: Отчет о НИР/МИФИ. Руководитель: Кулик С.Д. Испол.: Кулик С.Д., Козлов В. М. — Отчет по теме №80-3-029-511, №ГР01200102159, Инв.№02.2.00101863.-М.: МИФИ, 2000.-78с. 9. Кулик С.Д., Платонова И.В., Симагин П.В. Фактографическая информационносправочная система в сети Internet //Научная сессия МИФИ-2004. Сб. науч. тр. В 15т. М.: МИФИ, 2004. Т.12. Информатика и процессы управления. 10. Конференция TREC (Text Retrieval Conferences) http://trec.nist.gov/. ISBN 5-7262-0555-3. НАУЧНАЯ СЕССИЯ МИФИ-2005. Том 12 87