В основе всех современных инноваций лежат информационные техноло-гии

реклама
РАЗРАБОТКА НЕЙРОСЕМАНТИЧЕСКОЙ БАЗЫ ЗНАНИЙ
ДЛЯ ПОДДЕРЖКИ И РАЗВИТИЯ ИННОВАЦИОННЫХ ПРОЦЕССОВ
НА МЕЖРЕГИОНАЛЬНОМ УРОВНЕ
В.И. Бодякин к.ф.-м.н.,
Институт проблем управления РАН, к.ф-м.н. (г.Москва)
E-mail body@ipu.ru
Аннотация
Анализируются характеристики экономики знаний на современном этапе развития
НТП и ведущая роль в этом процессе интеллектуализированного инструментария.
В качестве которого рассматривается нейросетевая база знаний для поддержки
инновационных процессов. Приводятся основные ее характеристики и свойства.
DEVELOPMENT NEUROSEMANTIC OF THE KNOWLEDGE BASE
FOR SUPPORT AND DEVELOPMENT OF INNOVATIVE PROCESSES
AT THE REGIONAL LEVEL
V.I.Bodjakin
Institute of Control Sciences RAS
Abstract
Characteristics of economy of knowledge at the present stage of development of scientific and technical progress and the leading part in this process of intellectual toolkit are
analyzed. The Knowledge base for support of innovative processes is considered neurosemantic. Its basic characteristics and properties are resulted.
В последнюю четверть XX века человечество вступило в новую стадию своего развития 
стадию построения постиндустриального общества. Экономически развитые страны провозгласили переход к экономике, основанной на знаниях.
История развития информатизации началась в США с 60-х гг., затем с 70-х гг.  в Японии
и с конца 70-х  в Западной Европе. В развитых странах на долю новых технологий приходится от 70 до 80% прироста ВВП. США на экспорте наукоемких технологий зарабатывают в
год около 700 млрд. долл., Япония  порядка 400 млрд. долл. Пятнадцать из двадцати самых
богатых людей США представляют компании высоких технологий, возникшие в течение последних полутора десятков лет (Microsoft, Metromedia, Intel, Oracle, Viacom и др.) [1].
Ежегодный оборот на мировом рынке высоких технологий и наукоемкой продукции измеряется уже в триллионах долларов и в несколько раз превышает оборот рынка сырья,
включая нефть, нефтепродукты и газ. Россия, к сожалению, при всем своем научнотехническом потенциале сегодня на этом рынке представлена более чем скромно – 0,3 %, тогда как США — 39 %, Япония — 20%, Германия — 16 % [1].
Как никогда ранее, проблема автоматизации переработки информационного ресурса, на
фоне ежегодного удвоения мощности информационных потоков слабоструктурированной
информации, становится чрезвычайно актуальной.
В отличие от ведущих экономических держав, инновационная активность реального сектора отечественной экономики крайне низка. По различным оценкам, в России используются
только от 8 до 10% инновационных идей и проектов, в то время как в Японии -95%, в США 62%. Только одно из 500 запатентованных в России изобретений находит применение в промышленности. На долю России приходится более 10% всех ученых мира (огромный потен-
циал!), но сегодня её доля на мировом рынке наукоемкой продукции не превышает 0,3% от
его объема, хотя по оценке аналитиков, она могла бы составлять 10-12%.
Современная научно-экономическая политика ведущих стран заключается в том, что сохраняя лидирующее положение в мировой экономике, например, США, постепенно уступают и передают своим ближайшим конкурентам и подрядчикам почти все секторы материального производства мирового рынка, кроме стратегически главного  сектора экономики
знаний. Концентрируя при этом, производительные и интеллектуальные ресурсы в новейших
областях науки и техники, которые предопределяют и революционизируют всю завтрашнюю
структуру мирового производства.
В России, только по самым скромным оценкам, интеллектуально-информационный ресурс оценивается в 400-600 миллиардов долларов. Благодаря высокому культурнообразовательному уровню населения России, достаточно быстро он может быть еще многократно увеличен. Талантливость народа, его тяга к образованию  вот базис нашего инновационного ресурса. Примеры прорывных зон в СССР, это союз учебных заведений и очагов
высоких технологий: Академгородки, МФТИ и др. Создание аналитической организации,
подобной Rand Corporation, жизненно необходимо нашей стране. При сегодняшней внешней
недоброжелательности и клановой борьбе внутри страны, мы должны поставить во главу угла Разум и Знание, другого варианта у нас нет. Специалистов по перестройке экономики с
сырьевого направления на инновационное у нас нет, по серьезному, их нет нигде в мире и
подготовка специалистов такого класса одна из важнейших стратегических задач.
Наука  важнейший ресурс экономического и духовного обновления России. Результаты
наших исследований, анализ результатов исследований отечественных и зарубежных ученых
по данной проблеме убедили нас в том, что создание инновационной экономики является
стратегическим направлением развития нашей страны в первой половине XXI века.
Нельзя на старых концепциях построить что-либо революционно новое ("нельзя вливать
новое вино в старые мехи"). Запад может постепенно наращивать мощности, хотя это также
путь в инновационную экономику, но этот путь не для нас (идя по нему, мы будем и дальше
только отставать от лидеров). Так же нам не подходит и путь развивающихся стран ЮгоВосточной Азии – группы "молодых тигров", встраивающихся в отведенную для них западной экономикой нишу "отверточного производства". Нас точно не ждут в мировой экономике высоких технологий, а быть "сырьевым придатком",  это не для нас.
Наш путь не догонять, а упредить и обойти на новом качественно новом витке технологического развития. Создать принципиально новый компьютерный инструментарий, взамен
когда-то директивно загубленной линии БЭСМ. Этот новый революционный путь должен
быть интеллектуальным, на что замахнулась Япония в 80-х годах прошлого века, так и не
реализовав проект "ЭВМ пятого поколения" [2]. А у нас на это есть высококвалифицированные кадры и нам это по плечу, как будущей сверхдержаве.
Основная особенность разрабатываемой базы знаний (БЗ), применительно к инновационной деятельности, заключается в необходимости переработки сверхбольших объемов слабоструктурированной и разноформатной (текстовой, графической и др.) информации, которая очень чувствительна как к контексту, так и ко времени (относительности событий) и, самое главное, такая БЗ должна быть открыта для любых новых предметных областей знаний и
безболезненно интегрировать их в уже сформировавшуюся смысловую структуру. Поэтому
требуемую интеллектуальную БЗ, в ее идеале, можно построить только при возможности ее
автоматического "самоформирования" (самопрограммирования), когда от пользователя будет требоваться только качественная оценка получаемых результатов (например, в лингвистических переменных шкалы: "плохо  хорошо"), а БЗ будет автоматически сама подстраиваться под постоянно меняющиеся условия. Условиям такой динамической адаптации удовлетворяют нейросемантические структуры (НСС) [3]. Варианты других известных на сегодня подходов автоматизации обработки информации, будут ограничивать БЗ либо областью
применения, либо временем адаптации под требования пользователя, пока программисты
"вручную" решат его текущие проблемы, см. рис. 1.
База знаний
Алгоритм
if<> then<>
if<> then<>
… then<>
if<>
Пользователь
Аналитик, программист
Алгоритм
БД
Форма
НСС
"0" "1"
Предметная
область
АЦП- 01011011011010001101101001010
1101001101101000110110100101101
000101011011001000110110100101101
ЦАП 01100101011001101000110110100101010
Алгоритм
НCC
Рис. 1. Классическая (файловая) и нейросемантическая парадигмы автоматизации информационных процессов
Как отмечалось выше, способным решить задачу построения БЗ с данными требованиями
является направление нейросетевых технологий  "нейросемантика". В основе нейросемантики лежит формальная теория, согласно которой, при минимизации отображения информационного потока, идущего из произвольной предметной области, на нейроподобных средах
формируется топологически гомоморфная структура, которая автоматически является сформированной информационной моделью процессов данной предметной области. В каждом
нейроподобном элементе отображается процесс-объект априорно неизвестной предметной
области (нейрон ↔ образ процесса, поэтому и название направления  "нейро–семантика").
На этом этапе можно уже строить реальные информационно-поисковые системы, процедурно включая в них эвристические методы обработки данных. Но в нейросемантике предполагается и дальнейшая автоматизация информационных процессов, а именно, автоматическое
формирование правил на примерах, основанная на том же принципе  минимизации отображения, только теперь уже дополнительно и состояний самой нейроподобной среды, вызванного текущим входным информационным потоком предметной области. Т.е. многоуровневая
минимизация отображения информационного потока на специализированных нейроподобных структурах, при адекватной реакции самой интеллектуальной системы, с точки зрения
пользователя – это путь к построению открытых, крупномасштабных, автоматизированных,
интеллектуальных БЗ, см. рис. 1.
Для гарантированности получения положительного результата от эксплуатации БЗ, весь
проект ее построения разбивается на два этапа.
1-й этап. Формирование разнопрофильных полнотекстных баз данных, как первого шага
начала накопления информационного ресурса и первичного централизованного обслуживания пользователей, предоставлением существующей информации по интересующим их тематикам, с использованием инструментария БЗ. На этом этапе, за счет предоставления искомой информации по ключевым словам и посредством предоставляемого интеллектуального
сервиса (у каждого пользователя автоматически будет формироваться персональный поисковый агент, настроенный на его тематику), эффективность работы пользователя будет улучшена, как минимум в 2 3 раза, за счет своевременного получения релевантной информации
со всех доступных ресурсных источниках информации (различные базы данных и базы зна-
ний, Интернет). Агентно-ориентировнный подход на первом этапе будет являться одним из
самых полезных в развивающейся технологии программирования по поиску релевантной
информации, реализации пользовательских интерфейсов, электронной торговли, образования и обучения и т.д.
2-й этап. Построение автоматической базы знаний для любой предметной области
(априорно неизвестной), основываясь только на обучении примерами (текстовоеграфическое описание "задачи" и текстовое-графическое описание "решения") и лингвистическими оценками пользователя ("хорошо-плохо") соответствия качества данного "решения"
на конкретную "задачу". Вся информация-данные, предоставляется в текстовой и графических формах на естественном, либо на профессиональном языке пользователя, как на этапе
формирования БЗ, так и на этапе диалога с пользователем.
Особенность БЗ, построенной на нейросемантическом подходе заключается в том, что
все образы (данные) БЗ ассоциативно взаимоувязаны, образами контекстов (с оценками
пользователя) текущей задачи. Поэтому, между данными (подструктурами образов БЗ) различных предметных областей может осуществляться ассоциативное взаимоувязывание, которое для пользователя может стать отправной точкой для инновации. Так например, проблема медицины, "как осуществить безболезненный анализ уровня сахара в крови у больных
диабетом с забором крови из вены" (тема многих недавних грантов), решилась методом из
другой предметной области (разработка газоанализаторов и др.), при анализе состава газов,
уровень ацетона в выдохе больного оказался скоррелирован с уровнем сахара в его крови.
Такого типа "инновации-открытия", должна помогать делать данная интеллектуальная БЗ,
выдавая подобные ассоциации эксперту, а в будущем, и сама делать "открытия".
Другая особенность нейросемантических БЗ заключается в том, что все технические характеристики ее ассоциативной памяти: время доступа, коэффициент компрессии-сжатия
информации, надежность хранения информации и др., а также и явление "автоструктуризации", имеют тенденцию к улучшению, как в среднем, так и в абсолютных значениях, по
мере роста информационных объемов БЗ.
Разработка БЗ, как крупномасштабной интеллектуальной информационной системы потенциально способной к эволюционному саморазвитию до уровня когнитивных возможностей человека, открывает и неограниченные возможности ее качественного роста.
Прозрачное и понятное представление (в виде гипертекстовых форм) в БЗ структуры всех
инновационных предметных областей в их интеграции и в различных проекциях, позволят
пользователям-исследователям увидеть возможные междисциплинарные прорывные направления, управленцам  помогут принимать решения об эффективности и очередности проведения той или оной инновационной деятельности.
По информационно-аналитическому охвату проектируемая БЗ не будет уступать лучшим
зарубежным, а по качеству,  превосходить [3]. Начиная с середины второго этапа дальнейшее развитие БЗ может быть переведено в режим самофинансирования.
Список использованной литературы и материалов
1. Дондуков А.Н., Воронцов В.А. Научно-техническая сфера России на пороге нового века. //Информационное общество, 2000, вып. 6, с. 3 - 6.
2. Люггер Д.Ф. Искусственный интеллект. Стратегии и методы решения сложных проблем. М.: Издательский дом Вильямс, 2003 г.864 стр.
3. Бодякин В.И. Определение понятия "информация" и "знание" с позиций нейросемантики. М.: ИПУ РАН. 2006
http://www.mtas.ru/search_results.php?short_view=0&publication_id=3033
www.mtas.ru/Library/uploads/1168460706.pdf
Бодякин Владимир Ильич
E-mail body@ipu.ru
117997 Москва, ул.Профсоюзная-65, Институт проблем управления р.т.: 334-92-39
Скачать