Описание базы данных TROICA и клиентских интерфейсов к ней.

реклама
Описание базы данных TROICA и клиентских
интерфейсов к ней.
Сафронов А.Н., Панин Л.В.
Институт физики атмосферы им.А.М.Обухова, РАН
Содержание
Описание базы данных TROICA и клиентских интерфейсов к ней. ...............................1
Концепция создания базы данных для глобального экологического контроля
атмосферы России. ......................................................................................................................2
Общая характеристика системы...............................................................................................2
Характеристика рынка услуг....................................................................................................2
Другие мировые системы контроля качества атмосферы .....................................................3
Пользователи системы ..............................................................................................................3
Среда разработки и системные требования для пользователей............................................4
Функции системы ......................................................................................................................4
Функции для пользователей ..............................................................................................................................4
Функции администаторов базы.......................................................................................................................5
Функции для операторов ввода информации ..................................................................................................5
Функции для операторов ввода справочной информации и поддержания web сайта................................6
Описание предметной области и архитектура базы.............................................................6
Программные средства, которые входят в базу TROICA......................................................6
Общее описание базы данных..................................................................................................7
Описание некоторых наиболее важных таблиц базы данных.............................................11
Таблица “Измерений” : (MEASUREMENT) ...................................................................................................11
Таблица “Координат” : (COORDINATE)......................................................................................................11
Таблица “Измеренных, вычисленных или приобщенных величин” : (MEASURAND) ................................12
Интерфейсы клиентской стороны .........................................................................................13
Общее описание интерфейсов, работающих на клиентской стороне ................................13
Пример работы программы Town&Village, сделанной для анализа шлейфов газов от
городов, расположенных вдоль Транс-Сибирской магистрали..........................................14
Состояние базы данных и интерфейса. Основные проблемы. .........................................19
Создание структуры базы данных .........................................................................................19
Заполнение базы данными......................................................................................................19
Создание интерфейсов ............................................................................................................19
Прокладка локальной сети для работы базы ........................................................................19
Соединение центральной базы данных со стационарными станциями наблюдения .......20
Финансовые потребности, необходимые для создания профессиональной,
полномасштабной базы данных. ............................................................................................20
1
Концепция создания базы данных для глобального
экологического контроля атмосферы России.
Раздел «Концепция» дает представление о назначении системы TROICA и описывает
потребности пользователей и дает общее представление о решаемых системой задачах.
Общая характеристика системы
Система TROICA предназначена для ввода и хранения информации о составе атмосферы,
ее динамическом состоянии, радиационных и метеорологтческих характеристиках,
полученных в международных экспериментах TROICA и обеспечения доступа к этой
информации заинтересованным пользователям. Основные функции системы таковы:
• Хранение в базе данных информации о содержании в атмосфере газовых и
аэрозольных примесей, о потоках солнечной радиации, о скоростях
фотодиссоциации, о других динамических, радиационных и метеорологических
характеристиках, получаемых на научных станциях ИФА РАН (Высокогорная
научная станция, Кисловодск, Звенигород, Москва, Ловозеро).
• Предоставление клиентам с помощью системы запросов удобного доступа к базе
данных с возможностью сравнения состояния атмосферы по различным регионам и
годам, а также сравнение с характеристиками, представленными в базах данных,
содержащих информацию полученную с глобальной сети мониторинга атмосферы
(GAW), от космических средств мониторинга и в крупных международных
проектах.
• Автоматизация пополнения и изменения данных.
Характеристика рынка услуг
Большинство пользователей заинтересовано в наличии системы, облегчающей
использование полномаштабной базы данных. Сейчас они вынуждены проводить анализ
газовых компонент атмосферы экспедиций TROICA, анализируя огромные объемы
текстовых листов, электронных писем и www-сайтов, предоставляющих информацию в
различных видах. Поэтому пользователям требуется много времени и усилий на выборку
нужных значений. Система TROICA, предоставляя простой интерфейс для доступа к
данным по экспедициям и механизмы для быстрого сравнения данных, позволит понизить
требования к квалификации пользователей и увеличить скорость прохождения запросов и
объем обрабатываемой информации.
Потенциальные пользователи системы TROICA – научно- исследовательские
организации, коммерческие и экологические, анализирующие состояние атмосферы,
наличие или возможность появления экстремальной экологической ситуации.
Предполагается, что предоставление доступа к базе данных коммерческим организациям,
может обеспечить получение средств, достаточных для развития базы данных и ее
пополнения в ходе новых экспедиций TROICA.
Развитие базы данных и особенности следующих версий:
•
•
•
Расширение базы путем включения в нее данных наблюдений, полученных на
других российских и зарубежных станциях мониторинга атмосферы и с
космических аппаратов.
Модернизация базы в соответствии с мировыми стандартами, сертификацией как
данных, так и самой базы и интерфейса доступа к ней.
Наличие Web-интерфейса для доступа к базе данных
2
Другие мировые системы контроля качества атмосферы
Существует несколько мировых систем контроля состояния атмосферы, ряд из которых
пытается контролировать состояние атмосферы России, используя космические средства
мониторинга. С некоторыми из этих систем можно ознакомиться на следующих интернетсайтах :
•
•
•
•
•
•
•
•
•
•
•
Goddard Earth science archive center: http://www.daac.gsfc.nasa.gov
Метео данные, Word Meteorological Organization Global Atmosphere Watch, (ODW):
http://www.msc-smc.ec.gc.ca/woudc/
Озон и ультрафиолетовая радиация (WOUDC ): http://www.tor.ec.gc.ca/woudc
Парниковым газам (WDCGG):
http://www.gaw.kishou.go.jp/wdcdd.html
Поверхностный озон (WDCSO3):
http://www.nilu.no/projectcts/nadir/wdcso3/wdcso3.html
Радиационного переноса (WRDC):
http://wrdc.mgo.rssi.ru
Аерозоль (WDCA):
http://rea.ei.jrc.it/~wilson/wdca/wdca.html
Химия примесей (антропогенного загрязнения атмосферы)(WDCPC):
http://marble.asrc.cestm.albany.edu/gasac/data.html
Пользователи системы
Система предназначена для шести типов пользователей:
• Исследователи-пользователи
o Используют систему как средство быстрого подбора необходимых данных в
локальной сети или через интернет.
• Администраторы системы
o Устанавливают систему, контролируют деятельность пользователей,
планируют их работу на основе статистики запросов к базе.
o Отвечают за работоспособность базы, обеспечивают создание резервных
копий.
• Операторы ввода информации в систему
o Осуществляют добавление в систему новых информационных материалов и
данных наблюдений, удаление неактуальных или ошибочных данных.
• Операторы ввода справочной информации и поддержания web сайта
o Поддерживают web сайт базы, обеспечивают обновление демоверсии базы и
отвечают за рассылку по e-mail результатов подборки данных, отвечая на
запросы заинтересованных лиц и организаций.
• Операторы ввода записей, верификации и коррекции дневника экспедиций
o Отвечают за подготовку дневника экспедиции, в котором визульно
фиксируются события, к обработке с помощью запросов базы данных.
o Осуществляют добавление в новых записей в дневник экспедиции
o Корректируют работу фильтров, использующих лингвистический анализ
записей дневника . (В ряде случаев невозможно определить из
лингвистического анализа тип произощедшего события, например “Солнце
село…” и “проехали село…” или “слева озеро…” и “п.Озерское” и т.п.)
Основная категория пользователей – исследователи-пользователи. Именно для них, в
первую очередь, предназначена система. Операторы ввода и администраторы нужны
только для обслуживания этой основной категории пользователей.
3
Среда разработки и системные требования для пользователей
При работе с локальной копией базы данных пользователям необходим персональный
компьютер с процессором не ниже Pentium 4, HDD не менее 4 GB и CDROM. Кроме
самой базы данных, представленной в виде файла с расширением gdb, на компьютере
пользователя должен быть установлен Firebird Server (или Interbase Server) и программы
интерфейса, облегчающие генерацию SQL запросов.
При работе в локальной сети компьютер пользователя должен быть подключен к
локальной сети через сетевую карту, обеспечивающую достаточную скорость передачи
данных. Рекомендуемая сетевая карта: ReadyLink Express 10/100 (RE100ATX/WOL) со
скоростью 100Mbps.
При пользовании web доступом к базе данных компьютер должен дополнительно иметь
почтовую программу и браузер.
Предполагается, что компьютеры администраторов имеют дополнительно стандартные
программы из Interbase Administration Tool. Рекомендуются программы: ERwin, Case
Studio, IB Expert.
Функции системы
В данном разделе описаны основные функции системы, поделенные на четыре части, по
числу типов пользователей системы. Для каждой функции проставлен приоритет.
Приоритет - это число от 1 до 3 (наивысший приоритет - 1), означающее важность данной
функции для системы в целом, а не только для данной части функций.
1.
2.
3.
Критическая функция. Без реализации этой функции вообще не имеет смысла делать систему
Важная функция. Без реализации этой функции система потеряет значительную часть своих
достоинств.
Полезная функция. Может расширить круг пользователей за счет привлечения специалистов,
имеющих компьютерное образование на уровне пользователя MS Office.
Функции для пользователей
N Название
Приоритет Обоснование выбора приоритета
1=критическое
2=важное
3=полезное
1
Быстрый поиск данных
1
2
Возможность сравнения
на одном экране нужной
информации по всем
материалам всех
экспедиций
1
3
Актуальность и
оперативность базы.
Информация в
центральной базе должна
появляться не позднее,
чем через 1 месяц после
экспедиции
Работа в «оффлайн»-
2
4
Оптимизация запросов SQL запросов при
малой мощности персональных
компьютеров и довольно большом
объеме базы является ключевой.
Сравнение результатов из разных
экспедиций позволяет проследить
изменение состояния атмосферы в одной
и той же местности и облегчает
разработку сценариев для численного
моделирования.
Оперативный анализ данных необходим
для решения многих экологических
задач, в частности, обнаружение и
прослеживание экстремальных ситуаций,
природных и техногенных катастроф.
1
Так как даже выделенный доступ в
4
режиме (без подключения
к Интернет)
5
6
Возможность для
пользователей
оперативного обновления
своей копии демобазы в
интернете
Работа с базой данных в
«инлайн»-режиме (с
подключением к
Интернету).
Интернет не всегда надежен, то
возможность работы базы в локальной
сети является определяющим.
Повышается эффективность
использования данных различными
пользователями, шире становится круг
пользователей.
3
3
Высокая скорость ответа на SQL запрос
по современным линиям интернет-связи
обеспечивает доступность базы из любой
точки мира. Оператор web сервиса
проверяет правильность запроса к базе,
проводит аутентификацию и помогает
пользователям.
Функции администаторов базы
N Название
Приоритет Обоснование выбора приоритета
1=критическое
2=важное
3=полезное
1
Регулирование доступа
как ко всей базе данных,
так и к отдельным ее
частям
2
Добавление и исправление 1
данных
3
Поддержание целостности 1
базы и создание резервных
копий базы, настройка
индексов базы
Статистика пикового
3
времени обращений
клиентов
Оптимизация запросов
2
клиентов
4
5
1
Выставление password для
пользователей, распределение ролей в
базе и регулирование прав доступа к
информации. Шифрование данных по
просьбе организаций-владельцев данных.
Верификация данных, маркировка
данных, неудовлетворяющих условиям
их регистрации. Верификация данных
осуществляется на основе записей
дневника экспедиций
Создание резервных копий базы не реже
одного раза в 3 месяца и после внесения
новых экспедиционных данных
Расширение круга пользователей
Повышение эффективности
использования базы данных
Функции для операторов ввода информации
N
Название
Приоритет Обоснование
1=критическое
2=важное
3=полезное
1
Поддержка форматов
сканирования данных в
формате Excel, в
фиксированном формате
или в формате с
1
Автоматизация ввода данных приносит
выигрыш в скорости ввода данных по
сравнению с их набивкой
5
2
3
разделением данных
пробелами
Обработка информации из
дневника экспедиций,
стандартизация событий и
сообщений, занесенных
операторами
Выбраковка ошибочных
данных, исходя из
записей в дневнике
1
Использование всей доступной
информации, ее стандартизация
расширяют область применения базы
данных и ее коммерчискую
привлекательность
Выявление некорректных данных и
уведомление администратора о наличии
таких данных. Примером таких данных
является падение напряжения в сети
приборов, приводящее к отключению
приборов или неверной регистрации
параметров
1
Функции для операторов ввода справочной информации и поддержания
web сайта
N Название
Приоритет Обоснование
1=критическое
2=важное
3=полезное
1
2
Максимальная
1
автоматизация –
избавление от повторного
ввода данных
Реклама и маркетинг через 3
интернет базы данных
3
Обработка SQL запроса,
поступающего через
интернет, и отправка с
помощью e-mail
результатов запроса
3
4
Полная автоматизация
процесса измерений в
режиме online в реальном
времени
1
Основное занятие операторов – ввод
данных для демо версии web сайта и
ответа по e-mail на SQL запросы,
поступающие через e-net
Расширяет сферу использования базы
данных вплоть до ее применения в
программах экологического обучения и
решения региональных экологических
проблем.
Упрощает сотрудникам Центра данных
работу с пользователями. Удешевляет
стоимость услуг и делает базу данных
доступной для большого числа
пользователей.
Предполагается переход к проведению
дистанционно-удаленных измерений и к
вводу результатов в базу в реальном
времени
Описание предметной области и архитектура базы
Программные средства, которые входят в базу TROICA
1. Блок программ, поставляемых клиентам, работающих в режиме «offline»:
a. Клиентская часть базы данных «TROICA» по газовому и аэрозольному
составу атмосферы, динамике атмосферы, радиационным и
метеорологическим ее характеристикам , получаемых в ходе экспедиций
TROICA и на стационарных станциях мониторинга (часть основной базы по
6
2.
3.
4.
5.
запросу клиента и согласованию с организациями, являющимися
собственниками включенной в базу информации)
b. Клиентская программа доступа к базе данных
c. Клиентская часть программы обновления информации в базе TROICA с
центрального сервера (возможно обновление с CD диска)
Блок программ, поставляемых клиентам, работающих в режиме «online»
a. Демоверсия базы данных «TROICA».
Блок программ, работающих на стороне сервера
a. Центральная база данных «TROICA» по газовому и аэрозольному составу
атмосферы, динамике атмосферы, радиационным и метеорологическим ее
характеристикам , получаемых в ходе экспедиций TROICA и на
стационарных станциях мониторинга.
Дополнительная база «Backoffice»
a. Серверная часть программы обновления БД «TROICA»
b. Программа генерации web страниц, отображающих данные по текущему
состоянию атмосферы, получаемые по сети от стационарных станции
наблюдения
Блок программ для наполнения баз данных (backoffice)
a. Программа ввода информации по каждой новой экспедиции
b. Программа ввода текущей информации со стационарных станций
(получаемых в режиме e-mail или в режиме связи через Internet)
c. Программа ввода информации из подсоединенных к сети приборов в
режиме реального времени
d. Программа ввода информации из других источников, в том числе и в виде
графических файлов (ЦАО, ГидроМетеоЦентр и т.п.)
Общее описание базы данных
В соответствии с вышеизложенным, базу данных системы можно условно поделить на три
части:
• Информация по газовому и аэрозольному составу атмосферы, динамике
атмосферы, радиационным и метеорологическим ее характеристикам, полученная в
ходе международных экспедиций TROICA 1-7.
• Информация, передаваемая стационарными станциями наблюдения
(Высокогорная научная станция, Кисловодск, Звенигород, Москва, Ловозеро), в
том числе с приборов, включенных в систему автоматизированного контроля
состояния атмосферы.
• Информация от иных организаций и учреждений, передаваемая, как на основе
договоров о научном сотрудничестве, так и на основе бизнес-договоров.
База данных включает:
o 12 доменов;
o 38 таблиц;
o 18 обзоров;
o 17 процедур;
o 3 триггера;
o 5 генераторов;
o 3 исключения
Ниже приведена полная блок-схема структуры базы, полученная с помощью программы
Case Studio 2.6:
7
8
Продолжение диаграммы
...
Продолжение диаграммы ...
9
10
Пример административного доступа к базе данных демонстрируется на примере
программы IB Expert :
Описание некоторых наиболее важных таблиц базы данных
Таблица “Измерений” : (MEASUREMENT)
Атрибуты
• Индекс координаты, в которой измерялась величина (primary key)
• Индекс измеренной величины, то есть индекс, по которому из связанной таблицы
можно определить, какая величина измерялась (primary key)
• Значение измеренной величины
Связи
• Связь с таблицой координат (COORDINATE)
• Связь с таблицей измеряемых величин (MEASURAND)
Таблица “Координат” : (COORDINATE)
Атрибуты
• Индекс координаты, в которой измерялась величина (primary key)
• Список индексов различных экспедиций
• Время
• Индекс, указывающий на имя оператора
Связи
11
•
•
Связь с таблицой имен операторов (EMPLOYEE)
Связь с таблицей экспедиций (EXPERIMENT_PART)
Таблица “Измеренных, вычисленных или приобщенных величин” :
(MEASURAND)
Атрибуты
• Индекс измеренной величины (primary key)
• Индекс, определяющий название величины (например, “концентрация”)
• Индекс, определяющий название объекта измерения (например, “CO2”)
• Индекс, определяющий прибор, на котором проводились измерения
• Индекс, определяющий канал прибора (левый или правый сенсор)
• Индекс, определяющий источник получения величины (из экспедиции, из
интернета, ЦАО и т.п.)
• Индекс, определяющий тип величины (например, из экспедиций: 10 sec initial)
• Индекс, определяющий, в чем измерялась величина (например, Part per billion, ppb)
• Минимально допустимое значение измеряемой величины
• Максимально допустимое значение измеряемой величины
• Толерантность
• Описание величины, включающее название величины, название объекта и т.п.
(например, Concentration of ozone in ppb by DASIBI-1008AH)
Связи
• Связь с таблицей названий величин (MEASUREMENT_QUANTITY)
• Связь с таблицей названий объектов (MEASUREMENT_OBJECT)
• Связь с таблицей приборов (DEVICE)
• Связь с таблицей каналов приборов (DEVICE_CHANNEL)
• Связь с таблицей источников получения величин (DATA_SOURCE)
• Связь с таблицей типов измеряемых величин (MEASURAND_TYPE)
• Связь с таблицей единиц измерений (MEASUREMENT_UNIT)
12
Интерфейсы клиентской стороны
Общее описание интерфейсов, работающих на клиентской
стороне
Возможно несколько подходов к анализу данных TROICA.
Первый из них заключается в нахождении экстремальных значений концентрации
газов и аэрозолей и наличие токсичных соединений и определении координат местности,
где наблюдаются превышения либо над значениями ПДК, либо отклонения от типичных
для данной местности значений концентраций примесей и их состава. После этого
устанавливаются причины, вызвавшие аномальные значения или соотношения: либо это
дальний перенос загрязнений, либо загрязнения от локальных источников. Примером
такого подхода является разработка интерфейса O3_Generation для нахождения областей
генерации озона, то есть тех мест вдоль трассы, где концентрация озона превысила 10ppb
от усредненного за 10 минут значения, при одновременном возрастании концентрации
NO2 до 3-4ppb и NO до 2ppb.
Второй подход заключается в анализе значений концентраций, исходя из данных
метеорологии и записей оператора экспедиций о происходящих событиях (пожарах,
встречных поездах и т.п.). Примером такого подхода является разработка интерфейса
Dairy_GPS для нахождения значений концентраций примесей вблизи объектов, попавших
в поле зрения операторов экспедиции.
Третий подход заключается в анализе вклада в загрязнение атмосферы
стационарных объектов, таких как промышленные объекты, железнодорожные станции и
т.п. Примером такого интерфейса является программа Town&Village, позволяющая
исследовать шлейфы газов от городов.
И последним типом интерфейсов, являются программы верификации дневниковых
записей, позволяющие исправлять и идентифицировать записи наблюдений оператора.
Примером такого интерфейса является программа Enter_Dairy.
Итак, все типы интерфейсов на стороне клиента можно разделить на следующие типы:
•
•
•
•
Интерфейсы анализа данных и нахождения источника загрязнения
(O3_Generation)
Интерфейсы для исследования источников загрязнений, отмеченных
оператором экспедиций (Dairy_GPS)
Интерфейсы для исследования загрязнений от стационарных объектов, таких
как промышленные предприятия, города и станции (Town&Village)
Программы для верификации коррекции дневниковых записей (Enter_Dairy)
Ниже проиллюстрируем работу интерфейсов на примере рассмотрения программы
анализа шлейфов загрязнений.
13
Пример работы программы Town&Village, сделанной для
анализа шлейфов газов от городов, расположенных вдоль
Транс-Сибирской магистрали.
Интерфейс включает программы для генерации сложных SQL запросов. Ниже
представлен общий вид первой страницы интерфейса для иследования шлейфов от
городов и промышленных зон.
Необходимо
поключиться к базе
данных, введя пароль
Вторая страница интерфейса посвящена выбору экспедиции или ее части. В TROICA-6 на
настоящий момент включены данные по стационарным станциям наблюдения, которые в
будущем предполагается перенести в соответствующий раздел базы, относящийся к
измерениям со стационарных объектов.
14
Выводятся данные по
концентрации озона,
окислов азота и величина
солнечной активности
Показаны записи из дневника
оператора
На этой странице представлен процесс выбора данных для набора газов О3 и NO2,
измеренных соответствено приборами Dasibi-1008 AM, Dasibi-1008 RS и AC-30M,
которые потом ищутся в базе данных. В случае, когда в экспедиции измерение величин не
проводилось (например, концентрация Po218 не измерялась в экспедиции TROICA-1),
результатом вывода SQL запроса будут пустые строчки.
Результат выборки может быть автоматически представлен в виде графиков зависимости
измеряемых величин от расстояния вдоль маршрута движения. Ниже представлены
результирующие графики, полученные при выборке значений вблизи г.Тюмень:
15
16
В режиме online оператор видит увеличение концентрации газов вблизи объекта (в данном
случае города Тюмень) и может оценить величину шлейфа загрязнения, вызванную
различными антропогенными факторами, такими как выхлопы городского транспорта,
выбросы промышленных объектов, утечки из газовых магистралей, городские свалки и
т.п. Время обработки такого запроса составляет порядка 5-10 секунд, что существенно
меньше времени обработки пользователем тех же данных, представленных в
традиционном Exel формате (xml).
Выборки по величине и направлению ветра вблизи станции могут быть получены с
помощью следующего диалогового окна:
Как видно из результатов выборки, ветер вблизи станции Тюмень был порядка 5-10м/c без
сильных порывов, северо-восточный.
17
Кроме этого, программа Town&Village позволяет найти величину корреляции между
величинами, которые исследователь может задать на следующей странице интерфейса:
В результате получаются следующие значения корреляции:
18
Состояние базы данных и интерфейса. Основные
проблемы.
Создание структуры базы данных
С учетом возрастающих объемов информации существующая база данных была
модернизирована в реляционную базу данных, более удобную для обработки информации
и написания SQL запросов.
Структура базы данных на настояший момент имеет 13 доменов, 37 таблиц, 17
обзоров, 49 процедур, 12 триггеров, 8 генераторов и 6 исключений. Структура базы
данных устоялась, прошла тестирование на функциональную пригодность и в дальнейшем
не будет претерпевать существенных изменений.
Заполнение базы данными
Данные всех экспедиций TROICA 1-7 были импортированы в базу. Также были
введены в базу тексты дневников экспедиций. Объем заполненой базы составляет порядка
2.5 Gb, что накладывает довольно жесткие условия как на работу интерфейса по выборке
данных, так и на персональные компьютеры, на которых данная база будет
устанавливаться.
База данных по результатам предыдущих экспедиций TROICA 1-7 заполнена на 85% .
Заполнение базы будет продолжено после проведения последующих экспедиций.
Создание интерфейсов
Ведется работа по созданию интерфейса для управления базой данных, а также
разрабатывается интерфейс для обработки дневников. Из-за довольно большого размера
базы наиболее важными являются вопросы оптимизациии SQL запросов.
На настоящий момент создано несколько программ клиентского интерфейса, которые
могут генерировать SQL запросы, позволяющие исследовать шлейфы вблизи населенных
пунктов и промышленных объектов, генерацию озона, а также производить любые
выборки измеренных величин по событиям, зарегестрированным в дневниках экспедиций.
Создана программа, позволяющая верифицировать записи дневника .
Так как программно нельзя различить тип произошедшего события из-за встречающихся
синонимов русского языка ( Пример: “Солнце село” и “проехали большое село”), а так же
из-за использовании в названиях населенных пунктов корней слов, по которым ведется
компьютером поиск (Пример: “Озерская”, “озеро слева”), то приходится прибегать к
ручной верификации записей типов событий в дневнике оператора, что требует большого
объема ручной работы. Автоматическая выборка с помощью созданных лигвистических
фильтров, обеспечивает надежную идентификацию приблизительно 30-45% событий
дневника, которые в дальнейшем могут быть использованы при программной обработке
базы данных. В дальнейшем предполагается отказаться от ручного ввода записей в
дневник следующих экспедиций, так как это создает большие трудности при обработке
результатов экспедиций.
Из-за больших объемов информации дневники экспедиций подготовлены только на
10-20% от их объема.
Прокладка локальной сети для работы базы
Для создания локальной сети и обслуживания базы данных в ИФА РАН был
приобретен инструмент, кабель, разъемы и дополнительные современные компьютеры (с
процессорами Pentium IV). Также была произведена прокладка и обжимка локальной сети,
приобретены и установлены 8 портовый 10/100Mbps pocket switch (model PS2208B) и 16
19
портовый 10/100Mbps desktop switch (model DS2216), приобретены и установлены на PC
новые сетевые карты 10/100 Fast Ethernet Adapter (model Complex RE100TX PCI 10/100).
Таким образом, работы по прокладке локальной сети базы завершены.
Соединение центральной базы данных со стационарными
станциями наблюдения
Начаты работы по компьютеризации стационарных станций и установления
устойчивой связи для обмена данными. На настоящий момент имеется e-net связь на
станциях в Москве и Кисловодске, и модемная связь на станции в Звенигороде. На
настоящий момент работы по подключению станций к базе данных продолжаются.
Финансовые потребности, необходимые для создания
профессиональной, полномасштабной базы данных.
Для создания полномасштабной базы, включающей все компоненты, как сервисной,
так и клиентской части, а также для заполнения базы от приборов в режиме online,
требуется команда из 5-7 человек профессиональных программистов, работающих на
постоянной основе.
Учитывая , что зарплата профессионального программиста в России порядка $500-700
в месяц, а также тот факт, что потребуется от 5 до 7 комплектов современных
персональных компьютерных систем (компьютеры, мониторы, офисная мебель и т.п.)
стоимостью порядка $1.500 каждый, можно оценить затраты на создание современной
базы данных до $60.000 (при команде из 7 человек, работающих в течение года). Оценка
дана без учета возможных затрат на аренду помещений.
Следует учитывать, что при выходе на международный уровень (представления на
международных конференциях, публикациях в международных научных журналах,
представлением данных через интернет) потребуются официальные лицензии на
программные продукты. Для справки приведем цены на лицензии основных
производителей серверов баз данных:
• Microsoft SQL Server 2000, Enterprise Edition, бессрочная лицензия на 25
клиентов - $11.099 или лицензия на один компьютер (CPU) - $19.999
• Oracle 9i DB, Enterprise Edition, бессрочная лицензия на 10 клиентов - $12.128
или лицензия на один компьютер (CPU) - $59.750
На настоящее время работа над созданием базы ведется силами одного научного
сотрудника ИФА c оплатой $150 и одного аспиранта. Без дополнительной финансовой
поддержки проект создания базы данных TROICA может затянуться на годы, если
вообще будет реализован.
20
Скачать