Геоинформатика Раздел 3. Работа с пространственными данными. Пространственные данные как основа создания специализированных информационных систем • Пространственный объект (геообъект, геоинформационный объект, географический объект) – цифровая модель материального или абстрактного объекта реального или виртуального мира с указанием его идентификатора, координатных и атрибутивных данных. Объектом может быть неподвижный или движущийся простой или сложный объект, явление, событие, процесс и ситуация. • Пространственные данные (географические данные, геоданные) – данные о пространственных объектах, включающие сведения об их местоположении и свойствах, пространственных и непространственных атрибутах. Пространственные данные обычно состоят их двух взаимосвязанных частей: координатных и атрибутивных данных. • Координатные данные определяют позиционные характеристики пространственного объекта. Они описывают его местоположение в установленной системе координат в виде последовательности координат точек. Пространственные данные как основа создания специализированных информационных систем • Атрибутивные данные представляют собой совокупность непозиционных характеристик (атрибутов) пространственного объекта, определяют смысловое содержание (семантику) объекта и могут содержать качественные или количественные значения. Таким образом, любой предмет или явление может быть описано в пространстве согласно следующей модели: парой координат (географическое множество), геометрией (схематическое множество) и некоторым набором характеристик (атрибутов). Атрибутивная структура данных может быть представлена в виде таблиц и текстов. При этом атрибутивные данные могут иметь пространственную привязку, либо не иметь ее. Любые атрибутивные данные могут быть «привязаны» к конкретному объекту, дополняя тем самым его пространственные характеристики. Пространственные данные как основа создания специализированных информационных систем • Географическое (картографическое) множество содержит все образы объектов (точечных, линейных, площадных) с реальными географическими координатами; его выражением является цифровая модель местности (карта, изображение снимка). • Схематическое (графическое) множество – это схематическое описание образов объектов, например, в виде картосхем с условными координатами объектов, сетевых графиков планирования, схем телефонной сети, коммуникаций и т.п. • Между схематическим и географическим множествами существует тесная взаимосвязь, т.к. для решения задач анализа часто требуется совмещение схем и реальных карт, поэтому условные координаты переводятся в реальные, и наоборот. Модели данных • Атрибутивная модель. • Картографическая модель: ▫ 0-мерные модели – точечные; ▫ 1-мерные модели – линейные (дуги, отрезки, ломаные); ▫ 2-мерные модели – площадные (полигоны, окружности, многоугольники) и модели геополей (представлены в основном изолиниями); ▫ 2,5D-модели – двухмерные модели, отображенные в трехмерном пространстве (например, для отображения модели рельефа); ▫ 3D-модели – трехмерные модели. На основе этих моделей строятся модели поверхности, среди которых выделяются два основных вида: модель в виде регулярной сети данных – «решеточная» (lattice) и «ячеистая» (grid) модель; модель, построенная по нерегулярным наборам данных – триангуляционная (TIN – Triangulated Irregular Network). • Графическая модель: • Модель, используемая в системах автоматизированного проектирования общего назначения (САПР) • Модель инженерных сетей. Модели пространственных данных для создания хранилища данных заданной тематики • Системы с пространственной локализацией данных включают различные базы: 1. базы данных, 2. базы моделей объектов 3. базы программ 4. алгоритмов обработки. • В общем случае эти разнообразные базы можно рассматривать как базы данных различного содержания. • Большинство современных БД, построенных на основе так называемых реляционных моделей, имеют табличную форму и иногда называются табличными. Структуры БД ГИС • Главным принципом организации таких БД является создание одной или совокупности взаимосвязанных между собой таблиц. • Первым этапом создания БД является определение включаемых в нее характеристик и построение логической записи, включающей все описательные характеристики. • Вторым этапом является создание на основе полученной логической записи нескольких таблиц с помощью процедур нормализации. • Основными понятиями реляционных баз данных являются • тип данных • домен • атрибут • кортеж • первичный ключ • отношение Структуры БД ГИС • Главным принципом организации таких БД является создание одной или совокупности взаимосвязанных между собой таблиц. • Первым этапом создания БД является определение включаемых в нее характеристик и построение логической записи, включающей все описательные характеристики. • Вторым этапом является создание на основе полученной логической записи нескольких таблиц с помощью процедур нормализации. • Основными понятиями реляционных баз данных являются • тип данных • домен • атрибут • кортеж • первичный ключ • отношение Модель описания объектов хранилища пространственных данных класса «карта» Параметр Представление Формат хранения Система координат Проекция Датум Масштаб Тематика Геометрия объектов Значение векторная растровая shp img jpg Долгота/широта Сфероид Красовского Пулково 1942 1:100000 Горно-геологическая Гидрография Физико-химические свойства углей Точка Полилиния Полигон Модель описания объектов хранилища пространственных данных Класс «аналитические данные» Параметр Название Тип данных Значение Названия объектов (название шахт, марок углей и т.п.) Integer, Char, Long Класс «космоснимки» Параметр Номер Название Формат хранения Система координат Проекция Датум Значение Градация внутри геолого-экономических районов Имя снимка Img Долгота/широта Сфероид Красовского Пулково 1942 Хранилище пространственных данных • Создание хранилища пространственных данных • Две основные идеи: ▫ Интеграция разъединенных детализированных данных в едином хранилище. Под детализированными данными понимаются некоторые конкретные факты, свойства, события и т.п. В процессе интеграции должно выполняться согласование рассогласованных детализированных данных и, возможно, их агрегация. Данные могут поступать из различных источников: исторических архивов корпорации, оперативных БД, внешних источников. ▫ Разделение наборов данных, используемых для оперативной обработки, и наборов данных, применяемых для решения задач анализа. • Информационное хранилище представляет собой ядро всей системы – один или несколько серверов БД. • Метаданные (репозиторий) играют роль справочника, содержащего сведения об источниках первичных данных, алгоритмах обработки, которым исходные данные были подвергнуты и т.д. Общая архитектура корпоративной информационной системы на основе хранилища данных Разработанный банк данных ГИС Хранилище пространственных данных Проблемы реализации хранилища данных: • неоднородность программной среды; • распределенный характер организации; • повышенные требования к безопасности данных; • необходимость наличия многоуровневых справочников метаданных; • потребность в эффективном хранении и обработке очень больших объемов информации. Схема организации хранилища пространственных данных Существующие подходы и решения создания хранилищ данных Компания IBM. Программный продукт - A Data Warehouse Plus. Oracle. Warehouse Technology Initiative. ▫ наличие реляционной СУБД Oracle, которая постоянно совершенствуется для лучшего удовлетворения потребностей складов данных; ▫ существование набора готовых приложений, обеспечивающих возможности разработки склада данных; ▫ высокий технологический потенциал компании в области анализа данных; ▫ доступность ряда продуктов, производимых другими компаниями Hewlett Packard Sybase Informix Software AT&T GIS SAS Institute Software AG 1. IBM A data Warehouse Plus Комплект программных продуктов Warehouse Technology Initiative 3. Hewlett Intelligent Packard Warehouseплатф орма Unix 4. Sybase Warehouse WORKS 2. Oracle СУБД DB2 + Реляционна + я СУБД Oracle + Хранение данных Средства данных обработки компаний др. компании БД Интеграция ПО Название Производитель Сравнительный анализ программных продуктов, реализующих технологию хранилища данных Централизованное, несколько распределенных рынков данных Централизованное, несколько распределенных рынков данных Реляционна + я СУБД Централизованное Реляционна + я СУБД Sybase System 11 Централизованное, несколько распределенных рынков данных Средства аналитической обработки, статистического анализа Одномерный анализ, многомерный анализ (OLAP, DataMining ) Средства аналитической обработки, статистического анализа 5. Informix Software 6. AT&T GIS Enterprise Information Factory Open Data Warehouse Initiative СУБД Teradata Средства данных обработки Централизованное Централизованное, несколько распределенных рынков данных + Реляционн + ые, нереляцион ные БД + Хранение данных компаний др. компании On-Line Dinamic Реляционна + Parallel Server я СУБД 7. SAS Institute 8. Software AG БД Интеграция ПО Название Производитель Сравнительный анализ программных продуктов, реализующих технологию хранилища данных 4GL ADABA S, Natural 4GL Средства аналитической обработки, статистического анализа