Космические снимки: мультиспектральные оптические и SAR снимки Автоматизированное распознавание дорог в задачах управления рисками Появилось много методов (полу)автоматического распознавания дорог и зданий на аэро- и космоснимках. Что уже достигнуто, и что ещё необходимо сделать? Судя по последним работам, относящимся к распознаванию дорожных сетей по мультиспектральным космическим снимкам и снимкам SAR, на этих снимках может быть запечатлена в любое время практически любая точка Земли, что очень важно для обеспечения мер быстрого реагирования на угрозы или гражданские кризисы. Полностью автоматическое распознавание объектов пока ещё не стало повседневной реальностью и по-прежнему требует фундаментальных исследований (см. текстовое окно). Однако полуавтоматические методы все больше находят свое применение в работе. Методы, объединяющие разные виды съемки, разные сенсоры, внешние данные или другие источники информации в рамках устойчивой статистической схемы, могут в будущем повысить уровень автоматизации. Последние разработки даже ориентированы на поддержание деятельности спасательных команд в посткризисных условиях, обеспечивая автоматическое распознавание разрушенных и неповрежденных дорог. В статье дается общее описание трехэтапного метода. Первый этап сводится к исключительно автоматическому распознаванию дорог. Поскольку 100%-я полнота и правильность распознавания невозможны, то на втором этапе применяется схема самодиагностики. А на третьем этапе оператор выполняет конечную проверку – редактирование с использованием новейшего интерактивного инструментария. Рисунок 1. Распознавание дорог на снимках SAR X-/L- с использованием контекстной информации. Белые линии: распознанные дороги; черные линии: отсутствующие сегменты; пунктир: контекстная территория ‘город’ (исходная точка (seed point) распознавания); черные участки: контекстная территория ‘лес’. (Courtesy: Wessel, 2006) АВТОМАТИЧЕСКОЕ РАСПОЗНАВАНИЕ На рисунке 1 показан результат использования контекстной информации о лесных и городских территориях в распознавании дорог по двум снимкам SAR X-/L-. С помощью этого метода моделируется сенсорно- и контекстно-зависимое изображение дорог. Недавно этот метод был применен к теории байесовских решений для соединения нескольких SAR-снимков и данных об очертаниях и взаимном расположении объектов. Сравнение с оцифрованным вручную образцом показало 70% полноты и правильности распознавания. Цифры возрастают, когда немного модифицированный метод применяется к оптическим снимкам такого же разрешения и сложности: полнота распознавания составила 85%, а правильность - 90% (рисунок 2). Такое улучшение по сравнению со снимками SAR объясняется радиометрическим качеством оптических снимков, которое повышается при хороших погодных условиях и освещенности. На качество снимков SAR влияют спекл-шумы, слепая зона на экране радара и наложение, но качество не зависит от освещения и погодных условий (почти). Однако даже при небольшой облачности полнота и правильность распознавания оптических снимков снижается. Рисунок 2. Сегменты дороги, распознанные на панхроматических снимках Ikonos. Зеленый цвет - верно; красный цвет - отсутствует; синий цвет - ложная тревога (Courtesy: Mayer et al. 2006). Рисунок 3. Снимок Ikonos, полученный в период разлива Эльбы, Германия, 2002. Желтый цвет распознанные (отслеженные) дороги; синий цвет - щелчки мыши оператора. САМОДИАГНОСТИКА Перед тем как оператор займется проверкой и редактированием, на втором этапе проводится самодиагностика результатов автоматического распознавания. При постредактировании оператор руководствуется показателями надежности (reliability measures), полученными из избыточности данных и сведений об объекте (сведения, описываемые объектной моделью, а не иными внешними данными), и чтобы получить объективную оценку надежности, не следует при распознавании использовать свойства объекта, применяемые в самодиагностике. К типовым свойствам дорог, используемым в самодиагностике, относятся: небольшое количество связанных компонентов, отсутствие скоплений перекрестков за пределами городской территории и удобные соединения различных участков в зависимости от типа рельефа. Для оценки таких свойств используется теория нечетких множеств. Надежность самодиагностики определялась посредством сравнения результатов с эталоном при помощи “светофорного” кодирования (рисунок 4). Почти все участки дорог зеленого цвета были правильно распознаны (более 90%). Надежность распознавания “ложных тревог” составила 80%-90%. Оператору следует сосредоточиться на дорогах желтого цвета, поскольку в этом случае правильность распознавания варьируется между 50% и 75%. Каков был бы результат, если участки дорог желтого цвета распознавались исключительно оператором? Тогда правильность общего результата осталась бы равной 95%, а экономия времени составила 50% - 75%. Рисунок 4. Пример самодиагностики: зеленый (принять), желтый (проверить), красный (отклонить). РУЧНОЙ МЕТОД РАСПОЗНАВАНИЯ Самодиагностика повышает только правильность распознавания, но не её полноту; для обеспечения последней оператору необходимо найти дороги, не выявленные в ходе автоматического распознавания. Это трудоемкая и затратная процедура, и здесь может существенно помочь применение полуавтоматических инструментов (требующих участия пользователя). Они гарантируют высокое качество, поскольку оператор контролирует сбор данных и тут же предупреждает появление ошибок. Существует два типа полуавтоматических инструментов: первый – идентификаторы дорог (road trackers), которые определяют начало и направление дороги по двум точкам, второй – оптимизаторы маршрута или сети, которые, как и активные контуры (‘змейки’) прокладывают оптимальный маршрут между двумя точками. Концепция ‘змейки’ недавно была успешно применена к полным сетям с заранее заданной топологией. Участки желтого цвета на рисунке 3 распознавались автоматически, а в синих точках решение принимал оператор, нажатием “мышки” либо продолжая автоматическое распознавание, либо переходя к ручной процедуре с использованием полуавтоматических инструментов. Из-за качества изображения автоматическое распознавание снимков SAR менее устойчиво к ошибкам и требует большего участия оператора. Но топологические ограничения и процедуры оптимизации сети, встроенные в алгоритмы ‘змейки’, подтвердили свою эффективность: после грубой оцифровки точек и уточнения топологии можно было распознать дороги полностью автоматически (рисунок 5). Этот метод удобнее наблюдательного распознавания (supervising extraction) через отслеживание дороги (road tracking). Было бы хорошо определять наиболее подходящий метод по самим снимкам, но, похоже, в обозримом будущем эта цель не достижима. Рисунок 5. ‘Змейки’, примененные к снимку SAR. Слева - интерактивная инициализация; справа - результат оптимизации (Courtesy: Butenuth, 2008). БЛАГОДАРНОСТЬ Эта статья частично основана на докладе, представленном на конгрессе ISPRS 2008 в Пекине, ISPRS-архивы (Vol. 37-В4, pp 277-284). Штефан Хинц в 1998 году окончил Мюнхенский Технический Университет (TUM) по специальности «геодезия и геоинформация», в 2003 году блестяще защитил докторскую диссертацию по теме “Автоматическое распознавание городских дорожных сетей на аэроснимках”. В 2004 году стал научным сотрудником и возглавил Группу молодых исследователей Гельмгольца “Распознавание дистанционных изображений высокого разрешения” на факультете Технологий дистанционного зондирования, Мюнхенский Технический Университет. В 2008 году получил должность профессора Отделения дистанционного зондирования и машинного зрения, Университет Карлсруэ. Вопросы фундаментальных исследований Какой тип объектного моделирования лучше всего отображает разнообразие классов объектов, в частности, принимая во внимание успех новых методов на базе внешних характеристик? Какое взаимное расположение объектов облегчает распознавание, и какое создает значительные трудности? Можно ли разработать самонастраивающийся метод распознавания, сохранив при этом контроль над вычислительной нагрузкой? Или лучше взять монолитный метод и включить в него динамические элементы или использовать общие (типовые) алгоритмы поиска, применяя эвристики для управления областью поиска? Какие решения должен принимать оператор, а какие - компьютер?