Нечеткая классификация данных Aster для картографирования лесов В данной статье рассматривается новая методика дешифрирования снимков ASTER и неточная управляемая классификация (fuzzy supervised classification). Для установления категорий принадлежности типов лесного покрова на базе учебных данных (training data) используется метод статистической гистограммы. Сайед Сохел Али, Пол Дэр Новые сенсоры и передовые методики обработки космических снимков значительно расширяют возможности картографирования и мониторинга экологии лесов. Благодаря новым сенсорам с более высоким пространственным, а также спектральным и радиометрическим разрешением сбор данных стал гораздо легче и дешевле, чем раньше (Davis and Simonett, 1991; Sabins, 1987). Внедрение продвинутых методик классификации снимков также повысило точность классификации земного покрова. За последние два десятилетия для анализа космических снимков с успехом применялись различные классификационные подходы. Методики автоматизированной классификации условно делятся на две большие группы: управляемые (supervised) и неуправляемые (unsupervised) (Lillesand and Kiefer, 1994). Традиционно в обоих подходах используется принцип картографирования «один пиксель на один класс» (one-pixel-to-one-class). Однако если на интересующем участке представлено несколько типов земного покрова, то использование этого подхода сопряжено с некоторыми трудностями. Смешанный состав земной поверхности приводит к появлению смешанных пикселей (mixed pixels) на космическом снимке, если размер пикселя недостаточно мелок, чтобы включить в себя спектральное отображение только одной разновидности земного покрова. Например, смешанный пиксель может содержать спектральное изображение травы и расположенной под ней почвы. Не существует четкого критерия, разграничивающего эти два типа покрова. Причиной неточности также могут быть естественные изменения, исходные измерения и обработка данных (Wang, 1990). При традиционной обработке данных пикселю может присваиваться один атрибут, соотносящийся с определенным типом покрова. Неопределенные типы земного покрова классифицируются в настоящее время с помощью понятий и определений теории нечетких (размытых) множеств, которую внедряют в области дистанционного зондирования. В данной статье предлагается новая методика для дешифрирования снимков ASTER и нечеткой управляемой классификации (fuzzy supervised classification). Для установления категорий принадлежности к типам лесного покрова на базе учебных данных (training data) применяется метод статистической гистограммы. Затем установленные категории используются в нечеткой блочной матрице (fuzzy partition matrix) для создания нечетких сигнатур (signature). И, в конце концов, с помощью этих сигнатур проводится нечеткая (fuzzy) классификация трех видимых каналов ближнего ИК снимков ASTER. Aster Снимки ASTER (Advance Spaceborne Thermal Emission and Reflection Radiometer – современный космический инфракрасный отражательный радиометр), получаемые в настоящее время, имеют более высокое пространственное разрешение, и отличаются более широким диапазоном спектрального и радиометрического разрешения по сравнению с мультиспектральными снимками других современных космических систем. Сенсор ASTER был предоставлен Министерством Международной Торговли и Промышленности Японии, Токио (MITI), установлен на спутнике НАСА, снабженном системой наблюдения за Землей (EOS) и называемом платформой Terra (ранее АМ1), и запущен в декабре 1999 года. Основная научная цель запуска ASTER – лучше понять процессы, происходящие на локальном и региональном уровне близко к поверхности Земли и в нижних слоях атмосферы, включая взаимодействие «поверхность-атмосфера» (Yamaguchi et al., 1998). Снимки ASTER, дорожка 602, строка 67&68, были получены из Службы дистанционного зондирования (SRSS) и Департамента Землеустройства (DOLA), Западная Австралия. Снимки были сделаны 16 января 2001 года и относились к типу Level-1B (Уровень-1В). Перед тем как классифицировать данные, по снимку Landsat TM5 1995 года были выверены координаты сцен. Подробная информация об этом снимке с данными радиометрической калибровки приводятся в Syed and Corner (2003). Нечеткая управляемая классификация (fuzzy supervised classification) Понятие нечетких (размытых) множеств (Zadeh, 1965) не ново. На его основе в конце 1960-х г.г. была разработана теория обработки неточной информации. С помощью нечеткой логики классифицировались или квалифицировались сами утверждения, а не степень их верности. В традиционных методиках обработки снимков тип земного покрова рассматривается в виде дискретных классов. Каждый пиксель относят к тому классу, с которым у него наибольшее сходство. Поскольку на снимке только один класс соотносится с каждым пикселем, и отсутствуют какие-либо указания на соответствующее количество элементов, образующих классовую принадлежность, то подразумевается полная принадлежность к выделенному классу. Однако в большинстве случаев нельзя говорить о полной принадлежности к выделенному классу. Например, смешанные пиксели, в зависимости от характеристик наземных типов и пространственного разрешения снимков, могут быть одинаковыми. Нечеткие параметры и учебные данные (training data) Функция принадлежности fA(x) в нечетких множествах выбирается на базе экспертных знаний (например, граничные величины выделения критерия на базе традиции, закона или внешней таксономии) или с помощью методов числовой таксономии (Burrought and McDonnel, 1998). Первый подход известен как модель Семантического Импорта (Semantic Import - SI). В этом случае классы, выбранные на базе экспертного знания, обычно являются наложенными или импортированными и устанавливаются без прямой ссылки на локальную группу данных. Второй подход известен как модель Взаимного Подобия (Similarity Relationship - SR). В этом случае значение функции принадлежности представляет функцию используемого классификатора. Одной из широко используемых версий SR-модели является метод k- или c-средних значений. В данном исследовании нечеткая управляемая классификация (fuzzy supervised classification), предложенная Wang (1990), была адаптирована для классификации снимков ASTER. В управляемом варианте нечеткой классификации функции нечеткой принадлежности извлекают из учебных данных (training data), которые поддерживают приближенное, но при этом более точное, определение принадлежности к типам земного покрова. Такой нечеткий классификатор опирается на гистограммы спектральных данных (Zhang and Goodchild, 2001). Такая гистограмма создавалась на базе учебных данных (training data), а именно: нескольких пикселей, представляющих соответствующие прототипы классов, которые в редких случаях распределялись равномерно. Важной характеристикой нечеткого определения классовой принадлежности является максимальная относительная частота названного класса по отношению к конкретному источнику данных, как показано на рисунке 1. Рисунок 1. Гистограмма для определения нечеткой принадлежности к классу. Исследуемая территория Исследуемая территория, площадью 40 кв.км, располагается приблизительно в 400км к югу от Перт. Она входит в состав региона Lower Great Southern, Западная Австралия. Если двигаться по шоссе вдоль южного побережья, то она находится в 20км к северо-востоку от г.Олбани, центр региона Great Southern. На рисунке 2 показано месторасположение исследуемой территории. Использование нечеткой управляемой классификации В данном исследовании проводилось тестирование нечетких алгоритмов по трем видимым каналам снимков ASTER. После тщательного изучения снимков территории и карт растительности исследуемого района было выделено 5 классов земного покрова. Основными типами земного покрова стали сосновый лес, старые и молодые эвкалиптовые леса, смешанный лес и голая земля. Выбор тренировочных мест (training sites) Тренировочные места данных классов были оцифрованы по снимку ASTER. Местоположение тренировочных мест показано на рисунке 2. Эти тренировочные места имели форму многоугольника в векторном формате. Затем, чтобы провести нечеткую классификацию, их конвертировали в растровый формат. Некоторые тренировочные места специально выбирались таким образом, чтобы на них было представлено два класса. В этом случае тренировочное место, содержащее более одного класса, подходило для проведения нечеткой классификации учебных данных (training data). Подробные статистические данные представлены в таблице 1. Рисунок 2. Местоположение изучаемой территории с тренировочными участками (training sites). Таблица 1. Статистические данные по выбранным участкам Статистика Сосновый Старые Молодые Смешанный лес эвкалипты эвкалипты лес Миним. 14 16 17 21 Канал 1 Макс. 15 21 21 29 Средний 14.14 18.63 18.06 23.75 Стан. 0.34 1.04 0.86 1.78 откл. Миним. 8 14 16 28 Канал 2 Макс. 13 25 24 41 Средний 9.77 20.54 18.96 32.41 Стан. 0.69 2.55 1.63 3.49 откл. Миним. 41 31 33 35 Канал 3 Макс. 48 50 52 54 Средний 44.51 41.93 44.75 45.28 Стан. 1.20 4.426 5.30 3.41 откл. Голая земля 28 84 37.16 10.85 41 141 57.01 17.32 36 101 48.86 11.26 Создание нечеткой блочной матрицы (fuzzy partition matrix) DN-показатели тренировочных мест были нанесены на гистограмму, и рассчитана их относительная частота. Затем для выбранного места определяли категорию принадлежности классов. В случае, когда для каждого класса число тренировочных мест превышало одно, выводилось среднее число категорий принадлежности. На основе показателей категорий принадлежности составлялась блочная матрица. Извлечение нечетких сигнатур Следующим этапом нечеткой управляемой классификации было создание нечетких сигнатур. Здесь основные действия обуславливались названием файла, который определял сигнатуры, количество каналов, используемых для создания сигнатур, количество каналов и названия создаваемых сигнатур. Рисунок 3. Нечеткие сигнатуры классов (сосновый лес, молодые эвкалипты, старые эвкалипты, смешанный лес, голая земля). Управляемая классификация (supervised classification) Последним этапом нечеткой управляемой классификации стала классификация снимка ASTER с помощью файла группы нечетких сигнатур. В этом случае классификатор априорной вероятности стандартного максимального правдоподобия использовался только для замены традиционной средней ковариационной матрицы нечеткой средней ковариационной матрицей. Результаты и обсуждение Классифицированный снимок показал, что все классы земного покрова были смешанными в природе, за исключением нелесного (голая земля) класса. Класс «сосновый лес» в естественных условиях был очень сильно разбросан, что противоречило данным полевой съемки. С другой стороны, смешение прочих классов было приемлемым в контексте их дистрибуционных характеристик. Площадь и процентное соотношение классов земного покрова представлены в таблице 2. Согласно результатам, при использовании блочной матрицы учебных данных (training data) удалось более точно, чем ожидалось, классифицировать типы (классы) земного покрова. Смешанные леса старых и молодых эвкалиптов и просто смешанный лес больше всего соответствовали результатам полевой съемки. Таблица 2 Оценка территориальной протяженности типов земного покрова Тип земного покрова Площадь (га) Сосновый лес Старые эвкалипты Молодые эвкалипты Смешанные леса Голая земля 407 716 392 1457 1028 Процентное соотношение 10.17 17.9 9.8 36.43 25.7 Оценка точности В этом исследовании оценка точности включала четыре процедуры: определение размера пространственной выборки, сбор контрольных данных, составление матрицы ошибок и оценка точности. Определение размера пространственной выборки Congalton (1991) предлагает «для приблизительного подсчета собирать как минимум 50 образцов для каждой категории земного покрова». Однако, чтобы обеспечить адекватную избыточность для оценки точности, число элементов выборки составило 343: более 250 элементов (точек) для 5 классов. Сбор контрольных данных Для получения контрольных данных была проведена аэрофотосъемка и полевая съемка. Аэрофотоснимки в масштабе 1:25000 были визуально дешифрированы. Ряд образцов контрольных данных был получен в результате проведения полевой съемки с помощью подробных топографических карт и ручного GPS. На земле было определено местоположение контрольных элементов выборки, а затем письменно зафиксированы типы земного покрова, окружающие их. Оценка точности В таблице 3 представлена матрица ошибок для классифицированной карты земного покрова по снимкам ASTER, составленная по элементам выборки для классифицированных космических снимков и контрольным данным. В матрице ошибок ошибки вследствие пропуска сигнала (omission error) объясняются ошибочной классификацией. Для расчета этих показателей общее число правильных пикселей (correct pixel) в одной категорию делится на общее число (пикселей) этой категории, как следует из показателей контрольных данных (таблица 3, показатели строк). С другой стороны, комиссионные ошибки (commission errors) допускает аналитик, и они рассчитываются путем деления общего числа правильных пикселей в одной категории на общее число (пикселей) этой категории, взятых с классифицированной карты (таблица 3, показатели столбцов). В результате оценки точности классификации получена матрица ошибок, представленная в таблице 3. Показатель общей точности составил 90.96%. Этот высокий показатель продемонстрировал потенциал использования нечеткой управляемой классификации (fuzzy supervised classification) для работы со снимками ASTER, отображающими сложный и нечеткий земной покров. Таблица 3. Матрица неточностей для оценки точности Сосн. Старые Молодые Смешан. Голая Итого Точность лес эвк-ты эвк-ты лес земля производителя (%) 46 0 2 3 0 51 95.83 Сосн. лес Старые 0 59 7 2 0 68 эвк-ты Молодые 0 5 57 1 0 63 эвк-ты Смешан. 2 4 5 78 0 89 лес Голая 0 0 0 0 72 72 земля Итого 48 68 71 84 72 343 Ошибка 4.17 12.68 19.72 7.14 0.00 (%) Общая точность = 312/343=90.96%, коэффициент Каппа = 0.87 Точность пользователя (%) 90.00 86.70 86.77 90.48 80.28 87.64 100.00 100.00 Рисунок 4. Нечеткая классификация исследуемой территории по снимку ASTER. Заключение Результаты нечеткой управляемой классификации (fuzzy supervised classification) показали, что данные ASTER подходят для картографирования лесного покрова. Даже, несмотря на то, что для нечеткой классификации использовали только три видимых канала, классификация по снимку с разрешением 15м четко разграничила разные породы деревьев. Исследование показало, что эффективнее применять нечеткую классификацию к снимкам с высоким, а не с низким, разрешением. Пиксель больше не считается неделимой единицей анализа изображения. Имеются данные о классах покрова по пикселям, а частичная принадлежность пикселя позволяет повысить точностные статистические параметры. Описанный в статье метод определения значений частичной принадлежности удобен для определения показателей принадлежности с различных тренировочных мест (training sites). При обработке информации, главным образом, внимание концентрируется на алгоритмах, и недооценивается само представление знаний. В итоге сложные алгоритмы могут дать менее удовлетворительные результаты по причине недостаточного представления знаний. Данный метод составления гистограмм для определения показателей принадлежности позволит продуктивнее определять принадлежность пикселя в нечеткой управляемой классификации (fuzzy supervised classification). Примечание: Полный текст статьи со всеми ссылками представлен на www.gisdevelopment.net/magazine/asia/years/2006/march. Благодарность Авторы выражают благодарность г-ну Россу Доддсу из Службы дистанционного зондирования (SRSS) при Департаменте по Землеустройству за предоставление для данного исследования новейших ASTER-снимков региона Олбани. Сайед Сохел Али, Пол Дэр. Факультет географии, населения и охраны окружающей среды, Университет Флиндерс, Аделаида. sohel.syed@flinders.edu.au