ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3 И.С. КНЯЗЕВА, Н.Г. МАКАРЕНКО, А.А. МЕКЛЕР 1, Ю.М. ЗАБРОДСКАЯ2 Главная астрономическая обсерватория РАН, Санкт-Петербург iknyazeva@gmail.com, ng-makar@mail.ru 1 Санкт-Петербургский государственный университет телекоммуникаций им. проф. М.А. Бонч-Бруевича mekler@yandex.ru 2 Российский научно-исследовательский нейрохирургический институт им. проф. А.Л. Поленова, Санкт-Петербург zabrjulia@yandex.ru ДИАГНОСТИКА ОПУХОЛЕЙ ГОЛОВНОГО МОЗГА МЕТОДАМИ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ГИСТОЛОГИЧЕСКИХ ДАННЫХ Представлены результаты работы по созданию системы интеллектуальной классификации изображений гистологических срезов новообразований в головном мозге с целью уточнения диагноза. Для изображений гистологических срезов оценивается один из морфологических функционалов – Эйлерова характеристика. Дальнейшая классификация основана на сравнение формы характеристики Эйлера для различных стадий заболевания. Представлены результаты сравнения для пробных образцов с пятью типами тканей. Ключевые слова: опухоль головного мозга, классификация изображений, морфологичесий анализ Введение Диагностика и лечение опухолей головного мозга (ОГМ) является одной из актуальных проблем современной неврологии и нейрохирургии [1–3]. Оценка степени злокачественности первичных ОГМ влияет на тактику лечения и объем проведения лучевой и химиотерапии, которые сами по себе являются агрессивными по отношению к организму человека. Точный гистологический диагноз обеспечивает выбор оптимального лечения для каждого вида опухоли, обеспечивая тем самым продолжительность и качество жизни пациента. Одним из преимуществ гистологического метоУДК 004.032.26(06) Нейронные сети 72 ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3 да является его оперативность. Фотографии гистологических срезов тканей технически можно получать непосредственно после взятия биопсийного материала в кратчайшие сроки. В настоящей работе представлена попытка использования компьютерных методов Data Mining для автоматической классификации изображений гистологических срезов опухолей головного мозга. Морфологический анализа изображений В ряде случаев, в основе диагностики патологий лежат наблюдаемые пространственные паттерны биологических тканей. Стандартный подход к анализу пространственных структур, который предполагает вычисление корреляционных функций, не позволяет характеризовать нетривиальную геометрию объектов. Общий класс подходов позволяющих обнаружить практически полезную новую информацию из сырых данных принято называть интеллектуальным анализом данных [4] – DataMining. В этой работе мы используем такой анализ, основанный на морфологических функционалах [5], позволяющих характеризовать связность, количество и форму объектов. Интегральная геометрия [6, 7] предоставляет фундаментальную математическую базу для определения таких функционалов, которые получили название функционалов Минковского. В частности, фундаментальная теорема Хадвигера утверждает, что при выполнении определенных морфологических условий, количество различных функционалов, необходимых для полного описания d-мерного объекта, равно (d+1). Базовое множество B , для которых справедливы все утверждения теорем интегральной геометрии и на которых могут быть определены функционалы Минковского, называют кольцом выпуклости [8]. Оно состоит из выпуклых подмножеств, их конечных объединений и пустого множества . Над кольцом можно определить некоторые функционалы 2 Wi ( A), A B, т.е. функции от элементов B.. В R существует три функционала W0 , W1 , W2 Минковского – площадь, периметр и характеристика Эйлера [8, 9]. Основным из них является последний (характеристика Эйлера) W2 , он является знакопеременной суммой простейших элементов (симплексов) разной размерности, на которые можно разложить выпуклое тело. Простейший алгоритм для оценки характеристики Эйлера основан непосредственно на этом определении (рис. 1). Подсчитывая чис- УДК 004.032.26(06) Нейронные сети 73 ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3 ло ребер, вершин и граней, целиком принадлежащих области, ограниченной двумя контурами, легко убедиться, что = (число «островов») – (число «дыр») = 0. Рис. 1. Множество, эйлерова характеристика которого равна 0 Такой алгоритм реализован в среде Matlab, он и был использован для вычислений в данной работе. Как указывалось выше, все морфологические функционалы вычисляются для кольца выпуклости B . На практике для анализа реальных изображений необходимо вводить какие-то преобразования, для получения таких множеств из исходного изображения. Введем для этого некоторый уровень яркости или контраста и рассмотрим множество тех пикселей, значение «серого» в которых равно или превышает заданный порог. Такое множество называют множеством выбросов. Маркируя принадлежащие ему пиксели черным, а остальные пиксели – белым цветом, мы получим бинарное изображение. Изменение величины порога позволяет преобразовать весь диапазон серого в набор черно-белых или бинарных изображений. Бинарное изображение можно рассматривать как коллаж, состоящий из отдельных пикселей и их конечных объединений – кластеров. Геометрически они являются подмножествами плоскости R 2 . Так как отдельный пиксель является выпуклым множеством, то для бинарных изображений могут быть вычислены морфологические функционалы. Анализируя весь набор бинарных изображений, соответствующий одному исходному, получим зависимость характеристики от величины порога. УДК 004.032.26(06) Нейронные сети 74 ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3 Приложение к анализу гистологических срезов ОГМ Снимки срезов тканей представляют собой сложно организованные структуры на плоскости. Морфология или строение этих структур являются ключевыми в постановке диагноза. Именно этим обусловлен выбор подхода, основанного на морфологическом анализе, для классификации таких структур. В данной работе исследовался набор срезов пяти типов тканей (всего 33 образца), из которых два условно здоровых (не связанных с онкогенезом): это образцы коры и белого вещества, и три для различных стадий заболевания: астроцитома, анапластическая астроцитомаи наиболее тяжелой опухоли (глиобластомой). Ниже на рис. 2 показаны образцы здоровой ткани и раковой. Различия между этими двумя образцами видны достаточно хорошо даже при простом визуальном анализе. Однако это не всегда бывает так. Часто даже специалисту бывает проблематично по образцу установить степень заболевания. Задача системы ставится как классификация тяжести заболевания по образцу без участия специалиста. Рис. 2. Примеры гистологичексих срезов: условно здоровая ткань (справа) и глиобластома (слева) Применяя морфологический подход к имеющимся в распоряжении гистологическим изображениям, мы получили Эйлеровы характеристики для этих изображений. Эти кривые являются дескриптором изображений. Оказалось, что форма этих кривых существенно отличается для различных типов образцов (рис. 3). Это даёт основания предполагать, что характеристики кривых Эйлера позволят классифицировать гистологические срезы ОГМ различного характера. УДК 004.032.26(06) Нейронные сети 75 ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3 Классификация кривых Эйлеровых характеристик Классификация кривых является отдельной, достаточно сложной задачей. Для решения задачи классификации входные данные должны представлятся векторами, компонентами которых является набор признаков, характеризующий тот или иной объект. В случае задачи классификации УДК 004.032.26(06) Нейронные сети 76 ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3 4 3000 1 2000 x 10 0.5 1000 0 0 -0.5 -1000 -2000 0 20 40 60 -1 0 20 40 60 Рис. 3. Эйлеровы характеристики условно здоровой ткани (кора) – слева и глиобластомы – справа кривых такого вектора, однозначно характеризующего кривую, нет. Более того, используемые признаки могут варьироваться в зависимости от типа исследуемых кривых. Здесь могут быть несколько путей: сравнение кривых, основанное на анализе и обработке значений, которые они принимают, это может быть анализ средного, дисперсии, различных экстремумов и т.д. и работа с кривыми как с границами неких объектов, то есть анализ форм. Для выделения признаков могут быть использованы несколько подходов [10]: - Анализ распределений углов наклона касательных к графикам. При этом подходе в каждой точке графика вычисляется угол наклона, далее строится распределение углов наклона и в дальнейшем классификация строится на основе сравнения распределений углов. - Сравнение угловых расстояний. В этом случае вычисляется геометрический центр графика, а затем вычисляются угловые расстояния от этого центра до точек графика. Затем опять же строится функция распределения этих угловых расстояний, на основе которых производится дальнейшая классификация. - Анализ реперных точек, когда по графику вычисляются точки локальных минимумов и максимумов, величина максимального градиента и различные комбинации этих величин. Выбор реперных точек зависит от вида графика и априорных предположениях о различиях в кривых, описывающих разные группы данных. УДК 004.032.26(06) Нейронные сети 77 ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3 В нашем случае интересуют формы кривых, так как абсолютные значения зависят от качества фото, условий съемки и др., поэтому в первую очередь кривые были переведены в бинарные изображения. Для выделения признаков был выбран подход, основанный на анализе распределений углов наклона касательных. В случае цифрового изображения набор направлений ограничен (вправо, влево, вверх, вниз и по диагоналям), а так как в нашем случае кривая не может загибаться в обратном направлении, то вообще остается только пять направлений. Таким образом, классификация кривых сводится к классификации 5-мерных векторов. Эта задача уже может решаться различными способами и статистическими и нейросетевыми. Однако на данном этапе такая классификация осуществлена не была, так как количество образцов по каждой группе всего 5-6, что явно недостаточно для обучения какой-либо системы. Тем не менее, по имеющимся образцам были построены гистограммы рассеяния по различным направлениям, из которых явно видно, что такая классификация возможна. На рис. 4 представлены диаграммы рассеяния по нескольким направлениям 0.8 anapl.astrocytoma 1 astrocytoma 0.9 cancer kora 0.8 white 0.7 0.7 1 forth direction forth direction 0.9 0.6 0.5 0.4 0.6 0.5 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 0 0.2 0.4 0.6 third direction 0.8 1 0 0 0.2 0.4 0.6 second direction 0.8 1 Рис. 4. Диаграммы рассеяния по нескольким направлениям Выводы Проведённое нами исследование показало, что применяемые в нём методы весьма перспективны для построения системы автоматической классификации гистологических срезов опухолей головного мозга в диагностических целях. УДК 004.032.26(06) Нейронные сети 78 ISBN 978-5-7262-1377-4. НЕЙРОИНФОРМАТИКА – 2011. Часть 3 Список литературы 1. Berthold M.R., Hand D.J. Intelligent Data Analysis. Springer. 2003. 525 c. 2. Лосев Ю.А. и соавт. Первичные опухоли головного мозга – эпидемиология, организация медицинской помощи (по материалам Ленинградской области) / Акт. вопр. клинич. мед. Сб. НИР, Т. 1. СПб, 2003. С.35–40. 3. Тиглиев Г.С., Медведев Ю.А., Мелькишев В.Ф., Камалова Г.М., Вайншенкер Ю.А., Маслова Л.Н., Эджелат Ф.И. Кровоизлияния в опухоли головного мозга. СПб.: Изд-во РНХИ им. проф.А. Л. Поленова. 2003. 112 с. 4. Улитин А.Ю. Эпидемиология первичных опухолей головного мозга среди населения крупного города и пути совершенствования организации медицинской помощи больным с данной патологией (на модели СанктПетербурга). Автореф. дис. канд. мед. наук. – СПб. 1997 5. Макаренко Н.Г. Как получить временные ряды из геометрии и топологии пространственных паттернов? // Лекции по нейроинформатике. М.: МИФИ. 2004. 6. Сантало Л. Интегральная геометрия и геометрические вероятности. М.: Наука. 1983. 358 c. 7. Stoyan D., Kendall W.S. Stochastic Geometry and its applications. J. Wiley&Sons, 1995. 436 p. 8. Serra J. Image analysis and mathematical morphology. Academ.Press, 1988. 9. Mecke K.R., Buchert T., Wagner. Robust morphological measures for large-scale structure in the universe// Astron. Astrophys. 1994. V. 288. 697 p. 10. Parker J.R. Scientific Curve Classification by Combining Simple Algorithms // First IEEE International Conference on Cognitive Informatics. Proceedings. 2002. Р. 222–225. УДК 004.032.26(06) Нейронные сети 79