СБОРНИК НАУЧНЫХ ТРУДОВ НГТУ. - 2005. - № 1. - 1-4 УДК 62-53:519.6 НЕЙРОСЕТЕВАЯ КЛАССИФИКАЦИЯ МЕДИЦИНСКИХ ИЗОБРАЖЕНИЙ НА ОСНОВЕ СПЕКТРА РАЗМЕРНОСТЕЙ РЕНЬЕ А. Н. БОНДАРЕНКО, А. В. КАЦУК Аннотация В статье рассмотрен метод мультифрактального анализа медицинских изображений, используемый для распознавания раковых клеток. Изображения представляется в системе RGB. Вычислены размерности Ренье для каждого цвета и для совокупности трех цветов. Проанализирован спектр размерностей Ренье и выявлены наиболее информативные признаки для распознавания раковых клеток. Для распознавания изображений на классы «норма» / «патология» была применена нейронная сеть. Проведен анализ результатов, определен уровень распознавания медицинских изображений. 1. ВВЕДЕНИЕ C каждым годом растёт объём обрабатываемой информации, что требует формализации и последующей алгоритмизации процессов, ранее выполнявшихся вручную. Одним из ключевых понятий в автоматической обработке информации является «распознавание» объектов определённого класса. Когда алгоритмы выполняют распознавание на уровне человека - эксперта, автоматизация ведёт к ускорению работы систем обработки данных и повышению их эффективности. Нахождение «аномальных» клеток на медицинском изображении является достаточно трудоемкой задачей. Поэтому желательно иметь средство автоматического скрининга, такое, чтобы медицинские эксперты рассматривали только сложные случаи [1]. Мы исследовали медицинские изображения, содержащие клетки рака cervix uteri. Наш выбор обусловлен тем, что это один из самых распространенных видов рака среди женщин. Доцент кафедры высшей математики, канд. физ.-мат. наук аспирант кафедры высшей математики Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проекты 02-01-00809,02-01-00818). Бондаренко А. Н. и др. 2 В статье рассматривается мультифрактальный метод анализа медицинских изображений. Изображение клеток представлено тремя массивами данных, соответствующих красному, зеленому и голубому цвету (система RGB) в формате jpg. Мы вычисляем размерности Ренье для каждого цвета и для совокупности трех цветов и анализируем полученный спектр размерностей. Затем подаем полученные признаки на вход нейронной сети, которая обучена на множестве примеров двух классов («норма» / «патология») из обучающей выборки. Нейронная сеть автоматически обучается признакам, описывающим каждый класс. Правильные примеры отмечаются «+1» , неправильные «-1». Цель нашей системы в распознавании патологии на медицинских изображениях, которые не присутствуют в обучающей выборке. 2. МУЛЬТИФРАКТАЛЬНЫЙ АНАЛИЗ Задача распознавания образов имеет широкое применение в различных областях, включая роботостроение, медицину, горное дело, финансовые, временные ряды. В большинстве случаев цель компьютерного анализа в обработке больших объемов данных, либо нахождении информативных признаков недоступных человеческому глазу. В этом разделе мы опишем мультифрактальный подход к анализу изображений. Существенным различием между этим подходом и классическими методами (сегментацией, математической морфологией и пр.) является путь, которым мы ищем иррегулярность структуры изображения. d Простой метод подсчета ячеек N ( ) ~ устанавливает связь зависимости количества ячеек, необходимых, чтобы покрыть геометрический объект с размером ячейки . Этого достаточно, чтобы описать гладкие множества, такие как линии и поверхности, и обычные фракталы (которые имеют одинаковую размерность везде), но недостаточно для объектов имеющих меняющиеся характеристики. Во-первых, метод подсчета ячеек описывает одинаковый вес 1 для каждой ячейки с только одной точкой внутри и равномерной плотностью. Чтобы различить эти две противоположности было предложено в [3] использовать меру с различными весами. 3 Нейросетевая классификация медицинских… M d ( q, ) iq d ~ d ( q ) (1) i Ni отношение количества пикселей заданного цвета в i-той N ячейке к общему числу пикселей данного цвета. Функция (q ) , которая является масштабирующей экспонентой q-го момента меры часто расгде i сматривается как масс-экспонента. Для практических целей, вместо прямого вычислений меры (1), может быть применен аналог метода подсчета ячеек. Во-первых частичная функция N ( q, ) iq ~ ( q ) i вычисляется тем же путем, как и стандартный метод подсчета ячеек, и затем логарифм наклона графика N ( q, ) от дает размерность Ренье Dq ( q) также описанную в [4]: 1 q Dq 1 ln N ( q, ) lim 0 q 1 ln Рис. 1: Пример спектра размерностей Ренье для изображения, содержащего злокачественные клетки Бондаренко А. Н. и др. 4 Рис. 2: Пример спектра размерностей Ренье для изображения, содержащего только нормальные клетки Нами вычислены мультифрактальные размерности медицинских изображений. Цветное изображение на входе алгоритма должно быть в представлено в системе RGB с диапазоном интенсивности от 0 до 255 [5]. Первый шаг алгоритма распознавания заключается в вычислении спектра мультифрактальных размерностей specM (Рис. 1, 2) из красного, зеленого и синего компонент изображения. На втором этапе алгоритма полученные признаки были поданы на вход нейронной сети, обученной на изображениях с известным диагнозом [6] для разделения изображений на классы «норма» / «патология». Большим преимуществом использования нейронной сети является то, что нейросети выдают не статистически достоверное, а правдоподобное решение задачи и могут применяться при недостатке эмпирических данных для статистического исследования [7]. Нейросетевые модели налагают слабые ограничения на возможные функции распределения переменных и позволяют избегать априорных предположений о виде функций распределения переменных и структуре модели [7]. Они особенно продуктивны в решении слабоструктурированных задач, так как обычно эксперт может легко структурировать задачу до уровня «черного ящика» или системы данных на основе методов системного анализа, то есть указать входные и выходные параметры системы, не указывая метода решения. Поэтому, для решения реальных задач нейросетевой подход является более эффективным, чем другие методы. 3. РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТОВ 5 Нейросетевая классификация медицинских… Для получения результатов представленных в этом разделе, наша система распознавания раковых клеток обучена на 20 положительных примерах (раковых клеток) и на 20 отрицательном примере (изображения, на которых отсутствуют раковые клетки), система протестирована на 35 изображениях содержащих раковые клетки и на 56 изображениях с только нормальными клетками. Результаты распознавания приведены в нижеследующей таблице и на графике. Рис. 3: Зависимость уровня распознавания от количества изображений в обучающей выборке Количество изображений в обучающей выборке 10 Мультифрактальный метод 61% 20 71% 30 73% 40 76% Табл. 1: Зависимость уровня распознавания от количества изображений в обучающей выборке ЗАКЛЮЧЕНИЕ Нами представлена система распознавания злокачественных клеток в медицинских изображениях. Мы показали, что мультифрактальный метод обеспечивает получение признаков, которые являются информативными в задаче распознавания рака. А нейронные сети являются очень эффективным средством решения слабо формализованных задач на основе примеров. Получен хороший уровень распознавания 76%. 6 Бондаренко А. Н. и др. Результат показывает высокий потенциал использования информационных признаков на основе метода мультифрактального анализа для сравнения изображений. Дальнейшие работы в этом направлении посвящены комбинированию подходов для получения более широкого спектра информативных признаков из медицинских изображений. [1] Kurman R., Solomon D., The Bethesda System for Reporting Cervical/Vaginal Cytologic Diagnoses, Springer-Verlag, New York (1994). [2] Бондаренко А.Н., Кацук А.В. Информативность признаков Ренье при анализе медицинских изображений. Наука, Технологии, Инновации, Всероссийская научная конференция , НГТУ, 04-07 декабря 2003 г., материалы докладов всероссийской научной конференции молодых ученых, стр. 227-228. [3] Kam L., Blanc-Talon J., Multifractal texture characterization for real world image segmentation, Advanced Concepts for Intelligent Vision Systems, 1999, pp. 45-50. [4] Grassberger P., Procaccia I. Measuring the strangeness of strange attractors, Physica D, 1983, v.9, 189-208. [5] Бондаренко А.Н., Кацук А.В. Двумерный Ренье анализ изображений, Научный вестник НГТУ, 1(35), 2004, с.143-148 [6] Zhong L., Najarian K., Automated Classification of Pap Smear Tests Using Neural Networks, Proceedings of International Joint Conference on Neural Networks (IJCNN ’01), v.4, 2001, pp. 2899-2901. [7] Горбань А.Н., Россиев Д.А. Нейронные сети на персональном компьютере, Новосибирск: - Наука. -1996, - 276с.