Исследование информативности текстурных… В.Г. НИКИТАЕВ, А.Н. ПРОНИЧЕВ, Д.В. ХАРАЗИШВИЛИ, К.С. ЧИСТОВ, Д.В. ШМЕЛЕВ Национальный исследовательский ядерный университет «МИФИ» ИССЛЕДОВАНИЕ ИНФОРМАТИВНОСТИ ТЕКСТУРНЫХ, МОРФОЛОГИЧЕСКИХ И ЦВЕТОВЫХ ПРИЗНАКОВ В ЗАДАЧЕ РАСПОЗНАВАНИЯ БЛАСТНЫХ КЛЕТОК В ПЕРИФЕРИЧЕСКОЙ КРОВИ Представлены результаты исследования информативности текстурных, цветовых и морфологических признаков, описывающих клетки крови лейкоцитарного ряда. По полученным значениям признаков проводилась классификация типов клеток и была определена ошибка разделения, которая находится в интервале от 6 до 30 % в зависимости от типа клетки. Острые лейкозы – группа опухолевых заболеваний системы крови, которые характеризуются первичным поражением костного мозга незрелыми (бластными) клетками. При своевременном обнаружении данного заболевания вероятность успешного лечения повышается. Таким образом, своевременная диагностика острых лейкозов является важнейшей задачей. Данная работа посвящена исследованию методов и средств автоматизированного распознавания бластных клеток в периферической крови. Одним из отличительных свойств бластных клеток при визуальном микроскопическом анализе является структура ядра – нежнохроматиновая, тонкосетчатая с равномерной окраской и калибром нитей хроматина. Автоматическое обнаружение бластных клеток основано, в частности, на измерении текстурных, морфологических и цветовых признаков ядер лейкоцитов. Одной из задач является нахождение комбинации максимально информативных признаков, описывающих структуру ядра клетки. Значение текстурных признаков зависит от пространственного распределения цветовых компонент изображения, что позволяет обнаружить наличие нежной структуры хроматина в ядре. На текстурные признаки также влияют и условия подготовки препарата крови, и особенности формирования цифрового изображения. Поэтому для решения задачи автоматического обнаружения бластных клеток необходимо работать с выборкой, соответствующей требованиям компьютерного анализа. Задачей настоящей работы является исследование информативности текстурных признаков на основе матрицы пространственной смежности, матрицы длин серий, морфологических, цветовых и качественных признаков (описанных врачом-гематологом) при диагностике гематологических заболеваний. а б Рис. 1. Изображения бластной (а) и моноцитоидной (б) клеток крови На рис. 1,а хорошо просматривается тонкосетчатая структура хроматина, свойственная бластным клеткам. Именно эту структуру должны описывать текстурные признаки. На рис. 1,б видна более грубая структура ядра моноцитоидной клети. В качестве исходных данных была взята выборка изображений клеток крови с описательными признаками, состоящая из 1058 изображений, разделенных по 9 типам (бласт (462), пролимфоцит (55), лимфоцит (177), лимфоидная клетка (75), моноцит (32), моноцитоидная клетка (30), промиелоцит (90), миелоцит (82) атипичный мононуклеар (55)). Для вычисления количественных признаков используются только ядра клеток, поэтому из изображений клеток данной выборки были вырезаны ядра. Были вычислены значения текстурных признаков на основе нормированной матрицы пространственной смежности, матрицы длин серий, а также морфологические и цветовые признаки для исследуемых изображений ядер клеток крови. По полученным значениям Исследование информативности текстурных… признаков проводилась классификация типов клеток методом построения эталонов с использованием метрики Чебышева. При классификации типов клеток крови по рассмотренным признакам были получены результаты, приведенные в табл. 1. Таблица 1 Ошибка классификации типов клеток крови по признакам Типы классифицируемых клеток Бластные и небластные клетки исследуемой выборки Бластные и лимфоидные клетки Бластные клетки и лимфоциты Бластные клетки и промиелоциты Бластные клетки и пролимфоциты Бластные и моноцитоидные клетки Бластные клетки и моноциты Бластные клетки и атипичные мононуклеары Бластные клетки и миелоциты Доля ошибочно классифицированных клеток для признаков: качественных на базе НМПС на базе матрицы Морфологичедлин серий ских и цветовых 0,22 0,26 0,24 0,26 0,20 0,20 0,14 0,13 0,12 0,08 0,03 0,17 0,18 0,28 0,22 0,15 0,06 0,13 0,12 0,15 0,38 0,14 0,31 0,15 0,11 0,10 0,10 0,33 0,15 0,33 0,25 0,16 0,02 0,30 0,27 0,24 Из результатов классификации видно, что ошибки разделения по качественным признакам, описанным врачом-гематологом, находятся в диапазоне от 2 до 22 %. Ошибки классификации по признакам НМПС находятся в диапазоне от 6 до 30 %, матрицы длин серий от 11 до 38 %, морфологических и цветовых от 10 до 33 %. Из рис. 2 и 3 видно, что в целом признаки описанные врачом являются наиболее информативными, но некоторые пары лучше разделяются текстурными и морфологическими признаками. Например, пара бласт-лимфоидная клетка и бласт-лимфоцит разделяются лучше признаками матрицы длин серий, морфологическими и цветовыми признаками. Рис. 2. Зависимость ошибки классификации от разделяемой пары для качественных признаков (а) и для признаков на основе пространственной матрицы смежности (б) Исследование информативности текстурных… Рис. 3. Зависимость ошибки классификации от разделяемой пары для признаков на основе матрицы длин серий (а) и для морфологических и цветовых признаков (б) На основе исследований эффективности применения признаков матрицы пространственной смежности, матрицы длин серий, морфологических и цветовых признаков, можно сделать вывод, что минимальная ошибка разделения на бластные и небластные клетки на основе расчетных количественных признаков для исследованной выборки лежит в диапазоне от 24 до 26 %. В то же время при изучении качественных признаков, используемых при визуальном анализе изображений клеток врачом, эта ошибка составляет 22 %, что незначительно лучше применения расчетных признаков. При разделении между бластными и отдельными типами небластных клеток расчетные признаки в ряде случаев дают лучший результат, чем качественные (при разделении бластных и лимфоидных клеток применение качественных признаков приводит к ошибке в 20 %, а применение расчетных признаков – к ошибке от 10 до 17 %). В связи с этим целесообразно продолжить исследования в области поиска более информативных признаков, например на основе вейвлет или фрактального анализа, кроме того, для получения статистически достоверных результатов исследований необходимо увеличить объем исследуемой выборки. СПИСОК ЛИТЕРАТУРЫ 1. Никитаев В.Г., Проничев А.Н., Чистов К.С. и др. // Научная Сессия МИФИ-2006. Сборник научных трудов. Т. 1: М.: МИФИ, 2006. 2. Никитаев В.Г., Воробьев И.А., Блиндарь В.Н. и др. Компьютерные системы гематологической диагностики. Введение Москва. М.: ЦНИИАТОМ, 2006. 3. Воробьев И.А., Никитаев В.Г., Проничев А.Н. и др. // Научная Сессия МИФИ-2003. Сборник научных трудов. Т.1. М.: МИФИ, 2003.