Гудинова Ж.В. ПРИМЕНЕНИЕ DATA MINING (ОБНАРУЖЕНИЯ ПОЛЕЗНЫХ ЗНАНИЙ В БАЗАХ ДАННЫХ) КАК ОСНОВА ИССЛЕДОВАНИЙ И УПРАВЛЕНИЯ В СФЕРЕ ОХРАНЫ ЗДОРОВЬЯ НАСЕЛЕНИЯ И СРЕДЫ ОБИТАНИЯ ГБОУ ВПО «Омская государственная медицинская академия МЗиСР РФ» Эта работа о применении DATA MINING в медицинских исследованиях. Ключевые слова: DATA MINING, здоровье, окружающая среда, профилактика. К настоящему времени в Федеральной службе статистики, фондах информационно-аналитических отделов учреждений системы здравоохранения и социального развития России накоплены значительные объемы информации о здоровье населения и среде обитания. К сожалению, приходится признать, что их обработка, предполагающая своей целью получение полезных знаний, является недостаточной. Огромные базы данных остаются невостребованными, в то время как насущно необходимыми являются корректные, обоснованные управленческие решения; анализ и прогноз здоровья населения под влиянием среды обитания являются государственными функциями, в частности Федеральной службы Роспотребнадзора. Руководств по анализу данных, особенно адаптированных к потребностям практиков, крайне мало, программы медицинских вузов подготовки специалистов по обработке баз данных не включают, так что решения в сфере здравоохранения применяются в лучшем случае на основании результатов научных исследований и экспертных оценок, зачастую противоречивых. В качестве способа решения этой проблемы предлагаются технологии интеллектуального анализа данных – Data Mining и Knowledge Discovery in Data Mining – это процесс обнаружения в сырых Databases (DM&KDD). данных (row data) раннее неизвестных, нетривиальных, практически полезных, доступных интерпретации знаний (закономерностей), необходимых для принятия решений в различных сферах человеческой деятельности (Г.Пятецкий-Шапиро). В технологиях DM&KDD используются различные математические методы и алгоритмы: классификация, кластеризация, регрессия, прогнозирование временных рядов, ассоциация, последовательность. К интеллектуальным средствам DM&KDD относятся нейронные сети, деревья решений, индуктивные выводы, методы рассуждения по аналогии, нечеткие логические выводы, генетические алгоритмы, алгоритмы определения ассоциаций и последовательностей, анализ с избирательным действием, логическая регрессия, эволюционное программирование, визуализация данных. Полезные знания, полученные в ходе Data mining, могут быть представлены в виде закономерностей, правил, прогнозов, связей между элементами данных и др. [1, 2]. По нашему мнению, Data mining – это именно то, что сейчас следует активно осваивать, адаптировать к задачам и возможностям заинтересованных в оценке здоровья населения ведомств и внедрять в их рутинную работу. Тем более следует их использовать в научных исследованиях здоровья населения и среды обитания. Нами был предпринят ряд попыток в этом направлении. Отдельные методы Data mining мы использовали в своих научных исследованиях [3–12], а также в методических разработках, адаптированных к нуждам социально-гигиенического мониторинга и других специалистов, выполняющих исследования в области медицины [14–16]. С применением отдельных элементов Data Mining, чаще всего в ходе кластерного и регрессионного анализа был получен ряд знаний, которые можно отнести, на наш взгляд, к новым и практически полезным, а именно – установлены медико-географические закономерности формирования здоровья населения, проживающего на разных территориях России. Существенная неоднородность в этом отношении имеет место в масштабах не только страны, но даже отдельного региона. Так, по данным 1990–2002 гг. выявлены европейский и азиатский основные типы инвалидизации детей в стране: за Уралом отмечен рост инвалидности детей, обусловленной травмами, инфекционной патологией и психическими расстройствами, в то время как в европейских регионах России отмечена высокие показатели инвалидности детей вследствие новообразований и эндокринной патологии. Основными причинами отмеченных различий показателей инвалидности детей являются социально-экономическое состояние региона в сочетании с особенностями организации медико-социальной помощи населению, основной из которых является снижение профилактического компонента деятельности органов здравоохранения. В ряде территорий европейской части страны и в экономически развитых регионах Урала и Сибири более низкий уровень инвалидности оправдан экономической ситуацией, организацией деятельности и качеством работы органов здравоохранения. Получены количественные зависимости, позволяющие оценить влияние того или иного фактора на инвалидизацию детей и прогнозировать ситуацию при гипотетическом его (фактора) изменении [3]. Аналогичные результаты были получены в отношении болезней глаз у детей в регионах России [4], оценки здоровья населения в районах Омской области [5], заболеваемости анемиями детского населения России [6], профессиональной заболеваемости в регионах России [7, 10, 12], заболеваемости сифилисом и гонореей детей [8, 9, 11]. Из полученных результатов следует, на наш взгляд, два вывода: 1) о необходимости более сильного, чем сейчас, изучения и учета местных особенностей формирования здоровья населения под влиянием среды обитания в ходе обоснования разного рода профилактических программ, целевых индикаторов и др. и 2) организация в каждом регионе аналитических центров, обобщающих информацию из разного рода источников на основе Data Mining (возможно, это будут Data-центры). Кроме того, очевидна необходимость подготовки специалистов для работы в таких центрах, умеющих не только проводить сложнейшие виды анализа, но, главное, интерпретировать результаты, формулировать их в доступной пониманию большинства форме и готовить на их основе управленческие решения. Литература: 1. Анализ данных и процессов: учебное пособие / А.А. Барсегян, М.С. Куприянов, И.И. Холод и др. – СПб: БХВ-Петербург, 2009. – 512 с. 2. www.basegroup.ru/library/methodology/data_mining 3. Гудинова, Ж.В. Научные основы социально-гигиенического мониторинга инвалидности детей: автореф. дис. … докт. мед. наук / Ж.В. Гудинова. – Омск, 2005. – 44 с. 4. Нефедовская Л.В. Популяционные факторы риска в формировании болезней глаз у детей / Л.В. Нефедовская, Ж.В. Гудинова, А.А. Модестов. – Вопросы современной педиатрии. – 2007. – Т. 6. – № 5. – С. 24-25. 5. Гудинова Ж.В. Медико-географические аспекты формирования потерь здоровья детского населения в Омской области / Ж. В. Гудинова, А.В. Клочихина, А.П. Денисов // Вестник Уральской медицинской академической науки. – 2008. – № 3 (21). – С 6 – 9. 6. Резанова Н.В. Региональные аспекты заболеваемости анемиями детского населения России / Н.В. Резанова, Ж.В. Гудинова, И.В. Боровский // Сибирский медицинский журнал. – 2008. – № 4 (79). – С. 67–70. 7. Гудинова Ж.В. Профессиональная заболеваемость в регионах России как составная часть социально-гигиенического мониторинга / Ж.В. Гудинова, Г.Н. Жернакова // Вестник Санкт-Петербургской медицинской академии им. Мечникова. – 2008. – № 1(26). – С. 16–18. 8. Новиков А.И. Влияние популяционных социально-экономических факторов на формирование заболеваемости сифилисом и гонореей детей: оценка и прогноз / А.И. Новиков, А.А. Никитин, Ж.В. Гудинова, Ю.А. Новиков // Клиническая дерматология и венерология. – 2009. – № 5. – С. 32–35. 9. Новиков А.И. Заболеваемость сифилисом и гонореей детей в Российской Федерации: региональные различия в 2000-2006 гг./ А.И. Новиков, Ж.В. Гудинова, А.А. Никитин // Вопросы современной педиатрии. – 2009. – Т. 8. – № 4. – С. 32-36. 10. Гудинова Ж.В. Профессиональная заболеваемость в России: региональные вариации и факторы формирования / Ж.В. Гудинова, Г.Н. Жернакова // Информационно-аналитический вестник. Социальные аспекты здоровья населения.- 2011. - № 1 (17) [Электронный ресурс]. - Режим доступа : http://vestnik.mednet.ru/content/view/197/27/ 11. К вопросу о заболеваемости сифилисом и гонококковой инфекцией детской инфекцией детского населения, факторах развития и мерах их профилактики / А.И. Новиков, А.А. Никитин, Ж.В. Гудинова, Ю.А. Новиков // Современные проблемы дерматовенерологии, иммунологии и врачебной косметологии. – 2010. – № 6 (13). – С. 64-69. 12. Социально-гигиенический мониторинг. Прогнозные модели профессиональной заболеваемости в зависимости от факторов среды обитания / А.С. Крига, Ж.В. Гудинова, Е.Л. Овчинникова, Г.Н. Жернакова // Уральский медицинский журнал. – 2011. – № 09 (87). – С. 30-32. 13. Социально-гигиенический мониторинг. Инвалидность детей. Сбор, обработка и анализ показателей: метод. рекомендации МР ФЦ/3718 от 01.12.2004: утв. заместителем Главного государственного санитарного врача Российской Федерации / Ж.В. Гудинова [и др.] – М.: Федеральный центр госсанэпиднадзора, 2004. – 68 с. 14. Гудинова Ж.В. Дружелюбная статистика: анализ и прогнозирование здоровья в популяционных исследованиях: обучающие технологии, пошаговые инструкции [Электронный ресурс] / Ж.В. Гудинова. – Омск: Омская государственная медицинская академия, 2007. – 1 электр. опт. диск (CD-ROM). 15. Социально-гигиенический мониторинг. Анализ медико- демографических и социально-экономических показателей на региональном уровне: Методические рекомендации. Утв. приказом Роспотребнадзора № 341 от 20.09.10. / Н.В. Шестопалов, В.П. Самошкин, А.С. Крига, Е.Л. Овчинникова, Ж.В. Гудинова, Г.Н. Жернакова, С.С. Бунова, Н.В. Дедюлина, Д.А. Грюнер. – М.: Федеральная служба по надзору в сфере защиты прав потребителей и благополучия человека, 2010. – 53 с.