Гудинова Ж.В. ПРИМЕНЕНИЕ DATA MINING (ОБНАРУЖЕНИЯ

реклама
Гудинова Ж.В.
ПРИМЕНЕНИЕ DATA MINING (ОБНАРУЖЕНИЯ ПОЛЕЗНЫХ ЗНАНИЙ
В БАЗАХ ДАННЫХ) КАК ОСНОВА ИССЛЕДОВАНИЙ И УПРАВЛЕНИЯ
В СФЕРЕ ОХРАНЫ ЗДОРОВЬЯ НАСЕЛЕНИЯ И СРЕДЫ ОБИТАНИЯ
ГБОУ ВПО «Омская государственная медицинская академия МЗиСР РФ»
Эта работа о применении DATA MINING в медицинских исследованиях.
Ключевые
слова:
DATA
MINING,
здоровье,
окружающая
среда,
профилактика.
К настоящему времени в Федеральной службе статистики, фондах
информационно-аналитических отделов учреждений системы здравоохранения
и социального развития России накоплены значительные объемы информации о
здоровье населения и среде обитания. К сожалению, приходится признать, что
их обработка, предполагающая своей целью получение полезных знаний,
является недостаточной. Огромные базы данных остаются невостребованными,
в то время как насущно необходимыми являются корректные, обоснованные
управленческие решения; анализ и прогноз здоровья населения под влиянием
среды обитания являются
государственными
функциями, в частности
Федеральной службы Роспотребнадзора. Руководств по анализу данных,
особенно адаптированных к потребностям практиков, крайне мало, программы
медицинских вузов подготовки специалистов по обработке баз данных не
включают, так что решения в сфере здравоохранения применяются в лучшем
случае на основании результатов научных исследований и экспертных оценок,
зачастую противоречивых.
В качестве способа решения этой проблемы предлагаются технологии
интеллектуального анализа данных – Data Mining и Knowledge Discovery in
Data Mining – это процесс обнаружения в сырых
Databases (DM&KDD).
данных (row data) раннее неизвестных, нетривиальных, практически полезных,
доступных интерпретации знаний (закономерностей), необходимых для
принятия
решений
в
различных
сферах
человеческой
деятельности
(Г.Пятецкий-Шапиро). В технологиях DM&KDD используются различные
математические
методы
и
алгоритмы:
классификация,
кластеризация,
регрессия, прогнозирование временных рядов, ассоциация, последовательность.
К интеллектуальным средствам DM&KDD относятся нейронные сети, деревья
решений, индуктивные выводы, методы рассуждения по аналогии, нечеткие
логические
выводы,
генетические
алгоритмы,
алгоритмы
определения
ассоциаций и последовательностей, анализ с избирательным действием,
логическая регрессия, эволюционное программирование, визуализация данных.
Полезные знания, полученные в ходе Data mining, могут быть представлены в
виде закономерностей, правил, прогнозов, связей между элементами данных и
др. [1, 2].
По нашему мнению, Data mining – это именно то, что сейчас следует
активно осваивать, адаптировать к задачам и возможностям заинтересованных
в оценке здоровья населения ведомств и внедрять в их рутинную работу. Тем
более следует их использовать в научных исследованиях здоровья населения и
среды обитания. Нами был предпринят ряд попыток в этом направлении.
Отдельные
методы
Data
mining
мы
использовали
в
своих
научных
исследованиях [3–12], а также в методических разработках, адаптированных к
нуждам социально-гигиенического мониторинга и других специалистов,
выполняющих исследования в области медицины [14–16].
С применением отдельных элементов Data Mining, чаще всего в ходе
кластерного и регрессионного анализа был получен ряд знаний, которые можно
отнести, на наш взгляд, к новым и практически полезным, а именно –
установлены медико-географические закономерности формирования здоровья
населения, проживающего на разных территориях России. Существенная
неоднородность в этом отношении имеет место в масштабах не только страны,
но даже отдельного региона. Так, по данным 1990–2002 гг. выявлены
европейский и азиатский основные типы инвалидизации детей в стране: за
Уралом
отмечен
рост
инвалидности
детей,
обусловленной
травмами,
инфекционной патологией и психическими расстройствами, в то время как в
европейских регионах России отмечена высокие показатели инвалидности
детей вследствие новообразований и эндокринной патологии. Основными
причинами отмеченных различий показателей инвалидности детей являются
социально-экономическое состояние региона в сочетании с особенностями
организации медико-социальной помощи населению, основной из которых
является снижение профилактического компонента деятельности органов
здравоохранения. В ряде территорий европейской части страны и в
экономически развитых регионах Урала и Сибири более низкий уровень
инвалидности оправдан экономической ситуацией, организацией деятельности
и качеством работы органов здравоохранения. Получены количественные
зависимости, позволяющие оценить влияние того или иного фактора на
инвалидизацию детей и прогнозировать ситуацию при гипотетическом его
(фактора) изменении [3]. Аналогичные результаты были получены в отношении
болезней глаз у детей в регионах России [4], оценки здоровья населения в
районах Омской области [5], заболеваемости анемиями детского населения
России [6], профессиональной заболеваемости в регионах России [7, 10, 12],
заболеваемости сифилисом и гонореей детей [8, 9, 11].
Из полученных результатов следует, на наш взгляд, два вывода: 1) о
необходимости более сильного, чем сейчас, изучения и учета местных
особенностей формирования здоровья населения под влиянием среды обитания
в ходе обоснования разного рода профилактических программ, целевых
индикаторов и др. и 2) организация в каждом регионе аналитических центров,
обобщающих информацию из разного рода источников на основе Data Mining
(возможно, это будут Data-центры). Кроме того, очевидна необходимость
подготовки специалистов для работы в таких центрах, умеющих не только
проводить
сложнейшие
виды
анализа,
но,
главное,
интерпретировать
результаты, формулировать их в доступной пониманию большинства форме и
готовить на их основе управленческие решения.
Литература:
1. Анализ данных и процессов: учебное пособие / А.А. Барсегян, М.С.
Куприянов, И.И. Холод и др. – СПб: БХВ-Петербург, 2009. – 512 с.
2. www.basegroup.ru/library/methodology/data_mining
3. Гудинова,
Ж.В.
Научные
основы
социально-гигиенического
мониторинга инвалидности детей: автореф. дис. … докт. мед. наук / Ж.В.
Гудинова. – Омск, 2005. – 44 с.
4. Нефедовская Л.В. Популяционные факторы риска в формировании
болезней глаз у детей / Л.В. Нефедовская, Ж.В. Гудинова, А.А. Модестов. –
Вопросы современной педиатрии. – 2007. – Т. 6. – № 5. – С. 24-25.
5. Гудинова Ж.В. Медико-географические аспекты формирования потерь
здоровья детского населения в Омской области / Ж. В. Гудинова, А.В.
Клочихина, А.П. Денисов //
Вестник Уральской медицинской академической
науки. – 2008. – № 3 (21). – С 6 – 9.
6. Резанова Н.В. Региональные аспекты заболеваемости анемиями
детского населения России / Н.В. Резанова, Ж.В. Гудинова, И.В. Боровский //
Сибирский медицинский журнал. – 2008. – № 4 (79). – С. 67–70.
7. Гудинова Ж.В. Профессиональная заболеваемость в регионах России
как составная часть социально-гигиенического мониторинга / Ж.В. Гудинова,
Г.Н. Жернакова // Вестник Санкт-Петербургской медицинской академии им.
Мечникова. – 2008. – № 1(26). – С. 16–18.
8. Новиков А.И. Влияние популяционных социально-экономических
факторов на формирование заболеваемости сифилисом и гонореей детей:
оценка и прогноз / А.И. Новиков, А.А. Никитин, Ж.В. Гудинова, Ю.А. Новиков
// Клиническая дерматология и венерология. – 2009. – № 5. – С. 32–35.
9. Новиков А.И. Заболеваемость сифилисом и гонореей детей в
Российской Федерации: региональные различия в 2000-2006 гг./ А.И. Новиков,
Ж.В. Гудинова, А.А. Никитин // Вопросы современной педиатрии. – 2009. – Т.
8. – № 4. – С. 32-36.
10. Гудинова
Ж.В.
Профессиональная
заболеваемость
в
России:
региональные вариации и факторы формирования / Ж.В. Гудинова, Г.Н.
Жернакова // Информационно-аналитический вестник. Социальные аспекты
здоровья населения.- 2011. - № 1 (17) [Электронный ресурс]. - Режим доступа :
http://vestnik.mednet.ru/content/view/197/27/
11. К вопросу о заболеваемости сифилисом и гонококковой инфекцией
детской инфекцией детского населения, факторах развития и мерах их
профилактики / А.И. Новиков, А.А. Никитин, Ж.В. Гудинова, Ю.А. Новиков //
Современные проблемы дерматовенерологии, иммунологии и врачебной
косметологии. – 2010. – № 6 (13). – С. 64-69.
12. Социально-гигиенический
мониторинг.
Прогнозные
модели
профессиональной заболеваемости в зависимости от факторов среды обитания /
А.С. Крига, Ж.В. Гудинова, Е.Л. Овчинникова, Г.Н. Жернакова // Уральский
медицинский журнал. – 2011. – № 09 (87). – С. 30-32.
13. Социально-гигиенический мониторинг. Инвалидность детей. Сбор,
обработка и анализ показателей: метод. рекомендации МР ФЦ/3718 от
01.12.2004: утв. заместителем Главного государственного санитарного врача
Российской Федерации / Ж.В. Гудинова [и др.] – М.: Федеральный центр
госсанэпиднадзора, 2004. – 68 с.
14. Гудинова Ж.В. Дружелюбная статистика: анализ и прогнозирование
здоровья в популяционных исследованиях: обучающие технологии, пошаговые
инструкции [Электронный ресурс] / Ж.В. Гудинова. – Омск: Омская
государственная медицинская академия, 2007. – 1 электр. опт. диск (CD-ROM).
15. Социально-гигиенический
мониторинг.
Анализ
медико-
демографических и социально-экономических показателей на региональном
уровне: Методические рекомендации. Утв. приказом Роспотребнадзора № 341
от 20.09.10. / Н.В. Шестопалов, В.П. Самошкин, А.С. Крига, Е.Л. Овчинникова,
Ж.В. Гудинова, Г.Н. Жернакова, С.С. Бунова, Н.В. Дедюлина, Д.А. Грюнер. –
М.: Федеральная служба по надзору в сфере защиты прав потребителей и
благополучия человека, 2010. – 53 с.
Скачать