ПРИМЕНЕНИЕ ПРОЦЕДУРЫ РАНДОМИЗАЦИИ ДЛЯ ОЦЕНКИ

реклама
ПРИМЕНЕНИЕ ПРОЦЕДУРЫ РАНДОМИЗАЦИИ ДЛЯ ОЦЕНКИ
ИНТЕНСИВНОСТИ ПОВЕДЕНИЯ РЕСПОНДЕНТОВ В УСЛОВИЯХ
ИНФОРМАЦИОННГО ДЕФИЦИТА
Пащенко А.Е., м.н.с.
СПИИРАН
e-mail: aep@iias.spb.su
Тулупьева Т.В., доцент, с.н.с.
СПИИРАН, СЗАГС
e-mail: tvt@iias.spb.su
Тулупьев А.Л., доцент, в.н.с.
СПИИРАН
e-mail: alt@iias.spb.su
1. ВВЕДЕНИЕ
В ряде отраслей научных исследований стоит задача оценки интенсивности поведения респондентов
по неполным и неточным исходным данным. Например, в случае сахарного диабета ключевым показателем
является частота отклонения пациента от диеты. Строгое соблюдение низкоуглеводородной диеты 
существенное условие для замедления развития сахарного диабета [1]. Оценка эффективности
рекомендаций, а так же выбор тактики дальнейшего лечения пациента строятся (явно или неявно) исходя из
степени интенсивности отклонения от диеты.
Важным достижением, повлиявшим на исследования, посвящённые изучению жизни ВИЧинфицированных людей и продлению их жизни, явилась разработка высокоактивной антиретровирусной
терапии (ВААРТ). Под терапией подразумевается ежедневный прием препаратов по строгому графику
(расписанию). Для того чтобы ВААРТ-терапия имела положительный результат, пациент должен строго
соблюдать режим лечения. Из всех назначенных таблеток нужно выпить вовремя как минимум 95 %. То
есть, для большинства схем лечения допустимым является пропуск не более 3 дозировок лекарств в месяц
[2]. Но многим пациентам не удается достичь таких высоких показателей приверженности к лечению; на
практике это означает, что при изучении проблемы приверженности ключевым показателем является оценка
интенсивности отклонения от графика приема препаратов.
Выходя за рамки рискованного поведения, предложенный ниже метод можно использовать для
изучения потребления тех или иных товаров или продуктов. В частности, можно выделить группы
потребителей, существенно различающиеся интенсивностью потребления продуктов, товаров или услуг.
При наличии таких результатов маркетинговые усилия можно сосредоточить на тех группах, которые
многочисленны, но товар потребляют неинтенсивно. Такая стратегия может привести к существенному
увеличению объема продаж.
2. ПЕРЕДАЧА ВИЧ-ИНФЕКЦИИ
В последние годы в России неуклонно распространяется эпидемия инфекции, вызванной вирусом
иммунодефицита человека (ВИЧ).
Общее число россиян, у которых по сообщениям, поступившим в Федеральный Центр СПИДа к 31
декабря 2008г., подтверждена ВИЧ-инфекция, достигло 448459 [2].
Вакцины против ВИЧ пока не существует, поэтому единственным методом профилактики
распространения эпидемии ВИЧ/СПИДа во всем мире являются превентивные программы, направленные, в
первую очередь, на модификацию поведения людей.
Конечная цель исследований в данной области  оценить, какое же количество заражений удалось
предотвратить, иначе усилия эпидемиологов можно было бы свести к простому мониторингу ситуации.
К сожалению, выполнение прямых измерений риска представляется нереалистичным (слишком
дорого и труднореализуемо на практике). Поэтому необходимо использовать косвенные измерения.
Практическая апробация метода косвенных измерений, основанного на данных о последних эпизодах
рискованного поведения, была осуществлена в Санкт-Петербургском институте информатики и
автоматизации РАН [6,10].
В первом исследование приняли участие 160 ВИЧ-инфицированных [10]. Во втором исследовании
принял участие 301 ВИЧ-инфицированный пациент [4, 6]. С каждым из пациентов было проведено
персональное интервью, и каждый из участников прошел психологическое тестирование.
В частности, в ходе исследований регистрировались ответы о рискованном поведении, связанном: а) с
отклонением от графика приема препаратов антиретровирусной терапии; б) с употреблением алкоголя; в) с
употреблением внутривенных наркотиков. Задавались вопросы о последних трех эпизодах рискованного
поведения, максимальном, минимальном и обычном интервале между эпизодами. Ответы фиксировались в
тех словесных формулировках, которые использовал сам респондент.
По результатам исследований можно утверждать, что респонденты без затруднений отвечают на
сформулированные вопросы, интервьюеры также фиксировали дополнительные сведения из высказываний
респондентов, которые полезны для формирования более точной оценки риска передачи ВИЧ-инфекции:
минимальный, максимальный и обычный интервал между эпизодами рискованного поведения.
3. КЛАССИФИКАЦИЯ ОТВЕТОВ
В предыдущих статьях [6, 7] была представлена частная классификация ответов респондентов
связанная с их ВИЧ-рискованным поведением. В данной статье представлена обобщенная модель
классификации ответов на естественном языке.
Представленная схема оценки ответов покрывает все возможные варианты ответов об эпизодах
рискованного поведения. Любой ответ респондентов можно свести к одной из предложенных формальных
схем.
На рис. 1 схематично представлены формализованные варианты ответов респондентов, где (0) 
момент интервью, (1), (2), (3)  момент на оси времени, когда произошел последний, предпоследний, и предпредпоследний эпизод поведения. t01 , t12 , t23  длины временных интервалов соответственно между
моментом интервью и последним эпизодом, последним и вторым эпизодом, вторым и третьим эпизодом
поведения в прошлом.   временной промежуток, за который произошли эпизоды.
На рис. 1 (1а), представлен вариант ответов, когда респондент указывает временной интервал между
моментом интервью и каждым эпизодом, например: «вчера, позавчера, поза-позавчера».
На рис. 1 (1б), представлен вариант ответов, когда респондент указывает эпизоды рискованного
поведения, начиная с предпоследнего, отсчитывая их от момента предыдущего эпизода, например: «вчера,
за неделю до этого, за неделю до этого».
На рис. 1 (2а, 2б) представлены варианты ответов, являющиеся комбинацией предыдущих двух
классов, например: «вчера, позавчера, еще за день до этого».
Рис. 1. Обобщенная классификация ответов.
На рис. 1 (3а и 3б) схематично изображены возможные последовательности ответов респондентов,
при этом дается одна оценка для отдельной последовательности, а общая оценка является суммой оценок
последовательностей.
На рис. 1 (4) предложена обобщенная схема представления ответов респондентов, в рамках которой
эксперт должен действовать. То есть рис. 1 показывает, что эксперт имеет дело лишь с объединенными в
последовательности эпизодами поведения, для которых (последовательностей ответов) он дает оценку, а
итоговая оценка складывается из суммы оценок таких последовательностей.
4. НЕТОЧНОСТЬ ВЫСКАЗЫВАНИЙ И АРИФМЕТИЗАЦИЯ
НЕОПРЕДЕЛЕННОСТИ
Интервалы tij (из которых складывается  ) измерены неточно, они характеризуются существенной
недоопределенностью, связанной с тем, что результаты «измерения» зафиксированы на естественном языке,
терминами повседневной речи  с привычной и приемлемой для бытовых нужд строгостью и точностью.
Неточность высказываний респондента требует также введения недетерминированной части оценки.
Ее основу составляет случайная величина  , которая отвечает ряду требований: Ε  0 ; плотность
распределения f  указанной случайной величины  симметрична относительно нуля: f (t )  f (t ) ;
плотность распределения f достигает своего максимума в нуле, до нуля она монотонно возрастает, после 
монотонно убывает (требование строгой монотонности не предъявляется); носитель плотности
распределения f конечен.
Отрезок  L , L  дает область всех возможных значений Lˆ (tij )  длины временного интервала tij ;


L(tij ) является скалярной (точечной) оценкой длины указанного интервала.
Интервью
(0)
L(tij )
L (tij )
L (tij )
Рис. 2. Отрезок  L , L  на оси времени.




Заметим, что любая точка из интервала  L , L  возможна в качестве значения Lˆ (tij ) ; однако это не


означает, что точки из этого интервала «равноправны» или равновероятны в качестве значения Lˆ (tij ) .
Сведения о такого рода отношениях между допустимыми значениями можно задать с помощью их
распределения вероятностей. В таком случае Lˆ (tij ) будет представлять собой случайную величину, что
позволит нам использовать вероятностные методы для представления и обработки неопределенности
исходных данных [3].
В зависимости от наших предположений о характере ответов респондента, для задания случайной
величины Lˆ (tij ) мы можем использовать различные виды распределений.
Область возможных значений разбивается на N отрезков одинаковой длины. Границы отрезков
нумеруются от 0 до n , на рис. 2  для n  6 .
L̂
L0
L1
L3
L2
L4
L5
L6
Рис. 3. Разбиение отрезка L̂ .
В случае равномерного дискретного распределения все значения равновероятны, то есть i : 0  i  n
1
.
p ( Li ) 
n 1
В случае биномиального распределения: с заданной вероятностью успеха  ,
i : 0  i  n p( L)  Cni i (1  )i , [0,1] ,
Рассмотрим наиболее сложный для сведений о трех эпизодах:
Lˆ ()  Lˆ (t01 )  Lˆ (t12 )  Lˆ (t23 ) .
Множество возможных значений Lˆ () будет состоять из всех возможных сумм вида
Lijk ()  Li (t01 )  L j (t12 )  Lk (t23 ) , 0  i, j, k  n .
Причем каждой такой сумме будет составлена вероятность p( Li )  p( L j )  p(Lk ) .
Чтобы получить распределение случайной величины Lˆ () , необходимо сгруппировать одинаковые по
величине суммы; вероятность соответствующего значения будет складываться из вероятностей этих сумм:
Lˆi , j ,k ()  L , p( L) 
 p( Li )  p( L j )  p( Lk ) .
Li  L j  Lk  L
Мы можем от рандомизированной оценки длины интервала Lˆ () перейти к случайной величине ̂ ,
ijk 
характеризующей интенсивность поведения. Пусть

; заданные числа формируют
Li  L j  L k
множество значений случайной величины ̂ .
Элементами набора
M
m m
0
возможных значений
отвечающие следующие требования m
pm  0,
̂
приписаны вероятности
p(m )  pm ,
M
 pm  1 .
Для данной величины можно вычислять
m 0
математической ожидание, дисперсию и стандартное отклонение, а также межквартильный размах.
5. ОЦЕНКА ИНТЕНСИВНОСТИ И РИСКА ЗАРАЖЕНИЯ
D. C. Bell и R. A. Trevino разработали математическую модель оценки риска заражения ВИЧ в
результате рискованного сексуального и инъекционного поведения [8]. Основные уравнения модели,
предложенной авторами, таковы:
Pri  1  (1  pi ) Ni ,
n
Pr  1   (1  Pri ) ,
i1
где n  число видов рискованного поведения, pi  вероятность заразиться за отдельный эпизод i -ого вида
рискованного поведения, N i  число эпизодов i -ого вида рискованного поведения, в которых принимал
участие респондент, P̂r  вероятность заражения из-за участия в конкретном виде рискованного поведения,
Pr  общая вероятность заражения респондента. Величины pi считаются известными [9].
Комбинируя модель Белла-Тревино, уравнение Пуассоновского процесса и случайную величину,
характеризующую его интенсивность, получим
ˆ
P̂r  1  ept ,
где pi  вероятность заразиться за один эпизод рискованного поведения; t  длительность временного
интервала, для которого подсчитывается кумулятивный риск заразиться; ̂  интенсивность рискованного
поведения. В этом случае точечная оценка вероятности заражения Pr  ΕPˆr . Исследуя свойства случайной
величины P̂r , можно получить и другие оценки вероятности заражения.
Кроме того, мы можем опереться и на грубые оценки L , L , тогда грубые оценки равны   
и  

  
Pri  1  e

pi t

  
, а грубая верхняя и нижняя оценки вероятности заразится равны Pri  1  e

pi t
,
.
6. ЗАКЛЮЧЕНИЕ
В статье описаны задачи из ряда отраслей знаний, для которых критической является информация
либо об интенсивности поведения респондента, либо связанная с интенсивностью различных событий, в
которые он вовлечен. Представлен метод косвенных измерений, основанный на опросе респондентов о
последних эпизодах их рискованного поведения, а также рассказано о его успешной практической
апробации. Представлена обобщенная классификация ответов респондентов, которой необходимо
пользоваться при экспертном оценивании. Кроме того дано описание математических моделей, лежащих в
основе процедуры оценивания высказываний респондентов. Наконец даны формулы, позволяющие дать
оценку интенсивности рискованного поведения, связанного с передачей ВИЧ-инфекции, а также
позволяющие дать численную оценку вероятности заражения.
Часть результатов, представленных в настоящей работе, была получена на основе результатов исследований,
поддержанных грантом РГНФ «Взаимосвязь адаптивных стилей ВИЧ-инфицированных и степени рискованности их поведения» №0706-00738а, госконтрактом № 2.442.11.7489, шифр 2006-РИ-19.0/001/209, на НИР «Психологическая защита и копинг-стратегии ВИЧинфицированных с точки зрения опасности для общественного здоровья» в рамках ФЦНТП «Исследования и разработки по
приоритетным направлениям развития науки и техники на 2002–2006 годы», грантом СПбНЦ РАН на 2007 год «Моделирование и
измерение количественных характеристик ВИЧ-рискованного поведения на основе обработки ответов респондентов» № 2-199.
Руководитель проектов — Т. В. Тулупьева.
Часть результатов получена в проекте «Оценка вероятности заражения ВИЧ-инфекцией на основе сведений о последних N
эпизодах рискованного поведения, а также статистическое моделирование ограниченных указанных серий эпизодов», поддержанном
грантом №02/2.1/17-03/48 (в 2007 году) Конкурса для студентов и аспирантов вузов и академических институтов, расположенных на
территории Санкт-Петербурга. Руководитель проекта — А. Е. Пащенко.
Литература
1.
2.
3.
4.
5.
6.
7.
8.
9.
Уоткинс П. Дж. Сахарный диабет. 2-е изд. Пер. с англ. М.: Издательство БИНОМ, 2006. 134 с.
Федеральный научно-методический Центр по профилактике и борьбе со СПИДом.  http://www.hivrussia.org
Хованов Н. В. Анализ и синтез показателей при информационном дефиците.  СПб.: Изд-во Санкт-петербургского
университета, 1996.
Тулупьева Т. В., Тулупьев А. Л., Пащенко А. Е., Красносельских Т. В. Приверженность ВААРТ и рискованное
поведение среди пациентов Санкт-Петербургского Центра-СПИД: статистические модели, психологические и
социо-демографические факторы // Труды СПИИРАН. 2008. Вып. 6. СПб.: Наука, 2008. С. 207–237.
Тулупьева Т. В., Тулупьев А. Л., Пащенко А. Е., Сироткин А. В., Столярова Е. В., Ламанова Е. Б., Бадосова Н. В.,
Никитин П. В. Психологическая защита и копинг-стратегии ВИЧ-инфицированных с позиции опасности для
общественного здоровья: автоматизация сбора данных и итоги исследования // Труды СПИИРАН. 2007. Вып. 4.
СПб.: Наука, 2007. С. 357–387.
Тулупьева Т. В., Тулупьев А. Л., Столярова Е. В., Пащенко А. Е. Анализ особенностей рискованного поведения в
модели адаптивных стилей ВИЧ-инфицированных (на основе результатов опроса пациентов Санкт-Петербургского
СПИД-Центра) // Труды СПИИРАН. 2007. Вып. 5. СПб.: Наука, 2007. С. 117–150.
Тулупьева Т. В., Пащенко А. Е. , Тулупьев А. Л., Красносельских Т. В., Казакова О. С. Модели ВИЧ-рискованного
поведения в контексте психологической защиты и других адаптивных стилей. СПб.: Наука, 2008.
Bell D. C., Trevino R. A. Modeling HIV Risk [Epidemiology] // J Acquir Immune Defic Syndr. 1999. 22 (3). С. 280–287.
Bell D. C., Atkinson J. S., Mosier V., Riley M., Brown V. L. The HIV Transmission Gradient: Relationship Patterns of
Protection// AIDS Behav. 2007. 11 (6). С. 789-811.
Скачать