6513 ПЛАНИРОВАНИЕ И АНАЛИЗ РЕЗУЛЬТАТОВ КЛИНИЧЕСКИХ ИССЛЕДОВАНИЙ, ИСПОЛЬЗУЮЩИХ СУРРОГАТНЫЕ И КОМПОЗИТНЫЕ КОНЕЧНЫЕ ТОЧКИ С.М. Куликов Гематологический Научный Центр, Минздрава России Россия, 125167, Москва, Новый Зыковский пр., 4 E-mail: kulikov@blood.ru И.А. Тищенко Гематологический Научный Центр, Минздрава России Россия, 125167, Москва, Новый Зыковский пр., 4 Ключевые слова: клинические исследования, суррогатные конечные точки, композитные конечные точки, событийный анализ, интервальное цензурирование Аннотация: В современных клинических исследованиях в силу разных причин все чаще используются вместо истинных конечных точек, таких как выживаемость используются суррогатные и композитные, такие как безрецидивная выживаемость или достижение ответа. Суррогатные и композитные точки опираются в основном на периодические лабораторные измерения. Нарушения и несбалансированность во временных регламенте, пропуски в данных приводят искажениям результатов и ошибочным выводам. Традиционные право-цензурированные оценки используемые в событийном анализе,. такие как оценки Каплан-Маера, чувствительные к этим нарушениям в данных. Интервальные, двусторонне цензурированные оценки являются значительно более робастными и их использование рекомендуется. Приводится пример конкретного исследования, в котором удалось избежать ложных клинических выводов. 1. Введение Клинические исследования – это основной источник новой информации для врачей, пациентов и административных органов управления здравоохранения. В последнее время наблюдается небывалый рост новых знаний и экспериментальных данных в таких областях, как молекулярная биология и генетика. Добилась больших успехов онкологическая диагностика и фармакология, появились новые направления медицины, такие как таргетная терапия. В клинических исследованиях все чаще изучается эффективность не отдельных препаратов, а протоколов лечения, временных мультипрепаратных регламентов. Это заставляет биостатистиков разрабатывать новые методы планирования и анализа данных клинических исследований. Следствием новых знаний и улучшения терапии является увеличивающаяся гетерогенность нозологических групп и снижающаяся смертность. Новые исследования сталкиваются с проблемами ограниченности времени наблюдения и ограниченности популяции. Высокая стоимость, неоднородность системы здравоохранения, законодаXII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ ВСПУ-2014 Москва 16-19 июня 2014 г. 6514 тельные, юридические, административные ограничения – все эти факторы оказывают существенное влияния на дизайн и анализ данных клинических исследований [1]. 2. Суррогатные и композитные конечные точки Конечная точка – базовое понятия в клинических исследованиях, оно определяет критерий эффективности лечения. Конечной точкой называют ключевой параметр и/или его статистическую характеристику, по которой выносится решение об эффективности препарата или протокола лечения [2, 4]. В онкологии основным и истинным критерием эффективности всегда являлось время предстоящей жизни и его статистическая характеристика – общая выживаемость. Парадоксальный эффект успехов терапии в том, что событий (смертей) стало меньше, а это естественно снижает мощность статистического вывода. Как следствие этого – в дизайнах клинических трайлов стали появляться суррогатные и композитные конечные точки. По определению, суррогатная конечная точка – это заменитель «истинной» конечной точки, летальности или общей выживаемости. Композитной конечной точкой называются критерий, в котором целевых событий несколько, например смерть и рецидив. На роль суррогатных целевых событий вместо смерти предлагаются другие негативные события, например рецидивы заболевания, неудачи терапии, резистентность. Кроме негативных событий на роль суррогатных могут претендовать и позитивные события – ремиссия, ответ на терапию. При использовании композитных конечных точек, «измеряемым» событием считается первое событие из списка целевых событий. Внедрение суррогатных, положительных и композитных конечных точек влечет усложнение планирования и анализа, а также необходимость анализировать возможные связанные с этим искажения оценок. Интерпретация выводов исследований, использующих суррогатные и композитные конечные точки должна быть очень осторожной [3-5]. Базовая проблема использования суррогатных точек – это неочевидность их сильной связи с выходом заболевания и истинными конечными точками. Проблемой композитных конечных точек является классическая математико-статистическая тема множественности гипотез и «ложных открытий» [4]. Гетерогенность группы исследуемых больных и длительность наблюдения группы добавляет к списку биостатистических беспокойств такие явления как «хрупкость» и конкурирующие риски [6, 7]. «Хрупкость» – это изменение со временем состава изучаемой группы за счет естественного выбытия. Конкурирующие риски – это, когда наблюдать целевое событие мешают другие события. Например, смерть от других причин «маскирует» смерть от основного заболевания. Проблемой любых исследований являются пропущенные данные и нарушения, несбалансированность регламента в группах обследуемых. Существенную роль в анализе, трактовке результатов и экстраполяции результатов клинических исследований является селекция. Селекция планируемая, контролируемая и неконтролируемая, случайная, объективная и намеренная субъективная, селекция во времени – все это явления и факторы очень важны для планирования и анализа и трактовки результатов. Селекция любого типа может настолько сильно смещать оценки и искажать результаты, что может ставить под сомнения основные выводы клинического исследования. Наиболее чувствительными к хрупкости, конкурирующим рискам, селекции, пропускам в данных являются как раз исследования, использующие суррогатные и композитные конечные точки. XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ ВСПУ-2014 Москва 16-19 июня 2014 г. 6515 Главной метрологической проблемой суррогатных событий является сам факт их суррогатности – т.е. это чаще всего некоторое условное событие. Например пересечение некоторого лабораторного показателя заданного порога Датировка (измерение) такого события всегда зависит от временного регламента оценки основного параметра и/или клинического статуса. Главной математико-статистической проблемой композитных событий является то, что природа целевых событий и следовательно их вероятностные распределения могут существенно отличаться. Выводы исследования сильно чувствительны к сбалансированности, взвешенности составляющих композита. Статистический инструментарий, использующийся при анализе данных клинических исследований: и теоретический и программный, сильно развивается в последнее время. Классический анализ выживаемости пополнятся новыми методами: интервальные оценки, анализ хрупкости, оценки конкурирующих рисков и др. 3. Событийный анализ суррогатных конечных точек Большинство используемых в клинических трайлах композитных и суррготных конечных точках базируются на периодических лабораторных измерениях или экспертных оценках клинического статуса. Традиционными используемыми статистическими методами их обработки являются оценки Каплан-Майера (КМ) или коммулятивные оценки (CI – Cumulative Incidence). KM и CI оценки вычисляются на правоцензурированных данных. Хотя на самом деле, источником измерений суррогатных конечных точек являются интервальные данные, т.е. двухсторонне-цензурированные. KM, CI оценки всегда смещены вправо примерно на 0.5 среднего интервала между измерениями [8]. Когда временной регламент лабораторного мониторинга строго соблюдается, это не оказывает какого-либо существенного влияния на выводы. Беда приходит, когда в исследованиях много пропущенных данных, интервалы между измерениями не строго контролируются. Если сравниваемые группы не сбалансированы по этим параметрам (частоте измерений, процент пропусков) – это может привести сильно искаженным результатам. Использование интервальных оценок выживаемости может хотя бы частично решить эту проблему [9, 10]. Для анализа данных использован SAS макрос, опубликованный в работе [10]. Далее приводится пример реальных данных, при анализе которых удалось избежать ложной интерпретации данных, благодаря применению упомянутого алгоритма вместо классических методов событийного анализа. 4. Оценка динамики получения ответа на терапию Под эгидой Европейского общества по изучению лейкозов ELN (European Leukemia Network) в нескольких странах были проведены два крупных исследования по изучению хронического миелолейкоза (ХМЛ). Первое исследование OSP (Out Study Patients) – сбор из национальных регистров ретроспективных данных и второе PBS (Population Base Study) – проспективное, популяционно-эпидемиологическое исследование заболеваемости ХМЛ [11]. В обоих исследованиях собирались как данные по выживаемости больных ХМЛ, так и данные о динамике клинического статуса (ответа на терапию). В качестве положительной суррогатной точки использовалось время досXII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ ВСПУ-2014 Москва 16-19 июня 2014 г. 6516 тижения цитогенетического ответа – время исчезновения в анализе крови клеток с характерной хромосомной аномалией. Время проведения и характер данных двух исследований существенно отличался (OSP – 2002-2008 гг., ретроспективное, PBS – 20102012 гг. проспективное со строгим протоколом). Терапия и используемые препараты – практически одинаковые, и поэтому результаты ожидались близкие. Долговременные результаты, выживаемость больных в двух исследованиях мало отличались, однако ответ на терапию на первый взгляд совершенно разный. На рис. 1а. приведена динамика получения цитогенетического ответа, построенная на базе традиционных KM оценок. Из данного рисунка следует, казалось бы, очевидный вывод о существенном улучшении результатов терапии во втором исследовании. Полный цитогенетический ответ наступает практически на 0.5 года раньше во второй группе. Однако после пересчета с использованием интервальных оценок столь очевидный «прогресс» исчезает (рис.1b.). Таким образом, становится ясно, что видимое различие объясняется не клиническими причинами, полнотой данных и чувствительностью к ней используемых оценок (КМ). Это было подтверждено при сравнительном анализе полноты данных и регулярности лабораторных измерений в исследованиях. Приведенный пример говорит с очевидностью о том, что интервальные оценки более устойчивы к нерегулярности в измерениях суррогатных конечных чем традиционные KM и CI оценки. a) b) Рис.1 Динамика достижения полного цитогенетического ответа больных ХМЛ, по Российским данным двух исследований OSP (n=279) и PBS (n=103)., a – КМ оценка, b – интервальная оценка. 5. Заключение Использование суррогатных и композитных конечных точек в клинических исследованиях сопряжено с радом трудностей и может привести к ошибочным выводам. Одна из трудностей связана с неточностями в датировки целевых событий. Для анализа данных исследований, в которых много пропусков и нарушений временных протоколов рекомендуется использовать вместо традиционных право-цензурированных оценок (типа КМ или CI) интервальные оценки, которые являются более устойчивыми к такого рода нарушениям. Список литературы XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ ВСПУ-2014 Москва 16-19 июня 2014 г. 6517 1. 2. Crowley J., Hoering A. (edited by): Handbook of Statistics in Clinical Oncology. CRC Press, 2012. Guidance for Industry E9 Statistical Principles for Clinical Trials // U.S. Department of Health and Human Services Food and Drug Administration, September 1998 3. Guilhot J., Baccarani M., Clark R. E, Cervantes F., Guilhot F., Hochhaus A., Kulikov S., Mayer J., Petzer A.L., Rosti G., Rousselot P., Saglio G., Saussele S., Simonsson B., Steegmann J-L., Zaritskey A., Hehlmann R.: Definitions, methodological and statistical issues for phase 3 clinical trials in chronic myeloid leukemia: a proposal by the European LeukemiaNet //Blood. 2012. Vol. 119. P. 5963-5971. 4. Schulz KF, Grimes DA.: Multiplicity in randomised trials I: endpoints and treatments // Lancet. 2005. Vol. 365, No. 9471. P. 1657-1661. 5. Mell L., Jeong J-H.: Pitfalls of Using Composite Primary End Points in the Presence of Competing Risks // Journal of Clinical Oncology. 2010. Vol. 28, No. 28 P. 4297-4299. 6. Wienke A. :Frailty Models //M PIDR working paper. WP 2003-032. September, 2003. 7. Gichangi A., Vach W.: The analysis of competing risks data: A guided tour // Department of Statistics, University of Southern Denmark, Grant Report for Danish National Research Foundation, Statist. Med. 2005. 8. Panageas K, Ben-Porat L., Dickler M., Chapman P., Schrag D.: When You Look Matters: The Effect of Assessment Schedule on Progression-Free Survival // J Natl Cancer Inst. 2007. Vol. 99. P. 428-432. 9. Wang Z., Gardner J. A: Class of Estimators of the Survival Function from Interval-Cencored Data // The Annals of Statistics. 1996. Vol. 24, No. 2. P. 647-658. 10. So Y., Johnston G., Kim S.H. Analyzing Interval-Censored Survival Data with SAS® Software. SAS Global Forum, 2010. 11. EUTOS for CML. Expanded CML Registry. http://www.eutos.org/content/home/index_eng.html XII ВСЕРОССИЙСКОЕ СОВЕЩАНИЕ ПО ПРОБЛЕМАМ УПРАВЛЕНИЯ ВСПУ-2014 Москва 16-19 июня 2014 г.