Материалы Четвертой конференции «Математическое моделирование в экологии» ЭкоМатМод-2015, г. Пущино, Россия ПОПЫТКА ИСПОЛЬЗОВАНИЯ АНСАМБЛЯ ПРОСТЕЙШИХ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ В ОДНОЙ ЗАДАЧЕ МИКРОБИОЛОГИЧЕСКОЙ КИНЕТИКИ Филиппов И.В.1, Глаголев М.В.1,2,3,4, Сабреков А.Ф.3 1 Югорский государственный университет, Ханты-Мансийск, Россия filip83pov@yandex.ru 2 3 Московский государственный университет им. М.В. Ломоносова, Москва, Россия, Томский государственный университет, Томск, Россия m_glagolev@mail.ru 4 Институт лесоведения РАН, пос. Успенское (Московская обл.), Россия sabrekovaf@gmail.com Аннотация: предпринята попытка предсказания хемостатных кривых роста Candida diddenzii при помощи ансамбля моделей, параметры которых были идентифицированы по динамическим кривым роста периодической культуры. К сожалению, оказалось, что ансамбль из 15 моделей дает лишь незначительные преимущества при решении этой задачи (при использовании среднего арифметического или медианы для «коллективного прогноза»). Введение В научной литературе настойчиво обсуждается и разрабатывается идея о совместном использовании разнотипных моделей в коллективе – как средства наиболее полного учета априорной информации. Коллектив моделей, например, с позиций средневзвешенного преобразования либо оценивания областей их компетенции аккумулирует преимущества составляющих коллектив решающих правил (Лапко, 2002). Если результаты отдельно взятой модели не вызывают доверия, можно рассмотреть комплекс результатов, полученных с помощью всех моделей. Поскольку все они созданы на основе одних принципов, но независимо друг от друга, то эти результаты могут представлять собой статистический ансамбль, и, проведя их обработку по правилам математической статистики, мы получим наиболее вероятное значение, а также границы его вероятных изменений. Обычно каждая модель хорошо воспроизводит лишь часть искомых величин, в то время как остальные воспроизводятся значительно хуже. Сравнительный анализ показывает, что наиболее высокую успешность, как правило, демонстрирует «средняя» по ансамблю модель. Это связано с тем, что систематические ошибки разных моделей (а они присущи каждой) не зависят друг от друга и при осреднении по ансамблю могут взаимно компенсироваться. Успешность такого подхода уже нашла свое подтверждение: в регулярно издаваемых отчетах МГЭИК приводятся модельные оценки вероятных изменений основных климатических изменений в обозримом будущем, полученные с использованием вышеописанного подхода. При подготовке вышедшего в 2007 г. отчета, МГЭИК использовала около 20 моделей и на их основе предсказала увеличение среднеглобальной температуры воздуха в 1990-2007 гг. на 0.2 °С. Именно такая величина и была реально зафиксирована в наблюдениях (Кароль и Киселев, 2013). Целью нашей работы было: проверить описанный выше подход на примере одной из задач микробиологической кинетики, а именно – предсказать хемостатные кривые при помощи ансамбля моделей, параметры которых были идентифицированы по динамическим кривым роста периодической культуры. Объекты и методы Экспериментальные данные по динамике роста Candida diddenzii в периодической культуре и по ее стационарному (хемостатному) росту были взяты из (Шкидченко, 1984). По данным, полученным в периодической культуре, идентифицировали кинетические параметры математических моделей, после чего по каждой модели предсказывали 187 Материалы Четвертой конференции «Математическое моделирование в экологии» ЭкоМатМод-2015, г. Пущино, Россия стационарные хемостатные кривые. По невязке между теоретически рассчитанными хемостатными кривыми и экспериментальными данными делался вывод о качестве той или иной модели. Для работы, во-первых, из сводных таблиц в (Бирюков и Кантере, 1985) были отобраны все (16) моделей, содержащие не более трех идентифицируемых параметров и две зависимые переменные (концентрацию биомассы и субстрата). Во-вторых – 7 простейших «S-P-X-моделей» (Guthke and Knorre, 1978), содержащих 4 параметра и 3 независимые переменные. В-третьих – упрощенный вариант модели Н.Д. Иерусалимского (8.14) из (Романовский и др., 1975), также содержащий 4 параметра и 3 независимые переменные. Однако поскольку после идентификации параметров иногда оказывалось, что модель одного типа при данном наборе параметров сводилась к модели другого типа, то, фактически, для предсказания хемостатных кривых осталось лишь 15 различных моделей. Наряду с отдельными моделями проверялись предсказания даваемые их ансамблем. Для такого «коллективного» предсказания использовалось как среднее арифметическое всех моделей, так и медиана. В качестве целевой для минимизации применяли следующую функцию: K Ni S (k ) = ∑∑ {[eim - mi (k , t m )]/ci }2 (1) i =1 m =1 где k – вектор идентифицируемых параметров; N i – количество экспериментальных данных для i-го компонента; К – число компонентов; e im – экспериментально определенное значение i-го компонента в m-й момент времени; m i (k,t m ) – рассчитанное по модели значение i-го компонента в m-й момент времени; с i – характерный масштаб i-го компонента. Конкретно в нашей работе К = 3 (i=1 – биомасса дрожжей, г/л; i=2 – концентрация глюкозы, г/л; i=3 – относительная скорость дыхания); с 1 =5, с 2 =10, с 3 =0.5. Для характеристики невязки хемостатных экспериментов использовалась совершенно аналогичная функция, но значения t m имели смысл скорости разбавления. Вычисления проводились в средах Python и MATLAB с использованием реализованных там функций интегрирования систем жестких дифференциальных уравнений и минимизации. Результаты и обсуждение При сравнении медианы и среднего арифметического по ансамблю моделей был сделан вывод, что медиана лучше предсказывает результат хемостатного эксперимента по информации о росте периодической культуры. Однако и качество предсказания медианы оказалось довольно низким: медиана была немного лучше, чем 9 моделей, но хуже, чем остальные 6 моделей из 15. Таким образом, ансамбль из 15 моделей не дал ощутимых преимуществ при решении задачи предсказания хемостатных кривых при помощи ансамбля моделей, параметры которых были идентифицированы по динамическим кривым роста периодической культуры (по крайней мере, в частном случае роста Candida diddenzii). Литература Бирюков В.В., Кантере В.М. Оптимизация периодических процессов микробиологического синтеза. – М.: Наука, 1985. – 296 с. Кароль И.Л., Киселев А.А. Парадоксы климата. Ледниковый период или обжигающий зной? – М.: АСТ-ПРЕСС КНИГА, 2013. – 288 с. Лапко В.А. Непараметрические коллективы решающих правил. - Новосибирск: Наука, 2002. - 168 с. Романовский Ю.М., Степанова Н.В., Чернавский Д.С. Математическое моделирование в биофизике. – М.: Наука, 1975. – 344 с. Шкидченко А.Н. Физиологическое состояние дрожжей при кинетическом, физиологическом и метаболическом типах лимитирования // Рост микроорганизмов. Сб. научных трудов. - 1984. С. 118-126. Guthke R., Knorre W.A. Oscillations and multistability in continuous culture models: the S-P-X models // Contin. Cultiv. Microorganisms. Proc. 7-th Symp. – Prague, 1978. – P. 207-214. 188