Математика и эмпирическая информация

реклама
94
Математика и эмпирическая
информация
Печатна
я
Математическое и
информационное
моделирование:
сборник научных
трудов. Вып. 6.
Тюмень:
Издательство
«Вектор Бук»,
204. С. 182-203
21 стр.
Бекман
А.Д.
УДК 51(518.1)+519.95
А.Д.Бекман, аспирант, В.Н.Кутрунов, д.ф.-м.н., профессор
(Тюменский государственный университет)
МАТЕМАТИКА И ЭМПИРИЧЕСКАЯ ИНФОРМАЦИЯ
Рассматриваются вопросы включения эмпирической априорной информации в
конструирование математических моделей. Анализируются подходы к установлению
их критериев истинности.
Изучение способов построения математических теорий, методов
мышления в математике, может наводить на мысли, что эта наука
является
«чистой»,
освобождённой
от
всяких
эмпирических
утверждений. Подход к математике как к «чистой» науке не является
безобидным. Он может наносить известный ущерб, в особенности, если
учесть,
что
так
или
иначе
математика
отражает
объективную
реальность. Но особенно это относится к теориям, недостаточно
формализованным и вытекающим из практики. Для точного решения
этих задач часто не достает информации и исследователь вынужден
вносить
некоторое
количество
эмпирических
сведений.
Степень
достоверности этих сведений может быть различной, некоторые из них с
большой долей вероятности верны, а другие, напротив, являются почти
наверное ложными данными. Решения, получаемые при таком подходе,
верны в той мере, в какой верны привлечённые дополнительные
эмпирические утверждения и это несомненно лучше, чем ничего. Так
как
для
точного
решения
задачи
привлекаются
эмпирические
утверждения, то, очевидно, отсутствует формальный и объективный
критерий, который мог бы служить тестом для проверки адекватности
решения. Любой критерий является выдумкой эксперта, другой эксперт
предложит другой критерий. Следовательно, как дополнительные
эмпирические утверждения, так и критерии истинности являются
порождением эксперта, который является начальной и окончательной
инстанцией решения задачи. Интересно посмотреть, насколько часто
классическая математика обращается к эксперту, и как включаются в
постановки задач эмпирические сведения. Рассмотрим некоторые
примеры.
Пример1. Полиномиальная интерполяция данных.
Постановка задачи. Требуется восстановить некоторую функцию
на отрезке x  [a, b] по её N значениям y i  f ( xi ) , заданным в общем
случае на неравномерной сетке xi [a, b], i  1..N . Отметим некоторые
очевидные факты:
1. Поставленная задача не может быть решена однозначно. Это
очевидно, так как функция f ( x ) известна в конечном числе точек и
неизвестна на множестве мощности континуума точек отрезка [a, b] .
По этой причине эта задача относится к классу некорректных задач,
(А.Н. Тихонов и др.). Требуется дополнить информацию о поведении
функции
сведениями,
которые
из
множества
её
реализаций
позволили бы выбрать единственный вариант. Если такие точные
сведения
отсутствуют,
то
придётся
дополнить
информацию
некоторыми неточными, но правдоподобными сведениями. Эти
сведения могут опираться на какие-то эксперименты, либо являться
догадкой эксперта, которую он не всегда может объяснить. Догадка
является следствием его жизненного опыта.
2. Поскольку из первого пункта следует, что задача восстановления
будет
не
точной,
то
придётся
изобрести
меру
близости
приближённого
и
точного
решений.
Причём,
пока
никаких
эвристических фактов о поведении функции не указано, эта мера
должна быть связана только с этими точками. Несомненно, эта мера
близости
зависит
от
эксперта,
следовательно,
она
носит
эвристический (эмпирический) характер. Одна из таких мер требует,
чтобы приближённая функция в точках x i совпала с заданными
значениями. Поведение приближённой функции между точками будет
определяться соображениями эксперта. Введённая мера близости
приводит к интерполяционной задаче. Заметим также, что нет никаких
внешних
оснований
считать
предложенную
меру
лучшей
по
сравнению с какими- либо другими мерами.
3. Предыдущая
совпадения
постановка с
искомой
критерием
функции
с
её
близости,
требующим
«точными»
значениями
является эвристической уже по той причине, что все данные всегда
являются рациональными числами, чего в общем случае не может
быть. Рациональность данных возникает из из практической
невозможности
записывать
явно
иррациональные
числа
и
работать с ними. Следовательно, требование совпадения искомой
функции с этими данными, не только не лучший, но даже и не
верный критерий и исследователь вынужден либо смириться с его
грубостью, либо выдумывать другую форму реализации близости,
например, используемую в методе наименьших квадратов. Но
переход к другому критерию не спасает от ответа на вопрос лучше
он или хуже других критериев, для такого анализа требуется
метаэксперт.
4. Возвращаемся к пункту 1. Каков классический подход решения
задачи восстановления функции по конечному числу её значений?
Для
обеспечения
единственности
решения
вводятся
дополнительные утверждения. Первое утверждение: пусть задача
интерполяционная, т.е. накладывается требование совпадения
искомой функции с известными «точными» значениями. Так как
единственности нет, то нужны ещё какие-то гипотезы и они
вводятся. Например, в качестве второго утверждения может быть
задан конкретный вид искомой функции, содержащей некоторое
число неизвестных параметров, достаточное для обеспечения
единственности решения из интерполирующих условий. Этот
конкретный вид явно зависит от эксперта. Можно предложить в
качестве искомой функции такую, которая тождественно совпадает
с восстанавливаемой функцией и получить точное решение. Такой
выбор
практически
невозможен.
Математик
предложит
алгебраический или тригонометрический полином степени N с
неизвестными
коэффициентами.
Выбор
такой
функции
обеспечивает единственность решения задачи, но цена этоговведение многих необоснованных допущений. Действительно,
полином является бесконечно дифференцируемой немонотонной
функцией, производные этой функции начиная с N  1 производной,
являются нулями. Реальная восстанавливаемая функция такими (а
также другими привносимыми полиномом) свойствами в общем
случае не обладает. Таким образом, почти всё в этой задаче носит
эвристический характер, вносится лично математиком и на этом не
акцентируется внимание (либо упоминается вскользь) в учебниках
по математике и вычислительным методам.
Внутренняя
заставляет
неудовлетворённость
математика
пытаться
возникшей
очиститься
от
ситуацией,
многочисленных
неточностей и нестрогостей, которые возникают при описанном подходе.
Классический математический приём для решения подобных проблем
связан
с
предельным
переходом.
В
данном
случае
вводятся
произвольные последовательности бесконечно сгущающихся на отрезке
[a, b] сеток (набора интерполяционных узлов), на которых решается
множество интерполяционных задач. Доказываются теоремы, подобные
следующим:
Теорема 1. Какова бы не была последовательность сеток
интерполяционных узлов, найдётся такая непрерывная на [a, b]
функция
f ( x) ,
что интерполяционный процесс не сходится
равномерно.
Теорема 2. Если функция f ( x ) непрерывна на [a, b] , то существует
такая последовательность сеток интерполяционных узлов, что
интерполяционный
процесс
для
этой
функции
сходится
равномерно.
Эти и другие теоремы, к сожалению, не пригодны на практике.
Действительно, предельные переходы, указываемые в теоремах, не
могут
быть
выполнены,
последовательности
сеток
так
как
реально
интерполяционных
для
назначения
узлов
необходимо
заранее знать искомую функцию (теорема 2). Если же функция
неизвестна, то выбор произвольной сетки скорее всего (по теореме 1)
приведет к неравномерной сходимости. Нужно бесконечное число
экспериментов, либо, при численном моделировании, бесконечное
число раз вычислить функцию. Сами условия теорем также приводят к
размышлениям: почему мы требуем непрерывности от функции и
почему
так
важна
эта
мера
близости,
вытекающая
из
слов
«равномерная сходимость».
Сами условия теорем также приводят к размышлениям: почему
мы требуем непрерывности от функции и почему так важна эта мера
близости, вытекающая из слов «равномерная сходимость». Поскольку
реально предельный переход не может быть организован, число узлов
строго конечно и даже очень мало, то критерий, связанный с
равномерной сходимостью, лишён смысла.
Остаётся
практический
выход:
Если
реальная
задача
восстановления функции по конечному числу её значений имеет не
единственное решение, то к решению задачи привлекается эксперт. Он
дополняет задачу некоторым количеством новых условий, приводящих,
как и выше, к единственному решению. Эти дополнительные условия,
должны быть ранжированы по степени доверия к ним. Последние из
этих условий могут быть очень ненадёжны. Здесь важно понимать, что
не очень надёжные дополнительные сведения лучше, чем, например,
вообще ничем не обоснованный выбор полинома. Поэтому надо не
вуалировать ненадёжные сведения, а наоборот, выпукло представить
их. Критерием некоторой надёжности результатов будет не чуждый для
задачи предельный переход и стандартная метрика для определения
близости между точным и приближённым решениями задачи, а сам
эксперт. Он в состоянии формулировать дополнительные условия в
конкретной обстановке и изобретать меру близости совсем не похожую
на те, которые даны в учебниках. Можно сказать, что эксперт должен
быть
обязательной
аксиомой
в
наборе
равноправной
аксиом,
на
составляющей,
которых
равноправной
базируется
любая
математическая теория. Введение эксперта как аксиомы делает
математику неустойчивой, нестрогой, зависящей от индивидуального
мнения человека и это может не нравится «чистому» математику. Но
если вдуматься, то основания математики выстроены именно на
эмпирической базе. После создания (шаткого!) основания происходит
отказ от эмпирики и все выводы опираются на строгие логические
рассуждения.
Озабоченность указанными проблемами, в частности, вызвана тем,
что сегодня на изучение математики в ВУЗах отводится мало времени.
Преподаватели вынужденно преподают её в виде схем, рецептов.
Внушаться мысль, что алгоритмы доказательств утверждений во всех
случаях в принципе одинаковы. Ясно, что догматики такого рода
существовали и две тысячи лет тому назад и тогда они тоже рисовали
схемы «правильного» логического мышления, которое в будущем не
будет меняться. Для обучаемых математика становится фетишем, все
её утверждения воспринимаются как абсолютные истины без должного
критического рассмотрения. За неимением времени преподаватели
старательно уходят от подчёркивания связи математики с эмпирикой. В
результате математика становится не гибкой. Обученные специалисты
внедряют многочисленные шаблоны в многочисленные коммерческие
пакеты программ. Производители дорогих пакетов засекречивают
используемые в них часто тривиальные идеи, декларируют всеобщую
применимость пакетов к реальным задачам, а пользователи искренне
верят в их непогрешимость. Это становится серьёзной проблемой.
Покупатель вынужден косвенным образом устанавливать пригодность
пакета для конкретных целей и убеждаться в тривиальной мысли, что не
существует единого рецепта на все случаи жизни.
Пример 2. Математические модели в механике (теория упругости,
гидромеханика, теплофизика и.т.д.). Все эти модели очень надёжно
связаны с эвристическими утверждениями. В угоду классическим
подходам вводится серия утверждений, которая на самом деле не
верна, например, реальные среды заменяются на так называемые
сплошные. Без этого утверждения нельзя было бы применять к
моделированию классическую математику, вводить непрерывные и
дифференцируемые функции. К функциям, характеризующим среды,
предъявляются ещё более высокие требования, например, требования
дифференцируемости
вплоть
до
некоторой
производной.
Эти
требования не вытекают из каких либо свойств сред, а вводятся из
эвристического предположения, что все необходимые для получения
уравнений
выкладки
допустимы.
Сплошность
среды,
дифференцируемость функций и многие другие свойства навязаны
предметной области правилами игры в математике. Специалисты, чтобы
решить задачу, старательно освобождаются от этих навязанных
идеальных
свойств,
например,
используя
конечные
разности,
освобождаются
от
дифференцируемости
и
даже
непрерывности
функций. На такое освобождение тратится много сил, алгоритмы
становятся очень тяжёлыми, неповоротливыми.
В математических моделях механики обязательно присутствует
группа уравнений, называемых физическими уравнениями. Так в
механике деформируемого твёрдого тела утверждается связь между
силовыми
характеристиками
и
деформируемостью
среды.
Эвристическим здесь является набор связываемых величин, а также
форма соответствующей функциональной зависимости. Так, если речь
идёт о линейной теории упругости, то линейно связываются между
собой компоненты тензоров напряжений и деформаций. Пригодность
этой функциональной зависимости и допустимый диапазон изменения
компонент тензоров снова определяет эксперт. Механики хорошо знают
об эмпирическом происхождения их систем уравнений, поэтому для
сред строится большое количество различных математических моделей,
более
или
менее
пригодных
для
использования
в
различных,
очерченных экспертом условиях. Выводы подобных уравнений очень
математичны,
переходы
к
используются
пределам,
бесконечно
поэтому
у
малые,
дифференциалы,
специалистов,
занимающихся
исследованием этих уравнений, возникает иллюзия их « математической
чистоты». Происходит отделение этих уравнений от их эмпирической
родословной. Исследователи пытаются найти аналитические решения
(аналитики), или просчитать их с возможно более мелким шагом
конечноразностной сетки (вычислители). Если согласиться, что эти
модели достаточно грубы, то на сцену снова выходит эксперт. Он
изобретает не единственную эмпирическую меру близости точных и
приближённых решений и новый «обобщённый» смысл, в котором надо
удовлетворять построенные неточные уравнения.
Любопытно отношение специалистов разных областей к мере, в
которой можно, а в которой нельзя вводить эмпирические соображения
в предметную область. Можно заметить, что иногда специалистам в
одной области нравятся собственные «чистые» уравнения, и не
нравятся «не чистые» способы получения зависимостей в других
областях. Например, механику не нравится следующее рассуждение:
«похоже, что скорость увеличения числа карасей в озере прямо
пропорциональна их количеству и обратно пропорциональна количеству
щук в этом озере». Для правдоподобия остается подобрать константу
пропорциональности
и
записать
дифференциальное
уравнение.
Рассуждение кажется механику очень эвристическим и даже вымыслом,
так как для вывода уравнения не использовались малые величины,
предельные переходы и другая техника классического математического
анализа. Аналогичное рассуждение, связанное с законом Дарси,
описывающим фильтрацию жидкости в пористой среде, представляется
правильным: «вектор скорости движения жидкости в пористой среде
пропорционален градиенту давления». Это уравнение можно вывести
техникой классического математического анализа. Нетрудно видеть, что
оба утверждения мы можем предполагать верными, опираясь лишь на
жизненный опыт. Они более или менее верны в определённых условиях,
которые можно выявить экспериментально. Можно отметить, что такие
науки, как биологию, психологию, социологию и ряд других.
Они
настолько не формализованы, что там не может идти речь о бесконечно
малых, о предельных переходах или других «радостях» математика.
Должна приветствоваться и реально поддерживаться любая попытка их
математической формализации, даже если на данном этапе она на
поддерживается специалистами предметной области. Без подобных
даже отвергаемых попыток математические подходы сами по себе
никогда
не
классические
возникнут
в
этих
предметных
подходы
к
формализации
в
областях.
них
Поскольку
кажутся
очень
надуманными, то возможно, гуманитарные науки настойчиво говорят
нам, что надо отказаться от привычной математики двух последних
веков. Не зря в этих науках появились, активно развиваются и
используются
различные
экспертные
системы,
нейросети
и
нейрокомпьютеры. Может быть и в таких старых фундаментальных
науках как математика, физика, химия эксперт должен превратиться в
одну
из
естественных
аксиом,
что
приведёт
к
их
хорошей
приспособляемости к реальным условиям. Потеря точности, строгости в
выводах будет соответствовать при этом реальной нехватке знаний. В
этом нет беды, если отдаёшь себе отчёт в том, что происходит.
Вывод из предложенных двух примеров, который хотелось бы
сделать, заключается в том, что надо научится видеть в задачах все
эвристические или эмпирические утверждения. Необходимо научится
формулировать, а затем использовать такие утверждения в условиях
нехватки знания, даже если они почти ошибочны, и научиться отдавать
себе
отчёт
в
этом.
Хотелось
бы,
чтобы
и
в
преподаваемых
математических дисциплинах активно подчёркивалась эвристичность
утверждений даже там, где она не сразу заметна. Надо приучиться так
мыслить, чтобы успешно решать практические задачи.
Чтобы показать, насколько это важно, рассмотрим проблему
картопостроения геологических параметров и проблему поиска критерия
истинности такого построения [4,5,6].
Пусть
требуется
построить
кровлю
пласта
некоторого
месторождения (поверхность в трехмерном пространстве). Данные о
положении кровли в отдельных точках xi i  1...N известны из результатов
бурения конечного числа скважин и заданы вектором V  (v1 , v2 ...v N ) . Если
предположить, что эти данные точны, то задача может ставиться как
интерполяционная. Определим множество функций, которые можно
было бы рассматривать в качестве реализаций кровли пласта:
{u( x )}, x  D  R 2 где D область, занятая месторождением. Пусть дан
оператор A , который каждой функции u(x ) ставит в соответствие вектор
из её значений в точках xi i  1...N :
Au  U , U  (u( x1 ), u( x2 ),...u( x N )) .
Тогда задача о нахождении кровли пласта ставится как задача
определения функции u(x ) из операторного уравнения:
Au  V .
Задача некорректна, так как через конечное число точек можно провести
бесчисленное множество поверхностей. Если заузить этот класс
функций до полиномов степени
интерполяционная
задача,
N  1, то получится классическая
имеющая
единственное
решение.
Но
проблема в том, что в указанной выше постановке отсутствуют
основания для перехода к более узкому классу. Если все-таки
выполнить эту процедуру, то, полученное решение будет обладать
качествами, которых нет у истинной функции кровли. Поскольку речь
идёт
о
практической
задаче,
то
это
приведёт
к
неверному
представлению о месторождении, неверному подсчёту запасов и, в
конечном итоге, к увеличению затрат на его разработку.
Рассмотрим
общий
подход
к
этой
задаче,
когда
она
рассматривается как некорректная. Пусть её операторная запись имеет
вид:
Az  f , z  Z , f  F ,
где Z,U некоторые метрические пространства. Выбор пространств
зависит от априорных знаний исследователя (эксперта) и является
важным, так как от этого будет зависеть наличие решения этих
уравнений
в
указанном
пространстве,
его
единственность
или
неединственность. Разные способы введения расстояний (метрики)
будут влиять на численные методы и приводить к разным трактовкам
близости приближённого решения к точному. В практических задачах
надо
бы
выбрать
«наилучшие»
пространства
и
использовать
«наилучшую» метрику, однако здесь мы снова наталкиваемся на
эксперта, который мог бы сказать априори (из своего жизненного опыта),
какое пространство и какая метрика являются наилучшими.
Возвращаясь к постановке, назовём представленную задачу
некорректной [2], если она неразрешима или имеет неединственное
решение хотя бы для одного f  F , либо её решение единственное для
всех f  F , но неустойчиво по отношению к малым возмущениям
оператора A , либо правой части f . Рассмотрим три постановки задач, в
которых хотелось бы найти решения:
1. Операторное уравнение Az  f , z  Z , f  F , не имеет решения при
данной правой части.
2. Операторное уравнение Az  f , z  Z , f  F , при данной правой части
имеет неединственное решение.
3. Решение
уравнения
единственное,
но
оно
неустойчиво
по
отношению к возмущениям оператора или правой части уравнения.
В первой задаче желание найти решение уравнения, которое не
имеет решения, кажется противоречивым и может возникать из-за того,
что
уравнение
(или
система
уравнений)
строилось
на
основе
экспериментов. У исследователя оно не вызывает сомнений и причина
отсутствия решения заключается либо в малых и неустранимых
погрешностях экспериментов, либо это решение ищется в слишком
узком классе функций Z . Класс функций можно бы расширить, но для
этого нужны априорные соображения. Если класс функций достаточно
широк и устранить погрешности эксперимента невозможно, а уравнение,
тем не менее, не имеет решения, то, чтобы найти его, остаётся изменить
само понятие решения. В таких случаях вместо термина «решение»
употребляется какой-либо термин типа «псевдорешение», «обобщённое
решение»,
или
«квазирешение».
Следуя
работам
А.Н.Тихонова,
например [2], будем употреблять последний термин, если за решение
задачи примем такую функцию z , которая обеспечит «наилучшую»
близость левой и правой частей операторного уравнения. То есть
решение должно
минимизировать
расстояние
 ( Az, f ) ,
введенное
экспертом. Классическая ситуация, описываемая выше, возникает,
например, когда операторное уравнение является алгебраической
системой уравнений, в которой каждое уравнение получено из
эксперимента.
Исследователь
«для
надёжности»
провёл
много
экспериментов, система уравнений оказалась переопределённой. Если
бы всё было абсолютно точным, часть уравнений была бы линейно
зависимой. Несовместность и, как следствие, отсутствие классического
решения возникла из-за погрешностей экспериментов. Не без основания
исследователь считает, что если использовать все уравнения, то
решение будет более правильным. Выход заключается в поиске
квазирешения z , как минимума функционала  ( Az, f ) .
Как видим, при рассмотрении первой ситуации возникает много
вопросов: что такое уравнение, что такое пространство, какова метрика
пространства, что такое решение. Если всё это определено, то почему
этот способ определения лучше другого. В «чисто» математической
задаче возникла нужда в эксперте, который определил бы все эти
понятия и запретил исследователю сомневаться в них.
Во
второй
задаче
решение
операторного
уравнения
не
единственное. Причина этого могла быть в том, что не доставало
сведений,
фактов,
закономерностей
для
конструирования
дополнительных уравнений, которые привели бы к единственности.
Другая причина могла заключаться и в том, что из-за недостатка
информации было выбрано очень широкое пространство Z , в котором
ищется решение.
Рассматриваемая
практическая
задача
восстановления
кровли
пласта в интерполяционной постановке имеет неединственное решение,
следовательно, по определению, относится к классу некорректных
задач. Классическая схема, предлагаемая в учебниках по численным
методам, использует необоснованную процедуру перехода к более
узкому классу функций, например, использованию полиномов степени
N  1, где N количество интерполяционных узлов. Следует использовать
произвольный узкий класс функций только тогда, когда нет никаких
эвристических соображений о дополнительной информации, которую
можно использовать. Эту дополнительную информацию целесообразно
задавать
в
виде
некоторого
функционала,
который
надо
минимизировать при условии, что выполняются интерполяционные
равенства. В теории некорректных задач для операторных уравнений,
имеющих неединственное решение, в предположении, что пространство
Z является нормированным, вводится понятие нормального решения [2].
Это решение должно иметь минимальную норму, то есть, необходимо
решить следующую задачу на условный экстремум:
z
2
 min ,
Az  f , z  Z , f  F ,
Написанный функционал удобен для теоретических исследований,
но для решения практических задач, желательно, чтобы он возникал из
каких
либо
экспертных
соображений
о
решении.
В
случае
интерполяционной задачи можно потребовать, например, чтобы искомое
решение в точках области, не являющихся интерполяционными, мало
отличалось от средней по интерполяционным данным величины z0 , то
есть решать задачу
z  z0
2
 min
Az  f , z  Z , f  F ,
Минимизация величины отклонения от среднего - эвристическое
требование, ничем не обоснованное, но кажется это лучше, чем
минимизировать отклонение от нуля. С теоретической точки зрения обе
постановки равнозначны, но было бы лучше, попытаться записать
принципиально другой функционал из соображений эксперта (геолога) о
поведении кровли пласта.
Третий подход во второй задаче заключается в объединении
подходов первой и второй ситуации. Объединим в один функционал
требования близости левой и правой частей уравнения и того, чтобы
решение было близким к нормальному. Предполагая нормированными
пространства Z, F , получим:
Az  f
2
a z
2
 min
Здесь параметр a зависит от погрешностей определения оператора A и
правой части
f , нормы вычисляются в различных пространствах.
Минимизация
этого
функционала
приводит
к
согласованной
минимизации каждой из норм. Вообще говоря, ни одна из этих норм не
уменьшается до нуля, так как решение, обращающее в нуль одну из
норм,
может
согласованный
давать
минимум
значение
этого
второй
нормы,
функционала.
Эта
превышающее
конструкция
функционала предложена математиками для построения общей теории
некорректных задач. Здесь доказываются теоремы, смысл которых
состоит в том, что если уменьшать погрешности определения оператора
A и правой части f , то с определённой скоростью будет уменьшаться и
параметр a , при этом решение, минимизирующее функционал, будет
стремиться к нормальному решению. В практических задачах эти
предельные переходы, как правило, не выполнимы и тяжелы в теории.
Имеется
даже
утверждение,
что
это
направление
в
теории,
предложенное А.Н. Тихоновым, принесло значительный экономический
ущерб, так как заставило теоретиков придумывать правила поиска
параметра a , которые не привели к успеху, а практиков писать сложные
алгоритмы его подбора, связанные с многократными расчётами [3]. Это
достаточно искусственная конструкция. В частности, если речь идёт о
восстановлении
кровли
пласта,
то
требовать,
чтобы
функция,
описывающая эту поверхность, имела минимальную или близкую к ней
норму нет никаких оснований. Заметим также, что построенный
функционал мог возникнуть из задачи об условном экстремуме, тогда
параметр
a имел
бы смысл множителя Лагранжа и однозначно
определялся бы из решения задачи. Практики предпочитают считать
этот
параметр свободным,
соображений,
усиливая
задавать
или
его
уменьшая
на основе экспертных
роль
соответствующего
слагаемого в функционале [5,6].
Разберём третью ситуацию. Решение операторного уравнения
единственное, но оно неустойчиво по отношению к малым возмущениям
оператора A , либо правой части. Решать эту задачу напрямую нельзя,
так как малые возмущения возникнут даже из-за использования
компьютера и приближённое решение может отличаться от точного на
непредсказуемую величину. Практически нельзя менять пространство
Z , так как нет информации для того чтобы в новом пространстве
сохранилось решение. Нельзя и дополнить задачу новыми уравнениями
по той же причине. Остаётся изменить (исказить)
само операторное
уравнение, например, следующим образом:
Az  Bz  f , z  Z , f  F ,
где B искажающая добавка. Очевидно, что искажающий оператор
должен обеспечивать следующие цели:
1. Задача должна превратиться в корректную.
2. Решение нового операторного уравнения должно мало отличаться
от решения неискажённого операторного уравнения.
Здесь предстоит ответить на множество предварительных вопросов. Что
значит решения мало отличаются? Почему выбрана именно такая,
аддитивная форма искажения? Как можно искажать уравнение другим
способом, и какой способ искажения лучше? Может ли искажающий
оператор
нести
дополнительную
нагрузку,
обеспечивающую
дополнительные преимущества? Если на все эти и другие вопросы дан
ответ, то необходимо построить теорию, обосновывающую все эти
действия. В теории некорректных задач поступают иначе. Тихонов А.Н.
ввел понятие регуляризующего функционала. Частным случаем
регуляризирующего функционала является функционал вида:
Az  f
2
 a Tz
2
 min
называемый стабилизирующим. Для него доказаны теоремы о том, что
параметр a может быть связан с погрешностями оператора A и правой
части f таким образом, что при стремлении этих погрешностей к нулю
стремится к нулю и параметр. При этом элемент z , минимизирующий
функционал, будет стремиться к точному решению некорректного
(неустойчивого) операторного уравнения, либо к нормальному решению,
если решение неединственное (предыдущий случай). Известно, что в
определённых функциональных пространствах функционалам можно
поставить в соответствие операторное уравнение Эйлера. В тех
случаях, когда это возможно для указанного функционала уравнение
Эйлера (например, при Tz  z ) имеет вид:
A* Az  az  A* f ,
где A* сопряжённый оператор. Видно, что сначала исходное
операторное уравнение умножается на сопряжённый оператор. Это
тождественное преобразование, а затем добавляется искажение в
данном случае az . Очевидно, чтобы решение не было сильно искажено,
надо выбрать параметр a достаточно малым, но не настолько, чтобы
снова проявилась некорректность задачи. Разумеется, все эти понятия
должны быть строго определены. У регуляризующего функционала
смысл первого слагаемого заключается в минимизации невязки Az  f , а
у второго слагаемого такого ясного смысла нет. Желание уменьшить
норму решения z не вытекает из задачи. Оправдание в выборе второго
слагаемого в виде Tz  z вытекает только из желания математика
построить теорию достаточно простыми средствами. Вероятно
2
z -
самый простой функционал, который можно построить в нормированном
пространстве, и с помощью которого удаётся построить содержательную
теорию
регулиризующего
функционала.
Это
оправданно
для
неустойчивого к погрешностям операторного уравнения, имеющего
единственное решение. Но для уравнения, имеющего не единственное
решение, использование этого функционала не годится, так как из
множества решений будет выбираться решение с близкой к нулю
нормой. Это свойство оказывается навязанным самим регуляризующим
функционалом с помощью второго слагаемого. Из этого следует также,
что с помощью оператора T
решению можно навязать какие-то
свойства, если о них сообщит эксперт. По-видимому, этот подход
реализовывался во многих областях, в частности в геологии этот подход
предложил Волков А.М., [5]. В этом функционале изменился и смысл
параметра a . Этот параметр теперь регулирует вклад в решение каждой
из двух норм, определяет степень доверия к ним. Следовательно,
отсутствуют строгие математические соображения для его назначения,
он назначается из экспертных соображений. Оператор T выбирается
теперь на основе каких-то дополнительных сведений о решении. Если
эти сведения абсолютно точны, то есть не противоречат исходному
неустойчивому уравнению, то должны ослабиться требования на
параметр a . Если оператор T второго функционала выбран лишь из тех
соображений,
чтобы
полученный
суммарный
функционал
был
регуляризующим, то параметр a должен быть достаточно малым, чтобы
искажающее действие оператора T
было незначительным. Здесь
возможно сохранение связи между погрешностями задания всех
задаваемых операторов и функций и параметром a и построение
теории, сходной с теорией решения некорректных задач, но, скорее
всего, в условиях неточных знаний чрезмерное усложнение теории не
эффективно. Регуляризующий функционал может состоять из суммы
нескольких функционалов, каждый из которых построен на основе
соображений эксперта, специалиста в конкретной предметной области,
например, геолога, если речь идёт о восстановлении кровли пласта.
Отсутствие практической возможности предельного перехода, наличие
различной степени достоверности введённых норм с неясной мерой
этой достоверности, множество эмпирических утверждений, связанных с
построением функционала, приводит к вопросу о
внешнем критерии
правильности решения. Каков критерий достоверности решения задачи?
Так как вся известная достоверная, а также эмпирическая информация,
полученная
функционал,
на
то
основании
заключений
отсутствует
экспертов,
формальный
заложены
внешний
в
критерий
правильности решения задачи (иначе этот внешний критерий можно
было бы вложить в алгоритм). Функционал полностью соответствует
нашему представлению о том, как должно себя вести решение.
Функционал является математической моделью описываемого явления
и аккумулирует все сведения о решении. Правильность решения задачи
может оценить лишь эксперт на основе своих соображений. Если
решение с его точки зрения ошибочно, то ошибочна математическая
модель явления, следовательно, не верно составлен функционал.
Придётся проверить всю информацию, заложенную в функционал,
убрать часть информации или сделать её менее значимой, либо
дополнить её какими-либо другими более или менее достоверными
фактами.
Вопрос о критерии всегда был важным для практиков и в
последнее время он обострился в связи с многочисленными и очень
дорогими пакетами программ, решающими одни и те же задачи. Задачи
решаются одни и те же, а ответы разные. В этих пакетах, как правило,
закрыты для анализа используемые методы решения задач, всё это
засекречивается. Какой из пакетов предпочесть? В одной из работ [4],
посвящённой подсчётам запасов углеводородного сырья на основе
различных
пакетов
предлагается
взять
программ,
за
утверждение:
критерий
качества
правильно
их
работы
организованы
те
программы, которые выдают примерно одинаковый результат. Если не
рассматривать технику сравнения, то тестирование пакетов показало,
что результаты отличаются от 6% до 15%. Это не малые отклонения при
подсчёте запасов. Но можно ли доверять этому критерию? В этой
конкретной задаче все расчёты базируются на интерполяции ряда
геофизических параметров. Для обеспечения единственности решения
некорректная задача в каждом из пакетов дополнена своим (и
неизвестным нам) набором эмпирических сведений. Близость двух
результатов может лишь свидетельствовать о том, что эмпирические
сведения и данные использованные в двух пакетах, не совпадая между
собой, обеспечивают похожий результат на данном месторождении. На
другом месторождении они не обязаны совпадать, поскольку на нём
задачу необходимо дополнять эмпирической информацией, характерной
именно для данного месторождения. Формальный перенос пакета
программ на другое месторождение будет обоснованным, если в первом
случае его применение оказалось удачным и имеет место «похожесть»
месторождений по некоторым критериям. Но установить «похожесть»
невозможно, так как пакет написан как универсальный и его детали
закрыты от пользователя. Получается, что «правильные» пакеты
должны обладать следующими свойствами:
1. открытость пакета для пользователя.
2. наличие технологии для лёгкого исключения и включения в
пакет различных эмпирических представлений о задаче.
3. Декларированный отказ от универсализма.
В заключение можно сказать, что перечисленные в заметке
вопросы, связанные с математикой, экспертами, эмпирикой, априорной
информацией, корректностью и некорректностью задач, пакетами
программ интересуют сейчас многих исследователей в разных областях
знаний. Например, О.М. Белоцерковский и В.В.Щенников утверждают,
что в математике сейчас преобладают две тендеции: 1. Увеличение
сложности математических моделей. 2 Построение очень изощрённых
математических
методов.
Трудности
становятся
практически
непреодолимыми и возникает технологический тупик. «… Не претендуя
на глубину аналогии, мы отваживаемся утверждать, что ситуация,
складывающаяся в современном численном моделировании, схожа с
ситуацией, наблюдавшейся в механике перед появлением основных
идей и концепций квантовой механики». Эта и множество других
удивительных цитат и работ, а также обширная библиография даны в
работе [3].
Список Литературы
1.
Загоруйко Н.Г. Прикладные методы анализа данных и знаний. Новосибирск:
Издательство Института математики. 1999. 270 с.
2.
Тихонов А.Н., Гончарский А.В., Степанов В.В., Ягола А.Г. Регуляризующие
алгоритмы и априорная информация. -М.: Наука. Главная редакция физикоматематической литературы, 1983.-200 с.
3.
Перчик Е. Методология синтеза знаний: преодоление фактора некорректности
задач математического моделирования. Харьков. 2001. 156 c.
http://pelbook.narod.ru/read.htm
4.
Закревский К.Е., Бузов О.В., Букреева О.А. Оценка точности подсчёта запасов
углеводородов при построении цифровых геологических моделей. //Научнотехнический журнал ЕАГО. Специальный выпуск. Геофизика. Технологии
сейсморазведки. Тверь: Издательство ГЕРС. 2002. С. 68-74.
5.
Волков А.М. Геологическое картирование нефтегазоносных территорий с
помощью ЭВМ. М.: Недра.1988. 221 с
6.
Аронов В.И. Методы построения карт геолого-геофизических признаков и
геометризация залежей нефти и газа на ЭВМ. М.:Недра. 1990. 301 с.
УДК 51(518.1)+519.7
А.Д.Бекман, аспирант, В.Н.Кутрунов, д.ф.-м.н., профессор
(Тюменский государственный университет)
МАТЕМАТИКА И ЭМПИРИЧЕСКАЯ ИНФОРМАЦИЯ
Рассматриваются вопросы включения эмпирической априорной информации в
конструирование математических моделей. Анализируются подходы к установлению
их критериев истинности.
А.Д.
Бекман,
аспирант
ТюмГУ
(специальность
05.13.18
математическое
моделирование, численные методы и комплексы программ) первого года обучения.
ТюмГУ, кафедра математического моделирования.
В.Н.
Кутрунов,
зав.
кафедрой
математического
моделирования,
д.ф.-м.н.,
профессор, тел. Рабочий 46-14-84, домашний 32-10-52.
Область интересов авторов: Математические методы моделирования в области
обустройства и эксплуатации нефтяных и газовых месторождений.
Скачать