Лекция 3 25 сентября 2006 Обусловленность задачи интерполяции. Постоянная Лебега Рассмотрим две близкие задачи – об обусловленности задачи алгебраической интерполяции, т.е. чувствительности к начальным данным, и о вычислительной устойчивости. Пусть значения интерполируемой функции известны с некоторой погрешностью. Например, производится построение интерполяционного полинома по экспериментальным данным. При работе на вычислительной машине ошибки округления неизбежны, они могут возникнуть при действии оператора проекции на непрерывную функцию. Возникает вопрос о чувствительности интерполяционного полинома к ошибкам начальных данных (обусловленности задачи интерполяции) и к ошибкам округления (вопрос вычислительной устойчивости). Интерполяционный полином — оператор, линейный по отношению к значениям интерполируемой функции. С учетом погрешности начальных данных полином в форме Лагранжа может быть записан следующим образом: LN (t ) N N n 0 n 0 f nnN (t ) f nnN (t ), причем слагаемое N (t , f ) N f nnN (t ) n 0 характеризует чувствительность к ошибкам начальных данных и ошибкам вычислений (их можно трактовать как малые добавки к значениям функции ы узлах). Нас интересует оценка N max N (t , f ) l N ; max f n , lN max nN (t ) , коэффициент lN называется t a ,b t a ,b t[ a , b ] n 0 постоянной Лебега. Введем в рассмотрение еще один объект. Пусть iN x — сумма модулей всех базисных функций. Обозначим ее L x l iN x — функция Лебега (сетки). Тогда константа Лебега l N sup L x x a ,b Так как функция Лебега зависит лишь от расположения узлов сетки, то и константа Лебега зависит лишь от введенной сетки. Обусловленность и устойчивость задачи интерполяции зависят от константы Лебега. Если рассматривать оператор интерполяции как оператор проекции (проектор), переводящий элемент одного пространства (пространства сеточных функций) в другое (пространство непрерывно дифференцируемых функций), то постоянная Лебега есть норма такого оператора проекции. Конечно, реальная погрешность при интерполяции будет заведомо меньше, чем приведенная выше оценка. Тем не менее, оценка является достижимой (это свойство нормы оператора). Наихудшим распределением погрешности будет такое распределение, когда погрешности максимальны и меняют знак от точки к точке. То, что при этом будет достижима приведенная выше оценка, следует из вида функции Лебега и каждой из базисных функций. Приведем (без доказательства) примерные оценки роста постоянной Лебега в зависимости от числа узлов сетки. Константа Лебега растет примерно как lN ~ 2N для равномерной сетки. Минимизация остаточного члена интерполяции. Многочлены Чебышёва На прошлой лекции была получена оценка погрешности метода – оценка остаточного члена интерполяции. Пусть функция f(t) имеет на отрезке [a, b] N + 1 ограниченную производную. Тогда N 1 RN (t ) (t t j ) f ( N 1) (), где a, b. ( N 1)! j 0 Решим задачу о минимизации остаточного члена, точнее N (t t j ) j 0 путем соответствующего выбора узлов интерполяции. Для этого нам надо найти такой полином, который бы на нашем отрезке имел наименьшее уклонение от 0, его корини и будут требуемыми узлами интерполяции. Определение. Многочленом Чебышева первого рода называется функция Tn (t ) cos (n arccos t ), где t 1, 1, n = 0, 1,… Убедимся в том, что функция Tn (t ) действительно является многочленом. При n = 0 и n = 1 имеем T0 (t ) 1, T1 (t ) t. Положив arccost , получим T0 (t ) 1, T1 (t ) cos , Tn (t ) cos n, Tn1 (t ) cos(n 1), Tn1 (t ) cos(n 1). По формуле суммы косинусов cos(n 1) cos(n 1) 2 cos cos n, и справедливо рекуррентное соотношение Tn1 (t ) Tn1 (t ) 2T1 (t )Tn (t ), или Tn1 (t ) 2t Tn (t ) Tn1 (t ). Отсюда и следует вид записи полиномов Чебышева: T2 2t 2 1, T3 (t ) 4t 3 3t, T4 (t ) 8t 4 8t 2 1 и так далее. Функции Tn (t ) являются многочленами степени n со старшим членом 2n1 t n . Введем также нормированные (приведенные) многочлены Чебышева Tn (t ) Tn (t ) . 2n 1 Нули многочлена Чебышева находятся из очевидного уравнения 2m 1 Tn (t ) cos(n arccos t ) 0, откуда tm cos , n отрезка [a, b] нули полинома m 1, 2, Чебышева n, t [1, 1]. Для произвольного очевидным линейным ab ba 2m 1 преобразованием, выражения для них будут tm cos , m 1, 2, 2 2 n получаются n, t [a, b]. Легко отыскиваются также точки экстремумов полинома Чебышева, для них Tn (t ) 1 и на отрезке t [1, 1] точки экстремумов есть tm cos , m 1, 2, n. n m Нас интересует решение следующей задачи на минимакс: найти N min max (t tn ) , tn nN0 t[ 1, 1] n0 чтобы путем выбора узлов сетки минимизировать остаточный член интерполяции. Эта задача была решена П. Л. Чебышевым. Теорема Чебышева (без доказательства). Среди всех многочленов степени n 1, со старшим коэффициентом an равным единице, наименьшее уклонение от нуля, равное 21–n, имеет нормированный полином Чебышева Tn (t ) 21n Tn (t ), t 1, 1 . Это свойство полиномов Чебышева, наименьшее уклонение от нуля, можно сформулировать по-другому: для любого полинома Pn (t ) t n a n 1t n 1 a0 , отличного от Tn (t ) справедливо 21 n max Tn (t ) max Pn (t ) , t 1, 1 . 1,1 1,1 Теорема легко доказывается от противного, см. доказательство в книге Н. Бахвалова, Н. Жидкова и Г. Кобелькова. Если в качестве интерполяционных узлов выбрать нули полинома Чебышева, то N 1 произведение (t t j ) , а также Rn(t) будут наименее уклоняющимися от нуля. j 0 Интересно, что решение этой задачи позволяет минимизировать и константу Лебега, lN ~ ln(N) для сетки с чебышевским набором узлов. Доказано, что рост константы Лебега для последней сетки асимптотически стремится к минимально возможному, и сетка с чебышевскими узлами близка к оптимальной для задач интерполяции. Хотя оптимальное расположение узлов не известно, но для практики вычислений отличие оптимального набора от чебышевского является несущественным. Отметим еще, что полиномы Чебышева являются ортогональными полиномами в смысле скалярного произведения 1 2T ( x)T ( x) i j dx 1 1 x 2 Таким образом, вычислительные свойства задачи существенно изменяются при использовании удачного базиса! Замечание о тригонометрической интерполяции Для периодической функции f(t) с периодом T естественно строить приближение с использованием функций n (t ) an cos nt nt bn sin . Тригонометрическая интерполяция T T состоит в замене f(t) тригонометрическим многочленом N N nt nt FN (t ) n (t ) a 0 (a n cos bn sin ), коэффициенты которого находятся при T T n 0 n 1 решении СЛАУ FN (tk ) f (tk ), k 1, , 2N 1, t2 N 1 t0 T , здесь tk 2k N01 — последовательность узлов интерполяции. Очевидна связь задачи алгебраической интерполяции на сетке с чебышевскими узлами с задачей тригонометрической интерполяции. Свойства тригонометрической интерполяции (конечного ряда Фурье) отличаются от свойств алгебраической интерполяции. Очевидна связь с интерполяцией по чебышевским узлам. Кусочно-многочленная глобальная интерполяция (сплайны) Определение. Пусть на отрезке [a, b] задана система узловых точек {t n }nN01 . Сплайном S m (t ) называется определенная на [a, b] функция, имеющая l непрерывных производных и являющаяся на каждом интервале (tn–1, tn) многочленом степени m. Определение. Дефектом сплайна называется разность d m l между степенью сплайна и показателем его гладкости l. Замечание. Для сплайнов также используется обозначение S m,d (t ). Если сплайн строится так, чтобы выполнялись условия Sm (tn ) f (tn ) , где f(t) — интерполируемая функция, то он называется интерполяционным сплайном. В соответствии с определением, кусочнолинейная функция является интерполяционным сплайном первой степени дефекта 1, кусочно-квадратичная функция с первой непрерывной производной — интерполяционным сплайном второй степени дефекта 1. Наиболее известным в приложениях является интерполяционный кубический сплайн дефекта 1 (естественный сплайн), который будем обозначать S(t). Определение. Кубическим сплайном дефекта 1, интерполирующим на отрезке [a, b] заданную функцию f(t), называется функция S(t), удовлетворяющая следующим условиям: N 1 1. S(tn) = f(tn) — условие интерполяции в узлах сетки t n n0 . 2. S (t ) C 2 [a, b] , т.е. является непрерывной вместе с двумя первыми производными. 3. На каждом отрезке [tn, tn+1], S(t) является кубическим многочленом; n = 0,…,N –1. На краях отрезка [a, b] заданы краевые условия. Наиболее часто употребляются следующие: 4.1. S (a) f (a), S (b) f (b); 4.2. S (a) f (a), S (b) f (b); часто полагают S (a) S (b) 0; 4.3. S (a) S (b), S (a) S (b); эти условия называются периодическими, т.е. интерполируемая функция является периодической с периодом b – a. Покажем, что эта задача имеет единственное решение. Теорема. Интерполяционный кубический сплайн S(t), удовлетворяющий условиям 1–3 и одному из краевых условий 4, существует и единственен. Доказательство. Пусть S(z) — эрмитов кубический многочлен, который на каждом отрезке tn , tn1 , n 0, , N 1, представлен как 4. S ( z) fn (1 z)2 (1 2z) fn1 z 2 (3 2z) mn n z(1 z)2 mn1n z 2 (1 z), где n tn1 tn , z (t tn ) / n , mn S (tn ). Тогда S (t ) ( f n 1 f n )(6 12 z ) 6z 4 6z 2 mn mn 1 , 2 n n n f f 4m 2m S (tn 0) 6 n 1 n n n 1 , 2 n n n f f n1 2mn1 4m S (tn 0) 6 n mn1 n . n1 n1 2n1 Условие непрерывности второй производной S (t n 0) S (t n 0) будет rn mn1 2mn sn mn1 cn , f n 1 f f f n 1 , rn 1 sn , cn 3 sn n 1 n rn n , sn n 1 n n n 1 n 1, , N 1. После добавления краевых условий получаем систему из N + 1 уравнение с N + 1 неизвестным mn . Для краевых условий первого типа (заданы первые производные) система выглядит как m0 f0 , rn mn1 2mn sn mn1 cn , mN f N . Для условий второго типа (заданы вторые производные): f f 2m0 m1 3 1 0 0 f0, 0 2 rn mn1 2mn sn mn1 cn , f f N 1 N 1 mN 1 2mN 3 N f N . N 1 2 Аналогично получается СЛАУ для третьего типа краевых условий. Во всех случаях матрицы СЛАУ оказываются трехдиагональными симметричными, со строгим диагональным преобладанием и, как показывается, положительно определенными, а, следовательно, и неособенными. Следовательно, решение СЛАУ существует и единственно. Отсюда следует существование и единственность решения задачи о построении кубического сплайна. Приведем еще одно доказательство этой же теоремы. Рассмотрим неравномерную сетку: tn tn1 n1, tn1 tn n . В узлах сетки определены значения функции: f n 1 , f n , f n . Пусть m n — значение второй производной в точке t n (пока неизвестное!). На отрезке [t n , t n 1 ] для второй производной кусочно-кубического сплайна имеем: Stt 1 (mn (tn 1 t ) mn 1 (t tn )). n (6.1) Так как сплайн — полином третьей степени, то его вторая производная — линейная функция. Интегрируем (6.1) по t, получаем (на отрезке [t n , t n 1 ] ) St 1 n (t t )2 (t tn )2 mn mn1 n1 An . 2 2 Интегрируя последнее соотношение еще раз, получаем: S (t ) 1 (mn (tn 1 t )3 mn 1 (t tn )3 ) 6 n n (t n 1 t ) n 1 (t t n ). An — константа интегрирования. После второго интегрирования положим An t Bn ( n n )t n t n1 n t n , т. е. вместо двух констант An , B n введем две новые константы, более удобные для дальнейших выкладок. Из условий S (tn ) f n , S (tn1 ) fn1, получаем: fn f m n n n n . n 6 mn 2n n n 6 f n 1 f m n n1 n1 n . n 6 mn12n n n 6 f f (m mn )n An n 1 n n 1 . n 6 Приравняем первые производные в t n справа и слева St (tn 0) St (tn 0), получим систему уравнений для определения коэффициентов сплайна: mn n1 mn1n1 f n f n1 (mn mn1 )n1 2 2 n1 6 m f f (m mn )n m n1 n n n n1 n n1 , 2 2 n 6 (6.2) которая дополняется соответствующими граничными условиями. В случае свободного сплайна m0 m N 0. Систему для определения коэффициентов, называемых моментами кубического сплайна, можно записать в матричной форме AM = F, где A — квадратная матрица: 1 2 3 2 6 À 0 0 2 6 2 3 3 3 6 3 6 3 4 3 0 0 0 M и F — векторы-столбцы 0 0 0 N 1 6 0 ; 0 N N 1 3 0 M (m1, m2 , f f f f f f f f , mN 1 )T , F 2 1 1 0 , 3 2 2 1 , 1 1 0 2 T , f N f N 1 f N 1 f N 2 . N N 1 Матрица А симметрична, имеет свойство диагонального преобладания и, как можно показать, положительно определена, а следовательно, неособенная. Значит, решение рассматриваемой СЛАУ существует и единственно. Следовательно, и задача о построении кубического сплайна имеет единственное решение. Для других типов краевых условий доказательство проводится аналогично. Метод решения такой СЛАУ, который будет рассмотрен в лекции 10 — прогонка. Теорема (без доказательства). Для функции f (t ) C 4 [a, b] и интерполирующего ее сплайна S (t), построенного на сетке {t n }nN0 , имеют место следующие неравенства: f (t ) S (t ) [ a,b] M 4 4 , f (t ) S (t ) [ a,b] M 4 3 , f (t ) S (t ) [ a,b] M 4 2 , где M 4 f (4) (t ) [ a,b] , max(tn1 tn ). n Отсюда следует, что при τ → 0 последовательность функций S (k ) (t ), i 0,1, 2 (кубический сплайн и первые две его производные) сходится, соответственно, к f (k ) (t ). Теорема(экстремальное свойство кубических сплайнов) (без доказательства). N Пусть сплайн S (t) интерполирует функцию f(t) на системе узлов t n n0 ; t 0 a, t N b. Тогда S(t) с краевыми условиями S (a) S (b) 0 доставляет минимум функционалу b [ F (t )] dt 2 a среди всех функций F (t ) С22 [a, b], т.е. функций, имеющих интегрируемые с квадратом b вторые производные ( [ F (t )] 2 dt сходится на отрезке [a, b]) и интерполирующих f(t) на a отрезке [a, b]. Локальный сплайн. Локальная форма сплайн-интерполяции предложена В. С. Рябеньким [9, 10]. Рассмотрим неравномерную сетку: t n t n1 hn1 , t n 1 t n hn . В узлах сетки определены значения функции: f n 1 , f n , f n . Не вдаваясь в детали, приведем важные для практического использования формулы в случае постоянного шага сетки h const. Построим интерполяционный полином второго порядка P2 ( x ) в форме Ньютона ( d f n ) / : t n 1 tn t n 1 f n 1 fn f n 1 f n f n1 h f n1 f n f n1 2 f n f n1 . h2 h f f n1 P2 (t , f n ) f n1 n (t t n1 ) h f n1 2 f n f n1 (t t n1 )(t t n ), h2 (6.3) Этом полином приближает f на отрезке [t n1 , t n1 ] с точностью до o(h2 ). Рассмотрим теперь полином Q5 (t , f n ) P2 (t , f n ) h3 f n2 3 f n1 3 f n f n1 2 h3 3 2(t t n ) t t n t t n1 3 , h h h представляющий собой аппроксимацию функции f на отрезке [t n1 , t n1 ] с непрерывными первой и второй производными. В [1] доказано, что выражение (6.3) аппроксимирует f x(m ) с порядком o ( h 3m ) во всех точках отрезка. Так как коэффициенты сплайна зависят от значений функции лишь в 4-х соседних точках и для определения коэффициентов (6.3) не требуется решать систему линейных уравнений, такая кусочно-гладкая интерполяция называется локальным сплайном. Замечание. Q5 (t , f n ) уже не обладает экстремальным свойством.