Лектор: Лукин Алексей Сергеевич Вейвлеты и банки фильтров План Вейвлеты и их связь с банками фильтров ► Непрерывное вейвлет-преобразование ► Дискретное вейвлет-преобразование ► Квадратурные зеркальные фильтры ► Пирамидальное представление данных Банки фильтров: DFT, MDCT Применения банков фильтров ► Аудиоэффекты ► Шумоподавление ► Компрессия звука и изображений Понятие вейвлета Вейвлеты – это сдвинутые и масштабированные копии ψa,b(t) («дочерние вейвлеты») некоторой быстро затухающей осциллирующей функции ψ(t) («материнского вейвлета») a ,b (t ) 1 t b a a Используются для изучения частотного состава функций в различных масштабах и для разложения/синтеза функций в компрессии и обработке сигналов Понятие вейвлета Условия, обычно накладываемые на ψ(t): ► Интегрируемость (t) dt ► Нулевое среднее, нормировка (t ) dt 2 (t )dt 0 (t ) dt 1 2 ► Нулевые моменты (vanishing moments) t (t )dt 0 m Понятие вейвлета Примеры вейвлетов Morlet (Gabor) Meyer Mexican hat Непрерывное вейвлетпреобразование (CWT) Скалярные произведения исследуемой функции f(t) с вейвлетами ψa,b(t) W {x}(a, b) x, a ,b x(t ) a ,b (t )dt Дискретное вейвлетпреобразование (DWT) Используются лишь целочисленные сдвиги вейвлета и масштабирование в 2 раза Возможность построения ортогонального преобразования Дискретный вейвлет: 1. Последовательность чисел h2 [m] 2. Ортогонален своим сдвигам на четное число точек h [m]h [m 2k ] 0, m 2 2 k Z , k 0 3. Существует скейлинг-функция (НЧ-фильтр), ортогональная вейвлету h [m]h [m] 0 m 1 2 Преобразование Хаара Простейший случай вейвлет-преобразования Дан входной сигнал x[n] Образуем от него последовательности полусумм и полуразностей: x1*[n] x[n] x[n 1] 2 x2*[n] x[n] x[n 1] 2 Легко видеть, что сигнал x[n] можно восстановить: x[n] x1*[n] x2*[n] Такое кодирование избыточно: из одной последовательности получаем две Преобразование Хаара Устранение избыточности Проредим полученные последовательности в 2 раза: x1[n] x1*[2n] x2 [n] x2*[2n] Легко видеть, что справедлив алгоритм восстановления: n x , n четное yi [n] i 2 i 1, 2 n нечетное 0, x1**[n] y1[n] y1[n 1] (интерполяция нулями) x2**[n] y2 [n] y2 [n 1] x[n] x1**[n] x2**[n] (фильтрация) (суммирование) Дискретное вейвлетпреобразование Обобщение преобразования Хаара x[n] H2 H1 ↓2 ↑2 + Коэффициенты ↓2 Декомпозиция (анализ) G2 ↑2 x’[n] G1 Реконструкция (синтез) Свойство точного восстановления (PR): x[n] x[n] Количество информации не изменяется. Нужно найти хорошие фильтры, обеспечивающие точное восстановление. Дискретное вейвлетпреобразование Прореживание ВЧ-сигнала ↓2 Интерполяция ВЧ-коэффициентов до ВЧ-сигнала ↑2 Дискретное вейвлетпреобразование Квадратурные зеркальные фильтры (QMF) частотные характеристики H1 ( ) H 2 ( ) const 2 2 импульсные характеристики Дискретное вейвлетпреобразование QMF: базис Хаара Плохое частотное разделение, но хорошая временная (пространственная) локализация Дискретное вейвлетпреобразование Условия точного восстановления: ► Рассмотрим случай m четное h [m], h2 [m] 1 g1[m] h1[m], g2 [m] h2 [m], h1[m], m нечетное ► h1[m] – симметричный, четной длины ► В этом случае требуется, чтобы H1[ ] H 2 [ ] 2 2 2 Построение PR-вейвлетов: ► Нужна хорошая пространственная локализация – берем стандартные вейвлеты (например, вейвлеты Добеши) ► Нужна хорошая частотная локализация – свойству PR удовлетворить трудно. Поэтому строим QMF со свойством «почти PR». Дискретное вейвлетпреобразование Построение «почти PR»-фильтров большого размера с хорошим частотным разделением: 1. Строим симметричный НЧ-фильтр h1[m] методом оконного взвешивания. 2. Нормируем его коэффициенты: h1[m] 2 m 3. Строим дополняющий его ВЧ-фильтр h2[m]: m четное h [m], h2 [m] 1 h1[m], m нечетное 4. Проверяем величину искажений по суммарной частотной характеристике и пробуем изменить частоту среза НЧ-фильтра для уменьшения искажений. Пирамидальное представление Продолжаем вейвлет-разложение для НЧкоэффициентов Одномерный случай x[n] Частотный диапазон делится на октавы H2 ↓2 H1 ↓2 H2 ↓2 H1 ↓2 Коэффициенты Двумерное вейвлетпреобразование на каждом шаге получаем 4 набора коэффициентов: НЧ («аппроксимирующие») и ВЧ («детализирующие») Банки фильтров Банки фильтров (гребенки фильтров) – преобразования, разбивающие сигнал на несколько частотных полос ► С точным восстановлением? ► С увеличением количества информации? Пример: дискретное вейвлет-преобразование Еще пример: оконное преобразование Фурье (STFT – Short Time Fourier Transform) Банки фильтров Применения: ► ► Раздельная обработка сигнала в разных частотных полосах Компрессия сигналов с независимым квантованием в разных частотных полосах Пример банка фильтров, основанного на STFT ► ► ► Декомпозиция: STFT с окном Хана (Hann), и с перекрытием между окнами 75% Синтез: обратное DFT от каждого блока, применение весовых окон Хана и сложение окон с наложением (OLA) Свойства: ► ► Точное восстановление Наличие избыточности Банки фильтров Как банки фильтров разбивают частотновременную плоскость? ► Вейвлеты делят частотную ось на октавы ► STFT разбивает частотную ось равномерно f f t Оконное ДПФ t Вейвлеты Банки фильтров, основанные на STFT – + Без весовых окон, без перекрытия блоков ► Размытие спектра → плохое разделение частот в каналах ► Разрывы сигнала на границах блоков при синтезе ► Нет избыточности 0 + – N 2N С весовыми окнами, с перекрытием блоков ► Хорошее разделение частот в каналах ► Нет разрывов на границах блоков при синтезе ► Избыточность t Банки фильтров, основанные на STFT + Модифицированное дискретное косинусное преобразование (MDCT) ► Перекрытие 50%, весовое окно ► Неплохое разделение частот в каналах ► Без избыточности! → подходит для компрессии ► Каждое окно длины 2N захватывает N новых отсчетов и выдает N вещественных коэффициентов спектра ► Требования к окнам: w[ n ]2 w[ n N ]2 const ► Примеры подходящих окон: ► ► Полпериода синуса Kaiser-Bessel derived (KBD) Банки фильтров, основанные на STFT Частотно-временное разрешение ► Способность различать детали по частоте и по времени, «размытость» спектрограммы ► Для STFT определяется длиной весового окна (а также, отчасти, размером и шагом DFT по времени) ► Соотношение неопределенностей: разрешение по частоте обратно пропорционально разрешению по времени f t const 6 ms 12 ms 24 ms 48 ms 96 ms размер окна Банки фильтров, основанные на STFT Частотно-временное разрешение ► Частотное разрешение спектрограммы равномерное ► Частотное разрешение слуха на НЧ выше, чем на ВЧ STFT, окно 12 мс STFT, окно 93 мс Банки фильтров: достоинства и недостатки STFT Очень быстрая реализация для большого числа полос + – Слишком различающееся число осцилляций базисных функций, эффект Гиббса DWT Возможность произвольных разбиений F-T плоскости + – Малое число частотных полос Плохое частотное разделение между полосами