Механизмы защиты Классификация механизмов защиты в транспортных сетях Механизмы защиты в транспортных сетях В сетях SDH В сетях DWDM Функциональнологические механизмы Восстановление под управлением TMN Физические механизмы Резервирование терминального оборудования (EPS 1:1, N:1, N:m) Резервирование участков сети по разнесенным трассам (MSP 1:1, 1+1) Обход отказавшего узла (использование пассивных оптических ретрансляторов) Защита маршрута потока данных (TP) Механизм защиты с разделением ресурсов (MSSPRing) Механизм защиты с выделенным кольцом (MSDPRing) 2-волоконная схема защиты (2ОВ) 4-волоконная схема защиты (4ОВ) Переключение кольца (RS) Переключение на резервную длину волны Защита соединения подсети (SNCP) Оптическая защита мультиплексорной секции (O-MSP) Механизм с внутренним мониторингом (SNCP/I) Оптическая защита соединения подсети (O-SNCP) Механизм с мониторингом без перерыва сервиса (SNCP/N) Оптическая защита канала (Och protection) 4-волоконная схема защиты (4ОВ) Переключение перекрытия (SS) Физические методы защиты и восстановления работоспособности сети Одним из основных преимуществ технологии SDH является возможность такой организации сети, при которой достигается высокая надежность ее функционирования, обусловленная не только надежностью оборудования SDH (т.н. аппаратной надежностью) и надежностью среды передачи, в качестве которой используется ВОК, но и возможностью сохранения или восстановления (за очень короткое время в десятки миллисекунд) работоспособности сети, даже в случае отказа одного из ее элементов или среды передачи на одном из участков (т.н. системной надежностью). Такие сети (и системы) логично называть уже существующим в литературе по системному анализу и теории надежности термином: самовосстанавливающиеся сети (СВС). В качестве общего названия механизмов защиты в сетях SDH используется термин «автоматическое защитное переключение» (Automatic Protection Switching, APS). Он отражает факт перехода (переключения) на резервный путь или резервный элемент мультиплексора при отказе основного [12]. В принципе существуют различные методы обеспечения быстрого восстановления работоспособности синхронных сетей, основанные на методах физической защиты, которые могут быть сведены к следующим схемам: 1. Резервирование участков сети по схемам 1+1 и 1:1 по разнесенным трассам (MSP - Multiplex Section Protection). В этом случае участки между двумя узлами сети соединяются по двум разнесенным трассам (стопроцентное резервирование), сигналы по которым могут распространяться одновременно. В узле приема они могут обрабатываться по двум схемам: - резервирование по схеме 1+1 - в узле приема сигналы анализируются и выбирается тот, который имеет наилучшие рабочие параметры, или тот, который фактически возможен (Рисунок 9.1); - резервирование по схеме 1:1 - в узле приема альтернативным маршрутам назначаются приоритеты: низкий и высокий, ветвь с низким приоритетом находится в режиме горячего резерва, переключение на нее происходит по сигналу аварийного переключения от системы управления, при этом передача низкоприоритетного трафика прекращается (Рисунок 9.2). Рисунок 9.1 - Резервирование участка сети по схеме 1+1. Рисунок 9.2 - Резервирование участка сети по схеме 1:1. 2. Резервирование терминального оборудования по схемам 1:1, или N:1, или N:m (EPS - Equipment protection switching). В этом случае восстановление работоспособности осуществляется за счет резервирования на уровне трибных интерфейсов. Схема резервирования, обозначаемая в общем случае как N:m, использует m резервных на N работающих интерфейсных карт, что допускает различную степень резервирования: от 1:1 (100 %) до N:m (100m/N %), где минимально m=1, когда на N основных трибных интерфейсных карт используется одна резервная, которая автоматически выбирается системой управления при отказе одной из основных. Этот метод (CP – Card Protection) широко распространен в аппаратуре SDH для резервирования трибных карт 2 Мбит/с (21:1, 16:1), 34 Мбит/с (3:1), 140 Мбит/с или STM-n (1:1). Он используется также для резервирования наиболее важных сменных блоков (непосредственно EPS), например, блоков кросс-коммутации, систем управления и резервного питания (1:1). Время переключения основных карт (модулей) на резервные обычно не превышает 10 мс. 3. Восстановление работоспособности сети в целом путем обхода отказавшего узла. При этом резервирование как таковое не используется, а работоспособность всей системы в целом восстанавливается за счет исключения отказавшего (поврежденного) узла из схемы функционирования. Так, системы управления SDH мультиплексоров обычно дают возможность организовывать обходной путь, позволяющий пропускать агрегатный поток мимо мультиплексора в случае его отказа, путем использования пассивных оптических трактов передачи 4. Использование систем оперативного переключения на работоспособный участок. В этом случае, характерном для сетей общего вида или ячеистых сетей, в узлах сети устанавливаются кросс-коммутаторы систем оперативного переключения, которые осуществляют, в случае сбоя, вызванного либо разрывом соединительного кабеля, либо отказом узла последовательной линейной цепи, реконфигурацию маршрутов на прилегающих (входящих или исходящих) участках сети и соответствующую кросс-коммутацию потоков. Процедура такой реконфигурации может быть централизованной или распределенной. Использование систем оперативного переключения по принципу организации защиты напоминает схему резервирования 1:1 метода резервирования по разнесенным трассам. Разница, однако, состоит в том, что в последнем случае физический или виртуальный канал уже существует тогда, как в первом он формируется в момент оперативного переключения [11]. Функционально-логические методы защиты синхронных потоков. Методы защиты синхронных потоков в системах SDH (и связанная с ними терминология) начали разрабатываться практически сразу с момента возникновения самой технологии, однако были регламентированы в стандарте ITU-T G.841 относительно недавно (первая редакция - 7.95, вторая -10.98). В этом документе отражены и систематизированы новые методы защиты синхронных потоков в системах SDH, использующих как двухволоконную, так и четырехволоконную кольцевую архитектуру. В соответствии с ним схемы защиты делятся на две категории: - защита маршрута потока данных (ТР Trail Protection) SDH - осуществляется на уровне секции или маршрута путем замены основного маршрута потока данных на резервный (защитный) маршрут потока данных, если на основном маршруте произошел сбой или его показатели производительности опустились ниже требуемого уровня, или его показатели ошибок поднялись выше допустимого уровня; - защита соединения подсети (SNCP Sub-Network Connection Protection) SDH - осуществляется путем замены основного соединения подсети на защитное соединение, если первое дало сбой или его показатели производительности опустились ниже требуемого уровня, или его показатели ошибок поднялись выше допустимого уровня. Для фиксации момента переключения используются различные виды мониторинга указанных показателей (внутренний мониторинг, мониторинг без перерыва сервиса, мониторинг на подуровне). Схема защиты с разделением ресурсов каналов типа MS SPRing. Схема защиты типа MS SPRing (Multiplex Section Shared Protection Ring) нашла широкое применение в технологии защиты синхронных потоков систем SDH, построенных как на основе кольцевой, так и ячеистой архитектуры. Она относится к защите первого типа (ТР), основанной на разделении ресурсов кольца SDH, и применяется как для двухволоконных (2ОВ), так и четырехволоконных (4ОВ) вариантов использования среды передачи. Отличительной особенностью этой схемы защиты является то, что для передачи нормального трафика используются все волокна как в варианте 2ОВ, так и в варианте 4ОВ, однако только 50% емкости каждого ОВ отдано под нормальный трафик и 50% под трафик защиты так, если: должен быть защищен весь рабочий трафик. В этом смысле MS SPRing является технологией разделения ресурсов каналов. В этой схеме все доступная полоса пропускания системы SDH может быть разбита на каналы трех типов: - рабочие каналы, передающие основной (нормальный) трафик, защищенный механизмом действия протокола MS SPRing APS; - каналы защиты, которые могут нести дополнительный незащищенный трафик, сброс которого (с целью освобождения канала) осуществляется сигналом APS; -каналы типа NUT (незащищенный трафик с запрещением на сброс), которые могут нести незащищенный трафик, заблокированный (и в этом смысле защищенный) от сброса, осуществляемого обычно сигналом APS. Назначение каналов первых двух типов очевидно. Каналы же типа NUT могут быть использованы для передачи трафика виртуальных контейнеров верхнего уровня, связывающего, например, сети доступа ATM или подсети SDH (использующих схему защиты SNCP) с сетями SDH (использующих схему защиты типа MS SPRing). Трафик каналов NUT по степени защищенности за- нимает промежуточное положение между трафиком рабочих каналов (высшая степень защиты) и трафиком каналов защиты (низшая степень защиты). Рассмотрим организацию и функционирование схемы защиты потоков типа MS SPRing на примере кольцевой двунаправленной двухволоконной сети, приведенный на рисунке 9.3. На рисунке 9.3показан маршрут потока данных между узлами А и D при двух состояниях сети: нормальном (а) и аварийном (б). В первом случае маршрут потока А-В-C-D проходит по рабочему каналу через рабочие пролеты А-В, В-С, C-D. Во втором (учитывая повреждение ОВ на пролете В-С) –маршрут меняется на: А-В-A-F-E-D-C-D и поток распространяется по рабочему каналу только на рабочих пролетах А-В и C-D, а на остальных пролетах (В-А, A-F, F-E, E-D и D-C) - по каналу защиты. Рабочие каналы B A A B C C Каналы защиты ` ` F ` E D F ` E D а) б) Рисунок 9.3- Схема организации защиты потоков по технологии MS SPRing: а) нормальное состояние; б) повреждение ОВ на пролете В-С. Схема защиты с разделением ресурсов колец типа MS DPRing. Другой схемой защиты, также относящейся к защите первого типа (ТР), является защита мультиплексных секций с выделенным кольцом (MS DPRing) SDH. Она также применяется как для двухволоконных, так и четырехволоконных вариантов использования среды передачи. Отличительной особенностью этой схемы защиты является то, что все кольца разделяются на две группы (по одному кольцу для варианта 2ОВ и по два кольца для 4ОВ) с противоположным направлением распространения сигнала. Для передачи нормального трафика используется одна группа ОВ, а для защиты - другая, что дает возможность защитить весь рабочий трафик. В этом смысле MS DPRing является технологией разделения ресурсов колец. Она применялась еще в мультиплексорах SDH первого поколения. В этой схеме максимальное число каналов в основном кольце (в варианте 2ОВ) ограничено емкостью одного пролета, как и в схемах однонаправленного кольца. Например, в схеме с использованием STM-16 это составит 16 AU-4 (20В) или 32 AU-4 (40В). Схема защиты мультиплексных секций с выделенным маршрутом защиты может быть использована в любой топологии (кольцевой, ячеистой, линейной или смешанной) и на любом выделенном уровне сети. Схема защиты соединений подсети типа SNCP. Эта схема защиты также основана на механизме защиты выделенной части сети и может использоваться при различных топологиях такой части сети (кольцевой, ячеистой, линейной или смешанной) и на любом выделенном уровне сети. Она может быть использована для защиты любой части маршрута потока данных, если это часть имеет два различных, сегмента/ветви между двумя точками соединения СР или между точкой соединения СР и терминальной точкой соединения TCP, или, наконец, между двумя TCP. Защита типа SNCP фактически представляет собой схему линейной защиты, которая может быть использована для индивидуальной защиты сигналов VC-n любого уровня внутри мультиплексной секции, причем она может охватывать только часть VC-n нижнего уровня (LO VC), размещенных в контейнере VC-n верхнего уровня (НО VC). При защитном переключении линейной мультиплексной секции можно использовать как механизм защиты выделенной части, так и защиты с разделением ресурсов. Он используется на мультиплексном уровне применительно к физической сети с топологией точка-точка. Единственной спецификой может быть использование одной защищенной мультиплексной секции для защиты N рабочих мультиплексных секций. Такая защита, реализующая уровень защиты 1:N, может работать при использовании как однонаправленных, так и двунаправленных схем передачи трафика, однако она не может защитить трафик в случае аварии сетевого узла. Как отмечалось выше, решение о защитном переключении может быть принято либо в результате внутреннего мониторинга показателей производительности (или ошибок), и тогда такой тип защиты SNCP обозначается как SNC/I (Inherent), либо в результате мониторинга без перерыва сервиса, и тогда такой тип защиты SNCP обозначается как SNC/N (Non intrusive) Механизм действия защиты SNCP отражен на рисунке 9.4. A A B B C E D C E D а) б) а) нормальное состояние; б) повреждение. Рисунок 9.4 – Механизм защиты SNCP. Схема защиты MS SPRing с разделением ресурсов каналов для 4волоконного кольца. Выше рассматривались только двухволоконные кольцевые и линейные топологии и методы защиты, используемые для них - ТР и SNCP. Эти методы в процессе защитного переключения позволяют переходить на резервное (защитное) волокно, исключая аварийное волокно, или канал, или пролет, либо переходить на резервные каналы в одном и том же волокне. В любом случае происходит исключение короткого пути через аварийное перекрытие (В-С) и использование длинного пути (являющегося внешним замыканием звена В-С) по каналу защиты (см. рис 3.3). Для этого используется переключение APS типа переключения кольца (RS), фактически направляющего трафик в противоположную сторону. Четырехволоконная схема MS SPRing использует четыре ОВ в каждом пролете (а значит и в кольце в целом) - по два ОВ в каждом рабочем и защитном кольцах, причем эти кольца являются не только 2-волоконными, но и двунаправленными. В результате схема MS SPRing позволяет размещать 100% (а нее 50%, как в 2-волоконной схеме) нормальных каналов, что соответствует полной емкости канального оборудования, определяемой используемым уровнем STM-N. Схема отображения трафика на структуру каналов упрощается, учитывая, что теперь заголовки мультиплексных секций рабочих и защитных каналов полностью разделены, так как сами каналы передаются по отдельным парам ОВ. Различают 2 механизма защитного переключения: • Переключение кольца (RS, ring switching) - защитное переключение кольца - механизм защиты, используемый как в двухволоконных, так и в четырехволоконных кольцевых сетях, при котором трафик рабочих каналов с аварийного пролета (короткого звена) перегружается в канал защиты, являющийся внешним замыканием (динным звеном) пролета (Рисунок 9.3). • Переключение пролета (SS, stairwell switching) - защитное переключение пролета - механизм защиты подобен линейному APS типа 1:1, но применяется он только к 4ОВ-кольцам, где рабочие и защитные каналы находятся в различных волокнах и отказ поражает только рабочие каналы. Во время SS трафик рабочих каналов аварийного пролета перегружается в канал защиты, топологически совпадающим с аварийным пролетом. Применение 4-волоконной схемы (в кольцевой, ячеистой или линейной сети) позволяет, кроме прочего, использовать в качестве APS не только переключение типа RS, но еще и переключение перекрытия (SS), которое направляет трафик не назад по длинному внешнему замыканию аварийного перекрытия, а вперед через эквивалент перекрытия, сформированный в канале защиты (в другой симметричной паре ОВ), что упрощает схему коммутации защитного переключения. Единственное ограничение - RS и SS не могут быть использованы одновременно, хотя по кольцу можно одновременно использовать несколько SS, учитывая, что они действуют локально (на длине одного перекрытия). Четырехволоконную кольцевую схему, использующую переключение типа SS, часто называют двунаправленным (двойным) кольцом защиты с линейным переключением пролетов (BLSR). Рассмотрим организацию и функционирование схемы защиты потоков типа MS SPRing на примере кольцевой двунаправленной 4-волоконной сети, аналогичной 2-волоконной сети, приведенной на рис. 3.3. Предположим, что повреждены только 2 рабочих волокна в кабеле, а 2 волокна защиты остались целы. В этом случае при организации защиты может быть задействован механизм переключения SS, а не RS. На рисунке 9.5 показан маршрут потока данных между узлами А и D этой сети при двух ее состояниях: нормальном (а) и аварийном (б), рассчитанном на использование защитного переключения SS. В первом случае маршрут потока А-В-С-D проходит, как и в 2-волоконной схеме, по рабочему каналу через рабочие пролеты А-В, В-С, C-D. Во втором случае маршрут меняется только на пролете В-С (где В-С рабочий меняется на В-С защитный) на маршрут: A-B(p)B(3)-C(3)-C(p)-D (здесь индекс р означает "рабочий", а з- "защитный") и поток распространяется по рабочему каналу только на рабочих пролетах А-В и C-D, а на пролете В-С -по каналу защиты В(з)-С(з). а) б) а) нормальное состояние; б) повреждение рабочих ОВ на пролете В-С. Рисунок 9.5 - Схема организации защиты потоков по технологии MS SPRing для 4-волоконного кольца Самовосстанавливающиеся сети с механизмом защиты MS SPRing более выгодны при относительно большом числе узлов в кольце и достаточно равномерной загрузке кольца, т.е. равномерная загрузка сети становится дополнительной задачей при проектировании сети. Равномерно распределить передаваемый трафик не всегда возможно. Однако во многих случаях СВС с MS SPRing оказывается более экономичным, поскольку при его организации требуется меньшая пропускная способность. В то же время СВС c механизмом защиты SNCP проще в реализации и имеют меньшее время перехода на резерв. Каждый вариант метода защиты СВС имеет свою эффективную область применения. Использование методов восстановления как одна из альтернатив в защите трафика. Под восстановлением обычно понимают любую возможность восстановить трафик между двумя узлами. Такими возможностями (кроме рассмотрен- ных выше методов защиты) являются перемаршрутизация (или перекоммутация), переключение на резервный элемент (одна из классических альтернатив теории надежности - рассматривается здесь только применительно к замене блоков или узлов оборудования) и, наконец, замена вышедшего из строя элемента (классическая альтернатива ремонта). Методы восстановления также требуют наличия резервной емкости для осуществления перемаршрутизации или перекоммутации, однако процент этой емкости может быть снижен с 50 до 100/n, где n > 2 и зависит от числа альтернативных маршрутов, другими словами от степени "ячеистости" сети. В этом смысле ячеистая сеть может, в принципе, более экономно использовать сетевые ресурсы, чем кольцевая. Существует два типа схем восстановления: централизованная (реализуемая с помощью NMS) и распределенная. Скорость восстановления зависит от характера отказа и составляет 2-10 с (быстрая) и 10-30 мин (медленная). Разумный путь лежит в сочетании методов восстановления и защиты трафика. Сравнение результатов действия методов защиты и восстановления приведены на рис. а) б) в) а) Восстановление под управлением NMS; б) Защита под действием механизма SNCP; в) Защита под действием механизма MS SPRing. Рисунок– Сравненеие методов защиты и восстановления для разветвленной сети Методы повышения надежности и механизмы защиты транспортных сетей активно рассматриваются в международной научно-исследовательской деятельности. На сегодняшний день особое внимание уделяется следующим вопросам: - повышение скорости переключения между активным и резервным путями в транспортной сети. - развитие способов защиты нагрузки в ячеистой цифровой сети связи при повреждениях или ухудшении качества работы участков. - способы и устройства выбора резервных путей в волоконно-оптических сетях с разделением по длинам волн. - создание автоматических устройств обхода для волоконно-оптических линий связи.