ОЦЕНКА ФУНКЦИИ РАСПРЕДЕЛЕНИЯ ВРЕМЕНИ ЭФФЕКТИВНОГО ФУНКЦИОНИРОВАНИЯ БОЛЬШЕМАСШТАБНЫХ РАСПРЕДЕЛЕННЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ* Павский В.А.1, Павский К.В.2 1 Кемеровский технологический институт пищевой промышленности, Кемерово 2 Учреждение Российской академии наук Институт физики полупроводников им. А.В. Ржанова Сибирского отделения РАН, Новосибирск TIME DISTRIBUTION FUNCTION ESTIMATION OF EFFECTIVE FUNCTIONING LARGE-SCALE DISTRIBUTED COMPUTER SYSTEMS V.A. Pavsky1, K.V. Pavsky2 1 Technological Institute of the Food Industry, Kemerovo, Russia 2 A.V. Rzhanov Institute of Semiconductor Physics of Siberian Branch of the RAS, Novosibirsk, Russia Mathematical model allowing to calculate robustness indices of large-scale distributed computer systems (CS) with structural redundancy is offered. Estimation of time distribution function of effective functioning CS is received. Введение Для вычислительных систем (ВС), состоящих из десятков и сотен тысяч элементарных машин (ЭМ), понятие надежности приобретает качественно другой смысл, а понятие отказа, если и употребляется, то в смысле недостаточной производительности, поскольку системы, имеющие такой огромный вычислительный ресурс (число ЭМ), просто не должны отказать. Поэтому вполне разумно говорить о высокой производительности ВС или низкой в зависимости от объема рабочего ресурса 1. Это расширяет возможности анализа эффективности функционирования ВС. В самом деле, при оценке работы одной ЭМ или ВС с небольшим ресурсом, мы исследуем процесс функционирования машины или системы только до отказа. Для больших ВС, которые не отказывают, исследование можно проводить для систем, которые находятся как в состоянии высокой производительности (эффективного функционирования), так и в состоянии низкой. Если удается оценить функционирование системы с одной стороны, то оценка другой может быть получена переходом к противоположному состоянию. Математическая модель. Имеется ВС, состоящая из N ЭМ, n из которых составляют структурную избыточность, а N-n -основную подсистему. Время работы каждой ЭМ является случайной величиной подчиненной экспоненциальному закону с параметром - интенсивностью выхода ЭМ из строя. Вышедшая из строя ЭМ основной подсистемы мгновенно заменяется на ЭМ из структурной избыточности, а сама попадает в восстанавливающую систему (ВУ). Если для очередной отказавшей ЭМ основной подсистемы замены нет, то ВС переходит из состояния высокой производительности в низкую. Время восстановления ЭМ находящихся в ВУ является случайной величиной, подчиненной экспоненциальному закону с параметром интенсивностью восстановления. Предполагается, что, независимо от числа ЭМ, находящихся в ВУ, среднее время восстановления t cp 1 / μ . Предположим также, что функционирование ВС происходит достаточно длительное время. Это позволяет нам считать, что поток отказов ЭМ - пуассоновкий с параметром равным N λ 2. Требуется вычислить Pk (t ) - вероятность того, что в момент времени t, t [0, ) , в состоянии отказа находится k ЭМ, k 0,1,..., n . Работа выполнена при поддержке РФФИ (грант №09-07-00185) и Совета по грантам Президента РФ (грант № НШ-5176.2010.9). *) Система дифференциальных уравнений для вероятностей Pk (t ) эквивалентна системе, полученной в работе [3], и имеет вид: n ' P0 (t ) N λ P0 (t ) μ k1Pk (t ), ' (1) Pk (t ) ( N λ μ) Pk (t ) μ Pk 1 (t ),k 1,2,..., n 1, ' Pn (t ) μ Pn (t ) N λ P1 (t ), с начальными условиями P0 (0) 1 , Pk (0) 0 и условием нормировки n Pk (t ) 1 , t [0, ) . k 0 Общее решение системы (1) приведено в работе [3]. Если ВС функционирует достаточно долго, то для вероятностей Pk (t ) достаточно иметь решение для случая когда t , pk lim Pk (t ) , t которое имеет вид n Nλ μ ( N λ) k μ . p0 , pk , p n (2) k 1 Nλ μ ( N λ μ) Nλ μ Учитывая (2) и формулировку модели, вероятность нахождения ВС в состоянии низкой производительности n Зададим вероятность производительности, тогда Nλ . p н μ N λ того, что ВС находится в состоянии высокой n Логарифмируя (3) и полагая k cp где k cp Nλ . 1 γ μ N λ n 1 , находим (3) ln( 1 γ) k cp 1, ln N λ ln( N λ μ ) - среднее число ЭМ, составляющих структурную избыточность. Зависимость среднего числа n k cp 1 ЭМ структурной избыточности от числа ЭМ в ВС при 1 γ 0,05 , N 10 4 ,10 5 , μ 1 1/ч, λ 10 4 , 10 4 1/ч представлена в табл. 1 Таблица 1. Зависимость среднего числа ЭМ структурной избыточности от числа ЭМ в системе. N 2 10 4 10 4 10 4 10 5 8 5 62 32 Из таблицы следует, что при числе ЭМ в ВС близких к 105 структурная избыточность не превышает 0,15% от общего числа ЭМ в ВС, находящихся в состоянии высокой производительности. Перейдем к нахождению оценки функции распределения F (τ ) - вероятности того, что ВС выйдет из состояния высокой производительности (эффективного функционирования) в течение времени при условии, что режим функционирования стационарный. Предположим, что за время , τ [0, ) , в ВС число отказов ЭМ не более чем число ЭМ в системе. Пусть ВС функционирует достаточно долго, тогда вероятность ее нахождения в любом из состояний в любой момент времени постоянна и совпадает с начальными условиями, а вероятность того, что за время в ВС откажет k ЭМ (a( τ ) / τ ) k a ( τ ) Vk ( τ ) e , k! где a( τ ) N (1 exp( λ τ )) - среднее число отказавших ЭМ за время , τ [0, ) (заметим, что при τ 0 , получаем суммарную интенсивность отказов a (0) N λ ). Учитывая (3), для вероятности Pн (τ ) того, что ВС будет находится в течение времени в состоянии низкой производительности, получаем n a( τ ) . Pн ( τ ) μ τ a( τ ) Тогда функция F (τ ) распределения времени эффективного функционирования ВС запишется в виде n μNλ N (1 e λτ ) , (4) F ( τ ) 1 λτ N λ μ τ N ( 1 e ) где N λ /( μ N λ) - вероятность в любой момент времени застать ВС в состоянии низкой производительности, при условии, что режим работы стационарный. Учитывая, что F (τ ) - монотонно возрастающая, F (0) 0 , F () 1 , то заключаем, что (4), в самом деле, можно рассматривать как оценку функции распределения 1 времени эффективного функционирования ВС до выхода в состояние низкой производительности. На рис. 1 представлены зависимости функции F (τ ) от времени при μ 1 1/ч и данных табл. 1. F() 1 F()1 0,8 0,8 0,6 0,6 0,4 0,4 0,2 0,2 0 0 1 2 3 4 5 6 7 1 8 9 10 11 12 13 2 4 , 10 час а) 0 0 1 2 3 4 5 3 6 7 8 4 9 10 11 12 13 , 104 час б) Рис. 1. Зависимость функции распределения времени эффективного функционирования ВС F ( ) от времени при 1 1/ч а) 10 4 ; б) 2 10 4 : 1 – N 10 4 , n 5 ; 2 – N 10 5 , n 32 ; 3 – N 10 4 , n 8 ; 4 – N 105 , n 62 Из рисунков видно, что - для ВС состоящих из числа ЭМ близких к 105 , при среднем времени работы ЭМ не менее 1/ λ 10 4 ч, времени восстановления 1 / μ 1 ч, числе ЭМ структурной избыточности не превосходящего 0,062% (см табл. 1) - промежуток времени эффективного функционирования системы, с вероятностью не менее 0,98, будет не менее чем 2 10 4 часов. Из сравнения рисунков с таблицей (в которой расчеты проведены для стационарного режима моментного состояния ВС) следует, что результаты практически совпадают для промежутка времени до 2,5 10 4 ч, а далее различие становится существенным. Этот факт демонстрирует эффективность использования показателей надежности полученных для промежутка времени. С другой стороны, для сложных задач, время решения которых не годы, а месяцы, расчеты для момента времени более эффективны в силу простоты вычислений. Заключение Рассчитаны показатели живучести для многомашинных ВС. Получена оценка функции распределения времени эффективного функционирования до выхода системы в состояние низкой производительности. Установлено, что при одинаковых начальных условиях (исследуется стационарный режим работы системы), анализ функционирования ВС на промежутке времени дает более надежные результаты, чем анализ ее состояния в момент времени. Список литературы 1. Хорошевский В.Г. Архитектура вычислительных систем: Учеб. пособие. для вузов. – 2е изд. – М.: Изд-во МГТУ им. Баумана, 2008. – 520 с. 2. Клейнрок Л. Теория массового обслуживания. М.: Машиностроение, 1979. – 432 с. 3. Павский В.А. Павский К.В. Оценка показателей осуществимости решения задач на распределенных вычислительных системах// Вестник компьютерных и информационных технологий. – 2008. - №4. – С. 61 – 68.