b - Высшая школа экономики

реклама
УДК 519.24
ПОСТРОЕНИЕ ДИСКРЕТНЫХ РАСПРЕДЕЛЕНИЙ
СЛУЧАЙНЫХ ВЕЛИЧИН ДЛЯ МОДЕЛИРОВАНИЯ
ОБЩЕГО НЕОГРАНИЧЕННОГО СПРОСА
М.Г. Лапина, Г.М. Фридман
Аннотация: В статье предложены два новых типа распределения дискретной случайной величины, позволяющие более адекватно, чем применяемое
обычно нормальное распределение, моделировать общий неограниченный
спрос. Эти распределения учитывают тот факт, что спрос всегда является целой
неотрицательной случайной величиной. Новые распределения получены за счет
проведения двух последовательных преобразований для исходных нормального
и гамма-распределений: округления до ближайшего целого значения по стандартным правилам и усечения по левой границе в точке   0 (в случае нормального распределения). Найдены аналитические выражения для функций вероятностей для обоих модифицированных распределений. Для получения аналитических и числовых результатов была использована математическая среда
Wolfram Mathematica 8. Представленные результаты найдут свое применение
при решении задачи об оценки параметров распределения случайной величины
по ее цензурированной статистической выборке. С практической точки зрения
эти алгоритмы могут быть использованы при восстановлении общего неограниченного спроса.
Ключевые слова: прогнозирование общего спроса, моделирование спроса,
усеченный спрос, цензурированные данные, Wolfram Mathematica 8
NEW DERIVED DISCRETE STATISTICAL DISTRIBUTIONS FOR
DEMAND UNCONSTRAINING PROBLEM
M. G. Lapina, G.M. Fridman
Abstract: Two new derived discrete statistical distributions are proposed in the
paper for unconstraining demand simulation that are more adequate than the normal
distribution usually implemented. Both distributions accounts for the fact that demand is a nonnegative integer random value. New distributions were obtained by implementing two mathematical transformation of the normal and gamma - distributions: the rounding to the nearest integer value by the standard rule and left truncation
at the point   0 (in the case of the normal distribution). Analytic forms of the probability function for both distributions were derived. Wolfram Mathematica 8 was
used to obtain all analytical and numerical results presented in the paper. The results
presented in the paper can be applied to solutions to the problem of distribution parameters estimation of a random variable using its constraining sample. From the
practical view point these algorithms are useful for demand unconstraining problem
solution.
Keywords: unconstrained demand forecasting, demand modeling, constrained
demand, censored data, Wolfram Mathematica 8
Различные методы решения задачи восстановления общего неограниченного спроса по наблюдаемой цензурированной выборке представлены в работах [1-5]. Важной частью этих и многих других исследований по указанной
проблеме является сравнительное тестирование предлагаемых методов на базе
компьютерного моделирования процесса восстановления общего спроса. Для
этого обычно генерируется выборка x  ( x1 , x2 ,..., xn ) нормально распределенной
случайной величины X ~ N (1 ,  1 ) и выборка y  ( y1 , y2 ,..., yn ) нормально распределенной случайной величины Y ~ N (2 ,  2 ) , после чего формируется
наблюдаемая выборка z  ( z1 , z2 ,..., zn ) :
z1  min( x1 , y1 ), z2  min( x2 , y2 ),..., zn  min( xn , yn )
При этом случайная величина X представляет собой прогнозируемый
общий спрос на некоторый продукт, а случайная величина Y – установленные
продавцом ограничения на объем его продаж (иногда называемые пределами
бронирования). В результате выборка z соответствует цензурированным данным по спросу. Задача состоит в вычислении оценок параметров ̂1 и ˆ1 величины X по заданной выборке z .
Эффективность выбранного метода восстановления общего спроса характеризуется, в том числе, относительной погрешностью вычисленных оценок
величины X . Очевидно, важным в процессе моделирования является предположение о том, что неограниченный (общий) спрос распределен нормально.
Отметим, что большинство применяемых на практике методов восстановления
также по умолчанию использует это предположение. В то же время, при формировании наблюдаемой цензурируемой выборки
z часто производится
округление сгенерированных нормально распределенных случайных величин
xk и yk , k  1,..., n для того, чтобы отразить дискретный характер спроса. Кроме того, для малых значений 1 и относительно больших
 1 приходится либо
исключать отрицательные элементы xk  0 , либо, вместо нормального, использовать гамма-распределение. Таким образом, фактически тестирование методов
восстановления общего спроса, которые включают предположение о нормальности случайной величины X , проводится на выборках для случайной величины, не распределенной нормально. Это, естественно, вносит дополнительные
погрешности в процесс моделирования и делает сформулированные в результате выводы менее достоверными.
В настоящей работе для моделирования процесса восстановления общего
спроса предлагается иной способ формирования наблюдаемой цензурированной выборки z , который связан с построением новых дискретных законов распределения, так называемого «округленного» нормального распределения и
«округленного» гамма- распределения, для которых случайная величина принимает только целые неотрицательные значения.
Пусть случайная величина  ~ N ( ,  ) распределена нормально с параметрами сдвига
 и масштаба  . Совершим с этой величиной два последова-
тельных преобразования: усечение по левой границе в точке   0 и округление до ближайшего целого значения по стандартным правилам. Тогда, если
обозначить через N 0 ( ,  ) усеченное слева в точке   0 нормальное распределение, то вероятность того, что новая случайная величина S N примет значение b  1,2,... может быть вычислена по формуле
1
1


Pr(S N  b)  Pr b     b  |  ~ N 0 (  ,  )  ,
2
2


а в случае b  0 имеем
1


Pr(S N  0)  Pr 0    |  ~ N 0 (  ,  )  .
2


Несложные преобразования приводят к выражениям вида
1    
 2  1  
  erf 
 , b  0,
  erf 

2

2
2





 
Pr(S N  b)  
(1)


1
2
b

2


1
2
b

2


1




  erf

    2 2   erf  2 2  , b  1,2,...,

 
Где erf (z ) - функция Лапласа (функция ошибок):
erf ( x) 
А
2

z
t
 e dt ,
2
0
 - нормирующий коэффициент, равный
 
 2
  1  erf 

.

Рис. 1. Функция распределения дискретной случайной величины S N и
усеченной слева по нулю нормально распределенной случайной величины при
  3 и   2.
На рис. 1 изображены функции распределения дискретной случайной величины S N и непрерывной величины N 0 (  ,  ) при   3 и   2 .
Аналогичную процедуру округления несложно выполнить и для подчиняющейся
гамма-распределению
непрерывной
случайной
величины
 ~ G( ,  ) , где параметры формы и масштаба определены как    2 /  2 и
   2 /  . Отметим, что усечение делать не нужно, поскольку   0 . Функция
распределения полученной в результате дискретной случайной величины S Г
«округленного» гамма-распределения будет иметь вид:

 

Г

,



2 2 

1 
, b  0,
Г  

Pr(S Г  b)  
(2)
 Г   , (2b  1)    Г   , (2b  1)  
 
2 2 
2 2 

, b  1,2,...,

Г  

2
2
где    /  , Г   - гамма-функция, а Г  , z  - неполная гамма-
функция

Г ( )   t

e dt , Г ( , z )   t  1e t dt .
 1  t
z
0
На рис. 2 изображены функции распределения дискретной случайной величины S Г и непрерывной величины Г ( ,  ) при   3 и   2 .
Рис. 2. Функция распределения дискретной случайной величины S Г и непрерывной случайной величины, распределенной по гамма-распределению при
  3 и   2.
Для получения представленных аналитических и числовых результатов
были использованы возможности компьютерной математической среды Wolfram Mathematica 8. Например, для вычисления вероятности событий применялась встроенная функция
.
При построении «округленного» нормального распределения имеем:
Для «округленного» гамма-распределения:
Два новых типа распределения дискретной случайной величины, построенных в результате округления и усечения непрерывных случайных величин
предложены в статье. Эти распределения дают возможность более адекватно
учесть характеристики неограниченного спроса и могут быть использованы, в
частности, для моделирования процесса восстановления спроса. Для получения
аналитических и числовых результатов была применена математическая среда
Wolfram Mathematica 8.
Список литературы
1.
Лапина М.Г., Носова Е.В., Фридман Г.М. Сравнение статистических
и эвристических методов восстановления общего пассажирского спроса по
данным о количестве продаж авиабилетов// Финансы и бизнес, 2011. № 3.
C. 142-149.
2.
Лапина М.Г. Оценка параметров нормально распределенной слу-
чайно величины по ее цензурированной выборке// В мире научных открытий,
2010. №4 (10). Часть 11. С. 72-75.
3.
Talluri Kalyan T., Van Ryzin Garrett J. The theory and practice of Reve-
nue Management. Kluwer Academic Publishers. Boston. 2004. P.474-478, 485-486.
4.
Weatherford L. R., Polt Stefan. Better unconstraining of airline demand
data in revenue management systems for improved forecast accuracy and greater revenues// Journal of Revenue and Pricing Management. 2002. Vol.1. № 3. P. 234-254.
5.
Zeni Richard H. Revenue Management by unconstraining demand esti-
mates from censored data. PhD dissertation. Newark, New Jersey. 2001.
References
1.
Lapina M.G., Nosova E.V., Fridman G.M. Sravnenie statisticheskikh i
evristicheskikh metodov vosstanovleniya obshchego passazhirskogo sprosa po
dannym o kolichestve prodazh aviabiletov [A comparative analysis of statistical
methods and heuristics for airline passenger demand unconstraining]. Finansy i
biznes, no. 3 (2011): 142-149.
2.
Lapina M.G. Otsenka parametrov normal'no raspredelennoy sluchayno
velichiny po ee tsenzurirovannoy vyborke [The distribution parameters estimation of
a random normal variable using its constraining sample]. V mire nauchnykh otkrytiy,
vol. 11, no. 4(10) (2010): 72-75
3.
Talluri Kalyan T., Van Ryzin Garrett J. The theory and practice of Rev-
enue Management. Boston: Kluwer Academic Publishers, 2004. 474-478, 485-486.
4.
Weatherford L. R., Polt Stefan. Better unconstraining of airline demand
data in revenue management systems for improved forecast accuracy and greater
revenues. Journal of Revenue and Pricing Management, vol.1, no. 3 (2002): 234-254.
5.
Zeni Richard H. Revenue Management by unconstraining demand esti-
mates from censored data. PhD dissertation. Newark, New Jersey, 2001.
Данные об авторах
Фридман Григорий Морицович, доктор технических наук, профессор
кафедры Экономической кибернетики и математических методов в экономике
Санкт-Петербургского государственного университета экономики и финансов,
ул. Садовая, 21, г. Санкт-Петербург, 191023, Российская Федерация, grifri@finec.ru
Лапина Мария Геннадьевна, преподаватель кафедры экономической
теории НИУ Высшая Школа Экономики в г. Санкт-Петербурге, ул. Союза Печатников, 16, Санкт-Петербург, 190008, Российская Федерация, mlapina@hse.spb.ru
Data about the authors
Fridman Grigoriy Moritsovich, Doctor of Engineering Science, professor,
St. Petersburg State University of Economics and Finance , 21, Sadovaya street,
Saint-Petersburg, 191023, Russian Federation, grifri@finec.ru
Lapina Maria Gennadyevna, lecturer, High School of Economics in St. Petersburg, 16, Souza Pechatnikov street, Saint-Petersburg, 190008, Russian Federation, mlapina@hse.spb.ru
Сведения о рецензенте:
Рыжов Владимир Александрович, доктор технических наук, профессор
кафедры
Прикладной
математики
и
математического
моделирования
Санкт-Петербургского государственного морского технического университета,
ул. Лоцманская, 3, Санкт-Петербург, 190008, Российская Федерация.
Скачать