Gibrat’s Law for (All) Cities JAN EECKHOUT THE AMERICAN ECONOMIC REVIEW, 2004 Всеволод Андреев Нижний Новгород, 2012 The law of proportionate effect will therefore imply that the logarithms of the variable will be distributed following the [normal distribution]. —Robert Gibrat (1931) Распределение населения по географическим районам, которое непрерывно меняется, не является случайным. Существует сильная тенденция к агломерации. Реки, побережье и горы, возможно, сыграли решающую роль при возникновении ранних поселений. В настоящее время эволюция поселений представляет собой чрезвычайно сложный сплав стимулов и действий, исходящих от миллионов людей, предприятий и организаций. Однако имеются существенные трудности в описании мобильности населения. Трудность порождается двумя надежными эмпирическими закономерностями: 1. Крупнейшие города удовлетворяют закону Зипфа. 2. Темп роста городского населения не зависит от размера города: крупные города в среднем не растут быстрее или медленнее, чем маленькие города. Пропорциональный процесс роста (вторая закономерность) приводит к логнормальному распределению, а не к распределению Парето (т.е. закону Зипфа). Это установлено Gibrat (1931) и первоначально сформулировано астрономом Jacobus C. Kapteyn (1903): стохастический процесс роста, который является пропорциональным, приводит к асимптотически логарифмическому нормальному распределению. Цель статьи •Новое решение проблемы, связанной с двумя эмпирическими закономерностями. Это обеспечивает точное описание мобильности населения. •Выдвижение и исследование теории равновесия локальных внешних externalities. Зачем это надо? •Эффективно ли предоставлять субсидии из федерального бюджета малым городам для привлечения жителей? •Каков эффект от финансирования правительством местных перевозок в больших городах? Как решается? Данные переписи 2000 года содержат сведения по 25359 населённым пунктам, включая большие и малые города, деревни, ранжированные по населению от 1 до 8 миллионов. Ранее в литературе рассматривались только усеченные распределения, т.е. верхний хвост распределения из 135 крупнейших городов, что составляет 0,5% от текущей выборки и 30,2% от численности населения. Использование новых данных показало, что распределение всей выборки по размерам логнормальное и не по Парето. Кроме того, для наблюдений, для которых имеются данные переписи за 1990 год, рассчитаны темпы роста городов. Результаты подтверждают вторую закономерность, что рост не зависит от размера города. Как решается? Предложена теория локальных externalities. Как и в работе Lucas and Rossi-Hansberg (2002), города в этой модели характеризируются локальными externalities– как положительными производительными externalities, так и отрицательными потребительскими externalities (потери свободного времени в пробках). Эти externalities являются локальными, т.е. они оказывают влияние на население только в пределах города и обычно зависят от численности населения города. Однако, экономика отличается от Lucas and Rossi-Hansberg (2002), так как мобильность между городами и внутри городов разная. Локальные externalities в городах регулируют мобильность граждан между разными городами (т.е., нет externalities между городами). Как это случилось, что закон Зипфа многократно подтвержден в литературе, а в то время как действительное распределение логнормальное? FIGURE 1. DENSITY OF LOGNORMAL (PANEL A) AND PARETO (PANEL B) DISTRIBUTION I. The Empirical Size Distribution of Cities A.The Data В 2000 году 208 000 000 из 281 млн. человек (74%) жили в общей сложности в 25 359 местах. TABLE 1—TEN LARGEST CITIES IN THE UNITED STATES Rank City Population S SNY/S 1 New York, NY 8,008,278 1.000 2 Los Angeles, CA 3,694,820 2.167 3 Chicago, IL 2,896,016 2.753 4 Houston, TX 1,953,631 4.099 5 Philadelphia, PA 1,517,550 5.277 6 Phoenix, AZ 1,321,045 6.062 7 San Diego, CA 1,223,400 6.546 8 Dallas, TX 1,188,580 6.738 9 San Antonio, TX 1,144,646 6.996 10 Detroit, MI 951,270 8.419 Note: SNY /S denotes the ratio of population size relative to New York. TABLE 2—TEN LARGEST METROPOLITAN AREAS (MA) IN THE UNITED STATES Rank MA Population S SNY/S 1 New York-Northern New Jersey-Long Island, NYNJ-CT-PA 21,199,865 1.000 2 Los Angeles-Riverside-Orange County, CA 16,373,645 1.295 3 Chicago-Gary-Kenosha, IL-IN-WI 9,157,540 2.315 4 Washington-Baltimore, DC-MD-VA-WV 7,608,070 2.787 5 San Francisco-Oakland-San Jose, CA 7,039,362 3.012 6 Philadelphia-Wilmington-Atlantic City, PA-NJ-DEMD 6,188,463 3.426 7 Boston-Worcester-Lawrence, MA-NH-ME-CT 5,819,100 3.643 8 Detroit-Ann Arbor-Flint, MI 5,456,428 3.885 9 Dallas-Fort Worth, TX 5,221,801 4.060 10 Houston-Galveston-Brazoria, TX 4,669,571 4.540 According to the Census Bureau definition, an MA “must include at least one city with 50,000 or more inhabitants, or a Census Bureau–defined urbanized area (of at least 50,000 inhabitants) and a total metropolitan population of at least 100,000 (75,000 in New England).” In 2000, 80% of the entire U.S. population lived in 276 MAs. B. The Size Distribution FIGURE 2. EMPIRICAL AND THEORETICAL DENSITY FUNCTIONS FIGURE 3. EMPIRICAL AND THEORETICAL CUMULATIVE DENSITY FUNCTIONS Over the entire size distribution, the median city has a population of 1,338. The sample mean (in ln, standard error in brackets) is ̂ 7.28 (0.01) and the standard deviation is ̂ 1.75. The theoretical density function of the lognormal size distribution is normal in lnS and given by ˆ , ˆ 1 exp ln S ˆ 2ˆ 2 ˆ 2 .A Kolmogorov-Smirnov (KS) test of goodness of fit of the empirical density function against the lognormal with sample mean ̂ 7.28 and sample standard deviation ̂ 1.75 generates the KS test statistic D=0.0189, and the corresponding p-value obtained is 1%. C. Proportionate City Growth FIGURE 4. SCATTER PLOT OF CITY GROWTH AGAINST CITY SIZE Использованы данные о численности населения для мест (places) в Соединенных Штатах по переписям 1990 и 2000 годов. Размер выборки существенно меньше (19361 мест вместо 25359). Выполняется непараметрическая регрессия роста от размера. Регрессионное соотношение gi mSi i , i=1, ..., 19361. g i is the normalized growth rate, i.e., the difference between growth and the sample mean, divided by the sample standard deviation; Si is the log of the population size of a city. Цель состоит в том, чтобы обеспечить приближение неизвестных отношений между ростом и размером с помощью сглаживания, без параметрического предположения о функциональной форме mSi FIGURE 5. SURFACE PLOT: KERNEL DENSITY ESTIMATION OF NORMALIZED GROWTH RATES BY DECILE OF THE SIZE DISTRIBUTION Each stochastic kernel is calculated using the bandwidth derived with the automatic method corresponding to the Gaussian distribution (see Bernard W. Silverman, 1986). FIGURE 6. CONTOUR PLOT: KERNEL DENSITY ESTIMATION OF NORMALIZED GROWTH RATES BY DECILE OF THE SIZE DISTRIBUTION Темпы роста поразительно стабильны по различным децилям. FIGURE 7. KERNEL ESTIMATE OF POPULATION GROWTH (BANDWIDTH 0.5) FIGURE 9. CITY SIZE DISTRIBUTION AND LINEAR REGRESSION LINE Спасибо за внимание!