Лингвистика глазами экономики и теории игр Филатов А.Ю. Институт систем энергетики им.Л.А.Мелентьева, Иркутский государственный университет http://math.isu.ru/filatov, http://polnolunie.baikal.ru/me, http://fial_.livejournal.com, alexander.filatov@gmail.com Неоднородность Уровень людей: индивидуальные ценности и интересы, доходы и потребности Уровень стран: история, идеология, культура, доминирующая религия, титульная нация, экономика, язык… ## Альтруистическое поведение распространено в однородных группах США: бедные – другие (перераспределение меньше); Западная Европа: бедные – несчастные (перераспределение больше). Разнообразие – хорошо (культурный и технический прогресс, экономич.рост). Поляризация – плохо (разобщенность, дестабилизация, войны…). (2,2,2) и (3,0,3). Первая – более неоднородна, вторая – более поляризована. Поляризация общества наблюдается, если имеют место следующие свойства: 1. Высокая степень однородности внутри каждой группы. 2. Высокая степень неоднородности между группами. 3. Число групп индивидуумов – небольшое, а численность групп – большая. 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 разнообразие поляризация 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 поляризация поляризация Общественный антагонизм N N – население, разделенное на k групп по Ni человек. Доля si i , N 0 , , . – матрица расстояний, T ij 0; 1 ii ij ji ij ik kj n s i 1 i 1. Варианты формул для расстояния: T d ij , ij 1, i j – дихотомическое расстояние. T c ij , ij 0, i c, j c – важно расстояние между центром и периферией. Возможный вариант – расстояние между языками. Отчуждение (alienation) представителя i-группы к представителю j-группы, возрастает при ij , часто просто равняется расстоянию. Вовлеченность (identification) – увеличивается при росте размера группы, часто sj , 0, иногда допускается α = 0. Индивидуальный антагонизм к представителю j-группы = si ij . Индивидуальный антагонизм ко всей j-группе = si s j ij . 1 Антагонизм i-группы к j-группе = si s j ij . n n 1 Общественный антагонизм (Esteban, Ray’ 1994): A , si s j ij . i 1 j 1 Измерение неоднородности ELF (этнолингвистическая фрагментация; Shannon’ 1949) – индекс разнообразия; вероятность двух индивидов относиться к разным группам; 0 – однородное общество, 1– максимально разобщенное k ELF A0, T d 1 si2 . При росте числа групп k ELF увеличивается. i 1 При фиксированном k ELF max при s1 s2 ... sn . RQ (индекс поляризации; Reynal-Querol’ 2002) k RQ A 1, T d 1 si2 1 si . i 1 GI (Greenberg’ 1956) – ожидаемое расстояние между двумя случайными представителями разных групп k k GI A0, T si s j ij . i 1 j 1 ER (Esteban, Ray’k 1994) k k k ER A1, T s s . Вариация: ER A , T si1 s j ij , 1; 1,6. i 1 j 1 2 i j ij i 1 j 1 PH (периферийнаяk гетерогенность; Desmet, Ortuno-Ortin, Weber’ 2009) PH A0, T c 2 si sc ic . С – максимально центральная группа. i 1 Отчуждение – только между центром и периферией. Расстояние между языками Расстояния необходимо принимать во внимание! ## Андорра: каталонский (50%) + испанский (50%) – похожие романские языки Бельгия: голландский (60%, герм.группа) + французский (40%, роман.группа) Бельгия более неоднородна, чем Андорра; индексы ELF, RQ – наоборот! Becker’ 1957 – важно не только свой / чужой, но и насколько чужой! Попутно решается проблема разграничения одинаковых и различных групп ## Мексика – 291 язык, Венецианский ≈ итальянский… Методы построения матрицы расстояний 1. Fearon’ 2003 – метод, основанный на лингвистических деревьях ij 1 l m , где l – число общих ветвей, m – общее число ветвей. 2. Dyen’ 1992 – метод, основанный на доле общих корней 95 индоевропейских языков, 200 основных понятий (списки Сводеша) nij0 nij0 – число несовпадений корней, ij 0 1 – расстояние. 1 nij nij nij – число совпадений корней. ij 0 – абсолютно совпадающие языки, ij 1 – абсолютно различные языки. Эмпирические исследования Разнообразие: r (ELF, GI) = 0,69, однако 1. Латинская Америка более диверсифицирована с учетом расстояния (есть индоевропейские языки + языки индейских племен). ## Боливия (+54 места), Мексика (+69), Эквадор (+68). 2. Африка – более однородна (много похожих языков). ## Мозамбик (–163), Замбия (–146), Ангола (–128), Того (–126). 3. Европа – по-разному. ## Эстония (+71 – русские), Болгария (+65 – турки), Россия (+57), Андорра (–102 – испанцы и каталонцы). Поляризация vs разнообразие: r (ER, GI) = 0,87, однако ## Папуа - Новая Гвинея – 829 мелких языковых групп, GI(4) (диверсифицирована) ER(186) (не поляризована). Периферия и центр: r (PH, GI) = 0,93. Индекс важен при недостатке данных (нужны расстояния только до центра). Резюме: GI~ER~PH > ELF~RQ. Неоднородность значима в моделях, учитывающих расстояние. Рост неоднородности на сокращение перераспределения на 10%. Евросоюз и задача выбора официальных языков не зона Евро ЕС не ЕС Шенген Швеция Норвегия не Шенген Болгария Албания зона Евро ЕС не ЕС Шенген Франция Сан-Марино не Шенген Кипр Черногория До 2004 г. – 15 государств Австрия, Бельгия, Великобритания, Германия, Греция, Дания, Ирландия, Испания, Италия, Люксембург, Нидерланды, Португалия, Финляндия, Франция, Швеция. 2004 г. – 25 государств (+10) Венгрия, Кипр, Латвия, Литва, Мальта, Польша, Словакия, Словения, Чехия, Эстония. 2007 г. – 27 государств (+2), 23 государственных языка Болгария, Румыния. Дилемма: Малое число официальных языков – ущемление. Большое число официальных языков – высокие затраты (переводчики, задержки, ошибки и разночтения,…) 8 групп, представленных в ЕС 1. 2. 3. 4. 5. 6. 7. 8. Английский язык. Германская группа (немецкий, голландский, шведский, датский). Итальянская группа (французский, итальянский, испанский, португал., румынский). Славянская группа (словенский, чешский, словацкий, польский, болгарский). Балтийская группа (литовский, латышский). Греческий язык. Ирландский язык. Неиндоевропейские языки (финский, эстонский, венгерский, мальтийский). Табл. 1. Число граждан Евросоюза, говорящих на различных языках Язык Английский Немецкий Французский Итальянский Испанский Польский Голландский Румынский Русский Родной, млн.чел. Говорят, млн.чел. Говорят / родной 62,4 85,3 60,7 57,7 39,7 39,2 21,9 21,0 4,2 182,6 121,7 97,2 64,8 54,1 40,9 24,0 22,2 22,4 2,93 1,43 1,60 1,12 1,36 1,04 1,10 1,06 5,33 Расстояние между языками (Dyen) Табл. 2. Матрица расстояний между языками IT FR SP PT GE NL SW DA EN LI LA SV CZ SK PL GR RU UA IT 0 0,20 0,21 0,23 0,73 0,74 0,74 0,74 0,75 0,76 0,78 0,76 0,75 0,75 0,76 0,82 0,76 0,77 FR 0,20 0 0,27 0,29 0,76 0,76 0,76 0,76 0,76 0,78 0,79 0,78 0,77 0,76 0,78 0,84 0,77 0,78 SP 0,21 0,27 0 0,13 0,75 0,74 0,75 0,75 0,76 0,77 0,79 0,77 0,76 0,75 0,77 0,83 0,77 0,78 PT 0,23 0,29 0,13 0 0,75 0,75 0,74 0,75 0,76 0,78 0,80 0,78 0,76 0,76 0,78 0,83 0,77 0,78 GE 0,73 0,76 0,75 0,75 0 0,16 0,30 0,29 0,42 0,78 0,80 0,73 0,74 0,74 0,75 0,81 0,76 0,76 NL 0,74 0,76 0,74 0,75 0,16 0 0,31 0,34 0,39 0,79 0,80 0,75 0,76 0,75 0,77 0,81 0,78 0,79 SW 0,74 0,76 0,75 0,74 0,30 0,31 0 0,13 0,41 0,78 0,79 0,75 0,75 0,74 0,76 0,82 0,75 0,76 DA 0,74 0,76 0,75 0,75 0,29 0,34 0,13 0 0,41 0,78 0,80 0,73 0,75 0,73 0,75 0,82 0,74 0,76 EN 0,75 0,76 0,76 0,76 0,42 0,39 0,41 0,41 0 0,78 0,80 0,75 0,76 0,75 0,76 0,84 0,76 0,78 LI 0,76 0,78 0,77 0,78 0,78 0,79 0,78 0,78 0,78 0 0,39 0,66 0,62 0,60 0,64 0,83 0,62 0,63 LA 0,78 0,79 0,79 0,80 0,80 0,80 0,79 0,80 0,80 0,39 0 0,68 0,67 0,64 0,67 0,85 0,64 0,64 SV 0,76 0,78 0,77 0,78 0,73 0,75 0,75 0,73 0,75 0,66 0,68 0 0,34 0,31 0,37 0,82 0,39 0,36 CZ 0,75 0,77 0,76 0,76 0,74 0,76 0,75 0,75 0,76 0,62 0,67 0,34 0 0,09 0,23 0,84 0,26 0,24 SK 0,75 0,76 0,75 0,76 0,74 0,75 0,74 0,73 0,75 0,60 0,64 0,31 0,09 0 0,22 0,83 0,26 0,19 PL 0,76 0,78 0,77 0,78 0,75 0,77 0,76 0,75 0,76 0,64 0,67 0,37 0,23 0,22 0 0,84 0,27 0,20 GR 0,82 0,84 0,83 0,83 0,81 0,81 0,82 0,82 0,84 0,83 0,85 0,82 0,84 0,83 0,84 0 0,83 0,77 RU 0,76 0,77 0,77 0,77 0,76 0,78 0,75 0,74 0,76 0,62 0,64 0,39 0,26 0,26 0,27 0,83 0 0,22 UA 0,77 0,78 0,78 0,78 0,76 0,79 0,76 0,76 0,78 0,63 0,64 0,36 0,24 0,19 0,20 0,77 0,22 0 Индексы ущемления ni – родной язык i-человека, Li – множество языков, на которых он говорит, T – множество официальных языков Евросоюза. 0, ni T , 1, ni T . id , p равно 0, если родной язык человека является официальным языком Евросоюза, иначе 1. 0, Li T , равно 0, если человек говорит на одном из официальных 1 , L i T . языков Евросоюза, иначе 1. id , s i , p min ni , t tT равно минимальному расстоянию между родным языком и одним из официальных. равно минимальному расстоянию между одним из языlL i , tT ков, на котором говорит человек, и одним из официальных. * T – один из индексов ущемления (среднее по всем жителям значение). i ,s min l , t Двухкритериальная задача: * T min, T min . Наилучшие наборы офиц. языков Табл. 3. Доля граждан ЕС, не говорящих на соотв. языках, % Английский Немецкий Французский Итальянски й Испанский Польский Голландский Русский Всего 63 75 80 87 89 92 95 95 15-29 лет 30-44 лет 45-60 лет 45 59 68 74 75 76 78 81 80 87 87 92 95 96 87 89 92 95 95 87 90 92 95 95 Схема 1. Последовательность для индекса ущемления 1 > 60 лет 76 75 81 87 89 92 95 96 d ,s . Все население. EN 62,6 2 1+ GE 49,3 3 2+ FR 37,8 4 3+ IT 29,5 5 4+ SP 22,4 6 5+ PL 16,4 7 6+ RO 12,9 8 7+ HU 10,9 9 8+ PT 9,2 10a 9+ CZ 7,7 10b 9+ GR 7,7 10c 9+ RU 7,7 11 10a+ GR 6,2 12 11 + BG 5,0 13 12 + NL 4,0 14a 13 + FI 3,3 14b 13 + SW 3,3 15 14a+ SW 2,7 16a 15 + LT 2,2 16b 15 + SK 2,2 17 16a+ SK 1,7 18a 17 + LV 1,3 18b 17 + DA 1,3 19 18a+ DA 1,0 Наилучшие наборы офиц. языков Схема 2. Последовательность для индекса ущемления 1 EN 44,6 2 1+ FR 34,5 3 2+ GE 25,8 4 3+ IT 19,9 5 4+ SP 14,4 6 5+ PL 10,4 7 6+ RO 7,8 12 11a+ BG 2,3 13 12 + NL 1,8 14a 13 + RU 1,5 14b 13 + FI 1,5 14c 13 + SL 1,5 14d 13 + LT 1,5 14e 13 + LV 1,5 d ,s . Молодежь до 30 лет 8 7+ HU 6,3 9 8+ PT 5,1 10 9+ CZ 3,9 11a 10 + GR 3,1 11b 10 + BG 3,1 18 13 + FI / SK / LT / LV 0,7 Схема 3. Последовательность для индекса ущемления , s . Все население 1 2 3 4 5 6 7 8a 8b EN 43,1 1 + FR 24,0 2 + PL 16,6 3 + GE 11,4 4 + IT 9,0 5 + HU 6,9 6 + SP 5,2 7 + GR 4,0 7 + RO 4,0 10a 10b 10c 9 + CZ 2,1 9 + FI 2,1 9 + BG 2,1 12 10a + FI/BG 1,3 13a 12 + SW 1,1 13b 12 + PT 1,1 14 13a+ PT 0,9 9 8a + RO 2,9 Оптимальное число офиц. языков 70 60 , p 50 : GE GE+IT GE+IT+PL. всё население 40 молодежь 30 Зависимость индексов ущемления от числа официальных языков учет близости 20 10 0 1 2 3 4 5 6 7 8 9 10 Квалифицирован. большинство: 14 из 27 гос-в, 258 из 345 голос., 62% насел. Конституционное большинство: 15 государств, 65% населения. Закон Пенроуза: 62% голосов, пропорциональных корню из населения страны. Табл. 4. Минимальное число офиц. языков в зависимости от уровня ущемления Все население Молодежь до 30 лет С учетом близости r КвБ КоБ ЗП 10% 20% 30% 40% 50% 10% 20% 30% 40% 50% 10% 20% 30% 40% 50% 11 10 9 8 7 8 7 6 6 5 7 5 3 3 3 11 10 9 6 4 7 5 4 4 3 7 4 3 2 2 8 7 6 6 5 6 5 5 4 3 6 5 2 2 2 Теоретико-игровые постановки лингвистических моделей R. Selten, J.Pool, 1991: 1. На каких языках говорят люди? 2. Каковы выгоды от изучения языка? 3. Каковы издержки изучения языка? J. Church, I. King, 1993: 2 языка, одинаковые способности, нет разницы родной/приобретенный J. Gabszevicz, V. Ginsburgh, S. Weber, 2008: Различные способности к языкам V. Ginsburgh, A. Savvateev, S. Weber, 2008: 3 языка, в т.ч. вариант «эсперанто» V. Ginsburgh, I. Ortuno-Ortin, S. Weber, 2007: Есть разница родной/приобретенный, полезность зависит от расстояния между языками, эмпирическое исследование Модель Черча-Кинга, 1993 e0 – родной язык английский, f 0 – родной язык французский, e0 f 0 N , e0 f 0 . ê – число выучившихся англичан, fˆ – число выучившихся французов, Условия изучения иностранного языка: E : uN u e0 fˆ c, F : uN u f 0 eˆ c. Равновесные решения uN ue0 uN u f 0 c uN ue0 c uN u f 0 c uN ue0 uN u f 0 fˆ 0, eˆ 0. fˆ f , eˆ 0. fˆ f , eˆ 0, fˆ 0, eˆ e . 0 0 0 Общественное благосостояние WNL e0ue0 f 0u f 0 , WB NuN Nc, WB WEF WFE , WEF NuN e0c, WFE NuN f 0c. WNL WFE при c c*, c* uN ue0 e0 f 0 uN u f 0 . Эффективные решения Табл. 5. Эффективные и равновесные решения интервал 1 c uN ue0 интервал 2 интервал 3 интервал 4 c uN ue0 ; uN u f 0 c uN u f 0 ; c * FE эффективно FE / EF равновесны FE эффективно FE равновесно FE эффективно NL равновесно c c* NL эффективно NL равновесно Государство в состоянии регулировать долю изучающих язык: ux 0, uxx ux 1 c1 uN u f 0 e0uN , c2 uN u f 0 e0ue0 . Табл. 6. Эффективные и равновесные решения интервал 1 интервал 2 интервал 3 интервал 4 u N u e0 ; границы c uN u e0 c1; c2 u N u f 0 uN u f 0 ; c1 fˆ f 0 эффективно fˆ f 0 fˆ f 0 fˆ 0; f 0 fˆ f / eˆ e равновесно NL NL fˆ f 0 0 0 интервал 5 c c2 NL NL Модель Габжевича-Гинзбурга-Вебера, 2008 N i и N j – число жителей 2 стран, – «неспособность к языкам», равномерно распределенная на [0;1], Язык учит доля жителей страны, равная i : i 0; i i i . Полезность: u (x) = x, издержки: cii cii . i 1 j N j ci , j 1 i Ni c j . ci – выгоды от увеличения общения, нормированные на издержки. Ni N j Ni j N j cii , bi j N j Кривые реакции: i min 1 j bi j ; 1 , j min 1 i bij ; 1 . Равновесное решение: bij 1 bi j bi j 1 bij ; 1 . i * min ; 1 , j * min j i j i 1 bi b j 1 bi b j Равновесные решения j j j 1 1 1 i 1 bi j 1, bij 1 устойчивое внутреннее равновесие i * j * bi j b ij 1 bi j b ij j 1 i bi 1, j 1 bij 1 угловое равновесие i bi 1, j 1 bij 1 угловое равновесие i 1i bi 1, b j 1 j 2 угловых + + неустойчивое внутр. равновесие В стране, где выше выгоды, нормированные на издержки, выше и доля изучающих язык. Примеры: Канада, Бельгия. Эффективные решения i Ni Wi i , j 1 i N i N i j N j i N i N i N j ci d , 0 N i 1 Wi i , j N i2 N i N j i i j j ci i2 N i , 2 W i , j Wi i , j W j i , j 1 1 N i2 N 2j 2 N i N j i i j j ci i2 N i c j 2j N j . 2 2 i min 2bi j 1 j ; 1 , j min 2bij 1 i ; 1 . 1 1 1 bi 0,5, bij 1 0,5 1 i i j j j j j bi 0,5, j bij 1 0,5 i i bi 0,5, j bij 1 0,5 bi 0,5, j bij 1 0,5 Модель Гинзбурга, Савватеева, Вебера, 2008 Можно не ограничиваться 2 языками. 1) l0 и p0 – население 2 стран, в сумме составляющее N человек. 2) Сверхвысокие издержки изучения языков друг друга. 3) Существует третий язык R (эсперанто), издержки изучения которого равны c. 4) u(n) – функция полезности, зависящая от числа людей, с которыми возможен диалог. Равновесные решения lˆ 0, pˆ 0 – равновесие, выполняющееся при любых c>0 lˆ l0 , pˆ p0 – равновесие, выполняющееся при u N c u l0 u N c u p c u N max u l0 , u p0 0 При un n c min l0 , p0 . u l0 pˆ c u l0 – неустойчивое внутреннее равновесие ˆ u p0 l c u p0 Эффективные решения NuN cN l0u l0 p0u p0 , c u N l0 p u l0 0 u p0 . N N l p При un n равновесие l0 , p0 эффективно при c 2 0 0 N Равновесие (0; 0) Равновесие l0 , p0 c Эффективно l0 , p0 Возможные равновесия Ø F R F&R Ø + + – – F + – – – R – – + – F&R – – – – Модель Гинзбурга, Ортуно-Ортина, Вебера, 2007 N i и N j – число жителей 2 стран, N ij – число жителей i-страны, выучивших иностранный, Полезность: u N i , N j , Lij или u N i , N ji , Lij , издержки: cLij . Функция спроса на языки: Di N i , N j , Lij ln N ij N i – доля жителей i-страны, изучающих j-язык. Утверждение 1: Di N i , N j , Lij возрастает по N j . Утверждение 2: Di N i , N j , Lij убывает по N i . Утверждение 3: Di N i , N j , Lij убывает по Lij . Эмпирическое исследование Табл. 7. Доля населения стран ЕС, говорящих на наиболее распространенных языках Страна Родн. язык млн.чел. Австрия (GE) Великобрит. (EN) Германия (GE) Греция (GR) Дания (DA) Ирландия (EN) Испания (SP) Италия (IT) Нидерланды (NL) Португалия (PT) Финляндия (FI) Франция (FR) Швеция (SW) 100 341 100 12 5 341 340 62 20 176 6 77 9 Английский 46 100 54 47 75 100 36 39 70 35 61 42 79 Доли знающих язык, % Немецкий Французский 100 11 22 9 100 16 12 12 37 5 6 23 2 19 4 29 59 19 2 28 7 1 8 100 31 7 Испанский 1 5 2 5 1 2 100 3 1 4 1 15 4 Матрица расстояний между языками Табл. 8. Число говорящих на наиболее распространенных языках ЕС Язык Английский Немецкий Французский Испанский Родной, ЕС, млн.чел. 62,4 85,3 60,7 39,7 Родной, млн.чел. 341 100 77 340 Говорят, млн.чел. 1800 126 169 450 Табл. 9. Матрица расстояний между языками (*1000) Английский Голландский Греческий Датский Испанский Итальянский Немецкий Португальский Финский Французский Шведский Английский 0 392 838 407 760 753 422 760 1000 764 411 Немецкий 422 162 812 293 747 735 0 753 1000 756 305 Французский 764 756 843 759 266 197 764 291 1000 0 756 Испанский 760 742 833 750 0 212 747 126 1000 266 747 Регрессионные модели Nˆ iE ln 0,733* 0,153* ln N i 0,408 * ln Lij , 0, 016 0, 021 0, 082 Ni Rˆ 2 0,919. Nˆ iG ln 0,586* 0,361* ln N i 1,362* ln Lij , 0, 077 0, 072 0, 214 Ni Rˆ 2 0,910. Nˆ iF ln 0,193* 0,355* ln N i 0,512 ln Lij , 0,121 0,138 0, 416 Ni Rˆ 2 0,599. Nˆ iS ln 0,091 0,032 ln N i 0,560 ln Lij , 0,109 0,168 0,385 Ni Rˆ 2 0,232. ln Nˆ ij Ni 0,080 0,233* d G 0,112 d F 0,514* d S 0,100 0, 061 0, 062 0, 050 0,058 ln N i 0,625* ln N j 0,954 * ln Lij , 0, 069 0, 057 0, 200 Rˆ 2 0,758 . Регрессионные модели ln Nˆ ij Ni 0,070 0,340 * d S 0,055 ln N i 0, 096 0, 044 0, 070 0,600 * ln N j 0,789 * ln Lij 0,249 ln Trij , 0, 067 0, 205 0,134 Rˆ 2 0,712. Выводы по эмпирическому исследованию Высокая доля прогнозируемой вариации (76%). В больших странах меньше учат иностранные языки. Люди чаще учат более распространенные языки. Люди не склонны изучать языки, очень непохожие на их собственный. Огромная разница между отличными результатами для английского и немецкого, посредственными для французского и плохими для испанского. 6. Торговые связи частично объясняют различия. 7. Особое место Испании из-за того, что большинство носителей языка в Латинской Америке, а не в ЕС, а также из-за длительной изоляции. 1. 2. 3. 4. 5. Возможные направления применения подобных моделей Удобство, надежность, цена / совместимость 1. Операционные системы (Windows vs Linux). 2. Другие программные продукты (Word vs Tex). 3. Стандарты и форматы (mp3 vs ogg…). 4. Социальные сети (Odnoklassniki.ru vs Vkontakte.ru…). 5. Блоги (Livejournal.com vs Liveinternet.ru…). 6. Валюты, в т.ч. в резервах. 7. Тарифы, в т.ч. сотовых операторов. ……………………………………………………………… Важные вопросы: 1. Критическая доля пользователей, обеспечивающая переход к фактической монополии. 2. Минимальное количество пользователей, гарантирующее «невымирание». Спасибо за внимание! http://math.isu.ru/filatov, http://polnolunie.baikal.ru/me, http://fial_.livejournal.com, alexander.filatov@gmail.com