Федеральное агентство по образованию РФ Государственное образовательное учреждение высшего профессионального образования «НОВГОРОДСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ имени ЯРОСЛАВА МУДРОГО» Институт экономики и управления Кафедра статистики и экономико-математических методов Реферат на тему: «Предмет и основные задачи прикладной статистики» Выполнил: Студент III курса, гр. № 8541 Чуклин Станислав Игоревич Проверила: Доцент, Кафедра математического анализа Манова Наталия Васильевна Великий Новгород 2010 Тема: 2.1. Предмет и основные задачи прикладной статистики Предмет прикладной статистики. Отношение прикладной статистики к другим профессиональным дисциплинам. Методология прикладной статистики. Закон больших чисел. Основные задачи прикладной статистики. 1. Предмет прикладной статистики 2. Методология прикладной статистики 3. Основные задачи прикладной статистики Статистическая наука сложилась в результате теоретических обобщений накопленных человечеством опыта учетно-расчетных работ, обусловленных потребностями управления обществом. Термин «статистика» произошел от латинских слов stato (государство) status (положение вещей, политическое состояние). Объектом исследования прикладной статистики как науки являются: 1) общество; 2) массовые социально-экономические явления; 3) влияние природных и технических факторов на изменение количественных характеристик социально-экономических явлений; 4) влияние жизнедеятельности общества на среду обитания. Предметом прикладной статистики выступают количественные характеристики и соотношения качественно определенных социальноэкономических явлений, закономерности их связей и развития в конкретных условиях места и времени. Основой для разработки и применения статистической методологии (совокупности методов и приемов) является диалектический метод познания, когда общественные явления и процессы рассматриваются в развитии, взаимной связи и причинной обусловленности. Прикладная статистика опирается на диалектические категории: 1) случайного и необходимого; 2) единичного и массового; 3) индивидуального и общего; 4) причинность и закономерность. Многообразие статистических методов обусловлено сложностью объекта и сложностью и многоэтапностью трех стадий исследования экономических явлений: 1 стадия – сбор первичной информации – метод массового статистического наблюдения, обеспечивающий репрезентативность информации; 2 стадия – сводка, группировка, обработка первичной информации – метод статистических группировок математической статистики и теории вероятности; 3 стадия – обобщение и интерпретация статистической информации – метод обобщения и анализа на основе показателей абсолютных относительных и средних величин, вариаций динамики, индексов. На всех стадиях применяются графические, табличные и математические методы. Задачи прикладной статистики в современных условиях: 1) исследование происходящих в обществе преобразований социальных и экономических процессов на основе системы специальных показателей; 2) обобщение и прогнозирование тенденций развития народного хозяйства и его составляющих; 3) влияние имеющихся резервов эффективности общественного производства; создание единого информационного пространства органов государственной власти; организация статистики отраслей народного хозяйства и общества (прикладной статистики). 4) 5) 4. Закон больших чисел Под законом больших чисел в широком смысле понимается общий принцип, согласно которому, по формулировке академика Колмогорова, совокупное действие большого числа случайных факторов приводит к результату, почти не зависящему от случая. Или иначе: При большом числе случайных величин их средней результат перестает быть случайным и может быть предсказан с большой степенью определенности. Под законом больших чисел в узком смысле понимается ряд математических теорем, в каждой из которых для тех или иных условий устанавливается факт приближения средних характеристик большого числа испытаний к некоторым определенным постоянным. Неравенство Чебышева: для любой случайной величины, имеющей математическое ожидание M(X) и дисперсию D(X) справедливо: P x H x D( x) , 2 (4.1) или P ( x M ( x ) ) 1 D( x) , (4.2) 2 Если формула (6.1) устанавливает верхнюю границу рассматриваемого события, то (4.2) – нижнюю границу вероятности события, состоящего в том, что отклонения значения случайной величины от математического ожидания D( x) не превысит (не будет менее) величины 2 , где 2 – достаточно малая величина. В приложении к выборочному методу неравенство Чебышева может быть сформулировано так: при неограниченном увеличении числа наблюдений ( n ) в генеральной совокупности с ограниченной дисперсией с вероятностью близкой к единице можно ожидать, что отклонение ~ выборочной средней ( X ) от генеральной средней X будет сколь угодно ~ мало: P(( Х Х ) ) 1 при n . Эту вероятность в теореме А.М. Ляпунова (1901г.) используют для определения ошибки наблюдений. ~ P( Х Х t x ) F (t ) , (4.3) где F (t ) - нормированная формула Лапласса. – средняя квадратическая или стандартная ошибка выборки. t2 t2 1 t 2 2 t 2 F (t ) * e dt e dt . (4.4) 2 t 2 0 Пусть надо измерить некоторою величину, истинное значение которой равно a. Пусть результат каждого измерения – случайная величина Xi (i=1,2,…,n). Если при измерениях отсутствует систематические погрешности, то M(Xi)=a при любом i. Тогда средняя арифметическая результатов и измерений сходится по вероятности к истинному значению a. n Xi i 1 n a; (4.5) Дисперсия средней случайной величины Xi равна n Xi D i 1 n 2 n 1 D X 1 n 2 ; i 2 n2 n i 1 n Среднее квадратическое отклонение ошибок выборки (4.6) 2 x , n n (4.7) ~ x ~x x ~ x ~x . (4.8). Зная выборочную среднюю X и предельную ошибку выборки x ~ можно определить границы, в которых размещена генеральная средняя X . Величина средней квадратической ошибки простой случайной повторной выборки может быть определена по формуле: 2 x , (4.9) n т.е. чем больше вариация признака в генеральной совокупности, тем больше ошибка выборки. Величину t x называют предельной ошибкой для определения значения вероятности. Если требуется оценить среднюю генеральной совокупности ~ X с вероятностью 0,9545, то надо получить значение выборочной средней x x 2 x ) Ft 2 0,9545 (функция Лапласа). из соотношения P( ~ Для выборки объема n 30 предельная ошибка x t x может быть 2 определена из соотношения x t . n t 1,00 1,96 2,00 2,58 3,00 F(t) 0,683 0,9500 0,9545 0,9901 0,9973 x 3 x – это предел возможной ошибки (правило «трех сигм»). Формула предельной ошибки выборки используется не только для оценки пределов, в которых находится изучаемый признак в генеральной совокупности, но и для определения необходимого объема выборки при заданной ее ошибке. Третий тип задач, которые могут быть решены с использованием предельной ошибки выборки, – это определение вероятности, с которой можно гарантировать, что ошибка выборки не выйдет за заданные пределы. Величина дисперсии генеральной совокупности ген принципиально не известна и можно говорить лишь о ее оценке по результатам одной выборки. xi x 2 n 2 i 1 n 1 –для простой случайной выборки. При n 30 , поправка г в * n становится 3,5% (30/(30-1)), n 1 поэтому ею можно пренебречь. Выборочное наблюдение Наименование показателя Вид выборки повторная Случайная выборка Средняя (стандартная) ошибка Средняя признака ошибка доли Объем выборки Х Объем выборки t 2 2 n 2 2i n n t 2 2i Серийная выборка Средняя ошибка Объем выборки n p(1 p) n Х Типическая выборка Средняя ошибка 2 Х 2 2 s t 2 2 s 2 бесповторная 2 n Х Х n 1 N p(1 p) n 1 n N t 2 2 N n 2 N t 2 2 2i n 1 n N n t 2 2i N 2 N t 2 2i Х 2 s 1 s S t 2 2 S s 2 S t 2 2 Величина ошибки зависит от колеблемости признака в генеральной совокупности и от объема выборки. Т.е. чем больше вариация тем больше ошибка, чем больше выборка, тем меньше ошибка. Величину t Х~ называют предельной ошибкой выборки. Следовательно, предельная ошибка выборки Х~ t Х~ , т.е. предельная ошибка равна t-кратному числу средних ошибок выборки. t – коэффициент доверия n – объем выборки; N – объем генеральной совокупности; s - число отобранных серий; S – общее число серий; i - средняя из групповых дисперсий; - межгрупповая дисперсия. 5. Отношение прикладной статистики к другим профессиональным дисциплинам Прикладная статистика с одной стороны, является отраслью математических знаний, с другой стороны, разрабатывает национальные способы систематизации и анализа эмпирических данных, доставляемых наблюдением массовых явлений, для установления статистических закономерностей этих явлений, в связи с чем является базой для ряда профессиональных дисциплин, таких как бухгалтерский учет, экономика промышленности, экономика труда и др., входит в блок профессиональных дисциплин, базируется на основных понятиях математики, математической статистики и теории вероятности и является основной дисциплиной для изучения методов экономического анализа.