Задача. По территориям Сибирского и Дальневосточного федеральных округов известны денежные доходы и потребительские расходы в расчете на душу населения (файл Лабораторная работа 1. Xlsx) за июнь 2009 года Требуется: 1) построить поле корреляции, добавить линию тренда линейного типа с выводом уравнения на график, 2) рассчитать параметры уравнения линейной регрессии, зависимости потребительских расходов от денежного дохода, 3) оценить тесноту связи с помощью показателя детерминации, 4) оценить статистическую надежность результатов регрессионного моделирования с помощью F- критерия Фишера, 5) оценить качество уравнений с помощью средней ошибки аппроксимации, 6) оценить значимость параметров регрессии с помощью t-критерия Стьюдента и путем расчета доверительного интервала каждого из показателей. Решение (рекомендации) В главном меню выберем Анализ данных/Регрессия. Заполним диалоговое окно ввода данных и параметров вывода: входной интервал Y – диапазон, содержащий данные результативного признака, входной интервал X – диапазон, содержащий данные факторов независимого признака, метки – флажок, который указывает, содержит ли первая строка названия столбцов или нет, константа – ноль – флажок, указывающая на наличие или отсутствие свободного члена в уравнении, выходной интервал – левая верхняя ячейка диапазона вывода результатов исследования, В итоге получим таблицу результатов исследования: ВЫВОД ИТОГОВ Регрессионная статистика Множест. R R-квадрат 0,785588626 0,61714949 Нормир. R-кв. 0,569293176 Ст. ошибка Наблюдения 0,503435237 10 Дисперсионный анализ df SS MS Регрессия 1 3,268423699 3,268423699 Остаток Итого 8 9 2,027576301 5,296 0,253447038 Коэффициенты a b 16,40465876 -0,000117801 Ст. ошибка t-стат. 0,317061236 51,73971742 3,28037E-05 -3,591084015 F 12,8958844 P-Значение 2,15755E-11 0,007073334 Значимость F 0,007073334 Нижние 95% Верхние 95% 15,67351424 17,13580328 -0,000193446 -4,21553E-05 2) Из последней таблицы получаем значения коэффициентов a и b парной линейной регрессии: a=16,4047, b=-0,0001. Уравнение регрессии имеет вид y=16,40470,0001x. 3) Из первой таблицы имеем R2≈0,617. Таким образом, уравнением регрессии объясняется 61,7% дисперсии результативного признака, а на долю прочих факторов приходится 38,3% . 4) 1 способ.Значение Fкритерия находится во второй таблице Fфакт=12,9>Fтаб(0,05;m;n-2)= Fтаб(0,05;1;8)=5,3, значит, Но - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается статистическая значимость и надежность уравнения регрессии. 2 способ. По p-значению p(F) («Значимость F») делаем вывод статистической значимости уравнения регрессии: 0,007073334< (где 0,05 -уровень значимости), значит, Но - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается статистическая значимость и надежность уравнения регрессии. 5) Используя значения остатков, найдем коэффициент аппроксимации yi yi 1 A 100% . п yi Допустимые пределы средней ошибки аппроксимации 8-10%, 6) Значения t-критерия для параметров a и b возьмем из последней таблицы: ta=51,74, tb=3,59. C помощью функции СТЬЮДРАСПОБР найдем табличное значение t-критерия tтаб(0,05;n-2). ta> tтаб , | tb |> tтаб. Если фактические значения t-критерия превышают табличное, гипотезу о несущественности коэффициентов можно отклонить. Доверительный интервал для параметров a и b берем также из последней таблицы: 15,67351<a<17,13580; -0,00019<b<-0,00004. Таким образом, с вероятностью 0,95 параметры a и b, находясь в указанных границах, не принимают нулевых значений, не являются статистически незначимыми.