Загрузил София Пушкарь

1326M Pushkar kr2 ПОШАГОВАЯ МНОЖЕСТВЕННАЯ РЕГРЕССИЯ В СТАТГРАФ

реклама
МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ
ФЕДЕРАЦИИ
федеральное государственное автономное образовательное учреждение высшего
образования
«САНКТ–ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
АЭРОКОСМИЧЕСКОГО ПРИБОРОСТРОЕНИЯ»
КАФЕДРА №11
ОТЧЕТ
ПРЕПОДАВАТЕЛЬ
канд. техн. наук, доцент
должность, уч. степень, звание
подпись, дата
В. В. Перлюк
инициалы, фамилия
ОТЧЕТ О КОНТРОЛЬНОЙ РАБОТЕ №2
ПОШАГОВАЯ МНОЖЕСТВЕННАЯ РЕГРЕССИЯ В СТАТГРАФ
по дисциплине: Информационные технологии в приборостроении
РАБОТУ ВЫПОЛНИЛ
СТУДЕНТ ГР. №
1326М
подпись, дата
Санкт–Петербург 2023
С. Н. Пушкарь
инициалы, фамилия
1. Задание
Пошаговая множественная регрессия применяется для минимизации
количества независимых переменных, входящих в исследуемую модель.
Известно много подходов к такой минимизации.
Цель учебного задания заключается в определении существенных
связей между количественными критериальными показателями Z1…Z10 и
условно независимыми признаками X1…X12. В рамках учебного задания
следует реализовать в программе StatGraphics две наиболее популярные
процедуры: последовательное увеличение и последовательное уменьшение
группы независимых переменных. Рассматриваемый пример относится к
одной из наиболее важных и интересных проблем современных научных
исследований
больших
Представленный
данных
пример
методов
искусственного
интеллекта.
демонстрирует
эффективность
процедур
последовательного увеличения и уменьшения группы переменных при
построении моделей множественной регрессии. Удастся подбирать модели,
содержащие гораздо меньше переменных но сравнению с исходным
множеством
и
имеющие
Незначительное
количество
лучшие
статистические
переменных
(2-3)
характеристики.
позволяет
легко
интерпретировать содержание регрессионных моделей.
2. Практическая часть
2.1.
Исходные значения
При выполнении учебного задания следует оценить эффективность
процедур последовательного увеличения и уменьшения группы переменных
при построении моделей множественной регрессии, используя оценку
статистической
значимости
детерминации)
и
статистику
построенной
модели
(оценивающую
(коэффициент
улучшение
оценки
критериального показателя по сравнению с тривиальным назначением
2
среднего значения). Задание следует выполнить в программе StatGraphics по
соответствующему варианту (Вариант 10).
Таблица 1 – Таблица значений по варианту 10
2.2.
Составление уравнения регрессии для каждого Z
1. Для нахождения зависимости параметров Z от параметров X сначала
перенесем данные в StatGraphics (рис.1).
Рисунок 1 – Таблица значений независимых и зависимых показателей в
StatGraphics
2. С помощью функции Multiple Regression во вкладке Relate составим
множественную регрессию для всех Z (рис.2). Для этого выберем один
зависимый параметр и независимые параметры X1-X12.
3
Рисунок 2 – Пример составления множественной регрессии Z1
4
3. Щелкнем правой кнопкой мыши и выберем из появившегося меню
пункт Analysis Options. В разделе Fitting Procedure окна диалога установим
переключатель в положение Forward Selection (алгоритм последовательного
увеличения группы переменных). Все остальное оставим без изменений (рис.
3).
Рисунок 3 – Пример составления алгоритма последовательного увеличения
группы переменных для Z1
Как видно из таблиц, построена регрессионная модель, обладающая
высокой
статистической
значимостью
и
объясняющая
почти
36,3%
дисперсии зависимой переменной Z1.
4. Опробуем теперь процедуру с последовательным увеличением
группы переменных. Выберем Analysis Options в контекстном меню.
Установим переключатель Fitting Procedure в положение Backward Selection и
снимем флажок Costant in Model. Остальные элементы управления оставим
без изменений (рис. 4).
5
Рисунок 4 – Пример составления алгоритма последовательного уменьшения
группы переменных для Z1
Видно, что построенная регрессионная модель обладает значительно
лучшими свойствами, чем предыдущая. Данная модель объясняет уже 93%
дисперсии зависимой переменной; также высок (92,6%) коэффициент
детерминации, скорректированный с учетом степеней свободы (adjusted Rsquared). При этом взаимоотношения переменных, зафиксированные в модели, заслуживают почти 100-процентного доверия.
Полученные уравнения:
z1 = 32,0472 - 0,154374*x1 (Forward Selection)
z1 = 0,0895693*x2 + 0,0742352*x8 (Backward Selection)
5. Аналогичным образом реализуем множественную регрессию с
последовательным увеличением и последовательным уменьшением группы
независимых переменных для остальных Z (Z2-Z10). Полученные результаты
занесем в таблицу 2.
6
Таблица 2 – Таблица полученных уравнений для Z2-Z10
Forward Selection
Backward Selection
z2 = 12,9286
z3 = 13,1429
z2 = 0,129304*x7
z3 = 0,204384*x1 + 0,173848*x2 0,084797*x4 + 0,153073*x5 0,0747298*x6 + 0,143603*x8 0,31909*x9 +
0,434674*x11 - 0,452234*x12
z4 = 0,134527*x9
z5 = 0,0607246*x10
z6 = 0,102369*x11
z4 = -3,33212 + 0,166774*x9
z5 = 6,42857
z6 = 11,2143
z7 = 2,6729 + 0,12699*x7
z7 = -0,0563363*x2 - 0,0701431*x4 +
0,0757653*x5 + 0,0303086*x6 +
0,214674*x7 + 0,0828393*x8 0,13804*x9
z8 = 0,146502*x2 - 0,101285*x6 +
0,160641*x10 + 0,288794*x11 0,343346*x12
z9 = 0,105507*x2 - 0,149273*x7 +
0,151836*x11
z8 = 10,3571
z9 = 21,4427 - 0,112729*x7
z10 = -13,0208 + 0,0934781*x2 +
0,0882078*x3 + 0,104186*x7
z10 = 0,0566851*x2 + 0,0558585*x3 +
0,0734068*x7 - 0,0446639*x9
7
ВЫВОД
В ходе выполнения данной контрольной работы была рассмотрена
задача включающая анализ множественной регрессии. В программе
StatGraphics для каждой зависимой переменной Z были реализованы две
наиболее
популярные
процедуры:
последовательное
увеличение
и
последовательное уменьшение группы независимых переменных. Уравнения
регрессии были составлены и представлены в таблице.
По результатам проведенного анализа можно сделать вывод, что в
данном
варианте
последовательного
более
эффективной
уменьшения
группы
будет
являться
переменных,
процедура
поскольку
она
объясняет с большим процентным соотношением дисперсии зависимых
переменных Z1-Z10.
8
Скачать