МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ федеральное государственное автономное образовательное учреждение высшего образования «САНКТ–ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ АЭРОКОСМИЧЕСКОГО ПРИБОРОСТРОЕНИЯ» КАФЕДРА №11 ОТЧЕТ ПРЕПОДАВАТЕЛЬ канд. техн. наук, доцент должность, уч. степень, звание подпись, дата В. В. Перлюк инициалы, фамилия ОТЧЕТ О КОНТРОЛЬНОЙ РАБОТЕ №2 ПОШАГОВАЯ МНОЖЕСТВЕННАЯ РЕГРЕССИЯ В СТАТГРАФ по дисциплине: Информационные технологии в приборостроении РАБОТУ ВЫПОЛНИЛ СТУДЕНТ ГР. № 1326М подпись, дата Санкт–Петербург 2023 С. Н. Пушкарь инициалы, фамилия 1. Задание Пошаговая множественная регрессия применяется для минимизации количества независимых переменных, входящих в исследуемую модель. Известно много подходов к такой минимизации. Цель учебного задания заключается в определении существенных связей между количественными критериальными показателями Z1…Z10 и условно независимыми признаками X1…X12. В рамках учебного задания следует реализовать в программе StatGraphics две наиболее популярные процедуры: последовательное увеличение и последовательное уменьшение группы независимых переменных. Рассматриваемый пример относится к одной из наиболее важных и интересных проблем современных научных исследований больших Представленный данных пример методов искусственного интеллекта. демонстрирует эффективность процедур последовательного увеличения и уменьшения группы переменных при построении моделей множественной регрессии. Удастся подбирать модели, содержащие гораздо меньше переменных но сравнению с исходным множеством и имеющие Незначительное количество лучшие статистические переменных (2-3) характеристики. позволяет легко интерпретировать содержание регрессионных моделей. 2. Практическая часть 2.1. Исходные значения При выполнении учебного задания следует оценить эффективность процедур последовательного увеличения и уменьшения группы переменных при построении моделей множественной регрессии, используя оценку статистической значимости детерминации) и статистику построенной модели (оценивающую (коэффициент улучшение оценки критериального показателя по сравнению с тривиальным назначением 2 среднего значения). Задание следует выполнить в программе StatGraphics по соответствующему варианту (Вариант 10). Таблица 1 – Таблица значений по варианту 10 2.2. Составление уравнения регрессии для каждого Z 1. Для нахождения зависимости параметров Z от параметров X сначала перенесем данные в StatGraphics (рис.1). Рисунок 1 – Таблица значений независимых и зависимых показателей в StatGraphics 2. С помощью функции Multiple Regression во вкладке Relate составим множественную регрессию для всех Z (рис.2). Для этого выберем один зависимый параметр и независимые параметры X1-X12. 3 Рисунок 2 – Пример составления множественной регрессии Z1 4 3. Щелкнем правой кнопкой мыши и выберем из появившегося меню пункт Analysis Options. В разделе Fitting Procedure окна диалога установим переключатель в положение Forward Selection (алгоритм последовательного увеличения группы переменных). Все остальное оставим без изменений (рис. 3). Рисунок 3 – Пример составления алгоритма последовательного увеличения группы переменных для Z1 Как видно из таблиц, построена регрессионная модель, обладающая высокой статистической значимостью и объясняющая почти 36,3% дисперсии зависимой переменной Z1. 4. Опробуем теперь процедуру с последовательным увеличением группы переменных. Выберем Analysis Options в контекстном меню. Установим переключатель Fitting Procedure в положение Backward Selection и снимем флажок Costant in Model. Остальные элементы управления оставим без изменений (рис. 4). 5 Рисунок 4 – Пример составления алгоритма последовательного уменьшения группы переменных для Z1 Видно, что построенная регрессионная модель обладает значительно лучшими свойствами, чем предыдущая. Данная модель объясняет уже 93% дисперсии зависимой переменной; также высок (92,6%) коэффициент детерминации, скорректированный с учетом степеней свободы (adjusted Rsquared). При этом взаимоотношения переменных, зафиксированные в модели, заслуживают почти 100-процентного доверия. Полученные уравнения: z1 = 32,0472 - 0,154374*x1 (Forward Selection) z1 = 0,0895693*x2 + 0,0742352*x8 (Backward Selection) 5. Аналогичным образом реализуем множественную регрессию с последовательным увеличением и последовательным уменьшением группы независимых переменных для остальных Z (Z2-Z10). Полученные результаты занесем в таблицу 2. 6 Таблица 2 – Таблица полученных уравнений для Z2-Z10 Forward Selection Backward Selection z2 = 12,9286 z3 = 13,1429 z2 = 0,129304*x7 z3 = 0,204384*x1 + 0,173848*x2 0,084797*x4 + 0,153073*x5 0,0747298*x6 + 0,143603*x8 0,31909*x9 + 0,434674*x11 - 0,452234*x12 z4 = 0,134527*x9 z5 = 0,0607246*x10 z6 = 0,102369*x11 z4 = -3,33212 + 0,166774*x9 z5 = 6,42857 z6 = 11,2143 z7 = 2,6729 + 0,12699*x7 z7 = -0,0563363*x2 - 0,0701431*x4 + 0,0757653*x5 + 0,0303086*x6 + 0,214674*x7 + 0,0828393*x8 0,13804*x9 z8 = 0,146502*x2 - 0,101285*x6 + 0,160641*x10 + 0,288794*x11 0,343346*x12 z9 = 0,105507*x2 - 0,149273*x7 + 0,151836*x11 z8 = 10,3571 z9 = 21,4427 - 0,112729*x7 z10 = -13,0208 + 0,0934781*x2 + 0,0882078*x3 + 0,104186*x7 z10 = 0,0566851*x2 + 0,0558585*x3 + 0,0734068*x7 - 0,0446639*x9 7 ВЫВОД В ходе выполнения данной контрольной работы была рассмотрена задача включающая анализ множественной регрессии. В программе StatGraphics для каждой зависимой переменной Z были реализованы две наиболее популярные процедуры: последовательное увеличение и последовательное уменьшение группы независимых переменных. Уравнения регрессии были составлены и представлены в таблице. По результатам проведенного анализа можно сделать вывод, что в данном варианте последовательного более эффективной уменьшения группы будет являться переменных, процедура поскольку она объясняет с большим процентным соотношением дисперсии зависимых переменных Z1-Z10. 8