Муниципальное общеобразовательное учреждение гимназия №7 Красноармейского района г.Волгограда г.Волгоград 400026 бульвар Энгельса,33 тел.69-98-66, 69-56-77, 67-05-55 Исследование возможности применения метода наименьших квадратов к прогнозированию результатов ЕГЭ по математике Работу выполнили: ученики 10 «А» класса Семенова Виктория Эдуардовна, Жилич Максим Александрович Руководители проекта: учителя математики МОУ гимназии № 7 Литвинова Светлана Александровна, Тараева Галина Юрьевна научный консультант: Мазепа Елена Алексеевна, канд. ф.-м.н., доцент каф. ФИОУ ВолГУ Будущее можно предсказать, достаточно лишь обладать необходимым объемом информации. М. А. Шпиль Общество не может обойтись без прогнозов как средства познания будущего. А можно ли спрогнозировать результаты ЕГЭ? Мнения учителей: «…мониторинговые срезы в новом формате дают объективные данные об уровне подготовки выпускников, по которым можно спрогнозировать конечный результат» (Я. Желнина, г. Ноябрьск); «…даже по результатам контрольных срезов нельзя дать однозначный ответ по поводу будущего экзамена» (Н. Евсеенко, г. Петрозаводск); «…конечно, можно, если оценка объективна» (О. Латынина, г. Старый Оскол). Мнение выпускников нашей гимназии: «Достаточно сложно спрогнозировать результаты ЕГЭ, так как содержание КИМов все время меняется; мы не знаем, какие задания могут встретиться на экзамене, как мы на них отреагируем; иногда случаются неожиданности». Актуальность исследования: названная проблема остро стоит перед современными выпускниками и перед каждым образовательным учреждением. Цель исследования: • изучить виды и методы прогнозирования; • установить зависимость максимального и минимального экзаменационного балла от среднего школьного балла; • осуществить попытку спрогнозировать результаты предстоящего ЕГЭ для каждого выпускника 2013 года гимназии №7. Предмет исследования – возможность применения метода наименьших квадратов к анализу и прогнозированию результатов ЕГЭ. Приступая к исследованию, мы выдвинули гипотезу: «Верно ли, что высокая школьная оценка обеспечивает высокий балл на ЕГЭ»? Модели прогнозирования • Основу качественного подхода составляют такие факторы, как интуиция и опыт экспертов в построении прогнозов. • Количественный подход основывается на различных математических моделях: функциональных зависимостях, системах уравнений, графиках. Этапы прогнозирования • Определение пользы прогноза: какой цели мы пытаемся достичь? • Выбор предмета прогнозирования. • Определение временного горизонта прогнозирования – краткосрочное, среднесрочное, долгосрочное. • Выбор модели или моделей прогнозирования. • Сбор данных, необходимых для прогноза. • Обоснование модели прогнозирования. • Разработка прогноза. • Реализация результатов. Задача регрессионного анализа • В ходе эксперимента получают набор данных, между которыми может существовать или отсутствовать функциональная связь. • Требуется определить вид этой зависимости; подобрать математическую формулу. • Вычислить параметры функции методом наименьших квадратов. • Провести подгонку (аппроксимацию) между наблюдаемыми значениями и соответствующими расчетными. Метод наименьших квадратов Требование «наилучшего» согласования кривой и экспериментальных точек сводится к тому, чтобы сумма квадратов отклонений экспериментальных точек от расчетных обращалась в минимум. Метод наименьших квадратов был описан Лагранжем в 1806 г. в его труде Nouvelles methodes pour la determination des orbites des cometes. Примеры зависимостей между экспериментальными и расчетными данными: а) линейная зависимость б) квадратичная зависимость Коэффициенты уравнения прямой или кривой регрессии вычисляются по формулам, представленным в работе Уравнение линейной регрессии y p = b1 x + b0 n n nb0 xi b1 yi i 1 i 1 , где n n n x b x 2 b x y i 0 i 1 i i i 1 i 1 i 1 n n n n xiyi xi yi i 1 i 1 i 1 b 2 1 n n 2 n xi xi i 1 i1 n yi xi b1 b0 i1 i1 n n Уравнение квадратичной регрессии 2 y = ax + bx + c n n 4 n 3 n 2 2 xi a xi b xi c xi yi i 1 i 1 i 1 i 1 n n 3 n 2 n xi a xi b xi c yi xi i 1 i 1 i 1 i 1 n n n 2 xi a xi b n c yi i 1 i 1 i 1 Практическая часть • Собрали необходимую для расчетов информацию: выписали отметки за 10-11 класс по математике, результаты ЕГЭ и сгруппировали их. • Построили диаграмму рассеяния. • Выбрали нужную регрессионную модель. • Рассчитали коэффициенты, получили уравнения линий регрессии. • Определили, насколько удачной является полученная регрессионная модель. Диаграммы рассеяния , построенные для n=76. а) линейная зависимость 80 б) квадратичная зависимость 75 70 65 60 80 55 75 50 70 45 65 40 60 35 30 55 25 50 20 45 15 y = 10,84x + 9,32 R2 = 0,30 10 5 40 35 30 25 0 2 2,25 2,5 2,75 3 3,25 3,5 3,75 4 4,25 4,5 4,75 5 5,25 5,5 20 y = 1,62x2 - 1,91x + 33,74 15 10 Сила регрессионной связи для линейной и квадратичной функций практически одинакова, продолжим обработку данных с помощью линейной регрессии. R2 = 0,31 5 0 2 2,25 2,5 2,75 3 3,25 3,5 3,75 4 4,25 4,5 4,75 5 5,25 5,5 Анализируя полученную картину, можно заметить присутствие нетипичных результатов, так называемых выбросов: удалим их, проведем аналогичные расчеты для n=70, построим диаграмму рассеяния и линию регрессии. 80 75 70 65 60 55 50 45 40 35 30 25 20 15 10 5 0 Проверим тесноту связи с помощью коэффициента корреляции: x n i r= x n i i=1 y = 11,94x + 5,56 R2 = 0,45 2 2,25 2,5 2,75 3 3,25 3,5 3,75 4 4,25 4,5 4,75 5 5,25 5,5 x yi y i=1 x yi y 2 n 2 i=1 n n y x i x= i=1 n r= y= i i=1 n 350 ,32 = 0,67 522.90 При этом коэффициент детерминации R2=0,45, что говорит о наличии не совсем тесной связи. Прогнозирование Построим прогнозируемый «коридор» между максимальным и минимальным баллами ЕГЭ в зависимости от среднего школьного балла. 80 70 75 65 70 60 65 55 60 50 55 45 50 40 45 35 40 30 35 25 30 20 25 15 20 y = 14,02x - 11,65 10 R = 0,63 5 y = 5,80x + 37,90 R2 = 0,36 15 2 10 5 0 2 2,25 2,5 2,75 3 3,25 3,5 3,75 4 4,25 4,5 4,75 5 5,25 5,5 0 2 2,25 2,5 2,75 3 3,25 3,5 3,75 4 4,25 4,5 4,75 5 5,25 5,5 Минимальный прогнозируемый балл ЕГЭ Максимальный прогнозируемый балл ЕГЭ Удалим очевидные выбросы и продолжим исследование 75 80 70 75 65 70 60 65 55 60 50 55 45 50 40 45 35 40 30 35 30 25 25 20 y = 15,89x - 19,56 R2 = 0,85 15 10 20 y = 6,60x + 35,89 R2 = 0,55 15 10 5 5 0 2 2,25 2,5 2,75 3 3,25 3,5 3,75 4 Минимальный балл ЕГЭ 4,25 4,5 4,75 5 5,25 5,5 0 2 2,25 2,5 2,75 3 3,25 3,5 3,75 4 4,25 4,5 4,75 5 5,25 5,5 Максимальный балл ЕГЭ Коэффициент детерминации в первом случае говорит об очень тесной связи между рассматриваемыми факторами , то есть выбранная модель очень хорошая, а во втором – о приемлемости выбранной модели регрессии для осуществления прогноза. Прогнозируемый «коридор» для каждого среднего школьного балла 75 70 65 60 55 49 50 45 40 35 30 25 20 15 10 12 5 0 2 52 56 59 62 66 69 60 52 44 36 28 20 2,5 3 3,5 4 4,5 5 На основании полученных уравнений линейной регрессии, используя предполагаемый средний итоговый балл по математике для выпускников 2013 года произведен расчет для каждого испытуемого его «коридора»: минимальный балл из уравнения y =15,89x-19,56, а максимальный – y = 6,60x+35,89. Ф.И. учащихся Аветян Александр Алейникова Алина Брежнева Виктория Вахменина Наталия Гитинова Тамара Горелова Виктория Грибанова Виктория Дементьев Владислав Корякина Юлия Кудряшова Елена Кузнецова Вероника Кулагин Артем Кумейко Яна Лазуренко Татьяна Лебедев Станислав Лосицкая Александра Лукманов Владислав Онищенко Екатерина Поспелова Александра Савушкин Никита Соснина Олеся Черкасова Василиса Шепелевич Александра Фирсова Алина прогнозируемый «коридор» желаемый балл ЕГЭ прогнозируемый балл ЕГЭ 41-61 47-63 39-60 44-62 31-57 52-66 41-61 31-57 28-56 41-61 47-63 44-62 60-68 60-69 44-62 44-62 28-56 31-57 28-56 28-56 60-69 44-62 60-69 60-69 56 65 60 65 45 40 60 55 27 50 60 56 60 70 56 40 50 56 55 40 60 60 60 70 51 55 49 53 43 59 51 56 41 51 55 49 65 65 53 53 41 43 41 41 65 56 65 65 Заключение максимальные результаты успеваемости: обучающиеся, имеющие средний школьный балл 4,5 -5,0 прогнозируемый балл ЕГЭ 63-69; результаты успеваемости выше среднего: обучающиеся, имеющие средний школьный балл 3,5 -4,4 прогнозируемый балл ЕГЭ 49-53; средние результаты успеваемости: обучающиеся, имеющие средний школьный балл 2,6 -3,4 прогнозируемый балл ЕГЭ 28-42. Таким образом, нами было установлено, что результаты ЕГЭ имеют слабую линейную зависимость от успеваемости в течение последних двух лет, что подтверждается графически и аналитически. Очевидно, что кроме успеваемости на баллы ЕГЭ оказывают влияние ряд субъективных и объективных факторов (самочувствие и волнение учеников, сложность предлагаемых задач, строгость экзаменационной комиссии и др.) Список источников и литературы 1. Аронович А. Б., Афанасьев М. Ю., Суворов Б. П. Сборник задач по исследованию операций. М.: Изд-во МГУ, 1997. 2. Вентцель Е. С. Теория вероятностей: Учеб. для вузов. – 7-е изд. стер.-М.: Высш. шк., 2001. 3. Линник Ю. В. Метод наименьших квадратов и основы математикостатистической теории обработки наблюдений. — 2-е изд. — М., 1962. (математическая теория). 4. Поллард Дж. Справочник по вычислительным методам статистики/ пер. с англ. В. С. Занадворова; под ред. и с предисл. Е. М. Четыркина. – М.: Финансы и статистика, 1982. 5. http://ru.wikipedia.org/wiki/. 6. http://www.math.ru/dic/12. Вот закончились мученья, Позади уже ЕГЭ, Страхи, нервы и сомненья. Все! Прошло! Но как во сне. Можно выдохнуть спокойно Сдали! Честь нам и хвала! – И учебники вальяжно Отодвинуть от себя. И теперь мы убедились Трудно очень на ЕГЭ, Полагаться надо только На что имеем в голове. Тут и скрытые резервы – Очень много помним мы. И удача и везенье, А может, все-таки умны?! МОУ гимназия №7, г. Волгоград-26, Бульвар Энгельса, 33. Тел. 69-98-66 E-mail: gym7volgograd@mail.ru