МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РФ Федеральное государственное бюджетное образовательное учреждение высшего образования "Удмуртский государственный университет" (ФГБОУ ВО "УдГУ") Машинное обучение рабочая программа дисциплины (модуля) Закреплена за кафедрой вычислительных технологих и интеллектуальных систем больших данных ОПОП Направление 02.04.02 Фундаментальная информатика и информационные технологии направленность (профиль) Технологии искусственного интеллекта и Big Data Квалификация Магистр Год начала подготовки 2022 Форма обучения очная Общая трудоемкость 4 з.е. Виды контроля по семестрам: экзамен 1 Семестр(Курс.Номер семестра на курсе) Лекции Практические Итого ауд. Контактная работа Сам. работа Часы на контроль Практическая подготовка Семинары Консультации Итого трудоемкость в часах 1(1.1) Итого УП РПД УП РПД 20 20 20 20 32 32 32 32 52 52 52 52 66 66 66 66 76 76 76 76 2 2 2 2 0 0 0 0 12 12 12 12 2 2 2 2 158 158 158 158 Программу составил(и): к.т.н., доцент, Блеканов Иван Станиславович;ассистент, Вольф Дмитрий Александрович Рабочая программа дисциплины Машинное обучение разработана в соответствии с ФГОС: Федеральный государственный образовательный стандарт высшего образования - магистратура по направлению подготовки 02.04.02 Фундаментальная информатика и информационные технологии (приказ Минобрнауки России от 23.08.2017 г. № 811) составлена на основании учебного плана: Направление 02.04.02 Фундаментальная информатика и информационные технологии направленность (профиль) Технологии искусственного интеллекта и Big Data утвержденного Учёным советом вуза от _ протокол № 14. Рабочая программа одобрена на заседании кафедры вычислительных технологий и интеллектуальных систем больших данных Зав. кафедрой Бельтюков А.П. РПД утверждена Учёным советом университета протокол от _ № 1. ЦЕЛИ ОСВОЕНИЯ ДИСЦИПЛИНЫ Цель дисциплины – ознакомление с концепцией интеллектуального анализа данных и изучения актуальных методов машинного обучения, а также знакомство с практическими приложениями дынных методов. Курс нацелен на глубокое изучение математических основ и границ применимости рассматриваемых методов с точки зрения их достоинств и недостатков. 2. МЕСТО ДИСЦИПЛИНЫ В СТРУКТУРЕ ООП Цикл (раздел) ООП: Б1.О 2.1 Требования к предварительной подготовке обучающегося: 1. В соответствии с порядком приема на основные образовательные программы магистратуры по направлению “Фундаментальная информатика и информационные технологии”. 2. 1. 2. 3. 4. 5. 6. Знание одного из высокоуровневых языков программирования (Python, R). 2.2 Дисциплины и практики, для которых освоение данной дисциплины (модуля) необходимо как предшествующее: Глубокое обучение Компьютерное зрение Обработка естественного языка научно-исследовательская работа проектно-технологическая практика Семинар по выпускной квалификационной работе 3. СООТНЕСЕНИЕ РЕЗУЛЬТАТОВ ОБУЧЕНИЯ ПО ДИСЦИПЛИНЕ (МОДУЛЮ) С ИНДИКАТОРАМИ ДОСТИЖЕНИЯ КОМПЕТЕНЦИЙ 3.1 Компетенции обучающегося и индикаторы их достижения: ОПК-3: Способен проводить анализ математических моделей, создавать инновационные методы решения прикладных задач профессиональной деятельности в области информатики и математического моделирования ОПК-3.1 Знать: методы анализа математических моделей Знает: методы анализа математических моделей ОПК-3.2 Уметь: создавать инновационные методы решения прикладных задач профессиональной деятельности в области информатики и математического моделирования Умеет: создавать инновационные методы решения прикладных задач профессиональной деятельности в области информатики и математического моделирования ПК-4: Способен разрабатывать и применять методы и алгоритмы машинного обучения для решения задач (ПКП-6ИИР- ПК-3) ПК-4.1 Планирует применение методов и алгоритмов машинного обучения для решения задач искусственного интеллекта Планирует применение методов и алгоритмов машинного обучения для решения задач искусственного интеллекта ПК-4.2 Разрабатывает и применяет методы и алгоритмы машинного обучения для решения задач искусственного интеллекта Разрабатывает и применяет методы и алгоритмы машинного обучения для решения задач искусственного интеллекта ПК-5: Способен разрабатывать алгоритмы и программные средства для решения задач в области создания и применения искусственного интеллекта (ПКП-1-ИИ-ОПК-1) ПК-5.1 Разрабатывает оригинальные алгоритмы и программные средства с использованием современных интеллектуальных технологий Разрабатывает оригинальные алгоритмы и программные средства с использованием современных интеллектуальных технологий ПК-5.2 Решает задачи в области создания и применения искусственного интеллекта с использованием современных интеллектуальных технологий Решает задачи в области создания и применения искусственного интеллекта с использованием современных интеллектуальных технологий ПК-7: Способен руководить проектами по созданию комплексных систем искусственного интеллекта (ПКП-7-ИИРПК- 4) ПК-7.1 Анализирует методы управления проектами по созданию комплексных систем искусственного интеллекта Анализирует методы управления проектами по созданию комплексных систем искусственного интеллекта ПК-7.2 Осуществлет управление проектами по созданию комплексных систем искусственного интеллекта Осуществляет управление проектами по созданию комплексных систем искусственного интеллекта 3.2 Результаты обучения по дисциплине: В результате освоения дисциплины обучающийся должен: З.1 Знать: концепцию интеллектуального анализа данных; З.2 методы обработки данных, включающих сбор, подготовку и визуализацию данных; З.3 модели обучения с учителем для восстановления зависимости по данным; З.4 границы применимости и взаимосвязи дискриминантного и регрессионного анализа; З.5 модели обучения без учителя для восстановления паттернов в данных и уменьшения размерности; границы применимости кластерного анализа; З.6 прикладные задачи машинного обучения; З.7 методологию жизненного цикла проектов с применением методов машинного обучения; З.8 современные информационно-коммуникационные и интеллектуальные компьютерные технологии, инструментальные среды, программно-технические платформы для решения профессиональных задач; З.9 состав современных информационно-коммуникационных и интеллектуальных компьютерных технологий; З.10 принципы разработки оригинальных программных средств, в том числе с использованием современных информационно-коммуникационных и интеллектуальных компьютерных технологий, для решения профессиональных задач; З.11 классы методов и алгоритмов машинного обучения; З.12 методы и критерии оценки качества моделей машинного обучения; З.13 унифицированные и обновляемые методологии описания, сбора и разметки данных, а также механизмы контроля за соблюдением указанных методологий; З.14 возможности современных инструментальных средств и систем программирования для решения задач машинного обучения; З.15 функциональность современных инструментальных средств и систем программирования в области создания моделей и методов машинного обучения; З.16 принципы построения систем искусственного интеллекта, методы и подходы к планированию и реализации проектов по созданию систем искусственного интеллекта; У.1 Уметь: применять методы обработки данных, включающих сбор, подготовку и визуализацию данных; У.2 применять современные информационно-коммуникационные и интеллектуальные компьютерные технологии, инструментальные среды, программно-технические платформы для решения профессиональных задач; У.3 осуществлять выбор современных информационно-коммуникационных и интеллектуальных компьютерных технологий, осуществлять поиск решений на основе научной методологии; У.4 формализовать прикладные требования проблем согласно концепции интеллектуального анализа данных; У.5 реализовывать структуру решения и управлять стадиями жизненного цикла проектов машинного обучения; У.6 ставить задачу; У.7 определять критерии и метрики оценки результатов моделирования при построении систем искусственного интеллекта в исследуемой области; Владеть: 4. СТРУКТУРА И СОДЕРЖАНИЕ ДИСЦИПЛИНЫ (МОДУЛЯ) Код занятия 1.1 Наименование разделов Семестр / Часов и тем /вид занятия/ Курс Введение в машинное обучение Введение в машинное 1 1 обучение. Основные понятия машинного обучения. /Лек/ Литература Содержание Л1.1 Л1.2Л2.1 Постановка задачи машинного обучения – обучение с учителем (классификация, регрессия) и без учителя (кластеризация). Основные понятия машинного обучения: объекты, типы признаков – числовые, категориальные (номинальные, порядковые), алгоритм, функция потерь, функционал качества, обобщающая способность, кроссвалидация. Примеры прикладных задач. 1.2 Кросс-валидация. Смещение (bias) и разброс (variance) алгоритмов машинного обучения. /Лек/ 1 1 Л1.1 Л1.2Л2.1 1.3 Подготовка данных. Первичный анализ данных (Еxploration data analysis, EDA). /Лек/ 1 1 Л1.1 Л1.2Л2.1 1.4 (Еxploration data analysis, EDA). /Пр/ 1 2 Л1.1 Л1.2Л2.1 1.5 (Еxploration data analysis, EDA). /Ср/ 1 8 Л1.1 Л1.2Л2.1 1.6 Методы снижения размерности данных. Алгоритмы: PCA, tSNE, UMAP. /Лек/ 1 1 Л1.1 Л1.2Л2.1 1.7 Библиотека Pandas. Визуализация данных на Python. /Пр/ Библиотека Pandas. Визуализация данных на Python. /Ср/ 1 2 Л1.1 Л1.2Л2.1 1 4 Л1.1 Л1.2Л2.1 1.8 Методология обучения алгоритмов машинного обучения на экспериментальных данных. Скользящее среднее. Переобучение (overfitting) и недообучение (underfitting). сложность (complexity) модели алгоритмов. Разложение ошибки алгоритма на разброс (variance) и смещение (bias). Определение свойств и характеристики признаков в экспериментальных данных. Подготовка данных: очистка, фильтрация, трансформация данных, исследование взаимосвязей между признаками. Методики нормализации и категоризации числовых признаков. Работа с текстовыми данным – векторизация текстов. Методы работы с категориальными данными: кодирование, трансформация. Методы работы с несбалансированными данными: недосэмлирование (undersampling), пересемплирование (oversampling). Понятие лика в данных (leakage). Определение свойств и характеристики признаков в экспериментальных данных. Подготовка данных: очистка, фильтрация, трансформация данных, исследование взаимосвязей между признаками. Методики нормализации и категоризации числовых признаков. Работа с текстовыми данным – векторизация текстов. Методы работы с категориальными данными: кодирование, трансформация. Методы работы с несбалансированными данными: недосэмлирование (undersampling), пересемплирование (oversampling). Понятие лика в данных (leakage). Определение свойств и характеристики признаков в экспериментальных данных. Подготовка данных: очистка, фильтрация, трансформация данных, исследование взаимосвязей между признаками. Методики нормализации и категоризации числовых признаков. Работа с текстовыми данным – векторизация текстов. Методы работы с категориальными данными: кодирование, трансформация. Методы работы с несбалансированными данными: недосэмлирование (undersampling), пересемплирование (oversampling). Понятие лика в данных (leakage). Метод главных компонент (Principal component analysis). Стохастическое вложение соседей с t -распределением (t-distributed Stochastic Neighbor Embedding, t-SNE). Uniform Manifold Approximation and Projection (UMAP). Библиотека Pandas. Визуализация данных на Python. Библиотека Pandas. Визуализация данных на Python. Библиотека Pandas. Визуализация данных на Python. 1.9 Методы отбора признаков. (Feature selection) /Лек/ 1 1 Л1.1 Л1.2Л2.1 Методы использующие алгоритмы обучения с учителем и без учителя: обертки, встроенные методы. Методы не требующие алгоритмы обучения - фильтры. Гибридные методы. 1.10 Методы обработки признаков /Пр/ 1 4 Л1.1 Л1.2Л2.1 1.11 Методы обработки признаков /Ср/ 1 8 Л1.1 Л1.2Л2.1 1.12 Метрики качества в задачах классификации, регрессии. /Лек/ 1 1 Л1.1 Л1.2Л2.1 1.13 Метрики качества в задаче ранжирования. /Лек/ 1 1 Л1.1 Л1.2Л2.1 1.14 Введение в машинное обучение. Общие вопросы машинного обучения /Сем зан/ 1 4 Л1.1 Л1.2Л2.1 1 1 Л1.1 Л1.2Л2.1 1 1 Л1.1 Л1.2Л2.1 1 1 Л1.1 Л1.2Л2.1 2.1 2.2 2.3 Алгоритмы обучения с учителем Метрические алгоритмы классификации и регрессии, k-NN. /Лек/ Линейные модели. Многомерная линейная регрессия. Регуляризация. /Лек/ Логистическая регрессия. Обобщённая аддитивная модель. /Лек/ Методы использующие алгоритмы обучения с учителем и без учителя: обертки, встроенные методы. Методы не требующие алгоритмы обучения - фильтры. Гибридные методы. Методы использующие алгоритмы обучения с учителем и без учителя: обертки, встроенные методы. Методы не требующие алгоритмы обучения - фильтры. Гибридные методы. Функционалы качества бинарной классификации: матрица ошибок (Сonfusion matrix), доля правильных ответов (accarucy), точность, полнота, F1-мера, Коэффициент Мэттьюса (Matthews correlation coefficient), Каппа Коэна (Cohen’s Kappa), PR-кривая, ROC -кривая. Многомерная классификация: подход один против всех (one-vs-all), все против всех (all-vs-all). Логистическая функция ошибки (LogLoss). Функционалы качества регрессии: средняя квадратичная ошибка. средняя абсолютная ошибка, коэффициент детерминации, средняя абсолютная процентная ошибка, корень из средней квадратичной ошибки. Точность ранжирования (точность на K элементах, precision at K, average precision at K, mean average precision at K), normalized discounted cumulative gain (nDCG), discounted Cumulative Gain at K, mean reciprocal rank (MRR). Введение в машинное обучение. Основные понятия машинного обучения. Кроссвалидация. Смещение (bias) и разброс (variance) алгоритмов машинного обучения. Подготовка данных. Первичный анализ данных (Еxploration data analysis, EDA). (Еxploration data analysis, EDA). Методы снижения размерности данных. Алгоритмы: PCA, tSNE, UMAP. Библиотека Pandas. Визуализация данных на Python. Методы отбора признаков. (Feature selection). Методы обработки признаков. Метрики качества в задачах классификации, регрессии. Метрики качества в задаче ранжирования. Гипотезы компактности и непрерывности. Обобщённый метрический классификатор. Метод ближайших соседей kNN и его обобщения. Подбор числа k по критерию скользящего контроля. Линейные модели. Многомерная линейная регрессия. Регуляризация. Метод наименьших квадратов. Проблема мультиколлинеарности. Регуляриация: L1, L2 и ElasticNet. Логистическая регрессия с точки зрения двух классов, как линейный классификатор. Принцип максимального правдоподобия. Связь с другими методами. Пример прикладной задачи: кредитный скоринг. Обобщённая аддитивная модель. Экспоненциальное семейство распределений. Функция связи. 2.4 Метод опорных векторов (Support vector regression, SVM). /Лек/ 1 1 Л1.1 Л1.2Л2.1 2.5 Логические методы. Деревья решений. /Лек/ 1 1 Л1.1 Л1.2Л2.1 2.6 Ансамбли. Случайный лес. /Лек/ 1 1 Л1.1 Л1.2Л2.1 2.7 Алгоритмы LightGBM, XGBoost, Catboost. /Лек/ 1 1 Л1.1 Л1.2Л2.1 2.8 Применение алгоритмов обучения с учителем на реальном датасете. /Пр/ Применение алгоритмов обучения с учителем на реальном датасете. /Ср/ Анализ временных рядов. Модели прогнозирования временных рядов. /Лек/ 1 8 Л1.1 Л1.2Л2.1 1 16 Л1.1 Л1.2Л2.1 Применение алгоритмов обучения с учителем на реальном наборе данных. 1 1 Л1.1 Л1.2Л2.1 2.11 Прогнозирование цен на акции, транспортных потоков. /Пр/ 1 8 Л1.1 Л1.2Л2.1 2.12 Прогнозирование цен на акции, транспортных потоков. /Ср/ 1 16 Л1.1 Л1.2Л2.1 Стационарность рядов, приведение к стационарному виду. Кросс-валидация на временных рядах. Модели скользящего среднего. ARIMA, sARIMA. Извлечение признаков. Использование моделей машинного обучения. Стационарность рядов, приведение к стационарному виду. Кросс-валидация на временных рядах. Модели скользящего среднего. ARIMA, sARIMA. Извлечение признаков. Использование моделей машинного обучения. Стационарность рядов, приведение к стационарному виду. Кросс-валидация на временных рядах. Модели скользящего среднего. ARIMA, sARIMA. Извлечение признаков. Использование моделей машинного обучения. 2.9 2.10 Оптимальная разделяющая гиперплоскость. Понятие зазора между классами (margin). Связь с минимизацией регуляризованного эмпирического риска. Кусочно-линейная функция потерь. Задача квадратичного программирования и двойственная задача. Понятие опорных векторов. Рекомендации по выбору константы C. Функция ядра (kernel functions), спрямляющее пространство. Примеры ядер. Жадная нисходящая стратегия «разделяй и властвуй». Алгоритм ID3. Недостатки жадной стратегии и способы их устранения. Проблема переобучения. Критерии ветвления: мера нечистоты (impurity) распределения. Энтропийный критерий, критерий Джини. Алгоритм C4.5. Деревья в задачах регрессии. Алгоритм CART. Теорема о голосовании (комитет большинства). Взвешивание. Стохастические метод: бэггинг. Стохастический градиентный бустинг. Теоретическое обоснование изменения смещения и разброса для простого голосования. Сравнение бэггинга и бустинга. Алгоритм случаный лес (Random forest, RF). Алгоритмы LightGBM, XGBoost, Catboost. Варианты бустинга. Обработка категориальных признаков. Стэкинг, взвешивание по признакам. Применение алгоритмов обучения с учителем на реальном наборе данных. 2.13 3.1 3.2 Алгоритмы машинного обучения с учителем /Сем зан/ Алгоритмы обучения без учителя Постановка задачи кластеризации. Типы алгоритмов кластеризации. /Лек/ Алгоритм Иерархической кластеризации. Алгоритм k-средних. /Лек/ 1 4 Л1.1 Л1.2Л2.1 Метрические алгоритмы классификации и регрессии, k-NN. Линейные модели. Многомерная линейная регрессия. Регуляризация. Логистическая регрессия. Обобщённая аддитивная модель. Метод опорных векторов (Support vector regression, SVM). Логические методы. Деревья решений. Ансамбли. Случайный лес. Алгоритмы LightGBM, XGBoost, Catboost. Применение алгоритмов обучения с учителем на реальном датасете. Анализ временных рядов. Модели прогнозирования временных рядов. Прогнозирование цен на акции, транспортных потоков. 1 1 Л1.1 Л1.2Л2.1 Теорема компактности. Метрики расстояний и сходства. Примеры прикладных задач. 1 1 Л1.1 Л1.2Л2.1 Агломеративный и дивизимные подходы. Дендрограмма. Определение оптимального количества кластеров. Метод k-средних. Функционал качества. Определение оптимального количества кластеров: метод локтя, метод силуэта, Gap статистика. Метрики определения качества кластеров. Основные шаги EM-алгоритма. Смесь распределений. Медианные модификации алгоритма. Этапы DBSCAN, опорные, пограничные, шумовые точки. Подбор гиперпараметров алгоритма. Достоинства и недостатки алгоритмов. Матрица Лапласса. Связь с сильными компонентами связности. Свойства собственных чисел матрицы Лапласса. Базовый алгоритм. Алгоритмы обучения без учителя 3.3 EM-алгоритм. /Лек/ 1 1 Л1.1 Л1.2Л2.1 3.4 DBSCAN алгоритм. /Лек/ 1 1 Л1.1 Л1.2Л2.1 3.5 Графовые алгоритмы кластеризации. Спектральный алгоритм (Spectral clustering). /Лек/ Определение тематики корпуса текстов. /Пр/ Определение тематики корпуса текстов. /Ср/ Проект по созданию рекомендательной системы графа друзей. /Пр/ 1 1 Л1.1 Л1.2Л2.1 1 4 Л1.1 Л1.2Л2.1 1 12 Л1.1 Л1.2Л2.1 1 4 Л1.1 Л1.2Л2.1 3.9 Проект по созданию рекомендательной системы графа друзей. /Ср/ 1 12 Л1.1 Л1.2Л2.1 Алгоритм обучения без учителя. Проект по созданию рекомендательной системы графа друзей. 3.10 Консультация /Конс/ 1 2 Л1.1 Л1.2Л2.1 3.11 Алгоритмы машинного обучения без учителя /Сем зан/ 1 4 Л1.1 Л1.2Л2.1 Подготовка к экзамену. Обсуждение вопросов экзамена. Постановка задачи кластеризации. Типы алгоритмов кластеризации. Алгоритм Иерархической кластеризации. Алгоритм kсредних. EM-алгоритм. DBSCAN алгоритм. Графовые алгоритмы кластеризации. Спектральный алгоритм (Spectral clustering). Определение тематики корпуса текстов. Проект по созданию рекомендательной системы графа друзей. 3.6 3.7 3.8 Алгоритмы обучения без учителя Определение тематики корпуса текстов. Алгоритмы обучения без учителя. Проект по созданию рекомендательной системы графа друзей. 5. ОЦЕНОЧНЫЕ МАТЕРИАЛЫ 5.1. Типовые задания для проведения текущего контроля Примерный перечень тем докладов: 1. Утечка данных (data leakage) в машинном обучении. 2. Продвинутые техники борьбы с несбалансированным данными. 3. Методы отбора признаков. 4. Байесовское машинное обучение. Байесовский классификатор. 5. Алгоритмы коллаборативной фильтрации. 6. Методы семантического анализа текстов (LSA, LDA, pLDA) 7. Методы анализа социальных сетей. 8. Методы информационного поиска. 9. Методы ранжирования. 10. Рекомендательные системы. 11. Современные инструменты разработки моделей машинного обучения. 12. Инструменты поддержки моделей машинного обучения в продакшене. 5.2. Типовые задания для проведения промежуточной аттестации Примерные вопросы к экзамену по дисциплине: 1. Виды данных. Задача машинного обучения. Классификация задач машинного обучения. Способы предобработки данных. Сравнение моделей. 2. Разложение ошибки на смещение и разброс. 3. Подготовка данных. EDA. 4. Методы уменьшения размерности. 5. Методы отбора признаков. 6. Метрики качества для задач классификации и регрессии. 7. Метрики качества для задачи ранжирования. 8. Метрические методы классификации. k-NN. 9. Многомерная регрессия. Регуляризация. 10. Логистическая регрессия. Обобщенная линейная модель. 11. Логические методы классификации. Деревья решений. 12. Линейные классификаторы, SVM, kernel trick. 13. Ансамбли. Идея методов беггинга и бустинга. Основная идея метода случайных подпространств. Алгоритм случайного леса. 14. Градиентный бустинг. Алгоритм LightGBM, XGBoost. 15. Алгоритм Catboost. 16. Временные ряды. Стационарность. sARIMA. 17. Временные ряды. Кросс-валидация. Извлечение признаков. 18. Постановка задачи кластеризации. Типы алгоритмов кластеризации. 19. Алгоритм Иерархической кластеризации. Алгоритм k-средних. 20. EM-алгоритм. 21. DBSCAN алгоритм. 22. Графовые алгоритмы кластеризации. Спектральный алгоритм (Spectral clustering). 5.3. Перечень видов оценочных средств Перечень тем докладов Вопросы к экзамену 5.4. Процедура применения оценочных материалов Промежуточная аттестация проходит в форме презентаций командных разработок, описаний роли каждого обучающегося и научно-практического вклада в командную разработку проекта, и подготовленных докладов по темам семинаров. Для прохождения промежуточной аттестации необходимо выполнить все практические задания в командном проекте, подготовить доклад, представить результаты проведенных экспериментов и сдать экзамен по курсу. Экзамен проводится в устной форме по билетам. Список экзаменационных вопросов предоставляется обучающимся не позднее, чем за две недели до экзамена. Билет содержит два теоретических вопроса. По окончании подготовки к ответу обучающийся устно излагает содержание экзаменационных вопросов экзаменатору и отвечает на вопросы экзаменатора. После устного ответа по вопросам экзаменационного билета экзаменатор вправе задать обучающемуся любые вопросы из списка экзаменационных вопросов (дополнительные вопросы). Командный проект оценивается в соответствии со следующими критериями: Проект выполнен полностью, отчет представлен и защищен 60 баллов Проект выполнен полностью, отчет представлен, но не защищен 40 баллов В остальных случаях 0 баллов Ответ на вопрос билета оценивается в соответствии со следующими критериями: Дан полный ответ на вопрос 20 баллов Допущены неточности в ответе, непринципиальные ошибки 12 баллов Допущены существенные и даже грубые ошибки, но затем исправлены самостоятельно. Знание учебного материала в объеме, необходимом для дальнейшей учебы и профессиональной деятельности 5 балла В остальных случаях 0 баллов Показателями, характеризующими текущую учебную работу слушателей, являются: 1) посещаемость занятий и активность работы на занятиях; 2) оценка выполнения командного проекта. Критерии оценивания формируются исходя из данных показателей работы слушателей, и методов измерения знаний, которые используются при контроле освоения учебного материала дисциплины слушателями, с учётом весовых коэффициентов важности показателей. Для дисциплины выбрана комбинация следующих критериев: 1) результаты текущей работы (посещаемость занятий, активность работы на семинарах) – 10 баллов; 2) оценка выполнения индивидуального проекта – 60 баллов; 3) оценка ответа на экзаменационные вопросы – 30 баллов (по 15 баллов за вопрос). Максимальное количество баллов, которое может получить студент за изученный курс, составляет 100 баллов. Приведённые выше баллы указывают максимальные баллы, которые может получить слушатель по тому или иному показателю работы, из принятых по данной дисциплине. Для определения итоговой оценки используется следующая взаимосвязь шкал оценивания: Итоговое количество баллов Оценка ECTS Оценка при проведении зачёта от 90 до 100 A отлично от 80 до 89 B хорошо от 70 до 79 C от 61 до 69 D удовлетворительно от 50 до 60 E менее 50 F неудовлетворительно Преподаватель имеет право предоставить информацию о задолженностях студента в аттестационную комиссию. 6. УЧЕБНО-МЕТОДИЧЕСКОЕ И ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ ДИСЦИПЛИНЫ (МОДУЛЯ) 6.1. Рекомендуемая литература 6.1.1. Основная литература Авторы, составители Л1.1 Буховец А. Г. Л1.2 Зададаев С. А. Заглавие Алгоритмы вычислительной статистики в системе R: учебное пособие Математика на языке R: учебник Издательство, год Ссылка на электронное (кол-во экземпляров издание для печатных изданий) , 2015 http://e.lanbook.com/bo ok/68459 Москва: Прометей, http://biblioclub.ru/inde 2018 x.php? page=book&id=49494 1 6.1.2. Дополнительная литература Авторы, составители Л2.1 Э1 Э2 Заглавие Издательство, год Ссылка на электронное (кол-во экземпляров издание для печатных изданий) Волкова, В. М., Программные системы статистического Новосибирск: http://www.iprbooksho Семёнова, М. А., анализа. Обнаружение закономерностей в Новосибирский p.ru/91682.html Четвертакова, Е. С., данных с использованием системы R и государственный Вожов, С. С. языка Python: учебное пособие технический университет, 2017 6.2. Перечень ресурсов информационно-телекоммуникационной сети "Интернет" MachineLearning.ru [Электронный ресурс] / Профессиональный информационно-аналитический ресурс, посвященный машинному обучению, распознаванию образов и интеллектуальному анализу данных.Профессиональный информационно-аналитический ресурс, посвященный - Режим доступа: www.machinelearning.ru/wiki/index.php?title=Заглавная_страница, свободный - Загл. с экрана PZAD/README.md [Электронный ресурс] / Прикладные задачи анализа данных, Дьяконов - Режим доступа:https://github.com/Dyakonov/PZAD/blob/master/README.md, свободный - Загл. с экрана 6.3.Информационные технологии 6.3.1 Перечень лицензионного и свободно распространяемого программного обеспечения 1. Операционная система ROSA Enterprise Linux Desktop № RL00450-1-110518-01. RL00450-1-110518-17 от 11 мая 2018 г. 2. Операционная система Microsoft Windows 10 Professional Russian. Контракт № ПР/ФЕН/15/18 от 23.10.2015 г., договор № Пр/16/6 от 05 апреля 2016 г. 3. Программное обеспечение Microsoft Office 2013 Professional. Контракт № 405535 от 2 ноября 2015 года, контракт № ПР/ФЕН/15/18 от 23.10.2015 г. 4. Комплексная система антивирусной защиты Kaspersky Endpoint Security для бизнеса – стандартный Russian Edition. 500-999 Node 2 year Educational Renewal License. Лицензия № 13C8-190514-084943-783-1256 от 15.05.2019 5. Файловый архиватор 7z. Свободно распространяемое ПО 6. Браузеры Google Chrome, Mozilla, Opera. Свободно распространяемое ПО 7. Текстовый редактор NotePad++. Свободно распространяемое ПО 8. Программа просмотра файлов формата RPD Adobe Acrobat Reader DC. Свободно распространяемое ПО 9. Оболочка программирования Code: Blocks 17.12. Свободно распространяемое ПО 6.3.2 Перечень информационных справочных систем и профессиональных баз данных 1. Web of Science Core Collection – политематическая реферативно-библиографическая и наукометрическая (библиометрическая) база данных (http://webofscience.com) 2. Полнотекстовый архив ведущих западных научных журналов на российской платформе Национального электронно-информационного консорциума (НЭИКОН) (http://neicon.ru) 7. МАТЕРИАЛЬНО-ТЕХНИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ДИСЦИПЛИНЫ (МОДУЛЯ) Ауд. 2-15 2-16 4-303 4-305 4-306 4-307 4-318 Назначение Оборудование и технические средства обучения Компьютерный компьютеры, рулонный экран, стол преподавателя, столы компьютерные, класс переносной проектор Компьютерный интерактивная доска, компьютеры, маркерная доска, принтер, сканер, стол класс преподавателя, столы учебные Помещение для аудиоколонки, кондиционер, маркерная доска, столы компьютерные, столы самостоятельн учебные, компьютерная техника с возможностью подключения сети "Интернет" и ой работы обеспечением доступа в электронную информационно-образовательную среду университета Компьютерный аудиоколонки для проектора и интерактивной доски, аудиоколонки учебные, класс интерактивная доска, компьютеры, кондиционер, маркерная доска, проектор, столы компьютерные, столы учебные Компьютерный аудиоколонки для проектора и интерактивной доски, интерактивная доска, класс компьютеры, кондиционер, маркерная доска, проектор, столы компьютерные, столы учебные Компьютерный аудиоколонки, компьютеры, кондиционер, маркерная доска, столы компьютерные, класс столы учебные, телевизор Компьютерный компьютеры, маркерная доска, серверная стойка лаборатории МТС, стол класс преподавателя, столы компьютерные, столы учебный большой Вид Лек Сем зан Ср Пр Экзамен Конс Пр 8. МЕТОДИЧЕСКИЕ УКАЗАНИЯ ДЛЯ ОБУЧАЮЩИХСЯ ПО ОСВОЕНИЮ ДИСЦИПЛИНЫ (МОДУЛЯ) Самостоятельная работа студентов включает в себя решение задач, изучение лекционного материала, учебников, учебных пособий и иных материалов. Время и место самостоятельной работы выбираются студентами по своему усмотрению с учетом рекомендаций преподавателя. Самостоятельную работу над дисциплиной следует начинать с изучения учебно-методического комплекса, который содержит основные требования к знаниям, умениям, навыкам. Необходимо также вспомнить рекомендации преподавателя, данные в ходе лекционных занятий или консультаций, затем приступать к изучению отдельных разделов и тем. Подготовка к лекции заключается в следующем: • внимательно изучить материал предыдущей лекции; • целесообразно составить краткий конспект или схему, отображающую смысл и связи основных понятий данного раздела, включенных в него тем, а затем, полезно изучить выдержки из литературы; • узнать тему предстоящей лекции; • ознакомиться с учебным материалом по учебнику и учебным пособиям; • записать возможные вопросы, которые вы зададите лектору на лекции. Подготовка к практическим занятиям: • выполнить практические задания домашней работы; • внимательно изучить материал лекций, относящихся к данному семинарскому занятию, ознакомиться с учебным материалом по учебнику, учебным пособиям или рекомендованным электронным ресурсам; • выписать основные термины; • уяснить, какие учебные элементы остались неясными, и сформулировать вопросы, которые необходимо задать преподавателю на занятии или консультации; • готовиться можно индивидуально, парами или в составе малой группы, последние являются эффективными формами работы. Изучение дисциплины включает выполнение домашних и проектных работ. Изучение заканчивается экзаменом. При непосредственной подготовке к экзамену рекомендуется тщательно изучить формулировку каждого вопроса, понять его сущность. В соответствии со смыслом составить план ответа. План ответа желательно развернуть, приложив к нему ссылки на конкретные источники. Отметить пробелы в знаниях, которые следует ликвидировать в ходе консультации.