Загрузил romashalin322

Baza MGU Analiz dannykh i II By Lxnkyyy Zefffirka

реклама
База МГУ Анализ данных и ИИ (By Lxnkyyy, Zefffirka)
В какой стране была разработана программа создания компьютеров пятого
поколения?
США
Япония Верно
Германия
КНР
Республика Корея
В каком десятилетии появился термин «искусственный интеллект» (“Artificial
Intelligence”)?
1950-е Верно
1960-е
1970-е
1980-е
1990-е
Какой исследователь стал родоначальником интеллектуального анализа
данных (Data Mining)?
Алексей Ляпунов
Андрей Колмогоров
Григорий Пятецкий-Шапиро Верно
Иван Петровский
Пафнутий Чебышёв
Укажите ОШИБКУ в характеристиках больших данных (Big Data):
объем
скорость обновления
разнообразие
изменчивость
однородность Верно
Наука о данных (Data Science) – это:
математика
информатика
наука об обработке данных Верно
криминалистика
наука о хранении данных
Укажите ОШИБКУ среди элементов «Триады Самарского»
модель
алгоритм
схема Верно
программа
Тест Тьюринга состоит в определении:
пиковой производительности компьютера
устойчивости интернет соединения
того, каковы когнитивные возможности человека
того, кто является собеседником (человек или компьютер) Верно
времени автономной работы компьютера
В каком десятилетии появился термин «искусственный интеллект» (“Artificial
Intelligence”)?
1950-е Верно
1960-е
1970-е
1980-е
1990-е
Укажите, какой комплекс подходов к разработке методов ИИ является
основным:
восходящий и нисходящий Верно
горизонтальный и вертикальный
индивидуальный и групповой
ассоциативный и симуляционный
теоретический и эмпирический
Какой исследователь впервые сформулировал понятия «датология» и «наука о
данных»?
Норберт Винер
Уильям Кливленд
Петер Наур Верно
Джим Грей
Алан Тьюринг
Какой порядковой величиной будет исчисляться количество информации,
собранное человечеством, к 2025 году?
зетабайт
бронтобайт
эксабайт
геопбайт Верно
терабайт
Какой российский (советский) ученый одним из первых уделил внимание
методологической стороне анализа данных, сформулировав триаду «модель –
алгоритм – программа»?
Гурий Марчук
Андрей Колмогоров
Александр Самарский Верно
Лев Понтрягин
Андрей Тихонов
Укажите верные утверждения
Исследователь данных, в отличие от аналитика данных, использует более
совершенные методы статистики, аналитики, моделирования Верно
Исследователь данных, в отличие от аналитика данных, не может
самостоятельно формулировать задачи исследования
Исследователь данных, в отличие от аналитика данных, не может
непосредственно участвовать в анализе данных
Исследователь данных, в отличие от аналитика данных, определяет
приоритетность бизнес-целей Верно
Исследователь данных, в отличие от аналитика данных, не используют
специальных программных средств и моделей
Что из перечисленного НЕ ОТНОСИТСЯ к типам данных?
Структурированные данные
Полиструктурированные данные Верно
Полуструктурированные данные
Неструктурированные данные
Какие инструменты могут применяться для устранения «узких мест» при работе
с данными (укажите все верные варианты)?
Запросы к каталогам данных Верно
Запросы к базам данных Верно
Специальные языки программирования Верно
Библиотеки программного обеспечения Верно
Среды разработки («ноутбуки») Верно
«Машинное обучение» или, более широко, «технологии искусственного
интеллекта» - это…
использование мощности компьютера для процесса верификации и
модификации строимой модели, применение методов интеллектуального
анализа данных Верно
использование мощности компьютера для создания полной замены
естественному интеллекту
использование мощности компьютера для обучения людей с помощью
информационных технологий
использование мощности компьютера для моделирования работы мозга
человека и животных
Единственным критерием пригодности разработанной (с применением
технологий искусственного интеллекта) модели является
Быстрота функционирования
Дешевизна использования
Высокие результаты тестирования
Успешная практика применения Верно
С помощью какой метафоры описывается непрозрачность многих моделей,
доработанных с помощью технологий искусственного интеллекта?
Кот в мешке
Черный квадрат
Кот Шредингера
Черный ящик Верно
Что из перечисленного НЕ ОТНОСИТСЯ к метаданным?
Аудиофайл «М. Равель – Болеро» Верно
Список актеров фильма «В джазе только девушки»
Картина «Апофеоз войны» в формате JPG Верно
Подпись Ренуара на картине «Девочка с зонтиком»
Что НЕ относится к «узким местам», связанным с данными?
Большая часть времени исследователей данных уходит на поиск и подготовку
данных
Высокая стоимость извлечения данных по причине изолированности хранилищ
Высокая стоимость согласования и интеграции данных
Высокие риски утери данных вследствие киберугроз Верно
Какому ученому принадлежат слова: «Нет прикладных наук, есть приложения
наук»?
Луи Пастер Верно
Норберт Виннер
Александр Самарский
Владимир Арнольд
Жан Батист Ламарк
Какие из предложенных вариантов являются основными типами машинного
обучения?
Обучение с учителем Верно
Обучение без учителя Верно
Обучение с наказанием
Обучение с подкреплением Верно
Что НЕ является составляющей обучения с учителем?
Алгоритм машинного обучения
Тренировочные данные
Предикторные переменные Верно
Прогнозная модель
Какие основные задачи решает обучение с учителем?
Задача классификации Верно
Задача кластеризации
Задача регрессии Верно
Задача корреляции
Назовите основные виды классификаций:
Бинарная Верно
Троичная
Многоклассовая Верно
Моноклассовая
Как реализуется принцип бритвы Оккама в машинном обучении?
Усложнение модели
Масштабирование модели
Расширение модели
Упрощение модели Верно
Выберите подобласти обучения без учителя
Классификация
Кластеризация Верно
Снижение размерности данных Верно
Регрессионный анализ
Кластеризация – это:
разбиение данных на группы по некоторому критерию их «схожести» Верно
разбиение данных по заданным классам
структурирование данных
обнаружение в данных скрытых связей
маркировка данных экспертом
Какой из приведенных примеров является графическим изображением
использования снижения размерности?
Функция (линейная регрессия)
Разделение объектов прямой линией
Сжатие трехмерного «швейцарского рулета» в двумерное
подпространствоВерно
Выделение во множестве данных скоплений данных
Как называется классический пример набора данных, применяемого для
многоклассовой классификации?
Ирисы Фишинга
Гладиолусы Фишера
Ирисы Фишера Верно
Гладиолусы Фишинга
Какой феномен нельзя сопоставить с теоремой «Никаких бесплатных обедов»?
Эффект второй системы
Золотой молоток
Молоток Маслоу
Пирамида Маслоу Верно
В каком году была опубликована концепция упрощенной клетки головного
мозга? 1943
Кто является автором концепции перцептрона?
Уоррен Маккалок
Фрэнк Розенблатт Верно
Уолтер Питтс
Дэвид Румельхарт
Функция активация в алгоритме перцептрона не может иметь вид:
единичной ступенчатой функции
ступенчатой функции Хевисайда
функции единичного скачка
убывающей линейной функции Верно
Соотношение каких двух факторов обеспечивает устойчивое состояние
перцептрона?
Два класса линейно разделимы; темп обучения большой
Два класса линейно не разделимы; темп обучения большой
Два класса линейно разделимы; темп обучения небольшой Верно
Два класса линейно не разделимы; темп обучения небольшой
При построении сложных моделей функция Хевисайда наиболее часто
заменяется на:
Сигмоид Верно
Гиперболический тангенс
Линейная функция
Полулинейная функция
Какой из представленных подходов будет наиболее «дорогостоящим» в
условиях крупномасштабного машинного обучения?
Стохастический градиентный спуск
Пакетный градиентный спуск Скорее всего
Итеративный градиентный спуск
Онлайновый градиентный спуск
В каком году открыт алгоритм обратного распространения ошибки? 1986
Какая буква в кириллице является самой сложной для распознавания ИИ?
Ш
Л
Ы Верно
М
Какие шаги необходимы для создания надежной системы?
Множественные повторы процесса обучения Верно
Применение одного набора тренировочных и тестовых данных
Применение различных тренировочных и тестовых наборов данных Верно
Переподгонка (переобучение) системы
Найти коэффициент сходства по Жаккару множеств A={a, b, c, d, e} и B={a, c, e,
f, g}. Выберите правильный ответ:
1/2
2/3
4/5
3/7 Верно
1
Какой метод представления данных для их последующей обработки
используется при поиске сходных документов?
метод пословного градиентного спуска
метод разбиения документа на k-кусочки Верно
метод машинного перевода
метод оценки размеров документов
метод локально-чувствительного хеширования
Пусть наш документ Y – это строка nbxdnbd, а k=2. Выберите верное
множество кусочков для Y, если использовать подход создания
мультимножества:
nb, bx, xd, db, bd
nb, bx, xd, dn, nb, bx
nb, bx, xd, dn, nb, bd Верно
nb, bx, xd, dn, bd
Хешированная подпись документа – это:
вектор из кусочков текста, построенный с помощью алгоритма снижения
размерности (методом minhashing) Верно
криптографическая подпись
набор случайно выбранных слов из документа
набор наиболее часто встречающихся в документе букв
набор наиболее часто встречающихся в документе k-кусочков
Какое значение k для задания k-кусочков считается надежным при проведении
анализа сходства исследовательских статей?
2
7
5
9 Верно
Стоп-слова в документе – это:
знаки препинания
специальные термины, тормозящие работу программы
случайный набор слов в документе
наиболее общие слова, такие как "и", "вы", "к" Верно
наиболее редко встречающиеся слова
Матричное представление множеств – это:
случайное хеширование множеств
запись наименований множеств в специальную матрицу
представление множеств характеристической матрицей Верно
представление множеств в виде матричных слайдов
задание множеств случайными матрицами
Хеширование множества – это:
определенное отображение множества в заданный набор чисел Верно
случайная перестановка элементов множества
уменьшение размера множества
выбор отдельных элементов из множества
увеличение размера множества
В каких пределах оценивается погрешность значений сходства наборов
кусочков множеств при их трансформации в подписи?
Менее 30%
Более 20%
Более 10%
Менее 10% Верно
Какую задачу решает локально-чувствительное хеширование документов?
сокращение объема данных
кодирование данных
случайный отбор данных
сокращение количества сравниваемых пар документов Верно
улучшение хешированных подписей
Какие понятия НЕ используются в методах локально-чувствительного
хеширования документов?
ложный негатив
ложный позитив
пара-кандидат
лучший кандидат Верно
Какой подход лежал в основе в основе метода локально-чувствительного
хеширования документов?
случайный выбор пар-кандидатов
разбиение подписей документов на блоки и их поблочное сравнение Верно
поиск документов с идентичными подписями
поиск документов с подписями, совпадающими хотя бы в одном компоненте
Если мы хотим сократить время поиска сходных пар, мы должны:
сокращать количество ложных негативов
допускать больше ложных негативов
сокращать количество ложных позитивов Верно
допускать больше ложных позитивов
Какое утверждение верно в отношении связи коэффициента сходства по
Жаккару и вероятностью стать парой-кандидатом?
коэффициент сходства по Жаккару и вероятность стать парой-кандидатом не
связаны
чем выше коэффициент сходства по Жаккару, тем выше вероятность стать
парой-кандидатом Верно
чем ниже коэффициент сходства по Жаккару, тем выше вероятность стать
парой-кандидатом
Значения S-образной кривой – это:
вероятности для пары документов стать парой-кандидатом Верно
вероятности появления ложных негативов
вероятности появления ложных позитивов
вероятности превышения порога отбора
Характерные (особые) слова в документе – это:
знаки препинания
слова с наибольшим значением TF.IDF Верно
наиболее часто встречающиеся слова
наиболее общие слова, такие как "и", "вы", "к
Какие основные классы сущностей характерны для рекомендательных систем?
«Разработчики»
«Товары» Верно
«Услуги»
«Пользователи» Верно
«Клиенты»
Какие данные лежат в основе работы рекомендательной системы?
профили «товаров»
профили пользователей
экспертные оценки
справочные данные
данные из матрицы предпочтений Верно
Целью работы рекомендательной системы является:
прогнозирование значений взамен пропусков в матрице предпочтений Верно
кластеризация пользователей
нахождение схожих по профилю «товаров»
нахождение самых востребованных товаров
выявление самых перспективных пользователей
Метод совместной фильтрации в рекомендательных системах – это:
предсказание значений взамен пропусков в матрице предпочтений с помощью
схожих пользователей Верно
выявление схожих по профилю пользователей
выявление схожих по профилю «товаров»
нахождение самых востребованных товаров
очистка первоначальных данных в матрице предпочтений
В большинстве случаев рекомендательная система:
Не предлагает пользователю осуществлять ранжирование товаров
Предлагает пользователю осуществлять ранжирование всех товаров
Предлагает пользователю осуществлять ранжирование тех товаров, которым
он поставит низкую оценку
Предлагает пользователю осуществлять ранжирование тех товаров, которым
он поставит высокую оценку Верно
Какие данные о картине на продажу можно отнести к ее профилю
(метаинформации)?
Имя художника Верно
Год создания Верно
Название Верно
Процентный анализ использования цвета
Художественное направление Верно
Укажите ошибку в списке терминов, относящихся к методу «дерево решений».
Лист
Ствол Верно
Корневой узел
Предикат
В каждом узле дерева классификации «товаров» находится:
метка заданного класса «товара»
пример «товара» из заданного класса
предикат (условие), задающий правило классификации Верно
критерий, обеспечивающий 100%-ную гарантию принадлежности «товара» к
данному классу
утвержденное экспертное заключение о принадлежности «товара» конкретному
классу
Выберите верные соображения для получения наилучшего предиката
Один из потомков получает все или большинство положительных
примеровВерно
Потомки имеют одинаковую вероятность получения как положительных, так и
отрицательных примеров
Один из потомков получает все или большинство отрицательных
примеровВерно
Один из потомков не получает ни положительных, ни отрицательных примеров
Нормализация данных в матрице предпочтений рекомендательной системы –
это:
приведение всех данных к единой шкале измерений
отбрасывание значений данных, выходящих за пределы заданного диапазона
уменьшение значений данных до заданного размера
усреднение значений данных по каждому «товару»
уменьшение величин данных на среднее значение по каждому «товару» Верно
Алгоритмы анализа рыночной корзины – это:
алгоритмы нахождения лучшей рекламы товаров
алгоритмы поиска ассоциативных правил Верно
алгоритмы определения объема корзины
алгоритмы обучения покупателей правилам комплектования корзины
алгоритмы нахождения самых популярных товаров
В случае использования метода «рыночной корзины» в целях обнаружения
заимствований (плагиата) к категории «basket» будут относиться
предложения Верно
устойчивые выражения
слова
документы
Какие множества будут являться частыми, если известно, что является частым
множество ABCD?
ABD Верно
CA Верно
D Верно
BC Верно
Выберите основные элементы рыночной корзины
items
units
objects
baskets
boxes
Какие значения метрик характерны для товаров-каннибалов?
Высокий lift
Высокий score
Высокий z_score Верно
Низкий confidence
Какие параметры при анализе рыночной корзины задаются заранее?
стоимость всех товаров корзине
значение поддержки Верно
значение достоверности
количество товаров в корзине
привязываемость
Величина расстояния между кластерами это Расстояние между их центроидами Верно
Расстояние между кластроидами
Расстояние между крайними точками кластеров
Расстояние между K-средними
Какой термин обозначает наиболее репрезентативную для кластера точку?
Центроид
Аггломероид
K-средняя
Кластроид Верно
Сходство точек может определяться с помощью:
Евклидовых метрик Верно
Расстояние по Жаккару Верно
Расстояние по косинусу Верно
Расстояние редактирования Верно
При каких условиях кластеризация будет выглядеть просто?
Кластеризация происходит в двумерном пространстве Верно
Кластеризация происходит в многомерном пространстве
Кластеризация осуществляется на больших объемах данных
Кластеризация осуществляется на маленьких объемах данных Верно
Какие критерии могут использоваться для определения кластроида?
Наибольшее максимальное расстояние до других точек
Наименьшая сумма квадратов расстояний до других точек Верно
Наибольшее среднее расстояние до других точек
Наименьшее максимальное расстояние до других точек Верно
Какие типы наборов точек характерны для BFR-алгоритма?
Discard set Верно
Disrupt set
Compression set Верно
Retained set Верно
Maintained set
Какие условия соблюдаются в случае эффективного применения
BFR-алгоритма?
Оси кластеров являются фиксированными Верно
Оси кластеров не являются фиксированными
Эллипсы могут находиться под углом
Кластеры нормально распределены хотя бы в одном измерении
Кластеры нормально распределены в каждом измерении Верно
В каком году появляется алгоритм CURE?
1998
2000
2001 Верно
2006
Какая методология психологии может быть использована в технологиях
искусственного интеллекта для индивидуализированной мотивации
обучающихся?
Психоанализ
Транзактный анализ Верно
Экзистенциальный анализ
Гештальт-анализ
Негативные последствия какого эффекта могло бы минимизировать
использование искусственного интеллекта в процессе мотивации
обучающихся?
Эффект Даннинга-Крюгера
Эффект Манделы
Эффект Барнума-Форера
Эффект Зейгарник Верно
Что относится к составляющим мотивирующего оценивания?
Корректировка контрольно-измерительных материалов
Диагностика Верно
Обратная связь Верно
Контроль
Рефлексия над использованными методами преподавания
Какие принципы присущи эффективному мотивирующему оцениванию?
Выставление отметки
Акцентирование успехов Верно
Акцентирование неудач
Близость деятельности и оценки во времени Верно
Индивидуализированный характер обратной связи Верно
Зачем нужен анализ сентимента в социально-экономических исследованиях?
Для оценки ожиданий различной природы экономических агентов
Для решения задач наукастинга (Nowcasting)
Лучшая спецификация моделей за счет дополнительной информации
Все ответы верны Верно
Чем может помочь распознавание изображений и компьютерное зрение в
социально-экономических исследованиях?
Уточнить оценки социально-экономических характеристик в отдельных
регионах
Дополнить текущие статистические базы за счет получения оценок для
регионов, не предоставляющих первичную информацию
Выявлять оппортунистическое поведение среди экономических агентов
Все ответы верны Верно
В чем заключается смысл использования ИИ для масштабирования и снижения
трудоемкости?
Требуется меньше усилий человека для анализа большего объема
информации Верно
Можно построить одну модель ИИ и применять ее к любым новым данным
Можно значительно сократить издержки на заработные платы аналитиков и
разработчиков
Все ответы верны
Какое направление является наиболее перспективным для оценки моделей
ИИ?
Метод наименьших квадратов
Метод максимального правдоподобия
Эволюционные алгоритмы Верно
Методы стохастической оптимизации
Какое направление применения ИИ не относится к сфере
социально-экономических исследований:
Предиктивная аналитика (Forecasting and predictions)
Анализ сентимента и NLP (Sentiment analysis and Natural Language Processing
(NLP))
Симуляция искусственной жизни (Artificial Life Simulation (ALS)) Верно
Масштабирование и снижение трудоемкости (Process automation and
optimization)
Скачать