Распределенная поддержка исследовательской деятельности Егерев Сергей Викторович Акустический институт имени академика Н.Н.Андреева Захарова Светлана Арменовна Российская академия народного хозяйства и государственной службы ИНИОН, 18 марта 2015 г. Распределенная исследовательская деятельность (distributed problem solving) Это совместное выполнение проектов исследователями или экспертами, использующими новые коммуникационные технологии для удаленной работы и выполняющими эту работу вне рамок традиционных лабораторий. Термин используется по аналогии с известным термином «распределенные вычисления», определяющим совместную «параллельную» работу множества пространственно разнесенных компьютеров. Краудсорсинг (crowdsourcing) – букв. «ресурсы толпы», т. е. использование внешних по отношению к организации или компании интеллектуальных ресурсов за счет вовлечения добровольцев в решение исследовательских или инновационных задач компании (Стеффен Рот) Проекты простых решений Всего 850 публикаций за 5 лет Динамика публикаций (статьи и обзоры), в которых crowdsourcing упоминается или в названии, или в аннотации или в списке ключевых слов Источник: Scopus Почему опыт распределенной поддержки исследований важен для России? • Многолетний дисбаланс кадровой структуры российской науки • Неблагоприятная динамика затратности российских научных исследований • и др. Некоторые условия для успеха краудсорсингового проекта • Инициатор – организация с ярким брендом • Должна быть сформулирована ясная задача – с разделением творческой и рутинной частей • Задача должна быть интересна широкому кругу участников, иметь элементы «челленджа» • Призовая стратегия • Система IT-поддержки данного проекта • Наличие открытых информационных источников • и др. Известные краудсорсинговые проекты в т.ч. простых решений eBird.org. Орнитологический проект. Поиск и идентификация редких видов птиц силами добровольцев и профессионалов. Тип – вклада “Photo+comments” Folding@home («свертывание-на-дому»). Проект распределенных вычислений для проведения компьютерного моделирования свёртывания молекул белка. Тип – вклада “Volunteer computing + game” Сайт: http://folding.stanford.edu SETI@home (Search for Extra-Terrestrial Intelligence at Нome) Проект распределенных вычислений, использующий для поиска радиосигналов внеземных цивилизаций Тип – вклада “Volunteer computing” Сайт http://setiathome.berkeley.edu Простые решения с корректировкой В поисках могилы Чингисхана • Тип проекта – «поиск иголки в стоге сена при том, что вид иголки неизвестен» • Организатор - National Geographic • Объект обработки – спутниковые снимки обширного участка Северной Монголии 6000 км2 • Число участвующих добровольцев – 10000 • Трудозатраты - 30000 человеко-часов или 3,4 человеко-лет, более 1 миллиона отметок. • Мотивация – слава первооткрывателя и вообще интересно. Lin A. Y. M. et al. Crowdsourcing the Unknown: The Satellite Search for Genghis Khan //PloS one. – 2014. – Т. 9. – №. 12. – С. e114046. В поисках могилы Чингисхана – стадии проекта -Участники (их число – n) получают случайные частично перекрывающиеся фрагменты спутниковых съемок и делают пометки - Вклады аккумулируются, математически ищут консенсус - На место обнаруженных артефактов выезжает археологическая экспедиция Lin AYM, Huynh A, Lanckriet G, Barrington L (2014) Crowdsourcing the Unknown: The Satellite Search for Genghis Khan. PLoS ONE 9(12): e114046. doi:10.1371/journal.pone.0114046 http://127.0.0.1:8081/plosone/article?id=info:doi/10.1371/journal.pone.0114046 В поисках могилы Чингисхана Пример вклада отдельного добровольца Результат вклада коллектива В поисках могилы Чингисхана Процедурная часть на примере выявления древнего артефакта A . Метки как результат коллективного вклада формируют кластер – признак чего-то интересного на местности Б. Плотность консенсуса В. Кластеры помечаются кругами с радиусом, пропорциональным плотности консенсуса В поисках могилы Чингисхана Некоторые итоги проекта - На основе консенсуса более миллиона вкладов-пометок выявлены около 100 потенциальных артефактов - Наземная экспедиция подтвердила из этого числа 55 ранее неизвестных археологических объектов от бронзового века до монгольского периода, включая захоронения, мегалитические конструкции и фортификацию древнего города - Могилу Чингисхана не нашли Еще примеры научного краудсорсинга Археология Картография Биология Биология Разное Фармацевтика и медицина Климатология Астрономия Биология Изучают обрывки египетских папирусов и восстанавливают тексты Промеряют глубины в шельфовых районах и уточняют рельеф дна Запись и обработка сигналов летучих мышей Расшифровка генов болезнетворных бактерий (несколько проектов) Поиск ключевых данных по массивам текстов научных публикаций (несколько проектов) Клинические испытания лекарств и методов на больших массивах добровольцев (новые краудсорсинговые подходы) Выявляют зародыши циклонов по спутниковым снимкам Уточняют мелкую структуру поверхности Луны по спутниковым снимкам. Выращивают специальные растения, привлекательные для пчел и сообщают о текущих результатах Еще примеры … Биология Медицина Математика Океанология Океанология Морская биология Наблюдают за процессом гнездования и семейной активности птиц Пополняют базу данных «Кто, как и от чего лечится» Распределенное решение математических задач (много проектов) Обнаруживают вредные и подозрительные объекты - инспекция морского дна Мониторинг концентрации фитопланктона в приповерхностном слое с помощью диска Секки (ХIХ в.) и мобильного приложения (XXI в.) Мониторинг разных аспектов «морской жизни» по данным подводных съемок Морская биология Классификация песен китов и выявление совпадающих песен. Биология Устанавливают кормушку во дворе и ведут статистику посещений Заключение-1 Science sourcing (Scisourcing) Citizen science (термин вошел в состав Большого Оксфордского словаря в 2014 году) Заключение-2 Citizen science – примерная схема Открытое Краудсорсинговые R&D проекты по заказу корпораций (типа Mechanical Turk) Закрытое Участие в проекте Классификация систем получения знаний по степени открытости Традиционная наука с «принудительным» раскрытием промежуточных Традиционная наука данных, например, по («Мертоновского» типа) требованию журналов или фондов Закрытый Citizen science Открытый Общественный доступ к промежуточным данным Franzoni, Chiara, and Henry Sauermann. "Crowd science: The organization of scientific research in open collaborative projects." Research Policy 43.1 (2014): 1-20. Заключение-3