Технологии геномного анализа Illumina на основе биочиповых тестсистем и секвенирования NGS: Возможности, Успехи, Достижения! Илья Дёмин Специалист по продвижению продукции Moscow, 2011 Welcome to illumina! Миссия компании Инновационные разработки будущего в области генетического анализа От исследования генома человека… до валидации новых мишеней… Задача компании illumina состоит в достижении лидирующих позиций при разработке комплексных решений в области генетики и здравоохранения illumina в мире Illumina Китай (Пекин) Illumina BV (Нидерланды) Illumina Кембридж Illumina Хейвард (Хейвард, Калифорния) Главное управление Illumina (Сан Диего, Калифорния) Illumina Восток (Валингфорд, Коннектикут) Россия Корея Турция Израиль Персидский залив Джинан Ченгду Индия Тайланд Illumina Сингапур Illumina KK (Токио) Шанхай Тайвань Вьетнам Малайзия Южная Африка Австралия Новая Зеландия Компания основана в 1998 году, штаб-кватрира – San-Diego, США Коммерческий Производство/исследования и разработки Партнеры Дважды становилась №1 в рейтинге Forbes как наиболее быстро развивающаяся технологическая компания - 2007 и 2009; в 2008 попала в рейтинг NASDAQ-100 Сейчас – более 2500 сотрудников 3 Сегодня компания illumina предлагает: Секвенирование • Ресеквенирование • Секвенирование de novo • Выявление редких вариантов • Цифровое изображение картин экспрессии генов • Определение транскриптов • Секвенирование продуктов CHiP • Mетиллирование • Метиллирование de novo Генотипирование • Комплексное изучение генома человека и животных • Исследование биомаркеров и их валидация • Эпигенетические исследования • Проведение клинических экспериментов Анализ генной экспрессии • Профиль экспрессии • Поиск биомаркеров и их валидация • Выявление ассоциированных заболеваний • Проведение клинических экспериментов • Потребительские услуги Персонализированная медицина Молекулярную диагностику • Применение НИР • Продукты домашнего приготовления (Homebrew) • Диагностика сопутствующих заболеваний • Стандартный скрининг • Выявление инфекционных заболеваний MiSeq Genome Analyser Настольный ДНКсеквенатор ДНКсеквенатор HiSeq 1000/2000 ДНКсеквенатор Секвенирование HiScanSQ Анализатор биочипов + Сиквенсовый модуль BeadXpress Анализатор биочипов iScan Анализатор биочипов Анализ микроматриц Секвенирование сегодня: Новые горизонты ВОЗМОЖНОСТЬ ГЛУБОКОГО АНАЛИЗА МНОЖЕСТВА КРУПНЫХ, КОМПЛЕКСНЫХ ГЕНОМОВ И ТРАНСКРИПТОМОВ СОСТАВЛЯЕТ ОСНОВУ КРУПНЕЙШИХ ИССЛЕДОВАНИЙ В ОБЛАСТИ КАНЦЕРОГЕНЕЗА И ИЗУЧЕНИЯ ГЕНЕТИЧЕСКИХ ЗАБОЛЕВАНИЙ ЛЕЖИТ В ОСНОВЕ ТРАНСЛЯЦИОННОЙ МЕДИЦИНЫ ПОЗВОЛЯЕТ ОСУЩЕСТВЛЯТЬ DE NOVO СЕКВЕНИРОВАНИЕ: Человека Растений Животных Объектов потребительской геномики Общие технологические шаги NGS • • • Подготовка библиотек (матриц), оценка их качества – Выделение ДНК или РНК с ОТ - кДНК, – Разрушение ДНК на короткие участки (УЗ, ферменты) – Достройка ДНК под требования платформы секвенирования – лигирование адаптеров и индексов – Оценка качества библиотеки – Предамплификация – формирование кластеров Секвенирование – Секвенирование путём синтеза (Illumina), Анализ данных - биоинформатика – Сборка ридов – превращение данных от прибора в данные последовательности нуклеотидов, построение метрик качества – Сборка контигов – выравнивание ридов так, чтобы они сформировали разумную последовательность или ее варианты Шаг 1: Пробоподготовка Active Chromatin Genomic DNA (1-5 ug) Small RNA mRNA 10 ug total RNA 10 ug total RNA 10 ng ChIP-Sequencing Other Apps Фрагменты ДНК Затупление концов Фосфорилирование Аденилирование Лигирование адаптеров Epicentre Nextera Технология подготовки библиотек для NGS 2 часа, одна пробирка, 50 нг ДНК Разнообразие наборов для пробоподготовки Sample Prep Kits • Спецификация по типу исследования Геномная ДНК • Возможность мультиплексного анализа Экзомное обогащение ChiP-Seq Полногеномная экспрессия РНК и микроРНК Mate Pair секвенирование (фрагменты 2-5 kb) Flow Cell Поверхность flow cell покрыта газонов парных олигов Генерация кластеров: Гибридизация и комплиментарный синтез Сиквенсовый адаптер 3’ удлинение Генерация кластеров: • • • Двуцепочечная молекула денатурирует Первичная цепь вымывается Новая цепь закреплена на поверхности проточной ячейки Денатурация 2-цепочечной ДНК Новая цепь Первичная цепь сброс Генерация кластеров: Ковалентно-связанные одиночные молекулы разделены пространственно Единичные молекулы рандомно расположены на внутренней поверхности проточной ячейки Генерация кластеров: Амплификация по типу мостов • • Одноцепочечные молекулы становятся «мостиком» и гибридизуются на смежных олигах Затем происходит синтез новой цепи Генерация кластеров: Амплификация по типу мостов • Образуется двуцепочечный мостик Генерация кластеров: Амплификация по типу мостов • Цикл повторяется, пока не образуются структуры из множества мостов Генерация кластеров: • • Структура моста денатурирует Результат: 2 копии ковалентно-связанных одноцепочечных молекул Генерация кластеров: • «Отстающая цепь» вымывается, остаётся только «лидирующая» Генерация кластеров: Генерация кластеров: • Свободные 3’ концы блокируются • Сиквенсовый праймер гибридизуется на сиквенсовый адаптер Сиквенсовый праймер Амплификация кластеров 100um ~1000 молекул на ~ 1 um кластер ~7 миллиардов кластеров «Звёздное небо» из молекулярных кластеров ДНК Sequencing Process 1 Library prep (~ 6 hrs) Fragment DNA Repair ends / Add A overhang Ligate adapters Select ligated DNA 2 Automated Cluster Generation (~ 5 hrs) 1-8 samples Hybridize to flow cell Extend hybridized oligos Perform bridge amplification 3 Непосредственно секвенирование (~1,5-11 дней) Анализ последовательности DNA Первичная обработка данных Секвенирование путем синтеза (SBS) 3’ 5’ Цикл 1: Добавить реагенты для секвенирования Первое основание включено Удалить невключившиеся основания Детектировать сигнал A T G C C G T PPP T A C A Разблокировать и снять флуоресцентную метку Основание Флюоресценция C G A T Цикл 2: Добавить реагенты для секвенирования и повторить T A G A C T C C G A G C T C G A T 5’ • • • • Все 4 нуклеотида добавляются в одной реакции Высокая точность Секвенирование от основания к основанию Не возникает проблем с гомополимерными повторами Технология Clonal Single Molecule Array (Клональная амплификация на чипе ) >7 миллионов кластеров на проточную кювету MiSeq И >3 млрд кластеров на проточную кювету HiSeq 20 микрон 100 микрон 27 Новая разработка illumina Персональный NGS Встречайте! MiSeq 52.3 cm 12 cm Эволюция приборов NGS на примере платформы illumina Все технологические этапы работы с пробами объединены в одном приборе Генерация кластеров Флюидика для парно—концевых чтений Первичный и вторичный компьютерный анализ По цене обычного секвенатора по Сенгеру MiSeq – Подготовка, Запуск, Анализ Ампликоны Образец gDNA Подготовка бибилотеки 1,5 часа Клональная амплификация и Сиквенс 4,5 часа Биоинформатическая обработка данных 2 часа полностью автоматизированно) MiSeq – единственная система, дающая результат от образца до собранной последовательности за 8 часов 08:00:00 MiSeq: NGS это просто Next-Gen Made Simple: Load & Go Интуитивно понятный интерфейс Катридж с реагентами (одноразовый) Генерация кластеров (клональная амплификация) и блок флюидики для парноконцевых чтений встроены в прибор Радиометка (RFID) на реагентах и проточной ячейке Автоматическая настройка и регулировка Автоматизация «включил и ушел» Load Go Анализ данных MiSeq Характеристики и производительность Производительность оптимальна для работы с небольшими геномами (может сделать полный сиквенс нескольких бактериальных геномов de novo, достаточен для метогеномных исследований) Самый простой из существующих на рынке методов пробоподготовки для систем полногеномного секвенирования Наиболее проверенная по качеству и надежности данных технология на данный момент Недорогой прибор и недорогой запуск – ~50 долларов за бактериальный геном. «Все в одной коробке», включая биоинформатику Сравнительная характеристика секвенирующих платформ illumina HiSeq2000 HiSeq1000 HiScanSQ Genome Analyzer MiSeq Количество генерируемых данных, Гб > 600 > 300 > 150 95 >1 Количество проточных ячеек/каналов 2/16 1/8 1/8 1/8 1/1 Возможность мультиплекса, образцы 192 96 96 96 48 Одноконцевое чтение 2,5-3 млрд 1,3-1,5 млрд 600-750 млн 320 млн 3,4 млн Чтение с двух концов 5-6 млрд 2,5-3 млрд 1,2-1,5 млрд 640 млн 6,8 млн 2*100 2*100 2*100 2*150 2*150 Геномика, транскриптомика, эпигенетика Ампликоны, малые геномы и транскриптомы, проверка результатов клонирования и генной модификации Длина чтения, п.н. Применение в исследованиях Геномика, транскриптомика, эпигенетика Геномика, транскриптомика, эпигенетика Геномика, транскриптомика, эпигенетика Сколько стоит NGS? Изменение цены сиквенса полного генома человека как универсального ценового индикатора $10,000,000 500-кратное уменьшение стоимости за 3 года! $1,000,000 $100,000 $10,000 $1,000 2007 1G 2007 GA 2008 GAII 2009 GAIIx 2010 HiSeq 2011 HiSeq 2011 MiSeq MiSeq Удобное решение для любой лаборатории ВСЕ МЕТОДИКИ NGS В ОДНОМ ИНСТРУМЕНТЕ УДОБНОЕ, ДЕШЕВОЕ И ПРОИЗВОДИТЕЛЛЬНОЕ СЕКВЕНИРОВАНИЕ АМПЛИКОНОВ СЕКВЕНИРОВАНИЕ ГЕНОМОВ МИКРООРГАНИЗМОВ И МЕТАГЕНОМОВ БЫСТРЫЙ И КАЧЕСТВЕННЫЙ СКРИНИНГ Инфекционных болезней Качества лекарственных препаратов Контроля лечения Проверка клонов Целевое секвенирование участков генома Тканевое типирование КОНТРОЛЬ ЭКСПРЕССИИ И ГЕННОЙ РЕГУЛЯЦИИ • • • • Спектр задач, решаемых полногеномными секвенаторами Геномика – Секвенирование геномов de novo – Полное повторное секвенирование геномов (поиск SNP, структурных перестроек и вариаций, полногеномное генотипирование). – Копийность генов, структурные вариации ДНК Транскриптомика – Анализ РНК (RNA-Seq) – Изучение малых РНК (miRNA, siRNA, piRNA, esiRNA). – Измерение уровней мРНК, анализ изоформ мРНК, изучение некодирующих РНК, детекция новых транскриптов. – Анализ экспрессии генов, в том числе, в отдельной клетке, по чувствительности сравнимый с ПЦР. Эпигенетика – Иммунопреципитация хроматина с последующим секвенированием (ChIP-Seq). • Факторы транскрипции, Модификации гистонов – Анализ статуса метилирования ДНК в полногеномном масштабе (MeDIP-Seq). Исследование бактериома (метагеномика) – Прямое полногеномое типирование микроорганизмов и вирусов – Определение микробиологического состава популяций (экология, экосистемы, почвы) – Таксономия Объединение технологий NGS и микрочипов высокой плотности Платформа iScan –биочипы высокой плотности • Технология биочипов высокой плотности • 2 вида чипов: – Infinum – плотность 6К-240К5М маркеров /чип – GoldenGate – плотность 96-6К маркеров/чип • Производительность – 2-12 образцов на чип Технологическая платформа используется для высокопроизводительного анализа SNP; экспрессии генов; CNV (вариацию числа копий); генетических полиморфизмов MHC, ассоциированных с заболеваниями; метилирования; Есть панели на человека, мышь, овцу, лошадь, Custom-панели Технология BeadChip Приготовление микролунок с BeadChip Кремниевое покрытие Фотоустойчивый слой Микролунки 2um 2um 3.7um G G C T A A Однонуклеотидное удлинение GC CG CG AT A T C G AT dintrophenol-labeled ddNTPs TA biotin-labeled ddNTPs Окрашивание streptavidingreen anti-DNPred C C G A T T anti-streptavidinbiotin anti-AbDNP Усиление сигнала и визуализация A T INTENSITY G C INTENSITY INTENSITY C T Анализ данных. Genome Studio Анализ данных. Genome Studio: Наглядное и простое представление цитогенетических данных KaryoStudio Screenshot Known regions track Zooming, editing, reporting functions Found regions table Samples table with QC score Data display Known regions database Gene Information Chromosome information Семейство биочипов Illumina. Цель: изучение человека Семейство биочипов Illumina. Цель: изучение генома животных iScan with Autoloader2 Платформа BeadXpress – Суспензионные биочипы • • • • • Биочиповая технология для больших потоков образцов – 96-луночные плашки, 8луночные стрипы Мультиплексность – до ~384 образцов одновременно (технология штрих-кодирования микрочастиц) Возможность работы с ДНК, РНК и белками Готовые наборы VeraCode, и возможность создавать собственные наборы на основе этой технологии 2 флюорисцентные краски для 2 типов зондов Технология VeraCode КАПИЛЛЯРЫ ГОНЯТ ЧИПЫ К АНАЛИТИЧЕСКОЙ ПЛАСТИНЕ АНАЛИТИЧЕСКАЯ ПЛАСТИНА С СЕКЦИЯМИ ДЛЯ ЧИПОВ ЧИПЫ ПОПАДАЮТ В СЕКЦИИ ПЛАСТИНКИ ЧИПЫ РАСПОЛАГАЮТСЯ В ПОЗИЦИЯХ ОПТИМАЛЬНЫХ ДЛЯ СКАНИРОВАНИЯ Анализ чипов CCD ВОСПРИНИМАЮЩИЙ ЭЛЕМЕНТ ЧИП СЧИТЫВАЮЩИЙ ЛУЧ Pixel 240 220 200 180 160 140 120 100 80 60 40 20 220 200 390 180 340 160 140 290 200 240 180 340 160 290 140 180 160 120 240 290 140 160 190 240 120 140 240 120 140 100 190 120 190 100 120 140 190 100 100 140 80 100 140 80 140 80 80 80 90 60 90 90 60 90 60 60 40 0 ADC Output 220 440 200 240 160 290 390 340 180 BeadXpress Reader НАБОРЫ ЖИДКИХ ЧИПОВ ПЛАНШЕТ ДЛЯ ОБРАЗЦОВ РЕЗУЛЬТАТ ЗА СЧИТАННЫЕ МИНУТЫ ПАНЕЛЬ МУТАЦИЙ INSTRUMENT SPECIFICATIONS ПРОСТОЙ ФОРМАТ ИССЛЕДОВАНИЙ Стандартный 96-луночный планшет, или стрипы МУЛЬТИПЛЕКС НА ОДНУ ЛУНКУ 1 to 384 ПРОИЗВОДИТЕЛЬНОСТЬ 120 образцов/час при 10-плексном исследовании 80 образцов/час при 96-плексном исследовании ДЕТЕКЦИЯ 2 лазера, 2 цвета + штрих-код АВТОМАТИЗАЦИЯ Совместим со стандартным лабораторным оборудованием Совместим с любой ЛИС Платформа BeadXpress Решаемые задачи и реагентное обеспечение Технология – суспензионный (жидкостный) биочип Преимущества: •дешевизна точки за счет мультиплекса •большая производительность по образцам •SNP генотипирование с выской производительностью (по образцам) •Фармакогенетика (ADME панели – основные SNP, ассоциированные с метаболизмом лекарств) •Метиллирование •Анализ экспрессии генов •(Пользователь выбирает до 384 целевых генов и из них делается набор под стандартную 96 луночную плашку) •Наборы для пришивки белков и антител •Наборы для создания собственных гибирдизационных тест-систем Совмещая технологии… HiScanSQ Scan & Seq = HiScanSQ Единственная в своём роде система, совмещающая высокопроизводительный анализ биочипов и секвенирование нового поколения Возможности сканера – Загрузка и сканирование 4-х биочипов в реальном времени – Высокоточная оптическая система – 2 CCD камеры Разрешение сканера 0,5 микрон Возможности секвенирования Производительность данных – До 150 Gb за 1 запуск – Более 17,5 Gb в день Время 1 запуска – 1.5 дня при 1*36 bp SR – 8 дней при 2*100 bp PE Плотность кластеров – Более 1,5 миллиардов кластеров, прошедших фильтр и пригодных для анализа HiScanSQ Динамика числа публикаций (только по данным, полученным на платформе Illumina) 1000 900 800 700 600 500 400 300 200 100 0 Q1 Q2 Q3 2007 Q4 Q1 Q2 Q3 2008 Q4 Q1 Q2 Q3 2009 Q4 Q1 Q2 2010 Q3 Применение технологий illumina в мире Русский учёный Евгений Рогаев и его группа путём глубокого секвенирования ДНК семьи Николая II с помощью технологий Illumina определили состав генетического кода членов семьи, характерные мутации в геноме, отделили членов царской семьи от прислуги и доказали, что найденные отдельно останки соответствуют геномам царевича Алексея и княжны Анастасии СЕКВЕНИРОВАНИЕ ГЕНОМА РАКОВЫХ ОПУХОЛЕЙ Nature 2008. 456:66-72 Секвенирование генома лейкемии в сравнении с образцами нормальной ткани у того же пациента Возможность отделить геном раковой опухоли от генома здоровых клеток в одной пробе даже при небольшом количестве материала “Большинство из исследованных генов на период начала работы даже не рассматривались, как кандидаты на раковую предрасположенность” Greninger et al, PLOS 2010 Результат: • Удалось идентифицировать вирус H1N1 даже при сверх низких титрах • Собрать геном вируса de novo на основе полученных данных • Идентифицировать SNP в последовательностях H1N1 • Получить данные о вирусном и микробиологическом составе образцов • Характере и степени иммунного ответа «Глубокий» сиквенс региона V6 16s rRNA Идентификация не культивируемых видов Высокая чувствительность Мультиплексирование (сотня разных образцов за один запуск) Исследование пренатальной анеуплоидии путём сиквенса с низким покрытием в неинвазивной пренатальной диагностике –“Sequencing is the clear way to do non-invasive prenatal testing. … existing noninvasive Down syndrome tests are not very informative and provide variable results depending on the ethnicity of those taking the test.” DNA Sequence Miller Syndrome Tumor Profiling Cytogenetics Selected Publications Cytogenetics Algorithms WGAS/Algo WGAS www.illumina.com/publications Illumina Epigenomics Глубокое и быстрое изучение всех областей в полном геноме, транскриптоме и генной регуляции ChIP-Seq DNA Sequencing Targeted Resequencing Genotyping arrays GG geno on Veracode Bisulfite Seq Infinium methylation GG meth on Veracode ChI PSe q mRNA-Seq smRNA-seq Expression arrays Transcriptome Epigenome Genome