Расписание факультативного курса «NGS»:
11, 18, 25 апреля (четверг) |
15:35 – 18:55 |
16, 23, 30 мая (четверг) |
15:35 – 18:55 |
Аудитория 409
Описание курса
Блок 1. Экспериментальные аспекты NGS
Общее представление об NGS, принципы и этапы развития. Пиросеквенирование (технология 454) — основа метода, его особенности, преимущества и недостатки, области применения. Illumina: принципы пробоподготовки, генерации кластеров и секвенирования. Illumina: развитие технологии, её преимущества, недостатки и области применения, линейка приборов. Полупроводниковое секвенирование:
основа метода, его особенности, преимущества и недостатки, области применения, линейка приборов. Секвенирование путем лигирования (Solid): основа метода, его особенности, преимущества и недостатки, области применения. Секвенирование с помощью ДНК-наноглобул — принцип и варианты реализации. Мономолекулярное секвенирование: Helicos, SMRT, нанопоровое секвенирование. Перспективные разработки в области NGS (в том числе российские).
Особенности подготовки образцов: полногеномное секвенирование, секвенирование транскриптома (RNA-seq), целевое обогащение, секвенирование ампликонов, анализ метилирования. Методические подходы для de novo сборки геномов и фазирования гаплотипов — библиотеки с длинными вставками, синтетические длинные чтения, анализ конформации хроматина. Пробоподготовка для секвенирования генетического материала из единичных клеток. Пробоподготовка для секвенирования деградированной ДНК.
Блок 2. Контроль качества результатов секвенирования
Основные источники ошибок секвенаторов Illumina. Источники ошибок высокопроизводительных секвенаторов других фирм. Способы обнаружения ошибок. Способы коррекции ошибок. Цифровая нормализация.
Блок 3. Сборка de novo
Основные парадигмы построения алгоритмов для de novo сборки геномов: deBruijn графы и OLC графы. Сложности, возникающие при проведении сборки из коротких чтений. Скаффолдинг. Оценка качества сборки. N50. Основные этапы сборки эукариотического генома. Особенности сборки с использованием данных, полученных с помощью секвенаторов PacBio и Oxford Nanopore. Особенности de novo сборки транскриптомных данных. Оценка качества транскриптомной сборки. Сложности возникающие при проведении транскриптомной сборки.
Блок 4. Картирование, анализ однонуклеотидных вариантов и изменений копийности
Общие методы нахождения парного выравнивания последовательностей. Оценка значимости для парного выравнивания, численные оценки качества выравнивания. Алгоритмические подходы, используемые для решения задачи картирования, структуры данных: BWT, суффиксный массив, хэш-таблицы. Локальные, глобальные и разрывные выравнивания. Уникальные и множественно картированые прочтения. Краткий обзор параметров основных картировщиков (на примере bwa, bowtie2, STAR). Особенности картирования парных чтений, особенности картирования РНК. Обзор форматов sam/bam. Картирование без выравнивания. Итеративное картирование (чтений HiC). Поиск (calling) SNP, основные идеи, проблемы, влияние покрытия и алгоритма картирования. Оценка копийности фрагментов по картированию.
Блок 5. Аннотация геномов
Простой поиск открытых рамок считывания. Кодирующий потенциал последовательности. Периодичность кодирующих последовательностей. Применение марковских моделей, нейронных сетей и теории информации для поиска генов. Аннотация по гомологии и ab-initio. Оценка качества генной модели. Поиск некодирующих элементов генома. Псевдогены.
Блок 6. Методы количественного анализа экспрессии
Возникновение и развитие методов анализа экспрессии: гибридизационные методы, методы, основанные на ПЦР, методы, основанные на секвенировании. RNA-seq. Структура и формат данных. Подходы к анализу экспрессии. Типы аппроксимирующих распределений. Оценка эффективного размера библиотеки.
Нормализация серии библиотек. Влияние множественных картирований на оценку уровня экспрессии. Метрики уровня экспрессии генов: RPKM, FPKM, количество ридов.
Статистический анализ различия в уровнях экспрессии. Проблема множественного тестирования при анализе экспрессии. Сравнение программ для поиска дифференциально-экспрессирующихся генов. Особенности анализа экспрессии изоформ.
Обработка результатов анализа экспрессии с использованием категорий Gene Ontology.
Блок 7. Анализ ДНК-ДНК и ДНК-РНК взаимодействий
Принципы организации хроматина. Экспериментальные методы: обзор 3C-методов; метод Hi-C; сингл-селл Hi-C; ДНК-РНК методы. Биоинформатический анализ: анализ Hi-C данных; построение теплокарт; предсказание топологических доменов. Дизайн научных исследований на основе Hi-C данных.
Блок 8. Эпигенетика
Эпигенетическая регуляция транскрипции. Важные биологические примеры: активация и репрессия промоторов и энхансеров, импринтинг, инактивация X-хромосомы. Основные процессы, модификации ДНК и гистоновых белков. Бисульфитное секвенирование. Специфика контроля качества и выравнивания ридов. Сингл-сел BS-seq. ChIP-seq для модификаций гистонов. Интеграция уровней эпигенетической регуляции.
Блок 9. Метагеномика
Оценка таксономического разнообразия метагенома на основе использования 16S рРНК последовательностей. Альфа, бета, гамма разнообразие. Оценка состава микробиоты с использованием полнометагеномного секвенирование. Биннинг. Сборка метагенома. Аннотация и анализ метаболических путей.