Без темы
<<  Что делать, если… СЛИШКОМ ХОЛОДНО Что мы знаем о луке  >>
Что можно делать с одиночной последовательностью ДНК
Что можно делать с одиночной последовательностью ДНК
Как выявить векторные сегменты в Вашей последовательности
Как выявить векторные сегменты в Вашей последовательности
Как это выглядит
Как это выглядит
VecScreen - output
VecScreen - output
Как интерпретировать результаты VecScreen
Как интерпретировать результаты VecScreen
Почему надо бояться загрязнения ДНК чужеродными сегментами
Почему надо бояться загрязнения ДНК чужеродными сегментами
Карта рестрикционных фрагментов
Карта рестрикционных фрагментов
REBASE
REBASE
RestrictionMapper
RestrictionMapper
Output
Output
Дизайн праймеров для PCR
Дизайн праймеров для PCR
Primer3
Primer3
Что можно варьировать
Что можно варьировать
Анализ ДНК-состава
Анализ ДНК-состава
Зачем анализировать статистику ДНК
Зачем анализировать статистику ДНК
Как это делать
Как это делать
Какие программы выбрать
Какие программы выбрать
Как искать повторы в ДНК
Как искать повторы в ДНК
Dot-Plot approach
Dot-Plot approach
Как оценить сколько одинаковых слов много, а сколько нет
Как оценить сколько одинаковых слов много, а сколько нет
Геном-специфические повторы: RepeatMasker
Геном-специфические повторы: RepeatMasker
Поиск (белок-кодирующих) генов
Поиск (белок-кодирующих) генов
Output
Output
Более точное предсказание –GeneMark (HMM)
Более точное предсказание –GeneMark (HMM)
Heuristic Model input window
Heuristic Model input window
Output
Output
Предсказание внутренних экзонов (позвоночные)
Предсказание внутренних экзонов (позвоночные)
MZEF
MZEF
MZEF - output
MZEF - output
Поиск генов: GenomeScan
Поиск генов: GenomeScan
GenomeScan - output
GenomeScan - output
Сборка геномных фрагментов в контиги: EGassembler
Сборка геномных фрагментов в контиги: EGassembler
EGassembler - output
EGassembler - output
Поиски регуляторных сигналов
Поиски регуляторных сигналов
Positional weight matrix (PWM)
Positional weight matrix (PWM)

Презентация: «Что можно делать с одиночной последовательностью ДНК». Автор: irena. Файл: «Что можно делать с одиночной последовательностью ДНК.ppt». Размер zip-архива: 1684 КБ.

Что можно делать с одиночной последовательностью ДНК

содержание презентации «Что можно делать с одиночной последовательностью ДНК.ppt»
СлайдТекст
1 Что можно делать с одиночной последовательностью ДНК

Что можно делать с одиночной последовательностью ДНК

Как исключить векторные фланки? Рестрикционная карта Вашей последовательности Дизайн праймеров Анализ ДНК-состава Повторы в ДНК Как искать гены? (прокариоты, эукариоты) Тривиальные случаи применения сборки фрагментов

2 Как выявить векторные сегменты в Вашей последовательности

Как выявить векторные сегменты в Вашей последовательности

Просто сравнить с исходным вектором? VecScreen: http://www.ncbi.nlm.nih.gov/VecScreen/VecScreen_docs.html “VecScreen is a system for quickly identifying segments of a nucleic acid sequence that may be of vector origin. NCBI developed VecScreen to minimize the incidence and impact of vector contamination in public sequence databases. GenBank Annotation Staff use VecScreen to verify that sequences submitted for inclusion in the database are free from contaminating vector sequence. Any sequence can be screened for vector contamination using the VecScreen Web site”

3 Как это выглядит

Как это выглядит

4 VecScreen - output

VecScreen - output

“Non-significant similarity found” – ok! В нашем случае:

5 Как интерпретировать результаты VecScreen

Как интерпретировать результаты VecScreen

Если сегменты гомологии с векторов по краям – просто удалить их Если в нескольких местах по всей длине – проще всего… все это выбросить (!) Не надо выбрасывать, если: Вектор не ваш – он может быть просто родственным (100% сходство!) Ваш ген мог быть основой для вектора Но: если Вы видите неожиданную гомологию к E.coli или дрожжам – задумайтесь!

6 Почему надо бояться загрязнения ДНК чужеродными сегментами

Почему надо бояться загрязнения ДНК чужеродными сегментами

Быть уверенным в том, что Вы анализируете (и не тратить время зря) Ошибки распространяются по базам данных с экспоненциальной скоростью: неверная информация, проблемы сборки и т.п. В Swiss-Prot даже были специальные записи (P39188 – P39195: Alu-derived белки) Будьте внимательны при работах с базами данных! (неожиданно высокая гомология к бактериям в эукариотах и т.п.)

7 Карта рестрикционных фрагментов

Карта рестрикционных фрагментов

Еще одна возможность проверить сиквенс на идентичность с тем, что Вы ожидаете (годится, также, для длинных геномных кусков вплоть до бактериальных геномов) Все сайты рестрикции лежат в базе данных REBASE (http://rebase.neb.com/) Как предсказать список рестрикционных фрагментов?

8 REBASE

REBASE

9 RestrictionMapper

RestrictionMapper

10 Output

Output

11 Дизайн праймеров для PCR

Дизайн праймеров для PCR

http://biotools.umassmed.edu/

12 Primer3

Primer3

Output – простой текстовый формат, предлагает четыре варианта пар праймеров, первый из которых размечен на последовательности

13 Что можно варьировать

Что можно варьировать

Искать только левый или правый праймер, или пробу для гибридизации Предлагать свой собственный левый или правый праймер Выбрать последовательность, которую Вы хотите включить или наоборот исключить из амплифицированного фрагмента Выбрать диапазон длины фрагмента Выбрать диапазон размера олигонуклеотидов, GC-состав, точку плавления …

14 Анализ ДНК-состава

Анализ ДНК-состава

G+C – состав Статистика ди- и три- нуклеотидов (не путайте статистику тринуклеотидов и codon usage) Частота более длинных слов

15 Зачем анализировать статистику ДНК

Зачем анализировать статистику ДНК

GC-состав: (динамика плавления) Ди- и тринуклеотиды - уникальная геномная подпись: Идентификация загрязнения вектором Свидетельство параллельного переноса Островки патогенности Классификация метагеномных контигов Выявление origin репликации Более длинные слова – регуляторные сигналы

16 Как это делать

Как это делать

Это самые элементарные программы – обычно установлены на компьютере EMBOSS (European Molecular Biology Open Software Suite) – бесплатный пакет (~ 100 модулей, только под Unix) Web: http://www.genomatix.de/cgi-bin/tools/tools.pl http://bioweb.pasteur.fr/intro-uk.html Осмысленно смотреть “скользящим окном”

17 Какие программы выбрать

Какие программы выбрать

18 Как искать повторы в ДНК

Как искать повторы в ДНК

Внутренние повторы – сегменты, встречающиеся чаще, чем ожидается Могут быть несовершенными – отличаться одной или несколькими буквами Что лучше – 5 точных букв, 9 из 10 или 111 из 145? Разные score. Какой выбрать порог? => Много программ и несопоставимые результаты. Нельзя верить отрицательным результатам

19 Dot-Plot approach

Dot-Plot approach

http://arbl.cvmbs.colostate.edu/ molkit/

20 Как оценить сколько одинаковых слов много, а сколько нет

Как оценить сколько одинаковых слов много, а сколько нет

Статистическая модель – следует вероятность слова Самый простой расчет: CTGA - 10 раз в последовательности длины 5000. Оценим вероятность: в каждой позиции - ?*?*?*? = 1/256. Всего должно быть – 5000*1/256 ~ 20 раз Если от ожидания отличается меньше, чем в 2 раза – все нормально. То есть от 10 до 40 раз - ок

21 Геном-специфические повторы: RepeatMasker

Геном-специфические повторы: RepeatMasker

http://www.repeatmasker.org/cgi-bin/WEBRepeatMasker

22 Поиск (белок-кодирующих) генов

Поиск (белок-кодирующих) генов

Прокариоты – просто поиск длинных открытых рамок считывания (ORF) (> 100 aa) ORFing – например, ORF finder на сайте NCBI

http://www.ncbi.nlm.nih.gov/ gorf/gorf.html

23 Output

Output

Открытые рамки сортированы по длине Графическое представление – ссылка на белковую последовательность, соответствующую ORF Можно сразу запустить бласт этой последовательности по разным подмножествам GenBank Если надо найти CDS в эукариотической мРНК – абсолютно аналогично

24 Более точное предсказание –GeneMark (HMM)

Более точное предсказание –GeneMark (HMM)

Использует Hidden Markov Models Более короткие рамки Выбор из нескольких перекрывающихся рамок Более точное предсказание старта

http://opal.biology.gatech.edu/ GeneMark/

25 Heuristic Model input window

Heuristic Model input window

Если Вы знаете геном, то лучше выбрать не Heuristic Model и указать организм

26 Output

Output

Графический формат – посмотреть дома!

27 Предсказание внутренних экзонов (позвоночные)

Предсказание внутренних экзонов (позвоночные)

Принцип: ищут те участки, которые статистически похожи на белок-кодирующие сегменты (codon usage, статистика ДНК) Выбирают только те из них, которые фланкированы подходящими последовательностями (splicing sites) То есть (!), ищут только внутренние, белок-кодирующие экзоны

28 MZEF

MZEF

http://rulai.cshl.edu/tools/genefinder/human.htm

29 MZEF - output

MZEF - output

Результат работы программы на сегменте генома человека ~2 Kbp, включающем 2 полных экзона и экзон на границе сегмента Типичный выход – ~1/2

30 Поиск генов: GenomeScan

Поиск генов: GenomeScan

На основе HMM (учитывает статистику ДНК) и динамического программирования Разные объекты предсказывают разные модули Использует белковую гомология

http://genes.mit.edu/ genomescan.html

31 GenomeScan - output

GenomeScan - output

32 Сборка геномных фрагментов в контиги: EGassembler

Сборка геномных фрагментов в контиги: EGassembler

Чистит последовательности Маскирует повторы Маскирует векторные сегменты Маскирует сегменты геномов органелл Собирает контиги

http://egassembler.hgc.jp/

33 EGassembler - output

EGassembler - output

34 Поиски регуляторных сигналов

Поиски регуляторных сигналов

Пока поиск слишком несовершенен Самые лучшие программы не доступны on-line Результаты программ должен курировать специалист Почти все подходы используют Positional Weight Matrix (PWM)

35 Positional weight matrix (PWM)

Positional weight matrix (PWM)

Information content

I = ?j ?b f(b,j)[log f(b,j) / p(b)]

«Что можно делать с одиночной последовательностью ДНК»
http://900igr.net/prezentacija/biologija/chto-mozhno-delat-s-odinochnoj-posledovatelnostju-dnk-69904.html
cсылка на страницу

Без темы

1004 презентации
Урок

Биология

136 тем
Слайды
900igr.net > Презентации по биологии > Без темы > Что можно делать с одиночной последовательностью ДНК