Выравнивание последовательностей

Выравнивание последовательностей

В биоинформатике, выравнивание последовательностей — размещение последовательностей ДНК, РНК, и белков для того, чтобы увидеть места схожести, которые могут быть следствием функциональных, структурных или эволюционных взаимосвязей между последовательностями.[1]

Алгоритмы выравнивания последовательностей также используются в NLP.

Содержание

Графическое и текстовое представление

В большинстве представлений результата выравнивания, последовательности располагаются в строчках матрицы таким образом, что совпадающие элементы (нуклеотиды или аминокислоты) находятся один под другим (в одной колонке). «Разрывы» заменяются знаком «-» или ячейка остается пустой.

Выравнивание двух последовательностей аминокислот («цинковых пальцев»), сгенерированное программой ClustalW. В левой колонке находятся идентификаторы этих последовательностей в базе GenBank.
Обозначения: Буквы — Аминокислоты. Знаки: «*» — одинаковые. «.» — в одной цветовой группе. «:» — одинаковой формы.

Попарное выравнивание

Попарное выравнивание используется для нахождения совпадающих участков двух последовательностей. Различают глобальное и локальное выравнивание. Глобальное выравнивание применяется к «похожим» последовательностям приблизительно одинаковой длины и наглядно показывает разницу между этими последовательностями. Локальное выравнивание применяется для преимущественно отличающихся друг от друга последовательностей, которые предположительно могут содержат одинаковые участки. Следующий пример демонстрирует различие между результатами глобального и локального выравнивания для одинаковых исходных данных

  • Глобальное

SQ1: FTFTALILLAVAV
SQ2: F--TAL-LLA-AV

  • Локальное

SQ1: FTFTALILL-AVAV
SQ2: --FTAL-LLAAV--


Глобальное выравнивание базируется на алгоритме Нидлмана-Вунша, локальное — на алгоритме Smith-Waterman.

Алгоритмы поиска

Применяются для поиска в больших базах данных последовательностей, схожих с некой заданной последовательностью по указанным критериям. Применяемое выравнивание — локальное. Для повышения скорости поиска используются различные эвристические методы. Наиболее известные программы — BLAST ([1]) и FASTA3x

Множественное выравнивание

По сути является попарным выравниваем всех последовательностей в неком наборе и нахождение наиболее «оптимального» общего выравнивания. Применяется преимущественно для нахождения консервативных регионов в наборе последовательностей. Также используется в процессах установления эволюционных связей путем построения филогенетических деревьев. Так как множественное выравниваение является NP-полной задачей[2][3], различные ее решения базируются на эвристиках, генетических и иных алгоритмах комбинаторной оптимизации. Наиболее известные программы, осуществляющие множественное выравнивание — Clustal([2]) и T-coffee

Структурное выравнивание

Применяется к белкам и RNA-последовательностям, для которых известна их вторичная и/или третичная структура.

Примечания

  1. Mount DM. Bioinformatics: Sequence and Genome Analysis. — 2nd. — Cold Spring Harbor Laboratory Press: Cold Spring Harbor, NY., 2004. — ISBN 0-87969-608-7
  2. Wang L, Jiang T. (1994). «On the complexity of multiple sequence alignment». J Comput Biol 1 (4): 337–48. PMID 8790475.
  3. Just W. (2001). Computational complexity of multiple sequence alignment with SP-score. J Comput Biol 8(6):615-23.


Wikimedia Foundation. 2010.

Игры ⚽ Нужно решить контрольную?

Полезное


Смотреть что такое "Выравнивание последовательностей" в других словарях:

  • Множественное выравнивание последовательностей — (multiple sequence alignment) это выравнение трех и более биологических последовательностей, обычно белков, ДНК, или РНК. Категория: Генетика …   Википедия

  • Выравнивание — Выравнивание: Выравнивание данных Выравнивание нагрузки Выравнивание последовательностей Выравнивание строк …   Википедия

  • UGENE — UGENE …   Википедия

  • Геномика — Геномика  раздел молекулярной генетики, посвящённый изучению генома и генов живых организмов. Содержание 1 История 2 Разделы геномики 2.1 …   Википедия

  • Список эпизодов сериала «4исла» — «4исла» (англ. Numb3rs)  детективный телевизионный сериал, созданный Николасом Фалаччи и Шерил Хьютон. Премьера телесериала состоялась 23 января 2005 года, 18 мая 2010 года CBS закрыл сериал …   Википедия

  • Биоинформатика — математические методы компьютерного анализа в сравнительной геномике (геномная биоинформатика). разработка алгоритмов и программ для предсказания пространственной структуры белков (структурная биоинформатика). исследование стратегий,… …   Википедия

  • BLAST — У этого термина существуют и другие значения, см. BLAST (значения). BLAST Тип Биоинформатика Разработчик Altschul S.F., Gish W., Miller E.W., Lipman D.J., NCBI Операционная система UNIX, Linux, Apple Macintosh, Microsoft Windows …   Википедия

  • Алгоритм Нидлмана — Алгоритм Нидлмана  Вунша  это алгоритм для выполнения выравнивания двух последовательностей (будем называть их и ), который используется в биоинформатике при построении выравниваний аминокислотных или нуклеотидных последовательностей.… …   Википедия

  • ВЕРОЯТНОСТЕЙ ТЕОРИЯ — занимается изучением событий, наступление которых достоверно неизвестно. Она позволяет судить о разумности ожидания наступления одних событий по сравнению с другими, хотя приписывание численных значений вероятностям событий часто бывает излишним… …   Энциклопедия Кольера

  • Printf — printf  обобщённое название семейства функций или методов стандартных или широкоизвестных коммерческих библиотек, или встроенных операторов некоторых языков программирования, используемых для форматного вывода  вывода в различные потоки …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»