UGENE

UGENE
UGENE
UGENE logo
Working with genomic data in UGENE 1.9.0
Тип

Биоинформационная программа

Разработчик

Унипро

Написана на

C++, QtScript

Операционная система

Кроссплатформенное программное обеспечение

Языки интерфейса

русский, английский, чешский, китайский

Последняя версия

1.11.3 (02 ноября 2012 года)

Лицензия

GPL

Сайт

http://ugene.unipro.ru

UGENE — свободное кроссплатформенное биоинформационное программное обеспечение.[1]

В UGENE интегрированы десятки известных биоинформационных инструментов и алгоритмов, доступных как через графический интерфейс, так и через командную строку. Используя встроенный дизайнер вычислительных схем различные инструменты и алгоритмы могут быть скомпонованы в вычислительную схему.

Чтобы обеспечить максимальное быстродействие вычислений, UGENE использует возможности многоядерных ЦПУ и графических процессоров для оптимизации некоторых вычислительных задач. Имеется также возможность ускорить выполнение необходимой задачи используя облачные вычисления на Amazon EC2.

Содержание

Основные возможности

Ниже представлены основные возможности продукта:

Пользовательский интерфейс

Редактор множественных выравниваний

Имеется три основных представления биологических данных в UGENE.

1. Редактор последовательностей позволяет визуализировать, анализировать и редактировать нуклеотидные или белковые последовательности. Также, для различных типов данных, в окне редактора последовательностей поддерживаются дополнительные возможности визуализации:

  • Отображение 3D структуры белка
  • Круговое представление геномов плазмид
  • Редактор хроматограмм
  • Отображение точечных графиков для ДНК последовательностей
  • Визуализация данных секвенирования (сборок)

2. Редактор множественных выравниваний позволяет работать с нуклеотидным или белковым множественным выравниванием.

3. Визуализатор филогенетических деревьев.

Дизайнер вычислительных схем UGENE

Дизайнер вычислительных схем

Дизайнер вычислительных схем позволяет составлять и запускать сложные вычислительные схемы из различных алгоритмов.

Каждая схема состоит из вычислительных элементов. Дизайнер содержит элементы для большинства алгоритмов, интегрированных в UGENE. Также имеется возможность создавать собственные элементы.

Созданную вычислительную схему можно запускать как локально, так и удалённо, используя графический пользовательский интерфейс или через командную строку.

Дизайнер запросов UGENE

Дизайнер запросов

Дизайнер запросов позволяет анализировать заданную пользователем нуклеотидную последовательность используя несколько алгоритмов (например, Поиск повторов, Поиск открытых рамок считывания). При этом на взаимное расположение их результатов накладываются ограничения.

Запрос к последовательности представляется с помощью схемы, которая может быть создана как с помощью графического интерфейса, так и отредактирована вручную с помощью любого текстового редактора.

Результаты выполнения схемы для нуклеотидной последовательности сохраняются как аннотации в указанный файл формата GenBank.

Обозреватель сборок UGENE

Обозреватель сборок

Создание обозревателя сборок началось в 2010 году в качестве проекта-участника конкурса Illumina iDEA Challenge 2011. Обозреватель сборок позволяет визуализировать и изучать большие (до сотен миллионов коротких последовательностей) данные полногеномного секвенирования (Next-Generatoin Sequencing сборки). На сегодня, поддерживается единственный формат — BAM, являющийся бинарной версией формата SAM. Для просмотра данных в UGENE входной файл должен быть сконвертирован в базу данных — собственный формат UGENE. Такой подход обладает как преимуществами, так и недостатками. Недостатками являются время конвертирования, которое может быть значительным для больших файлов, а также размер баз данных. С другой стороны, конвертирование позволяет удобно обозревать всю сборку целиком, перемещаться по сборке и быстро переходить к плотно покрытым регионам. Вместе с тем, UGENE позволяет выбирать контиги из BAM-файла, которые будут сконвертированы. Таким образом, обозреватель позволяет открывать файлы большого объёма, такие как данные 1000 Genomes Project.

Поддерживаемые форматы биологических данных

  • Последовательности и аннотации: FASTA (.fa), GenBank (.gb), EMBL (.emb), GFF (.gff)
  • Множественные выравнивания: Clustal (.aln), MSF (.msf), Stockholm (.sto), Nexus (.nex)
  • 3D структуры белка: PDB (.pdb), MMDB (.prt)
  • Хроматограммы: ABIF (.abi), SCF (.scf)
  • Короткие последовательности: Sequence Alignment/Map (SAM) (.sam), бинарная версия SAM (BAM) (.bam), ACE (.ace), FASTQ (.fastq)
  • Филогенетические деревья: Newick (.nwk)
  • Некоторые другие форматы: Bairoch (информация о ферментах), HMM (HMMER профили), PWM and PFM (весовые матрицы)

Цикл выпуска

Разработка проекта ведется компанией «Унипро». Каждая итерация длится приблизительно 6 недель, после чего выпускается очередная версия. Пользователям также доступны промежуточные предрелизные сборки.

Возможности, которые будут включены в следующие версии во многом определяются запросами со стороны пользователей.

Награды

В 2010 году UGENE был признан «Лучшим свободным проектом России — 2010» в категории «Групповой проект» в конкурсе журнала Linux Format.

Также, в 2010 году UGENE занял третье место во «Всероссийском ежегодном конкурсе проектов в сфере высокопроизводительных вычислений (High Performance Computing)», поддерживаемом корпорациями РОСНАНО и Intel.

В 2008 году проекту оптимизации алгоритма HMMER в UGENE было присуждено первое место на «Конкурсе по разработке программного обеспечения для процессора PowerXCell 8i», проводимого компанией «Т-Платформы».

Литература

  1. Okonechnikov, K.; Golosova, O.; Fursov, M.; the UGENE team (2012). «Unipro UGENE: a unified bioinformatics toolkit». Bioinformatics. DOI:10.1093/bioinformatics/bts091.

Аналогичное программное обеспечение

Ссылки


Wikimedia Foundation. 2010.

Игры ⚽ Нужна курсовая?

Полезное


Смотреть что такое "UGENE" в других словарях:

  • UGENE — Infobox Software name = UGENE developer = Unipro latest release version = 1.2.0 latest release date = release date|2008|09|19 programming language = C++, QtScript operating system = Cross platform language = English, Russian genre =… …   Wikipedia

  • ugène — stimugène …   Dictionnaire des rimes

  • Edgerton, Harold E(ugene) — born April 6, 1903, Fremont, Neb., U.S. died Jan. 4, 1990, Cambridge, Mass. U.S. electrical engineer and photographer. He was a graduate student at Massachusetts Institute of Technology when in 1926 he developed a flash tube that could produce… …   Universalium

  • Edgerton, Harold E(ugene) — (6 abr. 1903, Fremont, Neb., EE.UU.–4 ene. 1990, Cambridge, Mass.). Ingeniero eléctrico y fotógrafo estadounidense. Era un estudiante graduado del MIT (Instituto de Tecnología de Massachusetts), cuando en 1926 desarrolló un tubo de flash capaz de …   Enciclopedia Universal

  • E. F. Young, Jr. — E. F. Young, Jr. (July 1898 [1900 U.S. Census, Lauderdale County, Mississippi, household of Fred Young accessed on http://www.ancestry.com] ndash; 1950) was an American businessman specializing in hair care products.BiographyE(ugene) F(red) Young …   Wikipedia

  • HMMER — Infobox Software name = HMMER developer = Sean Eddy latest release version = 2.3.2 latest release date = release date|2003|10|03 programming language = C language = English genre = Bioinformatics tool license = GPL website =… …   Wikipedia

  • Pierre Dufresne — est un acteur québécois né le 7 avril 1927 à Montréal (Canada), décédé le 31 octobre 1984 d une crise cardiaque. Sommaire 1 Biographie 2 Filmographie 3 …   Wikipédia en Français

  • Bioinformatics — For the journal, see Bioinformatics (journal). Map of the human X chromosome (from the NCBI website). Assembly of the human genome is one of the greatest achievements of bioinformatics. Bioinformatics …   Wikipedia

  • Tandem repeat — Tandem repeats occur in DNA when a pattern of two or more nucleotides is repeated and the repetitions are directly adjacent to each other. [1] Contents 1 Example 2 Terminology 3 Uses …   Wikipedia

  • A Brand New Me — Infobox Album | Name = A Brand New Me Type = Album Artist = Dusty Springfield Released = 15 January 1970 (US) 10 April, 1970 (UK) Recorded = Sigma Sound Studios, Philadelphia, September October 1969 Genre = Pop, Soul Length = 25:52 Label =… …   Wikipedia


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»