- UGENE
-
UGENE Тип Разработчик Унипро
Написана на Операционная система Языки интерфейса Последняя версия 1.11.3 (02 ноября 2012 года)
Лицензия Сайт UGENE — свободное кроссплатформенное биоинформационное программное обеспечение.[1]
В UGENE интегрированы десятки известных биоинформационных инструментов и алгоритмов, доступных как через графический интерфейс, так и через командную строку. Используя встроенный дизайнер вычислительных схем различные инструменты и алгоритмы могут быть скомпонованы в вычислительную схему.
Чтобы обеспечить максимальное быстродействие вычислений, UGENE использует возможности многоядерных ЦПУ и графических процессоров для оптимизации некоторых вычислительных задач. Имеется также возможность ускорить выполнение необходимой задачи используя облачные вычисления на Amazon EC2.
Содержание
Основные возможности
Ниже представлены основные возможности продукта:
- Создание, редактирование и аннотирование нуклеотидных и белковых последовательностей.
- Поиск в онлайн базах данных: NCBI, PDB, UniProtKB/Swiss-Prot, UniProtKB/TrEMBL
- Множественное выравнивание последовательностей: Clustal, MUSCLE, Kalign, MAFFT, T-Coffee
- Онлайн и локальный BLAST поиск
- Рестрикционный анализ со встроенной базой данных ферментов рестрикции REBASE
- Интегрированный пакет Primer3 для дизайна ПЦР праймеров
- Поиск повторов в последовательности ДНК: прямых, обратных, тандемных
- Конструирование точечных графиков для ДНК последовательностей
- Поиск сайтов связывания транскрипционных факторов с использованием весовых матриц или алгоритма SITECON
- Выравнивание коротких последовательностей с помощью Bowtie, BWA или модуля сборки контигов UGENE
- Поиск открытых рамок считывания
- Клонирование in silico
- Отображение 3D структуры белков для форматов PDB и MMDB formats, поддержка стереоэффекта
- Предсказание вторичной структуры белка с помощью алгоритмов GOR IV и PSIPRED
- Интегрированные пакеты HMMER2 и HMMER3
- Построение (используя интегрированный пакет PHYLIP) и отображение филогенетических деревьев
- Локальное выравнивание последовательности с использованием оптимизированной версии алгоритма Смита-Ватермана
- Комбинирование различных алгоритмов в вычислительную схему с помощью дизайнера вычислительных схем
- Поиск шаблона результатов различных алгоритмов в нуклеотидной последовательности с помощью дизайнера запросов
- Визуализация данных секвенирования (BAM-файлов) с помощью обозревателя сборок
Пользовательский интерфейс
Имеется три основных представления биологических данных в UGENE.
1. Редактор последовательностей позволяет визуализировать, анализировать и редактировать нуклеотидные или белковые последовательности. Также, для различных типов данных, в окне редактора последовательностей поддерживаются дополнительные возможности визуализации:
- Отображение 3D структуры белка
- Круговое представление геномов плазмид
- Редактор хроматограмм
- Отображение точечных графиков для ДНК последовательностей
- Визуализация данных секвенирования (сборок)
2. Редактор множественных выравниваний позволяет работать с нуклеотидным или белковым множественным выравниванием.
3. Визуализатор филогенетических деревьев.
Дизайнер вычислительных схем UGENE
Дизайнер вычислительных схем позволяет составлять и запускать сложные вычислительные схемы из различных алгоритмов.
Каждая схема состоит из вычислительных элементов. Дизайнер содержит элементы для большинства алгоритмов, интегрированных в UGENE. Также имеется возможность создавать собственные элементы.
Созданную вычислительную схему можно запускать как локально, так и удалённо, используя графический пользовательский интерфейс или через командную строку.
Дизайнер запросов UGENE
Дизайнер запросов позволяет анализировать заданную пользователем нуклеотидную последовательность используя несколько алгоритмов (например, Поиск повторов, Поиск открытых рамок считывания). При этом на взаимное расположение их результатов накладываются ограничения.
Запрос к последовательности представляется с помощью схемы, которая может быть создана как с помощью графического интерфейса, так и отредактирована вручную с помощью любого текстового редактора.
Результаты выполнения схемы для нуклеотидной последовательности сохраняются как аннотации в указанный файл формата GenBank.
Обозреватель сборок UGENE
Создание обозревателя сборок началось в 2010 году в качестве проекта-участника конкурса Illumina iDEA Challenge 2011. Обозреватель сборок позволяет визуализировать и изучать большие (до сотен миллионов коротких последовательностей) данные полногеномного секвенирования (Next-Generatoin Sequencing сборки). На сегодня, поддерживается единственный формат — BAM, являющийся бинарной версией формата SAM. Для просмотра данных в UGENE входной файл должен быть сконвертирован в базу данных — собственный формат UGENE. Такой подход обладает как преимуществами, так и недостатками. Недостатками являются время конвертирования, которое может быть значительным для больших файлов, а также размер баз данных. С другой стороны, конвертирование позволяет удобно обозревать всю сборку целиком, перемещаться по сборке и быстро переходить к плотно покрытым регионам. Вместе с тем, UGENE позволяет выбирать контиги из BAM-файла, которые будут сконвертированы. Таким образом, обозреватель позволяет открывать файлы большого объёма, такие как данные 1000 Genomes Project.
Поддерживаемые форматы биологических данных
- Последовательности и аннотации: FASTA (.fa), GenBank (.gb), EMBL (.emb), GFF (.gff)
- Множественные выравнивания: Clustal (.aln), MSF (.msf), Stockholm (.sto), Nexus (.nex)
- 3D структуры белка: PDB (.pdb), MMDB (.prt)
- Хроматограммы: ABIF (.abi), SCF (.scf)
- Короткие последовательности: Sequence Alignment/Map (SAM) (.sam), бинарная версия SAM (BAM) (.bam), ACE (.ace), FASTQ (.fastq)
- Филогенетические деревья: Newick (.nwk)
- Некоторые другие форматы: Bairoch (информация о ферментах), HMM (HMMER профили), PWM and PFM (весовые матрицы)
Цикл выпуска
Разработка проекта ведется компанией «Унипро». Каждая итерация длится приблизительно 6 недель, после чего выпускается очередная версия. Пользователям также доступны промежуточные предрелизные сборки.
Возможности, которые будут включены в следующие версии во многом определяются запросами со стороны пользователей.
Награды
В 2010 году UGENE был признан «Лучшим свободным проектом России — 2010» в категории «Групповой проект» в конкурсе журнала Linux Format.
Также, в 2010 году UGENE занял третье место во «Всероссийском ежегодном конкурсе проектов в сфере высокопроизводительных вычислений (High Performance Computing)», поддерживаемом корпорациями РОСНАНО и Intel.
В 2008 году проекту оптимизации алгоритма HMMER в UGENE было присуждено первое место на «Конкурсе по разработке программного обеспечения для процессора PowerXCell 8i», проводимого компанией «Т-Платформы».
Литература
- ↑ Okonechnikov, K.; Golosova, O.; Fursov, M.; the UGENE team (2012). «Unipro UGENE: a unified bioinformatics toolkit». Bioinformatics. DOI:10.1093/bioinformatics/bts091.
Аналогичное программное обеспечение
- Discovery Studio
- Gene Designer
- Vector NTI
- Geneious
- CLC Main Workbench
- MacVector
- QuickGene
- Ape
- SerialCloner
Ссылки
Категории:- Программное обеспечение по алфавиту
- Биоинформатика
- Свободное программное обеспечение, написанное на C++
Wikimedia Foundation. 2010.