stringtranslate.com

ФИЛИП

Пакет вывода PHYLogeny ( PHYLIP ) — это бесплатный пакет программ вычислительной филогенетики для вывода эволюционных деревьев ( филогений ). [ 1] Состоит из 65 портативных программ, т.е. исходный код написан на языке программирования C. Начиная с версии 3.696, оно лицензируется как программное обеспечение с открытым исходным кодом ; версии 3.695 и старше были проприетарным бесплатным ПО . Релизы выпускаются в виде исходного кода и в виде предварительно скомпилированных исполняемых файлов для многих операционных систем , включая Windows (95, 98, ME, NT, 2000, XP, Vista), Mac OS 8 , Mac OS 9 , OS X , Linux ( Debian , Red Hat ) . ; и FreeBSD с FreeBSD.org. [2] Для всех программ пакета написана полная документация, которая включена в него. Программы в пакете philip были написаны профессором Джозефом Фельзенштейном с факультета геномных наук и факультета биологии Вашингтонского университета в Сиэтле. [3]

Методы (реализуемые каждой программой), доступные в пакете, включают методы экономии , матрицы расстояний и методы правдоподобия , включая начальную загрузку и деревья консенсуса. Типы данных, которые можно обрабатывать, включают молекулярные последовательности , частоты генов, сайты и фрагменты рестрикции , матрицы расстояний и дискретные символы. [2]

Каждая программа управляется через меню, которое спрашивает пользователей, какие параметры они хотят установить, и позволяет им начать вычисления. Данные считываются в программу из текстового файла, который пользователь может подготовить с помощью любого текстового процессора или текстового редактора (но этот текстовый файл не может быть в специальном формате текстового процессора, вместо этого он должен быть в простом формате ASCII или только в текстовом формате) . формат). Некоторые программы анализа последовательностей, такие как программа выравнивания Clustal W, могут записывать файлы данных в формате PHYLIP. Большинство программ ищут данные в файле с именем infile. Если программы philip не находят этот файл, они просят пользователя ввести имя файла данных. [2]

Формат файла

Компоненты программ Phillip используют несколько различных форматов, каждый из которых относительно прост. Программы для анализа выравниваний последовательностей ДНК, выравниваний последовательностей белков или дискретных символов (например, морфологических данных) могут принимать эти данные в последовательном или чередующемся формате, как показано ниже.

Последовательный формат:

5 42Турция AAGCTNGGGC ATTTCAGGGT GAGCCCGGGC AATACAGGGT ATSalmo schiAAGCCTTGGC AGTGCAGGGT GAGCCGTGGC CGGGCACGGT ATH. sapiensACCGGTTGGC CGTTCAGGGT ACAGGTTGGC CGTTCAGGGT AAШимпанзе AAACCCTTGC CGTTACGCTT AAACCGAGGC CGGGACACTC ATГорилла AAACCCTTGC CGGTACGCTT AAACCATTGC CGGTACGCTT AA

Чередованный формат:

5 42Турция AAGCTNGGGC ATTTCAGGGTСалмо шиAAGCCTTGGC ATGGCAGGGTH. sapiensACCGGTTGGC CGTTCAGGGTШимпанзе AAACCCTTGC CGTTACGCTTГорилла AAACCCTTGC CGGTACGCTTGAGCCCGGGC AATACAGGGT ATGAGCCGTGGC CGGGCACGGT АТACAGGTTGGC CGTTCAGGGT ААAAACCGAGGC CGGGACACTC ATAAACCATTGC CGGTACGCTT AA

Цифры представляют собой количество таксонов (в примере, показанном выше), за которым следует количество символов (выровненных нуклеотидов или аминокислот в случае молекулярных последовательностей). Данные о сайте рестрикции также должны включать количество ферментов.

По умолчанию имена ограничены 10 символами и должны быть заполнены пробелами, чтобы иметь такую ​​длину, и сразу за ними следуют символьные данные с использованием однобуквенных кодов, хотя имя с ограничением в 10 символов может быть изменено путем незначительной модификации кода (путем изменение nmlngthв philip.h и перекомпиляция). В именах разрешены все печатные символы ASCII/ISO, за исключением круглых скобок (" (" и " )"), квадратных скобок (" [" и " ]"), двоеточия (" :"), точки с запятой (" ;") и запятой (" ,"). Пробелы, включенные в выравнивание, игнорируются.

Многие программы для филогенетического анализа, включая широко используемые программы RAxML [4] [5] и IQ-TREE [6] , используют формат phylip или небольшую модификацию этого формата, называемую расслабленным форматом philip.

Расслабленный формат Филипа (последовательный):

5 42Турция AAGCTNGGGCATTTCAGGGTGGAGCCCGGGCAATACAGGGTATSalmo_schiefermuelleri AAGCCTTGGCAGTGCAGGGTGAGCCGTGGCCGGGCACGGTATH_sapiens ACCGGTTGGCCGTTCAGGGTACAGGTTGGCCGTTCAGGGTAAШимпанзе AAACCCTTGCCGTTACGCTTAAACCGAGGCCGGGACACTCATГорилла AAACCCTTGCCGGTACGCTTAAACCATTGCCGGTACGCTTAA

Основным отличием смягченного формата philip является отсутствие ограничения в 10 символов и отсутствие необходимости заполнять имена пустыми буквами для достижения этой длины (хотя заполнение имен для начала матрицы символов в одной и той же позиции может улучшить читаемость для пользователя). В этом примере смягчения в именах используются подчеркивания, а не пробелы, а также пробелы между именами и выровненными символьными данными; Часто хорошей практикой является избегать пробелов в именах таксонов и отделять символьные данные от имени при создании файлов. Как и файлы строгого формата phylip, файлы расслабленного формата phylip могут иметь чередующийся формат и включать пробелы и конечные строки в данных последовательности.

Программы, использующие данные о расстояниях, например neighborпрограмма, реализующая метод соединения соседей , также используют простой формат матрицы расстояний, включающий только количество таксонов, их названия и числовые значения расстояний:

Матрица расстояний Филипа:

7Крупный рогатый скот 0,0000 1,6866 1,7198 1,6606 1,5243 1,6043 1,5905Мышь 1,6866 0,0000 1,5232 1,4841 1,4465 1,4389 1,4629Гиббон ​​1,7198 1,5232 0,0000 0,7115 0,5958 0,6179 0,5583Оранжевый 1,6606 1,4841 0,7115 0,0000 0,4631 0,5061 0,4710Горилла 1,5243 1,4465 0,5958 0,4631 0,0000 0,3484 0,3083Шимпанзе 1,6043 1,4389 0,6179 0,5061 0,3484 0,0000 0,2692Человек 1,5905 1,4629 0,5583 0,4710 0,3083 0,2692 0,0000

Цифра указывает на количество таксонов, и существуют такие же ограничения для названий таксонов. Обратите внимание, что эта матрица симметрична, а диагональ имеет значения 0 (поскольку расстояние между таксоном и самим собой по определению равно нулю).

Программы, использующие деревья в качестве входных данных, принимают деревья в формате Ньюика — неофициальном стандарте, согласованном в 1986 году авторами семи основных пакетов филогении. Вывод записывается в файлы с именами типа outfileи outtree. Деревья, на которых записаны, outtreeимеют формат Ньюика.

Компонентные программы

Рекомендации

  1. ^ Фельзенштейн, Дж. (1981). «Эволюционные деревья на основе последовательностей ДНК: подход максимального правдоподобия». Журнал молекулярной эволюции . 17 (6): 368–376. Бибкод : 1981JMolE..17..368F. дои : 10.1007/BF01734359. PMID  7288891. S2CID  8024924.
  2. ^ abc «Страница с общей информацией PHYLIP» . Проверено 14 февраля 2010 г.
  3. ^ Джозеф Фельзенштейн (август 2003 г.). Выводы о филогениях. Синауэр Ассошиэйтс. ISBN 0-87893-177-5. Архивировано из оригинала 22 октября 2011 г. Проверено 24 марта 2006 г.
  4. ^ Стаматакис, Александрос (1 мая 2014 г.). «RAxML версия 8: инструмент для филогенетического анализа и пост-анализа крупных филогений». Биоинформатика . 30 (9): 1312–1313. doi : 10.1093/биоинформатика/btu033. ISSN  1460-2059. ПМЦ 3998144 . ПМИД  24451623. 
  5. ^ Козлов, Алексей М; Дарриба, Диего; Флури, Томаш; Морель, Бенуа; Стаматакис, Александрос (01 ноября 2019 г.). Рен, Джонатан (ред.). «RAxML-NG: быстрый, масштабируемый и удобный инструмент для филогенетических выводов с максимальной вероятностью». Биоинформатика . 35 (21): 4453–4455. doi : 10.1093/биоинформатика/btz305. ISSN  1367-4803. ПМК 6821337 . ПМИД  31070718. 
  6. ^ Минь, Буй Куанг; Шмидт, Хайко А; Черномор, Ольга; Шремпф, Доминик; Вудхэмс, Майкл Д.; фон Хэзелер, Арндт; Ланфир, Роберт (01 мая 2020 г.). Тилинг, Эмма (ред.). «IQ-TREE 2: Новые модели и эффективные методы филогенетического вывода в эпоху генома». Молекулярная биология и эволюция . 37 (5): 1530–1534. doi : 10.1093/molbev/msaa015. ISSN  0737-4038. ПМК 7182206 . ПМИД  32011700. 
  7. ^ "Зеркало документации пакета PHYLIP" . Архивировано из оригинала 19 октября 2005 г. Проверено 24 марта 2006 г.

Внешние ссылки