Глобальный тест на расстояние

Тест глобального расстояния ( GDT ), также обозначаемый как GDT_TS для представления "общего балла", является мерой сходства между двумя белковыми структурами с известными аминокислотными соответствиями (например, идентичными аминокислотными последовательностями ), но разными третичными структурами . Он чаще всего используется для сравнения результатов предсказания структуры белка с экспериментально определенной структурой, измеренной с помощью рентгеновской кристаллографии , ЯМР-спектроскопии белков или, все чаще, криоэлектронной микроскопии .

Метрика GDT была разработана Адамом Землой в Ливерморской национальной лаборатории имени Лоуренса и первоначально реализована в программе локально-глобального выравнивания ( LGA ). ^[1]^[2] Она предназначена для более точного измерения, чем обычная метрика среднеквадратичного отклонения (RMSD), которая чувствительна к выбросам , созданным, например, плохим моделированием отдельных областей петель в структуре, которая в остальном является достаточно точной. ^[1] Обычная оценка GDT_TS вычисляется по альфа-атомам углерода и представляется в виде процента в диапазоне от 0 до 100. В общем, чем выше оценка GDT_TS, тем точнее модель приближается к заданной референтной структуре.

Измерения GDT_TS используются в качестве основных критериев оценки при получении результатов Критической оценки прогнозирования структуры (CASP), крупномасштабного эксперимента в сообществе прогнозирования структуры, посвященного оценке текущих методов моделирования. ^[1]^[3]^[4] Метрика была впервые введена в качестве стандарта оценки в третьей итерации двухгодичного эксперимента (CASP3) в 1998 году. ^[3] Были разработаны различные расширения исходного метода; вариации, учитывающие положения боковых цепей , известны как глобальные расчеты расстояний ( GDC ). ^[5]

Расчет

Оценка GDT рассчитывается как наибольший набор альфа-атомов углерода аминокислотных остатков в модельной структуре, попадающих в пределы определенного расстояния отсечки их положения в экспериментальной структуре, после итеративного наложения двух структур. По оригинальному замыслу алгоритм GDT рассчитывает 20 оценок GDT, т. е. для каждой из 20 последовательных отсечек расстояний (0,5 Å , 1,0 Å, 1,5 Å, ... 10,0 Å). ^[2] Для оценки сходства структур предполагается использовать оценки GDT из нескольких расстояний отсечки, и оценки, как правило, увеличиваются с увеличением отсечки. Плато в этом увеличении может указывать на экстремальное расхождение между экспериментальной и предсказанной структурами, так что никакие дополнительные атомы не включены ни в одну отсечку разумного расстояния. Обычный общий балл GDT_TS в CASP является средним результатом отсечек на 1, 2, 4 и 8 Å. ^[1]^[6]^[7]

Вариации и расширения

Исходный GDT_TS рассчитывается на основе суперпозиций и оценок GDT, полученных программой локально-глобального выравнивания (LGA). ^[1] «Высокоточная» версия, называемая GDT_HA, вычисляется путем выбора меньших расстояний отсечения (половина размера GDT_TS) и, таким образом, сильнее штрафует большие отклонения от референтной структуры. Она использовалась в категории высокой точности CASP7. ^[8] CASP8 определила новую «оценку TR», которая равна GDT_TS за вычетом штрафа за остатки, сгруппированные слишком близко, что должно наказывать стерические столкновения в предсказанной структуре, иногда для игры с мерой отсечения GDT. ^[9]^[10]

Первичная оценка GDT использует только альфа-атомы углерода . Чтобы применить оценку на основе суперпозиции к боковым цепям аминокислотных остатков , в 2008 году в рамках программы LGA была разработана и внедрена оценка, подобная GDT, называемая «глобальным расчетом расстояний для боковых цепей» (GDC_sc). ^[1]^[5] Вместо сравнения положений остатков на основе альфа-атомов углерода, GDC_sc использует предопределенный «характеристический атом» вблизи конца каждого остатка для оценки отклонений расстояний между остатками. Вариант оценки GDC «все атомы» (GDC_all) рассчитывается с использованием информации о полной модели и является одной из стандартных мер, используемых организаторами и оценщиками CASP для оценки точности предсказанных структурных моделей. ^[5]^[7]^[11]

Оценки GDT обычно вычисляются относительно одной референтной структуры. В некоторых случаях структурные модели с более низкими оценками GDT по отношению к референтной структуре, определенной с помощью ЯМР белка , тем не менее лучше соответствуют базовым экспериментальным данным. ^[12] Были разработаны методы оценки неопределенности оценок GDT из-за гибкости белка и неопределенности в референтной структуре. ^[13]

Смотрите также

Среднеквадратичное отклонение (биоинформатика) — иная мера сравнения структур.
TM-score — иная мера сравнения структур.

Ссылки

^ abcdef Zemla A (2003). "LGA: Метод поиска трехмерных сходств в белковых структурах". Nucleic Acids Research . 31 (13): 3370–3374. doi : 10.1093/nar/gkg571. PMC 168977. PMID 12824330.
^ ab патент США 8024127 B2, Адам Земла, «Локально-глобальное выравнивание для поиска трехмерных сходств в белковых структурах», выдан 20 сентября 2011 г., передан Lawrence Livermore National Security, LLC
^ ab Zemla A, Venclovas C, Moult J, Fidelis K (1999). "Обработка и анализ предсказаний структуры белка CASP3". Белки . S3 (S3): 22–29. doi :10.1002/(SICI)1097-0134(1999)37:3+<22::AID-PROT5>3.0.CO;2-W. PMID 10526349. S2CID 29803757.
^ Zemla A, Venclovas C, Moult J, Fidelis K (2001). «Обработка и оценка предсказаний в CASP4». Белки . 45 (S5): 13–21. doi :10.1002/prot.10052. PMID 11835478. S2CID 28166260.
^ abc Keedy, DA; Williams, CJ; Headd, JJ; Arendall, WB; Chen, VB; Kapral, GJ; Gillespie, RA; Block, JN; Zemla, A; Richardson, DC; Richardson, JS (2009). «Остальные 90% белка: оценка за пределами α-углерода для моделей CASP8 на основе шаблонов и высокой точности». Proteins . 77 (Suppl 9): 29–49. doi :10.1002/prot.22551. PMC 2877634 . PMID 19731372.
^ Криштафович, А; Прлич, А; Дмитрив, З; Данилюк, П; Милостан, М; Эйрих, В; Хаббард, Т; Фиделис, К (2007). «Новые инструменты и расширенные возможности анализа данных в Центре прогнозирования структуры белков». Белки . 69 Suppl 8 (S8): 19–26. doi :10.1002/prot.21653. PMC 2656758 . PMID 17705273.
^ ab "Справка по таблице результатов". 14-й эксперимент сообщества по критической оценке методов прогнозирования структуры белка . Получено 27 декабря 2020 г.
^ Read, Randy J.; Chavali, Gayatri (2007). «Оценка предсказаний CASP7 в категории моделирования на основе шаблонов высокой точности». Белки . 69 (S8): 27–37. doi : 10.1002/prot.21662 . PMID 17894351. S2CID 33172629.
^ Ши, С; Пей, Дж; Садреев, РИ; Кинч, ЛН; Маджумдар, И; Тонг, Дж; Ченг, Х; Ким, БХ; Гришин, НВ (2009). "Анализ целей, прогнозов и методов оценки CASP8". База данных: The Journal of Biological Databases and Curation . 2009 : bap003. doi :10.1093/database/bap003. PMC 2794793. PMID 20157476 . . Связанная страница
^ Садреев, RI; Ши, S; Бейкер, D; Гришин, NV (15 мая 2009 г.). «Мера структурного сходства со штрафом за близкие неэквивалентные остатки». Биоинформатика . 25 (10): 1259–63. doi :10.1093/bioinformatics/btp148. PMC 2677741. PMID 19321733 .
^ Моди В., Сюй К. Ф., Адхикари С., Данбрак Р. Л. (2016). «Оценка моделирования структуры белка на основе шаблонов в CASP11». Белки . 84 (Приложение 1): 200–220. doi :10.1002/prot.25049. PMC 5030193 . PMID 27081927.
^ MacCallum, Justin L.; Hua, Lan; Schnieders, Michael J.; Pande, Vijay S.; Jacobson, Matthew P.; Dill, Ken A. (2009). «Оценка категории уточнения структуры белка в CASP8». Белки: структура, функция и биоинформатика . 77 (S9): 66–80. doi : 10.1002/prot.22538 . PMC 2801025. PMID 19714776 .
^ Ли, Вэньлинь; Шеффер, Р. Дастин; Отвиновски, Збышек; Гришин, Ник В. (5 мая 2016 г.). «Оценка неопределенностей в глобальном тесте расстояний (GDT_TS) для моделей CASP». PLOS ONE . 11 (5): e0154786. Bibcode :2016PLoSO..1154786L. doi : 10.1371/journal.pone.0154786 . PMC 4858170 . PMID 27149620.

Внешние ссылки

Результаты CASP14 — сводные таблицы последнего эксперимента CASP, проведенного в 2020 году, включая примеры графиков оценки GDT как функции расстояния отсечки
Услуги описания GDT, GDC, LCS и LGA, а также документация по сравнению структур и мерам сходства.