Тест глобального расстояния ( GDT ), также обозначаемый как GDT_TS для представления "общего балла", является мерой сходства между двумя белковыми структурами с известными аминокислотными соответствиями (например, идентичными аминокислотными последовательностями ), но разными третичными структурами . Он чаще всего используется для сравнения результатов предсказания структуры белка с экспериментально определенной структурой, измеренной с помощью рентгеновской кристаллографии , ЯМР-спектроскопии белков или, все чаще, криоэлектронной микроскопии .
Метрика GDT была разработана Адамом Землой в Ливерморской национальной лаборатории имени Лоуренса и первоначально реализована в программе локально-глобального выравнивания ( LGA ). [1] [2] Она предназначена для более точного измерения, чем обычная метрика среднеквадратичного отклонения (RMSD), которая чувствительна к выбросам , созданным, например, плохим моделированием отдельных областей петель в структуре, которая в остальном является достаточно точной. [1] Обычная оценка GDT_TS вычисляется по альфа-атомам углерода и представляется в виде процента в диапазоне от 0 до 100. В общем, чем выше оценка GDT_TS, тем точнее модель приближается к заданной референтной структуре.
Измерения GDT_TS используются в качестве основных критериев оценки при получении результатов Критической оценки прогнозирования структуры (CASP), крупномасштабного эксперимента в сообществе прогнозирования структуры, посвященного оценке текущих методов моделирования. [1] [3] [4] Метрика была впервые введена в качестве стандарта оценки в третьей итерации двухгодичного эксперимента (CASP3) в 1998 году. [3] Были разработаны различные расширения исходного метода; вариации, учитывающие положения боковых цепей , известны как глобальные расчеты расстояний ( GDC ). [5]
Оценка GDT рассчитывается как наибольший набор альфа-атомов углерода аминокислотных остатков в модельной структуре, попадающих в пределы определенного расстояния отсечки их положения в экспериментальной структуре, после итеративного наложения двух структур. По оригинальному замыслу алгоритм GDT рассчитывает 20 оценок GDT, т. е. для каждой из 20 последовательных отсечек расстояний (0,5 Å , 1,0 Å, 1,5 Å, ... 10,0 Å). [2] Для оценки сходства структур предполагается использовать оценки GDT из нескольких расстояний отсечки, и оценки, как правило, увеличиваются с увеличением отсечки. Плато в этом увеличении может указывать на экстремальное расхождение между экспериментальной и предсказанной структурами, так что никакие дополнительные атомы не включены ни в одну отсечку разумного расстояния. Обычный общий балл GDT_TS в CASP является средним результатом отсечек на 1, 2, 4 и 8 Å. [1] [6] [7]
Исходный GDT_TS рассчитывается на основе суперпозиций и оценок GDT, полученных программой локально-глобального выравнивания (LGA). [1] «Высокоточная» версия, называемая GDT_HA, вычисляется путем выбора меньших расстояний отсечения (половина размера GDT_TS) и, таким образом, сильнее штрафует большие отклонения от референтной структуры. Она использовалась в категории высокой точности CASP7. [8] CASP8 определила новую «оценку TR», которая равна GDT_TS за вычетом штрафа за остатки, сгруппированные слишком близко, что должно наказывать стерические столкновения в предсказанной структуре, иногда для игры с мерой отсечения GDT. [9] [10]
Первичная оценка GDT использует только альфа-атомы углерода . Чтобы применить оценку на основе суперпозиции к боковым цепям аминокислотных остатков , в 2008 году в рамках программы LGA была разработана и внедрена оценка, подобная GDT, называемая «глобальным расчетом расстояний для боковых цепей» (GDC_sc). [1] [5] Вместо сравнения положений остатков на основе альфа-атомов углерода, GDC_sc использует предопределенный «характеристический атом» вблизи конца каждого остатка для оценки отклонений расстояний между остатками. Вариант оценки GDC «все атомы» (GDC_all) рассчитывается с использованием информации о полной модели и является одной из стандартных мер, используемых организаторами и оценщиками CASP для оценки точности предсказанных структурных моделей. [5] [7] [11]
Оценки GDT обычно вычисляются относительно одной референтной структуры. В некоторых случаях структурные модели с более низкими оценками GDT по отношению к референтной структуре, определенной с помощью ЯМР белка , тем не менее лучше соответствуют базовым экспериментальным данным. [12] Были разработаны методы оценки неопределенности оценок GDT из-за гибкости белка и неопределенности в референтной структуре. [13]