stringtranslate.com

Ген-кандидат

Подход гена-кандидата к проведению исследований генетических ассоциаций фокусируется на ассоциациях между генетическими вариациями в пределах заранее определенных интересующих генов и фенотипами или состояниями болезни. Это отличается от исследований ассоциаций по всему геному (GWAS), которые являются подходом без гипотез, сканирующим весь геном на предмет ассоциаций между распространенными генетическими вариантами (обычно SNP ) и интересующими признаками. Гены-кандидаты чаще всего выбираются для исследования на основе априорных знаний о биологическом функциональном влиянии гена на рассматриваемый признак или заболевание. [1] [2] Обоснованием сосредоточения внимания на аллельной вариации в определенных, биологически значимых областях генома является то, что определенные аллели в пределах гена могут напрямую влиять на функцию рассматриваемого гена и приводить к вариациям в фенотипе или состоянии болезни, которые исследуются. Этот подход часто использует дизайн исследования случай-контроль , чтобы попытаться ответить на вопрос: «Является ли один аллель гена-кандидата более часто встречающимся у субъектов с заболеванием, чем у субъектов без заболевания?» [1] Гены-кандидаты, предположительно связанные со сложными признаками , как правило, не были воспроизведены последующими GWAS [3] [4] [5] [6] или мощными попытками репликации. [7] [8] Неспособность исследований генов-кандидатов пролить свет на конкретные гены, лежащие в основе таких признаков, была приписана недостаточной статистической мощности , низкой априорной вероятности того, что ученые могут правильно угадать определенный аллель в определенном гене, который связан с признаком, плохой методологической практикой и выемкой данных . [9] [6] [10]

Выбор

Подходящие гены-кандидаты обычно выбираются на основе известной биологической, физиологической или функциональной значимости для рассматриваемого заболевания. Этот подход ограничен его опорой на существующие знания об известной или теоретической биологии заболевания. Однако молекулярные инструменты позволяют проникнуть в механизмы заболевания и определить потенциальные области интереса в геноме. Исследования ассоциаций по всему геному (GWAS) и картирование локусов количественных признаков (QTL) изучают общие вариации по всему геному и, таким образом, могут обнаружить новую область интереса, которая находится в потенциальном гене-кандидате или рядом с ним. Данные микрочипов позволяют исследователям изучать дифференциальную экспрессию генов между случаями и контролями и могут помочь определить новые потенциальные гены интереса. [11]

Большая изменчивость между организмами иногда может затруднить различение нормальной вариации в однонуклеотидных полиморфизмах (SNP) от гена-кандидата с вариацией, связанной с заболеванием. [12] При анализе больших объемов данных существует несколько других факторов, которые могут помочь привести к наиболее вероятному варианту. Эти факторы включают приоритеты в SNP, относительный риск функциональных изменений в генах и неравновесие сцепления между SNP. [13]

Кроме того, доступность генетической информации через онлайн-базы данных позволяет исследователям извлекать существующие данные и веб-ресурсы для поиска новых целевых генов-кандидатов. [14] Многие онлайн-базы данных доступны для исследования генов разных видов.

До подхода с использованием генов-кандидатов

До того, как подход гена-кандидата был полностью разработан, для идентификации генов, связанных с болезнями-состояниями, использовались различные другие методы. Эти методы изучали генетическую связь и позиционное клонирование с помощью генетического скрининга и были эффективны при идентификации генов относительного риска в менделевских заболеваниях . [13] [19] Однако эти методы не столь полезны при изучении сложных заболеваний по нескольким причинам: [13]

  1. Сложные заболевания, как правило, различаются как по возрасту начала, так и по тяжести. Это может быть связано с вариациями пенетрантности и экспрессивности . [20] Для большинства человеческих заболеваний нормой является вариабельная экспрессивность фенотипа заболевания. Это затрудняет выбор одной конкретной возрастной группы или фенотипического маркера для изучения. [13]
  2. Истоки сложных заболеваний включают множество биологических путей, некоторые из которых могут различаться в зависимости от фенотипа заболевания. [13]
  3. Самое важное, что сложные заболевания часто иллюстрируют генетическую гетерогенность – можно обнаружить несколько генов, которые взаимодействуют и производят одно состояние болезни. Часто каждый отдельный ген частично отвечает за производимый фенотип и общий риск расстройства. [13] [21]

Критика

Исследование генов-кандидатов стремится сбалансировать использование данных, одновременно пытаясь минимизировать вероятность создания ложноположительных или отрицательных результатов. [13] Поскольку этот баланс часто может быть сложным, существует несколько критических замечаний к подходу генов-кандидатов, которые важно понять перед началом такого исследования. Например, было показано, что подход генов-кандидатов дает высокий уровень ложноположительных результатов, [ 22] что требует, чтобы к результатам отдельных генетических ассоциаций относились с большой осторожностью. [23]

Одной из критических замечаний является то, что результаты ассоциаций в исследованиях генов-кандидатов не были легко воспроизведены в последующих исследованиях. [24] Например, недавнее исследование 18 хорошо изученных генов-кандидатов депрессии (по 10 публикаций или более по каждому) не смогло выявить никакой значимой ассоциации с депрессией, несмотря на использование выборок на порядки больше, чем в исходных публикациях. [25] Помимо статистических проблем (например, недостаточной мощности исследований), в этой непоследовательности часто обвиняют стратификацию населения ; поэтому необходимо также проявлять осторожность в отношении того, какие критерии определяют определенный фенотип, а также других вариаций в дизайне исследования. [13]

Кроме того, поскольку эти исследования включают априорные знания, некоторые критики утверждают, что наших знаний недостаточно для обоснованных прогнозов. Поэтому результаты, полученные с помощью этих «гипотезно-ориентированных» подходов, зависят от способности выбирать правдоподобных кандидатов из генома, а не от использования подхода, свободного от гипотез.

Использование в научных исследованиях

Одним из самых ранних успехов с использованием подхода гена-кандидата было обнаружение мутации одного основания в некодирующей области APOC3 (ген аполипопротеина C3), которая ассоциировалась с более высокими рисками гипертриглицеридемии и атеросклероза . [26] В исследовании Кима и соавторов были обнаружены гены, связанные с признаком ожирения как у свиней, так и у людей с использованием сравнительной геномики и хромосомной наследуемости. [27] Используя эти два метода, исследователи смогли преодолеть критику, что исследования генов-кандидатов сосредоточены исключительно на предшествующих знаниях. Сравнительная геномика была завершена путем изучения локусов количественных признаков как человека, так и свиньи с помощью метода, известного как комплексный анализ признаков по всему геному (GCTA), который позволил исследователям затем сопоставить генетическую дисперсию с конкретными хромосомами. Это позволило параметру наследуемости обеспечить понимание того, где фенотипическая вариация была на конкретных хромосомных участках, таким образом, распространившись на маркеры-кандидаты и гены в этих участках. Другие исследования также могут использовать вычислительные методы для поиска генов-кандидатов в широком смысле, дополняющим образом, как, например, одно исследование Тиффина и др., изучающее гены, связанные с диабетом 2 типа . [12]

Во многих исследованиях гены-кандидаты аналогичным образом использовались как часть междисциплинарного подхода к изучению признака или фенотипа. Один из примеров манипулирования генами-кандидатами можно увидеть в исследовании, проведенном Мартином Э. Федером по белкам теплового шока и их функции у Drosophila melanogaster . [28] Федер разработал целостный подход к изучению Hsp70 , гена-кандидата, который, как предполагалось, играет роль в адаптации организма к стрессу. D. melanogaster является весьма полезным модельным организмом для изучения этого признака благодаря тому, как он может поддерживать разнообразное количество генетических подходов для изучения гена-кандидата. Различные подходы, использованные в этом исследовании, включали как генетическую модификацию гена-кандидата (использование сайт-специфической гомологичной рекомбинации и экспрессии различных белков), так и изучение естественной вариации Hsp70 . Он пришел к выводу, что результаты этих исследований дали многогранное представление о Hsp70 . Манипулирование генами-кандидатами также наблюдается в исследовании Каспара К. Чейтера о происхождении и функции устьиц у Physcomitrella patens , мха. PpSMF1 , PpSMF2 и PpSCRM1 были тремя генами-кандидатами, которые были отключены гомологичной рекомбинацией, чтобы увидеть какие-либо изменения в развитии устьиц. С помощью эксперимента по отключению Чейтер заметил, что PpSMF1 и PpSCRM1 были ответственны за развитие устьиц у P. patens. [29] Спроектировав и изменив эти гены-кандидаты, они смогли подтвердить способы, которыми этот ген был связан с изменением фенотипа. Понимание естественного и исторического контекста, в котором действуют эти фенотипы, путем изучения естественной структуры генома дополнило это.

Ссылки

  1. ^ ab Kwon JM, Goate AM (2000). «Подход с использованием генов-кандидатов» (PDF) . Alcohol Research & Health . 24 (3): 164–168. PMC  6709736. PMID  11199286 .
  2. ^ Чжу М., Чжао С. (октябрь 2007 г.). «Подход к идентификации генов-кандидатов: прогресс и проблемы». Международный журнал биологических наук . 3 (7): 420–427. doi :10.7150/ijbs.3.420. PMC 2043166. PMID  17998950 . 
  3. ^ Джонсон EC, Бордер R, Мелрой-Грейф WE, де Леув CA, Эрингер MA, Келлер MC (ноябрь 2017 г.). «Нет доказательств того, что гены-кандидаты шизофрении больше связаны с шизофренией, чем некандидатные гены». Биологическая психиатрия . 82 (10): 702–708. doi :10.1016/j.biopsych.2017.06.033. PMC 5643230. PMID  28823710 . 
  4. ^ Chabris CF, Hebert BM, Benjamin DJ, Beauchamp J, Cesarini D, van der Loos M и др. (2012-09-24). «Большинство зарегистрированных генетических ассоциаций с общим интеллектом, вероятно, ложноположительны». Psychological Science . 23 (11): 1314–1323. doi :10.1177/0956797611435528. PMC 3498585 . PMID  23012269. 
  5. ^ Bosker FJ, Hartman CA, Nolte IM, Prins BP, Terpstra P, Posthuma D и др. (Май 2011 г.). «Плохая репликация генов-кандидатов на большое депрессивное расстройство с использованием данных об ассоциациях по всему геному». Молекулярная психиатрия . 16 (5): 516–532. doi : 10.1038/mp.2010.38 . PMID  20351714.
  6. ^ ab Border R, Johnson EC, Evans LM, Smolen A, Berley N, Sullivan PF, Keller MC (май 2019 г.). «Нет поддержки для исторических гипотез гена-кандидата или гипотез гена-кандидата по взаимодействию для большой депрессии на нескольких больших выборках». Американский журнал психиатрии . 176 (5): 376–387. doi : 10.1176/appi.ajp.2018.18070881. PMC 6548317. PMID  30845820 . 
  7. ^ Дункан LE, Келлер MC (октябрь 2011 г.). «Критический обзор первых 10 лет исследований взаимодействия генов-кандидатов с окружающей средой в психиатрии». Американский журнал психиатрии . 168 (10): 1041–1049. doi :10.1176/appi.ajp.2011.11020191. PMC 3222234. PMID  21890791 . 
  8. ^ Culverhouse RC, Saccone NL, Horton AC, Ma Y, Anstey KJ, Banaschewski T и др. (январь 2018 г.). «Совместный метаанализ не выявил доказательств сильного взаимодействия между стрессом и генотипом 5-HTTLPR, способствующим развитию депрессии». Молекулярная психиатрия . 23 (1): 133–142. doi :10.1038/mp.2017.44. PMC 5628077. PMID 28373689  . 
  9. ^ Farrell MS, Werge T, Sklar P, Owen MJ, Ophoff RA, O'Donovan MC и др. (май 2015 г.). «Оценка исторических генов-кандидатов на шизофрению». Молекулярная психиатрия . 20 (5): 555–562. doi :10.1038/mp.2015.16. PMC 4414705. PMID  25754081 . 
  10. ^ Risch N, Herrell R, Lehner T, Liang KY, Eaves L, Hoh J, et al. (Июнь 2009). «Взаимодействие между геном переносчика серотонина (5-HTTLPR), стрессовыми жизненными событиями и риском депрессии: метаанализ». JAMA . 301 (23): 2462–71. doi :10.1001/jama.2009.878. PMC 2938776 . PMID  19531786. 
  11. ^ Wayne ML, McIntyre LM (ноябрь 2002 г.). «Объединение картирования и массива: подход к идентификации генов-кандидатов». Труды Национальной академии наук Соединенных Штатов Америки . 99 (23): 14903–14906. Bibcode : 2002PNAS...9914903W. doi : 10.1073 /pnas.222549199 . PMC 137517. PMID  12415114. 
  12. ^ ab Tiffin N, Adie E, Turner F, Brunner HG, van Driel MA, Oti M и др. (2006). «Вычислительная идентификация генов заболеваний: сочетание методов отдает приоритет генам-кандидатам диабета 2 типа и ожирения». Nucleic Acids Research . 34 (10): 3067–3081. doi :10.1093/nar/gkl381. PMC 1475747 . PMID  16757574. 
  13. ^ abcdefgh Tabor HK, Risch NJ, Myers RM (май 2002). «Подходы с использованием генов-кандидатов для изучения сложных генетических признаков: практические соображения». Nature Reviews. Genetics . 3 (5): 391–397. doi :10.1038/nrg796. PMID  11988764. S2CID  23314997.
  14. ^ Чжу М., Чжао С. (октябрь 2007 г.). «Подход к идентификации генов-кандидатов: прогресс и проблемы». Международный журнал биологических наук . 3 (7): 420–427. doi :10.7150/ijbs.3.420. PMC 2043166. PMID  17998950 . 
  15. ^ Chen J, Bardes EE, Aronow BJ, Jegga AG (июль 2009 г.). «ToppGene Suite для анализа обогащения списка генов и приоритизации генов-кандидатов». Nucleic Acids Research . 37 (выпуск веб-сервера): W305–W311. doi :10.1093/nar/gkp427. PMC 2703978. PMID  19465376 . 
  16. ^ Sulakhe D, Balasubramanian S, Xie B, Feng B, Taylor A, Wang S и др. (январь 2014 г.). «Lynx: база данных и механизм извлечения знаний для интегративной медицины». Nucleic Acids Research . 42 (выпуск базы данных): D1007–D1012. doi :10.1093/nar/gkt1166. PMC 3965040. PMID  24270788 . 
  17. ^ Xie B, Agam G, Balasubramanian S, Xu J, Gilliam TC, Maltsev N, Börnigen D (апрель 2015 г.). «Определение приоритетов генов заболеваний с использованием сети и признаков». Журнал вычислительной биологии . 22 (4): 313–323. doi :10.1089/cmb.2015.0001. PMC 4808289. PMID 25844670  . 
  18. ^ Nitsch D, Gonçalves JP, Ojeda F, de Moor B, Moreau Y (сентябрь 2010 г.). «Приоритизация генов-кандидатов с помощью сетевого анализа дифференциальной экспрессии с использованием подходов машинного обучения». BMC Bioinformatics . 11 (1): 460. doi : 10.1186/1471-2105-11-460 . PMC 2945940 . PMID  20840752. 
  19. ^ Teixeira LV, Lezirovitz K, Mandelbaum KL, Pereira LV, Perez AB (август 2011 г.). «Анализ сцепления генов-кандидатов указывает на генетическую гетерогенность при синдроме Марфана». Бразильский журнал медицинских и биологических исследований . 44 (8): 793–800. doi : 10.1590/s0100-879x2011007500095 . PMID  21789464.
  20. ^ Лобо I (2008). «Одна и та же генетическая мутация, разный фенотип генетического заболевания». Nature Education . 1 (1): 64.
  21. ^ Gizer IR, Ficks C, Waldman ID (июль 2009 г.). «Исследования генов-кандидатов СДВГ: метааналитический обзор». Генетика человека . 126 (1): 51–90. doi :10.1007/s00439-009-0694-x. PMID  19506906. S2CID  166017.
  22. ^ Бордер, Ричард; Джонсон, Эмма С.; Эванс, Люк М.; Смолен, Эндрю; Берли, Ноа; Салливан, Патрик Ф.; Келлер, Мэтью С. (2019-05-01). «Нет поддержки для исторических гипотез гена-кандидата или гипотез гена-кандидата по взаимодействию для большой депрессии на нескольких больших выборках». Американский журнал психиатрии . 176 (5): 376–387. doi : 10.1176/appi.ajp.2018.18070881. ISSN  0002-953X. PMC 6548317. PMID  30845820. 
  23. ^ Салливан ПФ (май 2007). «Ложные генетические ассоциации». Биологическая психиатрия . 61 (10): 1121–1126. doi :10.1016/j.biopsych.2006.11.010. PMID  17346679. S2CID  35033987.
  24. ^ Hutchison KE, Stallings M, McGeary J, Bryan A (январь 2004 г.). «Стратификация населения в исследовании генов-кандидатов: смертельная угроза или отвлекающий маневр?». Psychological Bulletin . 130 (1): 66–79. doi :10.1037/0033-2909.130.1.66. PMID  14717650.
  25. ^ Border R, Johnson EC, Evans LM, Smolen A, Berley N, Sullivan PF, Keller MC (май 2019 г.). «Нет поддержки для исторических гипотез гена-кандидата или гипотез гена-кандидата по взаимодействию для большой депрессии на нескольких больших выборках». Американский журнал психиатрии . 176 (5): 376–387. doi :10.1176/appi.ajp.2018.18070881. PMC 6548317. PMID  30845820 . 
  26. ^ Rees A, Shoulders CC, Stocks J, Galton DJ, Baralle FE (февраль 1983 г.). «Полиморфизм ДНК, прилегающий к гену человеческого апопротеина A-1: ​​связь с гипертриглицеридемией». Lancet . 1 (8322): 444–446. doi :10.1016/s0140-6736(83)91440-x. PMID  6131168. S2CID  29511911.
  27. ^ Ким Дж., Ли Т., Ким ТХ., Ли КТ., Ким Х. (декабрь 2012 г.). «Комплексный подход сравнительной геномики и анализа наследуемости свиньи и человека по признаку ожирения: доказательства наличия генов-кандидатов на хромосоме 2 человека». BMC Genomics . 13 : 711. doi : 10.1186/1471-2164-13-711 . PMC 3562524. PMID  23253381 . 
  28. ^ Feder ME (июль 1999 г.). «Инженерные гены-кандидаты в исследованиях адаптации: белок теплового шока Hsp70 у Drosophila melanogaster». The American Naturalist . 154 (S1): S55–S66. doi :10.1086/303283. PMID  29586709. S2CID  4394996.
  29. ^ Чейтер CC, Кейн Р.С., Томек М., Уоллес С., Камисуги Ю., Каминг AC и др. (ноябрь 2016 г.). «Происхождение и функции устьиц мха Physcomitrella patens». Природные растения . 2 (12): 16179. doi :10.1038/nplants.2016.179. ПМК 5131878 . ПМИД  27892923. 

Внешние ссылки