stringtranslate.com

Биомедицинская наука о данных

Биомедицинская наука о данных — это междисциплинарная область, которая использует большие объемы данных для продвижения биомедицинских инноваций и открытий. Биомедицинская наука о данных черпает вдохновение из различных областей, включая биостатистику , биомедицинскую информатику и машинное обучение , с целью понимания биологических и медицинских данных. Ее можно рассматривать как изучение и применение науки о данных для решения биомедицинских проблем. [1] Современные биомедицинские наборы данных часто имеют особые характеристики, которые затрудняют их анализ, в том числе:

Многие проекты по биомедицинской науке о данных применяют машинное обучение к таким наборам данных. [2] [3] Эти характеристики, хотя и присутствуют во многих приложениях по биомедицинской науке о данных в более общем плане, делают биомедицинскую науку о данных особой областью. Примеры исследований в области биомедицинской науки о данных включают:

Обучение в области биомедицинской науки о данных

Национальная медицинская библиотека Национальных институтов здравоохранения США ( NIH) определила ключевые характеристики специалиста по биомедицинским данным в обзоре, охватывающем весь NIH: общие знания в области биомедицинских предметов; опыт работы с языками программирования; прогностическая аналитика , моделирование и машинное обучение; командная наука и коммуникация; ответственное управление данными. [6]

Факультеты и программы университета

Исследования в области биомедицинских данных в академической среде

Научные журналы

Первый журнал, посвященный биомедицинской науке о данных, появился в 2018 году — Annual Review of Biomedical Data Science .

« Ежегодный обзор науки о биомедицинских данных предоставляет комплексные экспертные обзоры в области науки о биомедицинских данных, уделяя особое внимание передовым методам хранения, извлечения, анализа и организации биомедицинских данных и знаний. Область применения журнала охватывает информатику, вычислительные и статистические подходы к биомедицинским данным, включая подобласти биоинформатики, вычислительной биологии, биомедицинской информатики, клинической и исследовательской информатики, биостатистики и визуализационной информатики. Миссия журнала — выявить как новые, так и устоявшиеся области науки о биомедицинских данных и лидеров в этих областях». [7]

Другие журналы имеют более общую тематику, чем биомедицинская наука о данных, но регулярно публикуют исследования в области биомедицинских данных, такие как Health Data Science [8] и Nature Machine Intelligence. [9] Наука о данных не могла бы существовать без курируемых наборов данных, и в этой области наблюдается рост числа журналов, посвященных описанию и проверке таких наборов данных, некоторые из которых полезны для биомедицинских приложений, включая Scientific Data, [10] Biomedical Data, [11] и Data. [12]

Пример

Проект «Геном человека» (HGP), который раскрыл последовательности ДНК, составляющие гены человека, был бы невозможен без науки о биомедицинских данных. Для обработки данных в HGP требовались значительные вычислительные ресурсы, поскольку геном человека содержит более 6 миллиардов пар оснований ДНК . [13] Ученые построили геном, соединив небольшие фрагменты ДНК, и только для вычисления перекрытий между этими последовательностями потребовалось более 10 000 часов ЦП. При таком огромном масштабе данных ученые полагались на передовые алгоритмы для выполнения этапов обработки данных, таких как сборка и выравнивание последовательностей для контроля качества. [14] Некоторые из этих алгоритмов, такие как BLAST , до сих пор используются в современной биоинформатике. Ученым в HGP также приходилось решать сложности, часто связанные с биомедицинскими данными, включая зашумленные данные, такие как ошибки чтения ДНК , и права на конфиденциальность субъектов исследования. [15] Проект HGP, завершенный в 2004 году, оказал огромное влияние как в биологическом плане, пролив свет на эволюцию человека , так и в медицинском плане, положив начало развитию области биоинформатики и приведя к таким технологиям, как генетический скрининг и генная терапия .

Ссылки

  1. ^ Альтман, Расс; Левитт, Майкл (2018). «Что такое наука о биомедицинских данных и нужен ли нам ежегодный обзор?». Ежегодный обзор науки о биомедицинских данных . 1 : i–iii. doi : 10.1146/annurev-bd-01-041718-100001 . S2CID  134950609.
  2. ^ Балди, Пьер (2018). «Глубокое обучение в науке о биомедицинских данных». Ежегодный обзор науки о биомедицинских данных . 1 : 181–205. doi :10.1146/annurev-biodatasci-080917-013343. S2CID  67381478.
  3. ^ ab Роннебергер, Олаф; Фишер, Филипп; Брокс, Томас (2015). "U-net: сверточные сети для сегментации биомедицинских изображений". Международная конференция по вычислениям медицинских изображений и компьютерному вмешательству . arXiv : 1505.04597 .
  4. ^ Дункан, Джеймс С.; Инсана, Майкл Ф.; Аяче, Николас (2020). «Биомедицинская визуализация и анализ в эпоху больших данных и глубокого обучения [сканирование проблемы]». Труды IEEE . 108 : 3–10. doi : 10.1109/JPROC.2019.2956422 . S2CID  210077608.
  5. ^ Су, Чанг; Тонг, Цзе; Чжу, Юнцзюнь; Ку, Пэн; Ван, Фэй (2020). «Внедрение сетей в биомедицинскую науку о данных». Briefings in Bioinformatics . 21 (1): 182–197. doi :10.1093/bib/bby117. PMID  30535359.
  6. ^ Зарингалам, Марьям; Федерер, Лиза; Уэрта, Майкл. «Основные навыки для специалистов по биомедицинским данным» (PDF) . Национальная медицинская библиотека США . Национальные институты здравоохранения США . Получено 21 февраля 2022 г. .
  7. ^ "Ежегодный обзор науки о биомедицинских данных". annualreviews.org . Получено 21.02.2022 .
  8. ^ "Health Data Science". spj.sciencemag.org . Получено 2022-07-05 .
  9. ^ "Nature Machine Intelligence". nature.com . Получено 2022-07-05 .
  10. ^ "Научные данные". nature.com . Получено 2022-07-05 .
  11. ^ "Журнал биомедицинских данных". biomed-data.eu . Получено 2022-07-05 .
  12. ^ "Данные". mdpi.com . Получено 2022-07-05 .
  13. ^ Пиовесан, Эллисон; Пеллери, Мария С; Антонарос, Франческа; Стрипполи, Пьерлуиджи; Витале, Лоренца (2019). «О длине, весе и содержании GC в геноме человека». BMC Research Notes . 12 (1): 106. doi : 10.1186/s13104-019-4137-z . PMC 6391780. PMID  30813969 . 
  14. ^ Altschul, Stephen F; Gish, Warren; Miller, Webb; Myers, Eugene W; Lipman, David J (1990). "Базовый инструмент поиска локального выравнивания". Journal of Molecular Biology . 215 (3): 403–410. doi :10.1016/S0022-2836(05)80360-2. PMID  2231712. S2CID  14441902.
  15. ^ Вентер, Дж. Крейг и др. (2001). «Последовательность генома человека». Science . 291 (5507): 1304–1351. Bibcode :2001Sci...291.1304V. doi :10.1126/science.1058040. PMID  11181995.