PubMed Central ( PMC ) — это бесплатный цифровой репозиторий , в котором архивируются полнотекстовые научные статьи открытого доступа , опубликованные в биомедицинских и биологических журналах. PubMed Central , одна из крупнейших исследовательских баз данных, разработанных Национальным центром биотехнологической информации (NCBI), представляет собой нечто большее, чем просто хранилище документов. Материалы, поступающие в PMC, индексируются и форматируются для расширенных метаданных , медицинской онтологии и уникальных идентификаторов, которые дополняют структурированные данные XML для каждой статьи. [1] Контент PMC может быть связан с другими базами данных NCBI и доступен через поисково-поисковые системы Entrez , что еще больше расширяет возможности общественности находить, читать и развивать свои биомедицинские знания. [2]
PubMed Central отличается от PubMed . [3] PubMed Central — это бесплатный цифровой архив полных статей, доступный любому человеку из любого места через веб-браузер (с различными условиями повторного использования). И наоборот, хотя PubMed представляет собой базу данных биомедицинских цитат и рефератов с возможностью поиска, полнотекстовая статья находится в другом месте (в печатном виде или в Интернете, бесплатно или за платным доступом для подписчиков ).
По состоянию на декабрь 2018 года [обновлять]архив PMC содержал более 5,2 миллиона статей [4] , причем материалы поступали от издателей или авторов, депонировавших свои рукописи в репозиторий в соответствии с Политикой публичного доступа NIH . Более ранние данные показывают, что с января 2013 г. по январь 2014 г. число депозитов, инициированных авторами, превысило 103 000 статей за 12-месячный период. [5] PMC идентифицирует около 4000 журналов, которые в той или иной степени участвуют в размещении своего опубликованного контента в репозитории PMC. [6] Некоторые издатели откладывают публикацию своих статей на PubMed Central на определенное время после публикации, называемое «периодом эмбарго», от нескольких месяцев до нескольких лет в зависимости от журнала. (Наиболее распространенными являются эмбарго на срок от шести до двенадцати месяцев.) PubMed Central является ключевым примером «систематического внешнего распространения третьей стороной» [7] , которое до сих пор запрещено соглашениями с участниками многих издателей.
PubMed Central начинался как E-biomed , первоначально предложенный в мае 1999 года тогдашним директором Национального института здравоохранения Гарольдом Вармусом . [8] Идея пришла к нему «внезапно» в декабре 1998 года, вдохновленная ранним использованием arXiv для препринтов после презентации Пэта Брауна из Стэнфорда и Дэвида Липмана , директора NCBI : [9] [10]
Но мои взгляды резко расширились однажды утром в декабре 1998 года, когда я встретил Пэта Брауна за кофе в кафе, которое раньше было знаменитой пекарней Тассахара, на углу Коул и Парнас, во время визита в Сан-Франциско. [...] За несколько недель до нашего кофе Пэт узнал о методах, используемых физиком Полом Гинспаргом и его коллегами в Лос-Аламосе, чтобы позволить физикам и математикам делиться своими работами друг с другом через Интернет. Они размещали «препринты» (статьи, еще не отправленные и не принятые к публикации) на общедоступном веб-сайте (называемом LanX или arXiv), чтобы каждый мог их прочитать и покритиковать. [...] Чем больше я думал об этом, тем больше я убеждался, что радикальная реструктуризация методов публикации, передачи, хранения и использования отчетов о биомедицинских исследованиях может быть возможной и полезной. В духе энтузиазма и политической невинности я написал длинный манифест, предлагая создать поддерживаемую НИЗ онлайн-систему под названием E-biomed.
Целью E-biomed было предоставление свободного доступа ко всем биомедицинским исследованиям. Документы, представленные в E-biomed, могут быть изданы одним из двух способов: либо немедленно опубликованы в виде препринта, либо через традиционный процесс рецензирования . Процесс рецензирования должен был напоминать современные журналы с наложением , при этом внешняя редакционная коллегия сохраняла контроль над процессом рецензирования, курирования и листинга статей, которые в противном случае были бы в свободном доступе на центральном сервере E-biomed. Вармус намеревался реализовать новые возможности, открывающиеся благодаря передаче научных результатов в цифровом формате, представляя непрерывный разговор об опубликованных работах, версиях документов и расширенных «многоуровневых» форматах, допускающих несколько уровней детализации. [8]
Предложение создать центральный указатель биомедицинских исследований было радикальным отходом от преобладающих издательских норм. До появления Интернета индексы публикаций работали в основном как номера ISBN : они выделялись регистрационными агентствами вторичным издателям. Идея о том, что каждый может владеть собственным адресным пространством через доменное имя и создать собственную систему индексации, была совершенно новой идеей. [11] [12] Крупные коммерческие издатели начали экспериментировать с системой индексирования научных статей, распространяемых между издателями еще в 1993 году, и были побуждены к действию после предложения E-biomed. На ежегодной конференции STM во Франкфурте в октябре 1999 года несколько издателей во главе со Springer-Verlag поспешно достигли консенсуса в конференц-зале о запуске прототипа своего конкурента: [13]
На заседании правления ассоциации STM, состоявшемся во второй половине дня в понедельник, 11 октября, перед открытием ярмарки в среду, обсуждение сосредоточилось на новой инициативе Национальной медицинской библиотеки США (NLM) под названием E-Biomed (позже PubMed Central), которая была предложил Гарольд Вармус из Национальных институтов здравоохранения весной 1999 года. Вармус предполагал создание цифрового архива журналов, доступного бесплатно и с дополнительной ценностью в виде ссылок на ссылки. «Наш консенсус заключался в том, что именно издатели должны устанавливать ссылки», — сказал Боб Кэмпбелл, председательствовавший на встрече. «Поскольку мы были, так сказать, «выше по течению», мы должны иметь возможность связывать наши статьи раньше NLM в рамках процесса их создания. Затем Стефан фон Хольцбринк положил начало делу, предложив связать публикации Nature с кем-либо еще. Мы решили опубликовать объявление о широкой инициативе по объединению эталонных ссылок STM. Это, конечно, был всего лишь стратегический шаг, поскольку у нас не было ни плана, ни прототипа».
Небольшая группа во главе с Арну де Кемпом из Springer-Verlag встретилась в соседней комнате сразу после заседания Совета, чтобы составить проект объявления, которое было роздано всем участникам ежегодного собрания STM на следующий день и опубликовано в издании для членов STM. [...] Потенциальная выгода от сервиса, который впоследствии станет CrossRef, стала очевидна сразу. Такие организации, как AIP и IOP (Институт физики) начали ссылаться на публикации друг друга, и невозможность тиражирования таких разовых мероприятий в отрасли стала очевидной. Как позже выразился Тим Инголдсби: «Все эти связывающие соглашения убьют нас».
Под давлением энергичного лоббирования со стороны коммерческих издателей и научных обществ, опасавшихся упущенной прибыли, [14] должностные лица НИЗ объявили о пересмотренном предложении PubMed Central в августе 1999 года . [9] PMC будет получать материалы от издателей, а не от авторов, как в E- биомед. На публикации было разрешено временное эмбарго на платный доступ сроком до одного года. PMC разрешала только рецензируемую работу — никаких препринтов. [15] Вскоре после этого тогда еще безымянная система ссылок под руководством издателя стала CrossRef и более крупной системой DOI . Вармус, Браун и другие, включая Майкла Эйзена , в 2001 году основали Публичную научную библиотеку ( PLoS ), придя к выводу, что «если мы действительно хотим изменить публикацию научных исследований, мы должны публиковать ее сами». [16]
Репозиторий, запущенный в феврале 2000 года, быстро рос, поскольку Политика публичного доступа НИЗ призвана сделать все исследования, финансируемые Национальными институтами здравоохранения (НИЗ), свободными для всех, и, кроме того, многие издатели сотрудничают с НИЗ. обеспечить свободный доступ к своим произведениям. [ нужна ссылка ] В конце 2007 года Закон о консолидированных ассигнованиях 2008 года (HR 2764) был подписан и включал положение, требующее от НИЗ изменить свою политику и потребовать включения в PubMed Central полных электронных копий своих рецензируемых исследований и результатов. в результате исследования, финансируемого НИЗ. Эти статьи должны быть включены в журнал в течение 12 месяцев после публикации. Это первый случай, когда правительство США потребовало от агентства предоставить открытый доступ к исследованиям и является развитием политики 2005 года, когда НИЗ просил исследователей добровольно добавлять свои исследования в PubMed Central. [17]
Британская версия системы PubMed Central, UK PubMed Central (UKPMC) , была разработана Wellcome Trust и Британской библиотекой в рамках группы из девяти британских спонсоров исследований. Эта система была запущена в январе 2007 года. 1 ноября 2012 года она стала называться Europe PubMed Central . Канадский член международной сети PubMed Central, PubMed Central Canada , был запущен в октябре 2009 года.
Язык разметки журнальных статей Национальной медицинской библиотеки «NLM Journal Publishing Tag Set» доступен бесплатно. [18] Ассоциация издателей научных и профессиональных обществ отмечает, что «он, вероятно, станет стандартом для подготовки научного контента как для книг, так и для журналов». [19] Для книг доступно соответствующее DTD . [20] Библиотека Конгресса и Британская библиотека объявили о поддержке NLM DTD. [21] Он также пользуется популярностью среди поставщиков журнальных услуг. [22]
С выпуском планов публичного доступа для многих агентств за пределами НИЗ, PMC становится хранилищем для более широкого спектра статей. [23] Сюда входит контент НАСА с интерфейсом под торговой маркой «PubSpace». [24] [25]
Статьи отправляются в PubMed Central издателями в формате XML или SGML с использованием различных DTD статей . Старые и крупные издатели могут иметь свои собственные DTD, но многие издатели используют DTD NLM Journal Publishing (см. выше).
Полученные статьи преобразуются через XSLT в очень похожий DTD NLM Archiving and Interchange. Этот процесс может выявить ошибки, о которых будет сообщено издателю для исправления. Графика также конвертируется в стандартные форматы и размеры. Исходные и преобразованные формы архивируются. Преобразованная форма перемещается в реляционную базу данных вместе со связанными файлами графики, мультимедиа или другими связанными данными. Многие издатели также предоставляют свои статьи в формате PDF , и они доступны без изменений. [26]
Библиографические цитаты анализируются и автоматически связываются с соответствующими рефератами в PubMed, статьями в PubMed Central и ресурсами на веб-сайтах издателей. Ссылки на PubMed также ведут на PubMed Central. Неразрешимые ссылки, например, на журналы или отдельные статьи, еще не доступные в одном из этих источников, отслеживаются в базе данных и автоматически активируются, когда ресурсы становятся доступными.
Внутренняя система индексации обеспечивает возможность поиска и учитывает биологическую и медицинскую терминологию , например, названия непатентованных и патентованных лекарств , а также альтернативные названия организмов, болезней и анатомических частей.
Когда пользователь получает доступ к выпуску журнала, автоматически создается оглавление путем извлечения всех статей, писем, редакционных статей и т. д. для этого выпуска. Когда достигается реальный элемент, например статья, PubMed Central преобразует разметку NLM в HTML для доставки и предоставляет ссылки на связанные объекты данных. Это осуществимо, поскольку множество входящих данных сначала преобразуется в стандартные DTD и графические форматы.
В отдельном потоке подачи авторы, финансируемые NIH, могут размещать статьи в PubMed Central, используя функцию подачи рукописей NIH (NIHMS). Представленные таким образом статьи обычно проходят разметку XML для преобразования в NLM DTD.
Реакция на PubMed Central среди научного издательского сообщества варьируется от искреннего энтузиазма одних до осторожной озабоченности других. [28]
Хотя PMC является желанным партнером для издателей открытого доступа, поскольку она способна расширять открытие и распространение биомедицинских знаний, эта же истина заставляет других беспокоиться о том, что трафик будет отвлечен от опубликованной версии записи , а также об экономических последствиях уменьшения читательской аудитории. как влияние на поддержание сообщества ученых в научных обществах. [29] [30] Анализ 2013 года обнаружил убедительные доказательства того, что публичные репозитории опубликованных статей ответственны за «отвлечение значительного числа читателей от веб-сайтов журналов» и что «эффект PMC со временем растет». [31]
Библиотеки, университеты, сторонники открытого доступа, группы по защите здоровья потребителей и организации по защите прав пациентов аплодируют PubMed Central и надеются увидеть аналогичные репозитории открытого доступа, разработанные другими федеральными финансовыми агентствами, чтобы свободно делиться любыми исследовательскими публикациями, ставшими результатом поддержки налогоплательщиков. . [32]
Исследование Антельмана публикаций в открытом доступе показало, что в философии, политологии, электротехнике и электронной технике, а также математике статьи в открытом доступе оказывают большее исследовательское влияние. [33] Рандомизированное исследование выявило увеличение количества загрузок контента статей в открытом доступе без преимущества цитирования по сравнению с доступом по подписке через год после публикации. [34]
Политика НИЗ и работа с хранилищем открытого доступа вдохновили президентскую директиву 2013 года , которая вызвала действия и в других федеральных агентствах.
В марте 2020 года PubMed Central ускорил процедуру хранения полных текстов публикаций о коронавирусе . NLM сделал это по запросу Управления научно-технической политики Белого дома и международных ученых, чтобы улучшить доступ для ученых, поставщиков медицинских услуг, новаторов в области интеллектуального анализа данных , исследователей в области здравоохранения в области искусственного интеллекта и широкой общественности. [35]
PMCID ( идентификатор PubMed Central ), также известный как ссылочный номер PMC, является библиографическим идентификатором базы данных открытого доступа PubMed Central, во многом аналогично тому, как PMID является библиографическим идентификатором базы данных PubMed . Однако эти два идентификатора различны. Он состоит из «PMC», за которым следует строка цифр. Формат: [36]
Авторы, подающие заявку на получение награды NIH , должны указать PMCID в своей заявке.
Чтобы поддержать эту инициативу, NLM адаптирует свои стандартные процедуры размещения статей в PMC, чтобы обеспечить большую гибкость и гарантировать доступность исследований коронавируса.