arXiv (произносится как « архив » — X представляет собой греческую букву хи ⟨χ⟩) [1] — это открытый репозиторий электронных препринтов и постпринтов (известных как электронные принты ), одобренных для публикации после модерации, но не рецензирования . Он состоит из научных статей в области математики , физики , астрономии , электротехники , информатики , количественной биологии , статистики , математических финансов и экономики , к которым можно получить доступ онлайн. Во многих областях математики и физики почти все научные статьи самостоятельно архивируются в репозитории arXiv перед публикацией в рецензируемом журнале. Некоторые издатели также предоставляют авторам разрешение на архивирование рецензируемых постпринтов . Начав свою работу 14 августа 1991 года, arXiv.org преодолел отметку в полмиллиона статей 3 октября 2008 года [2] [3] , к концу 2014 года [4] [5] число статей достигло миллиона , а к концу 2021 года — двух миллионов. [6] [7] По состоянию на апрель 2021 года скорость отправки статей составляет около 16 000 статей в месяц. [8]
arXiv стал возможен благодаря компактному формату файлов TeX , который позволял легко передавать научные статьи через Интернет и отображать их на стороне клиента . [11] Около 1990 года Джоан Кон начала отправлять по электронной почте препринты по физике коллегам в виде файлов TeX, но количество отправляемых статей вскоре заполнило почтовые ящики до отказа. [12] Пол Джинспарг осознал необходимость централизованного хранения, и в августе 1991 года он создал центральный репозиторий почтовых ящиков, хранящихся в Лос-Аламосской национальной лаборатории (LANL), к которому можно было получить доступ с любого компьютера. [13] Вскоре были добавлены дополнительные режимы доступа: FTP в 1991 году, Gopher в 1992 году и World Wide Web в 1993 году. [5] [14] Термин «электронная печать» был быстро принят для описания статей.
Он начинался как архив физики, названный архивом препринтов LANL , но вскоре расширился, включив в себя астрономию, математику, информатику, количественную биологию и, совсем недавно, статистику. Его первоначальное доменное имя было xxx.lanl.gov. Из-за отсутствия интереса LANL к быстро развивающейся технологии, в 2001 году Джинспарг сменил учреждение на Корнеллский университет и изменил название репозитория на arXiv.org. [15]
arXiv был одним из первых, кто принял и продвигал препринты . [16] Его успех в распространении препринтов был одним из факторов, которые привели к более позднему движению в научных публикациях, известному как открытый доступ . [16] Математики и ученые регулярно загружают свои статьи на arXiv.org для всемирного доступа [17] и иногда для рецензий до их публикации в рецензируемых журналах . В 2002 году Джинспарг был удостоен стипендии Макартура за создание arXiv. [18] Годовой бюджет arXiv составлял приблизительно 826 000 долларов США на период с 2013 по 2017 год, финансируемый совместно Библиотекой Корнелльского университета, Фондом Саймонса (как в форме дара, так и гранта на вызов ) и ежегодным доходом от членских организаций. [19] Эта модель возникла в 2010 году, когда Корнелл стремился расширить финансовое финансирование проекта, попросив организации вносить ежегодные добровольные взносы на основе объема использования загрузок каждым учреждением. Каждый член организации обязуется внести пятилетнее обязательство по финансированию поддержки arXiv. На основе рейтинга институционального использования ежегодные взносы устанавливаются в четыре уровня от $1000 до $4400. Целью Корнелла является сбор не менее $504000 в год за счет членских взносов, вносимых примерно 220 организациями. [20]
В сентябре 2011 года библиотека Корнеллского университета взяла на себя общую административную и финансовую ответственность за работу и развитие arXiv. В Chronicle of Higher Education цитируют Джинспарга , который сказал, что «это должна была быть трехчасовая экскурсия , а не пожизненное заключение». [21] Однако Джинспарг остается в Научном консультативном совете arXiv и его Физическом консультативном комитете. [22] [23]
В январе 2022 года arXiv начал присваивать статьям DOI в сотрудничестве с DataCite . [24]
Каждая статья arXiv имеет уникальный идентификатор:
YYMM.NNNNN
, например 1507.00123
,YYMM.NNNN
, например 0704.0001
,arch-ive/YYMMNNN
для старых работ, например hep-th/9901001
.Различные версии одной и той же статьи указываются номером версии в конце. Например, 1709.08980v1
. Если номер версии не указан, по умолчанию используется последняя версия.
arXiv использует систему категорий. Каждая статья помечена одной или несколькими категориями. Некоторые категории имеют два слоя. Например, q-fin.TR
это категория «Торговля и микроструктура рынка» в рамках «количественных финансов». Другие категории имеют один слой. Например, hep-ex
это «эксперименты по физике высоких энергий».
Хотя arXiv не рецензируется , группа модераторов для каждой области просматривает заявки ; они могут переименовать любые, которые считаются не относящимися к теме, [25] или отклонить заявки, которые не являются научными статьями, или иногда по нераскрытым причинам. [26] Списки модераторов для многих разделов arXiv общедоступны, [27] но модераторы для большинства разделов по физике остаются неуказанными.
Кроме того, в 2004 году была введена система «одобрения» как часть усилий по обеспечению релевантности контента и интереса к текущим исследованиям в указанных дисциплинах. [28] В рамках этой системы, для категорий, которые ее используют, автор должен быть одобрен признанным автором arXiv, прежде чем ему будет разрешено подавать статьи в эти категории. Одобряющим не предлагается проверять статью на наличие ошибок, а необходимо проверить, соответствует ли статья предполагаемой предметной области. [25] Новые авторы из признанных академических учреждений обычно получают автоматическое одобрение, что на практике означает, что им вообще не нужно иметь дело с системой одобрения. Однако система одобрения подверглась критике за то, что она якобы ограничивает научное исследование. [29] [30]
Большинство электронных печатных работ также отправляются в журналы для публикации, но некоторые работы, включая некоторые очень влиятельные статьи, остаются исключительно в виде электронных печатных работ и никогда не публикуются в рецензируемом журнале. Известным примером последнего является набросок доказательства гипотезы геометризации Терстона , включая гипотезу Пуанкаре как частный случай, загруженный Григорием Перельманом в ноябре 2002 года. [31] Перельман, похоже, доволен тем, что отказался от традиционного процесса рецензирования журнала, заявив: «Если кого-то интересует мой способ решения проблемы, все это есть [на arXiv] — пусть идут и читают об этом». [32] Несмотря на этот нетрадиционный метод публикации, другие математики признали эту работу, предложив Перельману медаль Филдса и премию тысячелетия по математике Клэя , от обеих из которых он отказался. [33]
Хотя arXiv действительно содержит некоторые сомнительные электронные публикации, например, те, которые утверждают, что опровергают известные теоремы или доказывают известные гипотезы, такие как Великая теорема Ферма , используя только математику средней школы, статья 2002 года, опубликованная в Notices of the American Mathematical Society, описала их как «удивительно редкие». [34] arXiv обычно переклассифицирует эти работы, например, в «Общую математику», а не удаляет их; [35] однако некоторые авторы выразили обеспокоенность по поводу отсутствия прозрачности в процессе отбора arXiv. [26]
Статьи могут быть представлены в любом из нескольких форматов, включая LaTeX и PDF, напечатанные из текстового процессора, отличного от TeX или LaTeX. Заявка отклоняется программным обеспечением arXiv, если не удается создать окончательный файл PDF , если какой-либо файл изображения слишком велик или если общий размер заявки слишком велик. Теперь arXiv позволяет сохранять и изменять неполную заявку и завершать ее только по готовности. Отметка времени на статье устанавливается при завершении отправки.
Стандартный путь доступа — через сайт arXiv.org. Другие интерфейсы и пути доступа также были созданы другими неассоциированными организациями.
Метаданные для arXiv предоставляются через OAI-PMH , стандарт для репозиториев открытого доступа . [36] Таким образом, контент индексируется во всех основных потребителях таких данных, таких как BASE , CORE и Unpaywall . По состоянию на 2020 год, дамп Unpaywall ссылается на более чем 500 000 URL-адресов arxiv как на версию открытого доступа работы, найденной в данных CrossRef от издателей, что делает arXiv одним из 10 лучших мировых хостов зеленого открытого доступа .
Наконец, исследователи могут выбирать подтемы и получать ежедневные электронные рассылки или RSS-каналы всех материалов по ним.
Файлы на arXiv могут иметь несколько различных статусов авторских прав: [37]
Произносится как «архив». X представляет греческую букву хи [χ].
Новая система одобрения может способствовать эффективному барьеру, цифровому неравенству