arXiv (произносится как « архив » — X представляет греческую букву chi ⟨χ⟩) [1] — хранилище электронных препринтов и постпринтов с открытым доступом (известных как электронные отпечатки ), одобренных для публикации после модерации, но не рецензирования. . Он состоит из научных работ в области математики , физики , астрономии , электротехники , информатики , количественной биологии , статистики , математических финансов и экономики , доступ к которым можно получить в Интернете. Во многих областях математики и физики почти все научные статьи перед публикацией в рецензируемом журнале самостоятельно архивируются в репозитории arXiv. Некоторые издатели также разрешают авторам архивировать рецензируемый постпринт . Созданный 14 августа 1991 года, arXiv.org преодолел отметку в полмиллиона статей 3 октября 2008 года, [2] [3] достиг миллиона к концу 2014 года [4] [5] и двух миллионов к концу 2014 года. конец 2021 года. [6] [7] По состоянию на апрель 2021 года скорость подачи составляет около 16 000 статей в месяц. [8]
arXiv стал возможен благодаря компактному формату файлов TeX , который позволял легко передавать научные статьи через Интернет и обрабатывать файлы . [11] Примерно в 1990 году Джоан Кон начала рассылать коллегам по электронной почте препринты по физике в виде файлов TeX, но количество отправляемых статей вскоре заполнило почтовые ящики до отказа. [12] Пол Гинспарг осознал необходимость центрального хранилища и в августе 1991 года создал почтовый ящик центрального хранилища , хранящийся в Национальной лаборатории Лос-Аламоса (LANL), к которому можно было получить доступ с любого компьютера. [13] Вскоре были добавлены дополнительные способы доступа: FTP в 1991 году, Gopher в 1992 году и World Wide Web в 1993 году . [5] [14] Термин «электронная печать» был быстро принят для описания статей.
Он начинался как архив физики, называемый архивом препринтов LANL , но вскоре расширился, включив в него астрономию, математику, информатику, количественную биологию и, совсем недавно, статистику. Его первоначальное доменное имя было xxx.lanl.gov. Из-за отсутствия интереса LANL к быстро развивающейся технологии, в 2001 году Гинспарг сменил учреждение на Корнельский университет и изменил название репозитория на arXiv.org. [15] В настоящее время его хостом является главным образом Корнелл, а его зеркала расположены по всему миру. [16]
arXiv был одним из первых, кто начал использовать и продвигать препринты . [17] Его успех в обмене препринтами был одним из ускоряющих факторов, которые привели к более позднему движению в научных публикациях , известному как открытый доступ . [17] Математики и ученые регулярно загружают свои статьи на arXiv.org для доступа по всему миру [18] , а иногда и для рецензий, прежде чем они будут опубликованы в рецензируемых журналах . Гинспарг был награжден стипендией Макартура в 2002 году за создание arXiv. [19] Годовой бюджет arXiv на 2013–2017 годы составлял примерно 826 000 долларов США и финансировался совместно Библиотекой Корнелльского университета, Фондом Саймонса (как в форме подарков, так и в форме грантов ) и ежегодными поступлениями от членских организаций. [20] Эта модель возникла в 2010 году, когда Корнелл стремился расширить финансовое финансирование проекта, попросив учреждения делать ежегодные добровольные взносы в зависимости от объема использования загрузок каждым учреждением. Каждое учреждение-член берет на себя пятилетнее обязательство по финансированию поддержки arXiv. В зависимости от рейтинга институционального использования ежегодные сборы устанавливаются в четыре уровня: от 1000 до 4400 долларов США. Цель Корнелла — собирать не менее 504 000 долларов в год за счет членских взносов, взимаемых примерно 220 учреждениями. [21]
В сентябре 2011 года библиотека Корнеллского университета взяла на себя общую административную и финансовую ответственность за работу и развитие arXiv. В «Хрониках высшего образования» процитировали Гинспарга, который сказал, что это «должна была быть трехчасовая экскурсия , а не пожизненное заключение». [22] Однако Гинспарг остается членом Научно-консультативного совета arXiv и его Консультативного комитета по физике. [23] [24]
В январе 2022 года arXiv в сотрудничестве с DataCite начал присваивать статьям DOI . [25]
Каждая статья arXiv имеет уникальный идентификатор:
YYMM.NNNNN
, например 1507.00123
,YYMM.NNNN
, например 0704.0001
,arch-ive/YYMMNNN
для старых документов, например hep-th/9901001
.Различные версии одного и того же документа обозначаются номером версии в конце. Например, 1709.08980v1
. Если номер версии не указан, по умолчанию используется последняя версия.
arXiv использует систему категорий. Каждая статья помечена одной или несколькими категориями. Некоторые категории имеют два слоя. Например, q-fin.TR
это категория «Торговля и микроструктура рынка» в разделе «Количественные финансы». Другие категории имеют один слой. Например, hep-ex
это «эксперименты по физике высоких энергий».
Хотя arXiv не рецензируется , материалы просматриваются группой модераторов в каждой области ; они могут переклассифицировать любые материалы, которые считаются не по теме, [26] или отклонять материалы, которые не являются научными статьями, а иногда и по нераскрытым причинам. [27] Списки модераторов многих разделов arXiv общедоступны, [28] но модераторы большинства разделов физики остаются незамеченными.
Кроме того, в 2004 году была введена система «одобрения» как часть усилий по обеспечению актуальности контента и интереса для текущих исследований в указанных дисциплинах. [29] Согласно этой системе, для категорий, которые ее используют, автор должен быть одобрен признанным автором arXiv, прежде чем ему будет разрешено подавать статьи в эти категории. Индоссантам предлагается не проверять статью на наличие ошибок, а проверять, соответствует ли статья предполагаемой предметной области. [26] Новые авторы из признанных академических учреждений обычно получают автоматическое одобрение, что на практике означает, что им вообще не нужно иметь дело с системой одобрения. Однако система одобрения вызвала критику за якобы ограничение научных исследований. [30] [31]
Большинство электронных отпечатков также передаются в журналы для публикации, но некоторые работы, в том числе некоторые очень влиятельные статьи, остаются исключительно в виде электронных распечаток и никогда не публикуются в рецензируемых журналах. Хорошо известным примером последнего является набросок доказательства гипотезы Тёрстона о геометризации , включая гипотезу Пуанкаре как частный случай, загруженный Григорием Перельманом в ноябре 2002 года. [32] Перельман, похоже, доволен отказом от традиционного рецензируемого журнала. процесс, заявив: «Если кого-то интересует мой способ решения проблемы, все это есть [на arXiv] — пусть пойдут и прочитают об этом». [33] Несмотря на этот нетрадиционный метод публикации, другие математики признали эту работу, предложив Перельману медаль Филдса и премию тысячелетия в области математики Клея, от чего он отказался. [34]
Хотя arXiv действительно содержит некоторые сомнительные электронные издания, например те, которые утверждают, что опровергают известные теоремы или доказывают известные гипотезы, такие как Великая теорема Ферма, с использованием только школьной математики, статья 2002 года, опубликованная в « Извещениях Американского математического общества», описывает их как « удивительно редко». [35] arXiv обычно переклассифицирует эти работы, например, в «Общую математику», а не удаляет их; [36] однако некоторые авторы выразили обеспокоенность по поводу отсутствия прозрачности в процессе скрининга arXiv. [27]
Статьи могут быть представлены в любом из нескольких форматов, включая LaTeX и PDF , распечатанные с помощью текстового процессора , отличного от TeX или LaTeX. Отправка отклоняется программным обеспечением arXiv, если не удается создать окончательный файл PDF , если какой-либо файл изображения слишком велик или если общий размер отправленного файла слишком велик. arXiv теперь позволяет хранить и изменять неполную отправку и завершать отправку только тогда, когда она будет готова. Отметка времени на статье устанавливается после завершения подачи.
Стандартный путь доступа — через веб-сайт arXiv.org или одно из нескольких зеркал. Другие интерфейсы и маршруты доступа также были созданы другими несвязанными организациями.
Метаданные для arXiv доступны через OAI-PMH , стандарт для репозиториев с открытым доступом . [37] Поэтому контент индексируется во всех основных потребителях таких данных, таких как BASE , CORE и Unpaywall . По состоянию на 2020 год дамп Unpaywall ссылается на более чем 500 000 URL-адресов arxiv как на версию произведения с открытым доступом , обнаруженную в данных CrossRef от издателей, что делает arXiv одним из 10 лучших мировых хостов зеленого открытого доступа .
Наконец, исследователи могут выбирать подполя и получать ежедневные электронные письма или RSS-каналы обо всех материалах в них.
Файлы на arXiv могут иметь несколько различных статусов авторских прав: [38]
Произносите это как «архив». X представляет собой греческую букву хи [χ].
Новая система одобрения может способствовать созданию эффективного барьера - цифрового неравенства.