Trove — австралийская онлайн-библиотека, принадлежащая Национальной библиотеке Австралии , в рамках которой она сотрудничает с поставщиками источников — Национальными и государственными библиотеками Австралии , агрегатором и сервисом, включающим в себя полные тексты документов , цифровые изображения , библиографические и фондовые данные об элементах, которые недоступны в цифровом виде, а также бесплатную систему фасетного поиска в качестве инструмента поиска.
База данных включает в себя архивы , изображения, газеты, официальные документы, архивные веб-сайты , рукописи и другие типы данных. Это один из самых уважаемых и доступных сервисов GLAM в Австралии, с более чем 70 000 ежедневных пользователей.
На основе предшественников, датируемых 1996 годом, первая версия Trove была выпущена для публичного использования в конце 2009 года. Она включает в себя контент из библиотек, музеев, архивов , репозиториев и других организаций с упором на Австралию. Она позволяет искать записи каталогов книг в австралийских библиотеках (некоторые полностью доступны онлайн), академические и другие журналы, полнотекстовый поиск оцифрованных архивных газет, правительственных бюллетеней и архивных веб-сайтов. Она предоставляет доступ к оцифрованным изображениям, картам, агрегированной информации о людях и организациях, архивным дневникам и письмам, а также всему изначально цифровому контенту, который был депонирован через Национальный edeposit (NED). Поисковый контент также включает музыку, звук и видео , а также стенограммы радиопрограмм. За исключением оцифрованных газет, ни один из контентов не размещается самим Trove, который индексирует контент метаданных коллекций своих партнеров , форматирует и управляет им, а также отображает агрегированную информацию в результатах поиска с ранжированием по релевантности.
В связи с сокращением государственного финансирования с 2015 года Национальная библиотека и другие организации с трудом справляются с обеспечением постоянного обновления и обновления контента Trove.
Истоки Trove можно увидеть в развитии более ранних служб, таких как Австралийская библиографическая сеть (ABN) [1] , служба коллективной каталогизации, запущенная в 1981 году.
«Проект по поиску единой информации о бизнесе» был запущен в августе 2008 года. [2] Целью было создание единой точки доступа для общественности к различным онлайн-сервисам поиска информации, разработанным библиотекой в период с 1997 по 2008 год, включая: [2] [3] [4]
Разработанная в рамках проекта услуга получила название Single Business Discovery Service , а также недолгое время была известна среди сотрудников как Girt . Название Trove было предложено одним из сотрудников, с ассоциациями с сокровищницей и французским глаголом trouver ( находить или обнаруживать). [4]
Ключевые функции сервиса были разработаны для создания многогранной поисковой системы специально для австралийского контента. Тесная интеграция с базами данных провайдера позволила использовать функции «Найти и получить» (например, просмотр в цифровом формате, заимствование, покупка, копирование). Важные дополнительные функции включают предоставление инструмента «проверка авторских прав» и постоянные идентификаторы (что позволяет использовать стабильные URL-адреса). [7]
Первая версия Trove была выпущена в конце 2009 года. [7]
Национальная библиотека Австралии объединила восемь различных онлайн-инструментов поиска, которые разрабатывались в течение двенадцати лет, в новый единый интерфейс поиска, который был выпущен в качестве прототипа в мае 2009 года для публичного обсуждения, прежде чем был запущен в ноябре 2009 года как Trove. [8] Он постоянно обновляется для расширения своего охвата. [9] [10] За исключением газетной «зоны», ни один из материалов, которые появляются в результатах поиска Trove, не размещается самим Trove. Вместо этого он индексирует контент метаданных коллекций своих партнеров по контенту и отображает агрегированную информацию в результатах поиска, ранжированных по релевантности. [11]
Сервис создан с использованием разнообразного программного обеспечения с открытым исходным кодом . [12] [13] Trove предоставляет бесплатный общедоступный интерфейс прикладного программирования (API). [14] Это позволяет разработчикам осуществлять поиск по записям книг, изображений, карт, видео, архивов, музыки, звука, журнальных статей, газетных статей и списков, а также извлекать связанные метаданные с помощью кодирования XML и JSON . [15] [16] Также доступен полный текст оцифрованных газетных статей. [17]
Несколько стилей цитирования автоматически создаются программным обеспечением, предоставляя стабильный URL-адрес для издания, страницы или уровня статьи для любой газеты. Wikipedia была тесно интегрирована с самого начала проекта, что сделало Trove первым веб-сайтом GLAM в мире, который интегрировал API Wikipedia в свой продукт. [18]
Trove продолжает развиваться и внедрять новые услуги и коллекции.
В 2012 году Music Australia объединилась с Trove и прекратила свое существование как отдельная организация. [19]
В 2016 году в сотрудничестве с Государственной библиотекой Нового Южного Уэльса Trove запустил зону правительственных газет и продолжает собирать официальные газеты всех уровней власти ( Содружества , штатов и территорий ) там, где это возможно. [20]
В марте 2019 года PANDORA стала частью более крупного Австралийского веб-архива , который включает в себя архив PANDORA, Австралийский правительственный веб-архив (AGWA) и коллекции доменов «.au» Национальной библиотеки , используя единый интерфейс в Trove, который находится в открытом доступе. [21] [22] [23] [24]
Trove вышел за рамки своих первоначальных целей и стал «сообществом, набором услуг, агрегацией метаданных и растущим хранилищем полнотекстовых цифровых ресурсов» и «платформой, на которой строятся новые знания». Теперь это сотрудничество между Национальной библиотекой, библиотеками штатов и территорий Австралии и сотнями других культурных и исследовательских учреждений по всей Австралии. [25]
Это австралийский онлайн -агрегатор баз данных библиотек ; бесплатная многофункциональная поисковая система, размещенная в Национальной библиотеке Австралии [26] в партнерстве с поставщиками контента, включая членов Национальной и государственной библиотек Австралии (NSLA). [7]
Trove «объединяет контент из библиотек, музеев, архивов, хранилищ и других исследовательских и коллекционных организаций, больших и малых», чтобы помочь пользователям находить и использовать ресурсы, связанные с Австралией, и поэтому контент ориентирован на Австралию. [25] Большую часть материала может быть трудно найти с помощью других поисковых инструментов, например, в случаях, когда он является частью глубокой сети , включая записи, хранящиеся в базах данных коллекций, [7] или в таких проектах, как веб-архив PANDORA , Australian Research Online, Australian National Bibliographic Database и других, упомянутых выше. [3]
С 2019 года Trove включил доступ ко всем электронным документам, депонированным австралийскими издателями в соответствии с положениями об обязательном экземпляре Закона об авторском праве 1968 года с поправками, внесенными в 2017 году, чтобы включить такие публикации. [27] Эти ресурсы можно идентифицировать по отображению в правом верхнем углу как в средствах просмотра электронных книг, так и в программах просмотра PDF-файлов, где написано «Национальная коллекция edeposit». Многие из них доступны для чтения, а некоторые — для загрузки , в зависимости от условий доступа. [28]
Контент сайта разделен на «зоны», обозначающие различные формы контента, которые можно искать все вместе или по отдельности. [29]
Зона книг позволяет осуществлять поиск по коллективным каталогам учреждений, которые можно найти в библиотеках Австралии, используя Австралийскую национальную библиографическую базу данных (ANBD). Она обеспечивает доступ к книгам, аудиокнигам , электронным книгам , диссертациям , материалам конференций и брошюрам, перечисленным в ANBD, который является объединенным каталогом единиц хранения в австралийских библиотеках и национальной библиографической базой данных ресурсов, включая австралийские онлайн-публикации. [30] Библиографические записи из ANBD также загружаются в глобальный объединенный каталог WorldCat . [31] Результаты можно фильтровать по формату, если ищутся книги со шрифтом Брайля , аудиокниги, диссертации или материалы конференций, а также по десятилетию и языку публикации. [32] Также предоставляется фильтр для австралийского контента. [8] [33]
Trove позволяет осуществлять текстовый поиск в оцифрованных исторических газетах, при этом зона «Газеты» заменила предыдущий веб-сайт «Австралийские газеты». [ требуется ссылка ] Он обеспечивает текстовый поисковый доступ к более чем 700 историческим австралийским газетам из каждого штата и территории. [35] К 2014 году более 13,5 миллионов оцифрованных газетных страниц были предоставлены через Trove в рамках Австралийского газетного плана (ANPlan), [36] «совместной программы по сбору и сохранению каждой газеты, изданной в Австралии, гарантирующей публичный доступ» к этим важным историческим записям. [37]
Объем оцифрованных газетных архивов обширен и включает в себя ныне несуществующие издания, такие как Australian Home Companion и Band of Hope Journal , а также The Barrier Miner в Новом Южном Уэльсе и The Argus в Виктории. [примечание 1] [38] Он включает в себя самую раннюю опубликованную австралийскую газету Sydney Gazette (которая датируется 1803 годом) и некоторые газеты на языках сообщества . [36] Также включен The Australian Women's Weekly . [39] [примечание 2]
The Canberra Times — единственная крупная газета, доступная после 1957 года. Она разрешила публикацию своего архива, защищенного авторским правом, до 1995 года в рамках «столетия Канберры» в 2013 году, [41] а расходы на оцифровку были собраны с помощью краудфандинговой кампании. [42] Также финансируемый с помощью краудфандинга австралийский феминистский журнал The Dawn был включен в Международный женский день 2012 года. [43] [44]
По состоянию на 10 мая 2020 года [обновлять]для просмотра было доступно 23 498 368 газетных страниц и 2 026 782 страницы правительственных бюллетеней.
25 июля 2008 года служба «Australian Newspapers Beta» была выпущена для публики как отдельный веб-сайт, а год спустя стала полностью интегрированной частью недавно запущенного Trove. Служба содержит миллионы статей с 1803 года и далее, и регулярно добавляется новый контент. [45] Веб-сайт был публичным лицом проекта Australian Newspapers Digitisation Project, координирующего работу крупнейших библиотек Австралии по преобразованию исторических газет в цифровые файлы с возможностью текстового поиска. Веб-сайт Australian Newspapers позволял пользователям осуществлять поиск в базе данных оцифрованных газет с 1803 по 1954 год, которые теперь находятся в открытом доступе .
Газеты (часто микрофиши или другие фотографические факсимиле) были отсканированы, а текст из статей был захвачен с помощью оптического распознавания символов (OCR) для облегчения поиска, но он содержит много ошибок OCR, часто из-за плохого качества факсимиле. [46] [47]
С августа 2008 года система включила краудсорсинговое исправление текста в качестве основной функции, что позволяет общественности изменять текст, доступный для поиска. Многие пользователи внесли десятки тысяч исправленных строк, а некоторые — миллионы. [48] По состоянию на январь 2022 года 5,82% статей имеют по крайней мере одно исправление. [49] Такое совместное участие позволяет пользователям вносить свой вклад в службу и со временем улучшает поисковую доступность базы данных. [50] [51] Сообщество исправления текста и другие пользователи Trove называются «Trovites». [52]
Австралийский веб-архив , созданный в марте 2019 года, [53] включает веб-сайты, архивированные с 1996 года по настоящее время. Это основной поисковый портал службы веб-архивирования PANDORA , а также веб-архив правительства Австралии (AGWA) и веб-сайты из домена ".au" , которые собираются ежегодно с помощью больших сборов данных . [54]
(В порядке представления на верхней вкладке.)
В программной речи на 14-й конференции Национальной австралийской библиотечной и информационной ассоциации (ALIA) в Мельбурне в 2014 году Роли Китинг , генеральный директор Британской библиотеки, охарактеризовал Trove как «образцовый» – «выбор с обеих сторон» глубокого, богатого и взаимосвязанного архива. [57]
Исследователь цифровых гуманитарных наук и менеджер Trove Тим Шерратт отметил, что в отношении интерфейса прикладного программирования (API) Trove «доставка ресурсов культурного наследия в машиночитаемой форме, будь то через пользовательский API или как связанные открытые данные , обеспечивает больше, чем просто улучшенный доступ или возможности для агрегации. Он открывает эти ресурсы для трансформации. Он дает нам возможность выйти за рамки «открытия» как способа взаимодействия для анализа, извлечения, визуализации и воспроизведения». [58] Последующая разработка GLAM Workbench [59] направлена на использование таких машиночитаемых данных. [60] С 2018 года Австралийская академическая и исследовательская сеть ( AARNet ) предоставила специальную среду Jupyter Notebooks , которая позволяет исследователям «легко исследовать и анализировать данные, хранящиеся в Национальной библиотеке Австралии (и Cloudstor), используя Jupyter Notebooks, созданные и открыто предоставленные доцентом Тимом Шерраттом через «GLAM Workbench». [61]
Сайт описывается как «модель для совместных проектов по оцифровке и служит для информирования учреждений культурного наследия, создающих как большие, так и маленькие цифровые коллекции» [62] .
Охват газетных архивов делает сервис привлекательным для генеалогов [63] [64] [65] и вязальщиц . [9] Это один из самых уважаемых [66] и доступных сервисов GLAM (галереи, библиотеки, архивы и музеи) в Австралии, с более чем 70 000 ежедневных пользователей. [67] [9]
Доктор Лиз Стейнфорт из Университета Лидса называет его «редким зверем: платформой цифрового наследия с популярной привлекательностью»; «самой успешной в своем роде среди агрегаторов, таких как Europeana , Цифровая публичная библиотека Америки и... DigitalNZ ». Что отличает его от трех других, так это то, что он также предоставляет контент и взаимодействует с широкой общественностью, что создало форму виртуального сообщества среди его корректоров текста. Пользователи могут войти в систему и, таким образом, создавать свои собственные списки, а также исправлять текст газет, отсканированных с помощью оптического распознавания символов (OCR), с почетной доской для лучших корректоров. Международные исследователи также используют Trove: в 2018 году сайт вошел в число 15 лучших по внешним цитированиям в англоязычной версии Википедии. Широта и широта его аудитории добавляют ему уникальности. [68]
Trove получил премию 2011 года за выдающиеся достижения в области электронного правительства и премию в категории «Доставка услуг» 2011 года. [69] [70]
Вслед за заявлением правительства Австралии о среднесрочных экономических и фискальных перспективах за 2015 год финансирование Trove было сокращено, в результате чего Национальная библиотека Австралии прекратит «объединять контент в Trove из музеев и университетов, если только... не будет полностью профинансирована для этого». [71] Кроме того, утверждалось, что сокращения еще больше «приведут к тому, что многие более мелкие учреждения по всей Австралии не смогут позволить себе добавлять свои цифровые коллекции в эту национальную инфраструктуру знаний». [72] К этим более мелким учреждениям относятся местные исторические общества, клубы, школы, коммерческие и общественные организации, а также частные коллекции.
В марте 2016 года десять крупных австралийских галерей, библиотек, архивов и музеев (обычно называемых сектором GLAM ) подписали заявление в поддержку Trove, в котором они предупредили, что бюджетные сокращения «затруднят развитие нашего ведущего мирового портала и станут серьезным препятствием для демонстрации коллекций небольших и региональных учреждений» и что «без дополнительного финансирования Trove не выполнит своего обещания как место открытия всего австралийского культурного контента». [73] Аналогичные заявления были сделаны Австралийской академией гуманитарных наук [74] и Национальным фондом (Новый Южный Уэльс) . [75]
Тим Шерратт, бывший менеджер Trove, в начале 2016 года предупреждал, что будет добавлено меньше коллекций и что будет доступно меньше оцифрованного контента — «не совсем заморозка контента, но определенно замедление». [76]
После масштабной кампании, включая публичную кампанию в Twitter , в декабре 2016 года Trove получил обязательство в размере 16,4 млн австралийских долларов , распределенное на четыре года. [68] [77]
К началу 2020 года, в связи с резким ростом спроса на все виды цифровых услуг, Национальной библиотеке пришлось справляться со все более сокращающимися кадровыми ресурсами для разработки услуг на Trove и National edeposit, и она провела реструктуризацию своего персонала и операций. [78]
В 2022 году издания The Age и The Sydney Morning Herald сообщили, что текущие договоренности о финансировании Trove прекратятся в конце июня 2023 года, что приведет к его закрытию. [79] В апреле было объявлено, что федеральное правительство пообещало NLA чрезвычайное финансирование в размере 33 миллионов долларов в течение следующих четырех лет. [80] [81] [82]
В июле–августе 2020 года был представлен обновленный пользовательский интерфейс с более открытым отображением результатов поиска и новым логотипом, напоминающим замочную скважину .
Пилотное тестирование распознавания рукописного текста с использованием оптического распознавания символов (OCR) и распознавания рукописного текста (HTR) началось в октябре 2023 года, при этом функция исправления текста появилась в некоторых рукописных и неопубликованных материалах. [83]
{{cite journal}}
: Цитировать журнал требует |journal=
( помощь ){{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка )