Проект BBC Genome представляет собой онлайн-базу данных списков программ с возможностью поиска, первоначально основанную на содержании Radio Times с первого выпуска с 1923 по 2009 год. [1] Доступ к телепрограммам после 2009 года можно получить через сайт программ BBC. [2]
BBC Genome - не первая база данных BBC с возможностью поиска в Интернете. В апреле 2006 года они предоставили публичный доступ к «Инфаксу» — единственной на тот момент электронной программной базе данных. Он содержал около 900 000 записей, но не все программы, которые когда-либо транслировались, и прекратил работу в декабре 2007 года. [3] Главную страницу веб-сайта по-прежнему можно увидеть через Интернет-архив . [4] После закрытия «Инфакса» на веб-сайте появилось сообщение о том, что информация будет включена в отдельные страницы программы. [5] В 2012 году Infax был заменен базой данных Fabric, но она предназначена только для внутреннего использования внутри BBC.
В декабре 2012 года BBC завершила оцифровку, отсканировав списки всех программ BBC с 1923 по 2009 год из Radio Times из всего тиража журнала, насчитывающего около 4500 экземпляров. [6] Они определили около пяти миллионов программ с участием 8,5 миллионов актеров, ведущих, писателей и технического персонала. [6] Геном BBC был выпущен для публичного использования 15 октября 2014 года. [7] [8]
Объявления опубликованы заранее и не включают в себя поздние изменения или отмены, которые были отражены в «Инфаксе». Тем не менее, они включают в себя огромное количество ранних радио- и телепередач, а также «ди-джеев-шоу» BBC Radio 1 и BBC Radio 2 , которые редко сохранялись официально и не были указаны в «Инфаксе» (который также обычно не включал повторы архивных программ). до 1976 года), поскольку их не было в архивах BBC. Выпуски были отсканированы с высоким разрешением , в результате чего были созданы изображения в формате TIFF , а затем использовалось оптическое распознавание символов для преобразования текста со страницы в текст, доступный для поиска в базе данных Genome. [1]
Цель этого проекта — позволить исследователям легче находить информацию и помочь архивам BBC составить представление о том, что существует и чего в настоящее время не хватает в архиве. [9] [10] Исправления ошибок оптического распознавания символов и изменения в рекламируемых расписаниях собираются с помощью краудсорсинга , [7] более 440 910 правок, внесенных пользователями, приняты после редакционной проверки по состоянию на середину декабря 2018 года. [11] [12] Каждая запись в списке имеет уникальный идентификатор, который может быть выражен в виде URL-адреса. Например, первый показ «Доктора Кто » http://genome.ch.bbc.co.uk/8f81c193ba224e84981f353cae480d49. Радиовещательная программа может иметь более одного такого идентификатора, если она транслировалась (и, следовательно, была указана в списке) неоднократно или в разных регионах.
Оцифрованные издания целых журналов (включая обложки, прозаические статьи, рекламу и другой контент, не включенный в списки) 1920-х годов были добавлены в марте 2017 года; [13] за 1930-е годы в декабре 2017 г.; [14] за 1940-е годы в декабре 2018 г.; [15] и за 1950-е годы в декабре 2019 г. [16]
Как только вы отредактируете запись, ваше предложение будет проверено, и если оно будет принято, геном будет изменен.
Если ваше предложение не соответствует журналу, мы включим ваше изменение в дополнительные данные, которые мы собираем, для использования позже.