Проект BBC Genome представляет собой поисковую базу данных программ, изначально основанную на содержании Radio Times с первого выпуска в 1923 году по 2009 год. [1] Программы телепередач после 2009 года доступны на сайте BBC Programmes. [2]
BBC Genome — не первая поисковая база данных BBC. В апреле 2006 года они предоставили публике доступ к Infax — своей единственной электронной базе данных программ на тот момент. Она содержала около 900 000 записей, но не все программы, когда-либо транслировавшиеся, и прекратила работу в декабре 2007 года. [3] Главная страница веб-сайта по-прежнему доступна для просмотра через Интернет-архив . [4] После того, как Infax прекратил свое существование, на веб-сайте появилось сообщение о том, что он будет включать информацию в отдельные страницы программ. [5] В 2012 году Infax была заменена базой данных Fabric, но она предназначена только для внутреннего использования в рамках BBC.
В декабре 2012 года BBC завершила оцифровку, отсканировав списки всех программ BBC с 1923 по 2009 год из Radio Times, собранных из всего тиража журнала, насчитывающего около 4500 экземпляров. [6] Они выявили около пяти миллионов программ с участием 8,5 миллионов актеров, ведущих, писателей и технического персонала. [6] BBC Genome был выпущен для публичного использования 15 октября 2014 года. [7] [8]
Списки опубликованы заранее, поэтому не включают поздние изменения или отмены, которые были отражены в Infax. Однако они включают огромное количество ранних радио- и телепередач, а также «DJ-шоу» с BBC Radio 1 и BBC Radio 2 , которые редко велись официально, которые не были перечислены в Infax (который также обычно не включал повторы архивных программ до 1976 года), поскольку они не были в архивах BBC. Выпуски были отсканированы с высоким разрешением , создав изображения TIFF , а затем оптическое распознавание символов было использовано для преобразования текста со страницы в текст, доступный для поиска в базе данных Genome. [1]
Цель этого проекта — предоставить исследователям возможность легче находить информацию и помочь архивам BBC составить картину того, что существует и чего в настоящее время не хватает в архиве. [9] [10] Исправления ошибок OCR и изменения в объявленных расписаниях финансируются краудсорсингом , [ 7] более 440 910 пользовательских правок были приняты после редакционного просмотра по состоянию на середину декабря 2018 года. [11] [12] Каждая запись в листинге имеет уникальный идентификатор, который может быть выражен как URL. Например, первый показ «Доктора Кто» — это http://genome.ch.bbc.co.uk/8f81c193ba224e84981f353cae480d49. Транслируемая программа может иметь более одного такого идентификатора, если она транслировалась (и, таким образом, была указана) многократно или в разных регионах.
Оцифрованные издания целых журналов (включая обложки, прозаические статьи, рекламу и другой неперечисленный контент) за 1920-е годы были добавлены в марте 2017 года; [13] за 1930-е годы — в декабре 2017 года; [14] за 1940-е годы — в декабре 2018 года; [15] и за 1950-е годы — в декабре 2019 года. [16]
После того, как вы отредактируете запись, ваше предложение будет проверено, и если оно будет принято, Genome будет изменен. Если ваше предложение не соответствует журналу, мы включим ваше изменение в дополнительные данные, которые мы собираем для использования в более поздний срок.