Text Creation Partnership ( TCP ) — некоммерческая организация, базирующаяся в библиотеке Мичиганского университета с 2000 года [обновлять]. Ее цель — создание крупномасштабных полнотекстовых электронных ресурсов (особенно в области гуманитарных наук) от имени как учреждений-членов (в частности, академических библиотек), так и научных издательств в рамках соглашения, рассчитанного на удовлетворение потребностей обеих сторон, и тем самым на демонстрацию ценности бизнес-модели, которая рассматривает корпоративных и некоммерческих поставщиков информации как потенциально дружественных соавторов, а не как антагонистических поставщиков и клиентов соответственно. [1]
На сегодняшний день TCP спонсировал четыре проекта по созданию текстов. Первый и самый крупный — «EEBO-TCP (Phase I)» (2001–2009), попытка создать структурно размеченные полнотекстовые транскрипции 25 000+ из примерно 125 000 книг, которые можно найти либо в каталогах ранних английских печатных книг Pollard and Redgrave and Wing с краткими названиями , либо среди Thomason Tracts , то есть среди почти всех книг, брошюр и брошюр, опубликованных на английском языке или в Англии до 1700 года. Книги были отобраны и транскрибированы из цифровых сканов, созданных ProQuest Information and Learning, и распространены ими как веб-продукт под названием « Early English Books Online » (EEBO). Сканированные копии, с которых были расшифрованы тексты, были сделаны с микрофильмированных копий, сделанных на протяжении многих лет ProQuest и ее предшествующими компаниями, включая оригинальную University Microfilms, Inc. [2] Фаза I EEBO-TCP завершилась в конце 2009 года, когда было расшифровано около 25 300 наименований, и сразу же перешла к фазе II EEBO-TCP (2009–), проекту-продолжению, посвященному конвертации всех оставшихся уникальных англоязычных монографий (примерно 45 000 дополнительных наименований).
Третьим проектом TCP был Evans-TCP (2003–2007, с некоторой продолжающейся работой до 2010 года), попытка транскрибировать 6000 из 36000 названий до 1800 года, перечисленных в Американской библиографии Чарльза Эванса, и распространить, снова в виде изображений страниц, отсканированных с микрофильмов, Readex , подразделением NewsBank, Inc. под названием «Архив Американы» («Ранние американские отпечатки, серия I: Эванс, 1639–1800»). Evans-TCP выпустил электронные тексты почти 5000 книг.
Последним проектом TCP был ECCO-TCP (2005–2010, с некоторыми текущими работами), попытка транскрибировать 10 000 книг восемнадцатого века из 136 000 названий, доступных в веб-ресурсе Thomson-Gale , "Eighteenth-Century Collections Online" (ECCO). ECCO-TCP исчерпал финансирование в 2010 году после транскрибирования около 3000 (и редактирования около 2400) названий.
Все четыре проекта текста TCP очень похожи. В каждом случае:
TCP курируется Советом директоров, в состав которого входят в основном старшие администраторы библиотек в учреждениях-партнерах, представители корпоративных партнеров и Совет по библиотечным и информационным ресурсам (CLIR). Совету в вопросах отбора и стипендий помогает академическая консультативная группа, в которую входят преподаватели в области раннего современного английского языка и американских исследований.
TCP имеет неформальные связи с рядом университетских научных текстовых проектов, особенно в плане предоставления им исходных текстов для работы. Представленные учреждения включают Северо-Западный университет , Оксфордский университет , Вашингтонский университет в Сент-Луисе , Сиднейский университет , Торонтский университет и Викторийский университет . TCP также работал со студентами, спонсируя ежегодный конкурс эссе для студентов, собирая целевые группы по использованию текстов TCP в педагогике и обращаясь к ученым и студентам за идеями по выбору и использованию.
Производством текста управляет Служба производства цифровых библиотек Мичиганского университета (DLPS), имеющая обширный опыт в производстве электронных текстов в кодировке SGML/XML. DLPS помогает Бодлианская система цифровых библиотек и службы (BDLSS) Оксфордского университета, включая покойного Себастьяна Ратца . Небольшие неполные производственные операции также были начаты в двух других библиотеках: Центр исследований Реформации и Возрождения в библиотеке Пратта (Университет Виктории в Университете Торонто), специализирующийся на латинских книгах; и Национальная библиотека Уэльса (Llyfrgell Genedlaethol Cymru) в Аберистуите, специализирующаяся на валлийских книгах.
Все четыре проекта текста TCP производятся одинаково и по одним и тем же стандартам, которые задокументированы, по крайней мере частично, на веб-сайте TCP. [3]
По состоянию на апрель 2011 года TCP создал около 40 000 доступных для поиска, навигации, полных текстовых транскрипций ранних книг, базу данных непревзойденного охвата, масштаба и полезности для студентов во многих областях. [ требуется ссылка ] Сможет ли он продолжить выпуск оставшихся 38 000 текстов, включенных в его амбициозные недавние планы (для EEBO-TCP Phase II), будет зависеть от обоснованности его первоначального видения, вытекающего из теории о том, что библиотеки могут и должны сотрудничать, чтобы стать производителями и разработчиками стандартов, а не потребителями; и что университеты и коммерческие фирмы, несмотря на их очень разные жизненные циклы, ограничения и мотивы, могут объединиться в долгосрочные партнерские отношения, выгодные для всех сторон.
По состоянию на 1 января 2015 года полный текст фазы I EEBO был опубликован под лицензией Creative Commons и может свободно скачиваться и распространяться.
В 2014 году было доступно 28 466 названий через Phase II. По состоянию на июль 2015 года ProQuest имела эксклюзивное право на распространение коллекции EEBO-TCP Phase II в течение пяти лет. В 2020 году тексты стали доступны для свободного доступа общественности. [4]