Проект « Китайский текст» (CTP; китайский :中國哲學書電子化計劃) — это проект цифровой библиотеки , который собирает коллекции ранних китайских текстов . Название проекта на китайском языке буквально означает «Проект оцифровки китайских философских книг», что указывает на его фокус на книгах, связанных с китайской философией . Он направлен на предоставление доступных и точных версий широкого спектра текстов, [1] особенно тех, которые связаны с китайской философией, и сайту приписывают предоставление одной из самых полных и точных коллекций классических китайских текстов в Интернете, [2] [3], а также он является одной из самых полезных текстовых баз данных для исследователей ранних китайских текстов. [4] [5]
Тексты делятся на тексты до Цинь и Хань, и тексты после Хань, причем первые классифицируются по школам мысли , а последние по династиям . Древний (до Цинь и Хань) раздел базы данных содержит более 5 миллионов китайских иероглифов, база данных после Хань более 20 миллионов иероглифов, а общедоступный раздел вики более 5 миллиардов иероглифов. [6] Многие тексты также имеют переводы на английский и китайский языки, которые сопоставлены с исходным текстом абзац за абзацем, а также фраза за фразой для удобства сравнения; это позволяет использовать систему в качестве полезного инструмента для научных исследований даже студентам, которые плохо или совсем не знают китайский язык. [7]
Помимо предоставления настраиваемой функции поиска, подходящей для китайских текстов, [8] [9] сайт также пытается использовать уникальный формат сети, чтобы предложить ряд функций, важных для синологов , включая интегрированный словарь, списки слов, информацию о параллельных отрывках, [10] отсканированные исходные тексты, данные конкорданса и индекса, [11] систему метаданных, отображение китайских комментариев, [12] базу данных опубликованных ресурсов и форум для обсуждений, в котором темы могут быть связаны с определенными данными на сайте. [13] [14] Раздел «Библиотека» сайта также включает отсканированные копии более 25 миллионов страниц ранних китайских текстов, [15] [6] построчно связанных с транскрипциями в полнотекстовой базе данных, многие из которых созданы с использованием оптического распознавания символов, [16] и редактируются и поддерживаются с использованием онлайн-системы краудсорсинга вики. [17] [18] Текстовые данные и метаданные также можно экспортировать с помощью интерфейса прикладного программирования , что позволяет интегрировать их с другими онлайн-инструментами, а также использовать в проектах по анализу текста и цифровым гуманитарным наукам . [17] [19]