Проект китайского текста

Проект « Китайский текст» (CTP; китайский :中國哲學書電子化計劃) — это проект цифровой библиотеки , который собирает коллекции ранних китайских текстов . Название проекта на китайском языке буквально означает «Проект оцифровки китайских философских книг», что указывает на его фокус на книгах, связанных с китайской философией . Он направлен на предоставление доступных и точных версий широкого спектра текстов, ^[1] особенно тех, которые связаны с китайской философией, и сайту приписывают предоставление одной из самых полных и точных коллекций классических китайских текстов в Интернете, ^[2]^[3], а также он является одной из самых полезных текстовых баз данных для исследователей ранних китайских текстов. ^[4]^[5]

Содержание сайта

Тексты делятся на тексты до Цинь и Хань, и тексты после Хань, причем первые классифицируются по школам мысли , а последние по династиям . Древний (до Цинь и Хань) раздел базы данных содержит более 5 миллионов китайских иероглифов, база данных после Хань более 20 миллионов иероглифов, а общедоступный раздел вики более 5 миллиардов иероглифов. ^[6] Многие тексты также имеют переводы на английский и китайский языки, которые сопоставлены с исходным текстом абзац за абзацем, а также фраза за фразой для удобства сравнения; это позволяет использовать систему в качестве полезного инструмента для научных исследований даже студентам, которые плохо или совсем не знают китайский язык. ^[7]

Помимо предоставления настраиваемой функции поиска, подходящей для китайских текстов, ^[8]^[9] сайт также пытается использовать уникальный формат сети, чтобы предложить ряд функций, важных для синологов , включая интегрированный словарь, списки слов, информацию о параллельных отрывках, ^[10] отсканированные исходные тексты, данные конкорданса и индекса, ^[11] систему метаданных, отображение китайских комментариев, ^[12] базу данных опубликованных ресурсов и форум для обсуждений, в котором темы могут быть связаны с определенными данными на сайте. ^[13]^[14] Раздел «Библиотека» сайта также включает отсканированные копии более 25 миллионов страниц ранних китайских текстов, ^[15]^[6] построчно связанных с транскрипциями в полнотекстовой базе данных, многие из которых созданы с использованием оптического распознавания символов, ^[16] и редактируются и поддерживаются с использованием онлайн-системы краудсорсинга вики. ^[17]^[18] Текстовые данные и метаданные также можно экспортировать с помощью интерфейса прикладного программирования , что позволяет интегрировать их с другими онлайн-инструментами, а также использовать в проектах по анализу текста и цифровым гуманитарным наукам . ^[17]^[19]

Ссылки

^ Элман, Бенджамин А. «Классическая историография китайской истории: базы данных и электронные тексты». Принстонский университет. Архивировано из оригинала 5 августа 2016 г. Получено 3 июня 2016 г.
^ «Ассоциация китайских философов в Северной Америке (北美中国哲学学者协会)» . Архивировано из оригинала 25 декабря 2010 г. Проверено 25 сентября 2010 г.
^ «Ссылки». Крис Фрейзер (方克濤) . Проверено 13 июня 2024 г.
^ «Поддержите проект «Китайский текст»! – Основа, уток и путь». 30 апреля 2013 г.
^ "ПРОЕКТ КИТАЙСКОГО ТЕКСТА. : languagehat.com". languagehat.com . Получено 2024-06-13 .
^ ab «Системная статистика — проект китайского текста».
^ Коннолли, Тим (2012). «Изучение китайской философии с комментариями». Преподавание философии . 35 (1). Центр документации по философии: 1–18. doi :10.5840/teachphil20123511.
^ "Инструкции: Расширенный поиск - Проект китайского текста". ctext.org .
^ «Часто задаваемые вопросы: Нормализация — китайский текстовый проект».
^ Sturgeon, Donald (2017). «Неконтролируемая идентификация повторного использования текста в ранней китайской литературе». Digital Scholarship in the Humanities . Oxford University Press . Получено 21 ноября 2017 г.
^ Сюй, Цзяцзинь (2015). «Корпусные китайские исследования: исторический обзор с 1920-х годов до наших дней». Китайский язык и дискурс . 6 (2). Издательская компания Джона Бенджамина: 218–244. doi : 10.1075/cld.6.2.06xu .
^ Адкинс, Марта А. (2016). «Обзор веб-сайта: онлайн-ресурсы для изучения китайской религии и философии». Теологическое библиотековедение . 9 (2). Американская теологическая библиотечная ассоциация: 5–8. doi : 10.31046/tl.v9i2.435 .
^ "Архивы и активизм в Эспаньоле – д-р". dissertationreviews.org . Получено 2024-06-13 .
^ «Введение — Проект китайского текста».
^ "Библиотека - Проект китайского текста". ctext.org .
^ Sturgeon, Donald (2017). Unsupervised Extraction of Training Data for Pre-Modern Chinese OCR. Тридцатая международная конференция Flairs. AAAI . Получено 21 ноября 2017 г.
^ ab «Краудсорсинг, API и цифровая библиотека китайского языка – Институт политики Китая: анализ». cpianalysis.org . 2016-06-08. Архивировано из оригинала 2017-03-20 . Получено 13 июня 2024 г.
^ "Инструкции: OCR - Проект китайского текста". ctext.org .
^ «Инструменты: API — Проект китайского текста».

Внешние ссылки

Проект китайского текста
中國哲學書電子化計劃(на китайском языке)
Проект китайского текста в Douban (на китайском языке)