stringtranslate.com

Китайский текстовый проект

Проект китайского текста (CTP; китайский :中國哲學書電子化計劃) — это проект цифровой библиотеки , объединяющий коллекции ранних китайских текстов . Название проекта на китайском языке буквально означает «Проект оцифровки китайской философской книги», что указывает на то, что он ориентирован на книги, связанные с китайской философией . Он направлен на предоставление доступных и точных версий широкого спектра текстов, [1] особенно тех, которые относятся к китайской философии, и этот сайт считается одним из наиболее полных и точных коллекций классических китайских текстов в Интернете, [2] ] [3] , а также является одной из наиболее полезных текстовых баз данных для исследователей ранних китайских текстов. [4] [5]

Содержание сайта

Тексты делятся на тексты до-Цинь и Хань, а также тексты после-Хань, причем первые классифицируются по школам мысли , а вторые - по династиям . Древний раздел базы данных (до Цинь и Хань) содержит более 5 миллионов китайских иероглифов, база данных после Хань - более 20 миллионов символов, а общедоступный раздел вики - более 5 миллиардов символов. [6] Многие тексты также имеют переводы на английский и китайский языки, которые для удобства сравнения сочетаются с оригинальным текстом абзац за абзацем, а также фраза за фразой; это позволяет использовать систему в качестве полезного инструмента научных исследований даже студентами, практически не знающими китайский язык. [7]

Помимо предоставления настраиваемых функций поиска, подходящих для китайских текстов, [8] [9] сайт также пытается использовать уникальный формат Интернета, чтобы предложить ряд функций, важных для китаеведов , включая интегрированный словарь, списки слов, информация о параллельных отрывках, [10] отсканированные исходные тексты, данные согласования и индексы, [11] система метаданных, отображение китайских комментариев, [12] база данных опубликованных ресурсов и дискуссионный форум, на котором темы могут быть связаны с конкретными данными о сайт. [13] [14] Раздел «Библиотека» сайта также включает отсканированные копии более 25 миллионов страниц ранних китайских текстов, [15] [6] построчно связанных с транскрипциями в полнотекстовой базе данных, многие из которых созданы с использованием Оптическое распознавание символов, [16] редактируется и поддерживается с использованием краудсорсинговой онлайн-вики-системы. [17] [18] Текстовые данные и метаданные также можно экспортировать с помощью интерфейса прикладного программирования , что позволяет интегрировать их с другими онлайн-инструментами, а также использовать в интеллектуальном анализе текста и цифровых гуманитарных проектах. [17] [19]

Рекомендации

  1. ^ Элман, Бенджамин А. «Классическая историография китайской истории: базы данных и электронные тексты». Университет Принстон. Архивировано из оригинала 5 августа 2016 года . Проверено 3 июня 2016 г.
  2. ^ «Ассоциация китайских философов в Северной Америке (北美中国哲学学者协会)» . Архивировано из оригинала 25 декабря 2010 г. Проверено 25 сентября 2010 г.
  3. ^ Крис Фрейзер, факультет философии Гонконгского университета
  4. ^ «Поддержите проект китайского текста! - Деформация, уток и путь» . 30 апреля 2013 г.
  5. ^ http://languagehat.com/chinese-text-project/
  6. ^ ab «Системная статистика — текстовый проект на китайском языке».
  7. ^ Коннолли, Тим (2012). «Изучение китайской философии с комментариями». Преподавание философии . Центр философской документации. 35 (1): 1–18. doi : 10.5840/teachphil20123511.
  8. ^ «Инструкции: Расширенный поиск — Проект китайского текста» .
  9. ^ «Часто задаваемые вопросы: Нормализация — проект китайского текста» .
  10. ^ Стерджен, Дональд (2017). «Неконтролируемое выявление повторного использования текста в ранней китайской литературе». Цифровая стипендия в области гуманитарных наук . Издательство Оксфордского университета . Проверено 21 ноября 2017 г.
  11. ^ Сюй, Цзяцзинь (2015). «Корпусное китаеведение: исторический обзор с 1920-х годов по настоящее время». Китайский язык и дискурс . Издательство Джона Бенджамина. 6 (2): 218–244. дои : 10.1075/cld.6.2.06xu .
  12. ^ Адкинс, Марта А. (2016). «Веб-обзор: онлайн-ресурсы для изучения китайской религии и философии». Богословское библиотечное дело . Американская теологическая библиотечная ассоциация. 9 (2): 5–8. дои : 10.31046/tl.v9i2.435 .
  13. ^ Хольгер Шнайдер и Джефф Тарсен, http://dissertationreviews.org/archives/9213.
  14. ^ «Введение - Проект китайского текста» .
  15. ^ «Библиотека — проект китайского текста» .
  16. ^ Стерджен, Дональд (2017). Неконтролируемое извлечение обучающих данных для досовременного китайского OCR. Тридцатая международная конференция по флэру. АААИ . Проверено 21 ноября 2017 г.
  17. ^ ab https://cpianasis.org/2016/06/08/crowdsource-apis-and-a-digital-library-of-chinese/. Архивировано 20 марта 2017 г. в Wayback Machine , Институт китайской политики, Ноттингемский университет.
  18. ^ «Инструкции: OCR — проект китайского текста» .
  19. ^ «Инструменты: API — проект китайского текста» .

Внешние ссылки