COCOA (аббревиатура, полученная из COunt и COncordance Generation в Atlas) была ранней утилитой текстовых файлов и связанным с ней форматом файлов для цифровых гуманитарных наук , тогда известным как гуманитарные вычисления. Это было около 4000 перфокарт Фортрана , созданных в конце 1960-х — начале 1970-х годов в Университетском колледже Лондона и компьютерной лаборатории Атлас в Харвелле, Оксфордшир . Функциональность включала подсчет слов и построение согласований . [1] [2] [3] [4]
Формат Oxford Concordance Program был прямым потомком COCOA, разработанного в вычислительной службе Оксфордского университета . Оксфордский текстовый архив хранит элементы этого формата. [5]
Формат файла COCOA имеет, по крайней мере, некоторое сходство с более поздними языками разметки, такими как SGML и XML . Заметное отличие от его преемников заключается в том, что теги COCOA имеют плоскую структуру, а не древовидную структуру. В этом формате каждый тип информации и значение, закодированные тегом, должны считаться истинными до тех пор, пока тот же тег не изменит свое значение. Члены сообщества Text Encoding Initiative поддерживают устаревшую поддержку COCOA, [6] [7], хотя большинство востребованных текстов и корпусов уже перенесены в более широко понимаемые форматы, такие как TEI XML . [8]
{{cite web}}
: CS1 maint: числовые имена: список авторов ( ссылка )