Thesaurus Linguae Graecae ( TLG ) — научно-исследовательский центр Калифорнийского университета в Ирвайне . TLG был основан в 1972 году Марианной Макдональд (в то время аспиранткой, а сейчас профессором театра и классики в Калифорнийском университете в Сан-Диего ) с целью создания всеобъемлющей цифровой коллекции всех сохранившихся текстов, написанных на греческом языке, от античности до наших дней. С 1972 года TLG собрал и оцифровал большинство сохранившихся литературных текстов, написанных на греческом языке, от Гомера до падения Константинополя в 1453 году н. э. и позже. Теодор Бруннер (1934–2007) руководил проектом с 1972 года до своей отставки из Калифорнийского университета в Ирвайне в 1998 году. Мария Пантелия, также профессор классики в Калифорнийском университете в Ирвайне, сменила Теодора Бруннера в 1998 году и с тех пор руководит TLG. Название TLG совпадает с названием ее онлайн-базы данных, полное название которой — Thesaurus Linguae Graecae: A Digital Library of Greek Literature ( TLG , курсивом, для краткости). [1]
Первоначально задача этого огромного предприятия была решена с помощью нескольких специалистов по классике и технических экспертов, но в первую очередь благодаря усилиям Дэвида В. Паккарда и его команды, которые создали систему Ibycus, аппаратное и программное обеспечение, первоначально использовавшееся для корректуры и поиска в корпусе. Паккард также разработал Beta code , соглашение о кодировании символов и форматирования, используемое для кодирования политонического греческого языка . Первоначально коллекция распространялась на CD-ROM . Первый CD-ROM был выпущен в 1985 году и стал первым компакт-диском, не содержащим музыки. Последующие версии были выпущены в 1988 и 1992 годах благодаря технической поддержке, предоставленной Packard.
К концу 1990-х годов стало очевидно, что старая технология Ibycus устарела. Под руководством профессора Марии Пантелии был предпринят ряд новых проектов, включая массовую миграцию из Ibycus, разработку новой системы для оцифровки, корректуры и управления текстовой коллекцией, новый CD-ROM (TLG E), выпущенный в 1999 году, и, в конечном итоге, перемещение корпуса в веб-среду в 2001 году. В то же время TLG начал работать с Техническим комитетом Unicode, чтобы включить все символы, необходимые для кодирования и отображения греческого языка в стандарте Unicode. Корпус продолжает значительно расширяться, чтобы включить византийские , средневековые и, в конечном итоге, современные греческие тексты. К более поздним проектам относятся лемматизация греческого корпуса (2006) — значительная работа, учитывая сильно флективную природу греческого языка и сложность корпуса, охватывающего более двух тысячелетий литературного развития, — и Онлайн- лексикон греко-английского языка Лидделла–Скотта–Джонса (обычно называемый LSJ), выпущенный в феврале 2011 года.
С 2001 года корпус TLG доступен для поиска в Интернете членам организаций-подписчиков, число которых по всему миру приближается к 1500. Вся библиографическая информация и подмножество текстов доступны широкой публике.
Количество греческих слов в корпусе составляет 110 миллионов, [2] в то время как количество уникальных словоформ составляет 1,6 миллиона, а количество уникальных лемм — 250 000. [3]