stringtranslate.com

Гапакс легоменон

График частотности рангов слов в романе «Моби Дик» . Около 44% отдельного набора слов в этом романе, например «брачный», встречаются только один раз, как и hapax legomena (красный). Около 17%, например «ловкость», появляются дважды (так называемые дис легомены , выделены синим цветом). Закон Ципфа предсказывает, что слова на этом графике должны приближаться к прямой линии с наклоном -1.

В корпусной лингвистике легомен hapax ( / ˈ h æ p ə k s l ɪ ˈ ɡ ɒ m ɪ n ɒ n / также / ˈ h æ p æ k s / или / ˈ h p æ k s / ; [1 ] [2] мн. hapax legomena ; иногда сокращается до hapax , множественное число hapaxes ) — слово или выражение , которое встречается только один раз в контексте: либо в письменных источниках целого языка , в произведениях автора, либо в один текст. Этот термин иногда неправильно используется для описания слова, которое встречается только в одном из произведений автора, но более одного раза в этом конкретном произведении. Hapax legomenon — это транслитерация греческого ἅπαξ λεγόμενον , что означает «сказанное один раз» . [3]

Соответствующие термины dis legomenon , tris legomenon и тетракис legomenon соответственно ( / ˈ d ɪ s / , / ˈ t r ɪ s / , / ˈ t ɛ t r ə k ɪ s / ) относятся к двойным, тройным или четверным вхождениям. , но используются гораздо реже.

Hapax legomena довольно распространены, как и предсказывает закон Ципфа [4] , который гласит, что частота любого слова в корпусе обратно пропорциональна его рангу в таблице частот. В больших корпусах от 40% до 60% слов составляют hapax legomena , а еще от 10% до 15% — dis legomena . [5] Таким образом, в Коричневом корпусе американского английского языка около половины из 50 000 отдельных слов являются hapax legomena внутри этого корпуса. [6]

Hapax legomenon относится к появлению слова или выражения в тексте, а не к его происхождению или распространенности в речи. Таким образом, оно отличается от одноразового слова , которое может никогда не быть записано, может найти распространение и может широко записываться или может появляться несколько раз в произведении, в котором оно создано , и так далее.

Значение

Hapax legomena в древних текстах обычно трудно расшифровать, поскольку легче вывести значение из нескольких контекстов, чем из одного. Например, многие из оставшихся нерасшифрованных символов майя представляют собой hapax legomena , а библейские (особенно ивритские ; см. § Иврит) hapax legomena иногда создают проблемы при переводе. Hapax legomena также создает проблемы при обработке естественного языка . [7]

Некоторые ученые считают Hapax legomena полезным для определения авторства письменных произведений. П. Н. Харрисон в книге «Проблема пастырских посланий» (1921) [8] сделал hapax legomena популярными среди библеистов , когда утверждал, что в трёх пастырских посланиях их значительно больше, чем в других посланиях Павла . Он утверждал, что количество hapax legomena в корпусе предполагаемого автора указывает на его словарный запас и характеризует автора как личность.

Теория Харрисона потеряла свое значение из-за ряда проблем, поднятых другими учеными. Например, в 1896 году У. П. Уоркман обнаружил в каждом послании Павла следующее количество hapax legomena :


На первый взгляд, последние три суммы (по пастырским посланиям) не отличаются от остальных. [9] Чтобы принять во внимание разную длину посланий, Уоркман также подсчитал среднее количество hapax legomena на странице греческого текста , которое колебалось от 3,6 до 13, как показано на диаграмме справа. [9] Хотя в пастырских посланиях больше hapax legomena на странице, Уоркман обнаружил, что различия умеренные по сравнению с различиями среди других посланий. Это подтвердилось, когда Уоркман просмотрел несколько пьес Шекспира , в которых были обнаружены схожие вариации (от 3,4 до 10,4 на страницу однотомного издания Ирвинга), как показано на второй диаграмме справа. [9]

Помимо личности автора, есть еще несколько факторов, которые могут объяснить количество hapax legomena в произведении: [10]

В конкретном случае пастырских посланий все эти переменные сильно отличаются от переменных в остальной части корпуса Павла, и hapax legomena больше не широко воспринимаются как убедительные индикаторы авторства; те, кто отвергает авторство Павла в Пасторалях, опираются на другие аргументы. [11]

Существуют также субъективные вопросы о том, являются ли две формы «одним и тем же словом»: собака против собак, подсказка против невежественной, знак против подписи; возникают и многие другие серые случаи. Еврейская энциклопедия указывает, что, хотя в еврейской Библии 1500 гапаксов , только около 400 явно не связаны с другими подтвержденными словоформами. [12]

Последняя трудность с использованием hapax legomena для определения авторства заключается в том, что среди произведений, о которых известно, что они написаны одним автором, существуют значительные различия, и разные авторы часто демонстрируют схожие значения. Другими словами, hapax legomena не является надежным индикатором. Исследования авторства теперь обычно используют широкий спектр показателей для поиска закономерностей, а не полагаются на отдельные измерения.

Информатика

В области компьютерной лингвистики и обработки естественного языка (НЛП), особенно. В корпусной лингвистике и НЛП с машинным обучением принято игнорировать hapax legomena (а иногда и другие нечастые слова), поскольку они, скорее всего, не будут иметь особой ценности для вычислительных методов. Такое игнорирование имеет дополнительное преимущество, заключающееся в значительном сокращении использования памяти приложением, поскольку по закону Ципфа многие слова являются hapax legomena. [13]

Примеры

Ниже приведены некоторые примеры hapax legomena в языках или корпусах .

арабский

В Коране :

Китайский и японский

Классическая китайская и японская литература содержит множество китайских иероглифов , которые встречаются в корпусе только один раз, и их значение и произношение часто теряются. Известные на японском языке как кого (孤語) , буквально «одинокие персонажи», их можно считать разновидностью хапакс легоменона . [15] Например, в «Классике поэзии» ( ок.  1000 г. до н.э. ) иероглифиспользуется ровно один раз в стихе 「伯氏吹塤,仲氏吹篪」 , и это произошло только благодаря обнаружению описания Го Пу . (276–324 гг. н. э.), что этот персонаж мог быть связан с определенным типом древней флейты.

Английский

Слово « honorificabilitudinitatibus » в первом издании пьесы Уильяма Шекспира « Бесплодные усилия любви».

Авторы довольно часто «выдумывают» новые слова, чтобы передать определенное значение или ради развлечения, без какого-либо предположения, что это «правильные» слова. Например, П. Г. Вудхауз делает это часто, не говоря уже о Льюисе Кэрролле . Indexy ниже, по-видимому, является примером этого.

Немецкий

Муспилли, строка 57: «дар нимак денне мак андремо хельфан уора демо муспилле» ( Баварская государственная библиотека , Clm 14098, ф. 121r)

Древнегреческий

По словам ученого-классика Клайда Фарра , «в « Илиаде» 1097 hapax legomena , а в « Одиссее» — 868». [19] Другие, однако, определили этот термин по-другому и насчитали всего 303 в « Илиаде» и 191 в « Одиссее» . [20]

иврит

Число различных hapax legomena в еврейской Библии составляет 1480 (из 8679 различных использованных слов). [26] : 112  Однако из-за еврейских корней , суффиксов и префиксов только 400 являются «истинными» hapax legomena . [12] Полный список можно увидеть в статье « Hapax Legomena » Еврейской энциклопедии . [12]

Вот некоторые примеры:

Венгерский

ирландский

итальянский

латинский

славянский

испанский

В популярной культуре

Смотрите также

Рекомендации

  1. ^ "гапакс легоменон" . Оксфордский словарь английского языка (онлайн-изд.). Издательство Оксфордского университета . (Требуется подписка или членство участвующей организации.)
  2. ^ "гапакс легоменон" . Dictionary.com Полный (онлайн). nd
  3. ^ ἅπαξ. Лидделл, Генри Джордж ; Скотт, Роберт ; Греко-английский лексикон в проекте «Персей»
  4. ^ Пол Бейкер, Эндрю Харди и Тони МакЭнери, Глоссарий корпусной лингвистики , Edinburgh University Press, 2006, стр. 81, ISBN 0-7486-2018-4
  5. ^ Андраш Корнаи, Математическая лингвистика , Springer, 2008, стр. 72, ISBN 1-84628-985-8
  6. ^ Кирстен Мальмкьер, Лингвистическая энциклопедия, заархивированная 1 января 2020 г. в Wayback Machine , 2-е изд., Routledge, 2002, ISBN 0-415-22210-9 , стр. 87. 
  7. ^ Кристофер Д. Мэннинг и Хинрих Шютце, Основы статистической обработки естественного языка , MIT Press, 1999, стр. 22, ISBN 0-262-13360-1
  8. ^ П.Н. Харрисон. Проблема пастырских посланий . Издательство Оксфордского университета, 1921.
  9. ^ abc Workman, «Hapax Legomena of St. Paul», Expository Times , 7 (1896:418), отмечено в Католической энциклопедии, св. «Послания к Тимофею и Титу». Архивировано 8 апреля 2011 г. в Wayback Machine .
  10. ^ Стивен Дж. ДеРоуз. «Статистический анализ некоторых лингвистических аргументов относительно авторства пастырских посланий». Диссертация с отличием, Университет Брауна, 1982 г.; Терри Л. Уайлдер. «Краткая защита подлинности пастырских посланий». Среднезападный богословский журнал 2.1 (осень 2003 г.), 38–4. (В сети)
  11. ^ Марк Хардинг. Что говорят о пастырских посланиях? , Paulist Press, 2001, стр. 12. ISBN 0-8091-3975-8 , ISBN 978-0-8091-3975-0 .  
  12. ^ abc Статья о Hapax Legomena. Архивировано 19 октября 2012 г. в Wayback Machine в Еврейской энциклопедии . Включает список всех ветхозаветных hapax legomena по книгам.
  13. ^ Д. Джурафски и Дж. Х. Мартин (2009). Речевая и языковая обработка . Прентис Холл.
  14. ^ Орхан Эльмаз. «Die Interpretationsgeschichte der koranischen Hapaxlegomena». Докторская диссертация, Венский университет, 2008 г., стр. 29.
  15. ^ Керр, Алекс (3 сентября 2015 г.). Потерянная Япония. Пингвин Великобритания. ISBN 9780141979755. Архивировано из оригинала 1 июня 2022 г. Проверено 15 мая 2021 г.
  16. ^ "Флотер" . Оксфордский словарь английского языка (онлайн-изд.). Издательство Оксфордского университета . (Требуется подписка или членство участвующей организации.)
  17. ^ «Исторический тезаурус :: Поиск» . Historicalthesaurus.arts.gla.ac.uk . Архивировано из оригинала 28 октября 2017 г. Проверено 28 октября 2017 г.
  18. ^ ab «Странный мир гапакс-легоменона | Зритель». Архивировано из оригинала 1 июня 2022 г. Проверено 4 ноября 2020 г.
  19. ^ Фарр, Клайд (1920). Гомеровский греческий, книга для начинающих. DC Heath & Co., Издательство. п. XXII.
  20. ^ Рис, Стив. «Hapax Legomena», в Маргалит Финкельберг (редактор), Энциклопедия Гомера (Оксфорд: Блэквелл, 2011) 330–331. Hapax Legomena в Homer. Архивировано 1 января 2020 г. в Wayback Machine.
  21. ^ ( Ил . 24.540)
  22. ^ например, Ричард Бокэм Еврейский мир вокруг Нового Завета: сборник эссе I, стр. 431, 2008 г.: «Новый Заветный хапакс, который встречается в Герме 19 раз...»
  23. ^ Джон Ф. Уолворд и Рой Б. Зак, Комментарий к «Познанию Библии: издание Нового Завета» , Дэвид К. Кук, 1983, стр. 860, ISBN 0-88207-812-7
  24. ^ Г. Клаффенбах, Lex de astynomis Pergamenorum (1954).
  25. ^ Природа и функция воды, ванн, купания и гигиены из ... - Страница 252 Синтия Коссо, Энн Скотт - 2009 « Гюнтер Клаффенбах , «Die Astynomeninschrift von Pergamon», Abhandlungen der Deutschen Akademie der Wissenschaften zu Berlin. Klasse für Sprachen, Literatur und Kunst 6 (1953), 3–25 взял на себя ответственность за предоставление полного, но строго филологического комментария».
  26. ^ Цукерманн, Гилад (2020). Возрождение: от возникновения израильского языка к возрождению языка в Австралии и за ее пределами. Нью-Йорк: Издательство Оксфордского университета. ISBN 9780199812790. Архивировано из оригинала 5 мая 2020 г. Проверено 30 апреля 2020 г.
  27. ^ «Ковчег, дизайн и размер»: Помощь в понимании Библии , Общество Сторожевой Башни, Библий и трактатов, 1971.
  28. ^ Блэр, Юдит М. (2009). Дедемонизация Ветхого Завета: исследование Азазеля, Лилит, Дебера, Кетеба и Решефа в еврейской Библии . Тюбинген, Германия: Мор Зибек. стр. 92–95. ISBN 9783161501319.
  29. ^ Танулманьок Сентмартони Сабо Геза хатванадик születésnapjára (на венгерском языке)
  30. ^ Тибор, Сёч. «A turul-monda szövegkapcolatai a középkori írásos hagyományunkban. В: Középkortörténeti tanulmanyok 6. Szerk.: G. Tóth Péter, Szabó Pál. Szeged, 2010. 249–259».
  31. ^ «Триады Ирландии». www.smo.uhi.ac.uk. _ Архивировано из оригинала 9 апреля 2016 г. Проверено 28 января 2019 г.
  32. ^ "Наряд в "Энциклопедии Дантески"" . www.treccani.it (на итальянском языке). Архивировано из оригинала 17 ноября 2018 г. Проверено 28 января 2019 г.
  33. ^ Льюис, Коннектикут и Шорт, К. (1879) Латинский словарь, Оксфордский университет, Clarendon Press, стр.1599.
  34. ^ "Тертуллиан: Де Паллио". Архивировано из оригинала 4 марта 2016 г. Проверено 28 ноября 2015 г.
  35. ^ Глер, PGW (1968). Оксфордский латинский словарь. Оксфорд: Кларендон П., с. 611.
  36. ^ Sblendorio Cugusi MT CLE 428 и лат. Эойгена. Studia philologica валентина, 2008, т. 1, с. 11, стр. 327–350. (на итальянском языке).
  37. ^ Андрей Зализняк, Новгородская Русь по берестяным грамотам: взгляд из 2012 г. Архивировано 3 ноября 2018 г. в Wayback Machine (Новгородская Русь по берестяным грамотам: вид 2012 г.), стенограмма лекции.
  38. ^ А. Л. Шилов (А.Л. Шилов), ЭТНОНИМЫ И НЕСЛАВЯНСКИЕ АНТРОПОНИМЫ БЕРЕСТЯНЫХ ГРАМОТ. Архивировано 7 ноября 2017 г. в Wayback Machine (Этнонимы и неславянские антропонимы в берестяных рукописях).
  39. ^ "ХАПАКС".
  40. ^ Родригес, Лола Понс. «Frecuencia linguistica y novedad grmatical. Propuestas sobre el hápax y las formas aisladas, con ejemplos del XV castellano». Ибероромания 2013, вып. 78 (2013): 222–245.
  41. ^ "Холлис Фрэмптон в IMDB" . IMDB . Архивировано из оригинала 6 июня 2014 г. Проверено 14 апреля 2014 г.
  42. ^ «Победитель University Challenge Тед Лавдей: я узнал свои ответы в Википедии» . Архивировано из оригинала 29 октября 2020 г. Проверено 27 января 2020 г.
  43. ^ «Этот парень только что выиграл университетский конкурс с одним нелепым ответом» . 14 апреля 2015 года. Архивировано из оригинала 8 мая 2017 года . Проверено 26 апреля 2017 г. .
  44. ^ «Лучший участник университетского конкурса получил высокую оценку после сверхбыстрых ответов» . Daily Mirror . 14 апреля 2015 г. Архивировано из оригинала 27 января 2020 г. . Проверено 27 января 2020 г.
  45. ^ sabotagetimes.com. Архивировано 15 октября 2015 г. в Wayback Machine ; youtube.com. Архивировано 11 апреля 2017 г. на Wayback Machine.
  46. ^ Архивировано в Ghostarchive и Wayback Machine: Vsauce; Стивенс, Майкл (15 сентября 2015 г.). «Тайна Зипфа». YouTube . Проверено 3 августа 2020 г.
  47. ^ "Происхождение свитков - NetHack Wiki" . Архивировано из оригинала 08 февраля 2021 г. Проверено 1 февраля 2021 г.

Внешние ссылки