stringtranslate.com

Hapax legomenon

График ранг-частота для слов в романе «Моби Дик» . Около 44% различных наборов слов в этом романе, таких как «matrimonial», встречаются только один раз, как и hapax legomena (красный). Около 17%, таких как «lexterity», встречаются дважды (так называемые dis legomena , синие). Закон Ципфа предсказывает, что слова в этом графике должны приближаться к прямой линии с наклоном -1.

В корпусной лингвистике hapax legomenon ( / ˈ h æ p ə k s l ɪ ˈ ɡ ɒ m ɪ n ɒ n / также / ˈ h æ p æ k s / или / ˈ h p æ k s / ; [ 1] [2] мн. ч. hapax legomena ; иногда сокращается до hapax , мн. ч . hapaxes ) — это слово или выражение , которое встречается только один раз в контексте: либо в письменной записи целого языка , либо в работах автора, либо в одном тексте. Иногда этот термин неправильно используется для описания слова, которое встречается только в одной из работ автора, но более одного раза в этой конкретной работе. Hapax legomenon — это транслитерация греческого ἅπαξ λεγόμενον , что означает «сказанное однажды». [3]

Родственные термины dis legomenon , tris legomenon и tetrakis legomenon соответственно ( / ˈ d ɪ s / , / ˈ t r ɪ s / , / ˈ t ɛ t r ə k ɪ s / ) относятся к двойным, тройным или четверным появлениям, но используются гораздо реже.

Hapax legomena довольно распространены, как и предсказывает закон Ципфа , [4] который гласит, что частота любого слова в корпусе обратно пропорциональна его рангу в таблице частот. Для больших корпусов около 40% - 60% слов являются hapax legomena , а еще 10% - 15% - dis legomena . [5] Таким образом, в Брауновском корпусе американского английского языка около половины из 50 000 отдельных слов являются hapax legomena в пределах этого корпуса. [6]

Hapax legomenon относится к появлению слова или выражения в тексте, а не к его происхождению или распространенности в речи. Таким образом, он отличается от окказионализма , который может никогда не быть записан, может найти применение и может быть широко записан или может появляться несколько раз в произведении, которое его чеканит , и т. д.

Значение

Hapax legomena в древних текстах обычно трудно расшифровать, поскольку легче вывести значение из нескольких контекстов, чем из одного. Например, многие из оставшихся нерасшифрованных глифов майя — это hapax legomena , а библейские (особенно ивритские ; см. § Иврит) hapax legomena иногда вызывают проблемы при переводе. Hapax legomena также вызывают проблемы при обработке естественного языка . [7]

Некоторые ученые считают Hapax legomena полезным для определения авторства письменных произведений. П. Н. Харрисон в своей работе «Проблема пастырских посланий» (1921) [8] сделал hapax legomena популярным среди библеистов , когда утверждал, что в трех пастырских посланиях их значительно больше , чем в других посланиях Павла . Он утверждал, что количество hapax legomena в корпусе предполагаемого автора указывает на его или ее словарный запас и является характеристикой автора как личности.

Теория Харрисона утратила свою значимость из-за ряда проблем, поднятых другими учеными. Например, в 1896 году WP Workman обнаружил следующее количество hapax legomena в каждом послании Павла :

На первый взгляд, последние три итога (для пастырских посланий) не выходят за рамки остальных. [9] Чтобы учесть различную длину посланий, Воркман также подсчитал среднее количество hapax legomena на страницу греческого текста , которое составило от 3,6 до 13, как показано на диаграмме справа. [9] Хотя в пастырских посланиях на страницу приходится больше hapax legomena , Воркман обнаружил, что различия умеренные по сравнению с различиями среди других посланий. Это было подтверждено, когда Воркман посмотрел на несколько пьес Шекспира , которые показали схожие различия (от 3,4 до 10,4 на страницу однотомного издания Ирвинга), как показано на второй диаграмме справа. [9]

Помимо личности автора, есть несколько других факторов, которые могут объяснить количество hapax legomena в произведении: [10]

В конкретном случае с Пастырскими посланиями все эти переменные существенно отличаются от переменных в остальной части корпуса Павла, и hapax legomena больше не принимаются в качестве весомых индикаторов авторства; те, кто отвергает авторство Павла в Пастырских посланиях, опираются на другие аргументы. [11]

Существуют также субъективные вопросы о том, являются ли две формы «одним и тем же словом»: dog против dogs, clue против clueless, sign против signature; также возникает множество других серых случаев. Еврейская энциклопедия указывает, что, хотя в еврейской Библии есть 1500 гапаксов , только около 400 из них не связаны явно с другими засвидетельствованными словоформами. [12]

Последняя трудность с использованием hapax legomena для определения авторства заключается в том, что существуют значительные различия между работами, которые, как известно, принадлежат одному автору, и разные авторы часто показывают схожие значения. Другими словами, hapax legomena не является надежным индикатором. Исследования авторства теперь обычно используют широкий спектр мер для поиска закономерностей, а не полагаются на отдельные измерения.

Информатика

В областях компьютерной лингвистики и обработки естественного языка (NLP), особенно корпусной лингвистики и машинного обучения NLP, обычно игнорируют hapax legomena (а иногда и другие редкие слова), поскольку они, вероятно, не представляют большой ценности для вычислительных методов. Это игнорирование имеет дополнительное преимущество в виде значительного сокращения использования памяти приложением, поскольку, согласно закону Ципфа , многие слова являются hapax legomena. [13]

Примеры

Ниже приведены некоторые примеры hapax legomena в языках и корпусах .

арабский

В Коране :

Китайский и японский

Классическая китайская и японская литература содержит много китайских иероглифов , которые встречаются в корпусе только один раз, и их значение и произношение часто терялись. Известные в японском языке как kogo (孤語) , буквально «одинокие иероглифы», их можно считать типом hapax legomenon . [15] Например, в «Классике поэзии» ( ок.  1000 г. до н. э. ) иероглифиспользуется ровно один раз в стихе 「伯氏吹塤, 仲氏吹篪」 , и только благодаря обнаружению описания Го Пу (276–324 гг. н. э.) иероглиф можно было связать с определенным типом древней флейты.

Английский

Слово « honorificabilitudinitatibus », встречающееся в первом издании пьесы Уильяма Шекспира «Бесплодные усилия любви».

Авторы довольно часто «придумывают» новые слова, чтобы передать определенное значение или ради развлечения, без какого-либо намека на то, что это «правильные» слова. Например, П. Г. Вудхауз и Льюис Кэрролл часто придумывали новые слова. Indexy , ниже, по-видимому, является примером этого.

немецкий

Муспилли, строка 57: «дар нимак денне мак андремо хельфан уора демо муспилле» ( Баварская государственная библиотека, Clm 14098, ф. 121r)

Древнегреческий

По словам классического исследователя Клайда Фарра , « в «Илиаде» 1097 hapax legomena , тогда как в «Одиссее» их 868». [19] Однако другие исследователи определили этот термин по-другому и насчитывают всего 303 в « Илиаде» и 191 в «Одиссее» . [20]

иврит

Число отдельных hapax legomena в еврейской Библии составляет 1480 (из общего числа 8679 отдельных используемых слов). [26] : 112  Однако из-за еврейских корней , суффиксов и префиксов только 400 являются «истинными» hapax legomena . [12] Полный список можно увидеть в статье « Hapax Legomena » в Еврейской энциклопедии . [12]

Вот некоторые примеры:

венгерский

ирландский

итальянский

латинский

славянский

испанский

В популярной культуре

Смотрите также

Ссылки

  1. ^ "hapax legomenon" . Оксфордский словарь английского языка (Электронная правка). Oxford University Press . (Требуется подписка или членство в участвующем учреждении.)
  2. ^ "hapax legomenon". Dictionary.com Unabridged (Online). nd
  3. ^ ἅπαξ. Лидделл, Генри Джордж ; Скотт, Роберт ; Греко-английский лексикон в проекте «Персей»
  4. ^ Пол Бейкер, Эндрю Харди и Тони МакЭнери, Глоссарий корпусной лингвистики , Издательство Эдинбургского университета, 2006, стр. 81, ISBN 0-7486-2018-4
  5. ^ Андраш Корнаи, Математическая лингвистика , Springer, 2008, стр. 72, ISBN 1-84628-985-8
  6. Кирстен Мальмкьер, «Лингвистическая энциклопедия». Архивировано 1 января 2020 г. на Wayback Machine , 2-е изд., Routledge, 2002 г., ISBN 0-415-22210-9 , стр. 87. 
  7. ^ Кристофер Д. Мэннинг и Хинрих Шютце, Основы статистической обработки естественного языка , MIT Press, 1999, стр. 22, ISBN 0-262-13360-1
  8. П. Н. Харрисон. Проблема пастырских посланий . Oxford University Press, 1921.
  9. ^ abc Workman, «The Hapax Legomena of St. Paul», Expository Times , 7 (1896:418), отмечено в The Catholic Encyclopedia, sv «Epistles to Timothy and Titus» Архивировано 08.04.2011 на Wayback Machine .
  10. ^ Стивен Дж. ДеРоуз. «Статистический анализ некоторых лингвистических аргументов относительно авторства пастырских посланий». Дипломная работа, Университет Брауна, 1982; Терри Л. Уайлдер. «Краткая защита подлинности пастырских посланий». Midwestern Journal of Theology 2.1 (осень 2003), 38–4. (онлайн)
  11. ^ Марк Хардинг. Что они говорят о пастырских посланиях? , Paulist Press, 2001, стр. 12. ISBN 0-8091-3975-8 , ISBN 978-0-8091-3975-0 .  
  12. ^ abc Статья о Hapax Legomena Архивировано 2012-10-19 в Wayback Machine в Jewish Encyclopedia . Включает список всех hapax legomena Ветхого Завета , по книгам.
  13. ^ D. Jurafsky и JH Martin (2009). Обработка речи и языка . Prentice Hall.
  14. ^ Орхан Эльмаз. «Die Interpretationsgeschichte der koranischen Hapaxlegomena». Докторская диссертация, Венский университет, 2008 г., стр. 29.
  15. ^ Керр, Алекс (2015-09-03). Потерянная Япония. Penguin UK. ISBN 9780141979755. Архивировано из оригинала 2022-06-01 . Получено 2021-05-15 .
  16. ^ "flother" . Оксфордский словарь английского языка (Электронная правка). Oxford University Press . (Требуется подписка или членство в участвующем учреждении.)
  17. ^ "Исторический тезаурус :: Поиск". historicthesaurus.arts.gla.ac.uk . Архивировано из оригинала 2017-10-28 . Получено 2017-10-28 .
  18. ^ ab "Странный мир hapax legomenon | Spectator". Архивировано из оригинала 2022-06-01 . Получено 2020-11-04 .
  19. ^ Фарр, Клайд (1920). Гомеровский греческий, книга для начинающих. DC Heath & Co., Publishers. стр. xxii.
  20. ^ Рис, Стив. "Hapax Legomena" в Margalit Finkelberg (ред.), Homeric Encyclopedia (Oxford: Blackwell, 2011) 330-331. Hapax Legomena у Гомера Архивировано 2020-01-01 в Wayback Machine
  21. ^ ( Илл . 24.540)
  22. ^ например, Ричард Бокхэм Еврейский мир вокруг Нового Завета: сборник эссе I стр. 431 2008: «новозаветный гапакс, который встречается 19 раз в Ерме...»
  23. Джон Ф. Уолвурд и Рой Б. Зак, Комментарий к библейскому знанию: Новое издание , Дэвид К. Кук, 1983, стр. 860, ISBN 0-88207-812-7
  24. ^ Г. Клаффенбах, Lex de astynomis Pergamenorum (1954).
  25. ^ Природа и функции воды, ванн, купания и гигиены из ... - Страница 252 Синтия Коссо, Энн Скотт - 2009 « Гюнтер Клаффенбах , «Die Astynomeninschrift von Pergamon», Abhandlungen der Deutschen Akademie der Wissenschaften zu Berlin. Klasse für Язык, литература и искусство 6 (1953), 3–25 взял на себя полный, но строго филологический комментарий».
  26. ^ Цукерман, Гилад (2020). Возрожденческая культура: от генезиса израильского до языкового возрождения в Австралии и за ее пределами. Нью-Йорк: Oxford University Press. ISBN 9780199812790. Архивировано из оригинала 2020-05-05 . Получено 2020-04-30 .
  27. ^ «Ковчег, конструкция и размер». Пособие по пониманию Библии , Общество Сторожевой Башни, Библий и трактатов, 1971.
  28. ^ Блэр, Джудит М. (2009). Дедемонизация Ветхого Завета: исследование Азазеля, Лилит, Дебера, Кетеба и Решефа в еврейской Библии . Тюбинген, Германия: Mohr Siebeck. стр. 92–95. ISBN 9783161501319.
  29. ^ Танулманьок Сентмартони Сабо Геза хатванадик születésnapjára (на венгерском языке)
  30. ^ Тибор, Сёч. «A turul-monda szövegkapcolatai a középkori írásos hagyományunkban. В: Középkortörténeti tanulmanyok 6. Szerk.: G. Tóth Péter, Szabó Pál. Szeged, 2010. 249–259».
  31. ^ "The Triads of Ireland". www.smo.uhi.ac.uk . Архивировано из оригинала 2016-04-09 . Получено 2019-01-28 .
  32. ^ "attuiare in "Enciclopedia Dantesca"". www.treccani.it (на итальянском). Архивировано из оригинала 2018-11-17 . Получено 2019-01-28 .
  33. ^ Льюис, CT и Шорт, C. (1879) Латинский словарь, Оксфордский университет, Clarendon Press, стр.1599.
  34. ^ "Tertullian: De Pallio". Архивировано из оригинала 2016-03-04 . Получено 2015-11-28 .
  35. ^ Глэр, PGW (1968). Оксфордский латинский словарь. Оксфорд: Clarendon P., стр. 611.
  36. ^ Sblendorio Cugusi MT CLE 428 и лат. Эойгена. Studia philologica валентина, 2008, т. 1, с. 11, стр. 327–350. (на итальянском языке).
  37. ^ Андрей Зализняк, Новгородская Русь по берестяным грамотам: взгляд из 2012 г. Архивировано 3 ноября 2018 г. в Wayback Machine (Новгородская Русь по берестяным грамотам: вид 2012 г.), стенограмма лекции.
  38. ^ А. Л. Шилов (А.Л. Шилов), ЭТНОНИМЫ И НЕСЛАВЯНСКИЕ АНТРОПОНИМЫ БЕРЕСТЯНЫХ ГРАМОТ. Архивировано 7 ноября 2017 г. в Wayback Machine (Этнонимы и неславянские антропонимы в берестяных рукописях).
  39. ^ "HÁPAX".
  40. ^ Родригес, Лола Понс. «Frecuencia lingüística y novedad grmatical. Propuestas sobre el hápax y las formas aisladas, con ejemplos del XV castellano». Ибероромания 2013, вып. 78 (2013): 222–245.
  41. ^ "Hollis Frampton at IMDB". IMDb . Архивировано из оригинала 2014-06-06 . Получено 2014-04-14 .
  42. ^ «Победитель University Challenge Тед Лавдей: Я узнал свои ответы в Википедии». 15 апреля 2015 г. Архивировано из оригинала 29-10-2020 . Получено 27-01-2020 .
  43. ^ «Этот парень только что выиграл University Challenge с одним нелепым ответом». 14 апреля 2015 г. Архивировано из оригинала 8 мая 2017 г. Получено 26 апреля 2017 г.
  44. ^ «Лучший из когда-либо существовавших участников University Challenge получил похвалу после сверхбыстрых ответов». Daily Mirror . 14 апреля 2015 г. Архивировано из оригинала 27 января 2020 г. Получено 27 января 2020 г.
  45. ^ sabotagetimes.comАрхивировано 15 октября 2015 г. на Wayback Machine ; youtube.comАрхивировано 11 апреля 2017 г. на Wayback Machine
  46. Архивировано в Ghostarchive и Wayback Machine: Vsauce; Стивенс, Майкл (15 сентября 2015 г.). «The Zipf Mystery». YouTube . Получено 3 августа 2020 г. .
  47. ^ "Scroll origins - NetHack Wiki". Архивировано из оригинала 2021-02-08 . Получено 2021-02-01 .

Внешние ссылки