Слово, которое встречается в данном тексте или записи только один раз
В корпусной лингвистике hapax legomenon ( / ˈ h æ p ə k s l ɪ ˈ ɡ ɒ m ɪ n ɒ n / также / ˈ h æ p æ k s / или / ˈ h eɪ p æ k s / ; [ 1] [2] мн. ч. hapax legomena ; иногда сокращается до hapax , мн. ч . hapaxes ) — это слово или выражение , которое встречается только один раз в контексте: либо в письменной записи целого языка , либо в работах автора, либо в одном тексте. Иногда этот термин неправильно используется для описания слова, которое встречается только в одной из работ автора, но более одного раза в этой конкретной работе. Hapax legomenon — это транслитерация греческого ἅπαξ λεγόμενον , что означает «сказанное однажды». [3]
Родственные термины dis legomenon , tris legomenon и tetrakis legomenon соответственно ( / ˈ d ɪ s / , / ˈ t r ɪ s / , / ˈ t ɛ t r ə k ɪ s / ) относятся к двойным, тройным или четверным появлениям, но используются гораздо реже.
Hapax legomena довольно распространены, как и предсказывает закон Ципфа , [4] который гласит, что частота любого слова в корпусе обратно пропорциональна его рангу в таблице частот. Для больших корпусов около 40% - 60% слов являются hapax legomena , а еще 10% - 15% - dis legomena . [5] Таким образом, в Брауновском корпусе американского английского языка около половины из 50 000 отдельных слов являются hapax legomena в пределах этого корпуса. [6]
Hapax legomenon относится к появлению слова или выражения в тексте, а не к его происхождению или распространенности в речи. Таким образом, он отличается от окказионализма , который может никогда не быть записан, может найти применение и может быть широко записан или может появляться несколько раз в произведении, которое его чеканит , и т. д.
Значение
Hapax legomena в древних текстах обычно трудно расшифровать, поскольку легче вывести значение из нескольких контекстов, чем из одного. Например, многие из оставшихся нерасшифрованных глифов майя — это hapax legomena , а библейские (особенно ивритские ; см. § Иврит) hapax legomena иногда вызывают проблемы при переводе. Hapax legomena также вызывают проблемы при обработке естественного языка . [7]
Некоторые ученые считают Hapax legomena полезным для определения авторства письменных произведений. П. Н. Харрисон в своей работе «Проблема пастырских посланий» (1921) [8] сделал hapax legomena популярным среди библеистов , когда утверждал, что в трех пастырских посланиях их значительно больше , чем в других посланиях Павла . Он утверждал, что количество hapax legomena в корпусе предполагаемого автора указывает на его или ее словарный запас и является характеристикой автора как личности.
Теория Харрисона утратила свою значимость из-за ряда проблем, поднятых другими учеными. Например, в 1896 году WP Workman обнаружил следующее количество hapax legomena в каждом послании Павла :
На первый взгляд, последние три итога (для пастырских посланий) не выходят за рамки остальных. [9] Чтобы учесть различную длину посланий, Воркман также подсчитал среднее количество hapax legomena на страницу греческого текста , которое составило от 3,6 до 13, как показано на диаграмме справа. [9] Хотя в пастырских посланиях на страницу приходится больше hapax legomena , Воркман обнаружил, что различия умеренные по сравнению с различиями среди других посланий. Это было подтверждено, когда Воркман посмотрел на несколько пьес Шекспира , которые показали схожие различия (от 3,4 до 10,4 на страницу однотомного издания Ирвинга), как показано на второй диаграмме справа. [9]
Помимо личности автора, есть несколько других факторов, которые могут объяснить количество hapax legomena в произведении: [10]
Длина текста: это напрямую влияет на ожидаемое количество и процент hapax legomena ; краткость пастырских посланий также делает любой статистический анализ проблематичным.
тема текста: если автор пишет на разные темы, то, конечно, многие тематически-специфические слова будут встречаться только в ограниченных контекстах.
аудитория текста: если автор пишет коллеге, а не студенту, или супругу, а не работодателю, то снова будет использоваться совершенно другая лексика.
время: с течением лет как язык, так и знание и использование языка автором будут меняться.
В конкретном случае с Пастырскими посланиями все эти переменные существенно отличаются от переменных в остальной части корпуса Павла, и hapax legomena больше не принимаются в качестве весомых индикаторов авторства; те, кто отвергает авторство Павла в Пастырских посланиях, опираются на другие аргументы. [11]
Существуют также субъективные вопросы о том, являются ли две формы «одним и тем же словом»: dog против dogs, clue против clueless, sign против signature; также возникает множество других серых случаев. Еврейская энциклопедия указывает, что, хотя в еврейской Библии есть 1500 гапаксов , только около 400 из них не связаны явно с другими засвидетельствованными словоформами. [12]
Последняя трудность с использованием hapax legomena для определения авторства заключается в том, что существуют значительные различия между работами, которые, как известно, принадлежат одному автору, и разные авторы часто показывают схожие значения. Другими словами, hapax legomena не является надежным индикатором. Исследования авторства теперь обычно используют широкий спектр мер для поиска закономерностей, а не полагаются на отдельные измерения.
Информатика
В областях компьютерной лингвистики и обработки естественного языка (NLP), особенно корпусной лингвистики и машинного обучения NLP, обычно игнорируют hapax legomena (а иногда и другие редкие слова), поскольку они, вероятно, не представляют большой ценности для вычислительных методов. Это игнорирование имеет дополнительное преимущество в виде значительного сокращения использования памяти приложением, поскольку, согласно закону Ципфа , многие слова являются hapax legomena. [13]
Примеры
Ниже приведены некоторые примеры hapax legomena в языках и корпусах .
Классическая китайская и японская литература содержит много китайских иероглифов , которые встречаются в корпусе только один раз, и их значение и произношение часто терялись. Известные в японском языке как kogo (孤語) , буквально «одинокие иероглифы», их можно считать типом hapax legomenon . [15] Например, в «Классике поэзии» ( ок. 1000 г. до н. э. ) иероглиф篪используется ровно один раз в стихе 「伯氏吹塤, 仲氏吹篪」 , и только благодаря обнаружению описания Го Пу (276–324 гг. н. э.) иероглиф можно было связать с определенным типом древней флейты.
Английский
Авторы довольно часто «придумывают» новые слова, чтобы передать определенное значение или ради развлечения, без какого-либо намека на то, что это «правильные» слова. Например, П. Г. Вудхауз и Льюис Кэрролл часто придумывали новые слова. Indexy , ниже, по-видимому, является примером этого.
Flother , как синоним слова «snowing» , — это hapax legomenon письменного английского языка, найденный в рукописи под названием «XI Pains of Hell» ( около 1275 г. ). [16] [17]
Индексный в « Дракуле » Брэма Стокера используется как прилагательное для описания ситуативного состояния, не имеющего иного дальнейшего использования в языке: «Если бы этот человек был обычным сумасшедшим, я бы рискнул довериться ему; но он, кажется, настолько связан с графом индексным образом, что я боюсь сделать что-то плохое, помогая его причудам». [18]
Мантикратический , означающий «правление семьи или клана Пророка», был, по-видимому, придуман Т. Э. Лоуренсом и появляется один раз в «Семи столпах мудрости» . [18]
Nortelrye , слово, означающее «образование», встречается у Чосера только один раз .
Слово «дерзость» , возможно, в значении «дерзость», встречается лишь однажды в рассказе Диккенса «Рождественская елка» .
Slæpwerigne , «утомленный сном», встречается в древнеанглийском корпусе только один раз, в « Книге Эксетера ». Ведутся споры о том, означает ли оно «утомленный сном» или «утомленный для сна».
По словам классического исследователя Клайда Фарра , « в «Илиаде» 1097 hapax legomena , тогда как в «Одиссее» их 868». [19] Однако другие исследователи определили этот термин по-другому и насчитывают всего 303 в « Илиаде» и 191 в «Одиссее» . [20]
Греческий Новый Завет содержит 686 местных hapax legomena , которые иногда называют «новозаветными hapaxes». [22] 62 из них встречаются в 1 Петра и 54 — во 2 Петра . [23]
Слово aphedrōn (ἀφεδρών) «отхожее место» в греческом Новом Завете встречается только дважды, в Евангелии от Матфея 15:17 и в Евангелии от Марка 7:19, но поскольку широко распространено мнение, что автор Евангелия от Матфея использовал Евангелие от Марка в качестве источника, его можно рассматривать как hapax legomenon . Его ошибочно переводили как «кишечник», пока надпись из Lex de astynomis Pergamenorum («Закон городских писцов Пергама ») не подтвердила, что оно означает «отхожее место». [24] [25]
иврит
Число отдельных hapax legomena в еврейской Библии составляет 1480 (из общего числа 8679 отдельных используемых слов). [26] : 112 Однако из-за еврейских корней , суффиксов и префиксов только 400 являются «истинными» hapax legomena . [12] Полный список можно увидеть в статье « Hapax Legomena » в Еврейской энциклопедии . [12]
Вот некоторые примеры:
Акут (אקוט – сражался) встречается в еврейской Библии только один раз, в Псалме 95:10.
Ацей Гофер (עֲצֵי-גֹפֶר – дерево гофер ) упоминается в Библии один раз, в Бытие 6:14, в инструкции сделать Ноев ковчег «из дерева гофер». Из-за его единственного вида его буквальное значение теряется. Гофер – это просто транслитерация , хотя ученые предположительно предполагают, что подразумеваемое дерево – кипарис . [27]
Гвина (גבינה – сыр ) – это hapax legomenon библейского иврита , встречается только в Иов 10:10. Слово стало чрезвычайно распространенным в современном иврите .
Zechuchith (זכוכית) — это hapax legomenon библейского иврита, встречающийся только в Иове 28:17. Слово происходит от корня זכה z-ch-h , означающего ясный/прозрачный и относящегося к стеклу или кристаллу . В современном иврите оно используется для «стекла».
Лилит (לילית) встречается один раз в еврейской Библии , в Исаии 34:14, где описывается опустошение Эдома . Это переводится несколькими способами. Следующий стих, Исаии 34:15, содержит еще один hapax legomenon , слово qippoz (קִפוֹז), которое в разных версиях текстапереводилось как сова , стрела-змея и песчаная куропатка . [28]
венгерский
Слово ímés упоминается в книге Иштвана Секели 1559 года под названием Chronica ez vilagnac ieles dolgairol . [29] Согласно теории историка литературы Гезы Сентмартони Сабо, это слово означает «полусонный». [30]
ирландский
chomneibi , прилагательное неизвестного значения, описывающее планку , появляется только в Triads of Ireland #169. [31]
Глагол attuia появляется один раз в Commedia ( Purgatorio XXXIII, 48). Значение оспаривается, но обычно интерпретируется как «затемняет» или «препятствует». В некоторых рукописях вместо него приводится альтернативное hapax accuia . [32]
Ultrafilosofia , что означает «за пределами философии», появляется в «Зибальдоне » Леопарди (Zibaldone 114–115 – 7 июня 1820 г.).
латинский
Deproeliantis , причастие слова deproelior , которое означает «яростно сражаться» или «бороться неистово», появляется только в строке 11 «Оды» Горация 1.9 .
Мактату , аблатив единственного числа от mactatus , что означает «из-за убийства». Оно встречается только в «De rerum natura » Лукреция .
Слово Mnemosynum , предположительно означающее «памятную записку» или «мемориал» , появляется только в стихотворении 12 « Кармины » Катулла .
Scortillum , уменьшительная форма, означающая «маленькая проститутка», встречается только в стихотворении 10 « Кармины » Катулла , строка 3.
Terricrepo , прилагательное, по-видимому, относящееся к методу громоподобного ораторского искусства, встречается только в 8-й книге « Исповеди » Августина .
Romanitas , существительное, означающее «римлянство» или «римский путь» или «римскую манеру», появляется только в труде Тертуллиана « О Паллио » . [33] [34]
Arepo — потенциальное имя собственное, встречающееся только в квадрате Сатор . Его можно получить, написав opera наоборот.
Эойгена , прилагательное, относящееся к солнцу и означающее «рожденный на востоке», [35] [36] появляется только в эпиграфе, найденном в Кастелламаре ди Стабия (древние Стабии ).
славянский
Вытол (вытол) — это hapax legomenon известного корпуса средневековых русских берестяных грамот . Слово встречается в надписи № 600 из Новгорода , датируемой ок. 1220–1240 гг., в контексте « вытоло изловили, вытоло изловили ». По словам Андрея Зализняка , слово больше нигде не встречается, и его значение неизвестно. [37] Были предложены различные толкования, такие как личное имя или социальный статус человека. [38]
испанский
Atafea — это hapax legomenon, появляющийся в пословице, переданной Бласко де Гараем в 16 веке ( «uno muere de atafea y otro la desea» ). Значение слова было неизвестно, и первоначально оно трактовалось как сытость. Современные этимологи связывают его с североафриканским арабским термином tafaya/attatfíha, который относится к рагу из лука и кориандра. [39]
Esi , как полагают, происходит от латинского союза etsi «хотя», появляется только один раз в произведении Альваро де Луны « Virtuosas e claras mugeres » (1446). [40]
В популярной культуре
Авангардный кинорежиссер Холлис Фрэмптон снял серию из семи фильмов с 1971 по 1972 год под названием « Hapax Legomena I: Ностальгия по Hapax Legomena VII: Специальные эффекты» . [41]
Термин Hapax legomenon на короткое время стал популярным в Великобритании после финала университетского конкурса 2014–15 годов , после того как в сети стали вирусными видеоролики , на которых студент Гонвилля и Кая Тед Лавдей быстро назвал этот термин правильным ответом, когда ведущий Джереми Паксман успел только спросить: «Какой греческий термин из двух слов обозначает слово...» [42] [43] [44] [45]
В видеоигре NetHack " HAPAX LEGOMENON " является одним из возможных рандомизированных текстов до сих пор не идентифицированного типа магического свитка. После прочтения свиток вызывает свой магический эффект, а затем исчезает ("вещь, сказанная однажды"), но, возможно, становится в дальнейшем идентифицированным (например, свиток зачарования доспехов, свиток телепортации и т. д.) для этого прохождения. [47]
В веб-комиксе Narbonic побочная история викторианской эпохи знакомит нас с группой венерианских рыболюдей, лидером которых является Гапакс Легоменон.
Смотрите также
Googlewhack – конкурс по поиску запроса Google, который возвращает один результат
^ Пол Бейкер, Эндрю Харди и Тони МакЭнери, Глоссарий корпусной лингвистики , Издательство Эдинбургского университета, 2006, стр. 81, ISBN 0-7486-2018-4 .
↑ Кирстен Мальмкьер, «Лингвистическая энциклопедия». Архивировано 1 января 2020 г. на Wayback Machine , 2-е изд., Routledge, 2002 г., ISBN 0-415-22210-9 , стр. 87.
^ Кристофер Д. Мэннинг и Хинрих Шютце, Основы статистической обработки естественного языка , MIT Press, 1999, стр. 22, ISBN 0-262-13360-1 .
↑ П. Н. Харрисон. Проблема пастырских посланий . Oxford University Press, 1921.
^ abc Workman, «The Hapax Legomena of St. Paul», Expository Times , 7 (1896:418), отмечено в The Catholic Encyclopedia, sv «Epistles to Timothy and Titus» Архивировано 08.04.2011 на Wayback Machine .
^ Стивен Дж. ДеРоуз. «Статистический анализ некоторых лингвистических аргументов относительно авторства пастырских посланий». Дипломная работа, Университет Брауна, 1982; Терри Л. Уайлдер. «Краткая защита подлинности пастырских посланий». Midwestern Journal of Theology 2.1 (осень 2003), 38–4. (онлайн)
^ abc Статья о Hapax Legomena Архивировано 2012-10-19 в Wayback Machine в Jewish Encyclopedia . Включает список всех hapax legomena Ветхого Завета , по книгам.
^ D. Jurafsky и JH Martin (2009). Обработка речи и языка . Prentice Hall.
^ Орхан Эльмаз. «Die Interpretationsgeschichte der koranischen Hapaxlegomena». Докторская диссертация, Венский университет, 2008 г., стр. 29.
^ ab "Странный мир hapax legomenon | Spectator". Архивировано из оригинала 2022-06-01 . Получено 2020-11-04 .
^ Фарр, Клайд (1920). Гомеровский греческий, книга для начинающих. DC Heath & Co., Publishers. стр. xxii.
^ Рис, Стив. "Hapax Legomena" в Margalit Finkelberg (ред.), Homeric Encyclopedia (Oxford: Blackwell, 2011) 330-331. Hapax Legomena у Гомера Архивировано 2020-01-01 в Wayback Machine
^ ( Илл . 24.540)
^ например, Ричард Бокхэм Еврейский мир вокруг Нового Завета: сборник эссе I стр. 431 2008: «новозаветный гапакс, который встречается 19 раз в Ерме...»
↑ Джон Ф. Уолвурд и Рой Б. Зак, Комментарий к библейскому знанию: Новое издание , Дэвид К. Кук, 1983, стр. 860, ISBN 0-88207-812-7 .
^ Г. Клаффенбах, Lex de astynomis Pergamenorum (1954).
^ Природа и функции воды, ванн, купания и гигиены из ... - Страница 252 Синтия Коссо, Энн Скотт - 2009 « Гюнтер Клаффенбах , «Die Astynomeninschrift von Pergamon», Abhandlungen der Deutschen Akademie der Wissenschaften zu Berlin. Klasse für Язык, литература и искусство 6 (1953), 3–25 взял на себя полный, но строго филологический комментарий».
^ Цукерман, Гилад (2020). Возрожденческая культура: от генезиса израильского до языкового возрождения в Австралии и за ее пределами. Нью-Йорк: Oxford University Press. ISBN9780199812790. Архивировано из оригинала 2020-05-05 . Получено 2020-04-30 .
^ «Ковчег, конструкция и размер». Пособие по пониманию Библии , Общество Сторожевой Башни, Библий и трактатов, 1971.
^ Блэр, Джудит М. (2009). Дедемонизация Ветхого Завета: исследование Азазеля, Лилит, Дебера, Кетеба и Решефа в еврейской Библии . Тюбинген, Германия: Mohr Siebeck. стр. 92–95. ISBN9783161501319.
^ Танулманьок Сентмартони Сабо Геза хатванадик születésnapjára (на венгерском языке)
^ Тибор, Сёч. «A turul-monda szövegkapcolatai a középkori írásos hagyományunkban. В: Középkortörténeti tanulmanyok 6. Szerk.: G. Tóth Péter, Szabó Pál. Szeged, 2010. 249–259».
^ "The Triads of Ireland". www.smo.uhi.ac.uk . Архивировано из оригинала 2016-04-09 . Получено 2019-01-28 .
^ "attuiare in "Enciclopedia Dantesca"". www.treccani.it (на итальянском). Архивировано из оригинала 2018-11-17 . Получено 2019-01-28 .
^ Льюис, CT и Шорт, C. (1879) Латинский словарь, Оксфордский университет, Clarendon Press, стр.1599.
^ "Tertullian: De Pallio". Архивировано из оригинала 2016-03-04 . Получено 2015-11-28 .
^ Sblendorio Cugusi MT CLE 428 и лат. Эойгена. Studia philologica валентина, 2008, т. 1, с. 11, стр. 327–350. (на итальянском языке).
^ Андрей Зализняк, Новгородская Русь по берестяным грамотам: взгляд из 2012 г. Архивировано 3 ноября 2018 г. в Wayback Machine (Новгородская Русь по берестяным грамотам: вид 2012 г.), стенограмма лекции.
^ А. Л. Шилов (А.Л. Шилов), ЭТНОНИМЫ И НЕСЛАВЯНСКИЕ АНТРОПОНИМЫ БЕРЕСТЯНЫХ ГРАМОТ. Архивировано 7 ноября 2017 г. в Wayback Machine (Этнонимы и неславянские антропонимы в берестяных рукописях).
^ "HÁPAX".
^ Родригес, Лола Понс. «Frecuencia lingüística y novedad grmatical. Propuestas sobre el hápax y las formas aisladas, con ejemplos del XV castellano». Ибероромания 2013, вып. 78 (2013): 222–245.
^ "Hollis Frampton at IMDB". IMDb . Архивировано из оригинала 2014-06-06 . Получено 2014-04-14 .
^ «Победитель University Challenge Тед Лавдей: Я узнал свои ответы в Википедии». 15 апреля 2015 г. Архивировано из оригинала 29-10-2020 . Получено 27-01-2020 .
^ «Этот парень только что выиграл University Challenge с одним нелепым ответом». 14 апреля 2015 г. Архивировано из оригинала 8 мая 2017 г. Получено 26 апреля 2017 г.
^ «Лучший из когда-либо существовавших участников University Challenge получил похвалу после сверхбыстрых ответов». Daily Mirror . 14 апреля 2015 г. Архивировано из оригинала 27 января 2020 г. Получено 27 января 2020 г.
^ sabotagetimes.comАрхивировано 15 октября 2015 г. на Wayback Machine ; youtube.comАрхивировано 11 апреля 2017 г. на Wayback Machine
↑ Архивировано в Ghostarchive и Wayback Machine: Vsauce; Стивенс, Майкл (15 сентября 2015 г.). «The Zipf Mystery». YouTube . Получено 3 августа 2020 г. .