stringtranslate.com

Джули Бет Ловинс

Джули Бет Ловинс (19 октября 1945 г., Вашингтон, округ Колумбия — 26 января 2018 г., Маунтин-Вью, Калифорния ) — компьютерный лингвист , опубликовавший в 1968 г. «Алгоритм стемминга Ловинса» — тип алгоритма стемминга для сопоставления слов. [1]

Ловинс Стеммер — это однопроходный, контекстно-зависимый стеммер, который удаляет окончания на основе принципа наибольшего соответствия . Стеммер был опубликован первым и был чрезвычайно хорошо разработан, учитывая дату его выпуска, оказав основное влияние на большое количество будущих работ в этой области. - Адам Г. и др. [2]

Фон

Родилась 19 октября 1945 года в Вашингтоне, округ Колумбия , Ловинс выросла в Амхерсте, штат Массачусетс . Ее отец Джеральд Х. Ловинс был инженером, а мать, Мириам Ловинс, администратором социальных служб . [3] Брат Ловинс , Эмори Ловинс , является соучредителем и главным ученым-экологом Института Роки Маунтин . [4]

Для получения степени бакалавра Ловинс поступила в Пембрук-колледж , женский колледж Университета Брауна , который позже был объединен в Университет Брауна в 1971 году. [5] [3] В Пембрук-колледже Ловинс изучала математику и лингвистику, окончив его с отличием. Ее диссертация называлась «Исследование идиом» . [6] В 1970 году она получила первую стипендию Блоха от Лингвистического общества Америки для поступления в аспирантуру . [7] Ловинс получила степень магистра искусств в 1970 году и степень доктора философии в 1973 году в Чикагском университете , изучая лингвистику . [4] В Чикагском университете ее диссертация называлась « Заимствованная фонология — предмет исследования». [8] Пересмотренная версия ее диссертации о заимствованных словах и фонологической структуре японского языка была опубликована в 1975 году Лингвистическим клубом Университета Индианы . [9]

Преподавательская карьера

После получения докторской степени Ловинс в течение года работала лингвистом-специалистом в исследовательском институте языка Токийского университета и преподавателем разговорного английского языка . [5] Затем она присоединилась к преподавательскому составу колледжа Цуда в качестве профессора английского языка и лингвистики , где преподавала в течение семи лет. [4] Во время своей работы в качестве преподавателя колледжа Цуда Ловинс также работала приглашенным исследователем в Научно-исследовательском институте логопедии и фониатрии Токийского университета , исследовательском центре речевой науки . [10]

Карьера в отрасли

После преподавания японской фонологии в японских университетах за рубежом, Ловинс вернулась в США, чтобы работать в компьютерной индустрии. Она работала над ранним синтезом речи в Bell Labs в Мюррей-Хилл, Нью-Джерси . В Bell Labs Ловинс работала с Осаму Фудзимурой , японским лингвистом, которого считают пионером в области речевых наук. [11]

Ловинс также работала инженером-программистом в различных компаниях Кремниевой долины и была консультантом по компьютерной лингвистике на протяжении 1990-х годов. [3] Работая консультантом, она называла свой бизнес «The Language Doctor». [12]

Алгоритм стемминга Ловинса

Ловинс опубликовала статью о своей работе по разработке алгоритма стемминга в Исследовательской лаборатории электроники Массачусетского технологического института в 1968 году. [1] Алгоритм стемминга Ловинс часто называют стеммером Ловинса. [13]

Алгоритм стемминга — это процесс взятия слова с суффиксами и приведения его к его корню или базовому слову. [14] Алгоритмы стемминга используются для повышения точности в поиске информации и в анализе домена . [15] Эти алгоритмы помогают находить варианты запрашиваемых терминов. Алгоритмы стемминга приносят ценность в сокращении заданного запроса до его менее сложной формы, позволяя извлекать больше похожих документов для похожих запросов. [16] Алгоритмы стемминга широко распространены в поисковых системах , таких как Google Search , который не реализовал стемминг слов до 2003 года. Это означает, что до 2003 года поиск Google по слову warm не выдавал явно результатов для связанных слов, таких как warmth или warming .

Работа Ловинса, как первый опубликованный алгоритм стемминга, создала прецедент и повлияла на будущие работы в области алгоритмов стемминга, таких как стеммер Портера, опубликованный Мартином Портером в 1980 году, который был широко признан наиболее распространенным алгоритмом стемминга для английского языка . [17] Кроме того, стеммер Доусона, разработанный Джоном Доусоном, является расширением стеммера Ловинса. [18]

Стеммер Lovins следует подходу устранения аффиксов на основе правил . [19] Сначала он удаляет самый длинный идентифицируемый суффикс из целевого слова, создавая базовое слово-основу, а затем индексирует таблицу поиска для преобразования (потенциально неправильно сформированного) слова-основы в допустимое слово. Этот процесс можно разделить на две фазы. На первой фазе слово сравнивается с заранее определенным списком окончаний, и когда обнаруживается, что слово содержит одно из этих окончаний, окончание удаляется, оставляя только основу слова. Вторая фаза стандартизирует исключения правописания, которые возникают на первой фазе, гарантируя, что слова с незначительно различающимися основами будут надлежащим образом спариваться друг с другом. Например, в случае со словом dried первый этап дает dri , что должно совпадать со словом dry . Второй этап занимается этими исключениями. [1]

По сравнению с другими стеммерами алгоритм Ловинса быстр и оснащен для обработки нерегулярных множественных слов, таких как person и people . Однако к недостаткам можно отнести отсутствие многих суффиксов в таблице окончаний. Кроме того, иногда он крайне ненадежен и часто не может сформировать допустимые слова из основ или сопоставить основы слов с похожим значением. Чаще всего это вызвано использованием автором специальной терминологии и специфического для предметной области словаря. [18]

Личная жизнь

В 1979 году Ловинс переехала в Маунтин-Вью, штат Калифорния , а в 1981 году — в Олд-Маунтин-Вью вместе со своим партнером, а затем и мужем Грегом Фаулером, инженером-программистом и защитником прав слепых и защитником окружающей среды. [20] [21]

В свободное время она и ее муж любили гулять и заниматься волонтерством в местном сообществе. Ловинс активно работала волонтером в таких организациях, как Old Mountain View Neighborhood Association, Mountain View Friends of the Library , League of Women Voters , Mountain View Cool Cities Team и Mountain View Sustainability Task Force. [22]

В 2016 году муж Ловинс неожиданно умер от сердечного приступа . [21] [22] Через восемнадцать дней после смерти мужа у Ловинс диагностировали рак мозга . Она умерла 26 января 2018 года в хосписе, в окружении друзей, семьи и лиц, осуществляющих уход. [20]

Ссылки

  1. ^ abc Lovins, Julie (1968). "Development of a Stemming Algorithm" (PDF) . Mechanical Translation and Computational Linguistics . 11 (1 & 2): 22–31. Архивировано из оригинала (PDF) 2016-10-19 . Получено 2016-10-27 .
  2. ^ Адам Г., Асимакис К., Бурас К., Пулопулос В. (2010). «Эффективный механизм стемминга и тегирования: случай греческого языка». Интеллектуальные информационные и инженерные системы, основанные на знаниях . Конспект лекций по информатике. Том 6278. С. 389–397. CiteSeerX 10.1.1.168.6070 . doi :10.1007/978-3-642-15393-8_44. ISBN  978-3-642-15392-1. {{cite book}}: |journal=проигнорировано ( помощь )CS1 maint: несколько имен: список авторов ( ссылка )
  3. ^ abc "Palo Alto Online - Lasting Memories - Мемориал Джули Бет Ловинс". www.paloaltoonline.com . Получено 12.11.2018 .
  4. ^ abc "Reinventing Energy in China". Азиатское общество . Получено 2018-11-12 .
  5. ^ ab "Brown Alumni Monthly". 74 (9). Провиденс, Университет Брауна [и т.д.] Июль 1974: 51 . Получено 6 июня 2017 . {{cite journal}}: Цитировать журнал требует |journal=( помощь )
  6. ^ «Диссертации и тезисы Университета Брауна».
  7. ^ "Стипендии лингвистического института". Лингвистическое общество Америки . Получено 6 июня 2017 г.
  8. ^ "Выпускники (1951-настоящее время) | Факультет лингвистики". linguistics.uchicago.edu . Архивировано из оригинала 2019-04-06 . Получено 2018-11-12 .
  9. ^ Ловинс, Джули (1975). «Заимствованные слова и фонологическая структура японского языка». Linguistics Club : 163. OCLC  1924640.
  10. ^ «Ежегодный бюллетень НИИ логопедии и фониатрии» (PDF) .
  11. ^ «В память: Осаму Фудзимура».
  12. ^ «Подробности комитета Федеральной избирательной комиссии».
  13. ^ "Что такое Lovins Stemming?". The Lovins Stemmer . Университет Ланкастера. Архивировано из оригинала 1 мая 2010 года . Получено 26 мая 2011 года .
  14. ^ "Алгоритмы стемминга". xapian.org . Получено 2018-12-09 .
  15. ^ "Алгоритм стемминга Портера". tartarus.org . Получено 2018-12-09 .
  16. ^ "Поиск информации: ГЛАВА 8: АЛГОРИТМЫ СТЕММИНГА". orion.lcg.ufrj.br . Получено 2018-12-09 .
  17. ^ "Стемминг и лемматизация". nlp.stanford.edu . Получено 2018-12-09 .
  18. ^ ab Jivani, Anjali Ganesh. "A Comparative Study of Stemming Algorithms" (PDF) . International Journal of Computer Technology and Applications . 2 . S2CID  14814448. Архивировано из оригинала (PDF) 2018-12-10.
  19. ^ 8-я Международная конференция по управлению знаниями в организациях: социальные вычисления и вычисления на основе больших данных для управления знаниями .
  20. ^ ab "Palo Alto Online - Lasting Memories - Мемориал Джули Бет Ловинс". www.paloaltoonline.com . Получено 17.11.2018 .
  21. ^ ab «Вспоминая Грега Фаулера».
  22. ^ ab "Информационный бюллетень OMVNA". www.omvna.org . Получено 17.11.2018 .