Natural Language Toolkit , или чаще NLTK , представляет собой набор библиотек и программ для символической и статистической обработки естественного языка (NLP) для английского языка, написанный на языке программирования Python . Он поддерживает функции классификации, токенизации, стемминга, тегирования, синтаксического анализа и семантического обоснования. [4] Он был разработан Стивеном Бердом и Эдвардом Лопером на кафедре компьютерных и информационных наук Пенсильванского университета . [5] NLTK включает графические демонстрации и примеры данных. Он сопровождается книгой, в которой объясняются основные концепции, лежащие в основе задач обработки языка, поддерживаемых набором инструментов, [6] а также кулинарной книгой. [7]
NLTK предназначен для поддержки исследований и преподавания в области NLP или тесно связанных областей, включая эмпирическую лингвистику , когнитивную науку , искусственный интеллект , поиск информации и машинное обучение . [8] NLTK успешно использовался в качестве учебного пособия, индивидуального учебного пособия и платформы для прототипирования и создания исследовательских систем. 32 университета в США и 25 странах используют NLTK в своих курсах.
{{cite journal}}
: Цитировать журнал требует |journal=
( помощь )