Поверхностный синтаксический анализ (также фрагментарный или легкий синтаксический анализ ) — это анализ предложения , который сначала идентифицирует составные части предложения (существительные, глаголы, прилагательные и т. д.), а затем связывает их с единицами более высокого порядка, имеющими дискретные грамматические значения ( группы существительных или фразы) . , группы глаголов и т. д.). В то время как самые элементарные алгоритмы фрагментации просто связывают составные части на основе элементарных шаблонов поиска (например, как указано в регулярных выражениях ), подходы, использующие методы машинного обучения (классификаторы, тематическое моделирование и т. д.), могут учитывать контекстную информацию и, таким образом, Составляйте фрагменты таким образом, чтобы они лучше отражали смысловые отношения между основными составляющими. [1] То есть эти более продвинутые методы решают проблему, заключающуюся в том, что комбинации элементарных составляющих могут иметь разные значения более высокого уровня в зависимости от контекста предложения.
Это метод, широко используемый при обработке естественного языка . Это похоже на концепцию лексического анализа компьютерных языков. Под названием «гипотеза мелкой структуры» она также используется в качестве объяснения того, почему изучающие второй язык часто не могут правильно разобрать сложные предложения. [2]
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка )