Поверхностный синтаксический анализ (также фрагментация или легкий синтаксический анализ ) — это анализ предложения , который сначала идентифицирует составные части предложений (существительные, глаголы, прилагательные и т. д.), а затем связывает их с единицами более высокого порядка, имеющими дискретные грамматические значения ( группы существительных или фразы , группы глаголов и т. д.). В то время как самые элементарные алгоритмы фрагментации просто связывают составные части на основе элементарных шаблонов поиска (например, как указано регулярными выражениями ), подходы, использующие методы машинного обучения (классификаторы, тематическое моделирование и т. д.), могут учитывать контекстную информацию и, таким образом, составлять фрагменты таким образом, чтобы они лучше отражали семантические отношения между основными компонентами. [1] То есть, эти более продвинутые методы обходят проблему того, что комбинации элементарных компонентов могут иметь разные значения более высокого уровня в зависимости от контекста предложения.
Это метод, широко используемый в обработке естественного языка . Он похож на концепцию лексического анализа для компьютерных языков. Под названием «гипотеза неглубокой структуры» он также используется в качестве объяснения того, почему изучающие второй язык часто не могут правильно разобрать сложные предложения. [2]
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка )