stringtranslate.com

Разрешение имени (семантика и извлечение текста)

В семантике и извлечении текста разрешение имени относится к способности программного обеспечения для интеллектуального анализа текста определять, к какому конкретному лицу, актеру или объекту относится конкретное использование имени. Его также можно назвать разрешением сущности .

Разрешение имени в простом тексте

Например, в области интеллектуального анализа текста программному обеспечению часто приходится интерпретировать следующий текст:

Джон отдал Эдварду книгу. Затем он встал и позвал Джона вернуться в комнату.

В этих предложениях программное обеспечение должно определить, относится ли местоимение "he" к "John" или "Edward" из первого предложения. Программное обеспечение также должно определить, является ли "John", упомянутый во втором предложении, тем же самым, что и "John" в первом предложении, или третьим лицом, чье имя также "John". Такие примеры применимы почти ко всем языкам, а не только к английскому.

Разрешение имен в документах

Часто этот тип разрешения имен также используется в разных документах, например, чтобы определить, является ли « Джордж Буш », упомянутый в старой газетной статье как президент Соединенных Штатов ( Джордж Буш-старший ), тем же человеком, что и «Джордж Буш», упомянутый в отдельной новостной статье несколько лет спустя о человеке, баллотирующемся на пост президента ( Джордж Буш-младший ). Поскольку у многих людей могут быть одинаковые имена, аналитики и программное обеспечение должны учитывать значительно больше информации, чем просто имя, чтобы определить, действительно ли две одинаковые ссылки («Джордж Буш») относятся к одному и тому же конкретному субъекту или лицу.

Разрешение имени/сущности в извлечении текста и семантике является печально известной трудной проблемой, отчасти потому, что во многих случаях недостаточно информации для точного определения. Существует множество частичных решений, которые опираются на конкретные контекстные подсказки, найденные в данных, но в настоящее время не существует известного общего решения.

Эту проблему иногда называют разрешением неоднозначности имен, а в случае цифровых библиотек — разрешением неоднозначности авторов.

Примеры программного обеспечения, которое может обеспечить преимущества разрешения имен, см. также:

Смотрите также

Ссылки