Проверка грамматики , в компьютерных терминах, это программа или часть программы, которая пытается проверить письменный текст на грамматическую правильность . Проверки грамматики чаще всего реализуются как функция более крупной программы, такой как текстовый процессор , но также доступны как отдельное приложение , которое может быть активировано из программ, работающих с редактируемым текстом.
Реализация проверки грамматики использует обработку естественного языка . [1] [2]
Самые ранние «проверщики грамматики» были программами, которые проверяли пунктуацию и несоответствия стиля, а не полный спектр возможных грамматических ошибок. Первая система называлась Writer's Workbench и представляла собой набор инструментов для письма, включенных в системы Unix еще в 1970-х годах. [3] [4] Весь пакет Writer's Workbench включал несколько отдельных инструментов для проверки различных проблем с письмом. Инструмент «diction» проверял текст на наличие многословных, банальных, клишированных или неправильно используемых фраз. Инструмент выводил список сомнительных фраз и предлагал варианты улучшения письма. Инструмент «style» анализировал стиль письма заданного текста. Он выполнял ряд тестов на читаемость текста и выводил результаты, а также давал некоторую статистическую информацию о предложениях текста.
Компания Aspen Software из Альбукерке, штат Нью-Мексико, выпустила самую раннюю версию программы проверки дикции и стиля для персональных компьютеров Grammatik в 1981 году. Grammatik впервые был доступен для Radio Shack - TRS-80 , а вскоре появились версии для CP/M и IBM PC . Reference Software International из Сан-Франциско, штат Калифорния, приобрела Grammatik в 1985 году. Разработка Grammatik продолжилась, и он стал настоящей программой проверки грамматики, которая могла обнаруживать ошибки письма помимо простой проверки стиля.
Другие ранние программы проверки дикции и стиля включали Punctuation & Style , Correct Grammar , RightWriter и PowerEdit . [5] Хотя все самые ранние программы начинались как простые программы проверки дикции и стиля, все они со временем добавляли различные уровни языковой обработки и развивали некоторый уровень истинной возможности проверки грамматики.
До 1992 года программы проверки грамматики продавались как дополнительные программы. В то время было доступно большое количество различных программ обработки текста, среди которых WordPerfect и Microsoft Word были двумя лидерами по доле рынка. В 1992 году Microsoft решила добавить проверку грамматики как функцию Word и лицензировала CorrecText, программу проверки грамматики от Houghton Mifflin , которая еще не продавалась как отдельный продукт. WordPerfect ответила на шаг Microsoft, приобретя Reference Software, и прямой потомок Grammatik по-прежнему включен в WordPerfect.
По состоянию на 2019 год средства проверки грамматики встроены в такие системы, как Google Docs и Sapling.ai, [6] расширения браузеров, такие как Grammarly и Qordoba , настольные приложения, такие как Ginger , бесплатное программное обеспечение с открытым исходным кодом , такое как LanguageTool , [7] и плагины текстовых редакторов, такие как доступные в WebSpellChecker Software.
Самые ранние программы по стилю письма проверяли текст на наличие многословных, банальных, клишированных или неправильно используемых фраз. Этот процесс был основан на простом сопоставлении с образцом . Сердцем программы был список из многих сотен или тысяч фраз, которые многие эксперты считают плохим написанием. Список сомнительных фраз включал альтернативные формулировки для каждой фразы. Проверяющая программа просто разбивала текст на предложения, проверяла наличие совпадений в словаре фраз, отмечала подозрительные фразы и показывала альтернативу. Эти программы также могли выполнять некоторые механические проверки. Например, они обычно отмечали двойные слова, двойную пунктуацию, некоторые ошибки в использовании заглавных букв и другие простые механические ошибки.
Настоящая проверка грамматики более сложна. В то время как язык программирования имеет очень специфический синтаксис и грамматику, для естественных языков это не так . Можно написать довольно полную формальную грамматику для естественного языка, но обычно в реальном использовании существует так много исключений, что формальная грамматика оказывает минимальную помощь в написании средства проверки грамматики. Одной из самых важных частей средства проверки грамматики естественного языка является словарь всех слов в языке, а также часть речи каждого слова. Тот факт, что естественное слово может использоваться как любая из нескольких частей речи (например, «свободный» используется как прилагательное, наречие, существительное или глагол), значительно увеличивает сложность любого средства проверки грамматики.
Проверка грамматики найдет каждое предложение в тексте, посмотрит каждое слово в словаре, а затем попытается разобрать предложение в форму, которая соответствует грамматике. Используя различные правила, программа может затем обнаружить различные ошибки, такие как согласование во времени , числе, порядке слов и т. д. Также возможно обнаружить некоторые стилистические проблемы в тексте. Например, некоторые популярные руководства по стилю, такие как The Elements of Style, осуждают чрезмерное использование страдательного залога . Проверка грамматики может попытаться определить страдательные предложения и предложить альтернативу с действительным залогом.
Элементы программного обеспечения, необходимые для проверки грамматики, тесно связаны с некоторыми проблемами разработки, которые необходимо решить для программного обеспечения распознавания речи . В распознавании голоса синтаксический анализ может использоваться для помощи в прогнозировании того, какое слово, скорее всего, подразумевается, на основе части речи и положения в предложении. В проверке грамматики синтаксический анализ используется для обнаружения слов, которые не соответствуют общепринятому использованию грамматики.
В последнее время [ когда? ] исследования были сосредоточены на разработке алгоритмов, которые могут распознавать грамматические ошибки на основе контекста окружающих слов. [ необходимо разъяснение ]
Программы проверки грамматики считаются типом помощи при письме на иностранном языке , которую неносители языка могут использовать для проверки своих текстов, поскольку такие программы стремятся выявить синтаксические ошибки. [8] Однако, как и другие компьютерные средства проверки письма, такие как программы проверки орфографии , популярные программы проверки грамматики часто подвергаются критике, когда они не обнаруживают ошибки и неправильно помечают правильный текст как ошибочный. Лингвист Джеффри К. Пуллум утверждал в 2007 году, что они, как правило, настолько неточны, что приносят больше вреда, чем пользы: «по большей части, принятие совета компьютерной программы проверки грамматики в отношении вашей прозы сделает ее намного хуже, иногда до смешного бессвязной». [9]
{{cite book}}
: |last=
имеет общее название ( помощь ){{cite journal}}
: Цитировать журнал требует |journal=
( помощь )