Предиктивный текст — это технология ввода, используемая, когда одна клавиша или кнопка представляет множество букв, например, на физических цифровых клавиатурах мобильных телефонов и в технологиях доступности . Каждое нажатие клавиши приводит к предсказанию, а не к многократному последовательному набору той же группы «букв», которую она представляет, в том же неизменном порядке. Предиктивный текст может позволить вводить целое слово одним нажатием клавиши. Предиктивный текст эффективно использует меньшее количество клавиш устройства для ввода текста в текстовое сообщение , электронное письмо , адресную книгу , календарь и тому подобное.
Наиболее широко используемые общие системы предиктивного ввода текста — это T9 , iTap , eZiText и LetterWise /WordWise. Существует много способов создания устройства, предсказывающего текст, но все системы предиктивного ввода текста имеют начальные лингвистические настройки, которые предлагают предсказания, приоритет которых изменяется для адаптации к каждому пользователю. Это обучение адаптируется посредством памяти устройства к неоднозначной обратной связи пользователя, которая приводит к корректирующим нажатиям клавиш, таким как нажатие клавиши «далее», чтобы перейти к намерению. Большинство систем предиктивного ввода текста имеют базу данных пользователей для облегчения этого процесса.
Теоретически количество нажатий клавиш, необходимое для ввода нужного символа в готовом тексте, в среднем сопоставимо с использованием клавиатуры . Это приблизительно соответствует истине при условии, что все используемые слова находятся в базе данных, знаки препинания игнорируются, и не допускаются ошибки ввода при наборе или написании. [1] Теоретическое количество нажатий клавиш на символ, KSPC, клавиатуры составляет KSPC=1,00, а многоточечного набора — KSPC=2,03. LetterWise от Eatoni — это предиктивный многоточечный гибрид, который при работе на стандартной телефонной клавиатуре достигает KSPC=1,15 для английского языка.
Выбор предиктивной текстовой системы, которая лучше всего подходит для использования, включает в себя соответствие предпочитаемому стилю интерфейса пользователя , уровню его обученной способности работать с предиктивным текстовым программным обеспечением и цели эффективности пользователя. Существуют различные уровни риска в предиктивных текстовых системах по сравнению с многоточечными системами, поскольку автоматически написанный предиктивный текст, который обеспечивает преимущество скорости и механической эффективности, может, если пользователь не будет осторожен при просмотре, привести к передаче дезинформации. Для того, чтобы научиться хорошо использовать предиктивные текстовые системы, требуется время, и поэтому, как правило, система устройства имеет пользовательские опции для настройки выбора многоточечного или любого из нескольких школ методов предиктивного текста.
Служба коротких сообщений (SMS) позволяет пользователю мобильного телефона отправлять текстовые сообщения (также называемые сообщениями, SMS, текстами и txt) в виде короткого сообщения. Наиболее распространенная система ввода текста SMS называется « многократным нажатием ». При использовании многократных нажатий клавиша нажимается несколько раз, чтобы получить доступ к списку букв на этой клавише. Например, нажатие клавиши «2» один раз отображает «a», два раза отображает «b» и три раза отображает «c». Чтобы ввести две последовательные буквы, которые находятся на одной клавише, пользователь должен либо сделать паузу, либо нажать кнопку «Далее». Пользователь может печатать, нажимая на буквенно-цифровую клавиатуру, не глядя на дисплей электронного оборудования. Таким образом, многократные нажатия просты для понимания и могут использоваться без какой-либо визуальной обратной связи. Однако многократные нажатия не очень эффективны, потенциально требуя множества нажатий клавиш для ввода одной буквы.
При идеальном предиктивном вводе текста все используемые слова находятся в словаре, знаки препинания игнорируются, не допускаются орфографические ошибки и ошибки при наборе текста. Идеальный словарь должен включать весь сленг, имена собственные , аббревиатуры , URL-адреса , иноязычные слова и другие уникальные для пользователя слова. Это идеальное обстоятельство дает предиктивному текстовому программному обеспечению сокращение количества нажатий клавиш, которые пользователь должен нажать для ввода слова. Пользователь нажимает цифру, соответствующую каждой букве, и, если слово существует в предиктивном текстовом словаре или правильно распознается несловарными системами, оно появится. Например, нажатие «4663» обычно будет интерпретироваться как слово good , при условии, что в настоящее время используется лингвистическая база данных на английском языке, хотя такие альтернативы, как home , hood и hoof, также являются допустимыми интерпретациями последовательности нажатий клавиш.
Наиболее широко используемые системы предиктивного ввода текста — Tegic T9 , Motorola iTap и Eatoni Ergonomics LetterWise и WordWise. T9 и iTap используют словари, но продукты Eatoni Ergonomics используют процесс устранения неоднозначности, набор статистических правил для воссоздания слов из последовательностей нажатий клавиш. Все системы предиктивного ввода текста требуют лингвистической базы данных для каждого поддерживаемого языка ввода.
Традиционное устранение неоднозначности осуществляется путем обращения к словарю общеупотребительных слов, хотя Eatoni предлагает систему устранения неоднозначности без использования словаря.
В системах на основе словаря, когда пользователь нажимает кнопки с цифрами, алгоритм ищет в словаре список возможных слов, соответствующих комбинации нажатия клавиш, и предлагает наиболее вероятный выбор. Затем пользователь может подтвердить выбор и продолжить или использовать клавишу для циклического просмотра возможных комбинаций.
Система без словаря создает слова и другие последовательности букв из статистики частей слов. Чтобы попытаться предсказать предполагаемый результат нажатия клавиш, которые еще не введены, устранение неоднозначности может быть объединено с функцией завершения слов .
Любая система (разрешающая неоднозначность или предиктивная) может включать пользовательскую базу данных, которую можно далее классифицировать как систему «обучения», когда слова или фразы вводятся в пользовательскую базу данных без прямого вмешательства пользователя. Пользовательская база данных предназначена для хранения слов или фраз, которые не очень хорошо разрешаются заранее предоставленной базой данных. Некоторые системы разрешения неоднозначности также пытаются исправить орфографию, отформатировать текст или выполнить другие автоматические переписывания, что может привести к рискованному эффекту либо улучшения, либо срыва усилий пользователя по вводу текста.
Технология предиктивного ввода текста и автозаполнения была изобретена китайскими учеными и лингвистами в 1950-х годах в связи с необходимостью решения проблемы неэффективности ввода на китайской пишущей машинке [2] , поскольку процесс печати включал в себя поиск и выбор тысяч логографических символов на лотке [3] , что существенно замедляло скорость обработки текста. [4] [5]
Активирующие клавиши китайской пишущей машинки, созданной Линь Юйтаном в 1940-х годах, включали предложения для символов, следующих за выбранным. В 1951 году китайский наборщик Чжан Цзиин организовал китайские символы в ассоциативные кластеры, предшественника современного предиктивного ввода текста, и побил рекорды скорости, сделав это. [6] Предиктивный ввод текста с клавиатуры телефона известен по крайней мере с 1970-х годов (Смит и Гудвин, 1971). Предиктивный ввод текста в основном использовался для поиска имен в справочниках по телефону, пока текстовые сообщения с мобильных телефонов не стали широко использоваться.
Если бы пользователи хотели набрать текст на обычной клавиатуре телефона с помощью системы ввода с «многократным нажатием», им пришлось бы:
Между тем, в телефоне с функцией предиктивного ввода текста им нужно всего лишь:
Система обновляет дисплей по мере нажатия каждой клавиши, чтобы показать наиболее вероятный ввод. В этом примере прогнозирование сократило количество нажатий кнопок с пяти до трех. Эффект еще больше с более длинными словами и теми, которые состоят из букв, находящихся позже в последовательности каждой клавиши.
Система прогнозирования на основе словаря основана на надежде, что нужное слово есть в словаре. Эта надежда может быть неуместной, если слово каким-либо образом отличается от общепринятого использования — в частности, если слово написано или напечатано неправильно, является сленгом или является именем собственным . В этих случаях для ввода слова должен использоваться какой-то другой механизм. Более того, простой подход со словарем не работает с агглютинативными языками , где одно слово не обязательно представляет собой одну семантическую сущность.
Предиктивный ввод текста разрабатывается и продается в различных конкурирующих продуктах, таких как T9 от Nuance Communications . Другие продукты включают iTap от Motorola ; LetterWise от Eatoni Ergonomic (предсказание на основе символов, а не слов); WordWise (предсказание на основе слов без словаря); EQ3 ( раскладка в стиле QWERTY , совместимая с обычными телефонными клавиатурами); Phraze-It от Prevalent Devices; TenGO от Xrgomics (упрощенная система QWERTY-клавиатуры с шестью клавишами); Adaptxt (учитывает язык, контекст, грамматику и семантику); Lightkey (программное обеспечение для предиктивного ввода текста для Windows); Clevertexting (статистическая природа языка, отсутствие словаря, динамическое распределение клавиш); и Oizea Type (временная неоднозначность); Tauto от Intelab; Intelligent Input Platform™ от WordLogic (запатентованная, основанная на слоях расширенная система прогнозирования текста, включающая многоязычный словарь, проверку орфографии, встроенный веб-поиск); Gboard от Google .
Слова, полученные с помощью одной и той же комбинации нажатий клавиш, называются «текстонимами»; [7] также «txtonyms»; [8] или «T9onyms» (произносится как «tynonyms» / ˈ t aɪ n ə n ɪ m z / [7] ), хотя они не являются специфическими для T9. Выбор неправильного текстонима может произойти без опечатки или ошибки, если неправильный текстоним выбран по умолчанию или по ошибке пользователя. Как упоминалось выше, последовательность клавиш 4663 на клавиатуре телефона, снабженной лингвистической базой данных на английском языке, обычно будет неоднозначно интерпретироваться как слово good . Однако та же последовательность клавиш также соответствует другим словам, таким как home , gone , hoof , hood и так далее. Например, «Are you home?» может быть отображено как «Are you good?», если пользователь не изменит слово 4663 по умолчанию. Это может привести к недоразумениям; например, последовательность 735328 может соответствовать либо select , либо его антониму reject . Драка 2010 года, которая привела к непредумышленному убийству, была спровоцирована ошибкой текстонима. [9] Предиктивный выбор текста по умолчанию, отличного от того, которого ожидает пользователь, имеет сходство с эффектом Купертино , при котором программное обеспечение для проверки орфографии изменяет написание на непреднамеренное слово.
Текстонимы использовались как сленг миллениалов ; например, использование слова book в значении cool , поскольку book было значением по умолчанию в системах предиктивного ввода текста, которые предполагали, что оно встречается чаще, чем cool . [10] Это связано с какографией .
Текстонимы — не единственная проблема, ограничивающая эффективность предиктивных реализаций текста. Еще одной значительной проблемой являются слова, для которых устранение неоднозначности дает один неверный ответ. Например, система может ответить Blairf при вводе 252473, когда предполагаемое слово было Blaise или Claire , оба из которых соответствуют последовательности нажатий клавиш, но в этом примере не найдены предиктивной системой текста. Когда происходят опечатки или опечатки, они вряд ли будут правильно распознаны системой устранения неоднозначности, хотя механизмы исправления ошибок могут смягчить этот эффект.
[KSPC] для английского языка варьируются от примерно 10 для методов, использующих только клавиши курсора и клавишу SELECT, до примерно 0,5 для методов предсказания слов. Показано, что KSPC полезен для априорного анализа, тем самым поддерживая характеристику и сравнение методов ввода текста до трудоемких реализаций и оценок.