Интеллектуального ввода текста

Интеллектуальный текст — это технология ввода, используемая, когда одна клавиша или кнопка представляет множество букв, например, на физических цифровых клавиатурах мобильных телефонов и в технологиях специальных возможностей . Каждое нажатие клавиши приводит к предсказанию , а не к многократному повторению одной и той же группы «букв», которую она представляет, в одном и том же неизменном порядке. Интеллектуальный текст может позволить ввести целое слово одним нажатием клавиши. Функция интеллектуального ввода текста позволяет эффективно использовать меньшее количество клавиш устройства для ввода текста в текстовое сообщение , электронное письмо , адресную книгу , календарь и т.п.

Наиболее широко используемые общие системы интеллектуального ввода текста — это T9 , iTap , eZiText и LetterWise /WordWise. Существует множество способов создания устройства, предсказывающего текст, но все системы предиктивного ввода текста имеют начальные лингвистические настройки, которые предлагают прогнозы, приоритеты которых перераспределяются для адаптации к каждому пользователю. Это обучение адаптируется посредством памяти устройства к устраняющей неоднозначность обратной связи пользователя , что приводит к корректирующим нажатиям клавиш, например, к нажатию клавиши «Далее», чтобы перейти к цели. Большинство систем интеллектуального ввода текста имеют базу данных пользователей, облегчающую этот процесс.

Теоретически количество нажатий клавиш, необходимое для одного нужного символа в готовом письме, в среднем сравнимо с использованием клавиатуры . Это примерно верно при условии, что все используемые слова находятся в его базе данных, пунктуация игнорируется и не допускаются ошибки при вводе или написании. ^[1] Теоретическое количество нажатий клавиш на символ, KSPC, для клавиатуры составляет KSPC=1,00, а для многократного нажатия — KSPC=2,03. LetterWise от Eatoni — это интеллектуальный гибрид с несколькими касаниями, который при работе со стандартной телефонной клавиатурой достигает KSPC = 1,15 для английского языка.

Выбор того, какую систему интеллектуального ввода текста лучше всего использовать, включает в себя соответствие предпочтительному стилю интерфейса пользователя , уровню его навыков работы с программным обеспечением для интеллектуального ввода текста и цели пользователя по эффективности. Существуют различные уровни риска в системах интеллектуального ввода текста по сравнению с системами с несколькими касаниями , поскольку автоматически записываемый прогнозируемый текст, обеспечивающий преимущество в скорости и механической эффективности, может, если пользователь не будет внимательно просматривать его, привести к передаче дезинформации. Системы предиктивного ввода текста требуют времени, чтобы научиться правильно их использовать, и поэтому, как правило, система устройства имеет пользовательские возможности, позволяющие настроить выбор нескольких касаний или любой из нескольких школ методов предиктивного ввода текста.

Фон

Служба коротких сообщений (SMS) позволяет пользователю мобильного телефона отправлять текстовые сообщения (также называемые сообщениями, SMS-сообщениями, текстовыми сообщениями и текстовыми сообщениями) в виде коротких сообщений. Самая распространенная система ввода текста SMS называется « мультитап ». При использовании многократного нажатия клавиша нажимается несколько раз, чтобы получить доступ к списку букв на этой клавише. Например, нажатие клавиши «2» один раз отображает «а», дважды — «b» и три раза — «c». Чтобы ввести две последовательные буквы, находящиеся на одной и той же клавише, пользователь должен либо сделать паузу, либо нажать кнопку «Далее». Пользователь может печатать, нажимая буквенно-цифровую клавиатуру, не глядя на дисплей электронного оборудования. Таким образом, мультитап легко понять и его можно использовать без какой-либо визуальной обратной связи. Однако многократное нажатие не очень эффективно: для ввода одной буквы потенциально требуется много нажатий клавиш.

При идеальном интеллектуальном вводе текста все используемые слова находятся в словаре, пунктуация игнорируется, орфографические и печатные ошибки не допускаются. Идеальный словарь должен включать весь сленг, имена собственные , сокращения , URL-адреса , слова на иностранных языках и другие уникальные для пользователя слова. Это идеальное обстоятельство дает программному обеспечению для интеллектуального ввода текста сокращение количества нажатий клавиш, необходимых пользователю для ввода слова. Пользователь нажимает число, соответствующее каждой букве, и, пока слово существует в словаре предиктивного текста или правильно расшифровывается не-словарными системами, оно появляется. Например, нажатие «4663» обычно будет интерпретироваться как слово « хорошо» при условии, что в настоящее время используется лингвистическая база данных на английском языке, хотя такие альтернативы, как « дом» , «капюшон» и «копыта», также являются допустимыми интерпретациями последовательности нажатий клавиш.

Наиболее широко используемые системы интеллектуального ввода текста — это T9 компании Tegic, iTap компании Motorola и системы LetterWise и WordWise компании Eatoni Ergonomics . T9 и iTap используют словари, но продукты Eatoni Ergonomics используют процесс устранения неоднозначности — набор статистических правил для воссоздания слов из последовательностей нажатий клавиш. Всем системам интеллектуального ввода текста требуется лингвистическая база данных для каждого поддерживаемого языка ввода.

Словарные и несловарные системы

Традиционное устранение неоднозначности работает путем обращения к словарю часто используемых слов, хотя Eatoni предлагает систему устранения неоднозначности без словаря.

В системах на основе словаря, когда пользователь нажимает цифровые кнопки, алгоритм ищет в словаре список возможных слов, соответствующих комбинации клавиш, и предлагает наиболее вероятный выбор. Затем пользователь может подтвердить выбор и двигаться дальше или использовать клавишу для переключения возможных комбинаций.

Несловарная система строит слова и другие последовательности букв на основе статистики частей слова. Чтобы попытаться предсказать предполагаемый результат еще не введенных нажатий клавиш, устранение неоднозначности можно объединить со средством завершения слов .

Любая система (устранение неоднозначности или прогнозирующая) может включать в себя базу данных пользователей, которую можно далее классифицировать как «обучающуюся» систему, когда слова или фразы вводятся в базу данных пользователей без прямого вмешательства пользователя. База данных пользователей предназначена для хранения слов или фраз, которые не могут быть четко определены предварительно предоставленной базой данных. Некоторые системы устранения неоднозначности также пытаются исправить орфографию, форматировать текст или выполнить другие автоматические перезаписи, что приводит к риску либо улучшить, либо свести на нет усилия пользователя по вводу текста.

История

Технология интеллектуального ввода текста и автозаполнения была изобретена китайскими учеными и лингвистами в 1950-х годах для решения проблемы неэффективности ввода китайской пишущей машинки , ^[2] поскольку процесс набора текста включал поиск и выбор тысяч логотипографических символов на подносе, ^{[3] ]} резко замедляет скорость обработки текста. ^[4]^[5]

Активирующие клавиши китайской пишущей машинки, созданной Линь Ютаном в 1940-х годах, включали предложения для символов, следующих за выбранным. В 1951 году китайский наборщик Чжан Цзиин расположил китайские иероглифы в ассоциативные группы, что стало предшественником современного интеллектуального ввода текста, и этим побил рекорды скорости. ^[6] Предиктивный ввод текста с клавиатуры телефона известен как минимум с 1970-х годов (Смит и Гудвин, 1971). Интеллектуальный текст в основном использовался для поиска имен в каталогах по телефону, пока текстовые сообщения с мобильных телефонов не получили широкого распространения.

Пример

Стандартная клавиатура ITU-T E.161, используемая для обмена текстовыми сообщениями.

На обычной телефонной клавиатуре, если пользователи хотят ввести код в системе ввода с несколькими касаниями, им необходимо будет:

Нажмите 8 (tuv) один раз, чтобы выбрать t .
Дважды нажмите 4 (ghi) , чтобы выбрать h .
Нажмите 3 (def) дважды, чтобы выбрать e .

Между тем в телефоне с интеллектуальным вводом текста им нужно всего лишь:

Нажмите 8 один раз, чтобы выбрать группу (tuv) для первого символа.
Нажмите 4 один раз, чтобы выбрать группу (ghi) для второго символа.
Нажмите 3 один раз, чтобы выбрать группу (def) для третьего символа.

Система обновляет дисплей при каждом нажатии клавиши, чтобы показать наиболее вероятный ввод. В этом примере прогнозирование уменьшило количество нажатий кнопок с пяти до трех. Эффект еще сильнее при использовании более длинных слов и слов, состоящих из букв, расположенных позже в последовательности каждой клавиши.

Система прогнозирования на основе словаря основана на надежде, что нужное слово есть в словаре. Эта надежда может оказаться неуместной, если слово каким-либо образом отличается от общепринятого употребления, в частности, если слово написано или напечатано неправильно, является сленгом или является существительным собственным . В этих случаях для ввода слова необходимо использовать какой-то другой механизм. Более того, простой словарный подход не работает с агглютинативными языками , где одно слово не обязательно представляет собой одну семантическую единицу.

Компании и продукты

Функция интеллектуального ввода текста разрабатывается и продается во множестве конкурирующих продуктов, таких как T9 компании Nuance Communications . Другие продукты включают iTap от Motorola ; LetterWise от Eatoni Ergonomic (предсказание на основе символов, а не слов); WordWise (предсказание на основе слов без словаря); EQ3 ( раскладка QWERTY , совместимая с обычными телефонными клавиатурами); Phraze-It от Preвалентных устройств; TenGO от Xrgomics (система клавиатуры QWERTY с шестью клавишами); Adaptxt (учитывает язык, контекст, грамматику и семантику); Lightkey (программа интеллектуального набора текста для Windows); Clevertexting (статистическая природа языка, отсутствие словаря, динамическое распределение ключей); и тип Оизеа (временная неоднозначность); Tauto компании Intelab; интеллектуальная платформа ввода WordLogic™ (запатентованное расширенное прогнозирование текста на основе слоев, включает многоязычный словарь, проверку орфографии, встроенный веб-поиск); Gboard от Google .

Текстонимы

Слова, созданные с помощью одной и той же комбинации нажатий клавиш, были названы «текстонимами»; ^[7] также «текстонимы»; ^[8] или «T9onyms» (произносится как «tynonyms» / ˈ t aɪ n ə n ɪ m z /^[7] ), хотя они не являются специфичными для T9. Выбор неправильного текстонима может произойти без орфографических ошибок или опечаток, если неправильный текстоним выбран по умолчанию или по ошибке пользователя. Как упоминалось выше, последовательность клавиш 4663 на телефонной клавиатуре, снабженной лингвистической базой данных на английском языке, обычно будет трактоваться как слово « хорошо» . Однако та же последовательность клавиш соответствует и другим словам, таким как home , goh , hoof , hood и так далее. Например: «Ты дома?» можно было бы перевести как «Ты в порядке?» если пользователь пренебрегает изменением слова 4663 по умолчанию. Это может привести к недопониманию; например, последовательность 735328 может соответствовать либо select , либо его антониму ignore . Драка 2010 года, приведшая к непредумышленному убийству , была спровоцирована ошибкой в текстовом названии. ^[9] Прогнозируемый текст, выбирающий значение по умолчанию, отличное от того, которое ожидает пользователь, имеет сходство с эффектом Купертино , при котором программное обеспечение для проверки правописания изменяет написание непредусмотренного слова.

Текстонимы использовались как сленг миллениалов ; например, использование слова book для обозначения «круто» , поскольку «book» было значением по умолчанию в системах интеллектуального ввода текста, которые предполагали, что это слово встречается чаще, чем «cool» . ^[10] Это связано с какографией .

Ошибка определения неоднозначности и орфографическая ошибка

Текстонимы — не единственная проблема, ограничивающая эффективность реализации интеллектуального текста. Еще одна серьезная проблема — это слова, для которых устранение неоднозначности дает один неправильный ответ. Система может, например, ответить Блэрфом при вводе 252473, когда предполагаемым словом было Блейз или Клэр , оба из которых соответствуют последовательности нажатий клавиш, но в этом примере не найдены системой интеллектуального ввода текста. Когда возникают опечатки или орфографические ошибки, они вряд ли будут правильно распознаны системой устранения неоднозначности, хотя механизмы исправления ошибок могут смягчить этот эффект.

Смотрите также

Концепции

дальнейшее чтение

Смит, Сидни Л.; Гудвин, Нэнси К. (1971). «Ввод данных в алфавитном порядке с помощью сенсорной панели: комментарий». Человеческие факторы . 13 (2): 189–190. дои : 10.1177/001872087101300212. S2CID 61164630.

Внешние ссылки

Викискладе есть медиафайлы, связанные с предсказательными текстами .

Статья New Scientist о текстонимах
Статья в австралийской газете о текстонимах ^{[ постоянная мертвая ссылка ]}
Технические примечания по iTap (включая списки текстонимов)