stringtranslate.com

Метод ввода пиньинь

Скриншот Smart Pinyin от SCIM
Набор текста с использованием IBus и SunPinyin

Метод пиньинь ( упрощенный китайский :拼音输入法; традиционный китайский :拼音輸入法; пиньинь : пиньинь сюру фу ) относится к семейству методов ввода, основанных на методе латинизации пиньинь .

В самой базовой форме метод пиньинь позволяет пользователю вводить китайские иероглифы , вводя пиньинь китайского иероглифа, а затем предоставляя пользователю список возможных символов с этим произношением . Однако существует ряд немного отличающихся таких систем, и современные методы пиньинь предоставляют ряд удобных функций.

Преимущества и недостатки

Очевидное преимущество методов ввода на основе пиньинь — простота обучения для носителей стандартного китайского языка. Те, кто знаком с пиньинь и может распознавать полученные символы, смогут вводить их практически без обучения по сравнению с другими методами ввода. [1] Это не требует от пользователя умения создавать символы с нуля, как это делается в письменном китайском языке . Поскольку все дети в материковом Китае обязаны изучать пиньинь в школе , пиньинь является одним из самых популярных методов ввода там. [2]

Для людей, которые не говорят на стандартном китайском языке, основное преимущество пиньинь становится недостатком, так как им нужно будет выучить стандартное китайское произношение иероглифов, прежде чем они смогут использовать этот метод ввода. [3] Кроме того, поскольку пиньинь и другие методы ввода, основанные на произношении, не полагаются на письменное формирование иероглифа для ввода (как методы ввода, основанные на штрихах, такие как Цанцзе ), они могут привести к истощению языка и потере навыков у взрослых, а также могут стать барьером для обучения письменному китайскому языку у детей. [4]

Элементы и особенности

Методы ввода пиньинь различаются по ряду возможных аспектов. Большинство методов ввода пиньинь предоставляют удобные функции для ускорения ввода. Некоторые из этих функций могут значительно ускорить набор текста.

Длина преобразования

Метод ввода длины преобразования представляет собой буфер, в котором хранится пользовательский ввод до тех пор, пока он не будет преобразован в символы, которые в противном случае были бы недоступны с клавиатуры.

В самых простых системах за раз преобразуется один символ. Это делает процесс ввода очень трудоемким. Пользователю не только приходится выбирать символы по одному, но и система ввода не может расставлять приоритеты при выборе символов с использованием словосочетаний, грамматической структуры или контекста. Кроме того, поскольку метод ввода поддерживает только один символ за раз, он, вероятно, потребует от пользователя набрать полное написание пиньинь, чтобы сузить выбор. Эта система все еще существует во встроенных приложениях, таких как мобильные телефоны.

Распространенные реализации пиньинь на компьютере сегодня могут поддерживать предложение в пиньинь, прежде чем потребуется преобразование. Метод пытается угадать соответствующие символы, используя словосочетания из словаря, грамматическую структуру и контекст.

Обработка тонов

Китайский язык — тональный . Тоны могут использоваться для дальнейшего различения символов с одинаковым звучанием. Многие из ранних реализаций метода пиньинь с одним символом требовали ввода тонов для сужения выбора символов.

Для удобства выбор тона по умолчанию отключен в большинстве современных систем пиньинь на компьютере. Пользователь может иметь возможность включить его в зависимости от реализации пиньинь.

Обработка расширенных латинских символов (ü и ê)

За исключением интонации, в пиньинь есть две расширенных латинских гласных. Это ü (U-умляут) и ê (E-циркумфлекс). Учитывая, что американская раскладка клавиатуры является наиболее распространенной в Китае, любая реализация метода пиньинь должна быть способна облегчить ввод этих гласных на американской клавиатуре.

Поскольку буква "v" не используется в китайском пиньине, она повсеместно используется как псевдоним для ü. Например, ввод "nv" в метод ввода выведет список кандидатов для пиньина : .

Обработка ê не столь универсальна, поскольку символ 欸 является единственным общеупотребительным символом с таким произношением. Это междометие, примерно эквивалентное « Eh » в английском языке. Некоторые редакторы метода ввода, такие как Google Pinyin, объединяют его в «e», в то время как другие создают для него дополнительную комбинацию букв, например «ea» или «eh», или «ei» в iOS. Другие просто опускают этот звук.

Лечение hm, hng, ng, n

Символ 嗯 (ng) можно (или нужно [5] ) написать с помощью IBUS GNU/Linux и метода ввода Microsoft, набрав «en».

Статистика использования и пользовательские словари

Большинство современных реализаций метода ввода будут корректировать позиции кандидатов слов в списке кандидатов на основе статистики предыдущего использования. Кроме того, метод ввода также будет поддерживать определяемые пользователем фразы через пользовательский словарь.

Аббревиатура

Сокращение — это функция, которая позволяет пользователю опускать все, кроме первой или первых нескольких букв в написании пиньинь. Эта функция может значительно ускорить ввод длинных словосочетаний. С помощью этой функции пользователь может ввести слово «концерт» ( упрощенный китайский :音乐会; традиционный китайский :音樂會; пиньинь : yīnyuèhuì ), набрав «yyh» вместо «yinyuehui».

В системах, поддерживающих определяемые пользователем фразы, пользователи могут даже определять свои собственные сокращения, которые могут не соответствовать стандартным правилам пиньинь.

Нечеткий пиньинь

Пиньинь был создан на основе произношения стандартного китайского языка , разновидности мандаринского китайского языка . Региональные акценты распространены в мандаринском языке как среди носителей языка, так и среди неносителей. Это означает, что значительное число носителей мандаринского языка будут испытывать трудности с различением ряда похожих по звучанию слогов пиньинь, таких как c и ch , s и sh , z и zh , n и ng , h или hu и f , или n и l . Нечеткий пиньинь или нечеткий ввод (模糊音) — это функция, которая позволяет пользователю вводить похожие по звучанию гласные или согласные, как если бы они были одним и тем же. У нее также есть недостатки, поскольку пользователь должен выбирать правильные символы или слова из более длинного списка «омофонов».

Предсказание слова

Предсказание слов ( упрощенный китайский :联想; традиционный китайский :聯想; пиньинь : liánxiǎng ; букв. «ассоциация») — это функция метода ввода, которая пытается угадать следующую серию символов, которую пользователь пытается ввести. Эта функция часто используется для обозначения двух различных механизмов, имеющих схожие функции.

Один из этих механизмов похож на функцию автозаполнения для пользовательского ввода. Пока пользователь печатает соответствующий пиньинь, метод ввода будет принимать ввод и искать все возможные словосочетания, которые могут соответствовать пользовательскому вводу, даже если ввод неполный. Например, когда пользователь вводит «shang», метод ввода покажет «上海» (Шанхай) как слово-кандидат в рамках этой функции.

Второй возможный механизм — это прогнозирование следующего ввода пользователя после того, как пользователь завершит ввод набора слов. Например, в приведенном выше примере после того, как пользователь выберет "上海" (Шанхай) из списка кандидатов, буфер пиньинь метода ввода будет пуст. При использовании этого механизма метод ввода отобразит список слов, которые часто следуют за словом Шанхай, например "人" (люди), "市" (город), "的" (вспомогательное слово).

Двойной пиньинь

Схема двойного пиньина по умолчанию в Microsoft Pinyin IME . Многие IME, включая ibus-pinyin, поддерживают эту схему.

Группы гласных в пиньинь могут быть длиной до четырех букв. Двойной пиньинь (双拼) — это метод, при котором более длинные группы гласных назначаются согласным клавишам в качестве сочетаний клавиш, а zh, ch, sh назначаются гласным клавишам в качестве сочетаний клавиш. Таким образом, когда метод ввода ожидает гласную, пользователь может использовать сочетания клавиш для ускорения набора текста.

Например, в Microsoft Pinyin IME , если пользователь хочет ввести в компьютер «中华人民共和国 (zhōnghuárénmíngònghéguó)», «Китайская Народная Республика», ему нужно ввести «zhonghuarenmingongheguo» в Full Pinyin. Однако в Double Pinyin нужно ввести только «vshwrfmngshego» (v=zh, s=ong, h=h, w=ua, r=r, f=en, m=m, n=in, g=g, s=ong, h=h, e=e, g=g, o=uo). Однако в системе, использующей сокращения, того же результата можно добиться, просто введя «zhrmghg».

Исправление опечатки

Подобно автоматическому исправлению опечаток для английского языка в текстовых процессорах , реализации метода пиньинь могут распознавать возможные опечатки и показывать соответствующие кандидаты слов. Используя Google Pinyin в качестве примера, при обнаружении предполагаемой опечатки Google Pinyin покажет как кандидаты слов, предполагая, что они верны, так и кандидаты слов, предполагая, что это опечатка.

Смешение языков

Большинство современных реализаций метода пиньинь позволяют смешивать английский язык с потоком ввода, не требуя от пользователя изменения языкового режима. Однако часто это сопряжено с некоторыми ограничениями, такими как требование ввода в верхнем регистре.

Следующие примеры показывают разницу, если пользователь хочет ввести «这个SQL漏洞可以瘫痪整个系统。» (эта уязвимость SQL может парализовать всю систему):

Реализации

Ниже приведены наиболее популярные редакторы метода пиньинь, используемые в материковом Китае . Их можно бесплатно загрузить с их официальных сайтов.

Кроссплатформенность

Окна

Линукс/Юникс

macOS

Веб

Смотрите также

Ссылки

  1. ^ "О вводе пиньинь (и других методах): основы и предпосылки китайского набора текста :: Pinyin Joe". www.pinyinjoe.com . Получено 31.03.2020 .
  2. ^ Cheuk, Джастин (2016-12-09). «Как печатать на китайском? Введение в китайские методы ввода». Джастин Чеук: Когда Гонконг встречается с Великобританией . Получено 31.03.2020 .
  3. ^ "Плюсы и минусы изучения китайского языка с помощью пиньинь". Письменный китайский . 2014-04-18 . Получено 2020-03-31 .
  4. Ли, Дженнифер (01.02.2001). «Где компьютер сильнее пера». New York Times . Получено 29.07.2008 .
  5. Ссылки ​Архивировано из оригинала 8 декабря 2015 г. Проверено 4 декабря 2015 г.
  6. ^ Домашняя страница librime, пакет librime Debian

Внешние ссылки