stringtranslate.com

Википедия:Таблица распознавания языков

  • ВП:ЛРК

В этой таблице распознавания языка представлены различные подсказки, которые можно использовать для определения языка, на котором написан текст.

Персонажи

Язык иностранного текста часто можно определить, найдя символы, характерные для этого языка.

Латинский алфавит (возможно расширенный)

Романские языки

Множество латинских корней.

Французский(на французском)

испанский(на испанском)

итальянский(итальянский)

каталонский(Катала)

румынский(Română)

португальский(на португальском)

валлонский(Уэлон)

галисийский(Галего)

германские языки

Английский

Голландский(Нидерланды)

западно-фризский(Фриск)

африкаанс(Африкаанс)

немецкий(немецкий)

шведский(Шведский)

датский(датский)

норвежский(Норвежский)

исландский(Исленская)

фарерский(Фёройскт)

балтийские языки

латышский(латышский)

литовский(Литва)

славянские языки

польский(Польский)

чешский(Чештина)

словацкий(Словения)

хорватский(Хрватски)

сербский(Srpski/Сербский)

сербская латынь
сербская кириллица

кельтские языки

валлийский(Кимраег)

ирландский(Гэльский)

шотландский гэльский(Gàidhlig)

албанский(Шкип)

мальтийский(Мальти)

иранские языки

курдский(Курдский / كوردی)

Финно-угорские языки

финский(Суоми)

эстонский(Эстония)

венгерский(Мадьяр)

Эскимосско-алеутские языки

гренландский(Калааллисут)

Южные атабаскские языки

В дополнение к вышесказанному,

(Мескалеро / Чирикауа) (Машгален / Чидикааго)

В дополнение к вышесказанному,

Гуарани

японскийвРомадзи(Нихонго/日本語)

(Примечание: ромадзи нечасто используется в японской письменности. Чаще всего его используют иностранцы, изучающие произношение японского языка.)

Хмонг(Hmoob) написано наРоманизированный популярный алфавит

вьетнамский(тиенг вьет)

Вьетнамский Цитируемый-Читаемый (ВИКР)

вьетнамскийВНИкодирование

вьетнамскийТелекс

Китайский, романизированный

Стандартный мандарин(現代標準漢語)

Пиньинь
Уэйд–Джайлс
Гвойеу Роматзих

Южный Мин / Мин-Нань(Бан-лам-ги/Бан-лам-гу) вПэ̍х-ё-джи

австронезийские языки

малайский(бахаса малайский) ииндонезийский(на индонезийском языке)

Может содержать следующее:
Префиксы: me-, mem-, memper-, pe-, per-, di-, ke-
Суффиксы: -kan, -an, -i
Другие (почти всегда пишутся строчными буквами): yang, dan , ди, ке, олег, иту

Малайский и индонезийский языки взаимно понятны для опытных носителей, хотя устные и письменные переводчики обычно являются специалистами в одном или другом языке. См. Сравнение стандартного малайского и индонезийского языков .

Частое использование буквы «а» (сравнимо с частотой английской «е»).

полинезийские языки

Большинство полинезийских языков используют AEFGHIKLMNOPRSTUV и ʻ (иногда пишется ' или Q)

тонганский(леа факатонга)
самоанский(гагана самоа)
уоллисский(леа факаувеа)
Восточный Футунан(леа факафутуна)

тюркские языки

Обратите внимание, что некоторые тюркские языки, такие как азербайджанский и туркменский, используют похожий латинский алфавит (часто Jaŋalif ) и похожие слова, и их можно спутать с турецким. В азербайджанском языке есть буквы Əə, Xx и Qq, которых нет в турецком алфавите, а в туркменском — Ää, Žž, Ňň, Ýý и Ww. Латинские символы, используемые уникально (или почти уникально) для тюркских языков: Əə, Ŋŋ, Ɵɵ, Ьь, Ƣƣ, Ğğ, İ и ı. Все тюркские языки могут образовывать длинные слова путем добавления нескольких суффиксов.

турецкий(Türkçe/Türkiye_Türkçesi)

Турецкий алфавит

Строчные буквы: abc ç defg ğ h ı ijklmno ö prs ş tu ü vyz

Прописные буквы: ABC Ç DEFG Ğ HI İ JKLMNO Ö PRS Ş TU Ü VYZ.

Общие слова
Разное

азербайджанский(Азербайджан)

Азербайджанский язык легко узнать по частому использованию ə . Эта буква не используется ни в одном другом официально признанном современном латинском алфавите. Кроме того, в нем используются буквы x и q , которые не используются в турецком языке.

китайский(中文)

Упрощенный китайский(简体) противТрадиционный китайский(繁體)

Примечание: Многие символы не были упрощены. В результате, обычно короткое слово или фраза идентичны в упрощенном и традиционном вариантах, но редко бывает, чтобы целое предложение было идентичным.

Общие радикалы, отличающиеся в традиционном и упрощенном вариантах:

Общие символы, отличающиеся в традиционном и упрощенном письме:

Стандартный письменный китайский (на основе мандаринского диалекта) против письменного народного кантонского диалекта

Примечание: Помимо Гонконга, носители кантонского языка также проживают на юге материкового Китая, в Малайзии и Сингапуре [1] , поэтому письменный кантонский диалект может быть записан как упрощенными, так и традиционными иероглифами.


Распространенные символы в разговорном кантонском диалекте, которые не встречаются или встречаются редко в мандаринском наречии:

Некоторые из вышеперечисленных символов поддерживаются не во всех кодировках, поэтому иногда радикал 口 слева заменяется на 0 или o , например


Иногда для выражения одного и того же значения в кантонском и мандаринском диалектах используются разные китайские иероглифы. Если вы используете тот, который обычно используется в кантонском диалекте, для выражения одного и того же значения, когда вы говорите или пишете на мандаринском диалекте, носитель языка может запутаться или даже посчитать его сложным для понимания, и наоборот. Вот несколько примеров: (кантонский диалект против мандаринского диалекта)


Есть китайские слова, используемые для построения словарей, используемых в кантонском диалекте, которые не используются или редко используются в современном мандаринском диалекте. Вот несколько примеров: (кантонский диалект против мандаринского диалекта)


Кантонские словари, созданные на основе кантонских слов, используются в повседневной жизни на юге Китая и не используются в современном мандаринском наречии. Вот несколько примеров:


Наконец, когда термины из других стран (особенно США и Великобритании) вводятся в Китай, кантонский и мандаринский часто получают разные переводы, где кантонский часто переводится в соответствии с произношением терминов на английском языке, а мандаринский часто переводится в соответствии со значением терминов. Вот несколько примеров: (кантонский против мандаринского)

японский(日本語)

корейский(한국어/조선말)

кхмерский языкភាសារខ្មែរ

Кхмерский язык пишется с использованием своеобразного кхмерского алфавита .

греческий(Элленика)

Современный греческий язык пишется греческим алфавитом в монотонном , политонном или атонном , либо в соответствии с демотической ( г-н Триантафилидис ) грамматикой или грамматикой Катаревуса . Некоторые люди пишут на греческом (греческий с латинским письмом), который либо визуально основан, орфографически или фонетически , либо просто перепутан (смешан). Единственными официальными орфографическими формами греческого языка являются монотонный и политонический.

Нормальный современный греческий (монотонный греческий)

Греческий до 1980-х годов (греческий политонический)

Катаревуса , Димотики ( грамматика Триантафилидиса )

Древнегреческий

греческий атонический

Греческий вгреческий

Орфографический греческий

Фонетический греческий

Визуально-ориентированный греческий

Перепутанный (смешанный) греческий

армянский(Հայերեն)

Армянский язык можно узнать по уникальному алфавиту из 39 букв:

Ա Բ Գ Դ Ե Զ Է Ը Թ Ժ Ի Լ Խ Ծ Կ Հ Ձ Ղ Ճ Մ Յ Ն Շ Ո Չ Պ Ջ Ռ ԍ Վ Տ Ր Ց Ւ Փ Ք ԵՎ(և) Предыдущий Предыдущий

грузинский(на английском)

Грузинский язык можно узнать по его уникальному алфавиту (обратите внимание, что некоторые символы вышли из употребления).

ა ბ გ დ ე ვ ზ ჱ თ ი კ ლ მ ნ ჲ ო პ ჟ რ ს ტ ჳ უ ფ ქ ღ ყ შ ჩ ც ძ წ ჭ ხ ჴ ჯ ჰ ჵ ჶ ჷ ჸ

кириллица

Жирным шрифтом выделены буквы, уникальные для данного языка.

славянские языки

Белорусский(belarusskaya)

болгарский(болгарский)

македонский(македонский)

Русский(русский)

сербский(сербский)

украинский(украинский)

монгольский

черногорский

осетинский

арабский алфавит

арабский(العربية)

персидский(Фарс)

За исключением очень редких случаев, глаголы находятся в конце фразы.

урду(Арду)

Сирийский алфавит

сирийский(ܐܬܘܪܝܐ)

Дравидийские языки

каннада

тамильский

அ ஆ இ ஈ உ ஊ எ ஏ ஐ ஒ ஓ ஔ க ங ச ஞ ட ண த ந ப ம ய ர ல வ ழ ள ற ன

телугу

Телугу имеет 56 символов (Aksharamulu), включая гласные (Achchulu) и согласные (Hallulu). Телугу использует восемнадцать гласных, каждый из которых имеет как независимую форму, так и диакритическую форму, используемую с согласными для создания слогов. В языке различают краткие и долгие гласные.

అ ఆ ఇ ఈ ఉ ఊ ఋ ౠ ఌ ౡ ఎ ఏ ఐ ఒ ఓ ఔ అం అః క ఖ గ ఘ ఙ చ ఛ జ ఝ ఞ ట ఠ డ ఢ ణ త థ ద ధ న ప ఫ బ భ మ య ర ఱ ల ళ వ శ ష స హ

౦ ౧ ౨ ౩ ౪ ౫ ౬ ౭ ౮ ౯

бенгальский

Бенгальский алфавит или бангла (бенгали: বাংলা বর্ণমালা, bangla bôrnômala) или бенгальское письмо (бенгали: বাংলা লিপি, bangla lipi) — это система письма, возникшая на индийском субконтиненте для бенгальского языка и являющаяся пятой по распространённости системой письма в мире. Письмо используется для других языков, таких как ассамский, майтхили, мейтей и бишнуприя-манипури, и исторически использовалось для записи санскрита в Бенгалии.

бенгальский

В бенгали уникальный алфавит из 50 букв.

অ আ ই ঈ উ ঊ ঋ এ ঐ ও ঔ

ক খ গ ঘ ঙ চ ছ জ ঝ ঞ ট ঠ ড ঢ ণ ত থ দ ধ ন প ফ ব ভ ম য র ল শ ষ স হ ড় ঢ় য় ৎ ঃ ং ঁ

া ি ী ু ূ ৃ ে ৈ ো ৌ

ассамский

অ আ ই ঈ উ ঊ ঋ এ ঐ ও ঔ

ক খ গ ঘ ঙ চ ছ জ ঝ ঞ ট ঠ ড ঢ ণ ত থ দ ধ ন প ফ ব ভ ম য ৰ ল শ ষ স হ ড় ঢ় য় ৎ ঃ ং ঁ

া ি ী ু ূ ৃ ে ৈ ো ৌ

Слоговое письмо канадских аборигенов

В современной письменности канадские аборигенные слоговые знаки характерны для языков кри , инуктитут или оджибве , хотя последние два также пишутся альтернативными шрифтами. Основной набор знаков — ᐁ ᐱ ᑌ ᑫ ᒉ ᒣ ᓀ ᓭ ᔦ, каждый из которых может появляться в любой из четырех ориентаций, жирным шрифтом, надстрочным шрифтом и с диакритическими знаками, включая ᑊ ᐟ ᐠ ᐨ ᒼ ᐣ ᐢ ᐧ ᐤ ᐦ ᕽ ᓫ ᕑ. Эта абугида также использовалась для племени черноногих .

Другие североамериканские слоговые азбуки

Чероки

Письменность чероки отличается уникальным слоговым письмом, состоящим из следующих символов:

ᎡᎢᎣᎤᎥᎦᎧᎨᎩᎪᎫᎬᎭᎮᎯᎰᎱᎲᎳᎴᎵ ᎶᎷᎸᎹᎺᎻᎼᎽᎾᎿᏀᏁᏂᏃᏄᏅᏆᏇᏈᏉᏊ ᏋᏌᏍᏎᏏᏐᏑᏒᏓᏔᏕᏖᏗᏘᏙᏚᏛᏜᏝᏞᏟ ᏠᏡᏢᏣᏤᏥᏦᏧᏨᏩᏪᏫᏬᏭᏮᏯᏰᏱᏲᏳᏴ.

Искусственные языки

эсперанто(Эсперанто)

Клингонский(tlhИнган Хол)

Ложбан(ложбан.)

Токи Пона(токи пона)

Полный алфавит: п, т, к, с, м, н, л, й, ш, а, е, и, о, у

Внешние ссылки

  1. ^ https://www.oakton.edu/user/4/billtong/chinaclass/Language/cantonese.htm