В этой таблице распознавания языка представлены различные подсказки, которые можно использовать для определения языка, на котором написан текст.
Персонажи
Язык иностранного текста часто можно определить, найдя символы, характерные для этого языка.
- ABCDEFGHIJKLMNOPQRSTUVWXYZ ( латинский алфавит )
- и никакой другой – английский , индонезийский , латынь , малайский , суахили , зулу
- àäèéëïijöü – голландский (За исключением лигатуры ij, эти буквы очень редки в голландском языке. Даже довольно длинные голландские тексты часто не имеют диакритических знаков .)
- африкаанс
- êôúû – западнофризский
- ÆØÅæøå – датский , норвежский
- отдельные диакритические знаки , в основном умлауты
- ÄÖäö – финский (BCDFGQWXZÅbcfgqwxzå встречаются только в именах и заимствованных словах, иногда также ŠšŽž)
- ÅÄÖåäö – шведский (иногда é)
- ÄÖÕÜäöõü – эстонский (BCDFGQWXYZcfqwxyz встречаются только в именах и заимствованных словах, иногда также ŠšŽž)
- ÄÖÜẞäöüß – немецкий
- Циркумфлексы
- Три или более типов диакритических знаков
- ÇĞİÖŞÜçğıöşü – турецкий
- ÁÐÉÍÓÚÝÞÆÖáðéíóúýþæö – исландский
- ÁÐÍÓÚÝÆØáðíóúýæø – фарерский
- ÁÉÍÓÖŐÚÜŰáéíóöőúüű – венгерский
- ÀÇÉÈÍÓÒÚÜÏàçéèíóòúüï· – каталанский
- ÀВЖЗІЇЉЈКЛОПФФІВЙЫЛМŸàавжзіклопфѴœщыя – французский ; (Ÿ и ÿ встречаются только в некоторых именах собственных)
- ÁÀÇÉÈÍÓÒÚËÜÏáàçéèíóòúëüï (· только на гасконском диалекте) – окситанский
- ÁÉÍÓÚÂÊÔÀãõçáéíóúвâêôà (ü бразильский и k, w и y отсутствуют в родных словах) – португальский
- ÁÉÍÑÓÜáéíñóúü ¡¿ – испанский
- ÀÉÈÌÒÙàéèìòù – итальянский
- ÁÉÍÓÚÝÃẼĨÕŨỸÑG̃áéíóúýãẽĩõũỹñg̃ - гуарани (единственный язык, в котором используется g̃)
- ÁĄĄ́ÉĘĘ́ÍĮĮ́ŁŃ áąą́éęę́íįį́łń (FQRVfqrv отсутствует в родных словах) – южные атабаскские языки
- ąłńóż Лехитские языки
- A, Ą, Ã, B, C, D, E, É, Ë, F, G, H, I, J, K, L, Ł, M, N, Ń, O, Ò, Ó, Ô, P, R, S, T, U, Ù, W, Y, Z, Ż – кашубский
- ЧШЖ
- ĐÀẢÃÁẠĂẰẲẴẮẶÂẦẨẪẤẬÈẺẼÉẸÊỀỂỄẾỆÌỈĨÍ ỊÒỎÕÓỌÔỒỔỖỐỘƠỜỞỠỚỢÙỦŨÚỤƯỪỬỮỨỰỲỶỸÝỴ đàảãáạăằẳẵắặâầẩẫấậèẻẽéẹêềểễếệìỉĩ íịòỏõóọồổỗốơờởỡớợùủũúụưừửữứựỳỷỹýỵ - Вьетнамский
- ā ī ō ū - можно увидеть в некоторых японских текстах на языке ромадзи или транскрипциях (см. ниже), а также в текстах на гавайском языке и маори .
- é – Суданский
- ñ - баскский
- أ ا ب ت ث ج ح خ د ذ ر ز س ش ص ض ط ظ ع غ ف ق ك ل م ن ه ؤ و ئ ى ي ء Арабская письменность
- Брахмическая семья письменностей
- бенгальское письмо
- অ আ কা কি কী উ কু ঊ কূ ঋ কৃ এ কে ঐ কৈ ও কো ঔ কৌ ক্ কত্ কং কঃ কঁ ক খ গ ঘ ঙ চ ছ জ ঝ ঞ ট ঠ ড ঢ ণ ত থ দ ধ ন প ফ ব ভ ম য র ৰ ল ৱ শ ষ স হ য় ড় ঢ় ০ ১ ২ ৩ ৪ ৫ ৬ ৭ ৮ ৯
- используется для записи на бенгальском и ассамском языках .
- Деванагари
- अ आ इ ई उ ऊ ऋ ॠ ऌ ॡ ऍ ऎ ए ऐ ऑ ऒ ओ ओ क ख ग घ ङ च छ ज झ ञ ट ठ ड ढ ण त थ द ध न प फ ब भ म य र ल ळ व श ष स ह ० १ २ ३ ४ ५ ६ ७ ८ ९ प् पँ पं पः प़ पऽ
- использовался для письма, либо вместе с другими письменностями, либо исключительно, на нескольких индийских языках, включая санскрит , хинди , майтхили , магахи , маратхи , кашмири , синдхи , бхили , конкани , бходжпури и непальский из Непала .
- Гурмукхи
- Письмо гуджарати
- અ આ ઇ ઈ ઉ ઊ ઋ ઌ ઍ એ ઐ ઑ ઓ ઔ ક ખ ગ ઘ ઙ ચ છ જ ઝ ઞ ટ ઠ ડ ઢ ણ ત થ દ ધ ન પ ફ બ ભ મ ય ર લ ળ વ શ ષ સ હ ૠ ૡૢૣ
- использовался для записи гуджарати и каччи
- тибетская письменность
- АБВГДЕЖЗИКЛМНОПРСТУФХЦЧШ ( кириллица )
- ΑΒΓΔΕΖΗΘΙΚΛΜΝΞΟΠΡΣΤΥΦΧΨΩ αβγδεζηθικλμνξοπρσςτυφχψω ( греческий алфавит ) – греческий
- אבגדהוזחטיכלמנסעפצקרשת ( еврейский алфавит )
- и, возможно, несколько странных точек и линий над, под или внутри символов – иврит
- פֿ; точки/линии под буквами, встречающиеся только с א,י и ו – идиш
- нет точек или линий вокруг букв, и больше, чем несколько слов заканчиваются на א (т.е. они имеют ее в крайней левой позиции) – арамейский
- ладино
- 漢字文化圈 – некоторые восточноазиатские языки
- 위키백과에 (обратите внимание на обычные многоточия и круги) Корейский
- ㄅㄆㄇㄈㄉㄊㄋㄌㄍㄎㄏ и т. д. -- ㄓㄨˋㄧㄣㄈㄨˊㄏㄠˋ ( Бопомофо )
- កខគឃងចឆជឈញដឋឌឍណតថទធនបផពភមសហយរលឡអវអ្កអ្ខអ ្គអ្ឃអ្ងអ្ចអ្ឆអ្ឈអ្ញអ្ឌអ ្ឋអ្ឌអ្ឃអ្ណអ្តអ្ថអ្ទអ្ធអ្នអ្បអ្ផអ្ពអ្ភអ្ មអ្សអ្ហអ្យអ្រអ្យអ្លអ្អអ្វ អក្សរខ្មែរ ( кхмерский алфавит ) - кхмерский
- Ա Բ Գ Դ Ե Զ Է Ը Թ Ժ Ի Լ Խ Ծ Կ Հ Ձ Ղ Ճ Մ Յ Ն Շ Ո Չ Պ Ջ Ռ Ս Վ Տ Ր Ց Ւ Փ Ք Օ Ֆ ( армянский алфавит ) – Армянский алфавит
- ??? წ ჭ ხ ჴ ჯ ჰ ჵ ჶ ჷ ჸ (грузинский алфавит ) – грузинский
- Власти США เแโใไๅๆ๏ ๐๑๒๓๔๕๖๗๘๙๚๛ ( тайский сценарий ) - тайский
- AEIOUHKLMNPW' Гавайский алфавит - Гавайский
- ⴰⴱⴲⴳⴴⴵⴶⴷⴸⴹⴺⴻⴼⴽⴾⴿⵀⵁⵂⵃⵄⵅⵆⵇⵈⵉⵊⵋⵌⵍⵎⵐⵑⵒⵓⵔⵕⵖⵗⵘ ⵙⵚⵛⵜⵝⵞⵠⵡⵢⵣⵤⵥⵦⵧ Тифинаг , сценарий, используемый для Тамазайта (берберский)
Латинский алфавит (возможно расширенный)
Романские языки
Множество латинских корней.
- Ударные буквы: â ç è é ê î ô û , редко ë ï ; ù только в слове où , à только на концах нескольких слов (в том числе à ). Никогда áí ì ó ò ú .
- Угловые кавычки: « » (хотя используются также кавычки «кудрявый-Q»); диалог традиционно обозначается с помощью тире.
- Распространенные короткие слова: la , le , les , un , une , des , de , du , à , au , et , ou , où , sur , il , elle , ils , se , je , vous , que , qui , y , en , si , ne , est , sont , a , ont .
- Множество апострофированных сокращений для обычных местоимений и частиц, т. е. слов l ' или d ' , реже c ' , j ' , m ' , n ' , s ' , t ' или еще реже z ' — только перед словом, начинающимся с гласной или, в некоторых случаях, с h .
- Распространенные диграфы и триграфы:
- Диграфы гласных: au , ai , ei , ou . Последнее слово -ez .
- Гласные диграфы (носовые): an , en , in , on , редко un . Для всех этих звуков n становится m перед b , p или m (например, embouchure , никогда * enbouchure ).
- Триграфы гласных: eau , ein , ain , oin .
- Согласные диграфы: ch , gu- . Редко sh . Полусогласный -ill- .
- Буквы w и k встречаются редко и используются только в заимствованиях, чаще всего из германских языков (например, виски ).
- Лигатуры œ и æ общеприняты, но используются редко (несколько слов хорошо известны, например , œil , œuf(s) , bœuf(s) , большинство других являются научными/техническими и заимствованы из латыни).
- Слова, оканчивающиеся на -aux , -eux или -oux .
- Символы: ¿ ¡ (перевернутые вопросительный и восклицательный знаки), ñ
- Все гласные (á, é, í, ó, ú) могут иметь острый ударение.
- Буква u может иметь диэрезис (ü), но только после буквы g.
- Некоторые часто используемые слова: de, el, del, los, la(s), uno(s), una(s), y.
- Никаких апострофированных сокращений.
- Не использовать гравис
- Буквы k и w встречаются редко и используются только в заимствованных словах (например, walkman ).
- Начало слова: ll- (проверьте, не валлийский ли или каталонский) двойная L (ll)
- Окончания слов: -o, -a, -ción, -miento, -dad.
- Угловые кавычки: « » (хотя используются также кавычки «кудрявый-Q»); диалог часто обозначается с помощью тире
- Почти каждое родное слово заканчивается на гласную. Примеры исключений: non , il , per , con , del .
- Распространенное однобуквенное слово: è .
- Общее слово: perché .
- Последовательности букв: gli , gn , sci .
- Буквы j , k , w , x и y встречаются редко и используются только в заимствованных словах (например, виски ).
- Окончания слов: -o , -a , -zione , -mento , -tà , -aggio .
- Ударение (например, на à) почти всегда встречается на последней букве слова.
- Часто встречаются двойные согласные ( tt , zz , cc , ss , bb , pp , ll и т. д.).
- Символы: à, è, é, í, ï, ò, ó, ú, ü, ç, ·
- Комбинация символов tz (также распространена в баскском языке) и l·l
- Слоги и слова, оканчивающиеся на -aig , -eig , -oig , -uig , -aix , -eix , -oix , -uix
- Последовательности букв: tx (также распространены в баскском языке) и tg
- Буква y используется только в сочетании ny и заимствованных слов.
- Буквы k и w встречаются редко и используются только в заимствованных словах (например, walkman ).
- Окончания слов: -o , -a , -es , -ció , -tat , -ment.
- Начало слова: ll- (также распространено в испанском и валлийском языках)
- Общие слова: això , amb , mateix , tots , que.
- Персонажи: ă â î ș ț
- Общие слова: şi, de, la, a, ai, ale, alor, cu.
- Окончания слов: -a, -ă, -u, -ul, -ului, -ties (или -ciune), -ment, -tate; имена, оканчивающиеся на -эску
- Двойное и тройное i: копия, копия
- Обратите внимание, что румынский язык иногда пишут в Интернете без диакритических знаков, что затрудняет его идентификацию. Иногда вместо правильного диакритического знака, запятой (выше), используется седиль на S (ş) и на T (ţ).
- Символы: ã, õ, â, ê, ô, á, é, í, ó, ú, à, ç
- Распространенные однобуквенные слова: а, à, е, é, о.
- Распространенные двухбуквенные слова: ao, as, às, da, de, do, em, os, ou, um.
- Распространенные трехбуквенные слова: aos, com, das, dos, ele, ela, mas, não, por, que, são, uma.
- Распространенные окончания: -ção, -dade, -ismo, -mente.
- Общие орграфы: ch, nh, lh; примеры: чаве, галинья, баральо.
- Буквы k, w и y встречаются редко. Они встречаются в основном в заимствованных словах, например: keynesianismo , walkie-talkie , nylon .
- Большинство слов в единственном числе заканчиваются на гласную l, m, r или z.
- Слова во множественном числе заканчиваются на -s.
- Персонажи: å, é, è, ê, î, ô, û
- Общие орграфы и триграфы: ai, ae, én, -jh-, tch, oe, -nn-, -nnm-, xh, ou.
- Распространенные однобуквенные слова: a, å, e, i, t', l', s', k'
- Распространенные двухбуквенные слова: al, ås, li, el, vs, ki, si, pô, pa, po, ni, èn, dj'
- Распространенные трехбуквенные слова: dji, nén, rén, bén, pol, mel.
- Распространенные окончания: -aedje, -mint, -xhmint, -es, -ou, -owe, -yî, -åcion.
- После апострофов ставится пробел (желательно неразрывный), например: l' ome вместо l'ome .
- Похож на португальский; неопределенный артикль «unha» (жен. множественное число), суффикс -ción и более тяжелое использование буквы «x» обычно обозначают галисийский язык.
- Определенные артикли o (муж. ч., ед. ч.), os (муж. ч., мн. ч.), a (жен. ч., ед. ч.), as (жен. ч., мн. ч.)
- Распространенные диаграммы: nh (ningunha)
- Буквы j, k, w и y отсутствуют в алфавите и встречаются только в заимствованных словах.
германские языки
- слова: а , и , в , из , на , что , к , есть , что , я ( я всегда пишется с заглавной буквы, когда говоришь о себе )
- последовательности букв: th , ch , sh , ough , augh , qu
- Окончания слов: -ing , -tion , -ed , -age , -s , -'s , -'ve , -n't , -'d
- Подавляющее большинство слов оканчиваются на согласную или иногда на e. Некоторые общие исключения: who, to, so, no, do, a и несколько имен, таких как Julia.
- диакритические знаки или ударения только в заимствованных словах (пиньята)
- последовательности букв ij (с заглавной буквы IJ , а также в виде лигатуры IJ или ij ), ei , ou , au , oe , удвоенные гласные (но не ii ), kw , ch , sch , oei , ooi , aai и uw ( особенно eeuw , ieuw , auw и ouw ).
- Все согласные, за исключением h , j , q , v , w , x и z, могут быть удвоены.
- Буквы c (за исключением последовательности (s)ch ), q , x и y встречаются почти исключительно в заимствованных словах.
- слова: хет, оп, ен, ен, вор (и составные слова вор ).
- Окончания слов: -tje , -sje , -ing , -en , -lijk ,
- в начале слов: z-, v-, ge-
- t/m иногда встречается между двумя точками во времени или между числами (например, номерами домов).
- последовательности букв: ij , ei , oa
- слова: yn
- Слова: 'n , as , vir , nie .
- Похож на голландский, но:
- распространенные голландские буквы c и z встречаются редко и используются только в заимствованных словах (например, chalet );
- общепринятая голландская гласная ij не используется; вместо нее используются i и y (например, -lik , sy );
- Распространенное в голландском языке окончание -en встречается редко и заменяется на -e .
- умлауты (ä, ö, ü), эсс-зетт (ß)
- последовательности букв: ch , sch , tsch , tz , ss ,
- Общие слова: der , die , das , den , dem , des , er , sie , es , ist , ich , du , aber.
- распространенные окончания: -en , -er , -ern , -st , -ung , -chen , -tät
- редкие буквы: x , y (кроме заимствованных слов)
- буква c используется редко, за исключением последовательностей, перечисленных выше, и заимствованных слов
- длинные сложные слова
- точка (.) после порядковых числительных, например 3. Oktober
- много слов в середине предложений пишутся с заглавной буквы, так как в немецком языке все существительные пишутся с заглавной буквы.
- буквы å, ä, ö, редко é
- общие слова: och , i , att , det , en , som , är , av , den , på , om , inte , men
- распространенные окончания: -ning , -lig , -isk , -ande , -ade , -era , -rna.
- распространенные окончания фамилий: -sson , -berg , -borg , -gren , -lund , -lind , -ström , -kvist/qvist/quist
- длинные сложные слова
- последовательности букв: stj , sj , skj , tj , ck , än
- не используются символы w , z, за исключением иностранных имен собственных и некоторых заимствованных слов, но используется x , в отличие от датского и норвежского языков, где он заменяется на ks
- удвоение согласных встречается часто, но удвоение гласных встречается очень редко
- буквы æ, ø, å
- общие слова: af, og, til, er, på, med, det, den ;
- распространённые окончания: -tion , -ing , -else , -hed ;
- длинные сложные слова;
- символы q , w , x и z не используются , за исключением иностранных имен собственных и некоторых заимствованных слов;
- в отличие от норвежского языка: используется сочетание букв øj ; частое использование æ ; сохраняется написание заимствованных иностранных слов (в частности, использование c ), например, centralstation .
- удвоение согласных встречается часто, но удвоение гласных встречается очень редко
- буквы æ, ø, å
- общие слова: av, ble, er, og, en, et, men, i, å, for, eller ;
- распространенные окончания: -sjon , -ing , -else , -het ;
- длинные сложные слова;
- символы c , w , z и x не используются , за исключением иностранных имен собственных и некоторых заимствованных слов;
- две версии языка: букмол (намного ближе к датскому) и нюнорск – например , ikke, lørdag, Norge (букмол) против ikkje, laurdag, Noreg (нюнорск); Нюнорск использует слово òg ; печатные материалы почти всегда публикуются только на букмоле;
- для отличия от датского языка: используется сочетание букв øy ; реже используется æ ; написание заимствованных иностранных слов «норвежское» (в частности, без использования c ), например, sentralstasjon .
- удвоение согласных встречается часто, но удвоение гласных встречается очень редко
- буквы á, ð, é, í, ó, ú, ý, þ, æ, ö
- общие начала: fj- , gj- , hj- , hl- , hr- , hv- , kj- , и sj- ,
- распространенные окончания: -ar (особенно -nar ), -ir (особенно -nir ), -ur , -nn (особенно -inn )
- символы c , q , w или z не используются, за исключением иностранных имен собственных, некоторых заимствованных слов и, в случае z , более старых текстов.
- удвоение согласных встречается часто, но удвоение гласных встречается очень редко
- буквы á, ð, í, ó, ú, ý, æ, ø
- сочетания букв: ggj , oy , skt
- в отличие от исландского: не использует é или þ, использует ø вместо ö (иногда на дорожных знаках отображается как ö или даже ő).
- удвоение согласных встречается часто, но удвоение гласных встречается очень редко
балтийские языки
- использует диакритические знаки : ā, č, ē, ģ, ī, ķ, ļ, ņ, ō, ŗ, š, ū, ž.
- не имеет букв: q, w, x, y
- в современном языке больше не используются ō или ŗ
- крайне редкое удвоение гласных
- редкое удвоение согласных
- точка (.) после порядковых числительных, например, 2005. gads
- общие слова: ir , bija , tika , es , viņš
- визуальное обилие букв ą, č, ę, ė, į, š, ų, ū, ų
- не имеет букв q, w, x
- крайне редкое удвоение гласных и согласных
- множество различных форм (обычно окончаний) одного и того же слова, например, намас, намо, намус, намамс и т. д.
- в целом длинные слова (отсутствие артиклей и меньше предлогов по сравнению с германскими языками)
- общие слова: ир , йра , кад , ставка .
славянские языки
- группы согласных rz, sz, cz, prz, trz
- включает в себя: ą, ę, ć, ś, ł, ń, ó, ż, ź
- слова w, z, we, i, na (несколько однобуквенных слов)
- слова шутка, сие
- слова, начинающиеся с był, będzie, jest (формы связки być , «быть»).
- визуальное обилие букв ž ů ě ř
- слова je, v
- в отличие от словацкого: не используются ä, ľ, ĺ, ŕ или ô; ú появляется только в начале слов.
- визуальное обилие букв жшч ;
- использует: ä, ľ и ô и (очень редко) ĺ и ŕ;
- типичные суффиксы: -cia , -ť ;
- чтобы отличить от чешского: не используются ě, ř или ů.
- похож на сербский
- буквы-диграфы dž, lj, nj
- не имеет q, w, x, y
- типичные суффиксы: -ti , -ći
- специальные буквы: č, ć, š, ž, đ
- общие слова: a, i, u, je
- в отличие от сербского: последовательности -ije- и -je- являются обычными; глаголы, оканчивающиеся на -irati , -iran
- похоже на хорватский
- буквы-диграфы dž, lj, nj (lj и nj встречаются несколько чаще, чем dž, хотя и не намного)
- нет д, ш, х, у
- типичные глагольные суффиксы -ti , -ći (инфинитив используется гораздо реже, чем в хорватском)
- Иностранные слова могут заканчиваться на -tija , -ovan , -ovati , -uje.
- специальные буквы: đ (редко), č, š (часто), ć, ž (реже)
- общие слова: а, я, ты, дже, шутка
- суффикс будущего времени -iće , -ićeš , -ićemo , -ićete (не встречается в хорватском языке)
- Последовательности гласных -ije- и -je- очень часто встречаются в сербском языке, на котором говорят в Боснии и Герцеговине, Черногории и Хорватии (ijekavica), но в Сербии они не встречаются, поскольку каждая из этих последовательностей заменяется на -e- (ekavica).
- использует Џ, Ј, Љ, Њ, Ђ, Ћ
- не использует Щ, Ъ, Ы, Ь, Э, Ю, Я, Ё, Є, Ґ, Ї, І, Ў
- в отличие от македонского: не использует Ѕ, Ѓ, Ќ
кельтские языки
- Буквы Ŵ, ŵ используются в валлийском языке
- слова y, yr, yn, a, ac, i, o
- последовательности букв wy, ch, dd, ff, ll, mh, ngh, nh, ph, rh, th, si
- неиспользуемые буквы: k, q, v, x, z
- буква используется редко, в заимствованных словах: j
- Буквы с обычными ударениями: â, ê, î, ô, û, ŵ, ŷ , хотя ударения акут ( ´ ), гравис ( ` ) и диерез ( ¨ ) гипотетически могут встречаться на всех гласных.
- Окончания слов: -ion, -au, -wr, -wyr
- y — самая распространенная буква в языке
- w между согласными ( w на самом деле представляет гласную в валлийском языке)
- Циркумфлекс ( ^ ) — самый распространённый диакритический знак, хотя диакритические знаки часто вообще опускаются.
- гласные с острым ударением: á é í ó ú
- слова, начинающиеся с последовательностей букв bp dt gc bhf
- последовательности букв sc cht
- не используются буквы J, K, Q, V, W.
- часто чч, ч, дч, чч, гх, мч, чт, ш
- для отличия от (шотландского) гэльского языка: могут быть слова или имена, в которых вторая (или даже третья) буква заглавная вместо первой: hÉireann .
- Гласные с ударением: à è ì ò ù ( é и ó все еще иногда встречаются, но их использование теперь не рекомендуется)
- последовательности букв sg chd
- часто чч, ч, дч, чч, гх, мч, чт, ш
- в отличие от ирландского: префиксы пишутся через дефис, поэтому заглавные буквы в середине слов обычно не встречаются: т-Обан .
албанский(Шкип)
- уникальные буквы: ë , ç .
- ë — самая распространённая буква в языке.
- Буква w не используется, за исключением заимствованных слов.
- dh , gj , ll , nj , rr , sh , th , xh и zh считаются одной буквой вместо двух.
- общие слова: po, jo, dhe, i, të, me
мальтийский(Мальти)
- уникальные буквы: ċ, ġ, ħ, għ, ħ, ż
- семитского происхождения, довольно понятен с арабским
- использует il-xxx для определенного артикля
иранские языки
- использует циркумфлекс ( ^ ): ê, î, û и седиль (¸ ): ç, ş
- слово xwe (сам, я, вы и т. д.) встречается часто и является весьма специфичным ( комбинация xw )
- ( I, i ) — самая распространенная буква в языке.
- использует восемь гласных (a, e, ê, i, î, o, u, û)
- невозможно найти слово без гласной
- имеет много сложных слов
Финно-угорские языки
- отдельные буквы å , ä и ö ; но никогда õ или ü ( y занимает место ü )
- b , f , z , š и ž встречаются только в заимствованных словах и именах собственных ; последние два заменяются на sh или zh в некоторых текстах
- c , q , w , x , å встречаются только в именах собственных (обычно иностранных)
- за пределами заимствованных слов d появляется только между гласными или в hd
- за пределами заимствованных слов g появляется только в ng
- за исключением заимствованных слов, слова не начинаются с двух согласных; это отражено в общей структуре слога, где согласные кластеры встречаются только через границы слогов, за исключением некоторых заимствованных слов
- общие слова: sinä , on
- распространенные окончания: -nen , -ka / -kä , -in , -t (суффикс множественного числа)
- распространенные комбинации гласных: ai , uo , ei , ie , oi , yö , äi
- необычно высокая степень дублирования букв, как гласные, так и согласные будут удвоены, например aa , ee , ii , kk , ll , ss , yy , ää
- частые длинные слова
- отдельные буквы: õ , ä , ö и ü ; но никогда ß или å
- похож на финский, за исключением:
- Буква y не используется, за исключением заимствованных слов ( ü — соответствующая гласная)
- Буквы b и g (без предшествующей n ) встречаются за пределами заимствованных слов
- редкое использование š и ž , в основном в заимствованных словах (плюс сочетание tš )
- заимствования более распространены, чем в финском языке, в основном заимствованы из немецкого языка
- слова оканчиваются на согласные чаще, чем в финском языке, особенно типичны конечные b , d , v
- Буква d встречается в эстонском языке гораздо чаще, чем в финском, и в эстонском языке она часто является последней буквой слова (суффиксом множественного числа), чего никогда не бывает в финском языке.
- двойное öö встречается чаще, чем в финском; другие двойные буквы могут включать õõ , üü , редко hh (для немецкого ch ) и даже šš
- общие слова: ja , on , ei , ta , см ., või .
- Буквы ő и ű ( двойной острый ударение ) характерны только для венгерского языка
- ударные буквы á и é часто
- Буквосочетания: cs, dz, dzs, gy, ly, ny, sz, ty, zs (все классифицируются как отдельные буквы), leg‐, ‐obb (примечание: sz также распространено в польском языке)
- общие слова: a, az, ez, egy, és, van, hogy
- буква k очень частая (суффикс множественного числа)
Эскимосско-алеутские языки
- длинные полисинтетические слова (одно слово может содержать более 30 букв)
- относительно обильные n , q (не обязательно сопровождаемые u ), u
- вездесущие двойные согласные и гласные ( аа , ii , qq , uu , реже ee , оо )
- Гласные a , i , u встречаются заметно чаще, чем e , o (которые встречаются только перед q и r )
- нет дифтонгов, за исключением иногда встречающегося в конце слова ai , только согласные сочетания, кроме двойных согласных и (n)ng, состоят из r + согласная
- старые варианты написания (ныне отмененные в ходе реформы правописания) иногда включали в себя акут, циркумфлекс и/или тильду: Qânâq против Qaanaaq .
Южные атабаскские языки
- гласные с острым ударением, огонёк (носовой крючок) или оба: á, ą, ą́
- удвоенные гласные: аа, áá, ąą, ą́ą́
- перечеркнутая l : ł (проверьте, не польская!)
- н с острым ударением: ń
- кавычки: ' или '
- последовательности: dl, tł, tł', dz, ts', ií, áa, aá
- могут иметь довольно длинные слова
В дополнение к вышесказанному,
- не использует u , ú или ų
В дополнение к вышесказанному,
- использует: u, ú, ų
- не использует o , ó или ǫ
Гуарани
- много тильд над гласными (включая y) и n
- тильда над g: g̃ — это единственный язык в мире, который ее использует. Примеры слов: hagũa и g̃uahẽ .
- Буквы b, d и g обычно не встречаются без букв m или n перед ними (mb, nd, ng), если только они не являются заимствованными из испанского языка словами.
- f, l, q, w, x, z чрезвычайно редкие внешние заимствованные слова
- не использует c без h: ch
японскийвРомадзи(Нихонго/日本語)
- слова: desu, aru, suru , особенно в конце предложений;
- Окончания слов: -масу, -масен, -шита ;
- буквы: в японском языке почти всегда чередуются согласные и гласные. Исключениями являются диграфы ши и чи , аффриката цу , геминация (два одинаковых согласных подряд) и палатализация (согласный, за которым следует буква y ).
- Для обозначения удвоенных гласных могут использоваться макрон или циркумфлекс, например: Tōkyō
- общие слова: нет, о, ва, де, ни
(Примечание: ромадзи нечасто используется в японской письменности. Чаще всего его используют иностранцы, изучающие произношение японского языка.)
Хмонг(Hmoob) написано наРоманизированный популярный алфавит
- Почти все написанные слова довольно короткие (один слог).
- Слоги (если они не произносятся со средним тоном) заканчиваются на букву тона: одну из bsjvmgd , что приводит к очевидным «согласным кластерам», таким как -wj
- w может быть главной гласной слога (например, tswv )
- Слоги могут начинаться с таких последовательностей, как hm-, ntxh-, nq- .
- Слоги, оканчивающиеся на двойные гласные (особенно -oo, -ee ), могут сопровождаться тоновыми буквами (как в Hmoob "Hmong").
вьетнамский(тиенг вьет)
- Латинские символы с более чем одним диакритическим знаком на одной и той же гласной. См. выше.
- Почти все написанные слова довольно короткие (состоят из одного слога, в основном менее шести символов).
- Слова, начинающиеся с ng или ngh
- Слова, заканчивающиеся на nh
- общие слова: cái, khong, có, ở, của, và, tại, với, để, đã, sẽ, đang, tôi, Ban, chung, là
Вьетнамский Цитируемый-Читаемый (ВИКР)
- Следующие символы (часто в сочетании) после гласных: ^ ( + ' ` ? ~ .
- ДД, Дд или дд
- Следующий символ перед знаком препинания: \
вьетнамскийВНИкодирование
- Цифры 1-8 после гласных
- Цифра 9 после D или d
- Следующий символ перед цифрами: \
- Следующие символы после гласных: sfrxj
- Следующие гласные удвоены: aeo
- Буква w после следующих символов: aou
- ДД, Дд или дд
Китайский, романизированный
- В целом, слоги в китайском языке заканчиваются только на гласные или n, ng, r; никогда на p, t, k, m.
- Слова, начинающиеся с x, q, zh
- Знаки тона гласных, например ā, á, َ, à.
- Для удобства использования компьютера их иногда заменяют цифрами, например a1, a2, a3, a4.
- Слова не начинаются с букв b, d, g, z, q, x, r
- Слова, начинающиеся с hs
- Много слов, написанных через дефис
- Апострофы после начальных букв или диграфов, например, t'a, ch'i
- Множество необычных сочетаний гласных, таких как ae, eei, ii, iee, oou, yy и т. д.
- Вставка r, например arn, erng и т.д.
- Слова, оканчивающиеся на nn, nq
- Много слов, написанных через дефис.
- Слова могут заканчиваться на p, t, k, m, n, ng, h; никогда на r
- Латинские символы с множеством диакритических знаков на гласных. В отличие от вьетнамских, каждый символ имеет максимум один такой знак.
- Необычные сочетания символов, а именно · (средняя точка, всегда после o ) и | (вертикальная черта). ¯ ( макрон ) также распространен.
австронезийские языки
Может содержать следующее:
Префиксы: me-, mem-, memper-, pe-, per-, di-, ke-
Суффиксы: -kan, -an, -i
Другие (почти всегда пишутся строчными буквами): yang, dan , ди, ке, олег, иту
Малайский и индонезийский языки взаимно понятны для опытных носителей, хотя устные и письменные переводчики обычно являются специалистами в одном или другом языке. См. Сравнение стандартного малайского и индонезийского языков .
Частое использование буквы «а» (сравнимо с частотой английской «е»).
Большинство полинезийских языков используют AEFGHIKLMNOPRSTUV и ʻ (иногда пишется ' или Q)
- L: Ядерные полинезийские языки ( тонганский , самоанский , тувалуанский , токелауанский ...), как в фале.
- R: восточно-полинезийские языки ( новозеландские маори , таитянский , маори островов Кука , рапа-нуи ...) как в тарифе.
- K: большинство полинезийских языков, за исключением гавайского , самоанского, таитянского
- H: большинство полинезийских языков, кроме самоанского
- WH: Новозеландский маори ( Whenua )
- Согласные всегда разделяются одной или несколькими гласными ( фенуа , хаапай , олело )
- Краткие и долгие гласные, которые пишутся либо с макроном (āēīōū), либо путем копирования (aa, ee, ii, oo, uu)
- Частые дифтонги ( ояуэ , маори )
- Слова всегда заканчиваются на гласную.
- Заимствованные слова транслитерируются (как в японском языке): Sesu Kilisito = Иисус Христос, polokalama = программа)
- Частые заимствования из английского или французского языка (в зависимости от колониальной истории)
- AEFHIKLMN NG OPSTUV ʻ
- нг ( Тонга ), ч, окончания на -онуа ( фонуа )
- статья те
- частые слова: 'о, тэ, ки, мей, я, фака-
- Английские заимствования
- AEFGILMNOPSTUV `
- нет буквы K, вместо нее используется окина (`) или ничего ( фака на Тонгане - это фаа на Самоа)
- частое использование L ( le )
- Частые слова: о , е , ле , се , а , я , ма
- АЕФГИКЛМНОПСТУВ `
- отличать от тонганского: g вместо ng ( tokaga )
- статья те
- h встречается чаще, чем s ( tahi )
- Частые слова: ko, te, ki, mai, i, o, ne'e, e, mo, faka-
- Французские заимствования
- АЕФГИКЛМНОПСТУВ `
- статья ле
- Частые слова: ко, ле, ки, мей, и, о, мо, фака-
- отличается от уоллисского: S встречается чаще, чем H ( tasi )
- отличить от самоанского: буква К
- Французские заимствования
тюркские языки
Обратите внимание, что некоторые тюркские языки, такие как азербайджанский и туркменский, используют похожий латинский алфавит (часто Jaŋalif ) и похожие слова, и их можно спутать с турецким. В азербайджанском языке есть буквы Əə, Xx и Qq, которых нет в турецком алфавите, а в туркменском — Ää, Žž, Ňň, Ýý и Ww. Латинские символы, используемые уникально (или почти уникально) для тюркских языков: Əə, Ŋŋ, Ɵɵ, Ьь, Ƣƣ, Ğğ, İ и ı. Все тюркские языки могут образовывать длинные слова путем добавления нескольких суффиксов.
Турецкий алфавит
Строчные буквы: abc ç defg ğ h ı ijklmno ö prs ş tu ü vyz
Прописные буквы: ABC Ç DEFG Ğ HI İ JKLMNO Ö PRS Ş TU Ü VYZ.
Общие слова
- бир — один, а
- бу — это
- анкак — но
- олду — был (произошёл)
- шу — это
Разное
- Буква «j» используется только в заимствованных словах.
- Слова никогда не начинаются с "ğ"
- Ищите общие окончания слов. Временные изменения в турецких глаголах создаются путем добавления суффиксов к концу глагола. Множественное число образуется путем добавления -lar и -ler .
- Изменения общего времени: -yor -mış -mus -sun
- Притяжательность/человек: -im -un -ın -in -iz -dur -tır
- Пример: Yap tı , «[Он] сделал это»; Yap — основа глагола, означающая «делать», -mış указывает на совершенное время, -tır указывает на третье лицо (он/она/оно).
- Пример: Ada lar , «Острова»; Ada — существительное, означающее «остров», -lar образует множественное число.)
- Пример: Ev imiz , «Наш дом»; Ev — существительное, означающее «дом», -im указывает на притяжательное местоимение первого лица, а -iz затем образует множественное число.)
Азербайджанский язык легко узнать по частому использованию ə . Эта буква не используется ни в одном другом официально признанном современном латинском алфавите. Кроме того, в нем используются буквы x и q , которые не используются в турецком языке.
- Общие слова: və , ki , ilə , bu , o , isə , görə , da , də.
- Частое использование диакритических знаков: ç , ğ , ı , İ , ö , ş , ü.
- Слова, оканчивающиеся на -lar , -lər , -ın , -in , -da , -də , -dan , -dən
- Слова, которые никогда не начинаются с ğ или ı
- Слова, редко начинающиеся с двух или более согласных
- Транслитерация иностранных слов и имен, например, Одри Хепберн = Одри Хепберн
китайский(中文)
- Никаких пробелов, за исключением знаков препинания и (иногда) иностранных слов.
- Иногда используются арабские цифры (0-9)
- Пунктуация:
- Точка 。(не .)
- Серийная запятая 、(отличается от обычной запятой ,)
- Эллипс …… (шесть точек)
- Ни хираганы , ни катаканы , ни хангыля.
- Может быть написано вертикально
Упрощенный китайский(简体) противТрадиционный китайский(繁體)
Примечание: Многие символы не были упрощены. В результате, обычно короткое слово или фраза идентичны в упрощенном и традиционном вариантах, но редко бывает, чтобы целое предложение было идентичным.
Общие радикалы, отличающиеся в традиционном и упрощенном вариантах:
- Упрощенно:讠钅饣纟门(например,语 银 饭 纪 问)
- Традиционный:訁釒飠糹門(например,語銀飯紀問)
Общие символы, отличающиеся в традиционном и упрощенном письме:
- Упрощенно:国 会 这 来 对 开 关 门 时 个 书 长 万 边 东 车 爱 儿
- Традиционный:國 會 這 來 對 開 關 門 時 個 書 長 萬 邊 東 車 愛 兒
Стандартный письменный китайский (на основе мандаринского диалекта) против письменного народного кантонского диалекта
Примечание: Помимо Гонконга, носители кантонского языка также проживают на юге материкового Китая, в Малайзии и Сингапуре [1] , поэтому письменный кантонский диалект может быть записан как упрощенными, так и традиционными иероглифами.
Распространенные символы в разговорном кантонском диалекте, которые не встречаются или встречаются редко в мандаринском наречии:
Некоторые из вышеперечисленных символов поддерживаются не во всех кодировках, поэтому иногда радикал 口 слева заменяется на 0 или o , например
Иногда для выражения одного и того же значения в кантонском и мандаринском диалектах используются разные китайские иероглифы. Если вы используете тот, который обычно используется в кантонском диалекте, для выражения одного и того же значения, когда вы говорите или пишете на мандаринском диалекте, носитель языка может запутаться или даже посчитать его сложным для понимания, и наоборот. Вот несколько примеров: (кантонский диалект против мандаринского диалекта)
- 食vs吃(есть) 飲vs喝(пить) 企vs站(стоять) 凍vs冷(холодно) 落vs下(вниз) 著vs穿(носить) 讀vs唸(читать) 鬧vs罵(ругать) 計vs算(рассчитать)咪vs別(не делать) 行vs走(идти/идти) 先vs才(тогда)
Есть китайские слова, используемые для построения словарей, используемых в кантонском диалекте, которые не используются или редко используются в современном мандаринском диалекте. Вот несколько примеров: (кантонский диалект против мандаринского диалекта)
- 成日vs整天(всегда) 傾計vs聊天(разговор) 返工vs上班(идти на работу) 溫書vs溫習(учиться) 影片vs視頻(видео) 隔離vs旁邊(поблизости)起屋vs蓋樓(построить дом) 聽日vs明天(завтра) 巴閉vs囂張(высокомерный) 搞掂vs完成(закончено) 定係vs還是(или) 靚仔vs帥哥(красивый мужчина) 鍾意vs喜歡(подобно) 犀利vs厲害(мощный) 同埋vs和/及(и) 黐綫vs瘋的(сумасшедший) 雪櫃vs冰箱(холодильник)
Кантонские словари, созданные на основе кантонских слов, используются в повседневной жизни на юге Китая и не используются в современном мандаринском наречии. Вот несколько примеров:
- 咪咁(не веди себя так) 好冇(ок?) 玩嘢(пошалить) 做嘢(работать) 睇戲(посмотреть фильм/кино) 唔知(не знаю) 埋嚟( приходят) 嗰個(что) 咁嘅嘢(такая вещь) 佢哋(они) 咩事/乜事(что?) 冇嘢(ничего) 嗰陣(в этот момент) 越嚟越多(все больше и больше) 我嘅(мой) 梗係(конечно) 𥄫(подглядывать) 冧佢(люблю его/ее) 拎畀我(возьми это для меня) 嘥曬(все пропадает) 你啱(вы правы) 𢫏住(что-то прикрыть) 冚唪唥(все) 撳實(плотно прижать что-то) 瞓覺(спать) 掟石仔(бросить) крошечный камень) 唓[модальное слово, выражающее презрение] 噃[модальное слово для напоминания или предупреждения кого-либо] 詏交(спорить) 好嬲(очень злиться) 心悒(чувствовать уныние в сердце) 𧨾女仔(угодить) девушка) 得咁多咋(только столько) 做好咗(сделала что-то хорошо)
Наконец, когда термины из других стран (особенно США и Великобритании) вводятся в Китай, кантонский и мандаринский часто получают разные переводы, где кантонский часто переводится в соответствии с произношением терминов на английском языке, а мандаринский часто переводится в соответствии со значением терминов. Вот несколько примеров: (кантонский против мандаринского)
- 的士(dik1 si2, не имеет прямого значения, переводится в соответствии с английским произношением.) vs 出租車(chū zū chē, означает автомобили для аренды.), перевод с Такси.
- 巴士(baa1 si2, не имеет прямого значения, переводится в соответствии с английским произношением.) vs 公車(gōng chē, означает общественные автомобили.), переводится с Bus.
- 多士(do1 si2, не имеет прямого значения, переводится в соответствии с английским произношением.) vs 土司(tǔ sī, не имеет прямого значения, переводится в соответствии с английским произношением.), перевод с Toast.
- 騷(sou1, не имеет прямого значения, переводится в соответствии с английским произношением.) vs 秀(xìu, не имеет прямого значения, переводится в соответствии с английским произношением), перевод с Show.
- 士多(si2 do1, не имеет прямого значения, переводится в соответствии с английским произношением) vs 小店(xiǎo diàn, означает небольшой магазин), переводится как Магазин.
- 𨋢(lip1, не имеет прямого значения, переводится в соответствии с английским произношением) vs 升降機(shēng jiàng jī, означает машина, которая поднимает и опускает себя), перевод от Lift/Elevator.
- 掰拜(baai1 baai3, не имеет прямого значения, переводится в соответствии с английским произношением) vs 再見(zài jiàn, означает «увидимся снова»), перевод от Byebye/Goodbye.
японский(日本語)
- Символы катаканы (カタカナ) и хираганы (ひらがな), смешанные с кандзи (漢字)
- Нет пробелов
- Система счисления = арабские цифры (1,2,3 и т.д.)
- Пунктуация:
- Период .
- Запятая 、(,также используется в двухбайтовых числах)
- Кавычки 「」
- Случайные маленькие символы рядом с большими, например. しゃ りゅ しょ って シャ リュ ショ ッテ
- Двойные отметки (известные как даку-он), появляющиеся в правом верхнем углу символов, например. で が ず デ ガ ズ
- Пустые кружки (известные как хандаку-он), появляющиеся в правом верхнем углу символов, например. ぱ ぴ パ ぴ
- Частые символы: の を は が
- Первоначально писалось вертикально (книги, школа и т. д.), но в Интернете чаще встречается горизонтально.
корейский(한국어/조선말)
- Знаки препинания в западном стиле
- Интервалы в западном стиле
- Буквы хангыля (фонетические), например: ㅂ(b в book) ㅈ(j в jump) ㅅ(s в sock)ㅊ(ch в champion) ㅍ(p в pox)
- Буквы хангыль, используемые для образования блоков слогов; например ㅅ s + ㅓ o + ㅇ ng = 성 песня
- Круги и эллипсы широко распространены в хангыле; в китайском языке они встречаются крайне редко.
- Общий вид имеет относительно однородную сложность, в отличие от китайского или японского языков.
кхмерский языкភាសារខ្មែរ
Кхмерский язык пишется с использованием своеобразного кхмерского алфавита .
- редко использует пробелы
- Буквы имеют заметно более «высокую» форму, чем в других брахмических письменностях.
- В написании использует кхмерские цифры ១ ២ ៣ ៤ ៥ ៦ ៧ ៨ ៩.
- Содержит уменьшенные версии согласных, расположенные под основными согласными, которые могут казаться сгруппированными
- Имеет 24 диакритических знака, обозначающих слоговые рифмы - ា ិ ី ឹ ឺ ុ ូ ួ ើ ឿ ៀ េ ែ ៃ េា ៅ ុំ ំ ាំ ះ ុះ េះ ោះ
- Использует это как точку: ។
греческий(Элленика)
Современный греческий язык пишется греческим алфавитом в монотонном , политонном или атонном , либо в соответствии с демотической ( г-н Триантафилидис ) грамматикой или грамматикой Катаревуса . Некоторые люди пишут на греческом (греческий с латинским письмом), который либо визуально основан, орфографически или фонетически , либо просто перепутан (смешан). Единственными официальными орфографическими формами греческого языка являются монотонный и политонический.
Нормальный современный греческий (монотонный греческий)
- слова και, είναι ;
- Каждое многосложное слово имеет один знак ударения/тона ( оксиа ): ά έ ή ί ό ύ ώ.
- Единственным другим диакритическим знаком, который когда-либо использовался, является трема: ϊ/ΐ, ϋ/ΰ и т. д.
Греческий до 1980-х годов (греческий политонический)
Катаревуса , Димотики ( грамматика Триантафилидиса )
- Диакритические знаки: ά, ᾶ, ἀ, ἁ и их сочетания, в том числе с другими гласными.
- В некоторых текстах, особенно в катаревусе, также встречаются ὰ, ᾳ в сочетании с другими диакритическими знаками.
Древнегреческий
- Диакритические знаки: ά, ὰ, ᾶ, ἀ, ἁ, ᾳ и их комбинации, а также с другими гласными; х; тильда (ᾶ) часто больше похожа на закругленный циркумфлекс
- в некоторых текстах вместо σ/ς используется полулунная сигма (похожа на c)
греческий атонический
- Было распространено в некоторых греческих СМИ (телевидение);
- Вы увидите греческие символы без акцентов/тонов;
- слова: και, ειναι, αυτο .
Греческий вгреческий
- Существует автоматизированное программное обеспечение для преобразования Greeklish->Greek. Если вы заметили текст на Greeklish, он может быть полезен для греческой el.wikipedia (после преобразования).
- Помните: в греческом языке для одной буквы может использоваться более одного символа (например: th для Θ ( theta )).
Орфографический греческий
Фонетический греческий
- слова ке, ине ;
- омега отображается как о;
- ei, oi появляются как i;
- ai отображается как e.
Визуально-ориентированный греческий
- омега (Ω или ω) может отображаться как W или w;
- эпсилон (E) может отображаться как 3 ;
- альфа (A) может отображаться как 4 ;
- тета (Θ) может отображаться как 8 ;
- ипсилон (Y) может отображаться как \|/ ;
- гамма (γ) может отображаться как y
- Для одной буквы можно использовать более одного символа.
Перепутанный (смешанный) греческий
- слова кай, эйне ;
- сочетает в себе принципы фонетического, визуального и орфографического греческого языка в соответствии с особенностями писателя ;
- Наиболее часто используемая форма греческого языка.
армянский(Հայերեն)
Армянский язык можно узнать по уникальному алфавиту из 39 букв:
Ա Բ Գ Դ Ե Զ Է Ը Թ Ժ Ի Լ Խ Ծ Կ Հ Ձ Ղ Ճ Մ Յ Ն Շ Ո Չ Պ Ջ Ռ ԍ Վ Տ Ր Ց Ւ Փ Ք ԵՎ(և) Предыдущий Предыдущий
грузинский(на английском)
Грузинский язык можно узнать по его уникальному алфавиту (обратите внимание, что некоторые символы вышли из употребления).
ა ბ გ დ ე ვ ზ ჱ თ ი კ ლ მ ნ ჲ ო პ ჟ რ ს ტ ჳ უ ფ ქ ღ ყ შ ჩ ც ძ წ ჭ ხ ჴ ჯ ჰ ჵ ჶ ჷ ჸ
кириллица
Жирным шрифтом выделены буквы, уникальные для данного языка.
славянские языки
- использует: ё, і, й, ў, ы, э, '
- особенности: щ используется вместо щ
- единственный кириллический язык, в котором не представлен и.
- использует: ъ, щ, я, ю, й
- слова: със, в
- особенности: многие слова оканчиваются на определенный артикль –ът, –ят, –та, –то, –те
- использует: ј, љ, њ, џ, ѓ , ќ , ѕ
- слова: во, со
- особенности: р обычно встречается между согласными, например првин
- использует: ё, й, ъ (редко), ы, э, щ
- использует: ј, љ, њ, џ, ђ , ћ
- не употребляет: ъ, щ, я, ю, й
- слова: је, у
- особенности: большие группы согласных, например српски
- употребляет: є, и, і, ї, й, ґ, є щ, '
- не использует: ъ, ё, ы, э
монгольский
- использует: ө, ү
- не употребляет: ё, й, к, щ, ъ, ы, ь, ю, я
- используется только в именах или заимствованных словах: в, е, з, ф, ц
черногорский
осетинский
арабский алфавит
- Во всех языках, использующих арабский алфавит, письмо ведется справа налево.
- В прошлом арабский алфавит использовался и в ряде других языков, но сейчас для письма чаще используются латинские буквы; к примерам можно отнести турецкий , сомалийский и суахили .
арабский(العربية)
- перевернутый вопросительный знак: ؟
- Короткие гласные не пишутся, поэтому многие слова пишутся вообще без гласных.
- общий префикс: -الـ
- распространенный суффикс: ة -ـة-
- слова: إلى، من، على
персидский(Фарс)
За исключением очень редких случаев, глаголы находятся в конце фразы.
- распространенные глаголы: کرد، بود، شد، است، میشود
- использует: پ، چ، ژ، گ
- слова: که، به
урду(Арду)
- использует: ٹ، ڈ، ڑ، ں، ے
- много слов, заканчивающихся на ے
- слова: اور، ہے
- отличие от арабского языка: во многих текстах стилистически слова на урду пишутся «наклонно» сверху вниз слева направо (в отличие от «линейного» стиля арабского, персидского и т. д.).
Сирийский алфавит
сирийский(ܐܬܘܪܝܐ)
- Короткие гласные обычно не пишутся, поэтому многие слова пишутся вообще без гласных.
- три стиля письма (эстранжела, серто, маханайя) и два разных способа представления гласных
- Основной алфавит в стиле Эстрангела:
- Основной алфавит в стиле Серто : ƒ , ƒ , �� , �� , �� , �� , �� , �� , �� , �� , �� , �� , �� , , �� , �� , �� , �� , �� , �� , �� ,
- Основной алфавит в стиле Маднхайя : ƒ , ƒ , �� , �� , �� , �� , �� , �� , �� , �� , �� , �� , �� , , �� , �� , �� , �� , �� , �� , �� ,
Дравидийские языки
- Письменность во всех дравидийских языках ведется слева направо.
- Все дравидийские языки имеют разную письменность. Но сходство можно найти в их орфографии.
каннада
- В алфавите каннада 49 букв.
тамильский
- Распространенные окончания слов: ள்ளது, கிறது, கின்றன, ம்
- общие слова: தமிழ், அவர், உள்ள, சில
- Тамильский язык имеет уникальный 30-буквенный алфавит. С помощью диакритических знаков можно написать до 247 букв.
அ ஆ இ ஈ உ ஊ எ ஏ ஐ ஒ ஓ ஔ க ங ச ஞ ட ண த ந ப ம ய ர ல வ ழ ள ற ன
телугу
Телугу имеет 56 символов (Aksharamulu), включая гласные (Achchulu) и согласные (Hallulu). Телугу использует восемнадцать гласных, каждый из которых имеет как независимую форму, так и диакритическую форму, используемую с согласными для создания слогов. В языке различают краткие и долгие гласные.
అ ఆ ఇ ఈ ఉ ఊ ఋ ౠ ఌ ౡ ఎ ఏ ఐ ఒ ఓ ఔ అం అః క ఖ గ ఘ ఙ చ ఛ జ ఝ ఞ ట ఠ డ ఢ ణ త థ ద ధ న ప ఫ బ భ మ య ర ఱ ల ళ వ శ ష స హ
౦ ౧ ౨ ౩ ౪ ౫ ౬ ౭ ౮ ౯
бенгальский
Бенгальский алфавит или бангла (бенгали: বাংলা বর্ণমালা, bangla bôrnômala) или бенгальское письмо (бенгали: বাংলা লিপি, bangla lipi) — это система письма, возникшая на индийском субконтиненте для бенгальского языка и являющаяся пятой по распространённости системой письма в мире. Письмо используется для других языков, таких как ассамский, майтхили, мейтей и бишнуприя-манипури, и исторически использовалось для записи санскрита в Бенгалии.
бенгальский
В бенгали уникальный алфавит из 50 букв.
- В бенгальском письме всего 9 гласных графем, каждая из которых называется স্বরবর্ণ swôrôbôrnô «гласная буква». Swôrôbôrnôs представляют шесть из семи основных гласных звуков бенгали, а также два гласных дифтонга. Все они используются как в бенгальском, так и в ассамском языках.
অ আ ই ঈ উ ঊ ঋ এ ঐ ও ঔ
- В бенгальском письме всего 39 согласных. Согласные буквы называются ব্যঞ্জনবর্ণ bænjônbôrnô «согласная буква» на бенгальском языке. Названия букв обычно состоят только из согласного звука и присущей ему гласной অ ô. Поскольку присущая ему гласная подразумевается и не пишется, названия большинства букв выглядят идентично самой букве (название буквы ঘ само по себе ghô, а не gh).
ক খ গ ঘ ঙ চ ছ জ ঝ ঞ ট ঠ ড ঢ ণ ত থ দ ধ ন প ফ ব ভ ম য র ল শ ষ স হ ড় ঢ় য় ৎ ঃ ং ঁ
- имеет 10 диакритических знаков, обозначающих слоговые рифмы -
া ি ী ু ূ ৃ ে ৈ ো ৌ
ассамский
- Ассамское письмо имеет в общей сложности 9 гласных графем, каждая из которых также называется স্বরবর্ণ swôrôbôrnô «гласная буква».
অ আ ই ঈ উ ঊ ঋ এ ঐ ও ঔ
- Всего 39 согласных. Согласные буквы на бенгали называются ব্যঞ্জনবর্ণ bænjônbôrnô «согласная буква».
ক খ গ ঘ ঙ চ ছ জ ঝ ঞ ট ঠ ড ঢ ণ ত থ দ ধ ন প ফ ব ভ ম য ৰ ল শ ষ স হ ড় ঢ় য় ৎ ঃ ং ঁ
- имеет 10 диакритических знаков, обозначающих слоговые рифмы -
া ি ী ু ূ ৃ ে ৈ ো ৌ
Слоговое письмо канадских аборигенов
В современной письменности канадские аборигенные слоговые знаки характерны для языков кри , инуктитут или оджибве , хотя последние два также пишутся альтернативными шрифтами. Основной набор знаков — ᐁ ᐱ ᑌ ᑫ ᒉ ᒣ ᓀ ᓭ ᔦ, каждый из которых может появляться в любой из четырех ориентаций, жирным шрифтом, надстрочным шрифтом и с диакритическими знаками, включая ᑊ ᐟ ᐠ ᐨ ᒼ ᐣ ᐢ ᐧ ᐤ ᐦ ᕽ ᓫ ᕑ. Эта абугида также использовалась для племени черноногих .
Другие североамериканские слоговые азбуки
Чероки
Письменность чероки отличается уникальным слоговым письмом, состоящим из следующих символов:
ᎡᎢᎣᎤᎥᎦᎧᎨᎩᎪᎫᎬᎭᎮᎯᎰᎱᎲᎳᎴᎵ ᎶᎷᎸᎹᎺᎻᎼᎽᎾᎿᏀᏁᏂᏃᏄᏅᏆᏇᏈᏉᏊ ᏋᏌᏍᏎᏏᏐᏑᏒᏓᏔᏕᏖᏗᏘᏙᏚᏛᏜᏝᏞᏟ ᏠᏡᏢᏣᏤᏥᏦᏧᏨᏩᏪᏫᏬᏭᏮᏯᏰᏱᏲᏳᏴ.
Искусственные языки
эсперанто(Эсперанто)
- слова: де , ла , ал , кай
- Шесть букв с диакритическими знаками: ĉ Ĉ ĝ Ĝ ĥ Ĥ ĵ Ĵ ŝ Ŝ ŭ Ŭ , их соответствующее представление в H-системе ch Ch Ch gh Gh hh Hh jh Sh Shu U или соответствующее им представление в X-системе cx Cx gx Gx hx Hx jx Jx sx Sx ux Ux
- Слова, оканчивающиеся на o , a , oj , aj , on , an , ojn , ajn , as , os , is , us , u , i , aŭ
Клингонский(tlhИнган Хол)
- При записи на латинском алфавите клингонский язык имеет необычное свойство различия в регистре; q и Q — это разные буквы, а другие буквы либо всегда (например, D, I, S), либо никогда (например, ch, tlh, v) пишутся в верхнем регистре. Это приводит к появлению большого количества слов, которые выглядят довольно странно для людей, которые к этому не привыкли, например: yIDoghQo ' , tlhIngan Hol (со смешанным регистром).
- Апостроф встречается довольно часто, особенно в конце слова или слога.
- Распространенные суффиксы: -be', -'a '
- Общие слова: « оХ , Qapla »
- Может использовать один или несколько апострофов в середине слова: SuvwI″a '
Ложбан(ложбан.)
- (почти) все строчные;
- общие слова lo , mi , cu , la , nu , do , na , se ;
- абзацы, разделенные знаком ni'o , и предложения, разделенные знаком .i (или i );
- много пятибуквенных слов в форме согласных-гласных CCVCV или CVCCV ;
- много коротких слов с апострофами между гласными, например, ko'a pi'o и т. д.;
- обычно без знаков препинания, за исключением точек;
- могут использовать запятые в середине слов (обычно имен собственных).
Токи Пона(токи пона)
- алфавит состоит из строчных букв, за исключением заимствованных слов
- без диакритических знаков
- на письме используются только глухие согласные , например , p , t , k
Полный алфавит: п, т, к, с, м, н, л, й, ш, а, е, и, о, у
- Общие слова li , mi , e , sina , ona , jan
- часто звучит как упрощенная и фонетическая форма английского или шведского языка
- много двусложных слов
Внешние ссылки
- Веб-сервис определения языка, API определения языка, поддерживается более 100 языков
- Google Translate, служба перевода Google.
- Xerox, онлайн-идентификатор языка, поддерживает 47 языков
- Language Guesser, статистический идентификатор языка, распознает 74 языка
- NTextCat — бесплатный API идентификации языка для .NET (C#): более 280 языков доступны из коробки. Распознает язык и кодировку ( UTF-8 , Windows-1252 , Big5 и т. д.) текста. Совместим с Mono .
- ^ https://www.oakton.edu/user/4/billtong/chinaclass/Language/cantonese.htm