Подъязык — это подмножество языка . Подъязыки встречаются в естественном языке , языке программирования и реляционных базах данных .
В информатике , обработке естественного языка и машинном переводе подъязык — это язык ограниченной области, в частности технической области. В математических терминах «подмножество предложений языка образует подъязык этого языка, если оно замкнуто относительно некоторых операций языка: например, если при выполнении двух членов подмножества, например, и или потому что , результирующий результат также является членом этого подмножества». [1] [2] [3] Это особый термин для того, что в большинстве лингвистических исследований называется языковой разновидностью или регистром. [4]
Термин подъязык также иногда использовался для обозначения компьютерного языка, который является подмножеством другого языка. Подъязык может быть ограничен синтаксически (он принимает подграмматику исходного языка) и/или семантически (набор возможных результатов для любой данной программы является подмножеством возможных результатов в исходном языке).
Например, ALGOL 68S был подмножеством ALGOL 68, разработанным для того, чтобы сделать возможным написание однопроходного компилятора для этого подъязыка .
Операторы SQL (язык структурированных запросов) классифицируются различными способами, [5] которые можно сгруппировать в подъязыки, обычно: язык запросов данных (DQL), язык определения данных (DDL), язык управления данными (DCL) и язык манипулирования данными (DML). [6]
В теории реляционных баз данных термин «подъязык», впервые использованный для этой цели Э. Ф. Коддом в 1970 году, относится к компьютерному языку, используемому для определения или манипулирования структурой и содержимым системы управления реляционными базами данных (СУРБД). Типичные подъязыки, связанные с современными СУРБД, — это QBE (Query by Example) и SQL (Structured Query Language). В 1985 году Кодд изложил свои мысли в двенадцати правилах, которым должна соответствовать каждая база данных, чтобы быть по-настоящему реляционной. [7] [8] Пятое правило известно как правило всеобъемлющего подъязыка данных и гласит: