Расширяемое программирование

Расширяемое программирование — термин, используемый в информатике для описания стиля компьютерного программирования, который фокусируется на механизмах расширения языка программирования , компилятора и системы времени выполнения (среды). Расширяемые языки программирования, поддерживающие этот стиль программирования, были активной областью работы в 1960-х годах, но движение было оттеснено на обочину в 1970-х годах. ^[1] Расширяемое программирование стало темой возобновленного интереса в 21 веке. ^[2]

Историческое движение

Первая статья, обычно ^[1]^[3] связанная с движением за расширяемые языки программирования, — это статья М. Дугласа Макилроя 1960 года о макросах для языков программирования высокого уровня . ^[4] Другое раннее описание принципа расширяемости встречается в статье Брукера и Морриса 1960 года о компиляторе-компиляторе . ^[5] Пик движения был отмечен двумя академическими симпозиумами в 1969 и 1971 годах. ^[6]^[7] К 1975 году обзорная статья о движении Томаса А. Стэндиша ^[1] была по сути посмертной. Форт был исключением, но он остался по сути незамеченным.

Характер исторического движения

Как обычно предполагалось, расширяемый язык состоял из базового языка, предоставляющего элементарные вычислительные возможности, и метаязыка, способного модифицировать базовый язык. Программа тогда состояла из модификаций метаязыка и кода на модифицированном базовом языке.

Наиболее выдающейся техникой расширения языка, используемой в движении, было макроопределение. Изменение грамматики также было тесно связано с движением, что привело к окончательному развитию адаптивных грамматических формализмов . Сообщество языка Лисп оставалось отделенным от сообщества расширяемого языка, по-видимому, потому, что, как заметил один исследователь,

любой язык программирования, в котором программы и данные по сути взаимозаменяемы, можно рассматривать как расширяемый [sic] язык. ... это можно легко увидеть из того факта, что Lisp использовался как расширяемый язык в течение многих лет. ^[8]

На конференции 1969 года Simula была представлена как расширяемый язык.

Стэндиш описал три класса языковых расширений, которые он назвал парафразой , ортофразой и метафразой (иначе парафраза и метафраза были бы терминами перевода ).

Парафраз определяет средство, показывая, как обменять его на что-то ранее определенное (или подлежащее определению). В качестве примеров он упоминает макроопределения, определения обычных процедур, грамматические расширения, определения данных, определения операторов и расширения управляющих структур.
Ортофраза добавляет к языку возможности, которые не могли быть достигнуты с помощью базового языка, например, добавление системы ввода/вывода (I/O) к базовому языку, ранее не имевшему примитивов ввода/вывода. Расширения следует понимать как ортофразу относительно некоторого заданного базового языка, поскольку возможность, не определенная в терминах базового языка, должна быть определена в терминах некоторого другого языка. Это соответствует современному понятию подключаемых модулей .
Метафраза изменяет правила интерпретации, используемые для уже существующих выражений. Это соответствует современному понятию рефлексивного программирования (рефлексии).

Смерть исторического движения

Стэндиш приписал неудачу движения за расширяемость сложности программирования последовательных расширений. Программист может построить первую оболочку макросов вокруг базового языка. Затем, если вторая оболочка макросов будет построена вокруг нее, любой последующий программист должен быть близко знаком как с базовым языком, так и с первой оболочкой. Третья оболочка потребует знакомства с базой и как с первой, так и со второй оболочками и так далее. Защита программиста от деталей более низкого уровня является целью движения за абстракцию , которое вытеснило движение за расширяемость.

Несмотря на более раннее представление Simula как расширяемой, к 1975 году обзор Стэндиша, похоже, на практике не включал новые технологии, основанные на абстракции (хотя он использовал очень общее определение расширяемости, которое технически могло бы их включить). История абстракции программирования 1978 года от изобретения компьютера до этого момента не упоминала макросы и не давала никаких намеков на то, что движение расширяемых языков когда-либо имело место. ^[9] Макросы были предварительно допущены в движение абстракции к концу 1980-х годов (возможно, из-за появления гигиенических макросов ), получив псевдоним синтаксические абстракции . ^[10]

Современное движение

В современном понимании система, поддерживающая расширяемое программирование, будет предоставлять все функции, описанные ниже ^{[ необходима ссылка ]} .

Расширяемый синтаксис

Это просто означает, что исходный язык(и) для компиляции не должен быть закрытым, фиксированным или статическим. Должна быть возможность добавлять новые ключевые слова, концепции и структуры в исходный язык(и). Языки, которые позволяют добавлять конструкции с определяемым пользователем синтаксисом, включают Coq , ^[11] Racket , Camlp4 , OpenC++, Seed7 , ^[12] Red , Rebol и Felix. Хотя приемлемо, чтобы некоторые фундаментальные и внутренние языковые функции были неизменяемыми, система не должна полагаться исключительно на эти языковые функции. Должна быть возможность добавлять новые.

Расширяемый компилятор

В расширяемом программировании компилятор не является монолитной программой, которая преобразует входной исходный код в двоичный исполняемый вывод. Сам компилятор должен быть расширяемым до такой степени, чтобы он был набором плагинов, которые помогают переводить входной исходный язык во что угодно . Например, расширяемый компилятор будет поддерживать генерацию объектного кода, документацию кода, переформатированный исходный код или любой другой желаемый вывод. Архитектура компилятора должна позволять своим пользователям «попасть внутрь» процесса компиляции и предоставлять альтернативные задачи обработки на каждом разумном этапе процесса компиляции.

Для выполнения задачи преобразования исходного кода в нечто, что может быть выполнено на компьютере, расширяемый компилятор должен:

использовать архитектуру подключаемого модуля или компонента практически для каждого аспекта его функции
определить, какой язык или вариант языка компилируется, и найти соответствующий плагин для распознавания и проверки этого языка
использовать формальные спецификации языка для синтаксической и структурной проверки произвольных исходных языков
помогать с семантической проверкой произвольных исходных языков, вызывая соответствующий плагин проверки
позволяют пользователям выбирать из различных типов генераторов кода, чтобы полученный исполняемый файл можно было использовать на разных процессорах, операционных системах, виртуальных машинах или других средах выполнения.
предоставить возможности для генерации ошибок и их расширения
разрешить новые типы узлов в абстрактном синтаксическом дереве (AST),
разрешить новые значения в узлах AST,
разрешить новые виды ребер между узлами,
поддерживать преобразование входного AST или его частей с помощью некоторого внешнего «прохода»
поддерживать перевод входного AST или его частей в другую форму с помощью некоторого внешнего «прохода»
помогают с потоком информации между внутренними и внешними проходами, поскольку они оба преобразуют и переводят AST в новые AST или другие представления

Расширяемая среда выполнения

Во время выполнения расширяемые системы программирования должны разрешать языкам расширять набор операций, которые они разрешают. Например, если система использует интерпретатор байт-кода , она должна разрешать определять новые значения байт-кода. Как и в случае с расширяемым синтаксисом, приемлемо, чтобы был некоторый (небольшой) набор фундаментальных или внутренних операций, которые являются неизменяемыми. Однако должна быть возможность перегружать или дополнять эти внутренние операции, чтобы можно было поддерживать новое или дополнительное поведение.

Содержание отделено от формы

Расширяемые системы программирования должны рассматривать программы как данные для обработки. Эти программы должны быть полностью лишены какой-либо информации о форматировании. Визуальное отображение и редактирование программ для пользователей должно быть функцией перевода, поддерживаемой расширяемым компилятором, который переводит данные программы в формы, более удобные для просмотра или редактирования. Естественно, это должен быть двусторонний перевод. Это важно, поскольку должна быть возможность легко обрабатывать расширяемые программы различными способами . Неприемлемо, чтобы единственными способами использования входных данных исходного языка были редактирование, просмотр и перевод в машинный код. Произвольная обработка программ облегчается путем отделения входных данных исходного языка от спецификаций того, как они должны обрабатываться (форматироваться, храниться, отображаться, редактироваться и т. д.).

Поддержка отладки исходного языка

Расширяемые системы программирования должны поддерживать отладку программ с использованием конструкций исходного языка, независимо от расширений или преобразований, которым подверглась программа, чтобы сделать ее исполняемой. В частности, нельзя предполагать, что единственный способ отображения данных времени выполнения — это структуры или массивы . Отладчик, или, правильнее сказать, «инспектор программ», должен разрешать отображение данных времени выполнения в формах, подходящих для исходного языка. Например, если язык поддерживает структуру данных для бизнес-процесса или рабочего потока , отладчик должен иметь возможность отображать эту структуру данных в виде диаграммы «рыбьей кости» или другой формы, предоставляемой плагином.

Примеры

Смотрите также

Ссылки

^ abc Standish, Thomas A., «Расширяемость в разработке языков программирования», SIGPLAN Notices 10 № 7 (июль 1975 г.), стр. 18–21.
↑ Грегори В. Уилсон, «Расширяемое программирование для 21-го века», ACM Queue 2 № 9 (декабрь/январь 2004–2005).
^ Сэммет, Джин Э., Языки программирования: история и основы , Prentice-Hall, 1969, раздел III.7.2
↑ Макилрой, МД, «Расширения макрокоманд языков компиляторов», Communications of the ACM 3 № 4 (апрель 1960 г.), стр. 214–220.
^ Брукер, РА и Моррис, Д., "Общая программа перевода для языков фразовой структуры", Журнал ACM 9 № 1 (январь 1962 г.), стр. 1–10. Статья была получена в 1960 г.
^ Кристенсен, К. и Шоу, К. Дж., ред., Труды симпозиума по расширяемым языкам, SIGPLAN Notices 4 № 8 (август 1969 г.).
^ Шуман, С.А., ред., Труды Международного симпозиума по расширяемым языкам, SIGPLAN Notices 6 № 12 (декабрь 1971 г.).
↑ Харрисон, М.К., в «Панели по концепции расширяемости», стр. 53–54 симпозиума 1969 года.
↑ Гуарино, Л.Р., «Эволюция абстракции в языках программирования ^{[ нерабочая ссылка ]} », CMU-CS-78-120 , Кафедра компьютерных наук, Университет Карнеги-Меллона, Пенсильвания, 22 мая 1978 г.
^ Габриэль, Ричард П., ред., «Проект отчета о требованиях к общей системе прототипирования», SIGPLAN Notices 24 № 3 (март 1989 г.), стр. 93 и далее.
^ "Расширения синтаксиса и области действия нотации – документация Coq 8.17.0". coq.inria.fr . Получено 2023-05-25 .
^ Зингаро, Дэниел, «Современные расширяемые языки», SQRL Report 47 Университет Макмастера (октябрь 2007 г.), стр. 16.

Внешние ссылки

Общий

Статья Грега Уилсона в очереди ACM
Обсуждение на Slashdot
Современные расширяемые языки. Архивировано 12 июня 2011 г. на Wayback Machine – Статья Дэниела Зингаро

Инструменты

MetaL – реализация расширяемого движка компилятора программирования
XPS – Расширяемая система программирования (в разработке)
MPS – JetBrains Система метапрограммирования

Языки с расширяемым синтаксисом

OpenZz
xtc – Расширяемый C
английский-сценарий
Макросы Nemerle
Синтаксические макросы Boo
Компилятор формата Стэнфордского университета Intermediate
Seed7 – Расширяемый язык программирования
Katahdin – язык, синтаксис и семантика которого изменяются во время выполнения
π – язык с расширяемым синтаксисом, реализованный с помощью синтаксического анализатора Эрли