Соглашение о вызовах

В информатике соглашение о вызовах — это схема уровня реализации (низкоуровневая) того, как подпрограммы или функции получают параметры от вызывающего объекта и как они возвращают результат. Когда некоторый код вызывает функцию, были приняты решения о том, где и как параметры передаются в эту функцию, а также где и как результаты возвращаются из этой функции, причем эти передачи обычно выполняются через определенные регистры или внутри кадра стека при вызове . куча . Существуют варианты дизайна того, как задачи подготовки к вызову функции и восстановления среды после завершения функции распределяются между вызывающим и вызываемым объектом. Некоторые соглашения о вызовах определяют способ вызова каждой функции. Для каждого вызова функции следует использовать правильное соглашение о вызовах, чтобы обеспечить правильное и надежное выполнение всей программы с использованием этих функций.

Введение

Соглашения о вызовах обычно считаются частью двоичного интерфейса приложения (ABI).

Связанные понятия

Имена или значения параметров и возвращаемых значений определяются в интерфейсе прикладного программирования (API, в отличие от ABI), который представляет собой отдельную, хотя и связанную концепцию с ABI и соглашением о вызовах. Имена членов переданных структур и объектов также будут считаться частью API, а не ABI. Иногда API включают ключевые слова для указания соглашения о вызове функций.

Соглашения о вызовах обычно не включают информацию о сроке службы динамически выделяемых структур и объектов. {{{1}}} в других документах указывается, где лежит ответственность за освобождение выделенной памяти.

Соглашения о вызовах вряд ли будут определять расположение элементов внутри структур и объектов, например порядок байтов или упаковку структур.

Для некоторых языков соглашение о вызовах включает детали обработки ошибок или исключений (например, Go , Java ), а для других — нет (например, C++ ).

Для удаленных вызовов процедур существует аналогичная концепция, называемая маршаллингом .

Соглашения о вызовах могут быть связаны со стратегией оценки конкретного языка программирования , но чаще всего не считаются ее частью (или наоборот), поскольку стратегия оценки обычно определяется на более высоком уровне абстракции и рассматривается как часть языка, а не как часть языка. как низкоуровневая деталь реализации компилятора конкретного языка .

Различные соглашения о вызовах

Соглашения о вызовах могут отличаться:

Где размещаются параметры. Варианты включают регистры , стек вызовов , сочетание того и другого или другие структуры памяти.
Порядок передачи параметров. Варианты включают порядок слева направо, справа налево или что-то более сложное.
Как обрабатываются функции, которые принимают переменное количество аргументов ( вариативные функции ). Опции включают только что переданные по порядку (при условии, что первый параметр находится в очевидной позиции) или переменные части массива.
Как возвращаемые значения доставляются от вызывающего абонента обратно вызывающему. Варианты включают в себя стек, регистр или ссылку на что-то, выделенное в куче.
Как длинные или сложные значения обрабатываются, возможно, путем разделения на несколько регистров, внутри кадра стека или с ссылкой на память.
Какие регистры гарантированно будут иметь то же значение при возврате вызываемого объекта, что и при вызове вызываемого объекта. Говорят, что эти регистры сохраняются или сохраняются , поэтому они не являются энергозависимыми .
Как задача настройки и очистки после вызова функции распределяется между вызывающим и вызываемым объектом. В частности, как восстанавливается кадр стека , чтобы вызывающая сторона могла продолжить работу после того, как вызываемая сторона завершила работу.
Передаются ли и как метаданные , описывающие аргументы
Здесь хранится предыдущее значение указателя кадра, которое используется для восстановления кадра стека после завершения подпрограммы. Опции включаются в стек вызовов или в определенный регистр.
Где размещаются какие-либо статические ссылки на область действия для нелокального доступа к данным подпрограммы (обычно в одной или нескольких позициях в кадре стека, но иногда в общем регистре или, для некоторых архитектур, в регистрах специального назначения)
Для объектно-ориентированных языков способ обращения к объекту функции.

Соглашения о вызовах на одной платформе

Иногда на одной платформе появляется несколько соглашений о вызовах; данная платформа и языковая реализация могут предлагать выбор соглашений о вызовах. Причины этого включают производительность, адаптацию соглашений других популярных языков, а также ограничения или соглашения, налагаемые различными « вычислительными платформами ».

Во многих архитектурах имеется только одно широко используемое соглашение о вызовах, часто предлагаемое архитектором. Для RISC, включая SPARC, MIPS и RISC-V , часто используются имена регистров, основанные на этом соглашении о вызовах. Например, регистры MIPS $4через $7имеют «имена ABI» $a0через $a3, что отражает их использование для передачи параметров в стандартном соглашении о вызовах. (ЦП RISC имеют множество эквивалентных регистров общего назначения, поэтому обычно нет аппаратных причин давать им имена, кроме чисел.)

Соглашение о вызовах языка данной программы может отличаться от соглашения о вызовах базовой платформы, ОС или какой-либо библиотеки, с которой связана ссылка. Например, в 32-разрядной версии Windows вызовы операционной системы имеют соглашение о вызовах stdcall , тогда как многие программы C , которые там выполняются, используют соглашение о вызовах cdecl . Чтобы учесть эти различия в соглашении о вызовах, компиляторы часто допускают ключевые слова, определяющие соглашение о вызовах для данной функции. Объявления функций будут включать дополнительные ключевые слова, специфичные для платформы, которые указывают используемое соглашение о вызовах. При правильной обработке компилятор сгенерирует код для вызова функций соответствующим образом.

Некоторые языки позволяют указывать соглашение о вызове функции с помощью этой функции; у других будет некоторое соглашение о вызовах, но оно будет скрыто от пользователей этого языка и поэтому обычно не будет учитываться программистом.

Архитектуры

x86 (32-разрядная версия)

32-разрядная версия архитектуры x86 используется со многими различными соглашениями о вызовах. Из-за небольшого количества архитектурных регистров и исторического акцента на простоте и небольшом размере кода многие соглашения о вызовах x86 передают аргументы в стек. Возвращаемое значение (или указатель на него) возвращается в регистр. В некоторых соглашениях для первых нескольких параметров используются регистры, что может повысить производительность, особенно для очень часто вызываемых коротких и простых листовых подпрограмм (т. е. подпрограмм, которые не вызывают другие подпрограммы).

Пример вызова:

 нажать EAX ; передать результат регистра push dword [ EBP + 20 ] ; передать некоторую переменную памяти (синтаксис FASM/TASM) push 3 ; передать некоторый постоянный вызов Calc ; возвращенный результат теперь находится в EAX

Типичная структура вызываемого объекта: (некоторые или все (кроме ret) приведенные ниже инструкции могут быть оптимизированы с помощью простых процедур). Некоторые соглашения оставляют пространство параметров выделенным, используя Plain retвместо ret imm16. В этом случае вызывающая сторона могла бы add esp,12в этом примере или иным образом справиться с изменением ESP.

расчет: нажмите EBP ; сохранить указатель старого кадра mov EBP , ESP ; получить указатель нового кадра sub ESP , localsize ; зарезервируйте место в стеке для местных жителей . . ; выполнить вычисления, оставить результат в EAX . мов ESP , EBP ; свободное место для местных жителей поп EBP ; восстановить указатель старого кадра ret paramsize ; свободное пространство параметров и возврат.

х86-64

В 64-битной версии архитектуры x86, известной как x86-64 , AMD64 и Intel 64, обычно используются две последовательности вызовов. В Windows используется одна последовательность вызовов, определенная Microsoft; другая последовательность вызовов, указанная в AMD64 System V ABI, используется Unix-подобными системами и, с некоторыми изменениями, OpenVMS . Поскольку x86-64 имеет больше регистров общего назначения, чем 16-битный x86, оба соглашения передают некоторые аргументы в регистрах.

АРМ (А32)

Стандартное 32-битное соглашение о вызовах ARM распределяет 16 регистров общего назначения следующим образом:

r15: Счетчик программ (согласно спецификации набора команд).
r14: Регистр связи. Инструкция BL, используемая при вызове подпрограммы, сохраняет адрес возврата в этом регистре.
r13: Указатель стека. Инструкции Push/Pop в режиме работы «Thumb» используют только этот регистр.
r12: Рабочий регистр внутрипроцедурного вызова.
от r4 до r11: локальные переменные.
от r0 до r3: значения аргументов, передаваемые в подпрограмму, и результаты, возвращаемые из подпрограммы.

Если тип возвращаемого значения слишком велик, чтобы поместиться в от r0 до r3, или его размер не может быть определен статически во время компиляции, то вызывающая сторона должна выделить место для этого значения во время выполнения и передать указатель на это пространство в r0.

Подпрограммы должны сохранять содержимое от r4 до r11 и указатель стека (возможно, сохраняя их в стек в прологе функции , затем используя их как рабочее пространство, а затем восстанавливая их из стека в эпилоге функции ). В частности, подпрограммы, вызывающие другие подпрограммы, должны сохранить адрес возврата в регистре связи r14 в стеке перед вызовом этих других подпрограмм. Однако таким подпрограммам не требуется возвращать это значение в r14 — им просто нужно загрузить это значение в r15, программный счетчик, чтобы вернуться.

Соглашение о вызовах ARM требует использования полного нисходящего стека. Кроме того, указатель стека всегда должен быть выровнен по 4 байтам и всегда должен быть выровнен по 8 байтам при вызове функции с открытым интерфейсом. ^[1]

Это соглашение о вызовах приводит к тому, что «типичная» подпрограмма ARM:

В прологе поместите r4 в r11 в стек и поместите адрес возврата в r14 в стек (это можно сделать с помощью одной инструкции STM);
Скопируйте все переданные аргументы (от r0 до r3) в локальные временные регистры (от r4 до r11);
Назначьте другие локальные переменные оставшимся локальным временным регистрам (от r4 до r11);
Выполните вычисления и при необходимости вызовите другие подпрограммы с помощью BL, предполагая, что от r0 до r3, r12 и r14 не будут сохранены;
Поместите результат в r0;
В эпилоге вытащите из стека r4 в r11 и вытащите адрес возврата в программный счетчик r15. Это можно сделать с помощью одной инструкции LDM.

АРМ (А64)

Соглашение о вызовах 64-битного ARM ( AArch64 ) распределяет 31 регистр общего назначения следующим образом: ^[2]

x31 (SP): указатель стека или нулевой регистр, в зависимости от контекста.
x30 (LR): регистр связи процедур, используемый для возврата из подпрограмм.
x29 (FP): указатель кадра.
от x19 до x28: сохраняется вызываемый абонент.
x18 (PR): Регистр платформы. Используется для некоторых специальных целей, специфичных для операционной системы, или для дополнительного регистра, сохраняемого вызывающим абонентом.
x16 (IP0) и x17 (IP1): рабочие регистры внутрипроцедурного вызова.
От x9 до x15: локальные переменные, вызывающий абонент сохранен.
x8 (XR): Косвенный адрес возвращаемого значения.
От x0 до x7: значения аргументов, передаваемые подпрограмме, и результаты, возвращаемые из нее.

Все регистры, начинающиеся с x , имеют соответствующий 32-битный регистр с префиксом w . Таким образом, 32-битный x0 называется w0.

Аналогично, 32 регистра с плавающей запятой распределяются следующим образом: ^[3]

от v0 до v7: значения аргументов, передаваемые подпрограмме, и результаты, возвращаемые из нее.
v8–v15: сохраняется вызываемый абонент, но необходимо сохранить только нижние 64 бита.
v16–v31: локальные переменные, вызывающая сторона сохранена.

RISC-V ISA

RISC-V имеет определенное соглашение о вызовах с двумя вариантами: с плавающей запятой или без нее. ^[4] По возможности он передает аргументы в регистры.

POWER, PowerPC и Power ISA

Архитектуры POWER , PowerPC и Power ISA имеют большое количество регистров, поэтому большинство функций могут передавать все аргументы в регистры для одноуровневых вызовов. Дополнительные аргументы передаются в стек, и место для аргументов на основе регистров также всегда выделяется в стеке для удобства вызываемой функции в случае, если используются многоуровневые вызовы (рекурсивные или иные) и регистры необходимо сохранить. Это также полезно в функциях с переменным числом аргументов , таких как printf(), где к аргументам функции необходимо обращаться как к массиву. Для всех процедурных языков используется единое соглашение о вызовах.

Инструкции ветвления и связи сохраняют адрес возврата в специальном регистре связи , отдельном от регистров общего назначения; процедура возвращается вызывающей стороне с инструкцией ветвления, которая использует регистр связи в качестве адреса назначения. Листовым процедурам не требуется сохранять или восстанавливать регистр связи; неконечные подпрограммы должны сохранять адрес возврата перед вызовом другой подпрограммы и восстанавливать его перед возвратом, сохраняя его с помощью команды «Переместить из регистра специального назначения», чтобы переместить регистр связи в регистр общего назначения и, при необходимости, затем сохранить его в стек и восстановить, если оно было сохранено в стеке, загрузив сохраненное значение регистра связи в регистр общего назначения, а затем используя команду «Переместить в регистр специального назначения» для перемещения регистра, содержащего сохраненную информацию. значение регистра связи в регистр связи.

МИПС

ABI O32 ^[5] является наиболее часто используемым ABI благодаря своему статусу исходного ABI System V для MIPS. ^[6] Он строго основан на стеке, и для передачи аргументов доступны только четыре регистра. Эта кажущаяся медлительность, а также устаревшая модель с плавающей запятой, состоящая всего из 16 регистров, способствовали распространению многих других соглашений о вызовах. ABI сформировался в 1990 году и никогда не обновлялся с 1994 года. Он определен только для 32-битного MIPS, но GCC создал 64-битный вариант под названием O64. ^[7]$a0-$a3

Для 64-разрядной версии чаще всего используется N64 ABI (не связанный с Nintendo 64 ) от Silicon Graphics. Самым важным улучшением является то, что теперь для передачи аргументов доступны восемь регистров; Это также увеличивает количество регистров с плавающей запятой до 32. Существует также версия ILP32 под названием N32, которая использует 32-битные указатели для меньшего кода, аналогично x32 ABI . Оба работают в 64-битном режиме процессора. ^[7]

Было предпринято несколько попыток заменить O32 32-битным ABI, который больше напоминает N32. На конференции 1995 года был предложен MIPS EABI, 32-битная версия которого была очень похожа. ^[8] EABI вдохновила MIPS Technologies предложить более радикальный ABI «NUBI», который дополнительно повторно использует регистры аргументов для возвращаемого значения. ^[9] MIPS EABI поддерживается GCC, но не LLVM; ни один из них не поддерживает NUBI.

Для всех O32 и N32/N64 адрес возврата хранится в $raрегистре. Это устанавливается автоматически с использованием инструкций JAL(переход и соединение) или JALR(регистр перехода и соединение). Стек растет вниз.

СПАРК

Архитектура SPARC , в отличие от большинства RISC- архитектур, построена на окнах регистров . В каждом окне регистров имеется 24 доступных регистра: 8 — «входящие» регистры (%i0-%i7), 8 — «локальные» регистры (%l0-%l7) и 8 — «выходящие» регистры (% о0-%о7). Регистры «in» используются для передачи аргументов вызываемой функции, а любые дополнительные аргументы необходимо помещать в стек . Однако вызываемая функция всегда выделяет пространство для обработки потенциального переполнения окна регистра, локальных переменных и (в 32-битном SPARC) возврата структуры по значению. Чтобы вызвать функцию, аргументы вызываемой функции помещаются в «выходные» регистры; когда функция вызывается, «выходные» регистры становятся «входящими» регистрами, и вызываемая функция получает доступ к аргументам в своих «входящих» регистрах. Когда вызываемая функция завершается, она помещает возвращаемое значение в первый входной регистр, который становится первым выходным регистром при возвращении вызванной функции.

ABI System V , ^[10] которому следуют большинство современных Unix -подобных систем, передает первые шесть аргументов во входные регистры от %i0 до %i5, резервируя %i6 для указателя кадра и %i7 для адреса возврата.

IBM System/360 и его преемники

IBM System/360 — еще одна архитектура без аппаратного стека. Приведенные ниже примеры иллюстрируют соглашение о вызовах, использовавшееся в OS/360 и его преемниках до появления 64-разрядной версии z/Architecture ; другие операционные системы для System/360 могут иметь другие соглашения о вызовах.

Вызов программы:

 LA 1,ARGS Загрузить адрес списка аргументов L 15,=A(SUB) Загрузка адреса подпрограммы BALR 14,15 Переход к вызываемой подпрограмме ¹ ...ARGS DC A(FIRST) Адрес первого аргумента Постоянный ток А (ВТОРОЙ) ... DC A(THIRD)+X'80000000' Последний аргумент ²

Вызываемая программа:

SUB EQU * Это точка входа в подпрограмму.

Стандартная последовательность ввода:

 ИСПОЛЬЗОВАНИЕ *,15 ³ STM 14,12,12(13) Сохранение регистров ⁴ ST 13,SAVE+4 Сохранить адрес области сохранения вызывающего абонента LA 12,SAVE Цепочка сохранений СТ 12,8(13) ЛР 13,12 ...

Стандартная последовательность возврата:

 Л 13,СОХРАНИТЬ+4 ⁵ ЛМ 14,12,12(13) Л 15, РЕТВАЛЬ ⁶ BR 14 Возврат к абонентуСОХРАНИТЬ DS 18F Сохранить область ⁷

Примечания:

Команда BALRсохраняет адрес следующей инструкции (адрес возврата) в регистре, указанном первым аргументом (регистр 14), и переходит к адресу второго аргумента в регистре 15.
Вызывающая сторона передает адрес списка адресов аргументов в регистр 1. В последнем адресе установлен старший бит, обозначающий конец списка. Это ограничивает программы, использующие это соглашение, 31-битной адресацией.
Адрес вызываемой процедуры находится в регистре 15. Обычно он загружается в другой регистр, и регистр 15 не используется в качестве базового регистра.
Команда STMсохраняет регистры 14, 15 и с 0 по 12 в 72-байтовой области, предоставленной вызывающей стороной, называемой областью сохранения, на которую указывает регистр 13. Вызываемая процедура предоставляет свою собственную область сохранения для использования подпрограммами, которые она вызывает; адрес этой области обычно хранится в регистре 13 на протяжении всей процедуры. Следующие инструкции STMобновляют прямую и обратную цепочки, связывающие эту область сохранения с областью сохранения вызывающего абонента.
Последовательность возврата восстанавливает регистры вызывающей стороны.
Регистр 15 обычно используется для передачи возвращаемого значения.
Статическое объявление saveareaв вызываемой подпрограмме делает ее нереентерабельной и нерекурсивной ; повторно входящая программа использует динамический объект savearea, полученный либо из операционной системы и освобождаемый при возврате, либо в памяти, переданной вызывающей программой.

В ABI System/390 ^[11] и ABI z/Architecture ^[12] используется в Linux:

Регистры 0 и 1 энергозависимы.
Регистры 2 и 3 используются для передачи параметров и возвращаемых значений.
Регистры 4 и 5 также используются для передачи параметров.
Регистр 6 используется для передачи параметров и должен быть сохранен и восстановлен вызываемой стороной.
Регистры с 7 по 13 предназначены для использования вызываемым абонентом и должны быть им сохранены и восстановлены.
Регистр 14 используется для обратного адреса.
Регистр 15 используется как указатель стека.
Регистры с плавающей запятой 0 и 2 используются для передачи параметров и возвращаемых значений.
Регистры с плавающей запятой 4 и 6 предназначены для использования вызываемым абонентом и должны быть им сохранены и восстановлены.
В z/Architecture регистры с плавающей запятой 1, 3, 5 и с 7 по 15 предназначены для использования вызываемым объектом.
Регистр доступа 0 зарезервирован для использования системой.
Регистры доступа с 1 по 15 предназначены для использования вызываемым абонентом.

Дополнительные аргументы передаются в стек.

СуперХ

Примечание: «сохраненные» резервы для сохранения вызываемого абонента; то же самое касается и «гарантированного».

68 тыс.

Наиболее распространенное соглашение о вызовах для серии Motorola 68000 : ^[13]^[14]^[15]^[16]

d0, d1, a0 и a1 — рабочие регистры.
Все остальные регистры сохраняются вызываемым абонентом.
a6 — указатель кадра, который можно отключить с помощью опции компилятора.
Параметры помещаются в стек справа налево.
Возвращаемое значение сохраняется в d0.

ИБМ 1130

IBM 1130 представлял собой небольшую 16-битную машину с пословной адресацией. В нем было всего шесть регистров плюс индикаторы состояния и не было стека. Регистрами являются регистр адреса инструкции (IAR) , аккумулятор (ACC) , расширение аккумулятора (EXT) и три индексных регистра X1–X3. Вызывающая программа отвечает за сохранение ACC, EXT, X1 и X2. ^[17] Существуют две псевдооперации для вызова подпрограмм: CALLдля кодирования неперемещаемых подпрограмм, напрямую связанных с основной программой, и LIBFдля вызова перемещаемых библиотечных подпрограмм через вектор передачи . ^[18] Обе псевдооперации преобразуются в машинную инструкцию перехода и сохранения IAR ( BSI), которая сохраняет адрес следующей инструкции по ее эффективному адресу (EA) и выполняет переход к EA+1.

Аргументы следуют за BSI‍—‌обычно это адреса аргументов, состоящие из одного слова‍—‌вызываемая подпрограмма должна знать, сколько аргументов ожидать, чтобы она могла пропустить их при возврате. Альтернативно аргументы могут передаваться в регистрах. Подпрограммы функций возвращали результат в ACC для реальных аргументов или в ячейку памяти, называемую псевдоаккумулятором действительных чисел (FAC). Аргументы и адрес возврата были адресованы с использованием смещения значения IAR, хранящегося в первом месте подпрограммы.

 * 1130 пример подпрограммы ENT SUB Объявить «SUB» внешней точкой входа. SUB DC 0 Зарезервированное слово в точке входа, обычно кодируемое «DC *-*» * Код подпрограммы начинается здесь * Если были аргументы, адреса можно загрузить косвенно из адреса возврата. LDX I 1 SUB Загрузить в X1 адрес первого аргумента (например) ... * Возвратная последовательность LD RES Загрузить целочисленный результат в ACC * Если аргументы не были предоставлены, выполняется косвенный переход к сохраненному адресу возврата. BI SUB Если аргументы не были предоставлены КОНЕЦ ПОДПИСКИ

Подпрограммы в IBM 1130, CDC 6600 и PDP-8 (все три компьютера были представлены в 1965 году) хранят обратный адрес в первом месте подпрограммы. ^[19]

Соглашения о вызовах вне машинной архитектуры

Резьбовой код

Многопоточный код возлагает всю ответственность за настройку и очистку после вызова функции на вызываемый код. Вызывающий код ничего не делает, а лишь выводит список вызываемых подпрограмм. Это помещает весь код настройки и очистки функции в одно место — пролог и эпилог функции — а не во многих местах, где функция вызывается. Это делает многопоточный код наиболее компактным соглашением о вызовах.

Поточный код передает все аргументы в стек. Все возвращаемые значения возвращаются в стек. Это делает наивные реализации медленнее, чем соглашения о вызовах, которые сохраняют больше значений в регистрах. Однако реализации многопоточного кода, которые кэшируют в регистрах несколько значений верхнего уровня стека, в частности адрес возврата, обычно работают быстрее, чем соглашения о вызове подпрограмм, которые всегда помещают и извлекают адрес возврата в стек. ^[20]^[21]^[22]

ПЛ/И

Соглашение о вызовах по умолчанию для программ, написанных на языке PL/I , передает все аргументы по ссылке , хотя при желании можно указать и другие соглашения. Аргументы обрабатываются по-разному для разных компиляторов и платформ, но обычно адреса аргументов передаются через список аргументов в памяти. Может быть передан окончательный скрытый адрес, указывающий на область, содержащую возвращаемое значение. Из-за большого разнообразия типов данных, поддерживаемых PL/I, также может быть передан дескриптор данных , чтобы определить, например, длину символьных или битовых строк, размерность и границы массивов ( дополнительные векторы ) или макет и содержимое. структуры данных . Фиктивные аргументы создаются для аргументов, которые являются константами или не соответствуют типу аргумента, ожидаемого вызываемой процедурой.

Смотрите также

Внешние ссылки

В Wikibooks есть книга на тему: 68000 Сборка.

В Wikibook Embedded Systems есть страница на тему: Смешанное программирование на C и ассемблере.

В Wikibook X86 Disassembly есть страница на тему: Соглашения о вызовах .

Джонсон, Стивен Кертис ; Ричи, Деннис Макалистер (сентябрь 1981 г.). «Технический отчет по информатике № 102: Последовательность вызовов языка C». Лаборатории Белла .
Введение в сборку на PowerPC
Руководство по вызову функций ABI в Mac OS X
Стандарт вызова процедур для архитектуры ARM
Программирование встраиваемых систем с помощью GNU Toolchain, раздел 10. Запуск C.