Стек вызовов

В информатике стек вызовов — это структура данных стека , которая хранит информацию об активных подпрограммах компьютерной программы . Этот тип стека также известен как стек выполнения , программный стек , стек управления , стек времени выполнения или машинный стек и часто сокращается до просто « стека ». Хотя обслуживание стека вызовов важно для правильного функционирования большинства программ , детали обычно скрыты и автоматически выполняются в языках программирования высокого уровня . Многие наборы компьютерных инструкций предоставляют специальные инструкции для манипулирования стеками.

Стек вызовов используется для нескольких связанных целей, но главная причина его наличия — отслеживание точки, в которую каждая активная подпрограмма должна вернуть управление после завершения выполнения. Активная подпрограмма — это та, которая была вызвана, но еще не завершила выполнение, после чего управление должно быть возвращено точке вызова. Такие активации подпрограмм могут быть вложены на любой уровень (рекурсивно как особый случай), отсюда и структура стека. Например, если подпрограмма DrawSquareвызывает подпрограмму DrawLineиз четырех разных мест, DrawLineнеобходимо знать, куда вернуться после завершения ее выполнения. Для этого адрес , следующий за инструкцией , которая переходит к DrawLine, адрес возврата , помещается на вершину стека вызовов как часть каждого вызова.

Описание

Поскольку стек вызовов организован как стек , вызывающий объект помещает адрес возврата в стек, а вызываемая подпрограмма, когда она завершает работу, извлекает или выталкивает адрес возврата из стека вызовов и передает управление этому адресу. Если вызванная подпрограмма вызывает еще одну подпрограмму, она помещает другой адрес возврата в стек вызовов и так далее, с информацией, складывающейся и распаковывающейся в соответствии с указаниями программы. Если вталкивание занимает все пространство, выделенное для стека вызовов, возникает ошибка, называемая переполнением стека , что обычно приводит к сбою программы . Добавление записи блока или подпрограммы в стек вызовов иногда называется «намоткой», а удаление записей — «раскруткой».

Обычно существует ровно один стек вызовов, связанный с работающей программой (или, точнее, с каждой задачей или потоком процесса ), хотя могут быть созданы дополнительные стеки для обработки сигналов или кооперативной многозадачности (как в случае с setcontext ). Поскольку в этом важном контексте существует только один стек, его можно называть стеком (неявно «задачи»); однако в языке программирования Forth доступ к стеку данных или стеку параметров осуществляется более явно, чем к стеку вызовов, и обычно его называют стеком (см. ниже).

В языках программирования высокого уровня специфика стека вызовов обычно скрыта от программиста. Им предоставляется доступ только к набору функций, а не к памяти самого стека. Это пример абстракции . Большинство языков ассемблера , с другой стороны, требуют, чтобы программисты участвовали в манипулировании стеком. Фактические детали стека в языке программирования зависят от компилятора , операционной системы и доступного набора инструкций .

Функции стека вызовов

Как отмечалось выше, основная цель стека вызовов — хранить адреса возврата . Когда вызывается подпрограмма, местоположение (адрес) инструкции, с которой вызывающая подпрограмма может позже возобновить выполнение, должно быть где-то сохранено. Использование стека для сохранения адреса возврата имеет важные преимущества по сравнению с некоторыми альтернативными соглашениями о вызовах , такими как сохранение адреса возврата перед началом вызываемой подпрограммы или в каком-то другом фиксированном месте. Одно из них заключается в том, что каждая задача может иметь свой собственный стек, и, таким образом, подпрограмма может быть потокобезопасной , то есть способной быть активной одновременно для разных задач, выполняющих разные вещи. Другое преимущество заключается в том, что, предоставляя повторную входимость , рекурсия автоматически поддерживается. Когда функция вызывает себя рекурсивно, адрес возврата необходимо сохранять для каждой активации функции, чтобы его можно было позже использовать для возврата из активации функции. Структуры стека автоматически предоставляют эту возможность.

В зависимости от языка, операционной системы и машинной среды стек вызовов может служить дополнительным целям, включая, например:

Локальное хранилище данных: Подпрограмме часто требуется пространство памяти для хранения значений локальных переменных , переменных, которые известны только в пределах активной подпрограммы и не сохраняют значения после ее возврата. Часто бывает удобно выделить пространство для этого использования, просто переместив верхнюю часть стека на достаточное расстояние, чтобы предоставить пространство. Это очень быстро по сравнению с динамическим выделением памяти , которое использует пространство кучи . Обратите внимание, что каждая отдельная активация подпрограммы получает свое собственное отдельное пространство в стеке для локальных переменных.
Передача параметров: Подпрограммы часто требуют, чтобы значения параметров предоставлялись им кодом, который их вызывает, и не редкость, что место для этих параметров может быть размещено в стеке вызовов. Обычно, если есть только несколько небольших параметров, регистры процессора будут использоваться для передачи значений, но если параметров больше, чем можно обработать таким образом, потребуется пространство памяти. Стек вызовов хорошо работает как место для этих параметров, особенно потому, что каждый вызов подпрограммы, которая будет иметь разные значения параметров, будет выделен отдельное место в стеке вызовов для этих значений. В объектно-ориентированных языках, таких как C++ , список параметров может также включать thisуказатель .
Стек оценки: Операнды для арифметических или логических операций чаще всего помещаются в регистры и там с ними производятся операции. Однако в некоторых ситуациях операнды могут быть сложены на произвольной глубине, что означает, что должно использоваться что-то большее, чем регистры (это случай выгрузки регистров ). Стек таких операндов, как в калькуляторе RPN , называется стеком вычислений и может занимать место в стеке вызовов.
Включающий контекст подпрограммы: Некоторые языки программирования (например, Pascal и Ada ) поддерживают объявление вложенных подпрограмм , которым разрешено получать доступ к контексту их включающих подпрограмм, т. е. параметрам и локальным переменным в области действия внешних подпрограмм. Такое статическое вложение может повторяться (функция, объявленная внутри функции, объявленной внутри функции…). Реализация должна предоставлять средства, с помощью которых вызываемая функция на любом заданном статическом уровне вложения может ссылаться на включающий фрейм на каждом включающем уровне вложения. Эта ссылка обычно реализуется указателем на фрейм последнего активированного экземпляра включающей функции, называемым «downstack link» или «static link», чтобы отличать его от «dynamic link», которая ссылается на непосредственный вызывающий объект (который не обязательно должен быть статической родительской функцией).; Вместо статической ссылки ссылки на вложенные статические фреймы могут быть собраны в массив указателей, известный как отображение , который индексируется для нахождения нужного фрейма. Глубина лексической вложенности процедуры является известной константой, поэтому размер отображения процедуры фиксирован. Кроме того, известно количество охватывающих областей для обхода, индекс в отображении также фиксирован. Обычно отображение процедуры располагается в ее собственном стековом фрейме, но Burroughs B6500 реализовал такое отображение на аппаратном уровне, которое поддерживало до 32 уровней статического вложения.; Записи отображения, обозначающие содержащие области, получаются из соответствующего префикса отображения вызывающего. Внутренняя процедура, которая рекурсивно создает отдельные кадры вызова для каждого вызова. В этом случае все статические ссылки внутренней процедуры указывают на один и тот же контекст внешней процедуры.
Контекст закрытого блока: В некоторых языках, например, ALGOL 60 , PL/I , блок внутри процедуры может иметь свои собственные локальные переменные, выделяемые при входе в блок и освобождаемые при выходе из блока. Аналогично, блок может иметь свои собственные обработчики исключений, деактивируемые при выходе из блока.
Другое состояние возврата: Помимо адреса возврата, в некоторых средах могут быть другие состояния машины или программного обеспечения, которые необходимо восстановить при возврате подпрограммы. Это может включать такие вещи, как уровень привилегий, информацию об обработке исключений, арифметические режимы и т. д. При необходимости это может быть сохранено в стеке вызовов, как и адрес возврата.

Типичный стек вызовов используется для адреса возврата, локальных переменных и параметров (известных как кадр вызова ). В некоторых средах может быть больше или меньше функций, назначенных стеку вызовов. Например, в языке программирования Forth обычно только адрес возврата, подсчитанные параметры цикла и индексы, и, возможно, локальные переменные хранятся в стеке вызовов (который в этой среде называется стеком возврата ), хотя любые данные могут быть временно помещены туда с помощью специального кода обработки стека возврата, пока соблюдаются потребности вызовов и возвратов; параметры обычно хранятся в отдельном стеке данных или стеке параметров , обычно называемом стеком в терминологии Forth, хотя есть стек вызовов, поскольку к нему обычно обращаются более явно. Некоторые Forth также имеют третий стек для параметров с плавающей точкой .

Структура

Стек вызовов состоит из кадров стека (также называемых записями активации или кадрами активации ). Это машинно-зависимые и ABI -зависимые структуры данных, содержащие информацию о состоянии подпрограммы. Каждый кадр стека соответствует вызову подпрограммы, который еще не завершился возвратом. Например, если подпрограмма с именем DrawLineв данный момент выполняется, будучи вызванной подпрограммой DrawSquare, верхняя часть стека вызовов может быть выложена так, как на соседнем рисунке.

Диаграмму, подобную этой, можно нарисовать в любом направлении, пока понятно размещение вершины, а значит, и направление роста стека. Архитектуры различаются в том, растут ли стеки вызовов в сторону более высоких адресов или в сторону более низких адресов, поэтому логика любой диаграммы не зависит от этого выбора адресации по соглашению.

Кадр стека в верхней части стека предназначен для текущей выполняемой процедуры, которая может получать доступ к информации внутри своего кадра (например, к параметрам или локальным переменным) в любом порядке. ^[1] Кадр стека обычно включает в себя как минимум следующие элементы (в порядке отправки):

аргументы (значения параметров), переданные в процедуру (если таковые имеются);
обратный адрес обратно вызывающей подпрограмме (например, в DrawLineстековом кадре, адрес в DrawSquareкоде); и
место для локальных переменных процедуры (если таковые имеются).

Указатели стека и кадра

Когда размеры стекового кадра могут различаться, например, между различными функциями или между вызовами определенной функции, извлечение кадра из стека не представляет собой фиксированного уменьшения указателя стека . При возврате функции указатель стека вместо этого восстанавливается до указателя кадра , значения указателя стека непосредственно перед вызовом функции. Каждый стековый кадр содержит указатель стека на вершину кадра, расположенного непосредственно под ним. Указатель стека — это изменяемый регистр, общий для всех вызовов. Указатель кадра данного вызова функции — это копия указателя стека, каким он был до вызова функции. ^[2]

Расположение всех остальных полей в кадре может быть определено либо относительно верха кадра, как отрицательные смещения указателя стека, либо относительно верха кадра ниже, как положительные смещения указателя кадра. Расположение самого указателя кадра должно быть по своей сути определено как отрицательное смещение указателя стека.

Сохранение адреса в памяти вызывающего абонента

В большинстве систем стековый кадр имеет поле для хранения предыдущего значения регистра указателя кадра, значение, которое он имел во время выполнения вызывающей стороны. Например, стековый кадр DrawLineбудет иметь область памяти, содержащую значение указателя кадра, которое DrawSquareиспользует (не показано на схеме выше). Значение сохраняется при входе в подпрограмму. Наличие такого поля в известном месте в стековом кадре позволяет коду получать доступ к каждому кадру последовательно под кадром текущей выполняемой процедуры, а также позволяет процедуре легко восстанавливать указатель кадра на кадр вызывающей стороны , непосредственно перед возвратом.

Лексически вложенные процедуры

Языки программирования, поддерживающие вложенные подпрограммы, также имеют поле в кадре вызова, которое указывает на кадр стека последней активации процедуры, которая наиболее близко инкапсулирует вызываемую функцию, т. е. непосредственную область действия вызываемой функции. Это называется ссылкой доступа или статической ссылкой (поскольку она отслеживает статическую вложенность во время динамических и рекурсивных вызовов) и предоставляет подпрограмме (а также любым другим подпрограммам, которые она может вызывать) доступ к локальным данным ее инкапсулирующих подпрограмм на каждом уровне вложенности. Некоторые архитектуры, компиляторы или случаи оптимизации хранят одну ссылку для каждого включающего уровня (а не только непосредственно включающего), так что глубоко вложенные подпрограммы, которые обращаются к неглубоким данным, не должны проходить несколько ссылок; эта стратегия часто называется «отображением». ^[3]

Ссылки доступа можно оптимизировать, когда внутренняя функция не обращается ни к каким (неконстантным) локальным данным в инкапсуляции, как в случае с чистыми функциями, взаимодействующими только через аргументы и возвращаемые значения, например. Некоторые исторические компьютеры, такие как Electrologica X8 и несколько позже большие системы Burroughs , имели специальные «регистры отображения» для поддержки вложенных функций, в то время как компиляторы для большинства современных машин (таких как вездесущий x86) просто резервируют несколько слов в стеке для указателей по мере необходимости.

Перекрывать

Для некоторых целей кадр стека подпрограммы и кадр ее вызывающей стороны можно считать перекрывающимися, причем перекрытие состоит из области, где параметры передаются от вызывающей стороны к вызываемой стороне. В некоторых средах вызывающая сторона помещает каждый аргумент в стек, тем самым расширяя свой кадр стека, а затем вызывает вызываемую сторону. В других средах вызывающая сторона имеет предварительно выделенную область в верхней части своего кадра стека для хранения аргументов, которые она предоставляет другим вызываемым ею подпрограммам. Эту область иногда называют областью исходящих аргументов или областью вызова . При таком подходе размер области вычисляется компилятором как наибольший, необходимый любой вызываемой подпрограмме.

Использовать

Обработка вызовов на сайте

Обычно манипуляция стеком вызовов, необходимая в месте вызова подпрограммы, минимальна (что хорошо, поскольку может быть много мест вызовов для каждой вызываемой подпрограммы). Значения для фактических аргументов оцениваются в месте вызова, поскольку они специфичны для конкретного вызова, и либо помещаются в стек, либо в регистры, как определено используемым соглашением о вызовах . Фактическая инструкция вызова, такая как «ветвь и ссылка», затем обычно выполняется для передачи управления коду целевой подпрограммы.

Обработка записи подпрограммы

В вызываемой подпрограмме первый выполняемый код обычно называется прологом подпрограммы , поскольку он выполняет необходимые действия перед началом кода операторов подпрограммы.

Для архитектур набора инструкций, в которых инструкция, используемая для вызова подпрограммы, помещает адрес возврата в регистр, а не помещает его в стек, пролог обычно сохраняет адрес возврата, помещая значение в стек вызовов, хотя если вызываемая подпрограмма не вызывает никаких других подпрограмм, она может оставить значение в регистре. Аналогично, текущие значения указателя стека и/или указателя кадра могут быть помещены в регистр.

Если используются указатели фрейма, пролог обычно устанавливает новое значение регистра указателя фрейма из указателя стека. Пространство в стеке для локальных переменных затем может быть выделено путем инкрементного изменения указателя стека.

Язык программирования Форт допускает явное сворачивание стека вызовов (называемое там «стек возвратов»).

Обработка возврата

Когда подпрограмма готова к возврату, она выполняет эпилог, который отменяет шаги пролога. Обычно это восстанавливает сохраненные значения регистров (например, значение указателя кадра) из кадра стека, выталкивает весь кадр стека из стека, изменяя значение указателя стека, и, наконец, переходит к инструкции по адресу возврата. Согласно многим соглашениям о вызовах, элементы, выталкиваемые из стека эпилогом, включают исходные значения аргументов, и в этом случае обычно нет никаких дальнейших манипуляций со стеком, которые нужно выполнить вызывающему. Однако в некоторых соглашениях о вызовах вызывающий несет ответственность за удаление аргументов из стека после возврата.

Раскручивание

Возврат из вызванной функции вытолкнет верхний фрейм из стека, возможно, оставив возвращаемое значение. Более общее действие выталкивания одного или нескольких фреймов из стека для возобновления выполнения в другом месте программы называется раскручиванием стека и должно выполняться, когда используются нелокальные структуры управления, такие как те, которые используются для обработки исключений . В этом случае фрейм стека функции содержит одну или несколько записей, указывающих обработчики исключений. Когда выбрасывается исключение, стек раскручивается до тех пор, пока не будет найден обработчик, который готов обработать (перехватить) тип выброшенного исключения.

В некоторых языках есть другие структуры управления, требующие общей раскрутки. Pascal позволяет глобальному оператору goto передавать управление из вложенной функции в ранее вызванную внешнюю функцию. Эта операция требует раскрутки стека, удаляя столько кадров стека, сколько необходимо для восстановления надлежащего контекста для передачи управления целевому оператору внутри охватывающей внешней функции. Аналогично, в C есть функции setjmpиlongjmp , которые действуют как нелокальные goto. Common Lisp позволяет контролировать то, что происходит при раскрутке стека, с помощью unwind-protectспециального оператора.

При применении продолжения стек (логически) раскручивается, а затем раскручивается со стеком продолжения. Это не единственный способ реализации продолжений; например, используя несколько явных стеков, применение продолжения может просто активировать свой стек и накручивать значение, которое должно быть передано. Язык программирования Scheme позволяет выполнять произвольные thunks в указанных точках при «раскручивании» или «перекручивании» стека управления при вызове продолжения.

Инспекция

Стек вызовов иногда можно проверять во время работы программы. В зависимости от того, как программа написана и скомпилирована, информация в стеке может использоваться для определения промежуточных значений и трассировок вызовов функций. Это использовалось для генерации мелкозернистых автоматизированных тестов ^[4] , а в таких случаях, как Ruby и Smalltalk, для реализации первоклассных продолжений. Например, отладчик GNU Debugger (GDB) реализует интерактивную проверку стека вызовов работающей, но приостановленной программы на языке C ^{[5] .}

Регулярное взятие образцов стека вызовов может быть полезным при профилировании производительности программ, поскольку, если адрес подпрограммы появляется в данных выборки стека вызовов много раз, он, скорее всего, будет выступать в качестве узкого места кода и должен быть проверен на предмет проблем производительности.

Безопасность

В языке со свободными указателями или непроверяемыми записями в массиве (например, в C) смешивание данных потока управления, которые влияют на выполнение кода (адреса возврата или указатели сохраненных кадров), и простых данных программы (параметры или возвращаемые значения) в стеке вызовов представляет собой угрозу безопасности и может быть использовано с целью взлома через переполнение буфера стека , которое является наиболее распространенным типом переполнения буфера .

Одна из таких атак включает заполнение одного буфера произвольным исполняемым кодом, а затем переполнение этого или какого-либо другого буфера для перезаписи некоторого адреса возврата значением, которое указывает непосредственно на исполняемый код. В результате, когда функция возвращается, компьютер выполняет этот код. Этот вид атаки можно заблокировать с помощью W^X , ^{[ требуется цитата ],} но подобные атаки могут быть успешными даже при включенной защите W^X, включая атаку return-to-libc или атаки, исходящие из возвратно-ориентированного программирования . Были предложены различные смягчения, такие как хранение массивов в совершенно отдельном месте от стека возврата, как это имеет место в языке программирования Forth. ^[6]

Смотрите также

Ссылки

^ Кржижановски, Пол (16 февраля 2018 г.). «Стековые кадры». Ратгерский университет . Архивировано из оригинала 28-08-2021 . Получено 19 декабря 2021 г.
^ "Понимание стека". cs.umd.edu . 2003-06-22. Архивировано из оригинала 2013-02-25 . Получено 2014-05-21 .
^ Альтернативная конструкция микропроцессора
^ McMaster, S.; Memon, A. (2006). Call Stack Coverage for GUI Test-Suite Reduction (PDF) . 17-й Международный симпозиум по проектированию надежности программного обеспечения ( ISSRE '06). стр. 33–44. CiteSeerX 10.1.1.88.873 . doi :10.1109/ISSRE.2006.19. ISBN 0-7695-2684-5.
^ "Отладка с помощью GDB: исследование стека". chemie.fu-berlin.de . 1997-10-17. Архивировано из оригинала 2021-04-14 . Получено 2014-12-16 .
^ Дуг Хойт. «Язык программирования Forth — почему ВАМ следует его изучить».

Дальнейшее чтение

Дейкстра, EW (1960). «Рекурсивное программирование». Числовая математика . 2 (1): 312–318. дои : 10.1007/BF01386232.
Wilson, PR; Johnstone, MS; Neely, M.; Boles, D. (1995). "Динамическое распределение памяти: обзор и критический обзор". Управление памятью . Конспект лекций по информатике. Том 986. С. 1–116. CiteSeerX 10.1.1.47.275 . doi :10.1007/3-540-60368-9_19. ISBN 978-3-540-60368-9.
"2.4. Стек". Руководство по программированию на языке ассемблера MCS-4 - Руководство по программированию микрокомпьютерной системы INTELLEC 4 (PDF) (Предварительное издание). Санта-Клара, Калифорния, США: Intel Corporation . Декабрь 1973 г. стр. 2-7–2-8. MCS-030-1273-1. Архивировано (PDF) из оригинала 01.03.2020 . Получено 02.03.2020 .(Примечание. 4-битный процессор Intel 4004 реализует внутренний стек, а не стек в памяти.)

Внешние ссылки

Вызов функций и операции указателя кадра в 68000 Архивировано 24 июля 2010 г. на Wayback Machine
Проект libunwind — платформенно-независимый API раскручивания