В компьютерном программировании таблица виртуальных методов ( VMT ), таблица виртуальных функций , таблица виртуальных вызовов , таблица диспетчеризации , vtable или vftable — это механизм, используемый в языке программирования для поддержки динамической диспетчеризации (или привязки методов во время выполнения ).
Всякий раз, когда класс определяет виртуальную функцию (или метод ), большинство компиляторов добавляют в класс скрытую переменную-член , которая указывает на массив указателей на (виртуальные) функции, называемый таблицей виртуальных методов. Эти указатели используются во время выполнения для вызова соответствующих реализаций функций, поскольку во время компиляции может быть еще неизвестно, должна ли быть вызвана базовая функция или производная, реализованная классом, который наследует от базового класса.
Существует множество различных способов реализации такой динамической диспетчеризации, но использование таблиц виртуальных методов особенно распространено среди C++ и родственных языков (таких как D и C# ). Языки, которые отделяют программный интерфейс объектов от реализации, такие как Visual Basic и Delphi , также склонны использовать этот подход, поскольку он позволяет объектам использовать другую реализацию, просто используя другой набор указателей на методы. Этот метод позволяет создавать внешние библиотеки, где другие методы, возможно, не могут. [1]
Предположим , что программа содержит три класса в иерархии наследования: суперкласс Cat и два подкласса HouseCat и Lion . Класс Cat определяет виртуальную функцию с именем speak , поэтому его подклассы могут предоставлять соответствующую реализацию (например, meow или roar ). Когда программа вызывает функцию speak для ссылки Cat (которая может ссылаться на экземпляр Cat или экземпляр HouseCat или Lion ), код должен иметь возможность определить, какой реализации функции должен быть отправлен вызов . Это зависит от фактического класса объекта, а не от класса ссылки на него ( Cat ). Класс, как правило, не может быть определен статически (то есть во время компиляции ), поэтому компилятор также не может решить, какую функцию вызывать в это время. Вместо этого вызов должен быть отправлен правильной функции динамически (то есть во время выполнения ).
Таблица виртуальных методов объекта будет содержать адреса динамически связанных методов объекта. Вызовы методов выполняются путем извлечения адреса метода из таблицы виртуальных методов объекта. Таблица виртуальных методов одинакова для всех объектов, принадлежащих одному классу, и поэтому обычно является общей для них. Объекты, принадлежащие к классам, совместимым по типу (например, родственные элементы в иерархии наследования), будут иметь таблицы виртуальных методов с одинаковой компоновкой: адрес данного метода будет отображаться с тем же смещением для всех классов, совместимых по типу. Таким образом, извлечение адреса метода из заданного смещения в таблицу виртуальных методов позволит получить метод, соответствующий фактическому классу объекта. [2]
Стандарты C++ не определяют, как именно должна быть реализована динамическая диспетчеризация, но компиляторы обычно используют незначительные изменения одной и той же базовой модели.
Обычно компилятор создает отдельную таблицу виртуальных методов для каждого класса. Когда создается объект, указатель на эту таблицу, называемый указателем виртуальной таблицы , vpointer или VPTR , добавляется как скрытый член этого объекта. Таким образом, компилятор также должен генерировать «скрытый» код в конструкторах каждого класса для инициализации указателя виртуальной таблицы нового объекта по адресу таблицы виртуальных методов его класса.
Многие компиляторы помещают указатель виртуальной таблицы в качестве последнего члена объекта; другие компиляторы помещают его в качестве первого; переносимый исходный код работает в любом случае. [3] Например, g++ ранее помещал указатель в конец объекта. [4]
Рассмотрим следующие объявления классов в синтаксисе C++ :
класс B1 { public : virtual ~ B1 () {} void fnonvirtual () {} virtual void f1 () {} int int_in_b1 ; }; класс B2 { public : virtual ~ B2 () {} virtual void f2 () {} int int_in_b2 ; };
используется для вывода следующего класса:
класс D : public B1 , public B2 { public : void d () {} void f2 () override {} int int_in_d ; };
и следующий фрагмент кода C++:
B2 * b2 = новый B2 (); D * d = новый D ();
g++ 3.4.6 из GCC создает следующую 32-битную структуру памяти для объекта b2
: [примечание 1]
б2: +0: указатель на таблицу виртуальных методов B2 +4: значение int_in_b2таблица виртуальных методов B2: +0: B2::f2()
и следующая структура памяти для объекта d
:
г: +0: указатель на таблицу виртуальных методов D (для B1) +4: значение int_in_b1 +8: указатель на таблицу виртуальных методов D (для B2) +12: значение int_in_b2 +16: значение int_in_dОбщий размер: 20 байт.Таблица виртуальных методов D (для B1): +0: B1::f1() // B1::f1() не переопределяетсятаблица виртуальных методов D (для B2): +0: D::f2() // B2::f2() переопределяется D::f2() // Расположение B2::f2 отсутствует в таблице виртуальных методов для D
Обратите внимание, что те функции, которые не содержат ключевое слово virtual
в своем объявлении (например, fnonvirtual()
и d()
), обычно не отображаются в таблице виртуальных методов. Существуют исключения для особых случаев, как это предусмотрено конструктором по умолчанию .
Также обратите внимание на виртуальные деструкторы в базовых классах B1
и B2
. Они необходимы для обеспечения delete d
освобождения памяти не только для D
, но и для B1
и B2
, если d
это указатель или ссылка на типы B1
или B2
. Они были исключены из макетов памяти для простоты примера. [примечание 2]
Переопределение метода f2()
в классе D
реализуется путем дублирования таблицы виртуальных методов B2
и замены указателя на B2::f2()
указателем на D::f2()
.
Компилятор g++ реализует множественное наследование классов B1
и B2
в классе D
с помощью двух таблиц виртуальных методов, по одной для каждого базового класса. (Существуют и другие способы реализации множественного наследования, но этот является наиболее распространенным.) Это приводит к необходимости «исправления указателей», также называемых thunks , при приведении типов .
Рассмотрим следующий код C++:
D * d = новый D (); B1 * b1 = d ; B2 * b2 = d ;
В то время как d
и b1
будут указывать на то же место в памяти после выполнения этого кода, b2
будет указывать на место d+8
(на восемь байт дальше места в памяти d
). Таким образом, b2
указывает на область внутри d
, которая «выглядит как» экземпляр B2
, т. е. имеет ту же структуру памяти, что и экземпляр B2
. [ необходимо разъяснение ]
Вызов d->f1()
обрабатывается путем разыменования d
vpointer D::B1
, поиска f1
записи в таблице виртуальных методов и последующего разыменования этого указателя для вызова кода.
Единичное наследование
В случае одиночного наследования (или в языке только с одиночным наследованием), если vpointer всегда является первым элементом d
(как это происходит во многих компиляторах), это сводится к следующему псевдо-C++:
( * (( * д )[ 0 ]))( д )
Где *d
относится к таблице виртуальных методов, D
а [0]
относится к первому методу в таблице виртуальных методов. Параметр d
становится указателем " this
" на объект.
Множественное наследование
В более общем случае вызов B1::f1()
или D::f2()
более сложен:
( * ( * ( d [ 0 ] /*указатель на таблицу виртуальных методов D (для B1)*/ )[ 0 ]))( d ) /* Вызов d->f1() */ ( * ( * ( d [ 8 ] /*указатель на таблицу виртуальных методов D (для B2)*/ )[ 0 ]))( d + 8 ) /* Вызов d->f2() */
Вызов d->f1()
передает B1
указатель как параметр. Вызов d->f2()
передает B2
указатель как параметр. Этот второй вызов требует исправления для создания правильного указателя. Расположение B2::f2
отсутствует в таблице виртуальных методов для D
.
Для сравнения, вызов d->fnonvirtual()
гораздо проще:
( * B1 :: fnonvirtual )( d )
Виртуальный вызов требует как минимум дополнительного индексированного разыменования и иногда добавления "fixup" по сравнению с невиртуальным вызовом, который является просто переходом к скомпилированному указателю. Поэтому вызов виртуальных функций по своей сути медленнее, чем вызов невиртуальных функций. Эксперимент, проведенный в 1996 году, показывает, что примерно 6–13% времени выполнения тратится просто на диспетчеризацию правильной функции, хотя накладные расходы могут достигать 50%. [5] Стоимость виртуальных функций может быть не такой высокой на современных архитектурах ЦП из-за гораздо большего кэша и лучшего предсказания ветвлений .
Кроме того, в средах, где JIT-компиляция не используется, вызовы виртуальных функций обычно не могут быть встроены . В некоторых случаях компилятор может выполнить процесс, известный как девиртуализация , в котором, например, поиск и косвенный вызов заменяются условным выполнением каждого встроенного тела, но такие оптимизации не распространены.
Чтобы избежать этих накладных расходов, компиляторы обычно избегают использования таблиц виртуальных методов всякий раз, когда вызов может быть разрешен во время компиляции .
Таким образом, вызов f1
выше может не потребовать поиска в таблице, поскольку компилятор может определить, что в этой точке d
может содержаться только , и не переопределяет . Или компилятор (или оптимизатор) может обнаружить, что в программе нет подклассов , которые переопределяют . Вызов или , вероятно, не потребует поиска в таблице, поскольку реализация указана явно (хотя она все еще требует исправления указателя 'this').D
D
f1
B1
f1
B1::f1
B2::f2
Таблица виртуальных методов, как правило, является хорошим компромиссом производительности для достижения динамической диспетчеризации, но существуют альтернативы, такие как диспетчеризация двоичного дерева, с более высокой производительностью в некоторых типичных случаях, но с другими компромиссами. [1] [6]
Однако таблицы виртуальных методов допускают только однократную диспетчеризацию по специальному параметру «this», в отличие от множественной диспетчеризации (как в CLOS , Dylan или Julia ), где типы всех параметров могут учитываться при диспетчеризации.
Таблицы виртуальных методов также работают только в том случае, если диспетчеризация ограничена известным набором методов, поэтому их можно поместить в простой массив, созданный во время компиляции, в отличие от языков с утиной типизацией (таких как Smalltalk , Python или JavaScript ).
Языки, которые предоставляют одну или обе эти функции, часто выполняют диспетчеризацию, просматривая строку в хэш-таблице или используя какой-либо другой эквивалентный метод. Существует множество методов, позволяющих сделать это быстрее (например, интернирование /токенизация имен методов, кэширование поисков, компиляция just-in-time ).
-fdump-class-hierarchy
(начиная с версии 8: -fdump-lang-class
) может использоваться для дампа таблиц виртуальных методов для ручной проверки. Для компилятора AIX VisualAge XlC используйте -qdump_class_hierarchy
для дампа иерархии классов и макета таблицы виртуальных функций.{{cite web}}
: CS1 maint: бот: исходный статус URL неизвестен ( ссылка )