Таблица виртуальных методов

В компьютерном программировании таблица виртуальных методов ( VMT ), таблица виртуальных функций , таблица виртуальных вызовов , таблица диспетчеризации , vtable или vftable — это механизм, используемый в языке программирования для поддержки динамической диспетчеризации (или привязки метода во время выполнения ).

Всякий раз, когда класс определяет виртуальную функцию (или метод ), большинство компиляторов добавляют в класс скрытую переменную-член , которая указывает на массив указателей на (виртуальные) функции, называемые таблицей виртуальных методов. Эти указатели используются во время выполнения для вызова соответствующих реализаций функций, поскольку во время компиляции еще может быть неизвестно, должна ли вызываться базовая функция или производная функция, реализованная классом, наследуемым от базового класса.

Существует множество различных способов реализации такой динамической диспетчеризации, но использование таблиц виртуальных методов особенно распространено в C++ и родственных языках (таких как D и C# ). Языки, которые отделяют программный интерфейс объектов от реализации, такие как Visual Basic и Delphi , также склонны использовать этот подход, поскольку он позволяет объектам использовать другую реализацию, просто используя другой набор указателей методов. Этот метод позволяет создавать внешние библиотеки там, где другие методы, возможно, невозможны. ^[1]

Предположим , программа содержит три класса в иерархии наследования: суперкласс Cat и два подкласса HouseCat и Lion . Класс Cat определяет виртуальную функцию с именем talk , поэтому его подклассы могут предоставлять соответствующую реализацию (например, meow или roar ). Когда программа вызывает функцию talk по ссылке Cat (которая может ссылаться на экземпляр Cat или экземпляр HouseCat или Lion ), код должен иметь возможность определить, какой реализации функции следует передать вызов . Это зависит от фактического класса объекта, а не от класса ссылки на него ( Cat ). Класс обычно не может быть определен статически (то есть во время компиляции ), поэтому компилятор также не может решить, какую функцию вызывать в этот момент. Вместо этого вызов должен быть перенаправлен на нужную функцию динамически (то есть во время выполнения ).

Выполнение

Таблица виртуальных методов объекта будет содержать адреса динамически связанных методов объекта. Вызовы методов выполняются путем получения адреса метода из таблицы виртуальных методов объекта. Таблица виртуальных методов одинакова для всех объектов, принадлежащих одному классу, и поэтому обычно используется ими совместно. Объекты, принадлежащие к совместимым по типу классам (например, братьям и сестрам в иерархии наследования), будут иметь таблицы виртуальных методов с одинаковым макетом: адрес данного метода будет отображаться с одинаковым смещением для всех совместимых по типу классов. Таким образом, при извлечении адреса метода из заданного смещения в таблицу виртуальных методов будет получен метод, соответствующий фактическому классу объекта. ^[2]

Стандарты C++ не предписывают, как именно должна быть реализована динамическая диспетчеризация, но компиляторы обычно используют небольшие вариации одной и той же базовой модели.

Обычно компилятор создает отдельную таблицу виртуальных методов для каждого класса. При создании объекта указатель на эту таблицу, называемый указателем виртуальной таблицы , vpointer или VPTR , добавляется в качестве скрытого члена этого объекта. Таким образом, компилятор также должен генерировать «скрытый» код в конструкторах каждого класса, чтобы инициализировать указатель виртуальной таблицы нового объекта по адресу таблицы виртуальных методов его класса.

Многие компиляторы помещают указатель виртуальной таблицы в качестве последнего члена объекта; другие составители ставят его первым; переносимый исходный код работает в любом случае. ^[3] Например, g++ ранее помещал указатель в конец объекта. ^[4]

Пример

Рассмотрим следующие объявления классов в синтаксисе C++ :

класс B1 { public : virtual ~ B1 () {} void fnonvirtual () {} virtual void f1 () {} int int_in_b1 ; };              класс B2 { public : virtual ~ B2 () {} virtual void f2 () {} int int_in_b2 ; };

используется для получения следующего класса:

класс D : public B1 , public B2 { public : void d () {} void f2 () override {} int int_in_d ; };

и следующий фрагмент кода C++:

B2 * b2 = новый B2 (); D * d = новый D ();

g++ 3.4.6 из GCC создает следующую 32-битную структуру памяти для объекта b2: ^{[nb 1]}

Би 2: +0: указатель на таблицу виртуальных методов B2. +4: значение int_in_b2Таблица виртуальных методов B2: +0: B2::f2()

и следующее расположение памяти для объекта d:

д: +0: указатель на таблицу виртуальных методов D (для B1) +4: значение int_in_b1 +8: указатель на таблицу виртуальных методов D (для B2) +12: значение int_in_b2 +16: значение int_in_dОбщий размер: 20 байт.Таблица виртуальных методов D (для B1): +0: B1::f1() // B1::f1() не переопределяетсяТаблица виртуальных методов D (для B2): +0: D::f2() // B2::f2() переопределяется D::f2() // Местоположение B2::f2 отсутствует в таблице виртуальных методов для D

Обратите внимание, что функции, не содержащие ключевого слова virtualв своем объявлении (например, fnonvirtual()и d()), обычно не отображаются в таблице виртуальных методов. Существуют исключения для особых случаев, заданных конструктором по умолчанию .

Также обратите внимание на виртуальные деструкторы в базовых классах B1и B2. Они необходимы для того, чтобы delete dможно было освободить память не только для D, но и для B1и B2, если dэто указатель или ссылка на типы B1или B2. Они были исключены из макетов памяти, чтобы упростить пример. ^{[номер 2]}

Переопределение метода f2() в классе Dреализуется путем дублирования таблицы виртуальных методов B2и замены указателя на B2::f2()указатель на D::f2().

Множественное наследование и переходы

Компилятор g++ реализует множественное наследование классов B1и B2внутри класса D, используя две таблицы виртуальных методов, по одной для каждого базового класса. (Есть и другие способы реализации множественного наследования, но этот является наиболее распространенным.) Это приводит к необходимости «исправления указателя», также называемого thunks , при приведении типов .

Рассмотрим следующий код C++:

D * d = новый D (); B1 * b1 = d ; B2 * b2 = d ;

Хотя dи b1будет указывать на ту же ячейку памяти после выполнения этого кода, b2будет указывать на это место d+8(на восемь байтов дальше места в памяти d). Таким образом, b2указывает на область внутри d, которая «выглядит» как экземпляр B2, т. е. имеет ту же структуру памяти, что и экземпляр B2. ^{[ нужны разъяснения ]}

Призыв

Вызов d->f1()обрабатывается путем разыменования dvpointer D::B1, поиска f1записи в таблице виртуальных методов и последующего разыменования этого указателя для вызова кода.

Единое наследование

В случае одинарного наследования (или в языке только с одинарным наследованием), если vpointer всегда является первым элементом d(как это происходит во многих компиляторах), это сводится к следующему псевдо-C++:

( * (( * d )[ 0 ]))( d )

Где *dотносится к таблице виртуальных методов Dи [0]относится к первому методу в таблице виртуальных методов. Параметр dстановится указателем thisна объект.

Множественное наследование

В более общем случае вызов B1::f1()or D::f2()более сложен:

( * ( * ( d [ 0 ] /*указатель на таблицу виртуальных методов D (для B1)*/ )[ 0 ]))( d ) /* Вызов d->f1() */ ( * ( * ( d [ 8 ] /*указатель на таблицу виртуальных методов D (для B2)*/ )[ 0 ]))( d + 8 ) /* Вызов d->f2() */

Вызов d->f1()передает B1указатель в качестве параметра. Вызов d->f2()передает B2указатель в качестве параметра. Этот второй вызов требует исправления для создания правильного указателя. Местоположение B2::f2отсутствует в таблице виртуальных методов для D.

Для сравнения, вызов d->fnonvirtual()намного проще:

( * B1 :: fневиртуальный )( d )

Эффективность

Виртуальный вызов требует как минимум дополнительного индексированного разыменования, а иногда и «исправления» по сравнению с невиртуальным вызовом, который представляет собой просто переход к скомпилированному указателю. Таким образом, вызов виртуальных функций по своей сути медленнее, чем вызов невиртуальных функций. Эксперимент, проведенный в 1996 году, показывает, что примерно 6–13% времени выполнения тратится на простое выполнение правильной функции, хотя накладные расходы могут достигать 50%. ^[5] Стоимость виртуальных функций может быть не такой высокой на современных архитектурах ЦП из-за гораздо большего размера кэша и лучшего прогнозирования ветвлений .

Более того, в средах, где JIT-компиляция не используется, вызовы виртуальных функций обычно не могут быть встроены . В некоторых случаях компилятор может выполнить процесс, известный как девиртуализация, в котором, например, поиск и косвенный вызов заменяются условным выполнением каждого встроенного тела, но такие оптимизации встречаются нечасто.

Чтобы избежать этих накладных расходов, компиляторы обычно избегают использования таблиц виртуальных методов всякий раз, когда вызов может быть разрешен во время компиляции .

Таким образом, вызов f1выше может не требовать поиска в таблице, поскольку компилятор может определить, что в этот момент dон может хранить только a и не переопределяет . Или компилятор (или оптимизатор) может обнаружить, что нигде в программе нет подклассов, которые переопределяют . Вызов или, вероятно, не потребует поиска в таблице, поскольку реализация указана явно (хотя для этого все равно требуется исправление указателя this).DDf1B1f1B1::f1B2::f2

Сравнение с альтернативами

Таблица виртуальных методов, как правило, является хорошим компромиссом в производительности для достижения динамической диспетчеризации, но существуют альтернативы, такие как диспетчеризация двоичного дерева, с более высокой производительностью в некоторых типичных случаях, но с другими компромиссами. ^[1]^[6]

Однако таблицы виртуальных методов допускают только однократную отправку по специальному параметру «this», в отличие от множественной отправки (как в CLOS , Dylan или Julia ), где типы всех параметров могут быть приняты во внимание при диспетчеризации.

Таблицы виртуальных методов также работают только в том случае, если диспетчеризация ограничена известным набором методов, поэтому их можно поместить в простой массив, созданный во время компиляции, в отличие от языков утиной типизации (таких как Smalltalk , Python или JavaScript ).

Языки, которые предоставляют одну или обе эти функции, часто осуществляют отправку данных путем поиска строки в хеш-таблице или с помощью какого-либо другого эквивалентного метода. Существует множество методов, позволяющих сделать это быстрее (например, интернирование /токенизация имен методов, кэширование поиска, своевременная компиляция ).

Смотрите также

Примечания

^ Аргумент G++ -fdump-class-hierarchy(начиная с версии 8: -fdump-lang-class) можно использовать для вывода таблиц виртуальных методов для проверки вручную. Для компилятора AIX VisualAge XlC используйте -qdump_class_hierarchyдля создания дампа иерархии классов и макета таблицы виртуальных функций.
^ "C++ - почему в виртуальной таблице два виртуальных деструктора и где находится адрес невиртуальной функции (gcc4.6.3)" .