stringtranslate.com

Некорневое двоичное дерево

Кладограмма в виде бинарного дерева без корней, показывающая сходства и историю эволюции видов актинобактерий .

В математике и информатике некорневое двоичное дерево — это некорневое дерево , в котором каждая вершина имеет одного или трех соседей.

Определения

Свободное дерево или некорневое дерево — это связный неориентированный граф без циклов . Вершины с одним соседом являются листьями дерева, а остальные вершины — внутренними узлами дерева. Степень вершины — это количество ее соседей; в дереве с более чем одним узлом листьями являются вершины степени один. Некорневое двоичное дерево — это свободное дерево, в котором все внутренние узлы имеют степень ровно три.

В некоторых приложениях может иметь смысл различать подтипы некорневых бинарных деревьев: плоское вложение дерева можно исправить, указав циклический порядок ребер в каждой вершине, превратив его в плоское дерево . В информатике бинарные деревья часто имеют корни и упорядочены, когда они используются в качестве структур данных , но в приложениях неукорененных бинарных деревьев в иерархической кластеризации и эволюционной реконструкции деревьев более распространены неупорядоченные деревья. [1]

Кроме того, можно различать деревья, в которых все вершины имеют разные метки, деревья, в которых помечены только листья, и деревья, в которых узлы не помечены. В некорневом двоичном дереве с n листьями будет n  - 2 внутренних узлов, поэтому метки можно брать из набора целых чисел от 1 до 2 n  - 1, когда нужно пометить все узлы, или из набора целых чисел. от 1 до n , когда необходимо пометить только листья. [1]

Связанные структуры

Укорененные бинарные деревья

Некорневое двоичное дерево T можно преобразовать в полное корневое двоичное дерево (то есть корневое дерево, в котором каждый нелистовой узел имеет ровно два дочерних узла), выбрав корневое ребро e из T и поместив новый корневой узел в середине. e и направляя каждое ребро полученного разделенного дерева от корневого узла. И наоборот, любое полностью корневое двоичное дерево можно преобразовать в некорневое двоичное дерево, удалив корневой узел, заменив путь между двумя его дочерними элементами одним ненаправленным ребром и подавив ориентацию остальных ребер в графе. По этой причине  полнокорневых бинарных деревьев с n листьями ровно в 2 n -3 раза больше , чем некорневых бинарных деревьев с n листьями. [1]

Иерархическая кластеризация

Иерархическую кластеризацию набора объектов можно формализовать как максимальное семейство множеств объектов, в котором никакие два множества не пересекаются. То есть для каждых двух множеств S и T в семействе либо S и T не пересекаются, либо одно является подмножеством другого, и при сохранении этого свойства в семейство больше нельзя добавлять множества. Если T — некорневое двоичное дерево, оно определяет иерархическую кластеризацию своих листьев: для каждого ребра ( u , v ) в T существует кластер, состоящий из листьев, которые ближе к u , чем к v , и эти множества вместе с пустое множество и множество всех листьев образуют максимальное непересекающееся семейство. И наоборот, из любого максимального непересекающегося семейства множеств над набором из n элементов можно сформировать уникальное некорневое двоичное дерево, имеющее узел для каждой тройки ( A , B , C ) непересекающихся множеств в семействе, которые вместе покрывают все элементов. [2]

Эволюционные деревья

Согласно простым формам теории эволюции , историю жизни можно резюмировать как филогенетическое дерево , в котором каждый узел описывает вид, листья представляют виды, существующие сегодня, а ребра представляют отношения предков-потомков между видами. Это дерево имеет естественную ориентацию от предков к потомкам и корень у общего предка вида, поэтому является укорененным деревом. Однако некоторые методы реконструкции бинарных деревьев позволяют восстановить только узлы и ребра этого дерева, но не их ориентации.

Например, кладистические методы , такие как максимальная экономия, используют в качестве данных набор бинарных атрибутов, описывающих особенности вида. Эти методы ищут дерево с заданным видом в виде листьев, в котором внутренние узлы также помечены признаками, и пытаются минимизировать количество раз, когда какой-либо признак присутствует только в одной из двух конечных точек ребра в дереве. В идеале каждый объект должен иметь только одно ребро. Изменение корня дерева не меняет этого количества различий ребер, поэтому методы, основанные на экономии, не способны определить местоположение корня дерева и создают некорневое дерево, часто некорневое двоичное дерево. [3]

Некорневые бинарные деревья также создаются с помощью методов построения эволюционных деревьев на основе данных квартета, определяющих для каждых четырех видов листьев некорневое двоичное дерево, описывающее эволюцию этих четырех видов, а также методами, которые используют квартетное расстояние для измерения расстояния между деревьями. [4]

Ветвевая декомпозиция

Некорневые двоичные деревья также используются для определения разложений графов путем формирования некорневого двоичного дерева, листья которого представляют собой ребра данного графа. То есть ветвевую декомпозицию можно рассматривать как иерархическую кластеризацию ребер графа. Декомпозиция ветвей и связанная с ней числовая величина, ширина ветвей, тесно связаны с шириной дерева и составляют основу эффективных алгоритмов динамического программирования на графах. [5]

Перечисление

Из-за их применения в иерархической кластеризации наиболее естественной задачей перечисления графов некорневых двоичных деревьев является подсчет количества деревьев с n помеченными листьями и неразмеченными внутренними узлами. Некорневое двоичное дерево на n помеченных листьях можно сформировать путем соединения n -го листа с новым узлом в середине любого из ребер некорневого двоичного дерева на n  - 1 помеченных листьях. Существует 2 n  − 5 ребер, к которым можно прикрепить n- й узел; следовательно, количество деревьев на n листьях больше количества деревьев на n - 1 листьях в 2 n - 5  раз  . Таким образом, количество деревьев на n помеченных листьях представляет собой двойной факториал

[6]

Количество деревьев на 2, 3, 4, 5, ... помеченных листьях равно

1, 1, 3, 15, 105, 945, 10395, 135135, 2027025, 34459425, ... (последовательность A001147 в OEIS ).

Фундаментальные равенства

Длина пути от листа к листу в фиксированном некорневом двоичном дереве (UBT) T кодирует количество ребер, принадлежащих уникальному пути в T, соединяющему данный лист с другим листом. Например, если обратиться к UBT, показанному на изображении справа, длина пути между листьями 1 и 2 равна 2, тогда как длина пути между листьями 1 и 3 равна 3. Длина пути последовательность от заданного листа на фиксированном УБТ T кодирует длины путей от данного листа ко всем остальным. Например, если обратиться к UBT, показанному на изображении справа, последовательность длин путей из листа 1 равна . Набор последовательностей длины пути, связанных с листьями T, обычно называют набором последовательностей длины пути T [7] .

Пример некорневого двоичного дерева с четырьмя листьями

Даниэле Катандзаро, Раффаэле Пезенти и Лоуренс Вулси показали [7] , что коллекция последовательностей длин путей, кодирующая данный UBT с n листьями, должна удовлетворять определенным равенствам, а именно:

Доказано, что эти равенства необходимы и независимы для набора длин путей для кодирования UBT с n листьями. [7] В настоящее время неизвестно, достаточны ли они.

Альтернативные названия

Некорневые бинарные деревья также называются свободными двоичными деревьями , [8] кубическими деревьями , [9] троичными деревьями [5] и некорневыми троичными деревьями . [10] Однако название «свободное двоичное дерево» также применяется к некорневым деревьям, которые могут иметь узлы второй степени [11] , а также к корневым двоичным деревьям с неупорядоченными дочерними элементами [12] , а название «тройное дерево» более распространено. часто используется для обозначения корневого дерева с тремя дочерними элементами на узел .

Примечания

  1. ^ abc Furnas (1984).
  2. ^ См., например, Эппштейн (2009) для того же соответствия между кластеризацией и деревьями, но с использованием корневых двоичных деревьев вместо некорневых деревьев и, следовательно, включая произвольный выбор корневого узла.
  3. ^ Хенди и Пенни (1989).
  4. ^ Сент-Джон и др. (2003).
  5. ^ Аб Робертсон и Сеймур (1991).
  6. ^ Болдинг, Бишоп и Каннингс (2007).
  7. ^ abcd Катандзаро Д., Песенти Р., Уолси Л. (2020). «О сбалансированном многограннике минимальной эволюции». Дискретная оптимизация . 36 : 100570. doi : 10.1016/j.disopt.2020.100570 . S2CID  213389485.
  8. ^ Чумай и Гиббонс (1996).
  9. ^ Эксу (1996).
  10. ^ Чилибраси и Витаньи (2006).
  11. ^ Харари, Палмер и Робинсон (1992).
  12. ^ Пшитицка и Лармор (1994).

Рекомендации