В экстремальной теории графов лемма Семереди о регулярности утверждает, что граф можно разбить на ограниченное число частей так, чтобы ребра между частями были регулярными. Лемма показывает, что некоторые свойства случайных графов можно применять к плотным графам, например, подсчет копий заданного подграфа внутри графов. Эндре Семереди доказал лемму над двудольными графами для своей теоремы об арифметических прогрессиях в 1975 году и для общих графов в 1978 году. Варианты леммы используют различные понятия регулярности и применяются к другим математическим объектам, таким как гиперграфы .
Заявление
Чтобы формально сформулировать лемму Семереди о регулярности, мы должны формализовать, что на самом деле означает распределение ребер между частями, ведущими себя «почти случайно». Под «почти случайно» мы подразумеваем понятие, называемое ε -регулярностью. Чтобы понять, что это значит, мы сначала дадим некоторые определения. В дальнейшем G — это граф с множеством вершин V .
Определение 1. Пусть X , Y — непересекающиеся подмножества V. Плотность ребер пары ( X , Y ) определяется как:
где E ( X , Y ) обозначает множество ребер, имеющих одну конечную вершину в X и одну в Y .
Мы называем пару частей ε -регулярной, если, когда вы берете большое подмножество каждой части, их плотность ребер не слишком сильно отличается от плотности ребер пары частей. Формально,
Определение 2. При ε > 0 пара множеств вершин X и Y называется ε -регулярной , если для всех подмножеств A ⊆ X , B ⊆ Y, удовлетворяющих | A | ≥ ε| X | , | B | ≥ ε| Y | , имеем
Естественным способом определения ε -регулярного разбиения должен быть тот, где каждая пара частей является ε -регулярной. Однако некоторые графы, такие как полуграфы , требуют, чтобы многие пары разбиений (но небольшая часть всех пар) были нерегулярными. [1] Поэтому мы определим ε -регулярные разбиения как те, где большинство пар частей являются ε -регулярными.
Определение 3. Разбиение на множества называется -регулярным разбиением, если
Теперь мы можем сформулировать лемму:
Лемма регулярности Семереди. Для любого ε > 0 и положительного целого числа m существует целое число M такое, что если G — граф с по крайней мере M вершинами, то существует целое число k в диапазоне m ≤ k ≤ M и ε -регулярное разбиение множества вершин графа G на k множеств.
Граница M для числа частей в разбиении графа, полученная в результате доказательств леммы Семереди о регулярности, очень велика и задается итерированной экспонентой уровня O(ε −5 ) от m . Одно время надеялись, что истинная граница будет намного меньше, что имело бы несколько полезных приложений. Однако Гауэрс (1997) нашел примеры графов, для которых M действительно растет очень быстро и по крайней мере так же велика, как итерированная экспонента уровня ε −1/16 от m . [2]
Доказательство
Найдем ε-регулярное разбиение для заданного графа, следуя алгоритму:
Начните с раздела
Хотя разбиение не является ε-регулярным:
Найдите подмножества, которые свидетельствуют о ε-нерегулярности для каждой нерегулярной пары.
Уточните раздел, используя все подмножества свидетелей.
Мы применяем технику, называемую аргументом приращения энергии , чтобы показать, что этот процесс останавливается после ограниченного числа шагов. Для этого мы определяем меру, которая должна увеличиваться на определенную величину на каждом шаге, но она ограничена сверху и, таким образом, не может увеличиваться бесконечно. Эта мера называется «энергия», поскольку она является величиной .
Определение 4. Пусть U , W — подмножества V. Набор . Энергия пары ( U , W ) определяется как:
Для разделов U и W мы определяем энергию как сумму энергий между каждой парой частей:
Наконец , для разбиения V определим энергию как . В частности,
Обратите внимание, что энергия находится в диапазоне от 0 до 1, поскольку плотность ребер ограничена сверху 1:
Теперь начнем с доказательства того, что энергия не уменьшается при уточнении.
Лемма 1. (Энергия не убывает при разбиении) Для любых разбиений и множеств вершин и , .
Доказательство: Пусть и . Выберем вершины равномерно из и равномерно из , причем частично и частично . Затем определим случайную величину . Давайте рассмотрим свойства . Ожидание равно
Второй момент -
По выпуклости, . Переставляя, получаем, что для всех .
Если каждая часть далее разбивается, новое разбиение называется уточнением . Теперь, если , применение Леммы 1 к каждой паре доказывает, что для каждого уточнения , . Таким образом, шаг уточнения в алгоритме не теряет никакой энергии.
Лемма 2. (Лемма о повышении энергии) Если не является -регулярным, как следует из , то,
Доказательство: Определим , как указано выше. Тогда,
Но заметьте, что с вероятностью (соответствующей и ), поэтому
Теперь мы можем доказать аргумент о приращении энергии, который показывает, что энергия существенно увеличивается при каждой итерации алгоритма.
Лемма 3 (лемма об увеличении энергии) Если разбиение не является -регулярным, то существует уточнение , в котором каждое разбивается на не более чем части, такие, что
Доказательство: Для всех таких, что не является -регулярным, найдите и , которые являются свидетелями нерегулярности (сделайте это одновременно для всех нерегулярных пар). Пусть будет общим уточнением по 's. Каждый из них разбивается на не более чем части по желанию. Затем,
Где разбиение задано . По лемме 1 указанная величина не менее
Так как при создании разрезается на , то и уточнение . По лемме 2 указанная выше сумма не менее
Но вторая сумма по крайней мере не меньше, так как не является -регулярной, поэтому выводим искомое неравенство.
Теперь, начиная с любого разбиения, мы можем продолжать применять Лемму 3 до тех пор, пока полученное разбиение не будет -регулярным. Но на каждом шаге энергия увеличивается на , и она ограничена сверху 1. Затем этот процесс может повторяться максимальное количество раз, прежде чем он прекратится, и мы должны иметь -регулярное разбиение.
Приложения
Лемма о подсчете графов
Если у нас достаточно информации о регулярности графа, мы можем подсчитать количество копий определенного подграфа внутри графа с небольшой погрешностью.
Лемма о подсчете графов. Пусть будет графом с , и пусть . Пусть будет -вершинным графом с множествами вершин, таким что является -регулярным всякий раз, когда . Тогда число помеченных копий в находится в пределах
Лемма об удалении графа обобщается на индуцированные подграфы , рассматривая редактирование ребер вместо удаления только ребер. Это было доказано Алоном, Фишером, Кривелевичем и Сегеди в 2000 году. [5] Однако для этого потребовалась более сильная вариация леммы о регулярности.
Лемма регулярности Семереди не дает значимых результатов в разреженных графах . Поскольку разреженные графы имеют субконстантную плотность ребер, -регулярность тривиально выполняется. Хотя результат кажется чисто теоретическим, были предприняты некоторые попытки [6] [7] использовать метод регулярности в качестве техники сжатия для больших графов.
Закономерность Фриза-Каннана
Другое понятие регулярности было введено Фризом и Каннаном, известное как лемма о слабой регулярности. [8] Эта лемма определяет более слабое понятие регулярности, чем у Семереди, которое использует лучшие границы и может использоваться в эффективных алгоритмах.
Для данного графа разбиение его вершин называется регулярным по Фризу-Каннану, если для любой пары множеств :
Лемма о слабой регулярности для графов утверждает, что каждый граф имеет слабо -регулярное разбиение не более чем на части.
Это понятие можно распространить на графоны , определив оператор шага. Учитывая графон и разбиение , мы можем определить как шаг-графон с шагами, заданными как и значениями, заданными усреднением по каждому шагу.
Разбиение является слабо -регулярным, если:
Лемма о слабой регулярности для графонов утверждает, что каждый графон имеет слабое -регулярное разбиение на не более чем части. Как и в случае с леммой о регулярности Семереди, слабая регулярность также индуцирует лемму о подсчете.
Алгоритмические приложения
Одной из первоначальных мотиваций для разработки леммы о слабой регулярности был поиск эффективного алгоритма для оценки максимального разреза в плотном графе . [8] Было показано, что аппроксимация задачи максимального разреза за пределами 16/17 является NP-трудной , [9] однако алгоритмическая версия леммы о слабой регулярности дает эффективный алгоритм для аппроксимации максимального разреза для плотных графов в пределах аддитивной ошибки. [8] Эти идеи были далее развиты в эффективные алгоритмы выборки для оценки максимального разреза в плотных графах. [10]
Меньшие границы леммы о слабой регулярности допускают эффективные алгоритмы для нахождения -регулярного разбиения. [11] Регулярность графа далее использовалась в различных областях теоретической информатики , таких как умножение матриц [12] и сложность связи . [13]
Лемма о сильной регулярности
Сильная лемма о регулярности является более сильной вариацией леммы о регулярности, доказанной Алоном , Фишером, Кривелевичем и Сегеди в 2000 году. [5] Интуитивно она предоставляет информацию о нерегулярных парах и может быть применена для доказательства леммы об удалении индуцированного графа .
Заявление
Для любой бесконечной последовательности констант существует целое число такое, что для любого графа можно получить два (справедливых) разбиения , и такое, что выполняются следующие свойства:
уточняет , то есть каждая часть представляет собой объединение некоторого набора частей в .
является -регулярным и является -регулярным.
Доказательство
Мы применяем лемму регулярности повторно, чтобы доказать более сильную версию. Грубый план:
Начните с обычного раздела
Повторно находим его уточнение, которое является регулярным. Если приращение энергии , мы просто возвращаем . В противном случае заменяем на и продолжаем.
Начнем с регулярного разбиения с частями. Здесь соответствует границе частей в лемме о регулярности, когда .
Теперь для , мы устанавливаем , чтобы быть регулярным уточнением с частями. По аргументу приращения энергии, . Поскольку энергия ограничена в , должно быть некоторое такое, что . Мы возвращаем как .
По нашему выбору регулярных и уточняющих условий выполняется. Условие энергии выполняется тривиально. Теперь мы рассуждаем о числе частей. Мы используем индукцию, чтобы показать, что , существует такое, что . Задавая , мы имеем . Обратите внимание, что когда , , поэтому мы могли бы задать и утверждение верно для . Задавая , мы имеем
Замечания по справедливому
Разделение справедливо, если размеры любых двух множеств отличаются не более чем на . Уравнивая в каждом раунде итерации, доказательство леммы о регулярности можно было бы использовать для доказательства справедливой версии леммы о регулярности. А заменив лемму о регулярности ее справедливой версией, доказательство выше могло бы доказать справедливую версию сильной леммы о регулярности, где и являются справедливыми разделами.
Полезное следствие
Заявление
Для любой бесконечной последовательности констант существует такая, что существуют разбиение и подмножества для каждой из них , где выполняются следующие свойства:
является -регулярным для каждой пары
для всех, кроме пар
Мотивация
Следствие глубже исследует малое приращение энергии. Оно дает нам раздел вместе с подмножествами с большими размерами из каждой части, которые попарно регулярны. Кроме того, плотность между соответствующими парами подмножеств отличается "не сильно" от плотности между соответствующими частями.
Доказательство следствия
Мы докажем только более слабый результат, где второе условие требует только быть -регулярным для . Полную версию можно доказать, выбрав больше подмножеств из каждой части, которые в основном попарно регулярны, и объединив их вместе.
Пусть . Применим лемму о сильной регулярности, чтобы найти справедливое , которое является регулярным разбиением , и справедливое , которое является регулярным измельчением , такое, что и .
Теперь предположим , что мы случайным образом выбираем вершину из каждого и пусть будет набором, содержащим в . Мы утверждаем, что подмножества удовлетворяют всем условиям с вероятностью .
Задавая первое условие, тривиально верно, поскольку является справедливым разделением. Поскольку не более пар вершин находятся между нерегулярными парами в , вероятность того, что пара и является нерегулярной , по объединению границ, вероятность того, что по крайней мере одна пара , является нерегулярной . Обратите внимание, что
Итак, по неравенству Маркова , с вероятностью максимум пары могли бы иметь . По объединению границ вероятность того, что все условия выполняются .
История и расширения
Семереди (1975) впервые ввел более слабую версию этой леммы, ограниченную двудольными графами, чтобы доказать теорему Семереди , [14]
а в (Семереди 1978) он доказал полную лемму. [15] Расширения метода регулярности на гиперграфы были получены Редлем и его коллегами [16] [17] [18] и Гауэрсом . [19] [20]
Янош Комлош , Габор Шаркёзи и Эндре Семереди позже (в 1997 году) доказали в лемме о раздутии [21] [22] , что регулярные пары в лемме о регулярности Семереди ведут себя как полные двудольные графы при правильных условиях. Лемма позволила глубже изучить природу вложений больших разреженных графов в плотные графы.
Первая конструктивная версия была предоставлена Алоном, Дьюком, Лефманном, Рёдлем и Юстером. [23]
Впоследствии Фриз и Каннан предложили другую версию и расширили ее до гиперграфов. [24] Позже они создали другую конструкцию благодаря Алану Фризу и Рави Каннану, которая использует сингулярные значения матриц. [25] Можно найти более эффективные недетерминированные алгоритмы, как формально описано в блоге Теренса Тао [26] и неявно упомянуто в различных статьях. [27] [28] [29]
Неравенство Теренса Тао расширяет лемму регулярности Семереди, пересматривая ее с точки зрения теории вероятностей и теории информации вместо теории графов. [30] Теренс Тао также предоставил доказательство леммы, основанное на спектральной теории, используя матрицы смежности графов. [31]
Невозможно доказать вариант леммы о регулярности, в котором все пары множеств разбиений являются регулярными. Некоторые графы, такие как полуграфы , требуют, чтобы многие пары разбиений (но небольшая часть всех пар) были нерегулярными. [1]
Распространенным вариантом определения -регулярного разбиения является требование, чтобы все наборы вершин имели одинаковый размер, при этом оставшиеся вершины собираются в "ошибочном"-наборе, размер которого составляет не более -доли размера набора вершин .
Более сильная вариация леммы регулярности была доказана Алоном, Фишером, Кривелевичем и Сегеди при доказательстве леммы об удалении индуцированного графа. Это работает с последовательностью вместо одного и показывает, что существует разбиение с чрезвычайно регулярным уточнением, где уточнение не имеет слишком большого приращения энергии.
Лемму регулярности Семереди можно интерпретировать как утверждение, что пространство всех графов полностью ограничено (и, следовательно, предкомпактно ) в подходящей метрике ( расстоянии разреза ). Пределы в этой метрике могут быть представлены графонами ; другая версия леммы регулярности просто утверждает, что пространство графонов компактно . [32]
^ Рот, К. Ф. (1953), «О некоторых множествах целых чисел», Журнал Лондонского математического общества , 28 (1): 104–109, doi :10.1112/jlms/s1-28.1.104, MR 0051853
^ Тао, Теренс (2006), «Вариант леммы об удалении гиперграфа», Журнал комбинаторной теории , Серия A, 113 (7): 1257–1280, arXiv : math/0503572 , doi : 10.1016/j.jcta.2005.11.006 , MR 2259060, S2CID 14337591
^ Пелосин, Франческо (2018), Сжатие графов с использованием метода регулярности (диссертация на степень магистра наук), Университет Ка' Фоскари в Венеции , arXiv : 1810.07275
^ Фиоруччи, Марко; Пелосин, Франческо; Пелильо, Марчелло (февраль 2020 г.), «Отделение структуры от шума в больших графах с использованием леммы о регулярности», Pattern Recognition , 98 : 107070, arXiv : 1905.06917 , Bibcode : 2020PatRe..9807070F, doi : 10.1016/j.patcog.2019.107070, S2CID 155100313
^ abc Frieze, Alan ; Kannan, Ravi (1999), "Быстрое приближение матриц и приложения", Combinatorica , 19 (2): 175–220, doi :10.1007/s004930050052, S2CID 15231198
^ Хастад, Йохан (2001), «Некоторые оптимальные результаты неаппроксимируемости», Журнал ACM , 48 (4): 798–859, doi :10.1145/502090.502098, S2CID 5120748
^ Делламоника, Домингос; Калянасундарам, Субрахманьям; Мартин, Даниэль; Рёдль, Войтех ; Шапира, Асаф (2012), «Случайная выборка и аппроксимация MAX-CSP», SIAM Journal on Discrete Mathematics , 26 (1): 15–29, doi :10.1137/110846373
^ Бансал, Нихил; Уильямс, Райан (2009), «Леммы регулярности и комбинаторные алгоритмы», 50-й ежегодный симпозиум IEEE по основам компьютерной науки , 2009, стр. 745–754, doi :10.1109/FOCS.2009.76, ISBN978-1-4244-5116-6
^ Хайнал, Андраш ; Маас, Вольфганг; Туран, Дьёрдь (1988), «О коммуникационной сложности свойств графов», Труды двадцатого ежегодного симпозиума ACM по теории вычислений - STOC '88 , т. 26, Ассоциация вычислительной техники, стр. 186–191, doi :10.1145/62212.62228, ISBN0897912640, S2CID 17495443
^ Семереди, Эндре (1975), «О множествах целых чисел, не содержащих k элементов в арифметической прогрессии», Polska Akademia Nauk. Институт Математики. Acta Arithmetica , 27 : 199–245, doi : 10.4064/aa-27-1-199-245 , MR 0369312.
^ Семереди, Эндре (1978), «Регулярные разбиения графов», Комбинированные проблемы и теории графов (Colloq. Internat. CNRS, Univ. Orsay, Orsay, 1976) , vol. 260, Париж: CNRS, стр. 399–401, MR 0540024..
^ Франкл, Питер ; Рёдль, Войтех (2002), «Экстремальные задачи для систем множеств», Случайные структуры и алгоритмы , 20 (2): 131–164, doi :10.1002/rsa.10017.abs, MR 1884430.
^ Рёдль, Войтех ; Скокан, Йозеф (2004), «Лемма о регулярности для k -однородных гиперграфов», Случайные структуры и алгоритмы , 25 (1): 1–42, doi : 10.1002/rsa.20017, MR 2069663, S2CID 7458739.
^ Nagle, Brendan; Rödl, Vojtěch ; Schacht, Mathias (2006), "The counting lemma for regular k -uniform hypergraphs", Random Structures & Algorithms , 28 (2): 113–179, CiteSeerX 10.1.1.378.8503 , doi :10.1002/rsa.20117, MR 2198495, S2CID 14126774 .
^ Остин, Тим (2008), «О взаимозаменяемых случайных величинах и статистике больших графов и гиперграфов», Probability Surveys , 5 : 80–145, arXiv : 0801.1698 , Bibcode : 2008arXiv0801.1698A, doi : 10.1214/08-PS124, S2CID 15421306
^ Тао, Теренс (2006), «Повторный взгляд на лемму регулярности Семереди», Вклад в дискретную математику , 1 (1): 8–28, arXiv : math/0504472 , Bibcode : 2005math......4472T, doi : 10.11575/cdm.v1i1.61900 , MR 2212136.
^ Тао, Теренс (2012), Спектральное доказательство леммы Семереди о регулярности