В комбинаторике принцип включения-исключения представляет собой метод подсчета, который обобщает известный метод получения числа элементов в объединении двух конечных множеств ; символически выражается как
где A и B — два конечных множества, а | S | указывает мощность множества S (которую можно рассматривать как число элементов множества, если множество конечно ). Формула выражает тот факт, что сумма размеров двух множеств может быть слишком большой, поскольку некоторые элементы могут быть учтены дважды. Дважды учтенные элементы — это те, которые находятся на пересечении двух множеств, и подсчет корректируется путем вычитания размера пересечения.
Принцип включения-исключения, являющийся обобщением случая двух множеств, возможно, более наглядно проявляется в случае трех множеств, который для множеств A , B и C задается выражением
Эту формулу можно проверить, подсчитав, сколько раз каждая область на диаграмме Венна включена в правую часть формулы. В этом случае при удалении вкладов пересчитанных элементов число элементов во взаимном пересечении трех множеств вычиталось слишком часто, поэтому его необходимо добавить обратно, чтобы получить правильную сумму.
Обобщение результатов этих примеров дает принцип включения-исключения. Чтобы найти мощность объединения n множеств:
Название происходит от идеи, что принцип основан на чрезмерно щедром включении , за которым следует компенсирующее исключение . Эта концепция приписывается Аврааму де Муавуру (1718), [1] хотя впервые она появляется в статье Даниэля да Силвы (1854) [2] и позже в статье Дж. Дж. Сильвестра (1883). [3] Иногда принцип называют формулой да Силвы или Сильвестра из-за этих публикаций. Принцип можно рассматривать как пример метода решета, широко используемого в теории чисел , и иногда его называют формулой решета . [4]
Поскольку конечные вероятности вычисляются как подсчеты относительно мощности пространства вероятностей , формулы для принципа включения-исключения остаются действительными, когда мощности множеств заменяются конечными вероятностями. В более общем смысле, обе версии принципа можно поместить под общую зонтику теории меры .
В очень абстрактной постановке принцип включения-исключения может быть выражен как вычисление обратной матрицы определенной матрицы. [5] Эта обратная имеет особую структуру, что делает принцип чрезвычайно ценным методом в комбинаторике и смежных областях математики. Как выразился Джан-Карло Рота : [6]
«Одним из самых полезных принципов перечисления в дискретной теории вероятностей и комбинаторной теории является знаменитый принцип включения-исключения. При умелом применении этот принцип дал решение многих комбинаторных задач».
В своей общей формуле принцип включения-исключения утверждает, что для конечных множеств A 1 , ..., A n имеет место тождество
Это можно компактно записать как
или
На словах, чтобы подсчитать количество элементов в конечном объединении конечных множеств, сначала суммируйте мощности отдельных множеств, затем вычтите количество элементов, которые появляются по крайней мере в двух множествах, затем прибавьте количество элементов, которые появляются по крайней мере в трех множествах, затем вычтите количество элементов, которые появляются по крайней мере в четырех множествах, и т. д. Этот процесс всегда заканчивается, поскольку не может быть элементов, которые появляются в большем количестве множеств в объединении. (Например, если не может быть элементов, которые появляются в более чем множествах; эквивалентно, не может быть элементов, которые появляются по крайней мере в множествах.)
В приложениях этот принцип часто можно увидеть выраженным в его дополнительной форме. То есть, если S — конечное универсальное множество , содержащее все A i , и если обозначить дополнение A i в S , то по законам Де Моргана мы имеем
В качестве другого варианта утверждения, пусть P 1 , ..., P n будет списком свойств, которые элементы множества S могут или не могут иметь, тогда принцип включения-исключения предоставляет способ вычисления количества элементов S , которые не имеют ни одного из свойств. Просто пусть A i будет подмножеством элементов S , которые имеют свойство P i , и используйте принцип в его дополнительной форме. Этот вариант принадлежит JJ Sylvester . [1]
Обратите внимание, что если вы примете во внимание только первые суммы m<n справа (в общей форме принципа), то вы получите завышенную оценку, если m нечетное, и заниженную оценку, если m четное.
Более сложный пример следующий.
Предположим, что есть колода из n карт, пронумерованных от 1 до n . Предположим, что карта с номером m находится в правильном положении, если это m -я карта в колоде. Сколькими способами, W , можно перетасовать карты, чтобы хотя бы 1 карта оказалась в правильном положении?
Начнем с определения множества A m , которое представляет собой все упорядочения карточек с m- й карточкой, которая является правильной. Тогда число упорядочений, W , с хотя бы одной карточкой, находящейся в правильной позиции, m , равно
Применить принцип включения-исключения,
Каждое значение представляет собой набор перетасовок, имеющих по крайней мере p значений m 1 , ..., m p в правильной позиции. Обратите внимание, что количество перетасовок с по крайней мере p правильными значениями зависит только от p , а не от конкретных значений . Например, количество перетасовок, имеющих 1- ю , 3 -ю и 17 -ю карты в правильной позиции, равно количеству перетасовок, имеющих 2 -ю , 5 -ю и 13 -ю карты в правильной позиции. Имеет значение только то, что из n карт 3 были выбраны для правильной позиции. Таким образом, в p -й сумме (см. комбинацию ) есть равные члены .
— это число упорядочений, имеющих p элементов в правильном положении, которое равно числу способов упорядочения оставшихся n − p элементов, или ( n − p )!. Таким образом, мы в итоге получаем:
Перестановка, в которой ни одна карта не находится в правильном положении, называется расстройством . Принимая n ! за общее число перестановок, вероятность Q того, что случайная перестановка приведет к расстройству, определяется как
усечение до n + 1 членов разложения Тейлора e −1 . Таким образом, вероятность угадать порядок перетасованной колоды карт и ошибиться относительно каждой карты составляет приблизительно e −1 или 37%.
Ситуация, которая появляется в приведенном выше примере расстройства, встречается достаточно часто, чтобы заслуживать особого внимания. [7] А именно, когда размер множеств пересечения, появляющихся в формулах для принципа включения-исключения, зависит только от количества множеств в пересечениях, а не от того, какие множества появляются. Более формально, если пересечение
имеет одинаковую мощность, скажем, α k = | A J |, для каждого k -элементного подмножества J из {1, ..., n }, тогда
Или, в дополнительной форме, где универсальное множество S имеет мощность α 0 ,
При наличии семейства (повторения допускаются) подмножеств A 1 , A 2 , ..., A n универсального множества S принцип включения-исключения вычисляет количество элементов S ни в одном из этих подмножеств. Обобщение этой концепции вычислило бы количество элементов S , которые появляются ровно в некотором фиксированном m из этих множеств.
Пусть N = [ n ] = {1,2,..., n }. Если мы определим , то принцип включения-исключения можно записать так, используя обозначения предыдущего раздела; число элементов S , не содержащихся ни в одном из A i , равно:
Если I — фиксированное подмножество индексного множества N , то число элементов, которые принадлежат A i для всех i из I и ни для каких других значений, равно: [8]
Определим множества
Мы ищем число элементов, не содержащихся ни в одном из B k , которое по принципу включения-исключения (с ), равно
Соответствие K ↔ J = I ∪ K между подмножествами N \ I и подмножествами N , содержащими I, является биекцией, и если J и K соответствуют при этом отображении, то B K = A J , что показывает, что результат верен.
В теории вероятности для событий A 1 , ..., A n в вероятностном пространстве принцип включения-исключения принимает вид для n = 2
для n = 3
и вообще
что можно записать в замкнутом виде как
где последняя сумма пробегает все подмножества I индексов 1, ..., n, которые содержат ровно k элементов, и
обозначает пересечение всех A i с индексом в I .
Согласно неравенствам Бонферрони , сумма первых членов формулы является попеременно верхней и нижней границей для LHS . Это можно использовать в случаях, когда полная формула слишком громоздка.
Для общего пространства с мерой ( S , Σ, μ ) и измеримых подмножеств A1 , ..., An конечной меры указанные выше тождества также справедливы, когда вероятностная мера заменяется мерой μ .
Если в вероятностной версии принципа включения-исключения вероятность пересечения A I зависит только от мощности I , что означает, что для каждого k из {1, ..., n } существует a k такое, что
тогда приведенная выше формула упрощается до
из-за комбинаторной интерпретации биномиального коэффициента . Например, если события независимы и одинаково распределены , то для всех i , и мы имеем , в этом случае выражение выше упрощается до
(Этот результат можно также получить более просто, рассмотрев пересечение дополнений событий .)
Аналогичное упрощение возможно в случае общего мерного пространства и измеримых подмножеств конечной меры.
Есть еще одна формула, используемая в точечных процессах . Пусть будет конечным множеством и будет случайным подмножеством . Пусть будет любым подмножеством , тогда
Этот принцип иногда формулируется в форме [9], которая гласит, что если
затем
Комбинаторная и вероятностная версии принципа включения-исключения являются примерами ( 2 ).
Возьми , , и
соответственно для всех наборов с . Тогда получаем
соответственно для всех множеств с . Это происходит потому, что элементы из могут также содержаться в других ( с ), и -формула проходит точно через все возможные расширения множеств с другими , считая только для множества, которое соответствует поведению членства , если проходит через все подмножества (как в определении ).
Так как , то из ( 2 ) получаем при этом
и при перестановке сторон получаются комбинаторная и вероятностная версии принципа включения-исключения.
Если рассматривать число как набор его простых множителей, то ( 2 ) является обобщением формулы обращения Мёбиуса для натуральных чисел без квадратов . Таким образом, ( 2 ) рассматривается как формула обращения Мёбиуса для алгебры инцидентности частично упорядоченного множества всех подмножеств A.
Для обобщения полной версии формулы обращения Мёбиуса ( 2 ) необходимо обобщить на мультимножества . Для мультимножеств вместо множеств ( 2 ) становится
где мультимножество, для которого , и
Обратите внимание, что это просто из ( 2 ) в случае, если это множество.
Подставим в правую часть ( 3 ). Обратите внимание, что появляется один раз с обеих сторон ( 3 ). Поэтому мы должны показать, что для всех с , члены в правой части ( 3 ) сокращаются. Для этого возьмем фиксированное значение , такое что , и возьмем произвольное фиксированное значение , такое что .
Обратите внимание, что должен быть набор для каждого положительного или отрицательного появления в правой части ( 3 ), который получается посредством мультимножества, такого что . Теперь каждое появление в правой части ( 3 ), которое получается посредством такого что является набором, который содержит , сокращается с тем, который получается посредством соответствующего такого что является набором, который не содержит . Это дает желаемый результат.
Принцип включения-исключения широко используется, и здесь можно упомянуть лишь некоторые из его применений.
Хорошо известное применение принципа включения–исключения — это комбинаторная задача подсчета всех расстройств конечного множества. Расстройство множества A — это биекция из A в себя, не имеющая неподвижных точек. С помощью принципа включения–исключения можно показать, что если мощность A равна n , то количество расстройств равно [ n !/ e ], где [ x ] обозначает ближайшее целое число к x ; подробное доказательство доступно здесь , а также см. раздел примеров выше.
Впервые задача подсчета количества сбоев встречается в ранней книге об азартных играх: Essai d'analyse sur les jeux de hazard, написанной П. Р. де Монмором (1678 – 1719), и была известна как «задача Монмора» или по названию, которое он ей дал, « problème des rencontres ». [10] Задача также известна как задача о шляпе.
Число нарушений также известно как субфакториал n , который записывается как ! n . Из этого следует, что если всем биекциям приписана одинаковая вероятность, то вероятность того, что случайная биекция является нарушением, быстро приближается к 1/ e по мере роста n .
Принцип включения-исключения, объединенный с законом Де Моргана , может быть использован для подсчета мощности пересечения множеств. Пусть представим дополнение A k относительно некоторого универсального множества A такого, что для каждого k . Тогда мы имеем
тем самым превращая задачу поиска пересечения в задачу поиска объединения.
Принцип включения-исключения лежит в основе алгоритмов для ряда NP-трудных задач разбиения графов, таких как раскраска графов. [11]
Хорошо известным применением принципа является построение хроматического многочлена графа. [12]
Число идеальных паросочетаний двудольного графа можно вычислить, используя принцип. [13]
При заданных конечных множествах A и B , сколько сюръективных функций (функций на) существует из A в B ? Без потери общности мы можем взять A = {1, ..., k } и B = {1, ..., n }, поскольку важны только мощности множеств. Используя S как множество всех функций из A в B и определяя для каждого i в B свойство P i как «функция пропускает элемент i в B » ( i не находится в образе функции), принцип включения–исключения дает число функций на между A и B как: [14]
Перестановка множества S = {1, ..., n } , в которой каждый элемент S ограничен тем, что не может находиться в определенных позициях (здесь перестановка рассматривается как упорядочение элементов S ), называется перестановкой с запрещенными позициями . Например, при S = {1,2,3,4} перестановки с ограничением, что элемент 1 не может находиться в позициях 1 или 3, а элемент 2 не может находиться в позиции 4, следующие: 2134, 2143, 3124, 4123, 2341, 2431, 3241, 3421, 4231 и 4321. Позволяя A i быть множеством позиций, в которых элемент i не может находиться, а свойству P i быть свойством, что перестановка помещает элемент i в позицию в A i , принцип включения-исключения может быть использован для подсчета количества перестановок, которые удовлетворяют всем ограничениям. [15]
В данном примере имеется 12 = 2(3!) перестановок со свойством P 1 , 6 = 3! перестановок со свойством P 2 и ни одна перестановка не имеет свойств P 3 или P 4 , так как для этих двух элементов нет ограничений. Количество перестановок, удовлетворяющих ограничениям, таким образом:
Последняя 4 в этом вычислении — это число перестановок, имеющих оба свойства P 1 и P 2. Других ненулевых вкладов в формулу нет.
Числа Стирлинга второго рода , S ( n , k ) подсчитывают количество разбиений множества из n элементов на k непустых подмножеств (неразличимых ящиков ). Явную формулу для них можно получить, применив принцип включения–исключения к очень близкой задаче, а именно, подсчету количества разбиений n -множества на k непустых, но различимых ящиков ( упорядоченных непустых подмножеств). Используя универсальное множество, состоящее из всех разбиений n -множества на k (возможно, пустых) различимых ящиков, A 1 , A 2 , ..., A k , и свойства P i , означающие, что в разбиении ящик A i пустой, принцип включения–исключения дает ответ на связанный результат. Деление на k ! для удаления искусственного упорядочения дает число Стирлинга второго рода: [16]
Ладейный полином — это производящая функция числа способов размещения неатакующих ладей на доске B , которая выглядит как подмножество клеток шахматной доски ; то есть никакие две ладьи не могут находиться в одном ряду или столбце. Доска B — это любое подмножество клеток прямоугольной доски с n строками и m столбцами; мы думаем о ней как о клетках, в которые разрешено поставить ладью. Коэффициент r k ( B ) от x k в ладейном полиноме R B ( x ) — это число способов, которыми k ладей, ни одна из которых не атакует другую, могут быть расставлены в клетках B . Для любой доски B существует дополнительная доска, состоящая из клеток прямоугольной доски, которые не находятся в B . Эта дополнительная доска также имеет ладейный полином с коэффициентами
Иногда удобно иметь возможность вычислить наивысший коэффициент ладейного полинома через коэффициенты ладейного полинома дополнительной доски. Без потери общности можно предположить, что n ≤ m , так что этот коэффициент равен r n ( B ). Количество способов разместить n неатакующих ладей на полной n × m "шахматной доске" (без учета того, размещены ли ладьи в клетках доски B ) определяется падающим факториалом :
Пусть P i — свойство, что при размещении n неатакующих ладей на полной доске в столбце i есть ладья , которая не находится ни в одной клетке доски B , тогда по принципу включения-исключения имеем: [17]
Тотиент Эйлера или фи-функция, φ ( n ) — это арифметическая функция , которая подсчитывает количество положительных целых чисел, меньших или равных n , которые взаимно просты с n . То есть, если n — положительное целое число , то φ( n ) — это количество целых чисел k в диапазоне 1 ≤ k ≤ n , которые не имеют общего множителя с n , кроме 1. Принцип включения-исключения используется для получения формулы для φ( n ). Пусть S — множество {1, ..., n } и определите свойство P i как то, что число из S делится на простое число p i , для 1 ≤ i ≤ r , где разложение на простые множители
Затем, [18]
Метод гиперболы Дирихле повторно выражает сумму мультипликативной функции путем выбора подходящей свертки Дирихле , признавая, что сумма
можно переформулировать как сумму по точкам решетки в области, ограниченной , и , разделив эту область на две перекрывающиеся подобласти и, наконец, используя принцип включения-исключения, сделать вывод, что
Во многих случаях, когда принцип мог бы дать точную формулу (в частности, подсчет простых чисел с использованием решета Эратосфена ), возникающая формула не предлагает полезного содержания, поскольку количество членов в ней чрезмерно. Если каждый член в отдельности может быть оценен точно, накопление ошибок может означать, что формула включения-исключения не применима напрямую. В теории чисел эта трудность была рассмотрена Вигго Бруном . После медленного старта его идеи были подхвачены другими, и было разработано большое количество методов решета . Они, например, могут попытаться найти верхние границы для «просеянных» множеств, а не точную формулу.
Пусть A 1 , ..., A n — произвольные множества и p 1 , ..., p n — действительные числа в замкнутом единичном интервале [0, 1] . Тогда для каждого четного числа k из {0, ..., n } индикаторные функции удовлетворяют неравенству: [19]
Выберите элемент, содержащийся в объединении всех множеств, и пусть будут отдельными множествами, содержащими его. (Обратите внимание, что t > 0.) Поскольку элемент учитывается ровно один раз левой частью уравнения ( 1 ), нам нужно показать, что он учитывается ровно один раз правой частью. С правой стороны единственные ненулевые вклады возникают, когда все подмножества в определенном члене содержат выбранный элемент, то есть все подмножества выбираются из . Вклад равен единице для каждого из этих множеств (плюс или минус в зависимости от члена) и, следовательно, является просто (знаковым) числом этих подмножеств, используемых в члене. Тогда мы имеем:
По биномиальной теореме ,
Используя тот факт, что и переставляя члены, имеем
и поэтому выбранный элемент учитывается только один раз в правой части уравнения ( 1 ).
Алгебраическое доказательство может быть получено с использованием индикаторных функций (также известных как характеристические функции). Индикаторная функция подмножества S множества X — это функция
Если и являются двумя подмножествами , то
Пусть A обозначает объединение множеств A 1 , ..., A n . Чтобы доказать принцип включения–исключения в общем виде, сначала проверим тождество
для индикаторных функций, где:
Следующая функция
тождественно равен нулю, потому что: если x не принадлежит A , то все множители равны 0−0 = 0; и в противном случае, если x принадлежит некоторому A m , то соответствующий m -й множитель равен 1−1=0. Раскрывая произведение в левой части, получаем уравнение ( 4 ).
Чтобы доказать принцип включения-исключения для мощности множеств, просуммируйте уравнение ( 4 ) по всем x в объединении A 1 , ..., A n . Чтобы вывести версию, используемую в вероятности, возьмите ожидание в ( 4 ). В общем случае, проинтегрируйте уравнение ( 4 ) относительно μ . Всегда используйте линейность в этих выводах.
В данной статье использованы материалы, основанные на принципе включения-исключения из PlanetMath , лицензированные по лицензии Creative Commons Attribution/Share-Alike License .