Теорема Байеса (альтернативно закон Байеса или правило Байеса , в честь Томаса Байеса ) дает математическое правило для инвертирования условных вероятностей , что позволяет нам находить вероятность причины, учитывая ее следствие. [1] Например, если известно, что риск развития проблем со здоровьем увеличивается с возрастом, теорема Байеса позволяет более точно оценить риск для человека известного возраста, обусловливая его относительно его возраста, а не предполагая, что человек типичен для популяции в целом. На основании закона Байеса необходимо учитывать как распространенность заболевания в данной популяции, так и частоту ошибок теста на инфекционные заболевания, чтобы правильно оценить значение положительного результата теста и избежать ошибки базовой вероятности .
Одним из многочисленных применений теоремы Байеса является байесовский вывод , особый подход к статистическому выводу , где он используется для инвертирования вероятности наблюдений при заданной конфигурации модели (т. е. функции правдоподобия ) для получения вероятности конфигурации модели при заданных наблюдениях (т. е. апостериорной вероятности ).
Теорема Байеса названа в честь преподобного Томаса Байеса ( / b eɪ z / ), также статистика и философа. Байес использовал условную вероятность для предоставления алгоритма (его Предложение 9), который использует доказательства для вычисления пределов неизвестного параметра. Его работа была опубликована в 1763 году как Эссе о решении проблемы в доктрине шансов . Байес изучал, как вычислить распределение для параметра вероятности биномиального распределения (в современной терминологии). После смерти Байеса его семья передала его работы другу, министру, философу и математику Ричарду Прайсу .
В течение двух лет Ричард Прайс значительно редактировал неопубликованную рукопись, прежде чем отправить ее другу, который прочитал ее вслух в Королевском обществе 23 декабря 1763 года. [2] Прайс отредактировал [3] основную работу Байеса «Эссе о решении проблемы в доктрине случайностей» (1763), которая появилась в Philosophical Transactions , [4] и содержит теорему Байеса. Прайс написал введение к статье, в котором излагаются некоторые философские основы байесовской статистики , и выбрал одно из двух решений, предложенных Байесом. В 1765 году Прайс был избран членом Королевского общества в знак признания его работы над наследием Байеса. [5] [6] 27 апреля письмо, отправленное его другу Бенджамину Франклину, было зачитано в Королевском обществе и позже опубликовано, в котором Прайс применяет эту работу к населению и вычислению «пожизненных рент». [7]
Независимо от Байеса, Пьер-Симон Лаплас в 1774 году, а позднее в своей работе 1812 года «Аналитическая теория вероятностей » использовал условную вероятность для формулирования отношения обновленной апостериорной вероятности к априорной вероятности, при наличии доказательств. Он воспроизвел и расширил результаты Байеса в 1774 году, по-видимому, не зная о работе Байеса. [примечание 1] [8] Байесовская интерпретация вероятности была разработана в основном Лапласом. [9]
Примерно 200 лет спустя сэр Гарольд Джеффрис положил алгоритм Байеса и формулировку Лапласа на аксиоматическую основу, написав в книге 1973 года, что теорема Байеса «является для теории вероятностей тем же, чем теорема Пифагора является для геометрии» [10] .
Стивен Стиглер использовал байесовский аргумент, чтобы заключить, что теорема Байеса была открыта Николасом Сондерсоном , слепым английским математиком, за некоторое время до Байеса; [11] [12] однако эта интерпретация была оспорена. [13] Мартин Хупер [14] и Шэрон Макгрейн [15] утверждали, что вклад Ричарда Прайса был существенным:
По современным стандартам, мы должны ссылаться на правило Байеса-Прайса. Прайс обнаружил работу Байеса, признал ее важность, исправил ее, внес вклад в статью и нашел ей применение. Современная традиция использовать только имя Байеса несправедлива, но настолько укоренилась, что все остальное не имеет смысла. [15]
Теорема Байеса математически формулируется в виде следующего уравнения: [16]
где и — события и .
Теорема Байеса может быть выведена из определения условной вероятности :
где — вероятность того, что оба утверждения A и B верны. Аналогично,
Решая и подставляя в приведенное выше выражение, получаем теорему Байеса:
Для двух непрерывных случайных величин X и Y теорема Байеса может быть аналогично выведена из определения условной плотности :
Поэтому,
Пусть будет условным распределением заданного и пусть будет распределением . Совместное распределение тогда будет . Условное распределение заданного тогда определяется как
Существование и единственность необходимого условного ожидания является следствием теоремы Радона–Никодима . Это было сформулировано Колмогоровым в его знаменитой книге 1933 года. Колмогоров подчеркивает важность условной вероятности, написав в Предисловии: «Я хочу обратить внимание на ... и особенно на теорию условных вероятностей и условных ожиданий ...». [17] Теорема Байеса определяет апостериорное распределение из априорного распределения. Уникальность требует предположений о непрерывности. [18] Теорему Байеса можно обобщить, включив в нее неправильные априорные распределения, такие как равномерное распределение на вещественной прямой. [19] Современные методы Монте-Карло для цепей Маркова повысили важность теоремы Байеса, включая случаи с неправильными априорными данными. [20]
Правило Байеса и вычисление условных вероятностей предоставляют метод решения для ряда популярных головоломок, таких как задача о трех заключенных , задача о Монти Холле , задача о двух детях и задача о двух конвертах .
Предположим, что конкретный тест на то, употреблял ли кто-то каннабис, имеет 90% чувствительности , что означает истинно положительный показатель (TPR) = 0,90. Таким образом, он приводит к 90% истинно положительных результатов (правильное определение употребления наркотиков) для пользователей каннабиса.
Тест также специфичен на 80% , что означает истинно отрицательный показатель (TNR) = 0,80. Таким образом, тест правильно определяет 80% неиспользования для непользователей, но также генерирует 20% ложноположительных результатов, или ложноположительный показатель (FPR) = 0,20, для непользователей.
Если предположить, что распространенность составляет 0,05 , то есть 5% людей употребляют каннабис, какова вероятность того , что случайный человек, у которого положительный результат теста, действительно употребляет каннабис?
Положительная прогностическая ценность (ППЦ) теста — это доля лиц, которые действительно дали положительный результат, среди всех лиц с положительным результатом теста. Ее можно рассчитать на основе выборки следующим образом:
Если известны чувствительность, специфичность и распространенность, PPV можно рассчитать с помощью теоремы Байеса. Пусть означает «вероятность того, что кто-то является потребителем каннабиса, при условии, что его тест положительный», что и подразумевается под PPV. Мы можем записать:
Знаменатель — это прямое применение закона полной вероятности . В этом случае он говорит, что вероятность того, что кто-то даст положительный результат, равна вероятности того, что пользователь даст положительный результат, умноженной на вероятность того, что он пользователь, плюс вероятность того, что не-пользователь даст положительный результат, умноженной на вероятность того, что он не-пользователь. Это верно, поскольку классификации «пользователь» и «не-пользователь» образуют раздел множества , а именно множества людей, которые проходят тест на наркотики. Это в сочетании с определением условной вероятности приводит к приведенному выше утверждению.
Другими словами, даже если у кого-то положительный результат теста, вероятность того, что он употребляет каннабис, составляет всего 19% — это связано с тем, что в этой группе только 5% людей употребляют каннабис, а большинство положительных результатов являются ложноположительными, полученными от оставшихся 95%.
Если протестировать 1000 человек:
Таким образом, на 1000 человек приходится 235 положительных тестов, из которых только 45 являются настоящими потребителями наркотиков, что составляет около 19%.
Важность специфичности можно продемонстрировать, показав, что даже если чувствительность повысить до 100%, а специфичность сохранить на уровне 80%, вероятность того, что человек с положительным результатом теста действительно является потребителем каннабиса, возрастет только с 19% до 21%, но если чувствительность сохранить на уровне 90%, а специфичность повысить до 95%, вероятность возрастет до 49%.
Даже если 100% пациентов с раком поджелудочной железы имеют определенный симптом, когда у кого-то есть тот же симптом, это не означает, что у этого человека 100% шанс заболеть раком поджелудочной железы. Если предположить, что уровень заболеваемости раком поджелудочной железы составляет 1/100000, в то время как 10/99999 здоровых людей имеют те же симптомы во всем мире, вероятность наличия рака поджелудочной железы с учетом симптомов составляет всего 9,1%, а остальные 90,9% могут быть «ложноположительными» (то есть ложно заявленными о наличии рака; «положительный» — это сбивающий с толку термин, когда, как в данном случае, тест дает плохие новости).
В следующей таблице представлены соответствующие цифры на 100 000 человек, основанные на уровне заболеваемости.
Что затем можно использовать для расчета вероятности наличия рака при наличии симптомов:
Фабрика производит товары с использованием трех машин — A, B и C, — которые составляют 20%, 30% и 50% ее продукции соответственно. Из товаров, произведенных машиной A, 5% являются дефектными; аналогично, 3% товаров машины B и 1% товаров машины C являются дефектными. Если случайно выбранный товар является дефектным, какова вероятность того, что он был произведен машиной C?
И снова ответ можно получить, не используя формулу, применив условия к гипотетическому числу случаев. Например, если фабрика производит 1000 изделий, 200 из них будет произведено машиной A, 300 — машиной B и 500 — машиной C. Машина A произведет 5% × 200 = 10 дефектных изделий, машина B 3% × 300 = 9, а машина C 1% × 500 = 5, что в сумме составит 24. Таким образом, вероятность того, что случайно выбранное дефектное изделие было произведено машиной C, составляет 5/24 (~20,83%).
Эту задачу можно решить также с помощью теоремы Байеса: Пусть X i обозначает событие, что случайно выбранный элемент был изготовлен i -й машиной (для i = A,B,C). Пусть Y обозначает событие, что случайно выбранный элемент является дефектным. Тогда нам дана следующая информация:
Если деталь была изготовлена на первой машине, то вероятность того, что она бракованная, составляет 0,05; то есть P ( Y | X A ) = 0,05. В целом, имеем
Чтобы ответить на исходный вопрос, сначала найдем P (Y). Это можно сделать следующим образом:
Таким образом, 2,4% от общего объема выпускаемой продукции является бракованной.
Нам дано, что произошло событие Y , и мы хотим вычислить условную вероятность события X C. По теореме Байеса,
Учитывая, что деталь неисправна, вероятность того, что она была изготовлена машиной C, составляет 5/24. Хотя машина C производит половину общего объема продукции, она производит гораздо меньшую долю дефектных деталей. Следовательно, знание того, что выбранная деталь была неисправной, позволяет нам заменить априорную вероятность P ( X C ) = 1/2 меньшей апостериорной вероятностью P ( X C | Y ) = 5/24.
Интерпретация правила Байеса зависит от интерпретации вероятности, приписываемой терминам. Ниже описаны две преобладающие интерпретации.
В байесовской (или эпистемологической) интерпретации вероятность измеряет «степень веры». Теорема Байеса связывает степень веры в предложение до и после учета доказательств. Например, предположим, что с 50% уверенностью полагают, что монета в два раза чаще выпадет орлом, чем решкой. Если монету подбросить несколько раз и наблюдать результаты, эта степень веры, вероятно, вырастет или упадет, но может даже остаться прежней, в зависимости от результатов. Для предложения A и доказательства B ,
Более подробную информацию о применении теоремы Байеса при байесовской интерпретации вероятности см. в статье Байесовский вывод .
В частотной интерпретации вероятность измеряет «долю результатов». Например, предположим, что эксперимент проводится много раз. P ( A ) — это доля результатов со свойством A (априорная), а P ( B ) — это доля результатов со свойством B . P ( B | A ) — это доля результатов со свойством B среди результатов со свойством A , а P ( A | B ) — это доля результатов с A среди результатов с B (апостериорная).
Роль теоремы Байеса лучше всего визуализировать с помощью древовидных диаграмм. Две диаграммы разделяют одни и те же результаты по A и B в противоположных порядках, чтобы получить обратные вероятности. Теорема Байеса связывает различные разбиения.
Энтомолог замечает, что из-за узора на спине может быть редким подвидом жука . У 98 % членов редкого подвида есть узор, поэтому P (Узор | Редкий) = 98 %. Только 5% членов обычного подвида имеют узор. Редкий подвид составляет 0,1% от общей популяции. Насколько вероятно, что жук с узором будет редким: чему равно P (Редкий | Узор)?
Из расширенной формы теоремы Байеса (поскольку любой жук либо редок, либо обычен),
Для событий A и B , при условии, что P ( B ) ≠ 0,
Во многих приложениях, например, в байесовском выводе , событие B фиксируется в обсуждении, и мы хотим рассмотреть влияние его наблюдения на нашу веру в различные возможные события A. В такой ситуации знаменатель последнего выражения, вероятность данного свидетельства B , фиксируется; то, что мы хотим изменить, это A. Теорема Байеса затем показывает, что апостериорные вероятности пропорциональны числителю, поэтому последнее уравнение становится:
Другими словами, апостериорная вероятность пропорциональна априорной вероятности, умноженной на вероятность. [21]
Если события A 1 , A 2 , ..., являются взаимоисключающими и исчерпывающими, т. е. одно из них обязательно произойдет, но никакие два не могут произойти вместе, мы можем определить константу пропорциональности, используя тот факт, что их вероятности должны давать в сумме единицу. Например, для данного события A само событие A и его дополнение ¬ A являются исключающими и исчерпывающими. Обозначая константу пропорциональности через c, мы имеем
Сложив эти две формулы, мы приходим к выводу, что
или
Другая форма теоремы Байеса для двух конкурирующих утверждений или гипотез выглядит так:
Для эпистемологической интерпретации:
Для предложения A и доказательства или предпосылки B , [22]
Часто для некоторого разбиения { A j } пространства выборки пространство событий задается в терминах P ( A j ) и P ( B | A j ). Тогда полезно вычислить P ( B ) с помощью закона полной вероятности :
Или (используя правило умножения для условной вероятности), [23]
В частном случае, когда A — двоичная переменная :
Рассмотрим выборочное пространство Ω, сгенерированное двумя случайными величинами X и Y с известными распределениями вероятностей. В принципе, теорема Байеса применима к событиям A = { X = x } и B = { Y = y }.
Однако члены становятся равными 0 в точках, где любая из переменных имеет конечную плотность вероятности . Чтобы оставаться полезной, теорему Байеса можно сформулировать в терминах соответствующих плотностей (см. Вывод).
Если X непрерывен, а Y дискретен,
где каждая из них является функцией плотности.
Если X дискретен, а Y непрерывен,
Если и X, и Y непрерывны,
Непрерывное пространство событий часто концептуализируется в терминах числителя. Тогда полезно исключить знаменатель, используя закон полной вероятности . Для f Y ( y ) это становится интегралом:
Теорема Байеса в форме коэффициентов выглядит следующим образом:
где
называется коэффициентом Байеса или отношением правдоподобия . Шансы между двумя событиями — это просто отношение вероятностей двух событий. Таким образом
Таким образом, правило гласит, что апостериорные шансы равны априорным шансам, умноженным на фактор Байеса , или, другими словами, апостериорные шансы пропорциональны априорным шансам, умноженным на вероятность.
В частном случае, когда и , пишут , и используют аналогичное сокращение для фактора Байеса и для условных шансов. Шансы по определению являются шансами за и против . Правило Байеса тогда можно записать в сокращенной форме
или, говоря словами, апостериорные шансы на равны априорным шансам на умножить на отношение правдоподобия для данной информации . Короче говоря, апостериорные шансы равны априорным шансам на умножить на отношение правдоподобия .
Например, если медицинский тест имеет чувствительность 90% и специфичность 91%, то положительный байесовский фактор равен . Теперь, если распространенность этого заболевания составляет 9,09%, и если мы возьмем это в качестве априорной вероятности, то априорные шансы составят около 1:10. Таким образом, после получения положительного результата теста апостериорные шансы фактического наличия заболевания станут 1:1, что означает, что апостериорная вероятность наличия заболевания составит 50%. Если провести второй тест в последовательном тестировании, и он также окажется положительным, то апостериорные шансы фактического наличия заболевания станут 10:1, что означает апостериорную вероятность около 90,91%. Отрицательный байесовский фактор можно рассчитать как 91%/(100%-90%)=9,1, поэтому, если второй тест окажется отрицательным, то апостериорные шансы фактического наличия заболевания составят 1:9,1, что означает апостериорную вероятность около 9,9%.
Пример выше можно также понять с помощью более надежных цифр: предположим, что пациент, проходящий тест, входит в группу из 1000 человек, из которых 91 на самом деле болен (распространенность 9,1%). Если все эти 1000 человек пройдут медицинский тест, 82 из тех, у кого есть заболевание, получат истинно положительный результат (чувствительность 90,1%), 9 из тех, у кого есть заболевание, получат ложноотрицательный результат ( ложноотрицательный процент 9,9%), 827 из тех, у кого нет заболевания, получат истинно отрицательный результат (специфичность 91,0%), а 82 из тех, у кого нет заболевания, получат ложноположительный результат (ложноположительный процент 9,0%). До прохождения любого теста вероятность наличия у пациента заболевания составляет 91:909. После получения положительного результата вероятность наличия у пациента заболевания составляет
что согласуется с тем фактом, что в группе из 1000 человек имеется 82 истинно положительных результата и 82 ложноположительных результата.
Используя дважды, можно использовать теорему Байеса, чтобы также выразить через и без отрицаний:
когда . Из этого мы можем сделать вывод
В словах: Если определенно подразумевает , мы заключаем, что определенно подразумевает . Где , два импликации, будучи определенными, являются эквивалентными утверждениями. В формулах вероятности условная вероятность обобщает логическую импликацию , где теперь за пределами назначения истинного или ложного мы присваиваем значения вероятности утверждениям. Утверждение о схвачено определенностью условного, утверждения о . Связывая направления импликации, теорема Байеса представляет собой обобщение закона противопоставления , который в классической пропозициональной логике может быть выражен как:
В этом отношении между импликациями позиции соответственно меняются местами.
Соответствующая формула в терминах исчисления вероятностей — это теорема Байеса, которая в развернутой форме, включающей только априорную вероятность / базовую ставку , выражается как: [1]
Теорема Байеса представляет собой частный случай вывода инвертированных условных мнений в субъективной логике, выраженный как:
где обозначает оператор инвертирования условных мнений. Аргумент обозначает пару биномиальных условных мнений, заданных источником , а аргумент обозначает априорную вероятность (иначе говоря, базовую ставку ) . Пара производных инвертированных условных мнений обозначается . Условное мнение обобщает вероятностное условное , т. е. в дополнение к назначению вероятности источник может назначить любое субъективное мнение условному утверждению . Биномиальное субъективное мнение — это убеждение в истинности утверждения со степенями эпистемической неопределенности, как выражено источником . Каждое субъективное мнение имеет соответствующую прогнозируемую вероятность . Применение теоремы Байеса к прогнозируемым вероятностям мнений является гомоморфизмом , что означает, что теорему Байеса можно выразить в терминах прогнозируемых вероятностей мнений:
Таким образом, субъективная теорема Байеса представляет собой обобщение теоремы Байеса. [24]
Версия теоремы Байеса для трех событий [25] получается путем добавления третьего события , на котором все вероятности обусловлены:
Использование цепного правила
И, с другой стороны,
Требуемый результат получается путем идентификации обоих выражений и решения относительно .
В генетике правило Байеса может быть использовано для оценки вероятности наличия у человека определенного генотипа. Многие люди стремятся приблизительно оценить свои шансы быть затронутыми генетическим заболеванием или вероятность быть носителем интересующего рецессивного гена. Байесовский анализ может быть выполнен на основе семейной истории или генетического тестирования , чтобы предсказать, разовьется ли у человека заболевание или передаст ли оно его своим детям. Генетическое тестирование и прогнозирование являются обычной практикой среди пар, которые планируют иметь детей, но обеспокоены тем, что они оба могут быть носителями заболевания, особенно в сообществах с низкой генетической дисперсией. [26]
Пример таблицы байесовского анализа для риска заболевания женщины, основанной на знании того, что заболевание присутствует у ее братьев и сестер, но не у ее родителей или кого-либо из ее четырех детей. Основываясь исключительно на статусе братьев и сестер и родителей субъекта, она с одинаковой вероятностью может быть носителем, как и неносителем (эта вероятность обозначена априорной гипотезой). Однако вероятность того, что все четыре сына субъекта будут не затронуты, составляет 1/16 ( 1 ⁄ 2 ⋅ 1 ⁄ 2 ⋅ 1 ⁄ 2 ⋅ 1 ⁄ 2 ), если она является носителем, и около 1, если она не является носителем (это условная вероятность). Совместная вероятность согласовывает эти два прогноза, умножая их друг на друга. Последняя строка (апостериорная вероятность) рассчитывается путем деления совместной вероятности для каждой гипотезы на сумму обеих совместных вероятностей. [27]
Генетическое тестирование родителей может обнаружить около 90% известных аллелей болезней у родителей, которые могут привести к носительству или поражению у их ребенка. Муковисцидоз — это наследственное заболевание, вызванное аутосомно-рецессивной мутацией в гене CFTR, [28] расположенном на плече q хромосомы 7. [29]
Байесовский анализ пациентки с семейным анамнезом муковисцидоза (МВ), у которой результаты теста на МВ оказались отрицательными, демонстрирующий, как этот метод использовался для определения риска рождения у нее ребенка с МВ:
Поскольку пациентка не поражена, она либо гомозиготна по аллелю дикого типа, либо гетерозиготна. Для установления априорных вероятностей используется квадрат Паннета, основанный на знании того, что ни один из родителей не был поражен болезнью, но оба могли быть носителями:
Учитывая, что пациент не поражен, есть только три возможности. В пределах этих трех есть два сценария, в которых пациент является носителем мутантного аллеля. Таким образом, априорные вероятности составляют 2 ⁄ 3 и 1 ⁄ 3 .
Далее пациент проходит генетическое тестирование и получает отрицательный результат на муковисцидоз. Этот тест имеет 90%-ную точность обнаружения, поэтому условные вероятности отрицательного теста составляют 1/10 и 1. Наконец, как и прежде, вычисляются совместная и апостериорная вероятности.
После проведения того же анализа у партнера-мужчины пациентки (с отрицательным результатом теста) вероятность того, что их ребенок будет поражен болезнью, равна произведению соответствующих апостериорных вероятностей того, что родители являются носителями, на вероятность того, что двое носителей произведут больного ребенка ( 1 ⁄ 4 ).
Байесовский анализ можно выполнить с использованием фенотипической информации, связанной с генетическим состоянием, и в сочетании с генетическим тестированием этот анализ становится намного сложнее. Например, кистозный фиброз можно обнаружить у плода с помощью ультразвукового исследования, которое выявляет эхогенный кишечник, то есть тот, который выглядит ярче, чем обычно при сканировании. Это не надежный тест, поскольку эхогенный кишечник может присутствовать у совершенно здорового плода. Генетическое тестирование родителей очень влиятельно в этом случае, когда фенотипический аспект может быть чрезмерно влиятельным при расчете вероятности. В случае плода с эхогенным кишечником, у матери, которая прошла тестирование и, как известно, является носителем муковисцидоза, апостериорная вероятность того, что у плода действительно есть это заболевание, очень высока (0,64). Однако, как только отец получает отрицательный результат теста на муковисцидоз, апостериорная вероятность значительно падает (до 0,16). [27]
Расчет фактора риска является мощным инструментом в генетическом консультировании и репродуктивном планировании, но его нельзя рассматривать как единственный важный фактор, который следует учитывать. Как указано выше, неполное тестирование может дать ложно высокую вероятность статуса носителя, а тестирование может быть финансово недоступным или неосуществимым, если родитель отсутствует.