stringtranslate.com

Заблуждение о базовой ставке

Больница, принимающая больше вакцинированных пациентов с COVID-19 , чем невакцинированных, может указывать на то, что вакцина неэффективна, но такой дисбаланс следует ожидать среди высоковакцинированного населения. [1]

Заблуждение о базовой ставке , также называемое игнорированием базовой ставки [2] или смещением базовой ставки , является типом заблуждения , при котором люди склонны игнорировать базовую ставку (например, общую распространенность ) в пользу индивидуализирующей информации (т. е. информации, относящейся только к конкретному случаю). [3] Например, если кто-то слышит, что друг очень застенчив и тих, он может подумать, что этот друг, скорее всего, библиотекарь, чем продавец, даже несмотря на то, что в целом продавцов гораздо больше, чем библиотекарей, — следовательно, повышается вероятность того, что его друг на самом деле продавец. Игнорирование базовой ставки является конкретной формой более общего расширенного игнорирования .

Это также называется ошибкой прокурора или ошибкой адвоката защиты , когда применяется к результатам статистических тестов (таких как тесты ДНК) в контексте судебных разбирательств. Эти термины были введены Уильямом К. Томпсоном и Эдвардом Шуманом в 1987 году, [4] [5] хотя утверждалось, что их определение ошибки прокурора распространяется на множество дополнительных недействительных вменений вины или ответственности, которые не поддаются анализу как ошибки в базовых ставках или теореме Байеса . [6]

Ложный положительный парадокс

Примером ошибки базовой скорости является парадокс ложных положительных результатов (также известный как парадокс точности ). Этот парадокс описывает ситуации, когда ложных положительных результатов теста больше , чем истинно положительных (это означает, что классификатор имеет низкую точность ). Например, если камера распознавания лиц может идентифицировать разыскиваемых преступников с точностью 99%, но анализирует 10 000 человек в день, высокая точность перевешивается количеством тестов, и список преступников программы, вероятно, будет иметь гораздо больше ложных положительных результатов, чем истинных. Вероятность положительного результата теста определяется не только точностью теста, но и характеристиками выборочной популяции. [7] Когда распространенность, доля тех, у кого есть данное состояние, ниже, чем ложноположительный показатель теста , даже тесты, которые имеют очень низкий риск дать ложный положительный результат в отдельном случае, дадут больше ложных, чем истинных положительных результатов в целом . [8]

Это особенно нелогично при интерпретации положительного результата теста в группе с низкой распространенностью после рассмотрения положительных результатов, полученных в группе с высокой распространенностью. [8] Если уровень ложноположительных результатов теста выше, чем доля новой группы с заболеванием, то администратор теста, чей опыт был получен в ходе тестирования в группе с высокой распространенностью, может сделать вывод из опыта , что положительный результат теста обычно указывает на положительного субъекта, хотя на самом деле ложноположительный результат гораздо более вероятен.

Примеры

Пример 1: Болезнь

Высокая распространенность населения

Представьте себе проведение теста на инфекционное заболевание в популяции A из 1000 человек, из которых 40% инфицированы. Тест имеет ложноположительный уровень 5% (0,05) и ложноотрицательный уровень 0. Ожидаемый результат 1000 тестов в популяции A будет следующим:

Инфицирован и тест показывает наличие заболевания ( истинно положительный )
1000 × 40/100 = 400 человек получат истинно положительный результат
Не инфицирован, и тест показывает наличие заболевания (ложноположительный результат)
1000 × 100 – 40/100 × 0,05 = 30 человек получат ложноположительный результат
Остальные 570 тестов дали отрицательный результат.

Таким образом, в популяции A человек, получивший положительный тест, может быть уверен более чем на 93% ( 400/30 + 400 ), что это правильно указывает на инфекцию.

Население с низкой распространенностью

Теперь рассмотрим тот же тест, примененный к популяции B , из которой инфицированы только 2%. Ожидаемый результат 1000 тестов на популяции B будет:

Инфицирован и тест показывает наличие заболевания (истинно положительный)
1000 × 2/100 = 20 человек получат истинно положительный результат
Не инфицирован, и тест показывает наличие заболевания (ложноположительный результат)
1000 × 100 – 2/100 × 0,05 = 49 человек получат ложноположительный результат
Остальные 931 тест дали отрицательный результат.

В популяции B только 20 из 69 человек с положительным результатом теста на самом деле инфицированы. Таким образом, вероятность фактического заражения после того, как человеку сообщили, что он инфицирован, составляет всего 29% ( 20/20 + 49 ) ​​для теста, который в остальном кажется «точным на 95%».

Тестировщик с опытом работы с группой A может посчитать парадоксом, что в группе B результат, который обычно правильно указывал на инфекцию, теперь обычно оказывается ложноположительным. Смешение апостериорной вероятности заражения с априорной вероятностью получения ложноположительного результата является естественной ошибкой после получения опасного для здоровья результата теста.

Пример 2: Пьяные водители

Представьте себе, что у группы полицейских есть алкотестеры, показывающие ложное опьянение в 5% случаев, когда водитель трезв. Однако алкотестеры никогда не ошибаются в выявлении действительно пьяного человека. Один из тысячи водителей водит машину пьяным. Предположим, что полицейские затем останавливают водителя наугад, чтобы провести тест на алкоголь. Он показывает, что водитель пьян. Никакой другой информации о них не известно.

Многие оценивают вероятность того, что водитель пьян, в 95%, но правильная вероятность составляет около 2%.

Объяснение этому следующее: в среднем на каждые 1000 проверенных водителей приходится

Таким образом, вероятность того, что любой водитель из 1 + 49,95 = 50,95 с положительным результатом теста действительно пьян, составляет .

Однако обоснованность этого результата зависит от обоснованности первоначального предположения, что полицейский остановил водителя действительно случайно, а не из-за плохого вождения. Если эта или другая непроизвольная причина остановки водителя присутствовала, то расчет также включает вероятность того, что пьяный водитель вел машину грамотно, а не пьяный водитель вел машину (не) грамотно.

Более формально, та же вероятность около 0,02 может быть установлена ​​с помощью теоремы Байеса . Цель состоит в том, чтобы найти вероятность того, что водитель пьян, учитывая, что алкотестеры показали, что он пьян, что можно представить как

где D означает, что алкотестер показывает, что водитель пьян. Используя теорему Байеса,

В этом сценарии известна следующая информация:

и

Как видно из формулы, для теоремы Байеса требуется p ( D ), которое можно вычислить из предыдущих значений, используя закон полной вероятности :

что дает

Подставляя эти числа в теорему Байеса, получаем, что

что является точностью теста.

Пример 3: Идентификация террориста

В городе с населением 1 миллион человек пусть будет 100 террористов и 999 900 нетеррористов. Для упрощения примера предположим, что все люди, присутствующие в городе, являются жителями. Таким образом, базовая вероятность того, что случайно выбранный житель города является террористом, составляет 0,0001, а базовая вероятность того, что тот же житель является нетеррористом, составляет 0,9999. В попытке поймать террористов город устанавливает систему сигнализации с камерой наблюдения и программным обеспечением для автоматического распознавания лиц .

Программное обеспечение имеет два показателя отказов по 1%:

Предположим теперь, что житель активирует сигнализацию. Кто-то, сделавший ошибку базовой ставки, сделает вывод, что существует 99% вероятность того, что обнаруженный человек является террористом. Хотя вывод кажется разумным, на самом деле это плохое рассуждение, и приведенный ниже расчет покажет, что вероятность террориста на самом деле близка к 1%, а не к 99%.

Заблуждение возникает из-за смешения двух различных показателей отказов. «Количество незвонящих на 100 террористов» (P(¬B | T), или вероятность того, что звонок не зазвонит, при условии, что житель — террорист) и «количество нетеррористов на 100 звонков» (P(¬T | B), или вероятность того, что житель — не террорист, при условии, что звонок зазвонит) — это несвязанные величины; одна из них не обязательно равна другой или даже близка к ней. Чтобы показать это, рассмотрим, что произойдет, если установить идентичную систему сигнализации во втором городе, где вообще нет террористов. Как и в первом городе, сигнализация срабатывает для 1 из каждых 100 обнаруженных жителей, не являющихся террористами, но, в отличие от первого города, сигнализация никогда не срабатывает для террористов. Следовательно, 100% всех случаев срабатывания сигнализации приходится на нетеррористов, но ложноотрицательный показатель даже не может быть подсчитан. «Количество нетеррористов на 100 звонков» в этом городе равно 100, однако P(T | B) = 0%. Вероятность обнаружения террориста равна нулю, учитывая звон колокола.

Представьте, что все население первого города в один миллион человек проходит перед камерой. Около 99 из 100 террористов включат сигнализацию, и так же поступят около 9999 из 999900 нетеррористов. Таким образом, около 10 098 человек включат сигнализацию, среди которых около 99 будут террористами. Вероятность того, что человек, включивший сигнализацию, на самом деле является террористом, составляет всего около 99 из 10 098, что меньше 1% и очень, очень много ниже первоначальной догадки в 99%.

Ошибочность базовой вероятности в этом примере настолько обманчива, потому что нетеррористов гораздо больше, чем террористов, а количество ложных положительных результатов (нетеррористы распознаются как террористы) намного больше, чем истинно положительных результатов (террористы распознаются как террористы).

Многие специалисты утверждают, что, поскольку базовый уровень терроризма крайне низок, использование алгоритмов интеллектуального анализа данных и прогнозирования для выявления террористов не может быть эффективным из-за парадокса ложных срабатываний. [9] [10] [11] [12] Оценки количества ложных срабатываний для каждого точного результата варьируются от более десяти тысяч [12] до одного миллиарда; [10] следовательно, расследование каждой зацепки будет непомерно дорогим и затратным по времени. [9] [11] Уровень точности, необходимый для того, чтобы сделать эти модели жизнеспособными, скорее всего, недостижим. Прежде всего, низкий базовый уровень терроризма также означает, что существует нехватка данных, с помощью которых можно создать точный алгоритм. [11] Кроме того, в контексте обнаружения терроризма ложные отрицательные результаты крайне нежелательны и, следовательно, должны быть максимально сведены к минимуму; однако это требует повышения чувствительности за счет специфичности , увеличивая количество ложных срабатываний. [12] Также сомнительно, что использование таких моделей правоохранительными органами будет соответствовать требуемому бремени доказывания, учитывая, что более 99% результатов будут ложноположительными. [12]

Пример 4: биологическое тестирование подозреваемого

Совершено преступление. Судебно-медицинская экспертиза определяет, что у преступника определенная группа крови, общая для 10% населения. Подозреваемый арестован, и у него обнаруживается та же группа крови.

Прокурор может предъявить подозреваемому обвинение в совершении преступления только на этом основании и заявить на суде, что вероятность виновности подсудимого составляет 90%.

Однако этот вывод близок к правильному, только если обвиняемый был выбран в качестве главного подозреваемого на основе надежных доказательств, обнаруженных до анализа крови и не связанных с ним. В противном случае представленное рассуждение ошибочно, поскольку оно упускает из виду высокую априорную вероятность (то есть до анализа крови) того, что он является случайным невиновным человеком. Предположим, например, что в городе, где произошло преступление, проживает 1000 человек. Это означает, что там проживает 100 человек с группой крови преступника, из которых только один является истинным преступником; следовательно, истинная вероятность того, что обвиняемый виновен — основанная только на том факте, что его группа крови совпадает с группой крови убийцы — составляет всего 1%, что намного меньше 90%, на которые ссылается прокурор.

Ошибка прокурора заключается в предположении, что априорная вероятность случайного совпадения равна вероятности того, что подсудимый невиновен. Используя ее, прокурор, допрашивающий эксперта-свидетеля, может спросить: «Вероятность обнаружения этих доказательств у невиновного человека настолько мала, что присяжные могут спокойно проигнорировать возможность того, что этот подсудимый невиновен, верно?» [13] Утверждение предполагает, что вероятность обнаружения доказательств у невиновного человека такая же, как и вероятность того, что человек невиновен, учитывая, что доказательства были найдены у него, что не соответствует действительности. В то время как первое обычно невелико (10% в предыдущем примере) из-за хороших процедур судебной экспертизы доказательств , последнее (99% в этом примере) не имеет к нему прямого отношения и часто будет намного выше, поскольку, по сути, оно зависит от вероятных довольно высоких априорных шансов того, что подсудимый является случайным невиновным человеком.

Примеры в законе

Судебный процесс над О. Дж. Симпсоном

В 1995 году О. Джей Симпсон предстал перед судом и был оправдан за убийства своей бывшей жены Николь Браун Симпсон и ее друга Рональда Голдмана.

Кровь с места преступления совпала с кровью Симпсона, и ее характеристики были общими для 1 из 400 человек. Однако защита утверждала, что количество людей из Лос-Анджелеса, соответствующих образцу, могло бы заполнить футбольный стадион, и что цифра 1 из 400 была бесполезной. [14] [15] Было бы неправильно полагаться исключительно на цифру «1 из 400», чтобы сделать вывод о том, что данный человек, соответствующий образцу, скорее всего, будет преступником.

Дерево частот 100 000 американских женщин, подвергшихся насилию, демонстрирующее ошибку прокурора в деле об убийстве О. Джей Симпсона

В том же судебном процессе обвинение представило доказательства того, что Симпсон был жесток по отношению к своей жене. Защита утверждала, что на каждые 2500 женщин, подвергшихся супружескому насилию, приходится только одна убитая женщина, и что любая история насилия Симпсона по отношению к своей жене не имеет значения для судебного разбирательства. Однако рассуждения, лежащие в основе расчетов защиты, были ошибочными. По словам автора Герда Гигеренцера , правильная вероятность требует дополнительного контекста: жена Симпсона не просто подвергалась домашнему насилию, но скорее подвергалась домашнему насилию (со стороны Симпсона) и была убита (кем-то). Гигеренцер пишет: «Вероятность того, что обидчик действительно убил свою партнершу, учитывая, что она была убита, составляет около 8 из 9 или около 90%». [16] Хотя большинство случаев супружеского насилия не заканчиваются убийством, большинство случаев убийства, в которых есть история супружеского насилия, были совершены супругом.

Дело Салли Кларк

Салли Кларк , британка, была обвинена в 1998 году в убийстве своего первого ребенка в возрасте 11 недель, а затем второго ребенка в возрасте 8 недель. Обвинение привлекло эксперта-свидетеля сэра Роя Медоу , профессора и консультанта-педиатра, [17] для показаний о том, что вероятность смерти двух детей в одной семье от СВДС составляет около 1 к 73 миллионам. Это было намного реже, чем фактический показатель, измеренный в исторических данных  — Медоу оценил его на основе данных о смерти от СВДС у одного ребенка и предположения, что вероятность таких смертей не должна коррелировать между младенцами. [18]

Медоу признал, что 1 из 73 миллионов не является невозможным, но утверждал, что такие несчастные случаи будут происходить «раз в сто лет» и что в стране с 15 миллионами семей с двумя детьми гораздо более вероятно, что двойные смерти вызваны синдромом Мюнхгаузена по доверенности, чем таким редким несчастным случаем. Однако есть веские основания полагать, что вероятность смерти от СВДС в семье значительно выше, если предыдущий ребенок уже умер при этих обстоятельствах ( генетическая предрасположенность к СВДС, вероятно, сделает недействительной эту предполагаемую статистическую независимость [19] ), что делает некоторые семьи более восприимчивыми к СВДС, а ошибка — результатом экологического заблуждения . [20] Вероятность двух смертей от СВДС в одной и той же семье не может быть надежно оценена путем возведения в квадрат вероятности одной такой смерти во всех в остальном подобных семьях. [21]

Цифра 1 из 73 миллионов сильно недооценивает вероятность двух последовательных несчастных случаев, но даже если бы эта оценка была точной, суд, похоже, упустил тот факт, что цифра 1 из 73 миллионов сама по себе ничего не значила. Как априорную вероятность, ее следовало бы сопоставить с априорными вероятностями альтернатив. Учитывая, что произошло две смерти, одно из следующих объяснений должно быть верным, и все они априори крайне маловероятны:

  1. Две последовательные смерти в одной семье, обе от СВДС
  2. Двойное убийство (версия обвинения)
  3. Другие возможности (включая одно убийство и один случай СВДС)

Неясно, предлагалась ли когда-либо оценка вероятности второго варианта в ходе судебного разбирательства или же сравнение первых двух вероятностей рассматривалось как ключевая оценка, которую необходимо было провести в статистическом анализе, оценивающем доводы обвинения против доводов о невиновности.

Кларк был осужден в 1999 году, после чего Королевское статистическое общество выпустило пресс-релиз , в котором указало на ошибки. [22]

В 2002 году Рэй Хилл (профессор математики в Солфорде ) попытался точно сравнить шансы этих двух возможных объяснений; он пришел к выводу, что последовательные несчастные случаи в 4,5–9 раз более вероятны, чем последовательные убийства, так что априорные шансы виновности Кларка составляли от 4,5 к 1 до 9 к 1 против. [23]

После того, как суд установил, что патологоанатом, обследовавший обоих младенцев, не предоставил оправдательных доказательств , вышестоящий суд позднее, 29 января 2003 года, отменил обвинительный приговор Кларку. [24]

Результаты исследований в области психологии

В ходе экспериментов было обнаружено, что люди предпочитают индивидуализированную информацию общей информации, когда первая доступна. [25] [26] [27]

В некоторых экспериментах студентам предлагалось оценить средний балл (GPA) гипотетических студентов. Когда им предоставляли соответствующие статистические данные о распределении GPA, студенты, как правило, игнорировали их, если им предоставляли описательную информацию о конкретном студенте, даже если новая описательная информация была явно мало или совсем не имела отношения к успеваемости в школе. [26] Этот вывод использовался для утверждения, что собеседования являются ненужной частью процесса поступления в колледж, поскольку интервьюеры не способны выбрать успешных кандидатов лучше, чем базовая статистика.

Психологи Дэниел Канеман и Амос Тверски попытались объяснить это открытие с помощью простого правила или «эвристики», называемой репрезентативностью . Они утверждали, что многие суждения, касающиеся вероятности или причины и следствия, основаны на том, насколько репрезентативна одна вещь по отношению к другой или к категории. [26] Канеман считает игнорирование базовой ставки особой формой игнорирования расширения . [28] Ричард Нисбетт утверждал, что некоторые атрибуционные искажения , такие как фундаментальная ошибка атрибуции , являются примерами ошибки базовой ставки: люди не используют «консенсусную информацию» («базовую ставку») о том, как другие вели себя в схожих ситуациях, и вместо этого предпочитают более простые диспозиционные атрибуции . [29]

В психологии ведутся серьезные дебаты об условиях, при которых люди ценят или не ценят информацию об априорной вероятности. [30] [31] Исследователи в программе эвристики и предубеждений подчеркивают эмпирические результаты, показывающие, что люди склонны игнорировать априорные вероятности и делать выводы, которые нарушают определенные нормы вероятностного мышления, такие как теорема Байеса . Вывод, сделанный в результате этого направления исследований, состоял в том, что человеческое вероятностное мышление в корне ошибочно и подвержено ошибкам. [32] Другие исследователи подчеркивают связь между когнитивными процессами и форматами информации, утверждая, что такие выводы, как правило, не являются обоснованными. [33] [34]

Рассмотрим еще раз пример 2 из предыдущего примера. Требуемый вывод — оценить (апостериорную) вероятность того, что (случайно выбранный) водитель пьян, учитывая, что тест на алкоголь положительный. Формально эту вероятность можно вычислить с помощью теоремы Байеса, как показано выше. Однако существуют разные способы представления соответствующей информации. Рассмотрим следующий формально эквивалентный вариант задачи:

 1 из 1000 водителей садится за руль пьяным. Алкотестеры всегда выявляют действительно пьяного человека. У 50 из 999 водителей, которые не пьяны, алкотестеры ложно показывают опьянение. Предположим, что полицейские останавливают водителя наугад и заставляют его пройти тест на алкоголь. Тест показывает, что он пьян. Никакой другой информации о нем не известно. Оцените вероятность того, что водитель действительно пьян.

В этом случае соответствующая числовая информация — p (пьяный), p ( D | пьяный), p ( D | трезвый) — представлена ​​в терминах собственных частот относительно определенного референтного класса (см. задачу референтного класса ). Эмпирические исследования показывают, что выводы людей более точно соответствуют правилу Байеса, когда информация представлена ​​таким образом, что помогает преодолеть пренебрежение базовой ставкой у неспециалистов [34] и экспертов. [35] Как следствие, такие организации, как Cochrane Collaboration, рекомендуют использовать этот формат для передачи статистики здравоохранения. [36] Обучение людей переводу таких задач байесовских рассуждений в форматы собственных частот более эффективно, чем простое обучение их подставлять вероятности (или проценты) в теорему Байеса. [37] Также было показано, что графические представления собственных частот (например, массивы значков, графики гипотетических результатов) помогают людям делать более точные выводы. [37] [38] [39] [40]

Одной из важных причин, по которой форматы собственной частоты полезны, является то, что этот формат информации облегчает требуемый вывод, поскольку он упрощает необходимые вычисления. Это можно увидеть при использовании альтернативного способа вычисления требуемой вероятности p (drunk| D ):

где N (пьяный ∩ D ) обозначает количество водителей, которые пьяны и получают положительный результат алкотестера, а N ( D ) обозначает общее количество случаев с положительным результатом алкотестера. Эквивалентность этого уравнения предыдущему следует из аксиом теории вероятностей, согласно которым N (пьяный ∩ D ) = N × p ( D | пьяный) × p (пьяный). Важно отметить, что хотя это уравнение формально эквивалентно правилу Байеса, оно не является психологически эквивалентным. Использование собственных частот упрощает вывод, поскольку требуемая математическая операция может быть выполнена над натуральными числами, а не над нормализованными дробями (т. е. вероятностями), поскольку это делает большое количество ложных срабатываний более прозрачным, и поскольку собственные частоты демонстрируют «структуру вложенных множеств». [41] [42]

Не каждый формат частоты способствует байесовскому рассуждению. [42] [43] Естественные частоты относятся к частотной информации, которая получается в результате естественной выборки , [44] которая сохраняет информацию о базовой ставке (например, количество пьяных водителей при взятии случайной выборки водителей). Это отличается от систематической выборки , в которой базовые ставки фиксируются априори (например, в научных экспериментах). В последнем случае невозможно вывести апостериорную вероятность p (пьяный | положительный тест) из сравнения количества водителей, которые пьяны и имеют положительный тест, по сравнению с общим числом людей, которые получают положительный результат алкотестера, потому что информация о базовой ставке не сохраняется и должна быть явно введена повторно с использованием теоремы Байеса.

Смотрите также

Ссылки

  1. ^ "COVID-19 Cases, Hospitalizations, and Deaths by Vaccination Status" (PDF) . Департамент здравоохранения штата Вашингтон. 2023-01-18. Архивировано (PDF) из оригинала 2023-01-26 . Получено 2023-02-14 . Если воздействие COVID-19 останется прежним, то по мере того, как все больше людей будут вакцинированы, больше случаев, госпитализаций и смертей будет у вакцинированных людей, поскольку они будут продолжать составлять все большую часть населения. Например, если бы 100% населения были вакцинированы, 100% случаев были бы среди вакцинированных людей.
  2. ^ Уэлш, Мэтью Б.; Наварро, Дэниел Дж. (2012). «Увидеть — значит поверить: априорные данные, доверие и игнорирование базовой ставки». Организационное поведение и процессы принятия решений человеком . 119 (1): 1–14. doi :10.1016/j.obhdp.2012.04.001. hdl : 2440/41190 . ISSN  0749-5978.
  3. ^ "Логическая ошибка: ошибка базовой ставки". Fallacyfiles.org . Получено 2013-06-15 .
  4. ^ Томпсон, WC; Шуман, EL (1987). «Интерпретация статистических доказательств в уголовных процессах: заблуждение прокурора и заблуждение адвоката защиты». Закон и человеческое поведение . 2 (3): 167. doi :10.1007/BF01044641. JSTOR  1393631. S2CID  147472915.
  5. ^ Фонтейн, Джон; Ганби, Филип (февраль 2010 г.). «Неоднозначность, иллюзия определенности и подход Гигеренцера к рассуждениям с обратными вероятностями на основе естественной частоты» (PDF) . Университет Кентербери . стр. 6.[ постоянная мертвая ссылка ]
  6. ^ Сасс, Ричард А. (4 октября 2023 г.). «Заблуждение прокурора, представленное как подмена пространства образцов». Препринты OSF . doi :10.31219/osf.io/cs248.
  7. ^ Райнфурт, МХ; Хауэлл, ЛВ (март 1998). Вероятность и статистика в аэрокосмической технике. НАСА . стр. 16. СООБЩЕНИЕ: Ложноположительные тесты более вероятны, чем истинно положительные тесты, когда общая популяция имеет низкую распространенность заболевания. Это называется ложноположительным парадоксом.
  8. ^ ab Vacher, HL (май 2003 г.). "Количественная грамотность - тестирование на наркотики, скрининг рака и идентификация магматических пород". Журнал Geoscience Education : 2. На первый взгляд, это кажется извращением: чем меньше студенты в целом употребляют стероиды , тем больше вероятность, что студент, идентифицированный как пользователь, не будет их употреблять. Это было названо Ложноположительным Парадоксом- Цитата: Gonick, L.; Smith, W. (1993). Карикатурное руководство по статистике . Нью-Йорк: Harper Collins. С. 49.
  9. ^ ab Munk, Timme Bisgaard (1 сентября 2017 г.). «100 000 ложных срабатываний на каждого настоящего террориста: почему алгоритмы борьбы с терроризмом не работают». Первый понедельник . 22 (9). doi : 10.5210/fm.v22i9.7126 .
  10. ^ ab Шнайер, Брюс . «Почему интеллектуальный анализ данных не остановит террор». Wired . ISSN  1059-1028 . Получено 30 августа 2022 г.
  11. ^ abc Jonas, Jeff; Harper, Jim (2006-12-11). «Эффективная борьба с терроризмом и ограниченная роль предиктивного анализа данных». Институт CATO . Получено 2022-08-30 .
  12. ^ abcd Сейджман, Марк (2021-02-17). «Последствия чрезвычайно низкой базовой ставки терроризма». Терроризм и политическое насилие . 33 (2): 302–311. doi :10.1080/09546553.2021.1880226. ISSN  0954-6553. S2CID  232341781.
  13. ^ Фентон, Норман; Нил, Мартин; Бергер, Дэниел (июнь 2016 г.). «Байес и закон». Ежегодный обзор статистики и ее применение . 3 (1): 51–77. Bibcode : 2016AnRSA...3...51F. doi : 10.1146/annurev-statistics-041715-033428. PMC 4934658. PMID  27398389 . 
  14. ^ Робертсон, Б. и Виньо, GA (1995). Интерпретация доказательств: Оценка судебных доказательств в зале суда. Чичестер: John Wiley and Sons.
  15. ^ Россмо, Д. Ким (2009). Неудачи в расследовании уголовных дел. CRC Press Taylor & Francis Group.
  16. ^ Гигеренцер, Г., Расплата с риском: учимся жить в условиях неопределенности, Penguin, (2003)
  17. ^ "Резолюция, принятая Сенатом (21 октября 1998 г.) об отставке профессора сэра Роя Медоу". Reporter . № 428. Университет Лидса . 30 ноября 1998 г. Архивировано из оригинала 2016-04-16 . Получено 2015-10-17 .
  18. ^ Вероятность смерти от СВДС для всей популяции составляла около 1 из 1303; Медоу вывел свою оценку 1 из 73 миллионов, исходя из меньшей вероятности смерти от СВДС в семье Кларков, в которой были более низкие факторы риска (например, некурящие). В этой подгруппе населения он оценил вероятность одной смерти в 1 из 8500. См.: Joyce, H. (сентябрь 2002 г.). "Beyond reasonably doubt" (pdf) . plus.maths.org . Получено 12.06.2010 .. Профессор Рэй Хилл подверг сомнению даже этот первый шаг (1/8500 против 1/1300) двумя способами: во-первых, на том основании, что он был предвзятым , исключая те факторы, которые увеличивали риск (особенно то, что оба ребенка были мальчиками) и (что более важно) потому, что снижение факторов риска СВДС пропорционально снизит факторы риска убийства, так что относительные частоты синдрома Мюнхгаузена по доверенности и СВДС останутся в том же соотношении, что и в общей популяции: Хилл, Рэй (2002). «Смерть в детской кроватке или убийство? – Взвешивание вероятностей». явно несправедливо использовать характеристики, которые в основном делают ее хорошей, порядочной матерью, в качестве факторов, которые учитываются против нее. Да, мы можем согласиться, что такие факторы делают естественную смерть менее вероятной, – но те же самые характеристики также делают убийство менее вероятным.
  19. Суини, Джон; Лоу, Билл (15 июля 2001 г.). «Находка гена ставит под сомнение двойные убийства «смерть в колыбели». The Observer . Архивировано из оригинала 11 июля 2012 г.
  20. ^ Винсент Шойрер. «Осужден по статистике?» . Получено 21.05.2010 .
  21. ^ Хилл, Р. (2004). «Множественные внезапные смерти младенцев – совпадение или нечто большее?» (PDF) . Детская и перинатальная эпидемиология . 18 (5): 321. doi :10.1111/j.1365-3016.2004.00560.x. PMID  15367318. Архивировано из оригинала (PDF) 2012-08-30 . Получено 2010-06-13 .
  22. ^ "Королевское статистическое общество обеспокоено вопросами, поднятыми в деле Салли Кларк" (PDF) . 23 октября 2001 г. Архивировано из оригинала (PDF) 24 августа 2011 г. Общество не терпит, чтобы врачи совершали серьезные клинические ошибки, поскольку широко известно, что такие ошибки могут означать разницу между жизнью и смертью. Дело R против Салли Кларк является одним из примеров того, как медицинский эксперт-свидетель допустил серьезную статистическую ошибку, которая могла оказать глубокое влияние на исход дела
  23. ^ Неопределенность в этом диапазоне в основном обусловлена ​​неопределенностью вероятности убийства второго ребенка, убив первого, см.: Hill, R. (2004). "Multiple unexpected infant deaths – accidentance or beyond accidentance?" (PDF) . Paediatric and Perinatal Epidemiology . 18 (5): 322–323. doi :10.1111/j.1365-3016.2004.00560.x. PMID  15367318. Архивировано из оригинала (PDF) 2012-08-30 . Получено 2010-06-13 .
  24. ^ "R v Clark. [2003] EWCA Crim 1020 (11 апреля 2003 г.)". www.bailii.org .
  25. ^ Бар-Хиллел, Майя (1980). «Ошибка базовой ставки в вероятностных суждениях» (PDF) . Acta Psychologica . 44 (3): 211–233. doi :10.1016/0001-6918(80)90046-3.
  26. ^ abc Канеман, Дэниел; Амос Тверски (1973). «О психологии предсказания». Psychological Review . 80 (4): 237–251. doi :10.1037/h0034747. S2CID  17786757.
  27. ^ Тверски, Амос; Канеман, Дэниел (1974-09-27). «Суждение в условиях неопределенности: эвристики и предубеждения». Science . 185 (4157): 1124–1131. Bibcode :1974Sci...185.1124T. doi :10.1126/science.185.4157.1124. PMID  17835457. S2CID  143452957.
  28. ^ Канеман, Дэниел (2000). «Оценка моментов, прошлого и будущего». В Дэниеле Канемане и Амосе Тверски (ред.). Выборы, ценности и рамки . ISBN 0-521-62749-4.
  29. ^ Нисбетт, Ричард Э.; Э. Боргида; Р. Крэндалл; Х. Рид (1976). «Популярная индукция: информация не всегда информативна». В JS Carroll & JW Payne (ред.). Познание и социальное поведение . Том 2. John Wiley & Sons, Incorporated. стр. 227–236. ISBN 0-470-99007-4.
  30. ^ Келер, Дж. Дж. (2010). «Пересмотр ошибки базовой ставки: описательные, нормативные и методологические проблемы». Поведенческие и мозговые науки . 19 : 1–17. doi : 10.1017/S0140525X00041157. S2CID  53343238.
  31. ^ Barbey, AK; Sloman, SA (2007). «Уважение к базовой ставке: от экологической рациональности к дуальным процессам». Behavioral and Brain Sciences . 30 (3): 241–254, обсуждение 255–297. doi :10.1017/S0140525X07001653. PMID  17963533. S2CID  31741077.
  32. ^ Тверски, А.; Канеман, Д. (1974). «Суждение в условиях неопределенности: эвристики и предубеждения». Science . 185 (4157): 1124–1131. Bibcode :1974Sci...185.1124T. doi :10.1126/science.185.4157.1124. PMID  17835457. S2CID  143452957.
  33. ^ Cosmides, Leda; John Tooby (1996). «Являются ли люди хорошими интуитивными статистиками в конце концов? Переосмысление некоторых выводов литературы о суждениях в условиях неопределенности». Cognition . 58 : 1–73. CiteSeerX 10.1.1.131.8290 . doi :10.1016/0010-0277(95)00664-8. S2CID  18631755. 
  34. ^ ab Gigerenzer, G.; Hoffrage, U. (1995). «Как улучшить байесовское рассуждение без инструкций: форматы частот». Psychological Review . 102 (4): 684. CiteSeerX 10.1.1.128.3201 . doi :10.1037/0033-295X.102.4.684. S2CID  16281385. 
  35. ^ Хоффраге, У.; Линдси, С.; Хертвиг, Р.; Гигеренцер, Г. (2000). «Медицина: передача статистической информации». Science . 290 (5500): 2261–2262. doi :10.1126/science.290.5500.2261. hdl : 11858/00-001M-0000-0025-9B18-3 . PMID  11188724. S2CID  33050943.
  36. ^ Akl, EA; Oxman, AD; Herrin, J.; Vist, GE; Terrenato, I.; Sperati, F.; Costiniuk, C.; Blank, D.; Schünemann, H. (2011). Schünemann, Holger (ред.). «Использование альтернативных статистических форматов для представления рисков и снижения рисков». База данных систематических обзоров Cochrane . 2011 (3): CD006776. doi :10.1002/14651858.CD006776.pub2. PMC 6464912. PMID  21412897 . 
  37. ^ ab Sedlmeier, P.; Gigerenzer, G. (2001). «Обучение байесовскому мышлению менее чем за два часа». Журнал экспериментальной психологии: Общие сведения . 130 (3): 380–400. doi : 10.1037/0096-3445.130.3.380. hdl : 11858/00-001M-0000-0025-9504-E . PMID  11561916. S2CID  11147078.
  38. ^ Brase, GL (2009). «Наглядные представления в статистических рассуждениях». Прикладная когнитивная психология . 23 (3): 369–381. doi :10.1002/acp.1460. S2CID  18817707.
  39. ^ Эдвардс, А.; Элвин, Г.; Малли, А. (2002). «Объяснение рисков: превращение числовых данных в осмысленные изображения». BMJ . 324 (7341): 827–830. doi :10.1136/bmj.324.7341.827. PMC 1122766 . PMID  11934777. 
  40. ^ Ким, Йе-Сыль; Уоллс, Логан А.; Крафт, Питер; Халлман, Джессика (2 мая 2019 г.). «Байесовский подход к познанию для улучшения визуализации данных». Труды конференции CHI 2019 года по человеческому фактору в вычислительных системах . стр. 1–14. arXiv : 1901.02949 . doi :10.1145/3290605.3300912. ISBN 9781450359702. S2CID  57761146.
  41. ^ Girotto, V.; Gonzalez, M. (2001). «Решение вероятностных и статистических задач: вопрос информационной структуры и формы вопроса». Cognition . 78 (3): 247–276. doi :10.1016/S0010-0277(00)00133-5. PMID  11124351. S2CID  8588451.
  42. ^ ab Hoffrage, U.; Gigerenzer, G.; Krauss, S.; Martignon, L. (2002). «Представление облегчает рассуждение: что такое собственные частоты, а что нет». Cognition . 84 (3): 343–352. doi :10.1016/S0010-0277(02)00050-1. PMID  12044739. S2CID  9595672.
  43. ^ Гигеренцер, Г.; Хоффраге, У. (1999). «Преодоление трудностей в байесовском рассуждении: ответ Льюису и Керену (1999) и Меллерсу и Макгроу (1999)». Psychological Review . 106 (2): 425. doi :10.1037/0033-295X.106.2.425. hdl : 11858/00-001M-0000-0025-9CB4-8 .
  44. ^ Kleiter, GD (1994). "Естественная выборка: рациональность без базовых ставок". Вклад в математическую психологию, психометрику и методологию . Последние исследования в области психологии. стр. 375–388. doi :10.1007/978-1-4612-4308-3_27. ISBN 978-0-387-94169-1.

Внешние ссылки