stringtranslate.com

Ошибка базовой ставки

Больница, принимающая больше вакцинированных пациентов с COVID-19 , чем непривитых, может предполагать, что вакцина неэффективна, но такого дисбаланса следует ожидать среди высоковакцинированного населения. [1]

Ошибка базовой ставки , также называемая пренебрежением базовой ставкой [2] или предвзятостью базовой ставки , представляет собой тип ошибки , при которой люди склонны игнорировать базовую ставку (например, общую распространенность ) в пользу индивидуализирующей информации (т. е. информации, касающейся только к конкретному случаю). [3] Игнорирование базовой ставки является особой формой более общего игнорирования расширения .

Это также называется ошибкой прокурора или ошибкой адвоката применительно к результатам статистических тестов (таких как тесты ДНК) в контексте судебного разбирательства. Эти термины были введены Уильямом К. Томпсоном и Эдвардом Шуманом в 1987 году, [4] [5] , хотя утверждалось, что их определение ошибки прокурора распространяется на множество дополнительных недействительных вменений вины или ответственности, которые не поддаются анализу как ошибки в базовые ставки или теорема Байеса . [6]

Ложноположительный парадокс

Примером ошибки базовой ставки является парадокс ложноположительного результата (также известный как парадокс точности ). Этот парадокс описывает ситуации, когда ложноположительных результатов теста больше, чем истинно положительных (это означает, что классификатор имеет низкую точность ). Например, если камера распознавания лиц может точно идентифицировать разыскиваемых преступников на 99%, но анализирует 10 000 человек в день, высокая точность перевешивается количеством тестов, и в списке преступников программы, скорее всего, будет гораздо больше ложных срабатываний, чем истинных. Вероятность положительного результата теста определяется не только точностью теста, но и характеристиками выборочной совокупности. [7] Когда распространенность, то есть доля тех, у кого есть данное заболевание, ниже, чем уровень ложноположительных результатов теста , даже тесты, которые имеют очень низкий риск дать ложноположительный результат в отдельном случае, дадут больше ложноположительных результатов, чем истинных положительных результатов. общий . [8]

Это особенно противоречит здравому смыслу при интерпретации положительного результата теста на популяции с низкой распространенностью после рассмотрения положительных результатов, полученных в популяции с высокой распространенностью. [8] Если уровень ложноположительных результатов теста выше, чем доля новой популяции с этим заболеванием, то администратор тестирования, чей опыт был основан на тестировании в популяции с высокой распространенностью, может на основе опыта сделать вывод , что положительный результат теста обычно указывает на положительный субъект, хотя на самом деле ложноположительный результат гораздо более вероятен.

Примеры

Пример 1: Болезнь

Популяция с высокой распространенностью

Представьте себе, что вы проводите тест на инфекционные заболевания среди населения А из 1000 человек, из которых 40% инфицированы. Уровень ложноположительных результатов теста составляет 5% (0,05), а уровень ложноотрицательных результатов равен нулю. Ожидаемый результат 1000 тестов в популяции А будет следующим:

Инфицирован и тест указывает на заболевание ( истинно положительный результат )
1000 ×40/100= 400 человек получат настоящий положительный результат
Неинфицирован и тест указывает на заболевание (ложноположительный результат)
1000 ×100 – 40/100× 0,05 = 30 человек получат ложноположительный результат.
Остальные 570 тестов оказались правильно отрицательными.

Таким образом, в популяции А человек, получивший положительный тест, может быть уверен в себе более чем на 93% (400/30 + 400), что это правильно указывает на инфекцию.

Популяция с низкой распространенностью

Теперь рассмотрим тот же тест, примененный к популяции B , из которой инфицированы только 2%. Ожидаемый результат 1000 тестов в популяции B будет следующим:

Инфицирован, и тест указывает на заболевание (истинно положительный)
1000 ×2/100= 20 человек получат настоящий положительный результат
Неинфицирован и тест указывает на заболевание (ложноположительный результат)
1000 ×100 – 2/100× 0,05 = 49 человек получат ложноположительный результат.
Остальные 931 тест оказались правильно отрицательными.

В популяции B только 20 из 69 человек с положительным результатом теста действительно инфицированы. Таким образом, вероятность действительно заразиться после того, как человеку сообщили, что он заражен, составляет всего 29% (20/20 + 49) для теста, который в противном случае кажется «точным на 95 %».

Тестировщику с опытом работы в группе А может показаться парадоксом, что в группе Б результат, который обычно правильно указывал на инфекцию, теперь обычно оказывается ложноположительным. Смешение апостериорной вероятности заражения с априорной вероятностью получения ложноположительного результата является естественной ошибкой после получения опасного для здоровья результата теста.

Пример 2: Пьяные водители

Представьте себе, что у группы полицейских есть алкотестеры , показывающие ложное состояние опьянения в 5% случаев, когда водитель трезв. Однако алкотестеры всегда способны обнаружить действительно пьяного человека. Один из тысячи водителей водит машину пьяным. Предположим, что полицейские затем случайным образом останавливают водителя, чтобы провести проверку на алкотестере. Это указывает на то, что водитель пьян. Никакой другой информации о них не известно.

Многие оценили бы вероятность того, что водитель пьян, в 95%, но правильная вероятность составляет около 2%.

Объяснение этому следующее: в среднем на каждую 1000 протестированных водителей

Следовательно, вероятность того, что любой водитель из 1 + 49,95 = 50,95 положительных результатов теста действительно пьян, равна .

Однако достоверность этого результата зависит от обоснованности первоначального предположения о том, что полицейский остановил водителя действительно случайно, а не из-за плохого вождения. Если имелась та или иная непроизвольная причина остановки водителя, то в расчете также учитывается вероятность того, что пьяный водитель будет управлять грамотно, а непьяный водитель будет управлять (не)грамотно.

Более формально, ту же вероятность, равную примерно 0,02, можно установить с помощью теоремы Байеса . Цель состоит в том, чтобы найти вероятность того, что водитель пьян, учитывая, что алкотестер показал, что он пьян, что можно представить как

где D означает, что алкотестер показывает, что водитель пьян. Используя теорему Байеса,

В этом сценарии известна следующая информация:

и

Как видно из формулы, для теоремы Байеса требуется p ( D ), который можно вычислить из предыдущих значений, используя закон полной вероятности :

который дает

Подставляя эти числа в теорему Байеса, можно обнаружить, что

что такое точность теста.

Пример 3: Выявление террориста

Пусть в городе с населением в 1 миллион жителей будет 100 террористов и 999 900 нетеррористов. Для упрощения примера предполагается, что все люди, находящиеся в городе, являются его жителями. Таким образом, базовая вероятность того, что случайно выбранный житель города является террористом, равна 0,0001, а базовая вероятность того, что тот же самый житель не является террористом, равна 0,9999. Пытаясь поймать террористов, город устанавливает систему сигнализации с камерой наблюдения и программным обеспечением автоматического распознавания лиц .

Программное обеспечение имеет два уровня отказов по 1%:

Предположим теперь, что тревогу включает житель. Кто-то, допускающий ошибку базовой ставки, пришел бы к выводу, что существует 99% вероятность того, что обнаруженный человек является террористом. Хотя этот вывод кажется разумным, на самом деле это плохое рассуждение, и приведенный ниже расчет покажет, что вероятность террориста на самом деле составляет около 1%, а не около 99%.

Заблуждение возникает из-за путаницы природы двух разных показателей отказов. «Количество нетеррористов на 100 террористов» (P(¬B | T), или вероятность того, что колокол не прозвенит, если житель является террористом) и «число нетеррористов на 100 звонков» (P (¬T | B), или вероятность того, что житель не является террористом, учитывая звон колокола) — это несвязанные величины; одно не обязательно равно другому или даже близко к нему. Чтобы продемонстрировать это, рассмотрим, что произойдет, если идентичную систему сигнализации установить во втором городе, где вообще нет террористов. Как и в первом городе, сигнал тревоги звучит для 1 из каждых 100 обнаруженных жителей-нетеррористов, но в отличие от первого города, сигнал тревоги никогда не звучит для террориста. Таким образом, 100% всех случаев срабатывания тревоги приходится на нетеррористов, но процент ложноотрицательных результатов даже подсчитать невозможно. «Число нетеррористов на 100 колоколов» в этом городе равно 100, но P(T | B) = 0%. Судя по звонку в колокол, вероятность того, что террорист будет обнаружен, равна нулю.

Представьте себе, что перед камерой проходит все население первого города в миллион человек. Около 99 из 100 террористов поднимут тревогу, как и около 9 999 из 999 900 нетеррористов. Таким образом, тревогу поднимут около 10 098 человек, среди которых около 99 будут террористами. Вероятность того, что человек, включивший сигнализацию, на самом деле является террористом, составляет всего около 99 из 10 098, что составляет менее 1% и очень, очень намного ниже первоначальной оценки в 99%.

Ошибка базовой ставки в этом примере настолько вводит в заблуждение, потому что нетеррористов гораздо больше, чем террористов, а количество ложноположительных результатов (нетеррористов сканируется как террористы) намного больше, чем истинных положительных результатов (террористов сканируют как террористов).

Многие специалисты-практики утверждают, что, поскольку базовый уровень терроризма чрезвычайно низок, использование интеллектуального анализа данных и алгоритмов прогнозирования для выявления террористов не может работать из-за парадокса ложноположительного результата. [9] [10] [11] [12] Оценки количества ложноположительных результатов для каждого точного результата варьируются от более десяти тысяч [12] до одного миллиарда; [10] Следовательно, расследование каждой версии было бы непомерно затратным по затратам и времени. [9] [11] Уровень точности, необходимый для того, чтобы сделать эти модели жизнеспособными, вероятно, недостижим. Прежде всего, низкий базовый уровень терроризма также означает отсутствие данных для создания точного алгоритма. [11] Кроме того, в контексте выявления терроризма ложноотрицательные результаты крайне нежелательны и поэтому должны быть сведены к минимуму, насколько это возможно; однако это требует повышения чувствительности за счет специфичности , что приводит к увеличению количества ложноположительных результатов. [12] Также сомнительно, что использование таких моделей правоохранительными органами позволит выполнить необходимое бремя доказывания , учитывая, что более 99% результатов будут ложноположительными. [12]

Пример 4: биологическое тестирование подозреваемого

Совершено преступление. Судебно-медицинская экспертиза установила, что у преступника определенная группа крови, которую разделяют 10% населения. Подозреваемый арестован, и у него та же группа крови.

Прокурор может предъявить подозреваемому обвинение в совершении преступления только на этом основании и заявить на суде, что вероятность того, что обвиняемый виновен, составляет 90%.

Однако этот вывод будет близок к правильному только в том случае, если обвиняемый был выбран в качестве главного подозреваемого на основании убедительных доказательств, обнаруженных до анализа крови и не связанных с ним. В противном случае представленное рассуждение ошибочно, поскольку оно упускает из виду высокую априорную вероятность (то есть до анализа крови) того, что он является случайным невиновным человеком. Предположим, например, что в городе, где произошло преступление, проживает 1000 человек. Это означает, что там живут 100 человек, имеющих группу крови преступника, из которых только один является истинным преступником; следовательно, истинная вероятность того, что обвиняемый виновен – основываясь только на том факте, что его группа крови совпадает с группой крови убийцы – составляет всего 1%, что намного меньше 90%, как утверждает прокурор.

Ошибка прокурора заключается в предположении, что априорная вероятность случайного совпадения равна вероятности невиновности обвиняемого. Используя его, прокурор, допрашивающий свидетеля-эксперта, может спросить: «Шансы найти эти доказательства у невиновного человека настолько малы, что присяжные могут спокойно игнорировать возможность того, что этот обвиняемый невиновен, верно?» [13] В заявлении предполагается, что вероятность того, что улики будут найдены у невиновного человека, такая же, как и вероятность того, что человек невиновен, учитывая, что у него были найдены улики, что неверно. В то время как первое обычно невелико (10% в предыдущем примере) из-за хороших процедур судебно-медицинской экспертизы , второе (99% в этом примере) не имеет к нему прямого отношения и часто будет намного выше, поскольку, по сути, оно зависит от на вероятных довольно высоких априорных шансах на то, что обвиняемый окажется случайным невиновным человеком.

Примеры в законе

Суд над О Джей Симпсоном

О. Дж. Симпсона судили и оправдали в 1995 году за убийства его бывшей жены Николь Браун Симпсон и ее друга Рональда Голдмана.

Кровь на месте преступления соответствовала крови Симпсона по характеристикам, присущим 1 из 400 человек. Однако защита утверждала, что количество людей из Лос-Анджелеса, соответствующих выборке, могло бы заполнить футбольный стадион и что цифра 1 на 400 бесполезна. [14] [15] Было бы неправильно и было бы примером ошибки прокурора полагаться исключительно на цифру «1 из 400» для вывода о том, что конкретное лицо, соответствующее выборке, вероятно, будет виновником.

Дерево частот 100 000 избитых американок, показывающее ошибку прокурора в судебном процессе по делу об убийстве О. Дж. Симпсона

На том же судебном процессе обвинение представило доказательства того, что Симпсон применял насилие по отношению к своей жене. Защита утверждала, что на каждые 2500 женщин, подвергшихся супружескому насилию, была убита только одна женщина, и что любая история жестокого обращения Симпсона по отношению к своей жене не имеет значения для суда. Однако обоснование расчетов защиты было ошибочным. По мнению автора Герда Гигеренцера , правильная вероятность требует дополнительного контекста: жена Симпсона не только подверглась домашнему насилию, но, скорее, подверглась домашнему насилию (со стороны Симпсона) и была убита (кем-то). Гигеренцер пишет: «Шансы на то, что насильник действительно убил свою партнершу, учитывая, что она была убита, составляют примерно 8 из 9, или примерно 90%». [16] Хотя большинство случаев супружеского насилия не заканчиваются убийством, большинство случаев убийств, в которых имеется история супружеского насилия, были совершены супругом.

Дело Салли Кларк

Салли Кларк , британку, в 1998 году обвинили в убийстве своего первого ребенка в возрасте 11 недель, а затем второго ребенка в возрасте 8 недель. Обвинение привлекло свидетеля-эксперта сэра Роя Медоу , профессора и педиатра-консультанта, [17] засвидетельствовавшего, что вероятность смерти двух детей в одной семье от СВДС составляет примерно 1 на 73 миллиона. Это было гораздо реже, чем фактический показатель, измеренный в исторических данных  – Медоу оценил его на основе данных о смертности от одиночной СВДС и предположения, что вероятность таких смертей не должна быть коррелированной между младенцами. [18]

Медоу признал, что 1 из 73 миллионов не является чем-то невозможным, но утверждал, что такие несчастные случаи будут происходить «раз в сто лет» и что в стране с 15 миллионами семей с двумя детьми гораздо более вероятно, что двойное смерти вызваны синдромом Мюнхгаузена, а не столь редким несчастным случаем. Однако есть веские основания предполагать, что вероятность смерти от СВДС в семье значительно выше, если предыдущий ребенок уже умер при таких обстоятельствах (генетическая предрасположенность к СВДС, вероятно, сведет на нет эту предполагаемую статистическую независимость [19] ) делает некоторые семьи более восприимчивыми к СВДС, а ошибка является результатом экологического заблуждения . [20] Вероятность двух смертей от СВДС в одной семье не может быть достоверно оценена путем возведения в квадрат вероятности одной такой смерти во всех других схожих семьях. [21]

Цифра 1 на 73 миллиона сильно недооценивает вероятность двух несчастных случаев подряд, но даже если бы эта оценка была точной, суд, похоже, упустил тот факт, что цифра 1 на 73 миллиона сама по себе ничего не значила. Как априорную вероятность ее следует сопоставить с априорными вероятностями альтернатив. Учитывая, что произошли две смерти, одно из следующих объяснений должно быть верным, и все они априори крайне маловероятны:

  1. Две последовательные смерти в одной семье, обе в результате СВДС
  2. Двойное убийство (версия обвинения)
  3. Другие возможности (включая одно убийство и один случай СВДС)

Неясно, предлагалась ли когда-либо оценка вероятности второй возможности в ходе судебного разбирательства, или же сравнение первых двух вероятностей считалось ключевой оценкой, которую необходимо было сделать в статистическом анализе, сравнивающем версию обвинения с версией обвинения. невиновность.

Кларк был осужден в 1999 году, в результате чего Королевское статистическое общество опубликовало пресс-релиз, в котором указали на ошибки. [22]

В 2002 году Рэй Хилл (профессор математики из Солфорда ) попытался точно сравнить шансы этих двух возможных объяснений; он пришел к выводу, что вероятность последовательных несчастных случаев в 4,5–9 раз выше, чем последовательных убийств, так что априорные шансы виновности Кларка составляли от 4,5 до 1 и 9 к 1 против. [23]

После того, как суд установил, что судебно-медицинский патологоанатом, осматривавший обоих младенцев, скрыл оправдательные доказательства , 29 января 2003 года суд более высокой инстанции отменил приговор Кларку .

Результаты в психологии

В ходе экспериментов было обнаружено, что люди предпочитают индивидуальную информацию общей информации, когда первая доступна. [25] [26] [27]

В некоторых экспериментах студентов просили оценить средние баллы (GPA) гипотетических студентов. Получив соответствующую статистику о распределении среднего балла, учащиеся, как правило, игнорировали ее, если ей давали описательную информацию о конкретном учащемся, даже если новая описательная информация, очевидно, имела мало или вообще не имела отношения к школьной успеваемости. [26] Этот вывод использовался, чтобы доказать, что собеседования являются ненужной частью процесса поступления в колледж , поскольку интервьюеры не могут выбрать успешных кандидатов лучше, чем базовая статистика.

Психологи Дэниел Канеман и Амос Тверски попытались объяснить это открытие с помощью простого правила или «эвристики», называемого репрезентативностью . Они утверждали, что многие суждения, касающиеся вероятности или причины и следствия, основаны на том, насколько одна вещь репрезентативна для другой или категории. [26] Канеман считает, что игнорирование базовой ставки является особой формой игнорирования расширения . [28] Ричард Нисбетт утверждал, что некоторые атрибутивные предубеждения , такие как фундаментальная ошибка атрибуции, являются примерами ошибки базовой ставки: люди не используют «консенсусную информацию» («базовую ставку») о том, как другие вели себя в аналогичных ситуациях, и вместо этого предпочитают более простые диспозиционные атрибуции . [29]

В психологии ведутся серьезные споры об условиях, при которых люди ценят или не ценят базовую информацию. [30] [31] Исследователи программы эвристики и предвзятости подчеркнули эмпирические результаты, показывающие, что люди склонны игнорировать базовые ставки и делать выводы, которые нарушают определенные нормы вероятностного рассуждения, такие как теорема Байеса . Вывод, сделанный в результате этого направления исследований, заключался в том, что человеческое вероятностное мышление фундаментально ошибочно и подвержено ошибкам. [32] Другие исследователи подчеркивали связь между когнитивными процессами и информационными форматами, утверждая, что такие выводы в целом необоснованны. [33] [34]

Рассмотрим еще раз пример 2 сверху. Требуемый вывод состоит в том, чтобы оценить (апостериорную) вероятность того, что (случайно выбранный) водитель пьян, при условии, что тест на алкотестер положителен. Формально эту вероятность можно вычислить с помощью теоремы Байеса, как показано выше. Однако существуют разные способы представления соответствующей информации. Рассмотрим следующий формально эквивалентный вариант задачи:

 1 из 1000 водителей водит машину в нетрезвом виде. Алкотестеры всегда распознают действительно пьяного человека. У 50 из 999 водителей, которые не пьяны, алкотестер ложно показывает состояние опьянения. Предположим, что полицейские случайно останавливают водителя и заставляют его пройти тест на алкотестер. Это указывает на то, что они пьяны. Никакой другой информации о них не известно. Оцените вероятность того, что водитель действительно пьян.

В этом случае соответствующая числовая информация — p (пьяный), p ( D | пьяный), p ( D | трезвый) — представлена ​​в терминах собственных частот относительно определенного эталонного класса (см. задачу эталонного класса ). Эмпирические исследования показывают, что выводы людей более точно соответствуют правилу Байеса, когда информация представлена ​​таким образом, что помогает преодолеть базовую пренебрежение со стороны непрофессионалов [34] и экспертов. [35] Как следствие, такие организации, как Кокрановское сотрудничество, рекомендуют использовать этот формат для передачи статистики здравоохранения. [36] Научить людей переводить такого рода байесовские задачи рассуждения в форматы собственных частот более эффективно, чем просто учить их подставлять вероятности (или проценты) в теорему Байеса. [37] Также было показано, что графическое представление собственных частот (например, массивы значков, графики гипотетических результатов) помогают людям делать более точные выводы. [37] [38] [39] [40]

Одна из важных причин, почему форматы собственных частот полезны, заключается в том, что этот информационный формат облегчает необходимые выводы, поскольку упрощает необходимые вычисления. В этом можно убедиться при использовании альтернативного способа вычисления требуемой вероятности p (пьяный| D ):

где N (drunk ∩ D ) обозначает количество водителей, находящихся в нетрезвом состоянии и получивших положительный результат алкотестера, а N ( D ) обозначает общее количество случаев с положительным результатом алкотестера. Эквивалентность этого уравнения приведенному выше следует из аксиом теории вероятностей, согласно которым N (пьяный ∩ D ) = N × p ( D | пьяный) × p (пьяный). Важно отметить, что хотя это уравнение формально эквивалентно правилу Байеса, оно не эквивалентно психологически. Использование собственных частот упрощает вывод, поскольку требуемую математическую операцию можно выполнить над натуральными числами вместо нормализованных дробей (т. е. вероятностей), поскольку это делает большое количество ложных срабатываний более прозрачным, а также потому, что собственные частоты представляют собой «вложенный набор» состав". [41] [42]

Не каждый частотный формат облегчает байесовские рассуждения. [42] [43] Собственные частоты относятся к информации о частоте, полученной в результате естественной выборки , [44] которая сохраняет информацию о базовой ставке (например, количество пьяных водителей при взятии случайной выборки водителей). Это отличается от систематической выборки , при которой базовые ставки фиксируются априори (например, в научных экспериментах). В последнем случае невозможно вывести апостериорную вероятность p (пьяный | положительный результат теста) путем сравнения количества водителей, которые находятся в нетрезвом состоянии и имеют положительный результат теста, по сравнению с общим числом людей, которые получили положительный результат алкотестера, поскольку информация о базовой ставке не сохраняется и должен быть явно повторно введен с помощью теоремы Байеса.

Смотрите также

Рекомендации

  1. ^ «Случаи, госпитализации и смерти от COVID-19 в зависимости от статуса вакцинации» (PDF) . Департамент здравоохранения штата Вашингтон. 18 января 2023 г. Архивировано (PDF) из оригинала 26 января 2023 г. Проверено 14 февраля 2023 г. Если подверженность Covid-19 останется прежней, то по мере того, как все больше людей будет вакцинировано, больше случаев, госпитализаций и смертей будет наблюдаться у вакцинированных людей, поскольку они будут продолжать составлять все большую и большую часть населения. Например, если бы 100% населения было вакцинировано, 100% случаев были бы среди привитых людей.
  2. ^ Валлийский, Мэтью Б.; Наварро, Дэниел Дж. (2012). «Увидеть значит поверить: приоритеты, доверие и пренебрежение базовой ставкой». Организационное поведение и процессы принятия человеческих решений . 119 (1): 1–14. дои : 10.1016/j.obhdp.2012.04.001. hdl : 2440/41190 . ISSN  0749-5978.
  3. ^ «Логическая ошибка: ошибка базовой ставки» . Fallacyfiles.org . Проверено 15 июня 2013 г.
  4. ^ Томпсон, WC; Шуман, Э.Л. (1987). «Интерпретация статистических доказательств в уголовных процессах: ошибка прокурора и ошибка адвоката». Закон и поведение человека . 2 (3): 167. дои : 10.1007/BF01044641. JSTOR  1393631. S2CID  147472915.
  5. ^ Фонтан, Джон; Ганби, Филип (февраль 2010 г.). «Неоднозначность, иллюзия уверенности и подход Гигеренцера на основе естественной частоты к рассуждениям с обратными вероятностями» (PDF) . Университет Кентербери . п. 6.[ постоянная мертвая ссылка ]
  6. Сасс, Ричард А. (4 октября 2023 г.). «Заблуждение прокурора, оформленное как образец подмены пространства». Препринты OSF . doi : 10.31219/osf.io/cs248.
  7. ^ Райнфурт, Миннесота; Хауэлл, LW (март 1998 г.). Вероятность и статистика в аэрокосмической технике. НАСА . п. 16. СООБЩЕНИЕ: Ложноположительные тесты более вероятны, чем истинно положительные тесты, когда в общей популяции распространенность заболевания низкая. Это называется ложноположительным парадоксом.
  8. ^ аб Вашер, HL (май 2003 г.). «Количественная грамотность - тестирование на наркотики, скрининг рака и идентификация магматических пород». Журнал Geoscience Education : 2. На первый взгляд это кажется извращенным: чем меньше студенты в целом употребляют стероиды , тем больше вероятность того, что студент, идентифицированный как пользователь, окажется непотребителем. Это явление получило название «ложноположительный парадокс».- Цитирование: Гоник Л.; Смит, В. (1993). Мультяшный справочник по статистике . Нью-Йорк: Харпер Коллинз. п. 49.
  9. ^ Аб Мунк, Тимме Бисгаард (1 сентября 2017 г.). «100 000 ложных срабатываний на каждого настоящего террориста: почему антитеррористические алгоритмы не работают». Первый понедельник . 22 (9). дои : 10.5210/fm.v22i9.7126 .
  10. ^ Аб Шнайер, Брюс . «Почему интеллектуальный анализ данных не остановит террор». Проводной . ISSN  1059-1028 . Проверено 30 августа 2022 г.
  11. ^ abc Джонас, Джефф; Харпер, Джим (11 декабря 2006 г.). «Эффективная борьба с терроризмом и ограниченная роль прогнозного анализа данных». Институт КАТО . Проверено 30 августа 2022 г.
  12. ^ abcd Сейджман, Марк (17 февраля 2021 г.). «Последствия чрезвычайно низкой базовой ставки терроризма». Терроризм и политическое насилие . 33 (2): 302–311. дои : 10.1080/09546553.2021.1880226. ISSN  0954-6553. S2CID  232341781.
  13. ^ Фентон, Норман; Нил, Мартин; Бергер, Дэниел (июнь 2016 г.). «Бейс и закон». Ежегодный обзор статистики и ее применения . 3 (1): 51–77. Бибкод : 2016AnRSA...3...51F. doi : 10.1146/annurev-statistics-041715-033428. ПМЦ 4934658 . ПМИД  27398389. 
  14. ^ Робертсон, Б., и Виньо, Джорджия (1995). Интерпретация доказательств: оценка судебно-медицинских доказательств в зале суда. Чичестер: Джон Уайли и сыновья.
  15. ^ Россмо, Д. Ким (2009). Неудачи в расследовании уголовных дел. CRC Press Тейлор и Фрэнсис Груп.
  16. ^ Гигеренцер, Г., Расплата с риском: учимся жить в условиях неопределенности, Penguin, (2003).
  17. ^ «Резолюция, принятая Сенатом (21 октября 1998 г.) об отставке профессора сэра Роя Медоу». Репортер . № 428. Университет Лидса . 30 ноября 1998 г. Архивировано из оригинала 16 апреля 2016 г. Проверено 17 октября 2015 г.
  18. ^ Вероятность летального исхода от СВДС среди населения составляла примерно 1 из 1303; Медоу получил оценку «1 из 73 миллионов», исходя из меньшей вероятности смерти от СВДС в семье Кларков, в которой были более низкие факторы риска (например, некурение). В этой подгруппе населения он оценил вероятность одной смерти в 1 на 8500. См.: Джойс, Х. (сентябрь 2002 г.). «Вне разумного сомнения» (pdf) . plus.maths.org . Проверено 12 июня 2010 г.. Профессор Рэй Хилл поставил под сомнение даже этот первый шаг (1/8500 против 1/1300) двояко: во-первых, на том основании, что он был предвзятым , исключая те факторы, которые увеличивали риск (особенно то, что оба ребенка были мальчиками) и (что более важно) потому что снижение факторов риска СВДС пропорционально уменьшит факторы риска убийств, так что относительная частота синдрома Мюнхгаузена по доверенности и СВДС останется в том же соотношении, что и среди населения в целом: Hill, Ray (2002). «Детская смерть или убийство? - Взвешивание вероятностей». Совершенно несправедливо использовать характеристики, которые, по сути, делают ее хорошей, чистоплотной матерью, как факторы, которые играют против нее. Да, мы можем согласиться с тем, что такие факторы делают естественную смерть менее вероятной, но те же самые характеристики также делают менее вероятным убийство.
  19. ^ Суини, Джон; Ло, Билл (15 июля 2001 г.). «Находка гена ставит под сомнение двойные убийства, связанные с «детской смертью»». Наблюдатель . Архивировано из оригинала 11 июля 2012 г.
  20. ^ Винсент Шерер. «Осужден по статистике?» . Проверено 21 мая 2010 г.
  21. ^ Хилл, Р. (2004). «Множественные внезапные детские смерти – совпадение или не совпадение?» (PDF) . Детская и перинатальная эпидемиология . 18 (5): 321. doi :10.1111/j.1365-3016.2004.00560.x. PMID  15367318. Архивировано из оригинала (PDF) 30 августа 2012 г. Проверено 13 июня 2010 г.
  22. ^ «Королевское статистическое общество обеспокоено проблемами, поднятыми по делу Салли Кларк» (PDF) . 23 октября 2001 г. Архивировано из оригинала (PDF) 24 августа 2011 г. Общество не терпит, чтобы врачи совершали серьезные клинические ошибки, поскольку широко распространено понимание того, что такие ошибки могут означать разницу между жизнью и смертью. Дело Р. против Салли Кларк является одним из примеров того, как свидетель-медик-эксперт допустил серьезную статистическую ошибку, которая могла оказать глубокое влияние на исход дела.
  23. ^ Неопределенность в этом диапазоне в основном обусловлена ​​неуверенностью в вероятности убийства второго ребенка после убийства первого, см.: Hill, R. (2004). «Множественные внезапные детские смерти – совпадение или не совпадение?» (PDF) . Детская и перинатальная эпидемиология . 18 (5): 322–323. дои : 10.1111/j.1365-3016.2004.00560.x. PMID  15367318. Архивировано из оригинала (PDF) 30 августа 2012 г. Проверено 13 июня 2010 г.
  24. ^ «Р против Кларка. [2003] EWCA Crim 1020 (11 апреля 2003 г.)» . www.bailii.org .
  25. ^ Бар-Хилель, Майя (1980). «Ошибка базовой ставки в вероятностных суждениях» (PDF) . Акта Психологика . 44 (3): 211–233. дои : 10.1016/0001-6918(80)90046-3.
  26. ^ abc Канеман, Дэниел; Амос Тверски (1973). «О психологии прогнозирования». Психологический обзор . 80 (4): 237–251. дои : 10.1037/h0034747. S2CID  17786757.
  27. ^ Тверски, Амос; Канеман, Дэниел (27 сентября 1974 г.). «Суждение в условиях неопределенности: эвристика и предвзятость». Наука . 185 (4157): 1124–1131. Бибкод : 1974Sci...185.1124T. дои : 10.1126/science.185.4157.1124. PMID  17835457. S2CID  143452957.
  28. ^ Канеман, Дэниел (2000). «Оценка по моментам, прошлому и будущему». В Дэниеле Канемане и Амосе Тверски (ред.). Выбор, ценности и рамки . ISBN 0-521-62749-4.
  29. ^ Нисбетт, Ричард Э.; Э. Борджида; Р. Крэндалл; Х. Рид (1976). «Популярная индукция: информация не всегда информативна». В Дж. С. Кэрролле и Дж. У. Пейне (ред.). Познание и социальное поведение . Том. 2. Джон Уайли и сыновья, Инкорпорейтед. стр. 227–236. ISBN 0-470-99007-4.
  30. ^ Келер, Джей-Джей (2010). «Переосмысление ошибки базовой ставки: описательные, нормативные и методологические проблемы». Поведенческие и мозговые науки . 19 : 1–17. дои : 10.1017/S0140525X00041157. S2CID  53343238.
  31. ^ Барби, АК; Сломан, С.А. (2007). «Базовое уважение: от экологической рациональности к двойным процессам». Поведенческие и мозговые науки . 30 (3): 241–254, обсуждение 255–297. дои : 10.1017/S0140525X07001653. PMID  17963533. S2CID  31741077.
  32. ^ Тверски, А.; Канеман, Д. (1974). «Суждение в условиях неопределенности: эвристика и предубеждения». Наука . 185 (4157): 1124–1131. Бибкод : 1974Sci...185.1124T. дои : 10.1126/science.185.4157.1124. PMID  17835457. S2CID  143452957.
  33. ^ Космидес, Леда; Джон Туби (1996). «Являются ли люди хорошими интуитивными статистиками? Переосмысление некоторых выводов литературы о суждениях в условиях неопределенности». Познание . 58 : 1–73. CiteSeerX 10.1.1.131.8290 . дои : 10.1016/0010-0277(95)00664-8. S2CID  18631755. 
  34. ^ аб Гигеренцер, Г.; Хоффраж, У. (1995). «Как улучшить байесовские рассуждения без инструкций: частотные форматы». Психологический обзор . 102 (4): 684. CiteSeerX 10.1.1.128.3201 . дои : 10.1037/0033-295X.102.4.684. S2CID  16281385. 
  35. ^ Хоффраж, У.; Линдси, С.; Хертвиг, Р.; Гигеренцер, Г. (2000). «Медицина: передача статистической информации». Наука . 290 (5500): 2261–2262. дои : 10.1126/science.290.5500.2261. hdl : 11858/00-001M-0000-0025-9B18-3 . PMID  11188724. S2CID  33050943.
  36. ^ Акл, Э.А.; Оксман, AD; Херрин, Дж.; Вист, GE; Терренато, И.; Сперати, Ф.; Костюнюк, К.; Бланк, Д.; Шунеманн, Х. (2011). Шунеманн, Хольгер (ред.). «Использование альтернативных статистических форматов для представления рисков и их снижения». Кокрановская база данных систематических обзоров . 2011 (3): CD006776. дои : 10.1002/14651858.CD006776.pub2. ПМК 6464912 . ПМИД  21412897. 
  37. ^ аб Седлмайер, П.; Гигеренцер, Г. (2001). «Обучение байесовскому рассуждению менее чем за два часа». Журнал экспериментальной психологии: Общие сведения . 130 (3): 380–400. дои : 10.1037/0096-3445.130.3.380. hdl : 11858/00-001M-0000-0025-9504-E . PMID  11561916. S2CID  11147078.
  38. ^ Брейс, Г.Л. (2009). «Изобразительные изображения в статистических рассуждениях». Прикладная когнитивная психология . 23 (3): 369–381. дои : 10.1002/acp.1460. S2CID  18817707.
  39. ^ Эдвардс, А.; Элвин, Г.; Малли, А. (2002). «Объяснение рисков: превращение числовых данных в значимые изображения». БМЖ . 324 (7341): 827–830. дои : 10.1136/bmj.324.7341.827. ПМЦ 1122766 . ПМИД  11934777. 
  40. ^ Ким, Йа-Сыль; Уоллс, Логан А.; Крафт, Питер; Халлман, Джессика (2 мая 2019 г.). «Байесовский подход к познанию для улучшения визуализации данных». Материалы конференции CHI 2019 года по человеческому фактору в вычислительных системах . стр. 1–14. arXiv : 1901.02949 . дои : 10.1145/3290605.3300912. ISBN 9781450359702. S2CID  57761146.
  41. ^ Джиротто, В.; Гонсалес, М. (2001). «Решение вероятностных и статистических задач: вопрос структуры информации и формы вопросов». Познание . 78 (3): 247–276. дои : 10.1016/S0010-0277(00)00133-5. PMID  11124351. S2CID  8588451.
  42. ^ аб Хоффраж, Ю.; Гигеренцер, Г.; Краусс, С.; Мартинньон, Л. (2002). «Представление облегчает рассуждения: что такое собственные частоты, а что нет». Познание . 84 (3): 343–352. дои : 10.1016/S0010-0277(02)00050-1. PMID  12044739. S2CID  9595672.
  43. ^ Гигеренцер, Г.; Хоффраж, У. (1999). «Преодоление трудностей в байесовском рассуждении: ответ Льюису и Керен (1999) и Меллерсу и МакГроу (1999)». Психологический обзор . 106 (2): 425. дои : 10.1037/0033-295X.106.2.425. hdl : 11858/00-001M-0000-0025-9CB4-8 .
  44. ^ Кляйтер, Г.Д. (1994). «Естественная выборка: рациональность без базовых ставок». Вклад в математическую психологию, психометрику и методологию . Последние исследования в области психологии. стр. 375–388. дои : 10.1007/978-1-4612-4308-3_27. ISBN 978-0-387-94169-1.

Внешние ссылки