Индекс чувствительности

Индекс чувствительности или индекс дискриминируемости или индекс обнаруживаемости — это безразмерная статистика, используемая в теории обнаружения сигнала . Более высокий индекс указывает на то, что сигнал может быть легче обнаружен.

Определение

Индекс дискриминируемости — это разделение между средними значениями двух распределений (обычно сигнального и шумового) в единицах стандартного отклонения.

Равные дисперсии/ковариации

Для двух одномерных распределений с одинаковым стандартным отклонением это обозначается как («dee-prime»): $а$ $б$ $d'$

d'={\frac {\left\vert \mu _{a}-\mu _{b}\right\vert }{\sigma }}

В более высоких измерениях, т.е. с двумя многомерными распределениями с одинаковой матрицей дисперсии-ковариации (чьей симметричной квадратной корней, матрицей стандартного отклонения, является ), это обобщается до расстояния Махаланобиса между двумя распределениями: $\mathbf {\Сигма }$ $\mathbf {S}$

d'={\sqrt {({\boldsymbol {\mu }}_{a}-{\boldsymbol {\mu }}_{b})'\mathbf {\Sigma } ^{-1}({\boldsymbol {\mu }}_{a}-{\boldsymbol {\mu }}_{b})}}=\lVert \mathbf {S} ^{-1}({\boldsymbol {\mu }}_{a}-{\boldsymbol {\mu }}_{b})\rVert =\lVert {\boldsymbol {\mu }}_{a}-{\boldsymbol {\mu }}_{b}\rVert /\sigma _{\boldsymbol {\mu }}

где - это 1-мерный срез sd вдоль единичного вектора через средние значения, т.е. равняется 1-мерному срезу через средние значения. ^[1] $\sigma _{\boldsymbol {\mu }}=1/\lVert \mathbf {S} ^{-1}{\boldsymbol {\mu }}\rVert$ ${\boldsymbol {\mu }}$ $d'$ $d'$

Для двух двумерных распределений с одинаковой дисперсией-ковариацией это определяется по формуле:

{d'}^{2}={\frac {1}{1-\rho ^{2}}}\left({d'}_{x}^{2}+{d'}_{y}^{2}-2\rho {d'}_{x}{d'}_{y}\right)

где - коэффициент корреляции, а здесь и , т.е. включая знаки средних разностей вместо абсолютных. ^[1] $\ро$ $d'_{x}={\frac {{\mu _{b}}_{x}-{\mu _{a}}_{x}}{\sigma _{x}}}$ $d'_{y}={\frac {{\mu _{b}}_{y}-{\mu _{a}}_{y}}{\sigma _{y}}}$

$d'$ также оценивается как . ^[2]^{: 8} $Z({\text{коэффициент попадания}})-Z({\text{коэффициент ложной тревоги}})$

Неравные дисперсии/ковариации

Когда два распределения имеют разные стандартные отклонения (или, в общих чертах, разные ковариационные матрицы), существует несколько конкурирующих индексов, все из которых сводятся к для равной дисперсии/ковариации. $d'$

Индекс байесовского дискриминанта

Это максимальный (оптимальный по Байесу) индекс дискриминируемости для двух распределений, основанный на величине их перекрытия, т.е. оптимальная (байесовская) ошибка классификации идеальным наблюдателем, или ее дополнение — оптимальная точность : $e_{b}$ $a_{b}$

d'_{b}=-2Z\left({\text{Коэффициент байесовской ошибки}}e_{b}\right)=2Z\left({\text{Коэффициент наилучшей точности}}a_{b}\right)

, ^[1]

где — обратная кумулятивная функция распределения стандартного нормального. Байесовская дискриминантность между одномерными и многомерными нормальными распределениями может быть вычислена численно ^[1] (код Matlab), а также может использоваться в качестве приближения, когда распределения близки к нормальному. $Z$

$d'_{b}$ является положительно-определенной статистической мерой расстояния, которая свободна от предположений о распределениях, таких как расхождение Кульбака-Лейблера . является асимметричной, тогда как является симметричной для двух распределений. Однако не удовлетворяет неравенству треугольника, поэтому она не является полной метрикой. ^[1] $D_{\text{KL}}$ $D_{\text{KL}}(a,b)$ $d'_{b}(a,b)$ $d'_{b}$

В частности, для задачи «да/нет» между двумя одномерными нормальными распределениями со средними значениями и дисперсиями оптимальная по Байесу точность классификации составляет: ^[1] $\mu _{a},\mu _{b}$ $v_{a}>v_{b}$

p(A|a)=p({\chi '}_{1,v_{a}\lambda }^{2}>v_{b}c),\;\;p(B|b)=p({\chi '}_{1,v_{b}\lambda }^{2}<v_{a}c)

где обозначает нецентральное распределение хи-квадрат , и . Байесовская дискриминируемость $\чи '^{2}$ $\lambda =\left({\frac {\mu _{a}-\mu _{b}}{v_{a}-v_{b}}}\right)^{2}$ $c=\lambda +{\frac {\ln v_{a}-\ln v_{b}}{v_{a}-v_{b}}}$ $d'_{b}=2Z\left({\frac {p\left(A|a\right)+p\left(B|b\right)}{2}}\right).$

$d'_{b}$ также может быть вычислен из ROC-кривой задачи «да/нет» между двумя одномерными нормальными распределениями с одним сдвиговым критерием. Его также можно высчитать из ROC-кривой любых двух распределений (в любом количестве переменных) с сдвиговым отношением правдоподобия, найдя точку на ROC-кривой, которая находится дальше всего от диагонали. ^[1]

Для двухинтервальной задачи между этими распределениями оптимальная точность равна ( обозначает обобщенное распределение хи-квадрат ), где . ^[1] Байесовская дискриминируемость . $a_{b}=p\left({\tilde {\chi }}_{{\boldsymbol {w}},{\boldsymbol {k}},{\boldsymbol {\lambda }},0,0}^{2}>0\right)$ ${\tilde {\chi }}^{2}$ ${\boldsymbol {w}}={\begin{bmatrix}\sigma _{s}^{2}&-\sigma _{n}^{2}\end{bmatrix}},\;{\boldsymbol {k}}={\begin{bmatrix}1&1\end{bmatrix}},\;{\boldsymbol {\lambda }}={\frac {\mu _{s}-\mu _{n}}{\sigma _{s}^{2}-\sigma _{n}^{2}}}{\begin{bmatrix}\sigma _{s}^{2}&\sigma _{n}^{2}\end{bmatrix}}$ $d'_{b}=2Z\left(a_{b}\right)$

Индекс дискриминантности RMS sd

Обычный приблизительный (т.е. субоптимальный) индекс дискриминируемости, имеющий замкнутую форму, заключается в том, чтобы взять среднее значение дисперсий, т.е. среднеквадратичное отклонение двух стандартных отклонений: ^[3] (также обозначается как ). Он равен -баллу площади под кривой рабочей характеристики приемника (AUC) однокритериального наблюдателя. Этот индекс распространяется на общие измерения как расстояние Махаланобиса с использованием объединенной ковариации, т.е. с как общей матрицей sd. ^[1] $d'_{a}=\left\vert \mu _{a}-\mu _{b}\right\vert /\sigma _{\text{rms}}$ $d_{a}$ ${\sqrt {2}}$ $z$ $\mathbf {S} _{\text{rms}}=\left[\left(\mathbf {\Sigma } _{a}+\mathbf {\Sigma } _{b}\right)/2\right]^{\frac {1}{2}}$

Средний индекс дискриминантности sd

Другой индекс — это , расширенный до общих измерений с использованием в качестве общей матрицы sd. ^[1] $d'_{e}=\left\vert \mu _{a}-\mu _{b}\right\vert /\sigma _{\text{avg}}$ $\mathbf {S} _{\text{avg}}=\left(\mathbf {S} _{a}+\mathbf {S} _{b}\right)/2$

Сравнение индексов

Было показано, что для двух одномерных нормальных распределений, а для многомерных нормальных распределений, по-прежнему. ^[1] $d'_{a}\leq d'_{e}\leq d'_{b}$ $d'_{a}\leq d'_{e}$

Таким образом, и недооценивают максимальную дискриминируемость одномерных нормальных распределений. может недооценивать максимум примерно на 30%. На пределе высокой дискриминируемости для одномерных нормальных распределений сходится к . Эти результаты часто остаются верными в более высоких измерениях, но не всегда. ^[1] Симпсон и Фиттер ^[3] продвигали как лучший индекс, особенно для двухинтервальных задач, но Дас и Гейслер ^[1] показали, что является оптимальной дискриминируемостью во всех случаях и часто является лучшим замкнутым приближением, чем , даже для двухинтервальных задач. $d'_{a}$ $d'_{e}$ $d'_{b}$ $d'_{a}$ $d'_{b}$ $d'_{e}$ $d'_{b}$ $d'_{a}$ $d'_{b}$ $d'_{e}$ $d'_{a}$

Приблизительный индекс , который использует геометрическое среднее значение sd, меньше при малой дискриминируемости, но больше при большой дискриминируемости. ^[1] $d'_{gm}$ $d'_{b}$

Вклад в различимость по каждому измерению

В общем, вклад в общую дискриминируемость каждого измерения или признака может быть измерен с использованием величины, на которую дискриминируемость падает при удалении этого измерения. Если общая байесовская дискриминируемость равна , а байесовская дискриминируемость с удаленным измерением равна , мы можем определить вклад измерения как . Это то же самое, что и индивидуальная дискриминируемость измерения , когда ковариационные матрицы равны и диагональны, но в других случаях эта мера более точно отражает вклад измерения, чем его индивидуальная дискриминируемость. ^[1] $d'$ $i$ $d'_{-i}$ $i$ ${\sqrt {d'^{2}-{d'_{-i}}^{2}}}$ $i$

Масштабирование дискриминируемости двух распределений

Иногда мы можем захотеть масштабировать дискриминируемость двух распределений данных, перемещая их ближе или дальше друг от друга. Один из таких случаев — когда мы моделируем задачу обнаружения или классификации, и производительность модели превышает производительность субъекта или наблюдаемых данных. В этом случае мы можем переместить распределения переменных модели ближе друг к другу, чтобы они соответствовали наблюдаемой производительности, а также предсказать, какие конкретные точки данных должны начать перекрываться и быть неправильно классифицированными.

Есть несколько способов сделать это. Один из них — вычислить средний вектор и ковариационную матрицу двух распределений, а затем выполнить линейное преобразование для интерполяции среднего и матрицы sd (квадратный корень ковариационной матрицы) одного из распределений по отношению к другому. ^[1]

Другой способ заключается в вычислении переменных решения точек данных (логарифмическое отношение правдоподобия того, что точка принадлежит одному распределению по сравнению с другим) в рамках мультинормальной модели, а затем перемещение этих переменных решения ближе друг к другу или дальше друг от друга. ^[1]

Смотрите также

Ссылки

^ abcdefghijklmnopqrs Дас, Абхранил; Уилсон С. Гейслер (2020). «Методы интеграции мультинормалей и вычисления мер классификации». arXiv : 2012.14331 [stat.ML].
^ MacMillan, N.; Creelman, C. (2005). Теория обнаружения: Руководство пользователя. Lawrence Erlbaum Associates. ISBN 9781410611147.
^ ab Simpson, AJ; Fitter, MJ (1973). «Каков наилучший индекс обнаруживаемости?». Psychological Bulletin . 80 (6): 481–488. doi :10.1037/h0035203.

Викенс, Томас Д. (2001). Элементарная теория обнаружения сигнала. OUP USA. гл. 2, стр. 20. ISBN 0-19-509250-3.

Внешние ссылки

Интерактивное руководство по теории обнаружения сигналов, включая расчет d ′.