Индекс чувствительности

Индекс чувствительности или индекс различимости или индекс обнаруживаемости — это безразмерная статистика , используемая в теории обнаружения сигналов . Более высокий индекс указывает на то, что сигнал легче обнаружить.

Определение

Индекс различимости — это разделение средних значений двух распределений (обычно распределения сигнала и шума) в единицах стандартного отклонения.

Равные дисперсии/ковариации

Для двух одномерных распределений с одинаковым стандартным отклонением оно обозначается («ди-простое»): $а$ $б$ $d'$

d'={\frac {\left\vert \mu _{a}-\mu _{b}\right\vert }{\sigma }}

В более высоких измерениях, то есть с двумя многомерными распределениями с одинаковой дисперсионно-ковариационной матрицей (чей симметричный квадратный корень, матрица стандартного отклонения, равен ), это обобщается на расстояние Махаланобиса между двумя распределениями: $\mathbf {\Sigma}$ $\mathbf {S}$

d'={\sqrt {({\boldsymbol {\mu }}_{a}-{\boldsymbol {\mu }}_{b})'\mathbf {\Sigma } ^{-1}( {\boldsymbol {\mu }}_{a}-{\boldsymbol {\mu }}_{b})}}=\lVert \mathbf {S} ^{-1}({\boldsymbol {\mu }} _{a}-{\boldsymbol {\mu }}_{b})\rVert =\lVert {\boldsymbol {\mu }}_{a}-{\boldsymbol {\mu }}_{b}\rVert /\sigma _{\boldsymbol {\mu }}

где - 1d срез sd вдоль единичного вектора через средства, т.е. равен вдоль 1d среза через средства. ^[1] $\sigma _ {\boldsymbol {\mu }}=1/\lVert \mathbf {S} ^{-1}{\boldsymbol {\mu }}\rVert$ ${\boldsymbol {\mu }}$ $d'$ $d'$

Для двух двумерных распределений с одинаковой ковариацией дисперсии это определяется как:

{d'}^{2}={\frac {1}{1-\rho ^{2}}}\left({d'}_{x}^{2}+{d'}_{y}^{2}-2\rho {d'}_{x}{d'}_{y}\right)

где – коэффициент корреляции, а здесь и , т.е. включая знаки средних разностей вместо абсолютных. ^[1] $\rho$ $d'_{x}={\frac {{\mu _{b}}_{x}-{\mu _{a}}_{x}}{\sigma _{x}}}$ $d'_{y}={\frac {{\mu _{b}}_{y}-{\mu _{a}}_{y}}{\sigma _{y}}}$

$d'$ также оценивается как . ^[2]^{: 8} $Z({\text{hit rate}})-Z({\text{false alarm rate}})$

Неравные дисперсии/ковариации

Когда два распределения имеют разные стандартные отклонения (или, в общих измерениях, разные ковариационные матрицы), существует несколько конкурирующих индексов, каждый из которых сводится к равной дисперсии/ковариации. $d'$

Байесовский индекс различимости

Это максимальный (байесовский) показатель различимости двух распределений, основанный на величине их перекрытия, т.е. оптимальной (байесовской) ошибки классификации идеальным наблюдателем или ее дополнением, оптимальной точностью : $e_{b}$ $a_{b}$

d'_{b}=-2Z\left({\text{Bayes error rate }}e_{b}\right)=2Z\left({\text{best accuracy rate }}a_{b}\right)

, ^[1]

где – обратная кумулятивная функция распределения стандартного нормального. Байесовская различимость между одномерными и многомерными нормальными распределениями может быть рассчитана численно ^[1] (код Matlab), а также может использоваться в качестве приближения, когда распределения близки к нормальным. $Z$

$d'_{b}$ является положительно определенной статистической мерой расстояния, которая свободна от предположений о распределениях, таких как расхождение Кульбака-Лейблера . является асимметричным, тогда как симметричным для двух распределений. Однако не удовлетворяет неравенству треугольника, поэтому не является полной метрикой. ^[1] $D_{\text{KL}}$ $D_{\text{KL}}(a,b)$ $d'_{b}(a,b)$ $d'_{b}$

В частности, для задачи «да/нет» между двумя одномерными нормальными распределениями со средними значениями и дисперсиями оптимальная по Байесу точность классификации составляет: ^[1] $\mu _{a},\mu _{b}$ $v_{a}>v_{b}$

p(A|a)=p({\chi '}_{1,v_{a}\lambda }^{2}>v_{b}c),\;\;p(B|b)=p({\chi '}_{1,v_{b}\lambda }^{2}<v_{a}c)

где обозначает нецентральное распределение хи-квадрат , и . Байесовская различимость $\chi '^{2}$ $\lambda =\left({\frac {\mu _{a}-\mu _{b}}{v_{a}-v_{b}}}\right)^{2}$ $c=\lambda +{\frac {\ln v_{a}-\ln v_{b}}{v_{a}-v_{b}}}$ $d'_{b}=2Z\left({\frac {p\left(A|a\right)+p\left(B|b\right)}{2}}\right).$

$d'_{b}$ также может быть вычислено по кривой ROC задачи «да/нет» между двумя одномерными нормальными распределениями с одним критерием сдвига. Его также можно вычислить по кривой ROC любых двух распределений (с любым количеством переменных) со сдвигом отношения правдоподобия, определив точку на кривой ROC, которая находится дальше всего от диагонали. ^[1]

Для двухинтервальной задачи между этими распределениями оптимальная точность равна ( обозначает обобщенное распределение хи-квадрат ), где . ^[1] Байесовская различимость . $a_{b}=p\left({\tilde {\chi }}_{{\boldsymbol {w}},{\boldsymbol {k}},{\boldsymbol {\lambda }},0,0}^{2}>0\right)$ ${\tilde {\chi }}^{2}$ ${\boldsymbol {w}}={\begin{bmatrix}\sigma _{s}^{2}&-\sigma _{n}^{2}\end{bmatrix}},\;{\boldsymbol {k}}={\begin{bmatrix}1&1\end{bmatrix}},\;{\boldsymbol {\lambda }}={\frac {\mu _{s}-\mu _{n}}{\sigma _{s}^{2}-\sigma _{n}^{2}}}{\begin{bmatrix}\sigma _{s}^{2}&\sigma _{n}^{2}\end{bmatrix}}$ $d'_{b}=2Z\left(a_{b}\right)$

Индекс различимости RMS sd

Общий приблизительный (т.е. неоптимальный) индекс различимости, имеющий замкнутую форму, состоит в том, чтобы брать среднее значение дисперсий, т.е. среднеквадратичное значение двух стандартных отклонений: ^[3] (также обозначается ). Это раз превышает -оценку площади под кривой рабочей характеристики приемника (AUC) однокритериального наблюдателя. Этот индекс расширяется до общих размеров как расстояние Махаланобиса с использованием объединенной ковариации, т.е. в качестве общей sd-матрицы. ^[1] $d'_{a}=\left\vert \mu _{a}-\mu _{b}\right\vert /\sigma _{\text{rms}}$ $d_{a}$ ${\sqrt {2}}$ $z$ $\mathbf {S} _{\text{rms}}=\left[\left(\mathbf {\Sigma } _{a}+\mathbf {\Sigma } _{b}\right)/2\right]^{\frac {1}{2}}$

Средний стандартный индекс различимости

Другой индекс — , расширенный до общих размеров, используя в качестве общей sd-матрицы. ^[1] $d'_{e}=\left\vert \mu _{a}-\mu _{b}\right\vert /\sigma _{\text{avg}}$ $\mathbf {S} _{\text{avg}}=\left(\mathbf {S} _{a}+\mathbf {S} _{b}\right)/2$

Сравнение индексов

Было показано, что для двух одномерных нормальных распределений , и для многомерных нормальных распределений по-прежнему. ^[1] $d'_{a}\leq d'_{e}\leq d'_{b}$ $d'_{a}\leq d'_{e}$

Таким образом, и недооценивают максимальную различимость одномерных нормальных распределений. может занижать максимум примерно на 30%. На пределе высокой различимости одномерных нормальных распределений сходится к . Эти результаты часто справедливы и для более высоких измерений, но не всегда. ^[1] Симпсон и Фиттер ^[3] позиционировались как лучший показатель, особенно для задач с двумя интервалами, но Дас и Гейслер ^[1] показали, что это оптимальная различимость во всех случаях и часто является лучшим приближением в замкнутой форме, чем , даже для двухинтервальных задач. $d'_{a}$ $d'_{e}$ $d'_{b}$ $d'_{a}$ $d'_{b}$ $d'_{e}$ $d'_{b}$ $d'_{a}$ $d'_{b}$ $d'_{e}$ $d'_{a}$

Приблизительный индекс , в котором используется среднее геометрическое стандартное отклонение, меньше, чем при малой различимости, но больше при большой различимости. ^[1] $d'_{gm}$ $d'_{b}$

Вклад в различимость по каждому измерению

В общем, вклад в общую различимость каждого измерения или признака можно измерить, используя величину, на которую снижается различимость при удалении этого измерения. Если общая байесовская различимость равна , а байесовская различимость с удаленной размерностью равна , мы можем определить вклад размерности как . Это то же самое, что и индивидуальная различимость измерения, когда ковариационные матрицы равны и диагональны, но в остальных случаях эта мера более точно отражает вклад измерения, чем его индивидуальная различимость. ^[1] $d'$ $i$ $d'_{-i}$ $i$ ${\sqrt {d'^{2}-{d'_{-i}}^{2}}}$ $i$

Смотрите также

Внешние ссылки

Интерактивное руководство по теории обнаружения сигналов, включая расчет d ′.