В области машинного обучения и, в частности, проблемы статистической классификации , матрица путаницы , также известная как матрица ошибок , [1] представляет собой особый макет таблицы , который позволяет визуализировать производительность алгоритма, обычно контролируемого обучения ; в обучении без учителя ее обычно называют матрицей соответствия .
Каждая строка матрицы представляет экземпляры реального класса, а каждый столбец представляет экземпляры прогнозируемого класса или наоборот — оба варианта встречаются в литературе. [2] Название происходит от того факта, что оно позволяет легко увидеть, не путает ли система два класса (т.е. обычно ошибочно маркирует один как другой).
Это особый вид таблицы сопряженности с двумя измерениями («фактическое» и «прогнозируемое») и идентичными наборами «классов» в обоих измерениях (каждая комбинация измерения и класса является переменной в таблице сопряженности).
Учитывая выборку из 12 человек, у 8 из которых был диагностирован рак, и у 4 человек, у которых нет рака, где люди с раком относятся к классу 1 (положительные), а лица, не являющиеся раковыми, относятся к классу 0 (отрицательные), мы можем показать, что данные следующим образом:
Предположим, что у нас есть классификатор, который каким-то образом различает людей с раком и без него. Мы можем взять 12 человек и пропустить их через классификатор. Затем классификатор делает 9 точных прогнозов и пропускает 3: 2 человека с раком, ошибочно предсказанные как свободные от рака (выборка 1 и 2), и 1 человек без рака, у которого ошибочно предсказано наличие рака (выборка 9).
Обратите внимание: если мы сравним фактический набор классификаций с прогнозируемым набором классификаций, есть 4 разных результата, которые могут привести к любому конкретному столбцу. Во-первых, если фактическая классификация положительна, а прогнозируемая классификация положительна (1,1), это называется истинно положительным результатом, поскольку положительный образец был правильно идентифицирован классификатором. Во-вторых, если фактическая классификация положительна, а прогнозируемая классификация отрицательна (1,0), это называется ложноотрицательным результатом, поскольку классификатор неправильно идентифицирует положительный образец как отрицательный. В-третьих, если фактическая классификация отрицательна, а прогнозируемая классификация положительна (0,1), это называется ложноположительным результатом, поскольку отрицательный образец ошибочно идентифицируется классификатором как положительный. В-четвертых, если фактическая классификация отрицательна, а прогнозируемая классификация отрицательна (0,0), это называется истинно отрицательным результатом, поскольку классификатор правильно идентифицирует отрицательный образец.
Затем мы можем выполнить сравнение фактической и прогнозируемой классификаций и добавить эту информацию в таблицу, чтобы правильные результаты отображались зеленым цветом, чтобы их было легче идентифицировать.
В шаблоне любой двоичной матрицы путаницы используются четыре вида результатов, описанных выше (истинно положительные, ложноотрицательные, ложноположительные и истинно отрицательные), а также положительные и отрицательные классификации. Четыре результата можно сформулировать в виде матрицы путаницы 2×2 следующим образом:
Цветовая гамма трех приведенных выше таблиц данных была выбрана в соответствии с этой матрицей путаницы, чтобы можно было легко различать данные.
Теперь мы можем просто суммировать результаты каждого типа, подставить их в шаблон и создать матрицу путаницы, которая будет кратко суммировать результаты тестирования классификатора:
В этой матрице путаницы из 8 образцов с раком система решила, что в 2 нет рака, а из 4 образцов без рака она предсказала, что в 1 действительно был рак. Все правильные прогнозы расположены по диагонали таблицы (выделены зеленым), поэтому легко визуально проверить таблицу на наличие ошибок прогнозов, поскольку их будут представлять значения за пределами диагонали. Суммируя две строки матрицы путаницы, можно также вывести общее количество положительных (P) и отрицательных (N) выборок в исходном наборе данных, т. е. и .
В прогнозной аналитике таблица путаницы (иногда также называемая матрицей путаницы ) представляет собой таблицу с двумя строками и двумя столбцами, в которой сообщается количество истинных положительных результатов , ложных отрицательных результатов , ложных положительных результатов и истинных отрицательных результатов . Это позволяет провести более детальный анализ, чем просто наблюдение за долей правильных классификаций (точностью). Точность приведет к вводящим в заблуждение результатам, если набор данных несбалансирован; то есть когда количество наблюдений в разных классах сильно различается.
Например, если бы в данных было 95 образцов рака и только 5 образцов нераковых заболеваний, конкретный классификатор мог бы классифицировать все наблюдения как имеющие рак. Общая точность составит 95 %, но более подробно классификатор будет иметь 100 % уровень распознавания ( чувствительность ) для класса рака и 0 % уровень распознавания для класса, не связанного с раком. Оценка F1 в таких случаях еще более ненадежна, и здесь она составит более 97,4%, тогда как информированность устраняет такую предвзятость и дает 0 как вероятность осознанного решения для любой формы догадок (здесь всегда догадка о раке).
По мнению Давиде Чикко и Джузеппе Юрмана, наиболее информативным показателем для оценки матрицы путаницы является коэффициент корреляции Мэтьюза (MCC) . [11]
В матрицу путаницы можно включить и другие показатели, каждый из которых имеет свое значение и применение.
Матрица неточностей не ограничивается бинарной классификацией и может использоваться также в многоклассовых классификаторах. [21] Матрицы путаницы, рассмотренные выше, имеют только два условия: положительное и отрицательное. Например, в таблице ниже обобщено общение на свистящем языке между двумя говорящими, нулевые значения опущены для ясности. [22]