Точность и прецизионность — это две меры погрешности наблюдения . Точность — это то, насколько близки заданные наборы измерений ( наблюдений или показаний) к их истинному значению . Точность — это то, насколько близки измерения друг к другу.
Международная организация по стандартизации (ИСО) определяет связанную меру: [1] истинность , «близость соответствия между средним арифметическим большого количества результатов испытаний и истинным или принятым контрольным значением».
Хотя точность — это описание случайных ошибок (мера статистической изменчивости ), у точности есть два разных определения:
Проще говоря, если взять статистическую выборку или набор точек данных из повторных измерений одной и той же величины, то можно сказать, что выборка или набор точны, если их среднее значение близко к истинному значению измеряемой величины, в то время как набор можно назвать точным , если их стандартное отклонение относительно невелико.
В области науки и техники точность измерительной системы — это степень близости результатов измерений величины к истинному значению этой величины . [3] Точность измерительной системы, связанная с воспроизводимостью и повторяемостью , — это степень, в которой повторные измерения в неизменных условиях показывают одни и те же результаты . [3] [4] Хотя два слова «точность» и «правильность» могут быть синонимами в разговорной речи, в контексте научного метода они намеренно противопоставляются .
В области статистики , где интерпретация измерений играет центральную роль, предпочитают использовать термины «смещение» и «изменчивость» вместо «точность» и «прецизионность»: смещение — это величина неточности, а изменчивость — это величина неточности.
Система измерения может быть точной, но не точной, точной, но не точной, ни тем, ни другим, или обоими. Например, если эксперимент содержит систематическую ошибку , то увеличение размера выборки обычно увеличивает точность, но не улучшает достоверность. Результатом будет последовательная, но неточная строка результатов ошибочного эксперимента. Устранение систематической ошибки повышает точность, но не меняет достоверность.
Система измерения считается действительной , если она является как точной , так и правильной . Связанные термины включают смещение (неслучайные или направленные эффекты, вызванные фактором или факторами, не связанными с независимой переменной ) и ошибку (случайную изменчивость).
Терминология также применяется к косвенным измерениям, то есть к значениям, полученным с помощью вычислительной процедуры из наблюдаемых данных.
Помимо точности и достоверности, измерения могут также иметь разрешающую способность , которая представляет собой наименьшее изменение базовой физической величины, вызывающее отклик при измерении.
В численном анализе точность также является близостью вычисления к истинному значению, в то время как точность — это разрешение представления, обычно определяемое числом десятичных или двоичных цифр.
В военной терминологии точность в первую очередь относится к точности стрельбы ( justesse de tir ), точности стрельбы, выражаемой плотностью группировки выстрелов в центре цели и вокруг него. [5]
Изменение в значении этих терминов произошло с публикацией серии стандартов ISO 5725 в 1994 году, что также отражено в издании Международного словаря метрологии (VIM) BIPM за 2008 год, пункты 2.13 и 2.14. [3]
Согласно ISO 5725-1, [1] общий термин «точность» используется для описания близости измерения к истинному значению. Когда этот термин применяется к наборам измерений одной и той же измеряемой величины , он включает компонент случайной погрешности и компонент систематической погрешности. В этом случае истинность — это близость среднего значения набора результатов измерений к фактическому (истинному) значению, то есть систематическая погрешность, а точность — это близость согласия между набором результатов, то есть случайная погрешность.
ISO 5725-1 и VIM также избегают использования термина « предвзятость », ранее указанного в BS 5497-1, [6], поскольку он имеет иные коннотации за пределами областей науки и техники, например, в медицине и юриспруденции.
В промышленном приборостроении точность — это допуск измерения или передача прибора, определяющая пределы ошибок, допускаемых при использовании прибора в нормальных рабочих условиях. [7]
В идеале измерительное устройство должно быть как точным, так и аккуратным, с измерениями, близкими к истинному значению и плотно сгруппированными вокруг него. Точность и правильность процесса измерения обычно устанавливаются путем повторного измерения некоторого прослеживаемого эталонного стандарта . Такие стандарты определены в Международной системе единиц (сокращенно СИ от французского: Système international d'unités ) и поддерживаются национальными организациями по стандартизации, такими как Национальный институт стандартов и технологий в Соединенных Штатах.
Это также применимо, когда измерения повторяются и усредняются. В этом случае термин « стандартная ошибка» применяется правильно: точность среднего равна известному стандартному отклонению процесса, деленному на квадратный корень из числа усредненных измерений. Кроме того, центральная предельная теорема показывает, что распределение вероятностей усредненных измерений будет ближе к нормальному распределению, чем распределение отдельных измерений.
По точности можно выделить:
Распространенным соглашением в науке и технике является выражение точности и/или достоверности неявно с помощью значащих цифр . Если явно не указано иное, погрешность понимается как половина значения последнего значащего разряда. Например, запись 843,6 м, или 843,0 м, или 800,0 м будет подразумевать погрешность 0,05 м (последний значащий разряд — это десятые доли), в то время как запись 843 м будет подразумевать погрешность 0,5 м (последние значащие цифры — это единицы).
Значение 8000 м с конечными нулями и без десятичной точки неоднозначно; конечные нули могут быть или не быть значимыми цифрами. Чтобы избежать этой неоднозначности, число можно представить в научной нотации: 8,0 × 10 3 м указывает, что первый ноль является значимым (следовательно, запас 50 м), в то время как 8,000 × 10 3 м указывает, что все три нуля являются значимыми, что дает запас 0,5 м. Аналогично можно использовать кратное базовой единицы измерения: 8,0 км эквивалентно 8,0 × 10 3 м. Это указывает на запас 0,05 км (50 м). Однако опора на это соглашение может привести к ложным ошибкам точности при приеме данных из источников, которые ему не подчиняются. Например, источник, сообщающий число вроде 153 753 с точностью +/- 5000, выглядит так, будто его точность составляет +/- 0,5. Согласно соглашению, оно было бы округлено до 150 000.
В качестве альтернативы, в научном контексте, если желательно указать предел погрешности с большей точностью, можно использовать такую запись, как 7,54398(23) × 10 −10 м, что означает диапазон от 7,54375 до 7,54421 × 10 −10 м.
Точность включает в себя:
В инженерии точность часто принимается как утроенное стандартное отклонение выполненных измерений, представляющее собой диапазон, в пределах которого могут находиться 99,73% измерений. [8] Например, эргономист, измеряющий человеческое тело, может быть уверен, что 99,73% полученных им измерений попадают в пределы ± 0,7 см — при использовании системы обработки GRYPHON — или ± 13 см — при использовании необработанных данных. [9]
Точность также используется как статистическая мера того, насколько хорошо тест бинарной классификации правильно идентифицирует или исключает условие. То есть точность — это доля правильных предсказаний (как истинно положительных, так и истинно отрицательных ) среди общего числа исследованных случаев. [10] Таким образом, она сравнивает оценки вероятности до и после теста . Чтобы сделать контекст понятным по семантике, ее часто называют «точностью Рэнда» или « индексом Рэнда ». [11] [12] [13] Это параметр теста. Формула для количественной оценки бинарной точности: где TP = Истинно положительный ; FP = Ложно положительный ; TN = Истинно отрицательный ; FN = Ложно отрицательный
В этом контексте понятия истинности и точности, определенные в ISO 5725-1, неприменимы. Одна из причин заключается в том, что не существует единственного «истинного значения» величины, а скорее два возможных истинных значения для каждого случая, в то время как точность является средним значением по всем случаям и, следовательно, учитывает оба значения. Однако термин точность используется в этом контексте для обозначения другой метрики, происходящей из области поиска информации (см. ниже).
При вычислении точности в многоклассовой классификации точность — это просто доля правильных классификаций: [14] [15] Обычно она выражается в процентах. Например, если классификатор делает десять предсказаний и девять из них верны, точность составляет 90%.
Точность иногда также рассматривается как микрометрика , чтобы подчеркнуть, что на нее, как правило, сильно влияет распространенность конкретного класса в наборе данных и предубеждения классификатора. [14]
Кроме того, ее также называют точностью top-1, чтобы отличать ее от точности top-5, распространенной в оценке сверточных нейронных сетей . Чтобы оценить точность top-5, классификатор должен предоставить относительные вероятности для каждого класса. Когда они сортируются, классификация считается правильной, если правильная классификация попадает в любое место среди top 5 предсказаний, сделанных сетью. Top-5 точность была популяризирована вызовом ImageNet . Она обычно выше, чем точность top-1, так как любые правильные предсказания на позициях со 2-й по 5-ю не улучшат оценку top-1, но улучшат оценку top-5.
В психометрии и психофизике термин точность взаимозаменяемо используется с терминами валидность и постоянная ошибка . Точность является синонимом надежности и переменной ошибки . Валидность измерительного прибора или психологического теста устанавливается посредством эксперимента или корреляции с поведением. Надежность устанавливается с помощью различных статистических методов, классически с помощью теста на внутреннюю согласованность, такого как альфа Кронбаха, чтобы убедиться, что наборы связанных вопросов имеют связанные ответы, а затем сравнение этих связанных вопросов между референтной и целевой популяцией. [ необходима ссылка ]
В логическом моделировании распространенной ошибкой при оценке точных моделей является сравнение логической модели моделирования с моделью моделирования транзисторной схемы . Это сравнение различий в точности, а не точности. Точность измеряется по отношению к деталям, а точность измеряется по отношению к реальности. [16] [17]
Системы поиска информации, такие как базы данных и поисковые системы в Интернете , оцениваются по многим различным показателям , некоторые из которых выводятся из матрицы путаницы , которая делит результаты на истинно положительные (документы, извлеченные правильно), истинно отрицательные (документы, извлеченные правильно, не были), ложно положительные (документы, извлеченные неправильно) и ложно отрицательные (документы, извлеченные неправильно). Обычно используемые показатели включают понятия точности и полноты . В этом контексте точность определяется как доля правильно извлеченных документов по сравнению с извлеченными документами (истинно положительные результаты, деленные на истинно положительные результаты плюс ложно положительные результаты), используя набор релевантных результатов, выбранных людьми. Полнота определяется как доля правильно извлеченных документов по сравнению с соответствующими документами (истинно положительные результаты, деленные на истинно положительные результаты плюс ложно отрицательные результаты). Реже используется метрика точности, которая определяется как доля правильно классифицированных документов по сравнению с документами (истинно положительные результаты плюс истинно отрицательные результаты, деленные на истинно положительные результаты плюс истинно отрицательные результаты плюс ложно отрицательные результаты).
Ни одна из этих метрик не учитывает ранжирование результатов. Ранжирование очень важно для поисковых систем, поскольку читатели редко заходят дальше первой страницы результатов, а в сети слишком много документов, чтобы вручную классифицировать их все относительно того, следует ли их включать или исключать из данного поиска. Добавление порогового значения при определенном количестве результатов в некоторой степени учитывает ранжирование. Например, точность измерения при k является мерой точности, рассматривающей только первые десять (k=10) результатов поиска. Более сложные метрики, такие как дисконтированный кумулятивный прирост , учитывают каждый отдельный рейтинг и чаще используются там, где это важно.
В когнитивных системах точность и достоверность используются для характеристики и измерения результатов когнитивного процесса, выполняемого биологическими или искусственными объектами, где когнитивный процесс представляет собой преобразование данных, информации, знаний или мудрости в более ценную форму. ( Пирамида DIKW ) Иногда когнитивный процесс производит точно предполагаемый или желаемый результат, но иногда производит результат, далекий от предполагаемого или желаемого. Более того, повторения когнитивного процесса не всегда производят тот же результат. Когнитивная точность (C A ) - это склонность когнитивного процесса производить предполагаемый или желаемый результат. Когнитивная точность (C P ) - это склонность когнитивного процесса производить тот же результат. [18] [19] [20] Для измерения дополненного познания в ансамблях человек/винтик, где один или несколько человек работают совместно с одной или несколькими когнитивными системами (винтиками), увеличение когнитивной точности и когнитивной точности помогает в измерении степени когнитивного дополнения .
{{cite web}}
: CS1 maint: архивная копия как заголовок ( ссылка )