stringtranslate.com

Точность и аккуратность

Точность — это близость результатов измерений к принятому значению; прецизионность — это степень, в которой повторные (или воспроизводимые ) измерения в неизменных условиях показывают одни и те же результаты.

Точность и прецизионность — это две меры погрешности наблюдения . Точность — это то, насколько близки заданные наборы измерений ( наблюдений или показаний) к их истинному значению . Точность — это то, насколько близки измерения друг к другу.

Международная организация по стандартизации (ИСО) определяет связанную меру: [1] истинность , «близость соответствия между средним арифметическим большого количества результатов испытаний и истинным или принятым контрольным значением».

Согласно стандарту ISO 5725-1, точность состоит из истинности (близости среднего значения результатов измерений к истинному значению) и прецизионности (повторяемости или воспроизводимости измерения).

Хотя точность — это описание случайных ошибок (мера статистической изменчивости ), у точности есть два разных определения:

  1. Чаще всего, описание систематических ошибок (мера статистического смещения заданной меры центральной тенденции , такой как среднее значение). В этом определении «точности» концепция независима от «прецизионности», поэтому конкретный набор данных можно назвать точным, точным, обоими или ни тем, ни другим. Эта концепция соответствует истинности ISO .
  2. Сочетание точности и истинности, учитывающее два типа ошибок наблюдения (случайную и систематическую), так что высокая точность требует как высокой точности, так и высокой истинности. Такое использование соответствует определению точности ISO (истинность и прецизионность). [2]

Общее техническое определение

Проще говоря, если взять статистическую выборку или набор точек данных из повторных измерений одной и той же величины, то можно сказать, что выборка или набор точны, если их среднее значение близко к истинному значению измеряемой величины, в то время как набор можно назвать точным , если их стандартное отклонение относительно невелико.

В области науки и техники точность измерительной системы — это степень близости результатов измерений величины к истинному значению этой величины . [3] Точность измерительной системы, связанная с воспроизводимостью и повторяемостью , — это степень, в которой повторные измерения в неизменных условиях показывают одни и те же результаты . [3] [4] Хотя два слова «точность» и «правильность» могут быть синонимами в разговорной речи, в контексте научного метода они намеренно противопоставляются .

В области статистики , где интерпретация измерений играет центральную роль, предпочитают использовать термины «смещение» и «изменчивость» вместо «точность» и «прецизионность»: смещение — это величина неточности, а изменчивость — это величина неточности.

Система измерения может быть точной, но не точной, точной, но не точной, ни тем, ни другим, или обоими. Например, если эксперимент содержит систематическую ошибку , то увеличение размера выборки обычно увеличивает точность, но не улучшает достоверность. Результатом будет последовательная, но неточная строка результатов ошибочного эксперимента. Устранение систематической ошибки повышает точность, но не меняет достоверность.

Система измерения считается действительной , если она является как точной , так и правильной . Связанные термины включают смещение (неслучайные или направленные эффекты, вызванные фактором или факторами, не связанными с независимой переменной ) и ошибку (случайную изменчивость).

Терминология также применяется к косвенным измерениям, то есть к значениям, полученным с помощью вычислительной процедуры из наблюдаемых данных.

Помимо точности и достоверности, измерения могут также иметь разрешающую способность , которая представляет собой наименьшее изменение базовой физической величины, вызывающее отклик при измерении.

В численном анализе точность также является близостью вычисления к истинному значению, в то время как точность — это разрешение представления, обычно определяемое числом десятичных или двоичных цифр.

В военной терминологии точность в первую очередь относится к точности стрельбы ( justesse de tir ), точности стрельбы, выражаемой плотностью группировки выстрелов в центре цели и вокруг него. [5]

.mw-parser-output .vanchor>:target~.vanchor-text{background-color:#b1d2ff}@media screen{html.skin-theme-clientpref-night .mw-parser-output .vanchor>:target~.vanchor-text{background-color:#0f4dc9}}@media screen and (prefers-color-scheme:dark){html.skin-theme-clientpref-os .mw-parser-output .vanchor>:target~.vanchor-text{background-color:#0f4dc9}}Определение ИСО (ИСО 5725)

Изменение в значении этих терминов произошло с публикацией серии стандартов ISO 5725 в 1994 году, что также отражено в издании Международного словаря метрологии (VIM) BIPM за 2008 год, пункты 2.13 и 2.14. [3]

Согласно ISO 5725-1, [1] общий термин «точность» используется для описания близости измерения к истинному значению. Когда этот термин применяется к наборам измерений одной и той же измеряемой величины , он включает компонент случайной погрешности и компонент систематической погрешности. В этом случае истинность — это близость среднего значения набора результатов измерений к фактическому (истинному) значению, то есть систематическая погрешность, а точность — это близость согласия между набором результатов, то есть случайная погрешность.

ISO 5725-1 и VIM также избегают использования термина « предвзятость », ранее указанного в BS 5497-1, [6], поскольку он имеет иные коннотации за пределами областей науки и техники, например, в медицине и юриспруденции.

Количественная оценка и применение

В промышленном приборостроении точность — это допуск измерения или передача прибора, определяющая пределы ошибок, допускаемых при использовании прибора в нормальных рабочих условиях. [7]

В идеале измерительное устройство должно быть как точным, так и аккуратным, с измерениями, близкими к истинному значению и плотно сгруппированными вокруг него. Точность и правильность процесса измерения обычно устанавливаются путем повторного измерения некоторого прослеживаемого эталонного стандарта . Такие стандарты определены в Международной системе единиц (сокращенно СИ от французского: Système international d'unités ) и поддерживаются национальными организациями по стандартизации, такими как Национальный институт стандартов и технологий в Соединенных Штатах.

Это также применимо, когда измерения повторяются и усредняются. В этом случае термин « стандартная ошибка» применяется правильно: точность среднего равна известному стандартному отклонению процесса, деленному на квадратный корень из числа усредненных измерений. Кроме того, центральная предельная теорема показывает, что распределение вероятностей усредненных измерений будет ближе к нормальному распределению, чем распределение отдельных измерений.

По точности можно выделить:

Распространенным соглашением в науке и технике является выражение точности и/или достоверности неявно с помощью значащих цифр . Если явно не указано иное, погрешность понимается как половина значения последнего значащего разряда. Например, запись 843,6 м, или 843,0 м, или 800,0 м будет подразумевать погрешность 0,05 м (последний значащий разряд — это десятые доли), в то время как запись 843 м будет подразумевать погрешность 0,5 м (последние значащие цифры — это единицы).

Значение 8000 м с конечными нулями и без десятичной точки неоднозначно; конечные нули могут быть или не быть значимыми цифрами. Чтобы избежать этой неоднозначности, число можно представить в научной нотации: 8,0 × 10 3  м указывает, что первый ноль является значимым (следовательно, запас 50 м), в то время как 8,000 × 10 3  м указывает, что все три нуля являются значимыми, что дает запас 0,5 м. Аналогично можно использовать кратное базовой единицы измерения: 8,0 км эквивалентно 8,0 × 10 3  м. Это указывает на запас 0,05 км (50 м). Однако опора на это соглашение может привести к ложным ошибкам точности при приеме данных из источников, которые ему не подчиняются. Например, источник, сообщающий число вроде 153 753 с точностью +/- 5000, выглядит так, будто его точность составляет +/- 0,5. Согласно соглашению, оно было бы округлено до 150 000.

В качестве альтернативы, в научном контексте, если желательно указать предел погрешности с большей точностью, можно использовать такую ​​запись, как 7,54398(23) × 10 −10 м, что означает диапазон от 7,54375 до 7,54421 × 10 −10 м.

Точность включает в себя:

В инженерии точность часто принимается как утроенное стандартное отклонение выполненных измерений, представляющее собой диапазон, в пределах которого могут находиться 99,73% измерений. [8] Например, эргономист, измеряющий человеческое тело, может быть уверен, что 99,73% полученных им измерений попадают в пределы ± 0,7 см — при использовании системы обработки GRYPHON — или ± 13 см — при использовании необработанных данных. [9]

В классификации

В бинарной классификации

Точность также используется как статистическая мера того, насколько хорошо тест бинарной классификации правильно идентифицирует или исключает условие. То есть точность — это доля правильных предсказаний (как истинно положительных, так и истинно отрицательных ) среди общего числа исследованных случаев. [10] Таким образом, она сравнивает оценки вероятности до и после теста . Чтобы сделать контекст понятным по семантике, ее часто называют «точностью Рэнда» или « индексом Рэнда ». [11] [12] [13] Это параметр теста. Формула для количественной оценки бинарной точности: где TP = Истинно положительный ; FP = Ложно положительный ; TN = Истинно отрицательный ; FN = Ложно отрицательный

В этом контексте понятия истинности и точности, определенные в ISO 5725-1, неприменимы. Одна из причин заключается в том, что не существует единственного «истинного значения» величины, а скорее два возможных истинных значения для каждого случая, в то время как точность является средним значением по всем случаям и, следовательно, учитывает оба значения. Однако термин точность используется в этом контексте для обозначения другой метрики, происходящей из области поиска информации (см. ниже).

В многоклассовой классификации

При вычислении точности в многоклассовой классификации точность — это просто доля правильных классификаций: [14] [15] Обычно она выражается в процентах. Например, если классификатор делает десять предсказаний и девять из них верны, точность составляет 90%.

Точность иногда также рассматривается как микрометрика , чтобы подчеркнуть, что на нее, как правило, сильно влияет распространенность конкретного класса в наборе данных и предубеждения классификатора. [14]

Кроме того, ее также называют точностью top-1, чтобы отличать ее от точности top-5, распространенной в оценке сверточных нейронных сетей . Чтобы оценить точность top-5, классификатор должен предоставить относительные вероятности для каждого класса. Когда они сортируются, классификация считается правильной, если правильная классификация попадает в любое место среди top 5 предсказаний, сделанных сетью. Top-5 точность была популяризирована вызовом ImageNet . Она обычно выше, чем точность top-1, так как любые правильные предсказания на позициях со 2-й по 5-ю не улучшат оценку top-1, но улучшат оценку top-5.

В психометрии и психофизике

В психометрии и психофизике термин точность взаимозаменяемо используется с терминами валидность и постоянная ошибка . Точность является синонимом надежности и переменной ошибки . Валидность измерительного прибора или психологического теста устанавливается посредством эксперимента или корреляции с поведением. Надежность устанавливается с помощью различных статистических методов, классически с помощью теста на внутреннюю согласованность, такого как альфа Кронбаха, чтобы гарантировать, что наборы связанных вопросов имеют связанные ответы, а затем сравнение этих связанных вопросов между референтной и целевой популяцией. [ необходима цитата ]

В логическом моделировании

Сравнительные формы сигналов для логических значений, напряжений цепей и измерительных напряжений

В логическом моделировании распространенной ошибкой при оценке точных моделей является сравнение логической модели моделирования с моделью моделирования транзисторной схемы . Это сравнение различий в точности, а не точности. Точность измеряется по отношению к деталям, а точность измеряется по отношению к реальности. [16] [17]

В информационных системах

Системы поиска информации, такие как базы данных и поисковые системы в Интернете , оцениваются по многим различным метрикам , некоторые из которых выводятся из матрицы путаницы , которая делит результаты на истинно положительные (документы, извлеченные правильно), истинно отрицательные (документы, извлеченные правильно, не были), ложно положительные (документы, извлеченные неправильно) и ложно отрицательные (документы, извлеченные неправильно). Обычно используемые метрики включают понятия точности и полноты . В этом контексте точность определяется как доля правильно извлеченных документов по сравнению с извлеченными документами (истинно положительные, деленные на истинно положительные плюс ложно положительные), используя набор релевантных результатов, выбранных людьми. Полнота определяется как доля правильно извлеченных документов по сравнению с соответствующими документами (истинно положительные, деленные на истинно положительные плюс ложно отрицательные). Реже используется метрика точности, которая определяется как доля правильно классифицированных документов по сравнению с документами (истинно положительные плюс истинно отрицательные, деленные на истинно положительные плюс истинно отрицательные плюс ложно положительные плюс ложно отрицательные).

Ни одна из этих метрик не учитывает ранжирование результатов. Ранжирование очень важно для поисковых систем, поскольку читатели редко заходят дальше первой страницы результатов, а в сети слишком много документов, чтобы вручную классифицировать их все относительно того, следует ли их включать или исключать из данного поиска. Добавление порогового значения при определенном количестве результатов в некоторой степени учитывает ранжирование. Например, точность измерения при k является мерой точности, рассматривающей только первые десять (k=10) результатов поиска. Более сложные метрики, такие как дисконтированный кумулятивный прирост , учитывают каждый отдельный рейтинг и чаще используются там, где это важно.

В когнитивных системах

В когнитивных системах точность и достоверность используются для характеристики и измерения результатов когнитивного процесса, выполняемого биологическими или искусственными объектами, где когнитивный процесс представляет собой преобразование данных, информации, знаний или мудрости в более ценную форму. ( Пирамида DIKW ) Иногда когнитивный процесс производит точно предполагаемый или желаемый результат, но иногда производит результат, далекий от предполагаемого или желаемого. Более того, повторения когнитивного процесса не всегда производят тот же результат. Когнитивная точность (C A ) - это склонность когнитивного процесса производить предполагаемый или желаемый результат. Когнитивная точность (C P ) - это склонность когнитивного процесса производить тот же результат. [18] [19] [20] Для измерения дополненного познания в ансамблях человек/винтик, где один или несколько человек работают совместно с одной или несколькими когнитивными системами (винтиками), увеличение когнитивной точности и когнитивной точности помогает в измерении степени когнитивного дополнения .

Смотрите также

Ссылки

  1. ^ ab BS ISO 5725-1: «Точность (правильность и прецизионность) методов и результатов измерений. Часть 1: Общие принципы и определения.», стр. 1 (1994)
  2. ^ Мендитто, Антонио; Патриарка, Марина; Магнуссон, Бертил (2007-01-09). «Понимание значения точности, истинности и аккуратности». Аккредитация и обеспечение качества . 12 (1): 45–47. doi :10.1007/s00769-006-0191-z. ISSN  0949-1775.
  3. ^ abc JCGM 200:2008 Международный словарь по метрологии — Основные и общие понятия и связанные с ними термины (VIM)
  4. ^ Тейлор, Джон Роберт (1999). Введение в анализ ошибок: изучение неопределенностей в физических измерениях. University Science Books. стр. 128–129. ISBN 0-935702-75-X.
  5. ^ Организация Североатлантического договора, Агентство стандартизации НАТО AAP-6 – Глоссарий терминов и определений, стр. 43.
  6. ^ BS 5497-1: «Точность методов испытаний. Руководство по определению повторяемости и воспроизводимости для стандартного метода испытаний». (1979)
  7. ^ Креус, Антонио. Instrumentación Industrial [ нужна ссылка ]
  8. ^ Блэк, Дж. Темпл (21 июля 2020 г.). Материалы и процессы ДеГармо в производстве. John Wiley & Sons. ISBN 978-1-119-72329-5. OCLC  1246529321.
  9. ^ Паркер, Кристофер Дж.; Гилл, Симеон; Харвуд, Адриан; Хейс, Стивен Г.; Ахмед, Марьям (19.05.2021). «Метод повышения точности 3D-сканирования тела: грифон и последовательное сканирование». Эргономика . 65 (1): 39–59. doi : 10.1080/00140139.2021.1931473 . ISSN  0014-0139. PMID  34006206.
  10. ^ Metz, CE (октябрь 1978 г.). «Основные принципы ROC-анализа» (PDF) . Semin Nucl Med . 8 (4): 283–98. doi :10.1016/s0001-2998(78)80014-2. PMID  112681. Архивировано (PDF) из оригинала 2022-10-09.
  11. ^ "Архивная копия" (PDF) . Архивировано из оригинала (PDF) 2015-03-11 . Получено 2015-08-09 .{{cite web}}: CS1 maint: архивная копия как заголовок ( ссылка )
  12. ^ Пауэрс, Дэвид МВ (2015). «Что не измеряет F-мера». arXiv : 1503.06410 [cs.IR].
  13. ^ Дэвид М. В. Пауэрс. «Проблема с Каппой» (PDF) . Anthology.aclweb.org . Архивировано (PDF) из оригинала 2022-10-09 . Получено 11 декабря 2017 .
  14. ^ ab Opitz, Juri (2024). «Более пристальный взгляд на метрики оценки классификации и критическое отражение общей практики оценки». Труды Ассоциации компьютерной лингвистики . 12 : 820–836. arXiv : 2404.16958 . doi : 10.1162/tacl_a_00675.
  15. ^ "3.3. Метрики и оценка: количественная оценка качества прогнозов". scikit-learn . Получено 17 мая 2022 г. .
  16. ^ Акен, Джон М. (1997). "none". Энциклопедия компьютерных наук и технологий . 36 : 281–306.
  17. ^ Глассер, Марк; Мэтьюз, Роб; Акен, Джон М. (июнь 1990 г.). «Семинар 1990 г. по моделированию на логическом уровне для ASICS». Информационный бюллетень SIGDA . 20 (1).
  18. ^ Фулбрайт, Рон (2020). Демократизация экспертизы: как когнитивные системы произведут революцию в вашей жизни (1-е изд.). Бока-Ратон, Флорида: CRC Press. ISBN 978-0367859459.
  19. ^ Фулбрайт, Рон (2019). «Расчет когнитивного дополнения – исследование случая». Дополненное познание . Конспект лекций по информатике. Том 11580. Springer Cham. С. 533–545. arXiv : 2211.06479 . doi : 10.1007/978-3-030-22419-6_38. ISBN 978-3-030-22418-9. S2CID  195891648.
  20. ^ Фулбрайт, Рон (2018). «Об измерении познания и когнитивном расширении». Интерфейс пользователя и управление информацией. Информация в приложениях и сервисах . Конспект лекций по информатике. Том 10905. Springer Cham. С. 494–507. arXiv : 2211.06477 . doi :10.1007/978-3-319-92046-7_41. ISBN 978-3-319-92045-0. S2CID  51603737.

Внешние ссылки