Проверка и согласование данных промышленного процесса , или, короче, согласование данных процесса (PDR) , представляет собой технологию, которая использует информацию о процессе и математические методы для автоматического обеспечения проверки и согласования данных путем корректировки измерений в промышленных процессах. Использование PDR позволяет извлекать точную и надежную информацию о состоянии промышленных процессов из необработанных данных измерений и создает единый согласованный набор данных, представляющих наиболее вероятную операцию процесса.
Промышленные процессы, например химические или термодинамические процессы на химических заводах, нефтеперерабатывающих заводах, объектах добычи нефти или газа или электростанциях, часто представлены двумя основными способами:
Модели могут иметь различные уровни детализации, например, можно включать простые балансы сохранения массы или составные балансы или более продвинутые термодинамические модели, включая законы сохранения энергии. Математически модель может быть выражена нелинейной системой уравнений в переменных , которая включает все вышеупомянутые системные ограничения (например, балансы массы или тепла вокруг блока). Переменной может быть температура или давление в определенном месте на заводе.
Данные обычно берутся из измерений, проводимых в разных местах по всей промышленной площадке, например, измерения температуры, давления, объемного расхода и т. д. Чтобы понять основные принципы PDR, важно сначала признать, что заводские измерения никогда не бывают на 100% правильными, т. е. необработанные измерения не являются решением нелинейной системы . При использовании измерений без коррекции для создания заводских балансов часто возникают несогласованности. Ошибки измерений можно разделить на два основных типа:
Случайные ошибки означают, что измерение является случайной величиной со средним значением , где — истинное значение, которое обычно неизвестно. С другой стороны, систематическая ошибка характеризуется измерением , которое является случайной величиной со средним значением , которое не равно истинному значению . Для простоты вывода и реализации оптимального оценочного решения и на основе аргументов о том, что ошибки являются суммой многих факторов (так что Центральная предельная теорема имеет некоторый эффект), согласование данных предполагает, что эти ошибки распределены нормально .
Другие источники ошибок при расчете балансов завода включают в себя технологические ошибки, такие как утечки, немоделированные потери тепла, неправильные физические свойства или другие физические параметры, используемые в уравнениях, и неправильную структуру, такую как немоделированные обводные линии. Другие ошибки включают в себя немоделированную динамику завода, такую как изменения задержки, и другие нестабильности в работе завода, которые нарушают модели устойчивого состояния (алгебраические). Дополнительные динамические ошибки возникают, когда измерения и пробы не берутся одновременно, особенно лабораторные анализы.
Обычная практика использования временных средних для ввода данных частично уменьшает динамические проблемы. Однако это не полностью устраняет временные несоответствия для нечасто выбираемых данных, таких как лабораторные анализы.
Это использование средних значений, как скользящее среднее , действует как фильтр нижних частот , поэтому высокочастотный шум в основном устраняется. Результатом является то, что на практике согласование данных в основном вносит корректировки для исправления систематических ошибок, таких как смещения.
ISA-95 — международный стандарт интеграции корпоративных и систем управления [1]. Он утверждает, что:
Согласование данных является серьезной проблемой для интеграции управления предприятием. Данные должны быть действительными, чтобы быть полезными для корпоративной системы. Данные часто должны определяться из физических измерений, которые имеют связанные с ними факторы ошибок. Обычно их необходимо преобразовывать в точные значения для корпоративной системы. Это преобразование может потребовать ручного или интеллектуального согласования преобразованных значений [...]. Системы должны быть настроены для обеспечения отправки точных данных на производство и с производства. Непреднамеренные ошибки оператора или канцелярских работников могут привести к слишком большому производству, слишком малому производству, неправильному производству, неправильному инвентарю или отсутствующему инвентарю.
PDR становится все более и более важным из-за промышленных процессов, которые становятся все более и более сложными. PDR начался в начале 1960-х годов с приложений, нацеленных на закрытие материальных балансов в производственных процессах, где были доступны необработанные измерения для всех переменных . [2] В то же время была представлена проблема идентификации и устранения грубых ошибок . [3] В конце 1960-х и 1970-х годах неизмеренные переменные были приняты во внимание в процессе согласования данных., [4] [5] PDR также стал более зрелым, рассматривая общие нелинейные системы уравнений, полученные из термодинамических моделей., [6] , [7] [8] Квазиустойчивая динамика для фильтрации и одновременной оценки параметров с течением времени была введена в 1977 году Стэнли и Ма. [7] Динамический PDR был сформулирован как нелинейная задача оптимизации Либманом и др. в 1992 году. [9]
Согласование данных — это метод, направленный на исправление ошибок измерения, вызванных шумом измерения, т. е. случайными ошибками . Со статистической точки зрения основное предположение заключается в том, что в наборе измерений не существует систематических ошибок , поскольку они могут исказить результаты согласования и снизить его надежность.
При наличии измерений согласование данных можно математически выразить как задачу оптимизации следующего вида:
где — согласованное значение -го измерения ( ), — измеренное значение -го измерения ( ), — -я неизмеренная переменная ( ), — стандартное отклонение -го измерения ( ), — ограничения равенства процесса и — границы измеренных и неизмеренных переменных.
Этот термин называется штрафом измерения i . Целевая функция представляет собой сумму штрафов, которая в дальнейшем будет обозначаться как .
Другими словами, требуется минимизировать общую коррекцию (измеренную в термине наименьших квадратов), которая необходима для удовлетворения системных ограничений . Кроме того, каждый термин наименьших квадратов взвешивается по стандартному отклонению соответствующего измерения. Стандартное отклонение связано с точностью измерения. Например, при уровне достоверности 95% стандартное отклонение составляет примерно половину точности.
Согласование данных в значительной степени опирается на концепцию избыточности, чтобы как можно меньше корректировать измерения, чтобы удовлетворить ограничениям процесса. Здесь избыточность определяется иначе, чем избыточность в теории информации . Вместо этого избыточность возникает из-за объединения данных датчика с моделью (алгебраические ограничения), иногда более конкретно называемой «пространственной избыточностью», [7] «аналитической избыточностью» или «топологической избыточностью».
Избыточность может быть вызвана избыточностью датчиков , когда датчики дублируются, чтобы иметь более одного измерения одной и той же величины. Избыточность также возникает, когда одна переменная может быть оценена несколькими независимыми способами из отдельных наборов измерений в заданное время или период усреднения времени, используя алгебраические ограничения.
Избыточность связана с концепцией наблюдаемости . Переменная (или система) является наблюдаемой, если модели и измерения датчика могут быть использованы для однозначного определения ее значения (состояния системы). Датчик является избыточным, если его удаление не приводит к потере наблюдаемости. Строгие определения наблюдаемости, вычислимости и избыточности, а также критерии для их определения были установлены Стэнли и Махом [10] для этих случаев с установленными ограничениями, такими как алгебраические уравнения и неравенства. Далее мы проиллюстрируем некоторые особые случаи:
Топологическая избыточность тесно связана со степенями свободы ( ) математической системы, [11] т.е. минимальным числом единиц информации (т.е. измерений), которые требуются для расчета всех переменных системы. Например, в приведенном выше примере сохранение потока требует, чтобы . Нужно знать значение двух из трех переменных, чтобы вычислить третью. Степени свободы для модели в этом случае равны 2. Для оценки всех переменных необходимо не менее 2 измерений, а для избыточности потребуется 3.
Говоря о топологической избыточности, мы должны различать измеряемые и неизмеренные переменные. В дальнейшем обозначим через неизмеренные переменные и измеряемые переменные. Тогда система ограничений процесса становится , которая является нелинейной системой относительно и . Если система вычислима с заданными измерениями, то уровень топологической избыточности определяется как , т. е. число дополнительных измерений, которые имеются в наличии сверх тех измерений, которые требуются для того, чтобы просто вычислить систему. Другой способ просмотра уровня избыточности — использовать определение , которое является разницей между числом переменных (измеренных и неизмеренных) и числом уравнений. Тогда получается
т.е. избыточность — это разница между числом уравнений и числом неизмеренных переменных . Уровень общей избыточности — это сумма избыточности датчиков и топологической избыточности. Мы говорим о положительной избыточности, если система вычислима, а общая избыточность положительна. Можно видеть, что уровень топологической избыточности зависит только от числа уравнений (чем больше уравнений, тем выше избыточность) и числа неизмеренных переменных (чем больше неизмеренных переменных, тем ниже избыточность), а не от числа измеряемых переменных.
Простой подсчет переменных, уравнений и измерений недостаточен для многих систем, распадаясь по нескольким причинам: (a) Части системы могут иметь избыточность, в то время как другие нет, а некоторые части могут быть даже невозможны для расчета, и (b) Нелинейности могут привести к разным выводам в разных рабочих точках. В качестве примера рассмотрим следующую систему с 4 потоками и 2 блоками.
Мы включаем только ограничения сохранения потока и получаем и . Возможно, что система не поддается расчету, даже если .
Если у нас есть измерения для и , но нет для и , то система не может быть рассчитана (знание не дает информации о и ). С другой стороны, если и известны, но нет и , то система может быть рассчитана.
В 1981 году были доказаны критерии наблюдаемости и избыточности для этих видов сетей потоков, включающих только ограничения баланса массы и энергии. [12] После объединения всех входов и выходов завода в «узел среды» потеря наблюдаемости соответствует циклам неизмеренных потоков. Это видно во втором случае выше, где потоки a и b находятся в цикле неизмеренных потоков. Далее следует классификация избыточности путем проверки пути неизмеренных потоков, поскольку это привело бы к неизмеренному циклу, если бы измерение было удалено. Измерения c и d являются избыточными во втором случае выше, даже несмотря на то, что часть системы ненаблюдаема.
Избыточность может использоваться как источник информации для перекрестной проверки и исправления измерений и повышения их точности и достоверности: с одной стороны, они согласовывались Кроме того, проблема согласования данных, представленная выше, также включает неизмеренные переменные . На основе избыточности информации оценки для этих неизмеренных переменных могут быть рассчитаны вместе с их точностью. В промышленных процессах эти неизмеренные переменные, которые обеспечивает согласование данных, называются мягкими датчиками или виртуальными датчиками, где аппаратные датчики не установлены.
Проверка данных подразумевает все действия по проверке и верификации до и после этапа сверки.
Фильтрация данных обозначает процесс обработки измеренных данных таким образом, чтобы значения стали осмысленными и находились в диапазоне ожидаемых значений. Фильтрация данных необходима перед процессом согласования, чтобы повысить надежность шага согласования. Существует несколько способов фильтрации данных, например, взятие среднего значения нескольких измеренных значений за четко определенный период времени.
Проверка результатов — это набор действий по проверке или верификации, предпринимаемых после процесса согласования, и она учитывает измеренные и неизмеренные переменные, а также согласованные значения. Проверка результатов охватывает, помимо прочего, анализ штрафов для определения надежности согласования или проверки границ для обеспечения того, чтобы согласованные значения находились в определенном диапазоне, например, температура должна находиться в некоторых разумных пределах.
Проверка результатов может включать статистические тесты для проверки надежности согласованных значений путем проверки наличия грубых ошибок в наборе измеренных значений. Эти тесты могут быть, например,
Если в наборе измеренных значений нет грубых ошибок, то каждый штрафной член в целевой функции является случайной величиной , которая нормально распределена со средним значением, равным 0, и дисперсией, равной 1. Следовательно, целевая функция является случайной величиной, которая следует распределению хи-квадрат , поскольку она является суммой квадратов нормально распределенных случайных величин. Сравнение значения целевой функции с заданным процентилем функции плотности вероятности распределения хи-квадрат (например, 95-м процентилем для 95%-ной достоверности) дает указание на то, существует ли грубая ошибка: Если , то грубых ошибок не существует с 95%-ной вероятностью. Тест хи-квадрат дает только грубое указание на существование грубых ошибок, и его легко провести: нужно только сравнить значение целевой функции с критическим значением распределения хи-квадрат.
Индивидуальный тест сравнивает каждый штрафной член в целевой функции с критическими значениями нормального распределения. Если -й штрафной член выходит за пределы 95% доверительного интервала нормального распределения, то есть основания полагать, что это измерение имеет грубую ошибку.
Расширенный процесс согласования данных (PDR) представляет собой комплексный подход, объединяющий методы согласования и проверки данных, который характеризуется
Простые модели включают только балансы масс. При добавлении в модель термодинамических ограничений, таких как энергетические балансы , ее область действия и уровень избыточности увеличиваются. Действительно, как мы видели выше, уровень избыточности определяется как , где — количество уравнений. Включение энергетических балансов означает добавление уравнений в систему, что приводит к более высокому уровню избыточности (при условии, что доступно достаточно измерений или, что эквивалентно, не слишком много переменных не измерены).
Грубые ошибки — это систематические ошибки измерения, которые могут исказить результаты согласования. Поэтому важно выявить и устранить эти грубые ошибки из процесса согласования. После согласования можно применить статистические тесты , которые покажут, существует ли грубая ошибка где-то в наборе измерений. Эти методы исправления грубых ошибок основаны на двух концепциях:
Устранение грубых ошибок определяет одно измерение, которое смещено систематической ошибкой, и отбрасывает это измерение из набора данных. Определение отбрасываемого измерения основано на различных видах штрафных условий, которые выражают, насколько измеренные значения отклоняются от согласованных значений. После обнаружения грубых ошибок они отбрасываются из измерений, и согласование может быть выполнено без этих ошибочных измерений, которые портят процесс согласования. При необходимости исключение повторяется до тех пор, пока в наборе измерений не останется ни одной грубой ошибки.
Релаксация грубой ошибки направлена на ослабление оценки неопределенности подозрительных измерений, чтобы согласованное значение находилось в 95% доверительном интервале. Релаксация обычно применяется, когда невозможно определить, какое измерение около одной единицы отвечает за грубую ошибку (эквивалентность грубых ошибок). Тогда неопределенности измерений вовлеченных измерений увеличиваются.
Важно отметить, что исправление грубых ошибок снижает качество согласования, либо избыточность уменьшается (устранение), либо неопределенность измеренных данных увеличивается (релаксация). Поэтому его можно применять только тогда, когда начальный уровень избыточности достаточно высок, чтобы гарантировать, что согласование данных все еще может быть выполнено (см. Раздел 2, [11] ).
Передовые решения PDR предлагают интеграцию вышеупомянутых технологий:
Результатом усовершенствованной процедуры PDR является согласованный набор проверенных и согласованных технологических данных.
PDR находит применение в основном в отраслях промышленности, где измерения неточны или вообще отсутствуют, например, в секторе добычи , где расходомеры трудно или дорого размещать (см. [13] ); или где точные данные имеют большое значение, например, по соображениям безопасности на атомных электростанциях (см. [14] ). Другая область применения — мониторинг производительности и процессов (см. [15] ) в нефтеперерабатывающей или химической промышленности.
Поскольку PDR позволяет надежно рассчитывать оценки даже для неизмеренных переменных, Немецкое инженерное общество (VDI Gesellschaft Energie und Umwelt) приняло технологию PDR в качестве средства замены дорогостоящих датчиков в атомной энергетике (см. норму VDI 2048, [11] ).