stringtranslate.com

Анализ причин

В науке и технике анализ первопричин ( RCA ) — это метод решения проблем , используемый для выявления коренных причин неисправностей или проблем. [1] Он широко используется в ИТ-операциях , производстве, телекоммуникациях , управлении производственными процессами , анализе аварий (например, в авиации , [2] железнодорожном транспорте или на атомных станциях ), медицине (для медицинской диагностики ), отрасли здравоохранения (например, для эпидемиологии ) и т. д. Анализ первопричин представляет собой форму индуктивного (сначала создайте теорию [корень] на основе эмпирических данных [причин]) и дедуктивного (проверьте теорию [основные причинные механизмы] с помощью эмпирических данных) умозаключения.

RCA можно разбить на четыре этапа:

RCA обычно служит входом в процесс исправления, в ходе которого предпринимаются корректирующие действия для предотвращения повторения проблемы. Имя этого процесса варьируется от одного домена приложения к другому. Согласно ISO/IEC 31010 , RCA может включать в себя методы «Пять почему» , анализ видов и последствий отказов (FMEA), анализ дерева отказов , диаграмму Исикавы и анализ Парето .

Определения

По сути, существует два способа устранения неисправностей и решения проблем в науке и технике.

Реактивное управление

Реактивное управление заключается в быстром реагировании после возникновения проблемы путем устранения симптомов. Этот тип управления реализуется реактивными системами, [3] [4] самоадаптирующими системами, [5] самоорганизующимися системами и сложными адаптивными системами . Цель здесь — быстро отреагировать и как можно скорее смягчить последствия проблемы.

Проактивное управление

Проактивное управление , наоборот, состоит в предотвращении возникновения проблем. Для этой цели можно использовать множество методов: от передового опыта проектирования до подробного анализа уже возникших проблем и принятия мер, чтобы они никогда не повторились. Здесь не так важна скорость, как точность и точность диагноза. Основное внимание уделяется устранению реальной причины проблемы, а не ее последствий.

Анализ первопричин часто используется в упреждающем управлении для выявления основной причины проблемы, то есть фактора, который был основной причиной. Обычно «коренную причину» называют в единственном числе, но один или несколько факторов могут составлять основную причину(ы) изучаемой проблемы.

Фактор считается «основной причиной» проблемы, если его устранение предотвращает повторение проблемы. И наоборот, «причинный фактор» — это способствующее действие, которое влияет на результат инцидента/события, но не является основной причиной. Хотя устранение причинного фактора может улучшить результат, оно не предотвращает его повторение с уверенностью.

Отличный способ взглянуть на картину проактивного/реактивного реагирования — рассмотреть модель оценки рисков с галстуком-бабочкой. В центре модели находится событие или несчастный случай. Слева показаны ожидаемые опасности и линия защиты, созданная для предотвращения возникновения событий из-за этих опасностей. Линия защиты — это нормативные требования, применимые процедуры, физические барьеры и кибербарьеры, которые существуют для управления операциями и предотвращения событий. Отличный способ использовать анализ первопричин — заранее оценить эффективность этих средств защиты, сравнивая фактическую производительность с применимыми требованиями, выявлять пробелы в производительности, а затем устранять их для усиления этой защиты. Если событие происходит, то мы находимся на правой стороне модели, на реактивной стороне, где упор делается на выявление коренных причин и смягчение ущерба.

Пример

Представьте себе расследование машины, которая остановилась из-за перегрузки и перегорания предохранителя. [6] Расследование показало, что машина была перегружена из-за недостаточной смазки подшипника. Расследование продолжается дальше и обнаруживает, что в механизме автоматической смазки был насос, который качал недостаточно, отсюда и отсутствие смазки. Исследование насоса показывает, что у него изношен вал. Исследование причин износа вала выявило отсутствие адекватного механизма, предотвращающего попадание металлического лома в насос. Это позволило металлолому попасть в насос и повредить его.

Очевидная основная причина проблемы заключается в том, что металлический лом может загрязнить систему смазки. Решение этой проблемы должно предотвратить повторение всей последовательности событий. Настоящей основной причиной может быть проблема конструкции, если нет фильтра, предотвращающего попадание металлического лома в систему. Или, если у него есть фильтр, который был заблокирован из-за отсутствия планового осмотра, то настоящей основной причиной является проблема с обслуживанием.

Сравните это с расследованием, которое не выявило первопричину: замена предохранителя, подшипника или смазочного насоса, вероятно, позволит машине на некоторое время вернуться в работу. Но существует риск, что проблема просто повторится, пока не будет устранена первопричина.

Вышеупомянутое не включает анализ затрат/выгод : превышает ли стоимость замены одной или нескольких машин стоимость простоя до замены предохранителя? Эту ситуацию иногда называют лекарством хуже болезни . [7] [8]

В качестве несвязанного примера выводов, которые можно сделать в отсутствие анализа затрат/выгод, рассмотрим компромисс между некоторыми заявленными выгодами от сокращения численности населения: В краткосрочной перспективе будет меньше плательщиков в пенсионные/пенсионные системы; тогда как прекращение роста населения потребует более высоких налогов, чтобы покрыть расходы на строительство большего количества школ. Это может помочь объяснить, почему лекарство хуже самой болезни. [9]

Затраты, которые следует учитывать, выходят за рамки финансов при рассмотрении персонала, обслуживающего оборудование. В конечном итоге цель состоит в том, чтобы предотвратить простои; но в большей степени предотвратить катастрофические травмы. Профилактика начинается с превентивных мер.

Общие принципы

Пример метода анализа первопричин

Несмотря на разные подходы в разных школах анализа первопричин и специфику каждой области применения, RCA обычно следует одним и тем же четырем шагам:

  1. Идентификация и описание. Эффективные формулировки проблем и описания событий (например, сбоев) полезны и обычно необходимы для обеспечения выполнения соответствующего анализа первопричин. Постановка задачи — это Полярная звезда RCA, поскольку она позволяет команде сосредоточиться на том, что они исследуют, и не дает им сбиться с пути.
  2. Сбор, организация и анализ информации. Большинство RCA начинаются с сеанса по установлению фактов для сбора доступной информации, такой как показания свидетелей, хронология событий и применимые требования к изменениям, которые происходили во время события. Эта информация может использоваться для установления последовательности событий или временных рамок события, а также для определения линии защиты, которая должна была предотвратить событие (т. е. административные требования, а также физические и кибербарьеры). Также следует запрашивать и анализировать доступные базы данных (например, базы данных программ корректирующих действий и программ безопасности), а также инструменты анализа данных, такие как диаграммы Парето, карты процессов, деревья отказов и другие инструменты, которые дают нам представление о пробелах в производительности. Можно использовать любое количество инструментов анализа данных, включая инструменты анализа данных из Lean Six Sigma, инструменты статистического анализа и другие, такие как иерархическая кластеризация и решения для интеллектуального анализа данных (например , интеллектуальный анализ данных на основе теории графов ). Другой заключается в сравнении расследуемой ситуации с прошлыми ситуациями, хранящимися в библиотеках дел, с использованием инструментов рассуждения на основе прецедентов и может включать анализ изменений, сравнительный анализ временной шкалы и анализ задач.
  3. Анализ средств защиты: После определения имеющихся средств защиты, которые должны были предотвратить событие или несчастный случай, настоятельно рекомендуется провести анализ средств защиты (традиционно называемый анализом барьеров ) в каждом случае, включая расследования, не связанные с RCA. Один из методов — перечислить средства защиты на диаграмме или виртуальной доске. Затем для каждой защиты просмотрите информацию и данные, собранные для подтверждения эффективности этой защиты. На самом деле мы ищем недостатки или пробелы в работе там, где не были соблюдены административные требования или где были обойдены физические или кибербарьеры. Эти первоначальные пробелы в производительности являются всего лишь симптомами более глубоких причин. Мы используем эти симптоматические пробелы в производительности для разработки ряда вопросов, как описано ниже, чтобы проследить симптомы до их источника (т.е. коренных причин), используя причинно-следственный анализ.
  4. Создание целенаправленных, беспристрастных вопросов для запроса: после сбора доступной информации, организации ее в диаграммах с временными рамками и другими данными, после анализа доступных данных и после проведения анализа нашей защиты мы используем эти идеи для создания хороших вопросов. Эти вопросы станут нашими направлениями для причинно-следственного анализа. Вопросы должны быть беспристрастными, и чтобы не допустить, чтобы какая-либо предвзятость со стороны команды RCA испортила расследование, вопросы должны быть привязаны к конкретной защите или к конкретному выводу, полученному в результате нашего анализа данных (например, диаграммы Парето , карты процессов , деревья ошибок , контрольные диаграммы ) и другие инструменты, которые дают нам представление о пробелах в производительности. Не должно быть никаких любопытных вопросов, вопросов, отражающих «предвзятость подтверждения» (т. е. задаваемых наводящих вопросов, чтобы ответить на то, что, по мнению команды RCA, являются причинами), или вопросов, носящих обвинительный характер, которые заставят тех, кто помогает расследованию, закрыть дело. вниз и уйти.
  5. Причинно-следственный анализ: как только мы разработаем надежный набор вопросов для запроса на основе собранных фактических данных, применимых требований и анализа доступных данных, мы можем передать эти вопросы профильным экспертам организации. С этого начинается процесс причинно-следственного анализа. Как только мы задаем вопрос затронутой организации, мы используем ее ответ, чтобы задать последующие сократические вопросы . Сократовские вопросы заставляют расследование переходить к следующим, более глубоким причинным факторам, пока у организации не закончатся ответы или пока последний причинный фактор не выйдет из-под контроля организации. Для проведения эффективного причинно-следственного анализа необходимо множество навыков, в том числе навыки фасилитации, коммуникативные навыки и сократовские вопросы. При правильном проведении это поможет RCA выявить самые глубокие коренные причины. Небольшое предостережение: Исикава или диаграмма «рыбья кость», а также методы «5 почему » недостаточно строги для проведения анализа первопричин. «Рыбная кость» появилась в 1940-х годах, а «5 почему» — в 1930-х, и существуют гораздо более продвинутые методы. Ищите методы, которые были разработаны в этом столетии (2000 год и позже), поскольку они с большей вероятностью объясняют новую динамику современной социотехнической рабочей среды.
  6. Составление диаграммы результатов RCA. Лучший способ отразить результаты расследования RCA — начать заполнять окончательную диаграмму с самого начала. Этот процесс стал намного проще с появлением виртуальных досок. На одной виртуальной доске мы можем отображать сроки, линии защиты, анализ данных, линии вопросов, причинно-следственный анализ, коренные причины и план корректирующих действий.
  7. Корректирующие действия для предотвращения повторения: с точки зрения управления усилия RCA не будут полными без комплексного плана корректирующих действий для устранения коренных причин, способствующих факторов и «масштаба причин». План корректирующих действий должен быть разработан владельцами проблем и не требует участия команды RCA, хотя эта группа является отличным источником рекомендаций для владельцев проблем. Анализ масштабов причин проводится для определения степени ущерба или воздействия, которое коренные причины и способствующие факторы оказали на людей, оборудование или объекты. Проверки степени причин являются ахиллесовой пятой в подавляющем большинстве организаций и основной причиной того, что RCA и планы корректирующих действий не могут предотвратить повторение проблем. Кроме того, необходимо проявлять осторожность, чтобы избежать планов корректирующих действий, которые просто добавляют организации больше административных требований и дополнительного обучения. Чтобы избежать этого, используйте «Иерархию контроля рисков » и «Бережливую защиту от ошибок» в качестве руководства для разработки эффективных корректирующих действий, которые с гораздо большей вероятностью предотвратят повторение ошибок.
  8. Обзоры эффективности. По истечении заранее определенного периода после реализации плана корректирующих действий планируется провести анализ эффективности для оценки результативности этих корректирующих действий. Для этого необходимо указать набор показателей или индикаторов, которые будут отслеживаться до и после реализации корректирующих действий, чтобы мы могли измерить их влияние. Если желаемые результаты не достигнуты, что в большинстве случаев означает значительное снижение масштабов или частоты событий или проблем, то RCA необходимо открыть заново, поскольку оно не было эффективным.

Чтобы быть эффективным, анализ первопричин должен проводиться систематически. Этот процесс дает возможность не упустить другие важные детали. Обычно требуются командные усилия, и в идеале все участвующие лица должны прийти к одному и тому же выводу. Например, при анализе авиационных происшествий выводы расследования и выявленные основные причины должны быть подкреплены документальными доказательствами. [10]

Переход к корректирующим действиям

Целью RCA является выявление основной причины проблемы с намерением предотвратить ее повторение или ухудшение. Следующим шагом является инициирование долгосрочных корректирующих действий для устранения основной причины, выявленной в ходе RCA, и обеспечения того, чтобы проблема не возникла снова. Однако исправление проблемы формально не является частью RCA; это разные этапы процесса решения проблем, известного как управление отказами в ИТ и телекоммуникациях, ремонт в технике, восстановление в авиации, восстановление окружающей среды в экологии , терапия в медицине и т. д.

Домены приложений

Анализ первопричин используется во многих областях приложений. RCA специально упоминается во многих разделах Кодекса федеральных правил США. Например:

  1. РАЗДЕЛ 10 – ЭНЕРГЕТИКА >>> 10CFR Часть 50, Приложение B, Критерий XVI, «Корректирующие действия» (также принят NQA-1)
    • «Должны быть установлены меры, гарантирующие, что условия, неблагоприятные для качества, такие как отказы, неисправности, недостатки, дефектные материалы и оборудование, а также несоответствия, быстро выявляются и исправляются.
    • В случае существенных условий, неблагоприятных для качества, меры должны гарантировать, что причина состояния установлена, и предприняты корректирующие действия для предотвращения повторения».
  2. РАЗДЕЛ 14 – АЭРОНАВТИКА И КОСМОСА >>> 14 CFR, глава III, подраздел C, часть 437, подраздел C, §437.73 Регистрация аномалий, отчетность и выполнение корректирующих действий.
    1. Лицо, получившее разрешение, должно фиксировать каждую аномалию, которая влияет на критически важную для безопасности систему, подсистему, процесс, объект или вспомогательное оборудование.
    2. Лицо, получившее разрешение, должно выявить все коренные причины каждой аномалии и осуществить все корректирующие действия для каждой аномалии.
  3. РАЗДЕЛ 21 – ПИТАНИЕ И ЛЕКАРСТВА >>> 21 CFR, подраздел J: 21CFR820.100(a) – Корректирующие/предупреждающие действия: (A) Каждый производитель должен установить и поддерживать процедуры по осуществлению корректирующих и предупреждающих действий. Процедуры должны включать требования к:
    1. Исследование причин несоответствий, касающихся продукции, процессов и системы качества;
    2. Определение действий, необходимых для исправления и предотвращения повторения несоответствующей продукции и других проблем с качеством;
    3. Проверка или подтверждение корректирующих и предупреждающих действий, чтобы гарантировать, что такие действия эффективны и не оказывают негативного влияния на готовое устройство;
  4. РАЗДЕЛ 42. ОБЩЕСТВЕННОЕ ЗДРАВООХРАНЕНИЕ >>> 42 CFR, ЧАСТЬ 488, ОБСЛЕДОВАНИЕ, СЕРТИФИКАЦИЯ И ИСПОЛНИТЕЛЬНЫЕ ПРОЦЕДУРЫ > Подраздел E — Осмотр и сертификация учреждений длительного ухода
    1. §488.61 Особые процедуры утверждения и повторного утверждения программ трансплантации органов.
    2. ...Анализ первопричин смертности пациентов и неудач трансплантатов, включая факторы, которые программа определила как вероятные причинные или способствующие факторы смерти пациентов и неудач трансплантатов;

Управление производством и производственными процессами

Приведенный выше пример иллюстрирует, как RCA можно использовать в производстве . RCA также обычно используется для контроля промышленных процессов , например, для контроля производства химикатов ( контроль качества ).

RCA также используется для анализа отказов при проектировании и техническом обслуживании .

ИТ и телекоммуникации

Анализ первопричин часто используется в ИТ и телекоммуникациях для выявления коренных причин серьезных проблем. Например, в структуре управления услугами ITIL целью управления инцидентами является как можно скорее возобновить работу неисправной ИТ-службы (реактивное управление), тогда как управление проблемами направлено на окончательное решение повторяющихся проблем путем устранения их коренных причин (проактивное управление). .

Другим примером является процесс управления инцидентами компьютерной безопасности , где анализ первопричин часто используется для расследования нарушений безопасности. [11]

RCA также используется в сочетании с мониторингом деловой активности и комплексной обработкой событий для анализа сбоев в бизнес-процессах .

Его использование в ИТ-индустрии не всегда можно сравнить с его использованием в отраслях, критически важных для безопасности, поскольку обычно использование RCA в ИТ-индустрии не поддерживается ранее существовавшими деревьями отказов или другими спецификациями проектирования. Вместо этого анализ обычно поддерживается сочетанием систем отладки, обнаружения на основе событий и мониторинга (где службы моделируются индивидуально). Инструментов обучения и поддержки, таких как моделирование или различные подробные инструкции для всех ожидаемых сценариев, не существует, вместо этого они создаются постфактум на основе проблем, которые считаются «достойными». В результате анализ часто ограничивается теми вещами, которые имеют интерфейсы мониторинга/наблюдения, а не фактической запланированной/видимой функцией с упором на проверку входных и выходных данных. Следовательно, поговорка «нет первопричины» стала распространенной в ИТ-индустрии.

Здоровье и безопасность

В сферах здоровья и безопасности RCA обычно используется в медицине (диагностика) и эпидемиологии (например, для определения источника инфекционного заболевания), где методы причинного вывода часто требуют как клинических, так и статистических знаний, чтобы понять сложности процессы. [12]

RCA используется в науках об окружающей среде (например, для анализа экологических катастроф), анализе аварий (авиационная и железнодорожная промышленность), а также в области безопасности и гигиены труда . [13] При производстве медицинских изделий, [14] фармацевтических препаратов, [15] продуктов питания, [16] и пищевых добавок, [17] анализ первопричин является нормативным требованием.

Системный анализ

RCA также используется в управлении изменениями , управлении рисками и системном анализе .

Проблемы

Не вдаваясь в особенности конкретных проблем, несколько общих условий могут сделать RCA более сложным, чем может показаться на первый взгляд.

Во-первых, важная информация часто отсутствует, поскольку на практике невозможно отслеживать все и хранить все данные мониторинга в течение длительного времени.

Во-вторых, сбор данных и доказательств и их классификация по временной шкале событий до конечной проблемы может быть нетривиальной задачей. Например, в телекоммуникациях распределенные системы мониторинга обычно обрабатывают от миллиона до миллиарда событий в день. Найти несколько важных событий в такой массе несущественных событий — значит найти пресловутую иголку в стоге сена.

В-третьих, у данной проблемы может быть более одной основной причины, и эта множественность может сильно затруднить установление причинно-следственной связи.

В-четвертых, причинные графики часто имеют много уровней, и анализ первопричин заканчивается на уровне, который является «коренным» для исследователя. Если еще раз взглянуть на приведенный выше пример управления производственными процессами, более глубокое исследование может показать, что процедуры технического обслуживания на заводе включали периодическую проверку подсистемы смазки каждые два года, в то время как продукт текущего поставщика подсистемы смазки предусматривал 6-месячный период. Смена поставщика могла произойти из-за желания руководства сэкономить деньги и неспособности проконсультироваться с инженерным персоналом о последствиях изменения процедур технического обслуживания. Таким образом, хотя показанная выше «основная причина» могла предотвратить указанное повторение, она не предотвратила бы другие – возможно, более серьезные – сбои, затрагивающие другие машины.

Смотрите также

Примечания

  1. ^ См. Wilson, Dell & Anderson 1993, стр. 8–17.
  2. ^ См. IATA 2016 и Sofema 2017.
  3. ^ См. Манна и Пнуэли, 1995.
  4. ^ См. Леверенц и Линднер, 1995.
  5. ^ См. Бабаоглу и др. 2005.
  6. ^ См. Оно 1988.
  7. ^ «Лекарство хуже болезни». Нью-Йорк Таймс . 5 ноября 1927 г.
  8. ^ Эндрю К. Ревкин (7 декабря 2000 г.). «Углубление печатных плат River может стать лекарством, даже хуже, чем сама болезнь, - настаивает GE». Нью-Йорк Таймс .
  9. Филип Лонгман (9 июня 2004 г.). «Глобальный детский кризис». Нью-Йорк Таймс .
  10. ^ См. ИАТА 2016.
  11. ^ См. Абубакар и др. 2016 год
  12. ^ Ландситтель, Дуглас; Шривастава, Авантика; Кропф, Кристин (2020). «Повествовательный обзор методов причинного вывода и связанных с ним образовательных ресурсов». Управление качеством в здравоохранении . 29 (4): 260–269. дои : 10.1097/QMH.0000000000000276. ISSN  1063-8628. PMID  32991545. S2CID  222146291.
  13. ^ См. OSHA 2019.
  14. ^ Управление по нормативному регулированию (26 декабря 2019 г.). «Корректирующие и предупреждающие действия (CAPA)». FDA .
  15. ^ США-FDA. «СОВРЕМЕННАЯ НАДЛЕЖАЩАЯ ПРАКТИКА ПРОИЗВОДСТВА ГОТОВЫХ ЛЕКАРСТВЕННЫХ СРЕДСТВ». Электронный свод федеральных правил (eCFR) . Проверено 28 декабря 2020 г.
  16. ^ США-FDA. «СОВРЕМЕННАЯ НАДЛЕЖАЩАЯ ПРОИЗВОДСТВЕННАЯ ПРАКТИКА, АНАЛИЗ ОПАСНОСТЕЙ И ПРЕВЕНТИВНЫЙ КОНТРОЛЬ НА ОСНОВЕ РИСКА ДЛЯ ПИЩЕВЫХ ПИЩЕВ ЧЕЛОВЕКА». Электронный свод федеральных правил (eCFR) . Проверено 28 декабря 2020 г.
  17. ^ США-FDA. «ТЕКУЩАЯ НАДЛЕЖАЩАЯ ПРОИЗВОДСТВЕННАЯ ПРАКТИКА ПРОИЗВОДСТВА, УПАКОВКИ, МАРКИРОВКИ ИЛИ ХРАНЕНИЯ ПИЩЕВЫХ ДОБАВОК». Электронный свод федеральных правил (eCFR) . Проверено 28 декабря 2020 г.

Рекомендации

Внешние ссылки