stringtranslate.com

Поиск неисправностей

Устранение неполадок — это форма решения проблем , часто применяемая для ремонта неисправных продуктов или процессов на машине или системе. Это логический, систематический поиск источника проблемы с целью ее решения и возобновления работы продукта или процесса. Устранение неполадок необходимо для выявления симптомов. Определение наиболее вероятной причины — это процесс устранения — устранения потенциальных причин проблемы. Наконец, устранение неполадок требует подтверждения того, что решение возвращает продукт или процесс в рабочее состояние.

Диагностика

В общем, устранение неполадок — это выявление или диагностика «проблем» в потоке управления системой, вызванных каким-либо сбоем. Первоначально проблема описывается как симптомы неисправности, а устранение неисправностей — это процесс определения и устранения причин этих симптомов.

Систему можно описать с точки зрения ее ожидаемого, желаемого или предполагаемого поведения (обычно для искусственных систем — ее цели). Ожидается, что события или входные данные в систему приведут к конкретным результатам или результатам. (Например, выбор опции «Печать» в различных компьютерных приложениях приведет к появлению печатной копии на каком-то конкретном устройстве). Любое неожиданное или нежелательное поведение является симптомом. Устранение неполадок — это процесс выявления конкретной причины или причин симптома. Часто симптомом является неспособность продукта или процесса дать какие-либо результаты. (Ничего не было напечатано, например). Затем можно предпринять корректирующие действия для предотвращения дальнейших сбоев подобного рода.

Методы судебной инженерии полезны при отслеживании проблем в продуктах или процессах, а для определения причины или причин конкретных сбоев доступен широкий спектр аналитических методов . Затем могут быть предприняты корректирующие действия для предотвращения дальнейших сбоев аналогичного типа. Предупредительные действия возможны с использованием видов и последствий отказов (FMEA) и анализа дерева отказов (FTA) перед полномасштабным производством, и эти методы также можно использовать для анализа отказов .

Для проведения диагностики устранения неполадок необходимы два основных элемента: априорное знание предметной области и стратегии поиска. [1] Они взаимозависимы, и именно здесь мы можем выделить принципиально два разных типа проблем с соответствующими подходами к их диагностике. Расмуссен [2] предположил, что существует стратегия, основанная на характеристиках правильного функционирования устройства (топографическая стратегия), и стратегия, основанная на характеристиках аномального функционирования (симптоматическая стратегия). Второй действительно спрашивает: «Что не так?» первый спрашивает: «Что происходит?»

Стратегия – это организованный набор действий, выражающий возможный способ достижения цели. Стратегии не следует рассматривать как алгоритмы, неуклонно выполняющие решения. Лица, решающие проблемы, ведут себя оппортунистически, корректируя действия в рамках стратегии и меняя стратегию и тактику в ответ на информацию и идеи. [3]

Симптоматическая стратегия (также известная как рассуждение на основе прецедентов или поверхностное рассуждение) требует априорных знаний предметной области, почерпнутых из прошлого опыта, который установил связи между симптомами и причинами. Эти знания называются поверхностными, компилированными, доказательными, основанными на истории, а также знаниями, основанными на конкретных случаях. Это стратегия, которая больше всего ассоциируется с диагностикой экспертов. Диагностика проблемы представляет собой быстрый процесс распознавания, в котором симптомы вызывают соответствующие категории ситуаций. [4] Эксперт знает причину, поскольку ранее сталкивался с подобными случаями. Обоснованное рассуждение — самая мощная стратегия, которая используется чаще всего. Однако стратегия не будет работать независимо от действительно новых проблем или там, где требуется более глубокое понимание того, что происходит. Топографическая стратегия попадает в категорию глубоких рассуждений. При глубоких рассуждениях используются глубокие знания системы. Топография в этом контексте означает описание или анализ структурированного объекта, показывающий отношения между его элементами. [5] Также известный как рассуждение на основе первых принципов, [6] глубокое рассуждение применяется к новым ошибкам, когда подходы, основанные на опыте, нежизнеспособны. Таким образом, топографическая стратегия связана с априорными знаниями предметной области, которые развиваются на основе более фундаментального понимания системы, возможно, с использованием знаний из первых принципов. Такое знание называется глубоким, причинным или основанным на модели знанием. [7]

Hoc [8] отметил, что симптоматические подходы, возможно, должны быть подкреплены топографическими подходами, поскольку симптомы можно определять по-разному. Верно и обратное: поверхностные рассуждения можно использовать абдуктивно для генерации причинных гипотез и дедуктивно для оценки этих гипотез в топографическом поиске.

Аспекты

Обычно устранение неполадок применяется к чему-то, что внезапно перестало работать, поскольку его предыдущее рабочее состояние формирует ожидания относительно его дальнейшего поведения. Поэтому первоначальное внимание часто уделяется недавним изменениям в системе или среде, в которой она существует. (Например, принтер, который «работал, когда его вот сюда подключили»). Однако существует хорошо известный принцип, согласно которому корреляция не предполагает причинно-следственной связи . (Например, выход из строя устройства вскоре после того, как его подключили к другой розетке, не обязательно означает, что события были связаны. Сбой мог быть результатом совпадения .) Поэтому устранение неполадок требует критического мышления , а не магии. мышление .

Полезно рассмотреть общий опыт, который мы имеем с лампочками. Лампочки «перегорают» более или менее случайно; в конечном итоге повторяющийся нагрев и охлаждение нити , а также колебания подаваемой на нее мощности приводят к растрескиванию или испарению нити. Тот же принцип применим к большинству других электронных устройств, и аналогичные принципы применимы к механическим устройствам. Некоторые сбои являются частью нормального износа компонентов системы.

Первый основной принцип устранения неполадок — иметь возможность воспроизвести проблему по своему желанию. Второй основной принцип устранения неполадок — свести «систему» ​​к ее простейшей форме, в которой все еще проявляется проблема. Третий основной принцип устранения неполадок — «знать, что вы ищете». Другими словами, полностью понимать, как должна работать система, чтобы вы могли «обнаружить» ошибку, когда она произойдет.

Специалист по устранению неполадок может проверять каждый компонент системы один за другим, заменяя заведомо исправные компоненты каждым потенциально подозрительным. Однако этот процесс «серийной замены» можно считать вырожденным, когда компоненты заменяются без учета гипотезы о том, как их отказ может привести к диагностике симптомов.

Простые и промежуточные системы характеризуются списками или деревьями зависимостей между их компонентами или подсистемами. Более сложные системы содержат циклические зависимости или взаимодействия ( петли обратной связи ). Такие системы менее поддаются методам устранения неполадок «пополам».

Это также помогает начать с заведомо исправного состояния, лучшим примером является перезагрузка компьютера . Познавательное прохождение также неплохо попробовать. Исчерпывающая документация , подготовленная опытными техническими авторами, очень полезна, особенно если она содержит теорию работы рассматриваемого устройства или системы.

Распространенной причиной проблем является плохой дизайн , например, плохой дизайн с человеческим фактором , когда устройство может быть вставлено задом наперед или вверх ногами из-за отсутствия соответствующей принудительной функции ( ограничение формирования поведения ) или отсутствия устойчивой к ошибкам конструкции . . Это особенно плохо, если сопровождается привыканием , когда пользователь просто не замечает неправильного использования, например, если две части имеют разные функции, но имеют общий корпус, так что при случайном осмотре не видно, какая часть используется.

Устранение неполадок также может принимать форму систематического контрольного списка , процедуры устранения неполадок, блок-схемы или таблицы, которые составляются до возникновения проблемы. Предварительная разработка процедур устранения неполадок позволяет достаточно продумать шаги, которые необходимо предпринять для устранения неполадок, и организовать устранение неполадок в наиболее эффективный процесс устранения неполадок. Таблицы устранения неполадок можно компьютеризировать, чтобы сделать их более эффективными для пользователей.

Некоторые компьютеризированные службы устранения неполадок (например, Primefax, позже переименованные в MaxServ) сразу показывают 10 лучших решений с наибольшей вероятностью устранения основной проблемы. Технический специалист может либо ответить на дополнительные вопросы, чтобы пройти процедуру устранения неполадок, каждый шаг сужая список решений, либо немедленно внедрить решение, которое, по его мнению, устранит проблему. Эти услуги предоставляют скидку, если технический специалист предпримет дополнительный шаг после решения проблемы: сообщит о решении, которое фактически устранило проблему. Компьютер использует эти отчеты для обновления своих оценок того, какие решения с наибольшей вероятностью устранят этот конкретный набор симптомов. [9] [10]

Полурасщепление

Эффективное методическое устранение неполадок начинается с четкого понимания ожидаемого поведения системы и наблюдаемых симптомов. На этом этапе специалист по устранению неполадок формирует гипотезы о потенциальных причинах и разрабатывает (или, возможно, ссылается на стандартизированный контрольный список) тестов для устранения этих предполагаемых причин. Этот подход часто называют « разделяй и властвуй ».

Две распространенные стратегии, используемые специалистами по устранению неполадок, — это сначала проверить часто встречающиеся или легко проверяемые условия (например, проверить, горит ли индикатор принтера и надежно ли закреплен его кабель на обоих концах). Это часто называют «доением передней панели». [11]

Затем «разделите» систему пополам (например, в системе сетевой печати, проверяя, достигло ли задание сервера, чтобы определить, существует ли проблема в подсистемах «в направлении» пользователя или «в направлении» устройства).

Последний метод может быть особенно эффективен в системах с длинными цепочками сериализованных зависимостей или взаимодействий между компонентами. Это просто применение двоичного поиска по диапазону зависимостей, которое часто называют «половинным разделением». [12] Это похоже на игру в « двадцать вопросов »: любой может выделить один вариант из миллиона, разделив множество альтернатив пополам 20 раз (поскольку 2^10 = 1024 и 2^20 = 1 048 576).

Воспроизведение симптомов

Один из основных принципов устранения неполадок заключается в том, что воспроизводимые проблемы можно надежно изолировать и устранить. Часто значительные усилия и упор при устранении неполадок уделяется воспроизводимости... поиску процедуры, позволяющей надежно вызвать возникновение симптома.

Периодические симптомы

Некоторые из наиболее сложных проблем при устранении неполадок связаны с симптомами, которые возникают периодически . В электронике это часто происходит из-за того, что компоненты термочувствительны (поскольку сопротивление цепи меняется в зависимости от температуры проводников в ней). Сжатый воздух можно использовать для охлаждения определенных мест на печатной плате, а для повышения температуры можно использовать тепловую пушку; таким образом, устранение неисправностей электронных систем часто влечет за собой применение этих инструментов для воспроизведения проблемы.

В компьютерном программировании условия гонки часто приводят к периодическим симптомам, которые чрезвычайно трудно воспроизвести; могут использоваться различные методы, чтобы заставить конкретную функцию или модуль вызываться быстрее, чем при нормальной работе (аналогично «нагреву» компонента в аппаратной схеме), в то время как другие методы могут использоваться для введения больших задержек, или принудительно синхронизировать другие модули или взаимодействующие процессы.

Таким образом можно определить периодически возникающие проблемы:

Интермиттирующая — это проблема, для которой не существует известной процедуры, позволяющей последовательно воспроизводить ее симптом.

-  Стивен Литт, [13]

В частности, он утверждает, что существует различие между частотой возникновения и «известной процедурой последовательного воспроизведения» проблемы. Например, знание того, что периодическая проблема возникает «в течение» часа после определенного стимула или события… но иногда это происходит через пять минут, а иногда это занимает почти час… не представляет собой «известную процедуру» даже если стимул действительно увеличивает частоту наблюдаемых проявлений симптома.

Тем не менее, иногда специалистам по устранению неполадок приходится прибегать к статистическим методам... и они могут найти только процедуры, позволяющие увеличить возникновение симптомов до точки, при которой становится возможной серийная замена или какой-либо другой метод. В таких случаях, даже когда кажется, что симптом исчезает на значительно более длительный период времени, существует низкая уверенность в том, что основная причина найдена и проблема действительно решена.

Кроме того, могут быть запущены тесты для проверки определенных компонентов, чтобы определить, вышли ли эти компоненты из строя.[14]

Множественные проблемы

Изолировать отказы отдельных компонентов, вызывающие воспроизводимые симптомы, относительно просто.

Однако многие проблемы возникают только в результате многочисленных сбоев или ошибок. Это особенно справедливо для отказоустойчивых систем или систем со встроенным резервированием. Функции, которые добавляют в систему избыточность, обнаружение неисправностей и аварийное переключение , также могут быть подвержены сбоям, и достаточное количество отказов различных компонентов в любой системе приведет к ее «выходу из строя».

Даже в простых системах специалист по устранению неполадок всегда должен учитывать возможность наличия более одной неисправности. (Замена каждого компонента с использованием последовательной замены, а затем замена каждого нового компонента на старый, когда обнаруживается, что симптом сохраняется, может не решить такие случаи. Что еще более важно, замена любого компонента на дефектный действительно может увеличивать количество проблем, а не устранять их).

Обратите внимание: хотя мы говорим о «замене компонентов», решение многих проблем предполагает регулировку или настройку, а не «замену». Например, периодические обрывы проводников или «грязные или ослабленные контакты» могут просто нуждаться в очистке и/или подтяжке. Все обсуждения термина «замена» следует понимать как «замену, корректировку или другую модификацию».

Смотрите также

Рекомендации

  1. ^ Венкатасубраманиан, Венкат, Рагунатан Ренгасвами и Сурья Н. Кавури. «Обзор процесса обнаружения и диагностики неисправностей: Часть II: Качественные модели и стратегии поиска». Компьютеры и химическая инженерия 27.3 (2003): 313–326.
  2. ^ Расмуссен, Йенс. Обработка информации и взаимодействие человека и машины. Подход к когнитивной инженерии. Северная Голландия, 1987 год.
  3. ^ Лесголд, Алан и Сюзанна Лажуа. «Решение сложных задач в электронике». Решение сложных проблем: Принципы и механизмы (1991): 287-316.
  4. ^ Гилхули, Кеннет Дж. «Когнитивная психология и медицинский диагноз». Прикладная когнитивная психология 4.4 (1990): 261-272.
  5. ^ Словарь американского наследия.
  6. ^ Дэвис, Рэндалл. «Рассуждения на основе основных принципов поиска и устранения неисправностей электроники». Международный журнал человеко-машинных исследований 19.5 (1983): 403-423.
  7. ^ Милн, Роберт. «Стратегии диагностики». Транзакции IEEE по системам, человеку и кибернетике 17.3 (1987): 333-339.
  8. ^ Хок, Жан-Мишель. «Метод описания стратегий диагностики человека в отношении проектирования сотрудничества человека и машины». Международный журнал когнитивной эргономики 4.4 (2000): 297-309.
  9. ^ «Устранение неполадок у вас под рукой», Нильс Конрад Перссон. Журнал «Электроника, сервис и технологии», 1982, июнь.
  10. ^ «Проблемы диагностики неисправностей динамических систем» Рона Дж. Паттона, Пола М. Франка, Роберта Н. Кларка.
  11. ^ "Трусы Hewlett Packard Bench" (PDF) . Hewlett Packard . Проверено 14 октября 2011 г.
  12. Салливан, Майк (15 ноября 2000 г.). «Секреты супер-гика: используйте половинное расщепление для решения сложных задач». Техреспублика . Архивировано из оригинала 8 июля 2012 года . Проверено 22 октября 2010 г.
  13. ^ «Профессиональный журнал по устранению неполадок, декабрь 98 г.: Прерывистые явления» . www.troubleshooters.com . Проверено 14 октября 2020 г.
  14. ^ «Как устранить неполадки с компьютером - joyojc.com» . www.joyojc.com . Архивировано из оригинала 24 февраля 2013 г. Проверено 9 апреля 2018 г.