stringtranslate.com

Поиск неисправностей

Устранение неполадок — это форма решения проблем , часто применяемая для ремонта неисправных продуктов или процессов на машине или в системе. Это логический, систематический поиск источника проблемы с целью ее решения и возобновления работоспособности продукта или процесса. Устранение неполадок необходимо для выявления симптомов. Определение наиболее вероятной причины — это процесс исключения — устранения потенциальных причин проблемы. Наконец, устранение неполадок требует подтверждения того, что решение восстанавливает работоспособность продукта или процесса.

Диагностика

В общем, устранение неполадок — это идентификация или диагностика «неполадок» в потоке управления системы, вызванных каким-либо сбоем. Проблема изначально описывается как симптомы неисправности, а устранение неполадок — это процесс определения и устранения причин этих симптомов.

Система может быть описана в терминах ее ожидаемого, желаемого или предполагаемого поведения (обычно, для искусственных систем, ее цели). Ожидается, что события или входы в систему будут генерировать определенные результаты или выходы. (Например, выбор опции «печать» из различных компьютерных приложений должен привести к появлению печатной копии на некотором определенном устройстве). Любое неожиданное или нежелательное поведение является симптомом. Устранение неполадок — это процесс изоляции определенной причины или причин симптома. Часто симптомом является отказ продукта или процесса производить какие-либо результаты. (Например, ничего не было напечатано). Затем можно предпринять корректирующие действия для предотвращения дальнейших сбоев подобного рода.

Методы судебной инженерии полезны для отслеживания проблем в продуктах или процессах, и широкий спектр аналитических методов доступен для определения причины или причин конкретных отказов . Затем можно предпринять корректирующие действия для предотвращения дальнейших отказов подобного рода. Профилактические действия возможны с использованием анализа характера и последствий отказов (FMEA) и анализа дерева отказов (FTA) до полномасштабного производства, и эти методы также можно использовать для анализа отказов .

Для диагностики неисправностей необходимы два основных элемента: априорные знания предметной области и стратегии поиска. [1] Они взаимозависимы, и здесь мы можем принципиально выделить два разных типа проблем с соответствующими подходами к их диагностике. Расмуссен [2] предположил, что существует стратегия, основанная на характеристиках правильного функционирования устройства (топографическая стратегия), и стратегия, основанная на характеристиках ненормального функционирования (симптоматическая стратегия). Вторая стратегия на самом деле заключается в том, чтобы спросить «что не так?», первая стратегия заключается в том, чтобы спросить «что происходит?».

Стратегия — это организованный набор действий, выражающий вероятный способ достижения цели. Стратегии не следует рассматривать как алгоритмы, негибко применяемые к решениям. Решатели проблем ведут себя оппортунистически, корректируя действия в рамках стратегии и меняя стратегии и тактики в ответ на информацию и идеи. [3]

Симптоматическая стратегия (также известная как рассуждение на основе прецедентов или поверхностное рассуждение) требует априорных знаний в области, которые почерпнуты из прошлого опыта, который установил связи между симптомами и причинами. Эти знания называются поверхностными, скомпилированными, доказательными, основанными на истории, а также на знаниях на основе прецедентов. Это стратегия, наиболее связанная с диагностикой экспертами. Диагностика проблемы происходит как быстрый процесс распознавания, в котором симптомы вызывают соответствующие категории ситуаций. [4] Эксперт знает причину в силу того, что ранее сталкивался с подобными случаями. Рассуждение на основе прецедентов является самой мощной стратегией, и она используется чаще всего. Однако эта стратегия не будет работать независимо с действительно новыми проблемами или там, где требуется более глубокое понимание того, что происходит. Топографическая стратегия относится к категории глубоких рассуждений. При глубоком рассуждении используются глубокие знания системы. Топография в этом контексте означает описание или анализ структурированной сущности, показывающий отношения между ее элементами. [5] Также известное как рассуждение из первых принципов, [6] глубокое рассуждение применяется к новым ошибкам, когда подходы, основанные на опыте, нежизнеспособны. Топографическая стратегия, таким образом, связана с априорными знаниями о предметной области, которые развиваются из более фундаментального понимания системы, возможно, с использованием знаний из первых принципов. Такие знания называются глубокими, причинными или основанными на моделях знаниями. [7]

Хок [8] отметил, что симптоматические подходы могут нуждаться в поддержке топографических подходов, поскольку симптомы могут быть определены в различных терминах. Обратное также верно — поверхностное рассуждение может использоваться абдуктивно для генерации причинных гипотез и дедуктивно для оценки этих гипотез в топографическом поиске.

Аспекты

Обычно устранение неполадок применяется к чему-то, что внезапно перестало работать, поскольку его предыдущее рабочее состояние формирует ожидания относительно его дальнейшего поведения. Поэтому первоначальное внимание часто уделяется недавним изменениям в системе или среде, в которой он существует. (Например, принтер, который «работал, когда его включили вон там»). Однако существует хорошо известный принцип, согласно которому корреляция не подразумевает причинно-следственной связи . (Например, отказ устройства вскоре после того, как его включили в другую розетку, не обязательно означает, что события были связаны. Отказ мог быть делом совпадения .) Поэтому устранение неполадок требует критического мышления, а не магического мышления .

Полезно рассмотреть распространенный опыт, который мы имеем с лампочками. Лампочки «перегорают» более или менее случайно; в конечном итоге повторяющийся нагрев и охлаждение нити накаливания и колебания подаваемой на нее мощности приводят к тому, что нить растрескивается или испаряется. Тот же принцип применим к большинству других электронных устройств, и подобные принципы применимы к механическим устройствам. Некоторые отказы являются частью нормального износа компонентов в системе.

Первый базовый принцип устранения неполадок — иметь возможность воспроизвести проблему, если пожелаете. Второй базовый принцип устранения неполадок — свести «систему» ​​к ее простейшей форме, которая все еще показывает проблему. Третий базовый принцип устранения неполадок — «знать, что вы ищете». Другими словами, полностью понимать, как должна работать система, чтобы вы могли «заметить» ошибку, когда она произойдет.

Специалист по устранению неполадок может проверить каждый компонент в системе один за другим, заменяя каждый потенциально подозрительный компонент известными исправными компонентами. Однако этот процесс «серийной замены» можно считать вырожденным, когда компоненты заменяются без учета гипотезы о том, как их отказ может привести к диагностируемым симптомам.

Простые и промежуточные системы характеризуются списками или деревьями зависимостей между их компонентами или подсистемами. Более сложные системы содержат циклические зависимости или взаимодействия ( петли обратной связи ). Такие системы менее поддаются методам устранения неполадок «бисекции».

Также полезно начинать с известного хорошего состояния, лучшим примером которого является перезагрузка компьютера . Когнитивное пошаговое руководство также является хорошей вещью, которую стоит попробовать. Подробная документация, созданная опытными техническими писателями, очень полезна, особенно если она предоставляет теорию работы для рассматриваемого устройства или системы.

Распространенной причиной проблем является плохой дизайн , например, плохой дизайн с учетом человеческого фактора , когда устройство может быть вставлено задом наперед или вверх ногами из-за отсутствия соответствующей принудительной функции ( ограничение, формирующее поведение ), или отсутствия конструкции , устойчивой к ошибкам . Это особенно плохо, если сопровождается привыканием , когда пользователь просто не замечает неправильного использования, например, если две части имеют разные функции, но имеют общий корпус, так что при поверхностном осмотре не видно, какая часть используется.

Устранение неполадок может также принимать форму систематического контрольного списка , процедуры устранения неполадок, блок-схемы или таблицы, которая создается до возникновения проблемы. Разработка процедур устранения неполадок заранее позволяет достаточно продумать шаги, которые необходимо предпринять для устранения неполадок, и организовать устранение неполадок в наиболее эффективный процесс устранения неполадок. Таблицы устранения неполадок можно компьютеризировать, чтобы сделать их более эффективными для пользователей.

Некоторые компьютеризированные службы устранения неполадок (например, Primefax, позже переименованный в MaxServ), немедленно показывают 10 лучших решений с наибольшей вероятностью устранения основной проблемы. Технический специалист может либо ответить на дополнительные вопросы, чтобы продвинуться по процедуре устранения неполадок, каждый шаг сужая список решений, либо немедленно реализовать решение, которое, по его мнению, исправит проблему. Эти службы предоставляют скидку, если технический специалист предпринимает дополнительный шаг после решения проблемы: сообщает о решении, которое фактически исправило проблему. Компьютер использует эти отчеты для обновления своих оценок того, какие решения имеют наибольшую вероятность исправления этого конкретного набора симптомов. [9] [10]

Разделение пополам

Эффективное методичное устранение неполадок начинается с четкого понимания ожидаемого поведения системы и наблюдаемых симптомов. Отсюда специалист по устранению неполадок формирует гипотезы о потенциальных причинах и разрабатывает (или, возможно, ссылается на стандартизированный контрольный список) тесты для устранения этих предполагаемых причин. Этот подход часто называют « разделяй и властвуй ».

Две распространенные стратегии, используемые специалистами по устранению неполадок, — это проверка часто встречающихся или легко проверяемых условий (например, проверка того, что индикатор принтера горит, а его кабель надежно закреплен на обоих концах). Это часто называют «доением передней панели». [11]

Затем «разделите» систему (например, в сетевой системе печати проверьте, достигло ли задание сервера, чтобы определить, существует ли проблема в подсистемах «по направлению» к пользователю или «по направлению» к устройству).

Этот последний метод может быть особенно эффективен в системах с длинными цепочками сериализованных зависимостей или взаимодействий между его компонентами. Это просто применение бинарного поиска по всему диапазону зависимостей, и его часто называют «полуразделением». [12] Это похоже на игру « двадцать вопросов »: любой может выделить один вариант из миллиона, разделив набор альтернатив пополам 20 раз (потому что 2^10 = 1024 и 2^20 = 1 048 576).

Воспроизведение симптомов

Один из основных принципов устранения неполадок заключается в том, что воспроизводимые проблемы могут быть надежно изолированы и решены. Часто значительные усилия и акцент при устранении неполадок направляются на воспроизводимость... на поиск процедуры, которая надежно вызывает возникновение симптома.

Периодические симптомы

Некоторые из наиболее сложных проблем устранения неисправностей связаны с симптомами, которые возникают периодически . В электронике это часто является результатом компонентов, которые являются термочувствительными (поскольку сопротивление цепи изменяется в зависимости от температуры проводников в ней). Сжатый воздух может использоваться для охлаждения определенных точек на плате, а термофен может использоваться для повышения температуры; таким образом, устранение неисправностей электронных систем часто влечет за собой применение этих инструментов для воспроизведения проблемы.

В компьютерном программировании условия гонки часто приводят к периодическим симптомам, которые чрезвычайно трудно воспроизвести; можно использовать различные методы, чтобы заставить определенную функцию или модуль вызываться быстрее, чем это было бы при нормальной работе (аналогично «нагреву» компонента в аппаратной схеме), в то время как другие методы можно использовать для введения больших задержек или принудительной синхронизации между другими модулями или взаимодействующими процессами.

Периодические проблемы можно определить следующим образом:

Перемежающаяся проблема — это проблема, для которой не существует известной процедуры, позволяющей последовательно воспроизводить ее симптом.

—  Стивен Литт, [13]

В частности, он утверждает, что существует различие между частотой возникновения и «известной процедурой последовательного воспроизведения» проблемы. Например, знание того, что непостоянная проблема возникает «в течение» часа после определенного стимула или события... но что иногда это происходит через пять минут, а иногда это занимает почти час... не является «известной процедурой», даже если стимул действительно увеличивает частоту наблюдаемых проявлений симптома.

Тем не менее, иногда специалисты по устранению неполадок должны прибегать к статистическим методам... и могут найти только процедуры, которые увеличивают частоту возникновения симптома до точки, в которой становится возможной серийная замена или какая-либо другая методика. В таких случаях, даже когда симптом, кажется, исчезает на значительно более длительные периоды, существует низкая уверенность в том, что найдена первопричина и что проблема действительно решена.

Кроме того, могут проводиться испытания для проверки определенных компонентов на прочность с целью определения их неисправности. [14]

Множественные проблемы

Выделение неисправностей отдельных компонентов, вызывающих воспроизводимые симптомы, сравнительно просто.

Однако многие проблемы возникают только в результате множественных отказов или ошибок. Это особенно касается отказоустойчивых систем или систем со встроенной избыточностью. Функции, которые добавляют избыточность, обнаружение отказов и отказоустойчивость в систему, также могут быть подвержены отказам, и достаточное количество отказов различных компонентов в любой системе «выведет ее из строя».

Даже в простых системах специалист по устранению неполадок всегда должен учитывать возможность наличия более одной неисправности. (Замена каждого компонента с использованием последовательной замены и последующая замена каждого нового компонента на старый, если обнаруживается, что симптом сохраняется, может не решить такие случаи. Что еще важнее, замена любого компонента на неисправный может фактически увеличить количество проблем, а не устранить их).

Обратите внимание, что, хотя мы говорим о «замене компонентов», решение многих проблем подразумевает корректировку или настройку, а не «замену». Например, периодические разрывы в проводниках — или «грязные или ослабленные контакты» могут просто нуждаться в очистке и/или подтяжке. Все обсуждения «замены» следует понимать как «замену или корректировку или иную модификацию».

Смотрите также

Ссылки

  1. ^ Венкатасубраманиан, Венкат, Рагхунатхан Ренгасвами и Сурья Н. Кавури. «Обзор обнаружения и диагностики неисправностей процесса: Часть II: Качественные модели и стратегии поиска». Компьютеры и химическая инженерия 27.3 (2003): 313-326.
  2. ^ Расмуссен, Йенс. Обработка информации и взаимодействие человека и машины. Подход к когнитивной инженерии. Северная Голландия, 1987.
  3. ^ Лесголд, Алан и Сюзанна Лажуа. «Решение сложных проблем в электронике». Решение сложных проблем: Принципы и механизмы (1991): 287-316.
  4. ^ Гилхули, Кеннет Дж. «Когнитивная психология и медицинская диагностика». Прикладная когнитивная психология 4.4 (1990): 261-272.
  5. ^ Словарь американского наследия.
  6. ^ Дэвис, Рэндалл. «Рассуждения на основе первых принципов в электронном поиске и устранении неисправностей». Международный журнал исследований человека и машины 19.5 (1983): 403-423.
  7. ^ Милн, Роберт. «Стратегии диагностики». Труды IEEE по системам, человеку и кибернетике 17.3 (1987): 333-339.
  8. ^ Хок, Жан-Мишель. «Метод описания диагностических стратегий человека в отношении проектирования взаимодействия человека и машины». Международный журнал когнитивной эргономики 4.4 (2000): 297-309.
  9. ^ "Устранение неполадок на кончиках пальцев" Нильса Конрада Перссона. Журнал "Electronics Servicing and Technology", июнь 1982 г.
  10. ^ «Вопросы диагностики неисправностей динамических систем» Рона Дж. Паттона, Пола М. Фрэнка, Роберта Н. Кларка.
  11. ^ "Hewlett Packard Bench Briefs" (PDF) . Hewlett Packard . Получено 14 октября 2011 г. .
  12. ^ Салливан, Майк (15 ноября 2000 г.). «Секреты супергика: используйте деление пополам для решения сложных проблем». TechRepublic . Архивировано из оригинала 8 июля 2012 г. Получено 22 октября 2010 г.
  13. ^ "Декабрь 98 Журнал профессионального устранения неполадок: Перебои". www.troubleshooters.com . Получено 14 октября 2020 г. .
  14. ^ "Как устранить неполадки компьютера – joyojc.com". www.joyojc.com . Архивировано из оригинала 2013-02-24 . Получено 9 апреля 2018 .