stringtranslate.com

Надежность

В системной инженерии надежность является мерой доступности , надежности , ремонтопригодности системы , а в некоторых случаях и других характеристик, таких как долговечность , безопасность и защищенность . [1] В вычислениях в реальном времени надежность является способностью предоставлять услуги, которым можно доверять в течение определенного периода времени. [2] Гарантии обслуживания должны сохраняться даже тогда, когда система подвергается атакам или естественным сбоям.

Международная электротехническая комиссия (МЭК) через свой Технический комитет TC 56 разрабатывает и поддерживает международные стандарты, которые предоставляют систематические методы и инструменты для оценки надежности и управления оборудованием, услугами и системами на протяжении их жизненного цикла. Рабочая группа IFIP 10.4 [3] по «Надежным вычислениям и отказоустойчивости» играет роль в синтезе прогресса технического сообщества в этой области и организует два семинара каждый год для распространения результатов.

Надежность можно разбить на три элемента:

История

Некоторые источники утверждают, что это слово было придумано в девятнадцатых годах в автомобильной печатной рекламе Dodge Brothers. Но слово появилось еще до этого периода, и Оксфордский словарь английского языка впервые упоминает его в 1901 году.

По мере того, как в 1960-х и 1970-х годах возрос интерес к отказоустойчивости и надежности систем, надежность стала мерой [x], поскольку меры надежности стали охватывать дополнительные меры, такие как безопасность и целостность. [4] В начале 1980-х годов Жан-Клод Лапри выбрал надежность в качестве термина для охвата исследований отказоустойчивости и надежности систем без расширения смысла, присущего надежности . [5]

Сфера надежности развилась из этих начинаний в активное международное направление исследований, получившее развитие благодаря ряду известных международных конференций, в частности, Международной конференции по надежным системам и сетям , Международному симпозиуму по надежным распределенным системам и Международному симпозиуму по проектированию надежности программного обеспечения .

Традиционно надежность системы включает в себя доступность , безотказность и ремонтопригодность , но с 1980-х годов к показателям надежности были добавлены безопасность и защищенность . [6]

Элементы надежности

Атрибуты

Таксономия, показывающая связь между надежностью и безопасностью и атрибутами, угрозами и средствами (по Лапри и др.)

Атрибуты — это качества системы. Их можно оценить, чтобы определить ее общую надежность с помощью качественных или количественных мер. Авизиенис и др. определяют следующие атрибуты надежности:

Как следует из этих определений, только Доступность и Надежность поддаются количественной оценке прямыми измерениями, тогда как другие более субъективны. Например, Безопасность не может быть измерена напрямую с помощью метрик, но является субъективной оценкой, которая требует применения оценочной информации для обеспечения уровня уверенности, в то время как Надежность может быть измерена как отказы с течением времени.

Конфиденциальность , т. е. отсутствие несанкционированного раскрытия информации , также используется при рассмотрении безопасности. Безопасность является составным элементом Конфиденциальности , Целостности и Доступности . Безопасность иногда классифицируется как атрибут [7], но в настоящее время принято объединять его с надежностью и рассматривать Надежность как составной термин, называемый Надежностью и Безопасностью. [2]

На практике применение мер безопасности к устройствам системы обычно повышает надежность за счет ограничения количества внешних ошибок.

Угрозы

Угрозы — это то, что может повлиять на систему и вызвать падение Надежности. Есть три основных термина, которые необходимо четко понимать:

Важно отметить, что сбои регистрируются на границе системы. В основном это ошибки, которые распространились на границу системы и стали наблюдаемыми. Сбои, ошибки и сбои действуют в соответствии с механизмом. Этот механизм иногда называют цепочкой сбой-ошибка-сбой. [8] Как правило, сбой при активации может привести к ошибке (которая является недопустимым состоянием), а недопустимое состояние, сгенерированное ошибкой, может привести к другой ошибке или сбою (которая является наблюдаемым отклонением от указанного поведения на границе системы). [9]

После активации сбоя создается ошибка. Ошибка может действовать так же, как сбой, в том смысле, что она может создавать дополнительные условия возникновения ошибки, поэтому ошибка может распространяться несколько раз в пределах границ системы, не вызывая наблюдаемого сбоя. Если ошибка распространяется за пределы границ системы, говорят, что произошел сбой. Сбой — это, по сути, точка, в которой можно сказать, что служба не соответствует своей спецификации. Поскольку выходные данные из одной службы могут быть переданы в другую, сбой в одной службе может распространиться в другую службу как сбой, поэтому можно сформировать цепочку в форме: сбой, ведущий к ошибке, ведущей к сбою, ведущему к ошибке и т. д.

Означает

Поскольку механизм Fault-Error-Chain понятен, можно сконструировать средства для разрыва этих цепочек и тем самым повысить надежность системы. На данный момент выявлено четыре средства:

  1. Профилактика
  2. Удаление
  3. Прогнозирование
  4. толерантность

Предотвращение сбоев связано с предотвращением появления сбоев в системе. Это может быть достигнуто путем использования методологий разработки и хороших методов внедрения.

Устранение неисправностей можно разделить на две подкатегории: Устранение во время разработки и Устранение во время использования.
Устранение во время разработки требует проверки, чтобы неисправности можно было обнаружить и устранить до того, как система будет запущена в производство. После того, как системы были запущены в производство, необходима система для регистрации сбоев и их устранения с помощью цикла обслуживания.

Прогнозирование неисправностей позволяет предсказать вероятные неисправности, чтобы их можно было устранить или обойти их последствия. [10] [11]

Отказоустойчивость связана с внедрением механизмов, которые позволят системе продолжать предоставлять требуемые услуги при наличии неисправностей, хотя качество этих услуг может быть снижено.

Средства обеспечения надежности призваны сократить количество сбоев, которые становятся заметны конечным пользователям системы.

Упорство

В зависимости от того, как проявляются или сохраняются неисправности, их классифицируют следующим образом:

Надежность информационных систем и живучесть

В некоторых работах по надежности [12] используются структурированные информационные системы , например, с SOA , для введения атрибута живучести , тем самым принимая во внимание ухудшенные сервисы, которые информационная система поддерживает или возобновляет после немаскируемого сбоя.

Гибкость существующих фреймворков побуждает системных архитекторов включать механизмы реконфигурации, которые перенаправляют доступные безопасные ресурсы на поддержку наиболее важных сервисов, а не выделять избыточные ресурсы для создания отказоустойчивой системы.

С распространением сетевых информационных систем была введена доступность , придающая большее значение опыту пользователей.

Чтобы учесть уровень производительности, измерение производительности определяется как «количественная оценка того, насколько хорошо работает объектная система при наличии неисправностей в течение определенного периода времени» [13] .

Смотрите также

Дальнейшее чтение

Статьи

Конференции

Больше конференций региональной направленности:

Журналы

Книги

Научно-исследовательские проекты

Ссылки

  1. ^ IEC, Electropedia del 192 Dependability , http://www.electropedia.org, выберите 192 Dependability, см. 192-01-22 Dependability.
  2. ^ ab A. Avizienis, J.-C. Laprie, Brian Randell и C. Landwehr, «Основные концепции и таксономия надежных и безопасных вычислений», IEEE Transactions on Dependable and Secure Computing, т. 1, стр. 11–33, 2004.
  3. ^ "Надежные системы и сети". www.dependability.org . Получено 2021-06-08 .
  4. ^ Брайан Рэнделл , «Надежность программного обеспечения: личный взгляд», в Трудах 25-го Международного симпозиума по отказоустойчивым вычислениям (FTCS-25), Калифорния, США, стр. 35-41, июнь 1995 г.
  5. ^ JC Laprie. «Надежные вычисления и отказоустойчивость: концепции и терминология», в Трудах 15-го Международного симпозиума IEEE по отказоустойчивым вычислениям, 1985 г.
  6. ^ А. Авизиенис, Ж.-К. Лапри и Брайан Рэнделл : Фундаментальные концепции надежности . Исследовательский отчет № 1145, Лидфорд, доктор наук, CNRS , апрель 2001 г.
  7. ^ И. Соммервилл, Программная инженерия: Addison-Wesley, 2004.
  8. ^ А. Авизиенис, В. Магнус У., Дж. К. Лапри и Брайан Рэнделл , «Фундаментальные концепции надежности», представленные на ISW-2000, Кембридж, Массачусетс, 2000.
  9. ^ Моради, Мехрдад; Ван Акер, Берт; Ванхерпен, Кен; Денил, Иоахим (2019). Чемберлен, Роджер; Таха, Валид; Тёрнгрен, Мартин (ред.). «Реализованная на основе модели гибридная инъекция неисправностей для Simulink (демонстрации инструментов)». Киберфизические системы. Проектирование на основе моделей . Конспект лекций по информатике. 11615. Cham: Springer International Publishing: 71–90. doi :10.1007/978-3-030-23703-5_4. ISBN 978-3-030-23703-5. S2CID  195769468.
  10. ^ «Оптимизация внесения неисправностей в совместное моделирование FMI посредством разбиения чувствительности | Труды Летней конференции по моделированию 2019 года». dl.acm.org . Получено 15.06.2020 .
  11. ^ Моради, Мехрдад, Бентли Джеймс Оукс, Мустафа Сараоглу, Андрей Морозов, Клаус Яншек и Йоахим Денил. «Исследование пространства параметров неисправностей с использованием инъекции неисправностей на основе обучения с подкреплением». (2020).
  12. ^ Джон К. Найт, Элизабет А. Странк, Кевин Дж. Салливан: На ​​пути к строгому определению живучести информационной системы. Архивировано 29 октября 2006 г. на Wayback Machine.
  13. ^ Джон Ф. Мейер, Уильям Х. Сандерс Спецификация и построение моделей производительности
  14. ^ "DSN 2022". dsn2022.github.io . Получено 2021-08-01 .
  15. ^ "SRDS-2021". srds-conference.org . Получено 2021-08-01 .