Надежность устройств и схем химических процессов (Семестр 8)

Время выполнения – Продолжительность или диапазон эксплуатации объекта.

Что такое надежность оборудования

1 Основные понятия теории надежности

1.1 Значение, методы и основные понятия теории надежности

Надежность является одним из определяющих факторов качества машиностроения, электроники, радиотехники и других объектов. Надежность определяется как свойство объекта выполнять заданные функции, сохраняя во времени значения заданных показателей эффективности в установленных пределах, соответствующих заданным режимам и условиям использования, технического применения, технического обслуживания, ремонта, хранения и транспортирования. Надежность – это комплексное свойство, которое в зависимости от назначения объекта и условий его эксплуатации может включать надежность, работоспособность и ремонтопригодность по отдельности или некоторую комбинацию этих свойств как для объекта, так и для его частей.

Обычно говорят, что теория надежности – это обратная связь от пользователя-оператора оборудования к его разработчику. Считается, что на этапе проектирования и строительства объекта проектировщик должен определить или предусмотреть соответствующие показатели надежности; на этапе изготовления оборудования инженерная служба должна обеспечить заданную в проекте надежность; на этапе эксплуатации надежность должна поддерживаться путем проведения соответствующих работ по техническому обслуживанию и ремонту. Очевидно, что услуги по обеспечению надежности на этих трех этапах тесно связаны между собой.

Многолетний опыт промышленной эксплуатации различного оборудования показал [1, 2], что существует четкая зависимость между уровнем показателя надежности и стоимостью производства данного объекта. По оси абсцисс – уровень качества продукции, по оси ординат – величина, пропорциональная уровню затрат на производство продукции. Кривая А показывает качественное снижение затрат на эксплуатацию изделия (в основном ремонт), когда изделие изготовлено с более высоким уровнем надежности. Кривая B показывает, что затраты на производство более надежного продукта требуют увеличения расходов. Кривая C соответствует сумме капитальных и эксплуатационных затрат. Кривая показывает, что существует оптимальная надежность X0 , которая соответствует минимальной стоимости. Поэтому не всегда нужно стремиться к продукту с самой высокой надежностью. Достижение наивысшей эффективности продукта соответствует условию минимизации общей стоимости.

Рисунок 1: Взаимосвязь между индексом надежности и затратами

Рассмотрим тенденцию изменения затрат на обслуживание основного оборудования с течением времени (рис. 2). В системе координат временных затрат кривая E – возрастающие затраты на содержание объекта; кривая D – убывающая амортизация как функция времени. Общая стоимость представлена кривой F. Эта кривая иллюстрирует существование минимальной общей стоимости, которая соответствует некоторому оптимальному времени T0. Это демонстрирует важные свойства функционирующих объектов – существование оптимального уровня надежности и существование оптимального срока службы. Эти два аспекта изучаются в теории надежности.

Рис. 2 Изменчивость затрат в процессе эксплуатации продукта

Рассмотрим тенденцию изменения стоимости обслуживания основного оборудования во времени (рис.2). В системе координат затрат времени кривая E показывает увеличение затрат на ремонт объекта; кривая D показывает уменьшение амортизации как функцию времени. Общая стоимость представлена кривой F. Эта кривая иллюстрирует существование минимума общей стоимости, который соответствует определенному оптимальному времени T0. Это демонстрирует важные свойства функционирующих объектов – существование оптимального уровня надежности и существование оптимального срока службы. Эти два аспекта изучаются теорией надежности.

В рамках теории надежности разрабатываются методы оценки надежности изделий и ее количественных характеристик, служба надежности собирает и анализирует эксплуатационную информацию, разрабатывает и проводит возможные виды испытаний изделий на надежность, разрабатывает конструктивные пути улучшения показателей надежности, методы расчета и прогнозирования надежности, методы рациональной эксплуатации и ремонта изделий, разрабатывает организационные, экономические проблемы надежности, влияние субъективных характеристик оператора и окружающей среды на надежность

Рассмотрим некоторые основные понятия, используемые в теории надежности.

Надежность – это свойство объекта, позволяющее ему сохранять работоспособность в течение определенного времени и наработки.

Долголетие – Свойство объекта сохранять способность работать до предельного состояния при фиксированном режиме технического обслуживания и ремонта.

Ремонтопригодность – свойство объекта быть способным предотвращать и обнаруживать причины отказов и повреждений и устранять их путем ремонта и технического обслуживания.

Ремонтопригодность – Свойство объекта постоянно сохранять свое функциональное и работоспособное состояние во время и после хранения и транспортировки.

Исправное состояние – состояние изделия, когда оно соответствует всем требованиям, указанным в технической документации.

Граничное условие – состояние изделия, при котором дальнейшая эксплуатация должна быть прекращена либо из-за неустранимой ошибки безопасности, либо из-за неустранимой потери заданных характеристик за установленные пределы, либо из-за неустранимого падения характеристик ниже приемлемого уровня, либо из-за необходимости ремонта.

Урон – Нарушение состояния объекта, вызванное внешними воздействиями, выходящими за допустимые пределы.

Отказ – Событие, приводящее к нарушению функционирования объекта.

Ремонтопригодный (неремонтопригодный) объект – Способность работать и управлять объектом, который нельзя (невозможно) отремонтировать в случае поломки или повреждения.

Индекс надежности – Количественная характеристика одной или нескольких характеристик надежности объекта.

Пожизненный – это количественная характеристика одной или нескольких характеристик, составляющих надежность объекта.

Пожизненный – Календарное время работы объекта от момента его создания (или возобновления после ремонта) до предельного состояния.

Следует отметить, что понятие “работоспособность” шире, чем понятие “удобство использования”. Исправный предмет может быть неисправным. Кроме того, “работоспособность” может быть измерена в единицах времени, длины, площади и т.д. Различают “ежедневное время работы”, “ежемесячное время работы”, “время работы до первого отказа”, “время работы между отказами”. (наработка до отказа), “целевая наработка” и т.д. В теории надежности под объектом понимаются как целые системы, так и их компоненты.

Степень возможности последующее использование продукт:

Классификация отказов

Согласно ГОСТ 27.002-83, отказы делятся на восемь типов:

  1. Внезапный отказ характеризуется внезапным изменением одного или нескольких параметров объекта.
  2. Постепенный отказ характеризуется постепенным изменением значения одного или нескольких параметров объекта, т.е. регулярным изменением параметра в течение времени, предшествующего отказу (отказы с износом).
  3. Независимая неудача объекта не вызвана отказом другого объекта.
  4. Зависимые сбои Вызывается отказом другого объекта.
  5. Периодические сбои – Многочисленные самовосстанавливающиеся отказы объекта одной и той же природы.
  6. Структурное разрушение является результатом неадекватности или нарушения принципов и стандартов проектирования.
  7. Производственный сбой возникает в результате несовершенства или нарушения установленного процесса производства изделия, осуществляемого на машиностроительном предприятии.
  8. Операционная ошибка Возникает в результате нарушения установленных правил или условий эксплуатации объекта.

ГОСТ 24.010.05-78 дополнительно регламентирует наличие внешние проявления:

  • очевидный (явный) провал;
  • неявный провал.

Степень доступности последующее использование продукт:

  • провал;
  • частичный отказ;
  • систематическая неудача;
  • полный провал.

Время возникновения Время отказа:

  • Во время тестирования;
  • В период обкатки;
  • Во время нормальной работы;
  • В течение последнего периода эксплуатации.

Рабочее состояние определяется как выполнение всех заданных функций процесса в пределах заданных параметров.

Нерабочее состояние Состояние неисправности возникает, когда одна из установленных функций не выполняется или когда параметры процесса выходят за установленные пределы.

Функциональное состояние характеризуется соответствием объекта всем требованиям, указанным в технической документации.

Если объект не соответствует хотя бы одному требованию нормативно-технической документации, то это состояние определяется как дефектный.

Кроме того, для электромеханических систем действуют следующие правила правильная работа – способность объекта в текущий момент времени выполнять заданные алгоритмы работы со значениями параметров, соответствующими установленным требованиям.

  • ущерб – нарушение функционального состояния во время работы при сохранении рабочего состояния;
  • отказ – дефект в производственном или операционном алгоритме;
  • дефект – дефект в качестве изготовления или сборки элементов объекта.

Если объект переходит в поврежденное, но исправное состояние, это событие называется ущербесли объект становится неработоспособным -. отказ.

Предельное состояние – состояние объекта, когда его дальнейшее использование по назначению или восстановление до исправного состояния невозможно или нецелесообразно, или когда восстановление до исправного или работоспособного состояния невозможно или нецелесообразно.

Все объекты подразделяются на ремонтируемые и неремонтируемые:

  • ремонтируемый объект – изделие, которое может быть отремонтировано в соответствии с нормативно-технической и конструкторской документацией;
  • неремонтопригодный предмет – объект, который не подлежит восстановлению и для которого ремонт невозможен.

Восстанавливаемые объекты можно разделить на восстанавливаемые и невосстанавливаемые:

  • Ремонтопригодный объект – Объект, для которого в данной ситуации восстановление работоспособности предусмотрено технической документацией;
  • инструмент, не подлежащий возмещению – инструмент, который, как ожидается, не будет восстановлен в рабочем состоянии в данной ситуации.

Отказоустойчивость рассчитывается в терминах времени или часов работы. Продолжительность – Продолжительность или диапазон работы объекта. Она выражается в рабочем времени или единицах объема работы, выполненной за определенный период времени (ч, дни, циклы погрузки, тонна).

Для количественной оценки времени работы металлургического оборудования используются следующие показатели:

  1. MTBFСреднее среднее время между отказами, Т – математическое ожидание наработки объекта от начала его эксплуатации до начала отказа.
  2. Вероятность безотказной работыP(t) – это вероятность того, что объект не выйдет из строя в момент времени t, т.е. наработка на отказ объекта будет больше t (вероятность события T > t).
  3. Вероятность неудачиQ(t) – это вероятность того, что отказ произойдет в момент времени t, т.е. время работы T объекта до момента возникновения отказа принимает значение меньше t (вероятность события T < t).
  4. Уровень отказов, λ(t) – вероятность того, что объект выйдет из строя в данный момент времени, предполагая, что до этого момента времени отказ не произошел.

Долголетие – это свойство объекта поддерживать работоспособное состояние до достижения предельного состояния при установленном режиме технического обслуживания и ремонта. Основным показателем продолжительности жизни является технический срок службы – это время, необходимое для работы объекта от начала эксплуатации или ремонта до предельного состояния, которое выражается в общей наработке или сроке службы. Для количественной оценки срока службы используются следующие показатели:

  1. Средний срок службы, Tp – это среднее время работы объекта от начала срока службы или ремонта до предельного состояния. Различают полный срок полезного использования, срок полезного использования и оставшийся срок полезного использования.
  2. Средний срок полезного использования, Tsl – это календарный срок службы объекта при его использовании в течение одного и того же периода времени.

Ремонтопригодность – это свойство объекта быть способным предотвращать и обнаруживать причины отказов, повреждений и быть способным восстанавливать их путем технического обслуживания и ремонта. Простота обслуживания оценивается следующими показателями:

  1. Среднее время восстановления работоспособностиτ – среднее время восстановления работоспособности объекта.
  2. Вероятность восстановленияP(τ) – это вероятность того, что время восстановления не превысит заданного τ.
  3. Интенсивность восстановленияμ(τ) – это вероятность возврата объекта в течение времени τ при условии, что объект не был возвращен к этому времени.

Комплексные показатели включают коэффициент доступности, Кг – это вероятность того, что объект будет находиться в работоспособном состоянии в любое время, кроме плановых периодов, когда использование объекта не ожидается. Для анализируемого интервала времени коэффициент готовности можно рассчитать по формуле:

Фактор доступности

где ti – среднее время между отказами; τi – время восстановления; n – количество неудач.

  • проверяемость;
  • наличие;
  • легко снимается;
  • возможность загрузки;
  • взаимозаменяемость;
  • модульность;
  • Степень унификации;
  • Количество точек смазки.

Ремонтопригодность – Свойства объекта, позволяющие ему оставаться надежным, прочным и работоспособным во время или после хранения или транспортировки.

Классическая природа вариации надежности любого изделия может быть представлена в терминах потока отказов, где используются законы:

  • экспоненциальный;
  • нормальный;
  • Распределение Вейбулла.

Известны примеры применения теории вероятности и математической статистики для оценки надежности металлургического оборудования [1]. В то же время статистика отказов дает представление об уровне надежности при длительной задержке. Сбор информации о неудачах занимает много времени. Отсутствие анализа и причин отказов, большинство из которых не связано со свойствами машины, вызывает сомнения в достоверности таких оценок и не дает возможности прогнозировать надежность.

А.И. Целиков писал [1], что индивидуальный характер производства металлургических машин, их чрезвычайно высокая стоимость, износ металла и специфические условия работы, сравнительно большой интервал между опытными образцами машин – все это делает невозможным применение к количественным расчетам методов теории надежности, основанных на законах больших чисел. Надежность прокатных станов нельзя повысить с помощью тех же методов, которые используются, например, в автомобильной промышленности. Статистика отказов не является ключом к надежности металлургического оборудования, но она оказывает целенаправленное влияние на производительность компонентов.

Примечание. Классификация отказов по критичности (например, по уровню прямых и косвенных потерь, связанных с возникновением отказа, или по сложности процесса восстановления) определяется в технической и/или проектной документации по согласованию с заказчиком на основе технических, экономических соображений и соображений безопасности.

Что такое надежность оборудования

ТЕХНИЧЕСКАЯ НАДЕЖНОСТЬ

Термины и определения

Надежность промышленных изделий. Общие условия.
Термины и определения

Дата поступления 1990-07-01

1. разработан и внесен Институтом машиноведения Академии наук СССР, Межпрофессиональным научно-техническим комплексом “Надежность машин” и Государственным комитетом СССР по управлению качеством продукции и стандартам

2. УТВЕРЖДЕН и введен в действие Постановлением Государственного комитета СССР по стандартизации от 15.11.89 N 3375

3. УЧИТЫВАЕТСЯ ВПЕРВЫЕ

4. ССЫЛАЕТСЯ НА НОРМАТИВНЫЕ И ТЕХНИЧЕСКИЕ ДОКУМЕНТЫ

Спецификация упомянутых спецификаций

Введение, 5.1, 5.3

Настоящий стандарт устанавливает основные понятия, термины и определения понятий в области надежности.

Настоящий стандарт распространяется на технические объекты (далее – объекты).

Термины, установленные настоящим стандартом, обязательны для применения во всей документации и литературе, входящей в область стандартизации или использующей результаты этой деятельности.

Настоящий стандарт следует применять совместно с ГОСТ 18322.

(1) Стандартизированные термины с определениями приведены в таблице 1.

(2) Для каждого понятия существует один стандартный термин.

Использование синонимов стандартизированного термина не допускается.

2.1 Для отдельных терминов, стандартизованных в таблице 1, существуют сокращенные формы ссылок, которые приняты к использованию, если невозможно противоположное толкование.

2.2 Приведенные определения могут быть при необходимости дополнены путем введения производных признаков, раскрытия значения используемых терминов, указания объектов, входящих в объем определяемого термина. Поправки не должны влиять на объем и содержание терминов, определенных в настоящем стандарте. 2.3.

2.3 В случаях, когда термин содержит все необходимые и достаточные признаки понятия, определение не дается, а в графе “Определение” ставится прочерк.

2.4 Эквивалентные стандартизированные термины на английском языке приведены в таблице 1.

Алфавитные указатели терминов на русском языке и их английских эквивалентов, содержащихся в стандарте, приведены в таблицах 2-3.

4. Стандартизированные термины напечатаны жирным шрифтом, а их сокращенные формы – светлым шрифтом.

(5) Приложение содержит пояснения к терминам, определенным в настоящем стандарте.

1. ОБЩИЕ ПОЛОЖЕНИЯ

1.1. Надежность
Надежность, безотказность

Свойство объекта сохранять во времени в заданных пределах значения всех параметров, характеризующих его способность выполнять требуемые функции при заданных методах и условиях использования, обслуживания, хранения и транспортировки.

Примечание. Надежность – это комплексное свойство, которое в зависимости от назначения объекта и условий его эксплуатации может включать надежность, долговечность, ремонтопригодность и работоспособность или некоторую комбинацию этих свойств.

1.2. Отказоустойчивость
Надежность, безотказная работа

Свойство объекта непрерывно поддерживать работу в течение определенного периода или времени эксплуатации.

1.3. Долголетие
Прочность, долговечность

Свойство объекта сохранять работоспособность до предельного состояния при определенном режиме технического обслуживания и ремонта.

1.4. Ремонтопригодность Ремонтопригодность

Свойство объекта быть способным поддерживать и восстанавливать работоспособное состояние посредством технического обслуживания и ремонта

1.5. Ремонтопригодность
Ремонтопригодность

Свойство объекта сохранять в определенных пределах значения параметров, характеризующих его способность выполнять требуемую функцию, во время и после хранения и/или транспортировки

2 СТАТУС

2.1. Исправное состояние
Исправное состояние
Хорошее состояние

Состояние объекта, при котором он соответствует всем требованиям технической и/или проектной документации.

2.2. Дефектное состояние Отказ
Ошибка, состояние отказа

Состояние объекта, при котором он не удовлетворяет одному или нескольким требованиям технической и/или проектной документации

2.3. Дефектное состояние Полностью функциональна
Исходное состояние

Состояние объекта, при котором значения всех параметров, характеризующих способность выполнять определенные функции, соответствуют требованиям технической и (или) конструкторской (проектной) документации.

2.4. Нерабочее состояние
Безработица
Штат сократился

Состояние объекта, при котором значение хотя бы одного параметра, характеризующего способность выполнять определенные функции, не соответствует требованиям технической и (или) конструкторской (проектной) документации.

Внимание. Для сложных объектов можно разделить их нерабочие состояния. Из множества нефункциональных состояний существуют частично нефункциональные состояния, в которых объект может частично выполнять требуемые функции

2.5. Ограничительное государство Ограничительное государство

Состояние объекта, когда его дальнейшая эксплуатация неприемлема или нецелесообразна, или когда невозможно или нецелесообразно вернуть его в работоспособное состояние.

2.6. Критерий предельного состояния
Критерий предельного состояния

Атрибут или сочетание атрибутов граничного состояния объекта, определенное в нормативной, технической и/или проектной документации.

Примечание. В зависимости от условий эксплуатации для одного и того же объекта могут быть установлены два или более критериев предельного состояния.

3. ДЕФЕКТЫ, ПОВРЕЖДЕНИЯ, СБОИ

3.1. Дефект
Дефект

3.2. Дефекты
Дефекты

Событие, которое нарушает работоспособность объекта, сохраняя его в хорошем состоянии

3.3. Отказ
Отказ

Событие, связанное с нарушением рабочего состояния объекта.

3.4. Критерий отказа
Критерий отказа

Признак или совокупность признаков отказа объекта, указанные в технической и (или) проектной (конструкторской) документации

3.5. Причина отказа
Причина отказа

Явления, процессы, события и состояния, которые привели к отказу объекта.

3.6. Влияние неудачи
Влияние неудачи

Явления, процессы, события и состояния, вызванные возникновением отказа

3.7. Критичность отказа
Критичность отказа

Набор характеристик, описывающих последствия отказа.

Внимание. Классификация отказов по критичности (например, по уровню прямых и косвенных потерь, связанных с возникновением отказа, или по трудоемкости восстановления после отказа) устанавливается в нормативно-технической и/или проектной документации, согласованной с заказчиком на основе технико-экономических соображений и соображений безопасности.

3.8. Отказ ресурса
Маргинальная неудача

Сбой, в результате которого объект достигает предельного состояния

3.9. Независимая неудача
Первичный отказ

Отказ, не вызванный другими отказами

3.10. Зависимый отказ
Вторичный отказ

Отказ, вызванный другими отказами

3.11. Внезапный отказ
Внезапный отказ

Отказ, характеризующийся внезапным изменением одного или нескольких параметров объекта

3.12. Постепенный отказ
Постепенный отказ

Отказ, вызванный постепенным изменением значений одного или нескольких параметров объекта

3.13. Отказ
Разбивка

Самоустраняющийся отказ или однократный отказ с незначительным вмешательством оператора

3.14. Прерывистый отказ
Прерывистый отказ

Повторяющиеся самокорректирующиеся сбои одного и того же характера

3.15. Очевидная неудача
Очевидный дефект

неисправность, обнаруженная визуально или с помощью методов и средств обычного осмотра и диагностики во время подготовки или предполагаемого использования объекта

3.16. Скрытая неудача
Скрытая неудача

Дефект, не обнаруживаемый визуально или обычными методами и средствами осмотра и диагностики, но обнаруживаемый при техническом обслуживании или специальными методами диагностики

3.17. Ошибка проектирования
Неисправность конструкции

Отказ, происходящий из-за неадекватной или дефектной конструкции и/или принципов проектирования

3.18. Производственная недостаточность
Производственный дефект

Повреждение, вызванное ошибкой или несоблюдением установленного производственного или ремонтного процесса на ремонтном предприятии.

3.19. Эксплуатационная неисправность
Неисправность, вызванная неправильным использованием, неправильной эксплуатацией

Ущерб, вызванный несоблюдением установленных правил и/или условий эксплуатации

3.20. Ущерб, вызванный деградацией
Повреждения, вызванные износом, старением

Повреждения, вызванные естественным старением, износом, коррозией и усталостными процессами, при условии соблюдения всех установленных правил и/или стандартов проектирования, производства и использования

4. ПОНЯТИЕ ВРЕМЕНИ

4.1. Время работы
Время работы

Продолжительность или объем эксплуатации объекта.

Примечание. Время работы может быть непрерывной величиной (количество часов, пройденных километров и т.д.) или целочисленной величиной (количество рабочих циклов, запусков и т.д.).

4.2. MTBF
Наработка на отказ

Время работы объекта с момента начала эксплуатации до возникновения первого отказа.

4.3. Время работы между отказами
Время работы между отказами

Время работы между отказами до возникновения следующего отказа.

Теперь рассмотрим, что произойдет, если резервным будет не датчик, а клапан (рис. 13). Каковы равные вероятности?

Функциональная безопасность, часть 6 из 7. Оценка показателей функциональной безопасности и надежности

Продолжая серию публикаций о функциональной безопасности, в сегодняшней статье мы рассмотрим способы количественной оценки функциональной безопасности на основе статистики случайных отказов оборудования. Для этого используется математический аппарат теории надежности, которая, как вы знаете, является одним из приложений теории вероятностей. Поэтому мы будем периодически обращаться к теоремам, известным из теории надежности.

Мы рассмотрим следующие вопросы:

– Взаимосвязь между атрибутами надежности, информационной безопасностью и функциональной безопасностью;
– Переход от анализа рисков к измерению показателей функциональной безопасности;
– примеры расчета показателей надежности и функциональной безопасности.

Атрибуты надежности, информационной безопасности и функциональной безопасности

Чтобы лучше понять, какие атрибуты мы будем оценивать, давайте рассмотрим структуру и взаимосвязи атрибутов надежности, ИБ и ФБ.

Начнем с определения надежности. Надежность – это свойство объекта сохранять во времени в установленных пределах значения всех параметров, характеризующих способность выполнять требуемые функции при заданных режимах и условиях эксплуатации, технического обслуживания, хранения и транспортирования. Его можно представить с помощью простой диаграммы. Системе назначается срок службы и пределы параметров. Пока параметры находятся в заданных пределах, система работает, и наоборот, если параметры вышли за пределы, произошел сбой.
(Рисунок 1).

Рисунок 1: Графическая интерпретация определения надежности

О соотношении надежности и прочности следует сказать отдельно, поскольку в области стандартизации этого свойства западная и советская наука в свое время пошли несколько разными путями. Правильный перевод термина надежность – это зависимость, поскольку и надежность, и зависимость считаются комплексными свойствами. Надежность – это правильный перевод слова failsafe, которое является важным, но только одним из элементов надежности. Безотказность – это свойство объекта оставаться в исправном состоянии в течение определенного времени или периода эксплуатации, т.е. отказоустойчивость может быть обобщена на надежность только для необслуживаемых систем.

Помимо времени безотказной работы, надежность – это также простота обслуживания, долговечность и возможность хранения. Доступность – это сочетание надежности и простоты обслуживания.

Все эти положения изложены в одном из лучших стандартов, который я когда-либо держал в руках, – ГОСТ 27.002-89 “Надежность в машиностроении. Основные понятия. Термины и определения”. К сожалению, “повальная” адаптация западных стандартов в качестве ГОСТ Р привела к тому, что достижения советской школы надежности были забыты (по крайней мере, в области формальной стандартизации). В 2009 году был опубликован ГОСТ Р 27.002-2009 (его первоначальный номер почему-то был ГОСТ Р 53480-2009, потом историческая справедливость восторжествовала), который представляет собой copy-and-paste также из довольно старого глоссария Международной электротехнической комиссии IEC 60050-191:1990. Прогресс не всегда постепенный, и качество изложения можно оценить, сравнив изложение основных понятий (рис. 2). В Украине в настоящее время действует ДСТУ 2860-94, который соответствует ГОСТ 27.002-89.

Рисунок 2: Сравнительный анализ признаков надежности в соответствии с ГОСТ 27.002
за 1989 и 2009 годы.

Мы подчеркиваем, что речь идет о случайных отказах оборудования, к которым можно применить математический аппарат теории вероятности. Теория надежности дает практическую картину мира, в которой можно строить надежные системы из не совсем надежных компонентов (как правило, методами резервирования и диагностики). Иначе обстоит дело с систематическими отказами, которые, очевидно, не могут быть описаны в рамках теории надежности. Именно эти сбои представляют собой самую большую проблему, поскольку они непредсказуемы. В 1980-х и 1990-х годах систематические сбои были самыми распространенными. были предприняты попытки использовать вероятностные модели для оценки надежности программного обеспечения, ошибок оператора, а затем и показателей ИБ. Пока что этот путь не принес практических результатов.

Другим подходом к анализу атрибутов надежности является так называемый подход RAMS, который расшифровывается как надежность, доступность, ремонтопригодность и безопасность. Иногда к этим четырем атрибутам добавляют целостность или полноту, поскольку именно так переводится это слово в русскоязычной версии МЭК 61508. Простейшие определения для этих атрибутов следующие:

– Готовность – это способность функционировать должным образом;
– Безотказность – это непрерывность правильного обслуживания;
– Ремонтопригодность – это способность к модификации и ремонту.
– Безопасность – это отсутствие катастрофических последствий для пользователя и окружающей среды;
– Целостность – это отсутствие несоответствующих модификаций системы.

Безопасность (ИБ) – это набор атрибутов конфиденциальности, интеграции и доступности (так называемая триада CIA). Готовность или доступность относится к законным действиям по доступу к информации, а интеграция относится к надлежащей обработке данных, исключающей возможность несанкционированного изменения. Конфиденциальность – это дополнительный атрибут надежности, который означает отсутствие несанкционированного разглашения информации. Таким образом, простейшая модель, описывающая надежность и безопасность, представлена всего шестью атрибутами (рис. 3).

Рисунок 3: Атрибуты RAMS и CIA

Теперь выполним еще одну итерацию и попытаемся представить все известные атрибуты на одной диаграмме (рисунок 4).

Рисунок 4: Обобщенная таксономия атрибутов надежности, информационной безопасности и функциональной безопасности

Атрибуты и ссылки, соответствующие только что рассмотренной модели из шести атрибутов, отмечены обычными линиями. Пунктирная линия добавляет дополнительные атрибуты. Одна группа атрибутов относится к компонентам надежности. FB (Safety), согласно IEC 61508, включает функции безопасности и целостность, при этом FB связан через функции безопасности с временем безотказной работы, доступностью и надежностью, а комплексное выполнение функций обеспечивает ряд атрибутов, включая IS. Таким образом, между атрибутами надежности, ИБ и ФБ существуют взаимные влияния и некоторые зависимости, которые мы рассмотрим для количественной оценки.

Анализ рисков и показатели функциональной безопасности

Теперь обратимся к показателям безопасности. Основным понятием и показателем ФВ является риск, который представляет собой сочетание вероятности нежелательного события и его последствий.

Оценка риска может быть количественной или качественной, с качественными категориями, такими как “высокий”, “средний”, “низкий” и т.д.

Если нежелательное событие и связанный с ним вред фиксированы, то риск становится численно равным вероятности P(t) того, что фиксированный вред произойдет. Например, риск аварии на атомной электростанции, приводящей к выбросу радиоактивных веществ в атмосферу, в настоящее время установлен на уровне не более 10-7 1/год.

Так называемый принцип ALARA (ALARP) (as low as reasonably applicable/practicable), подход к управлению риском, предполагающий его максимально возможное снижение, достигаемое при реально доступных (ограниченных) ресурсах, стал широко использоваться для оценки и управления рисками (рис. 5).

Рисунок 5: Снижение риска на основе ALARP (настолько низкий, насколько это разумно практически возможно), IEC 61508-5

Удобной моделью является график рисков (Рисунок 6). В качестве примера можно привести стандарт по безопасности промышленного оборудования (EN ISO 13849-1 Safety of machinery – Safety-related parts of control systems – Part 1: General principles for design). Помимо вероятности и последствий событий, рассматривается также возможность избежать опасностей и ущерба. Три категории – высокая и низкая, дают шесть комбинаций, каждая из которых соответствует уровню производительности (PL), от a до e, что аналогично уровню целостности безопасности (SIL).

Рисунок 6: Диаграмма рисков, EN ISO 13849-1

Это качественный подход к оценке риска, теперь рассмотрим, как IEC 61508 стандартизирует количественные значения показателей безопасности. Если мы рассматриваем системы управления, то события риска – это отказы функции безопасности, поэтому логично, что в качестве показателей безопасности выбираются вероятности отказа функции безопасности.

Давайте вернемся к основным понятиям теории надежности. Теория надежности – это ветвь теории вероятностей, в которой время до отказа рассматривается как случайная переменная системы.

Одним из наиболее важных показателей является вероятность отказа, т.е. вероятность того, что отказ не произойдет в течение определенного MTTF, называемого временем до отказа: P(t) = P t>. Как и все вероятности, вероятность работы в режиме отказа имеет значения от 1 до 0, с единицей в начале и нулем в моменты времени, уходящие в бесконечность.

Вероятность отказа – это вероятность того, что отказ произойдет в заданное время T, т.е. вероятность отказа дополняет вероятность отсутствия отказа до единицы (отказ либо произойдет, либо нет, т.е. мы имеем полный набор событий): F(t) = 1 – P(t).

Интенсивность отказов – это условная плотность распределения (т.е. производная по времени) наработки до отказа, при условии, что отказа не произошло, составляет 1/час:

(t) = f(t)/P(t) = – [1/P(t)] – [dP(t)/dt] = – [1/(1 – F(t)] – [dF(t /dt]. В статистической оценке интенсивность отказов определяется как отношение числа отказов одного вида продукции к интервалу времени, в течение которого эти отказы наблюдались (например, если 10 изделий отказывают за 1000 часов, то = 10/1000 = 0,01 1/час).

Важным допущением в теории надежности является использование так называемого экспоненциального распределения времени до отказа, где предполагается, что частота отказов постоянна во времени.

Среднее время наработки на отказ MTTF рассчитывается как некоторый интеграл от нуля до бесконечности для вероятности безотказной работы в течение времени:

Коэффициент MTTF иногда интерпретируется как среднее или гарантированное время безотказной работы системы, но это не так, поскольку вероятность отказа в течение MTTF равна 1/e, или около 0,37. Это означает, что для отдельной единицы оборудования вероятность того, что она все еще будет работать после MTTF, составляет всего 0,37. Для группы оборудования того же типа это означает, что только 37% из него все еще будет работать после MTTF.

Коэффициент доступности – это вероятность того, что объект будет доступен в любое время, кроме плановых периодов, когда не предполагается использование объекта по назначению. Коэффициент готовности рассчитывается как отношение MTBF (среднее время между отказами) к MTTR (среднее время до отказа):

A = MTTF / (MTTF + MTTR).

Чтобы понять взаимосвязь между надежностью и безопасностью, обратимся к классификации неисправностей, рассмотренной в IEC 61508 (рис. 7). Неудачи могут быть опасными и безопасными, а также диагностируемыми и недиагностируемыми. В рамках надежности рассматриваются все виды отказов. С точки зрения безопасности нас интересуют только опасные отказы, и важно, чтобы такие отказы можно было диагностировать и чтобы при их обнаружении система могла перейти в безопасное состояние.

Рисунок 7: Классификация неисправностей и индикаторы безопасности в соответствии с IEC 61508

В стандарте IEC 61508 говорится о следующих показателях безопасности.

Первый из них – это так называемая аппаратная отказоустойчивость (Hardware Fault Tolerance, HFT). Это очень простая метрика, которая показывает, сколько аппаратных сбоев может произойти в системе, прежде чем она выйдет из строя. По сути, это эквивалентно количеству дополнительных резервных каналов. Это означает, что если система нерезервирована, то любой сбой выведет ее из строя, HFT = 0. Если система имеет два резервных канала, один из них является дополнительным резервным каналом. После единичного сбоя система будет продолжать работать, т.е. HFT = 1 и т.д.

Во-вторых, необходимо определить долю безопасных отказов (SFF). В терминах МЭК 61508 это отношение интенсивности безопасных и опасных диагностируемых отказов к общей интенсивности отказов (см. рисунок 7). Получается, что в терминах МЭК 61508 рассматриваются в основном недиагностируемые опасные отказы, а диагностируемые опасные отказы как доля безопасных отказов относятся к безопасным отказам.

Поэтому можно определить долю опасных отказов (DFF), которая дополняет долю безопасных отказов до единицы и рассчитывается как отношение интенсивности опасных недиагностируемых отказов к общей интенсивности отказов (см. рисунок 7).

Диагностическое покрытие, округ КолумбияD) в МЭК 61508 определяется только на основе опасной интенсивности отказов, это отношение опасной диагностируемой интенсивности отказов к опасной интенсивности отказов (см. рисунок 7).

В технической диагностике более привычным подходом является определение диагностического охвата (DC) как отношения диагностируемой интенсивности отказов к общей интенсивности отказов (см. рисунок 7). В отличие от этого, IEC 61508 заявляет о диагностическом покрытии на основе доли снижения вероятности опасных отказов благодаря встроенной диагностике.

На основе полученной в результате частоты безопасных отказов можно определить максимально достижимый уровень полноты безопасности SIL в зависимости от конфигурации с резервированием или без резервирования (рис. 8).

Рисунок 8: Максимально достижимый SIL на основе SFF (безопасная доля отказов) и HFT (отказоустойчивость аппаратуры), IEC 61508-2

Например, при доле безопасных отказов 90%-99% для конфигурации без резервирования (HFT=0) может быть достигнут максимальный уровень целостности безопасности SIL2. В системе с резервированием (HFT=1) может быть достигнут SIL3, а в системе с тройным резервированием SIL4 (HFT=2). Этот подход обычно используется разработчиками ПЛК и других устройств управления безопасностью. Устойчивость к случайным аппаратным сбоям соответствует SIL2 для конфигурации без резервирования и SIL3 для конфигурации с резервированием. Обратите внимание, однако, что систематическая отказоустойчивость, возникающая в результате процессов жизненного цикла, также должна соответствовать SIL3.

Еще одной градацией, определенной в стандарте IEC 61508, является разделение устройств на тип A и тип B. Тип А включает самые простые, в основном механические и электрические компоненты. Все программируемые электронные компоненты относятся к типу B.

В дополнение к требованиям, рассмотренным выше, существуют также требования к числовым значениям показателей безопасности.

Из основных определений МЭК 61508 следует, что существует три режима работы оборудования: режим низкого спроса, при котором частота запросов на функции безопасности не превышает одного в год, режим высокого спроса, при котором частота запросов на функции безопасности превышает один в год, и непрерывный режим. Оказывается, IEC 61508 рекомендует разные значения надежности для этих режимов.

Для систем, работающих с низкой частотой запросов, средняя вероятность опасного отказа функции безопасности на один запрос должна быть указана в качестве целевого значения (рис. 9). Для уровня безопасности SIL1 это значение не должно превышать 0,1. По мере увеличения SIL вероятность опасного отказа должна уменьшаться с каждым разом в 10 раз. Таким образом, для уровня целостности безопасности SIL4 вероятность опасного отказа должна составлять от 10-5 до 10-4.

Если сравнивать его с показателями, которые мы уже обсуждали, то этот показатель эквивалентен коэффициенту недоступности, то есть прибавлению коэффициента доступности к единице. Помните, однако, что мы говорим не обо всех неудачах, а только об опасных, не поддающихся диагностике неудачах.

Рисунок 9: зависимость SIL от среднего значения вероятности опасного отказа функции безопасности по требованию (низкий рабочий цикл), IEC 61508-1

Для систем, работающих с высокой частотой запросов или в непрерывном режиме, определяется средняя частота (или интенсивность) опасных отказов функции безопасности (рис. 10). Для уровня надежности SIL1 это число не должно превышать 10-15 1/ч, что соответствует одному отказу каждые 11,4 года. Опасная интенсивность отказов должна быть уменьшена в 10 раз при каждом повышении SIL. Для уровня надежности SIL4 опасная интенсивность отказов должна составлять от 10-9 до 10-8 1/час, т.е. не более одного отказа за 11 400 лет. Конечно, для одной системы это звучит несколько абсурдно, но если учесть, что по всему миру работают тысячи систем одного типа, то даже при таком низком уровне отказов опасные сбои вполне вероятны, что мы и наблюдаем в реальности.

Этот показатель соответствует интенсивности опасных, не диагностируемых отказов.

Рисунок 10. Зависимость уровня SIL от значения средней опасной интенсивности отказов функции безопасности (высокий спрос и непрерывный режим), IEC 61508-1

Все задачи, связанные с безопасностью, взаимосвязаны в рамках методологии FMECA (анализ режимов, последствий и критичности отказов). Основные положения этой методологии содержатся в стандарте IEC 60812:2006 Techniques for analysing the reliability of systems – Failure mode and effect analysis (FMEA) procedure. В Российской Федерации принят ГОСТ Р 51901.12-2007 “Управление рисками. Метод анализа режимов и последствий отказов”, который является адаптацией стандарта IEC 60812.

Предварительные данные для FMECA могут быть получены с помощью таких методов, как структурные диаграммы надежности, анализ дерева неисправностей и анализ Маркова.

Примеры расчета показателей функциональной безопасности и надежности

Давайте теперь рассмотрим несколько примеров определения показателей безопасности, я немного адаптировал их на основе примеров, приведенных в “Справочнике инженера АСУ” Y.N. Федоров.

Предположим, нам нужно рассчитать безопасность простой системы управления процессом. У нас есть емкость (например, котел) с датчиком давления, в которую по трубке подается определенное количество жидкости (рис. 11). При превышении установленного уровня давления должен сработать запорный клапан и перекрыть подачу жидкости в резервуар. Программируемый логический контроллер (ПЛК) используется для обработки сигнала от датчика и передачи сигнала запуска на клапан. Для конкретности определим вероятности отказов, для датчика и клапана вероятность отказа равна 10 -3 . Чтобы было проще исследовать подход с резервированием поля, выведем ПЛК за скобки, т.е. будем считать, что ПЛК абсолютно надежен, и не будем учитывать его влияние.

Что касается отказов оборудования, следует отметить, что они могут быть двух типов, во-первых, опасные отказы, т.е. отказы, когда оборудование должно работать, и, во-вторых, явные отказы, т.е. действия, когда оборудование не должно работать. Для обоих типов неудач мы имеем одинаковую вероятность.

Теперь несколько слов об одной из лазеек в МЭК 61508. Оказывается, МЭК 61508 не устанавливает никаких требований к надежности и доступности систем управления, а содержит только требования к безопасности. Казалось бы, речь идет об одном и том же – чем надежнее система, тем она безопаснее. Однако это не совсем так, полностью безопасная система – это та, которая постоянно находится в безопасном состоянии, т.е. не работает. Инженерные задачи проектирования систем безопасности включают оптимизацию параметров безопасности (вероятность опасного отказа) и доступности (вероятность ложных срабатываний). В нашем примере мы рассматриваем самые простые архитектуры систем управления с точки зрения вероятности опасных отказов и ложных тревог.

Рисунок 11 Пример 1: Неизбыточная система
Определите вероятность опасного провала и вероятность ложного срабатывания (ответ под спойлером)

Теперь определите вероятности для различных типов избыточности. Сначала представим избыточность для датчика (Рисунок 12). Предположим, что резервные компоненты идентичны, то есть вероятность их отказа одинакова. Попытайтесь определить, какова вероятность опасного отказа и неисправности для данного случая?

Рисунок 12. Пример 2: резервирование датчиков
Определите вероятность опасного отказа и вероятность ложной тревоги (ответ под спойлером)

Теперь давайте посмотрим, что произойдет, если резервным будет не датчик, а клапан (рис. 13)? Каковы равные вероятности?

Рисунок 13 Пример 3: резервные клапаны
Определите вероятность опасного отказа и вероятность ложной тревоги (ответ под спойлером)

Теперь рассмотрим схему, в которой и датчики, и клапаны являются избыточными. Предположим, что данные от каждого датчика создают управляющий сигнал для каждого клапана (Рисунок 14). Что мы получаем?

Рисунок 14: Пример 4: резервирование датчиков и клапанов (метод 1)
Определите вероятность опасного отказа и вероятность ложной операции (ответ под спойлером)

В случае с запорным клапаном возможен другой тип резервирования, когда они установлены параллельно, в этом случае подача продукта в резервуар прекращается при срабатывании обоих клапанов (рис. 15). Как определить вероятность опасного отказа и ложного срабатывания в этом случае?

Рисунок 15 Пример 5: Резервирование датчиков и клапанов (метод 2)
Определите вероятность опасного отказа и вероятность ложной операции (ответ под спойлером)

Поэтому в системах безопасности необходимо анализировать не только показатели безопасности, но и показатели надежности и выбирать структуры с учетом всего богатства имеющейся информации. В противном случае система будет безопасной, но ее эксплуатация может оказаться экономически нецелесообразной.

Выводы

Сегодня мы рассмотрели, как осуществляется количественная оценка показателей ФБ.

Функциональные атрибуты безопасности, которые включают функции безопасности и полноту безопасности, являются частью более широкой системы атрибутов, которая также включает информационную безопасность и надежность.

Функциональные атрибуты безопасности также связаны с атрибутами информационной безопасности и надежности. При проектировании систем безопасности необходимо провести всесторонний анализ измеряемых показателей и выявить возможные конфликты между атрибутами, где необходимо оптимизировать и найти компромисс.

При оценке и обеспечении информационной безопасности вероятностные метрики могут использоваться в основном для анализа доступности (готовности) отдельных физических устройств.

Риск является универсальным показателем функциональной безопасности. В зависимости от типа системы, риски могут быть переведены в целевые значения доступности и интенсивности отказов, которые варьируются в зависимости от уровня полноты гарантий SIL.

Анализ режимов, последствий и критичности отказов (FMECA) является наиболее эффективным подходом для количественной и качественной оценки безопасности.

MTBF – Время эксплуатации объекта с момента запуска до первого отказа. Он учитывается как для невосстанавливаемых, так и для восстанавливаемых объектов.

ЭКСПЛУАТАЦИОННАЯ НАДЕЖНОСТЬ ОБОРУДОВАНИЯ

Надежность – Свойство объекта, заключающееся в сохранении в течение времени в определенных пределах значений всех параметров, характеризующих его способность выполнять требуемые функции при определенных режимах и условиях использования, технического обслуживания, хранения и транспортировки. В данном случае под объектом понимается предмет, имеющий конкретное назначение (деталь, узел, машина).

Показателем назначения объекта являются часы работы.

Часы работы – Продолжительность или область действия объекта. Его можно измерить в единицах времени, длины, объема и массы. Например, для компрессоров он измеряется в часах работы (мото-ч). Время пробега автомобилей измеряется в километрах (км).

В теории надежности рассматриваются следующие виды наработки: время до отказа, время между отказами и ресурсы.

Время между отказами – Время нахождения объекта в эксплуатации с начала срока службы до возникновения первого отказа. Этот показатель учитывается как для невосстанавливаемых, так и для восстанавливаемых объектов.

Наработка на отказ – это случайная переменная. Исчерпывающей характеристикой случайной величины является закон распределения, который определяет связь между возможными значениями случайной величины и соответствующими им вероятностями. Закон распределения случайной величины обычно задается функцией распределения.

При оценке надежности машин наиболее актуальны следующие законы распределения: экспоненциальное распределение, распределение Вейбулла, логнормальное распределение и нормальное распределение.

Время работы между отказами – Время работы объекта с момента окончания восстановления его работоспособности после отказа до следующего отказа. Он определяется на основе времени эксплуатации объекта от i-й к (i+1)-й отказ и рассматривается только для воспроизводимых объектов.

Ресурс – это общее время работы объекта от начала эксплуатации или ее возобновления после ремонта до достижения предельного состояния. Другими словами, срок службы – это запас возможного времени работы объекта. Оно измеряется в тех же единицах, что и время работы.

Для неремонтируемых объектов ресурс совпадает с продолжительностью исправного состояния для использования по назначению, если переход в предельное состояние вызван исключительно возникновением отказа.

Надежность объекта – это комплексное свойство, которое в свою очередь характеризуется совокупностью свойств: надежность, работоспособность, ремонтопригодность.

Устойчивость к сбоям – это свойство объекта постоянно поддерживать свое рабочее состояние в течение определенного времени или времени работы.

Машина должна быть безотказной как в течение всего срока службы, так и во время хранения и транспортировки.

Частота отказов различна для невосстанавливаемых и восстанавливаемых объектов.

Основными показателями невосстанавливаемых объектов являются вероятность безотказной работы P (t), среднее время между отказами tср., интенсивность отказов λ (t) и гамма-процентная наработка на отказ tγ.

Вероятность неудачи– Вероятность того, что в течение

заданное время работы, вероятность того, что объект не выйдет из строя.

Пусть t – время жизни тестируемого объекта и T – случайное время безотказной работы, т.е. время между началом эксплуатации и первым отказом. Затем событие T > t означает, что в момент времени t не происходит отказа объекта.

Для каждого значения t существует некоторая вероятность того, что T будет иметь значение больше, чем tто есть

Функция P(t) называется вероятностью безотказной работы.

Функция P(t) является непрерывной функцией времени со следующими очевидными свойствами:

1) P(0) = 1, т.е. объекты эффективны в начале;

2) P(t) является монотонно убывающей функцией времени;

3) на t→ ∞, P (t) 0.

Статистическая оценка вероятности безотказной работы характеризуется отношением числа исправных объектов к общему числу объектов наблюдения

где N (0) – количество исправных объектов в момент времени t = 0;

N (t) – это количество оперативных объектов в момент времени t t; n(t) – количество отказавших объектов в момент времени t t.

Если эмпирическое распределение данной случайной величины и его близость к соответствующему теоретическому распределению определено по статистическим данным, то вероятность безотказной работы может быть рассчитана по известным математическим соотношениям. Например, если вероятность выхода из строя машины в течение 1000 часов составляет 0,95, это означает, что в среднем около 5% машин данной модели выйдут из строя до 1000 часов работы.

Вероятность неудачи – Вероятность того, что машина выйдет из строя в течение определенного временного интервала или времени работы:

Из этого выражения видно, что вероятность отказа является функцией распределения случайного времени T Вероятность отказа является функцией случайного распределения времени наработки T.

Статистическая оценка вероятности отказа – это отношение числа объектов, которые отказывают, к времени tколичество бездефектных объектов в начальный момент времени (т.е. время t =0), – определяется по формуле:

Вероятность безотказной работы и вероятность отказа связаны соотношением

P(t) + Q(t) = 1.

Среднее время между отказами – математическое ожидание времени между отказами

Статистическая оценка средней наработки на отказ (среднее арифметическое средней наработки на отказ группы объектов) определяется по формуле

где N0 – количество проверенных (наблюдаемых) объектов; ti – время работы i-го объекта до момента отказа.

Для определения меры дисперсии наработки группы объектов до отказа следует использовать среднее квадратическое отклонение наработки до отказа, статистическая оценка которого рассчитывается по формуле

Уровень отказов – Условная плотность вероятности отказа объекта, определяемая в предположении, что до рассматриваемого момента времени отказ не произошел. Другими словами, интенсивность отказов – это условная плотность вероятности отказа объекта в момент времени t

Статистическая оценка интенсивности отказов – это отношение числа отказавших объектов в единицу времени к среднему числу объектов, которые работали правильно в данный период времени (предполагается, что отказавшие объекты не перестраиваются и не заменяются работающими, т.е. число протестированных или наблюдаемых объектов уменьшается со временем). Она определяется по формуле

где ∆ t – временной интервал; ∆n (∆t) – это количество объектов, которые вышли из строя в момент времени ∆t.

Процентное время до отказа по гамма-шкале (tγ) – это время работы, в течение которого объект не выйдет из строя с вероятностью γ, выраженной в процентах. В своем физическом смысле гамма-процентная наработка на отказ – это односторонний нижний доверительный предел наработки на отказ, указывающий, насколько γ% объектов должны превысить заданный предел наработки на отказ. Если, например, MTBF составляет 0,90, это означает, что из большого количества автомобилей данной марки 90 процентов не выйдут из строя в течение установленного срока службы.

Это означает, что из очень большого количества объектов данной марки в течение установленного времени работы не произойдет ни одного отказа.

Для определения гамма-процента MTBF можно использовать следующее уравнение

Для работы реконструированных объектов характерно, что каждый объект начинает работать в определенный момент времени, принятый за начальный, и после запуска случайная величина t1, не получается. После сбоя объект восстанавливается и снова работает, пока не выйдет из строя, после случайного значения t2 и так далее. Моменты отказа создают случайный поток, который принято называть потоком отказа.

Поэтому основными показателями надежности реконструированных объектов являются: параметр потока повреждений ω(t) и среднее время между отказами tср..

Параметр интенсивности отказов – это отношение математического ожидания количества отказов реконструированного объекта за достаточно малую наработку к значению этой наработки.

Статистическая оценка параметра интенсивности отказов

где r(t) – количество отказов в интервале времени ∆t; t1 ≤ t2.

Долголетие – это свойство объекта, позволяющее ему функционировать до конца срока службы при определенном режиме технического обслуживания и ремонта.

Долговечность объектов измеряется ресурсами и продолжительностью жизни, на которые влияют случайные факторы. Поэтому эти числа относятся к случайным величинам, а законы их распределения определяются плотностью вероятности f (R). При этом используется большинство распределений, применяемых при анализе безотказной работы.

срок службы – Календарное рабочее время от начала работы или возобновления работы после ремонта до переналадки. Он измеряется в единицах времени (месяц, год).

Основные черты закона распределения ресурса (срока службы) объектов – средний ресурс (средний срок службы) Rср. и гамма-процент ресурса (срок полезного использования) Rγ.

Различают до-, сверх-, после-, общий и целевой срок службы.

Жизнь до капитального ремонта-Это ресурс, который считается от начала жизни объекта до его первого среднего (капитального) ремонта.

Межремонтный ресурс-это ресурс, учитываемый между двумя средними (капитальными) ремонтами объекта.

Срок службы после ремонтаэто ресурс объекта, отсчитываемый от последнего промежуточного (капитального) осмотра до перехода в предельное состояние, соответствующее окончательному переоборудованию использования (списанию).

Общий срок службыэто ресурс, рассчитанный с начала срока службы установки до ее перехода в критическое состояние, соответствующее ее окончательному выводу из эксплуатации (амортизации).

Назначенный срок полезного использования (“назначенный срок полезного использования”) – это общий срок службы (календарный срок службы), по истечении которого объект подлежит выводу из эксплуатации, независимо от его состояния. Обычно он определяется средним сроком службы самой слабой части объекта.

Средний срок службы – это математическое ожидание ресурса (срок службы).

Статистическая оценка средней продолжительности жизни

где Rj – жизнь j-продукт

tцзи – доступность j-илатация между i-(i +1) неудачи; n – количество отказов продукции в течение рассматриваемого срока службы; N0 – количество протестированных продуктов.

Гамма-процентный срок службы Rγ – это общее время работы, в течение которого объект не достигает своего предельного состояния с вероятностью γ, выраженной в процентах. В физическом смысле гамма-процентный срок службы, как и гамма-процентная наработка на отказ, является односторонней нижней доверительной границей для ожидаемого значения срока службы, указывающей, сколько γ% объектов должны превысить установленный предельный срок службы.

Указанный процент объектов γ является регулируемой вероятностью. Если, например, γ=90%, соответствующий ресурс называется ресурсом 90%.

Ремонтопригодность – Свойство объекта, которое зависит от его адаптивной способности поддерживать и восстанавливать свою полезность путем технического обслуживания и ремонта.

При экспериментальном определении ремонтопригодности наблюдения проводятся во время испытаний или эксплуатации N объектов в заданных условиях и определять время восстановления работоспособности объекта после отказа. Из-за влияния организационных и технических случайных факторов относится к случайной величине. Используется большинство законов распределения, применяемых в анализе отказоустойчивости.

Основными характеристиками ремонтопригодности объекта являются среднее время восстановления tcsv и вероятность восстановления Pв (tз).

Среднее время восстановления – математическое ожидание времени восстановления после сбоя

Для того чтобы определить меру дисперсии времени восстановления, необходимо использовать параметр Среднее квадратичное отклонение времени восстановления, статистически оценивается по

Вероятность восстановления Pв (t0) – это вероятность того, что время восстановления tв не превышает заданного значения tз. Это следует из соотношения

Аналитическая форма отношения Pв(tз) зависит от типа закона распределения времени восстановления.

Скорость восстановления параметра – отношение значения параметра объекта после восстановления к номинальному значению этого параметра

где Пк– обобщенный параметр объекта после восстановления; Пн – является обобщенным параметром нового объекта.

Ремонтопригодность – Свойство объекта сохранять в заданных пределах значения параметров, характеризующих способность объекта выполнять требуемые функции во время и после хранения и/или транспортировки.

Долговечность объекта является показателем его ремонтопригодности. Вследствие влияния случайных факторов относится к случайным величинам, законы распределения которых определяются плотностью вероятности f (x). Важнейшей числовой характеристикой закона распределения периода сохранения объекта является средний период сохранения хср. и процентная гамма срока годности Pв(хс).

Средний срок хранения xср. – математическое ожидание срока годности.

Процент гамма-прочности – Срок службы, достигнутый объектом с заданной вероятностью γ, выраженный в процентах. Физический смысл времени удержания гамма-излучения, а также гамма-долговечности – это односторонний нижний доверительный предел показателя времени удержания, указывающий, какой γ-процент объектов или их компонентов должен превысить заданное время удержания во время тестирования или мониторинга.

Комплексной мерой надежности возобновляемых объектов является индекс доступности.

Индексы доступности и технического использования служат комплексным показателем надежности восстанавливаемых объектов.

Они одновременно характеризуют несколько свойств, составляющих надежность объекта: безотказность, долговечность и работоспособность. Такие индикаторы необходимы, когда простой объекта из-за отказа не может быть проигнорирован.

коэффициент доступности Kг– Вероятность того, что объект будет функционировать в любое время, кроме плановых периодов, когда не предполагается использование объекта по назначению.

В стационарном режиме работы, который предусматривает немедленное начало восстановления поврежденного объекта, коэффициент готовности Кг рассчитывается по формуле

где tр– среднее время между отказами; tв – среднее время возвращения объекта в рабочее состояние (без учета времени простоя для планового ремонта и технического обслуживания).

Фактор доступности оценивает незапланированные простои объекта, возникновение которых свидетельствует о том, что запланированные мероприятия по ремонту и техническому обслуживанию выполняются не в полном объеме. Он показывает, что надежность объекта достигается не только за счет увеличения времени безотказной работы и долговечности, но и за счет повышения ремонтопригодности объекта, что может быть достигнуто за счет сокращения среднего времени замены.

Коэффициент технического обслуживания Kti – это отношение математического ожидания общего срока службы объекта за определенный период эксплуатации к математическому ожиданию общего срока службы объекта и времени простоя из-за технического обслуживания и ремонта за тот же период.

где tс – это общее время работы объекта за данный промежуток времени; tв, tр и tзатем – соответственно, общее время, затраченное на замену, ремонт и техническое обслуживание за тот же период.

Коэффициент технического использования является более полной характеристикой ремонтопригодности объекта, поскольку он учитывает как запланированные, так и незапланированные простои объекта.

В других случаях надежность может быть выражена в терминах вероятности выполнения задания. Например, надежность полета в гражданской авиации может быть безразмерной или может быть выражена в процентах, как это делается в практике обеспечения безопасности систем. В некоторых случаях успех системы может заключаться в одном ответе. Это актуально для систем, которые предназначены для однократного срабатывания: например, подушки безопасности в автомобиле. В этом случае определяется вероятность срабатывания или, как в случае с ракетами, вероятность попадания в цель. Для таких систем мерой надежности является вероятность срабатывания. Для систем, которые могут быть перестроены, можно установить среднее время перестройки (ремонта) и время проверки (тестирования). Часто параметры надежности приводятся в виде соответствующих статистических доверительных интервалов.

УПРАВЛЕНИЕ НАДЕЖНОСТЬЮ

Управление надежностью – свойство объекта сохранять в течение времени в заданных пределах значения всех параметров, характеризующих его способность выполнять требуемые функции при заданных условиях использования, обслуживания, хранения и транспортировки.

Интуитивно понятно, что надежность объектов связана с недопустимостью отказов при эксплуатации. Это понимание надежности в “узком” смысле – свойство объекта оставаться в рабочем состоянии в течение определенного времени или в течение определенного периода эксплуатации. Другими словами, надежность объекта заключается в отсутствии непредвиденных, недопустимых изменений его качества на стадии эксплуатации (при использовании, обслуживании, хранении, транспортировке). Надежность – это комплексное свойство, которое в зависимости от назначения объекта и условий его эксплуатации может включать свойства надежности, долговечности, ремонтопригодности и безопасности, а также некоторую комбинацию этих свойств.

Для количественной оценки надежности используются так называемые единичные показатели надежности (характеризующие только одно свойство надежности) и составные показатели надежности (характеризующие несколько свойств надежности за определенный период времени).

Основные понятия и определения:

Устойчивость к сбоям – это свойство объекта непрерывно поддерживать свое функциональное состояние в течение определенного времени или времени выполнения.

Ремонтопригодность – Свойство объекта восстанавливаться после сбоя или повреждения объекта или его компонентов.

Устойчивость – Свойство объекта постоянно поддерживать работоспособность с начала эксплуатации до достижения предельного состояния, т.е. состояния, при котором объект выводится из эксплуатации.

Ремонтопригодность – Свойство объекта сохранять свою полезность в течение всего периода хранения и транспортировки.

живучесть – Свойство объекта, позволяющее ему оставаться работоспособным после выхода из строя отдельных функциональных узлов.

Отказ – событие, связанное с полной или частичной потерей работоспособности.

Отказ – это самовосстанавливающийся отказ или единичный отказ, устраненный незначительным вмешательством оператора.

MTBF – Количество (время или объем работы), используемое для измерения срока службы оборудования.

Пожизненный – Время между началом работы и предельным состоянием.

Пожизненный – это календарный период между началом эксплуатации и достижением предельного состояния.

Оценка надежности.

Для любой системы одной из первых задач инженерии надежности является адекватная стандартизация показателей надежности, например, в отношении требуемой доступности. Нормирование надежности предполагает указание количественных и качественных требований к надежности в проектной или другой документации. Требования надежности относятся к самой системе и ее компонентам, а также к планам испытаний, точности и достоверности исходных данных, формулировке критериев отказов, дефектов и предельных состояний, методам контроля надежности на всех этапах жизненного цикла изделия. Например, требования к ремонтопригодности могут включать показатели стоимости и времени восстановления. Оценка эффективности процессов технического обслуживания и ремонта является частью процесса FRACAS (Система отчетности, анализа и корректирующих действий).

Параметры надежности системы.

Анализ параметров надежности системы учитывает структуру системы, состав и взаимодействие ее компонентов, возможность восстановления ее структуры и алгоритмов функционирования в случае отказа отдельных компонентов.

Наиболее часто в инженерной практике рассматриваются последовательные, параллельные, смешанные (последовательно-параллельные и параллельно-последовательные) соединения элементов системы, а также схемы типа “К с N”, мостовые соединения.

Системы делятся на восстанавливаемые и невосстанавливаемые, обслуживаемые и не обслуживаемые в зависимости от возможности восстановления и обслуживания. В зависимости от способа применения (функционирования) – на системы непрерывного, многократного (циклического) и однократного использования.

Обычно в качестве параметра надежности используется среднее время наработки на отказ (MTTF), которое может определяться интенсивностью отказов или количеством отказов в заданном интервале времени. Интенсивность отказов математически определяется как условная плотность вероятности отказа продукции при условии, что до данного момента времени отказов не было. Если частота отказов увеличивается, среднее время до отказа уменьшается, и надежность изделия снижается. Среднее время наработки на отказ обычно измеряется в часах, но также может быть выражено в таких единицах, как циклы и мили.

В других случаях надежность может быть выражена в терминах вероятности выполнения задачи. Например, надежность полета в гражданской авиации может быть безразмерной или может быть выражена в процентах, как это делается в практике обеспечения безопасности систем. В некоторых случаях успех системы может заключаться в одном ответе. Это актуально для систем, которые предназначены для однократного срабатывания: например, подушки безопасности в автомобиле. В этом случае задается вероятность срабатывания или, как в случае с ракетами, вероятность попадания в цель. Для таких систем мерой надежности является вероятность срабатывания. Для перестраиваемых систем можно определить среднее время перестройки (ремонта) и время проверки (испытания). Параметры надежности часто задаются в терминах соответствующих статистических доверительных интервалов.

Надежность по конструкции.

Надежность при проектировании является развивающейся дисциплиной и относится к процессу разработки надежных продуктов. Этот процесс включает в себя несколько инструментов и практик и описывает, как они должны применяться организацией для обеспечения высокой надежности и ремонтопригодности разработанного продукта с целью достижения высокой доступности, снижения затрат и максимального срока службы продукта. Как правило, первым шагом в этом направлении является нормирование показателей надежности. Надежность должна быть “спроектирована” в системе. Во время проектирования системы назначаются требования к надежности более высокого порядка, которые затем разбиваются на конкретные подсистемы конструкторами, инженерами и специалистами по надежности, работающими вместе. Проектирование надежности начинается с разработки модели. Это включает использование диаграмм потока надежности или деревьев отказов, которые представляют взаимосвязи между различными частями (компонентами) системы.

Одним из наиболее важных методов проектирования является введение избыточности или резервирования. Резервирование – это способ обеспечения надежности продукции с помощью дополнительных ресурсов и/или возможностей, которые являются избыточными по отношению к минимально необходимым для выполнения требуемых функций (ГОСТ 27.002). При внедрении резервирования и хорошо организованного мониторинга неисправностей даже системы с низкой надежностью по одному каналу могут в целом иметь высокий уровень надежности. Однако введение избыточности на высоком уровне в сложной системе (например, на уровне авиационного двигателя) очень сложно и дорого, что ограничивает такую избыточность. На более низком уровне системы резервирование может быть введено быстро и легко, например, с помощью дополнительного болтового соединения.

Существует множество методик анализа надежности, характерных для конкретных отраслей и областей применения. Наиболее распространенными из них являются следующие:

  • Анализ режимов и последствий отказов (FMEA)
  • Имитационное моделирование надежности
  • Анализ диаграмм функциональной целостности (FIS)
  • Анализ опасностей
  • Проверка надежности конструкции (RBD)
  • Анализ дерева неисправностей
  • Ускоренное тестирование
  • Анализ роста надежности
  • Анализ Вейбулла (анализ эмпирических данных, полученных в ходе испытаний и эксплуатации)
  • Анализ смеси распределений
  • Управление критическими отказами
  • Планирование технического обслуживания с учетом надежности (RCM)
  • Анализ диагностики отказов
  • Анализ человеческих ошибок

Инженерные исследования проводятся для определения оптимального баланса между надежностью и другими требованиями и ограничениями. Программные пакеты для анализа надежности могут оказать важную поддержку при проектировании надежности.

Оценка надежности оборудования на этапе эксплуатации.

После изготовления системы осуществляется контроль ее надежности, оцениваются и устраняются дефекты и недостатки. Мониторинг включает электронное и визуальное наблюдение за критическими параметрами, определенными на этапе проектирования при разработке дерева отказов. Для обеспечения конкретной надежности системы данные постоянно анализируются с использованием статистических методов, таких как анализ Вейбулла и линейная регрессия. Данные о надежности и оценки параметров являются ключевыми входными данными для модели логистики системы.

Одним из наиболее распространенных методов оценки надежности эксплуатируемых машин является система отчетности, анализа и корректирующих действий (FRACAS). Систематический подход к оценке надежности во времени, безопасности и логистики основан на отчетности об отказах и авариях, управлении, анализе корректирующих и предупреждающих действий.

Надежность системы определяет способность технологической системы реагировать на возникающие возмущения и восстанавливать режим работы. Надежность отдельных единиц оборудования определяется их вероятностной способностью выполнять свои функции в заданных условиях эксплуатации. Здесь и ключевую роль в управлении надежностью играет система поддержания уровня работоспособности на требуемом уровне.

Классические подходы к этому вопросу имеют один общий недостаток: планирование мероприятий по поддержанию надежности слабо связано с естественным ожидаемым результатом – ее (надежности) повышением. Причинами этого являются усредненный подход к оборудованию, непонимание отдельных аспектов работы каждого агрегата, а также планирование проверок и ремонта без учета бизнес-целей компании, существующих рисков и ограничений. Как следствие, ремонтируется то, что не нужно, ломается то, что должно продолжать работать, увеличиваются всевозможные потери, а расходы на содержание не уменьшаются.

Универсальным решением этих проблем является такой подход к эксплуатации и обслуживанию оборудования, при котором каждая единица оборудования рассматривается как постоянный фактор риска для бизнес-целей компании. Основной целью деятельности по техническому обслуживанию оборудования является максимальное снижение риска при существующих условиях и ограничениях. Таким образом, управление надежностью превращается из деятельности, требующей затрат, в инструмент для достижения текущих бизнес-целей – увеличения прибыли за счет более эффективного использования оборудования, снижения накладных расходов при сохранении нагрузки на оборудование.

Основной управленческой задачей, связанной с обеспечением надежности, является необходимость найти компромисс между стремлением сэкономить на стоимости оборудования и желанием избежать аварий, простоев и связанных с ними убытков. Обычно такого компромисса найти не удается, и в реальной жизни “побеждает” одна из точек зрения – либо приоритет отдается надежности, часто в ущерб экономической целесообразности, либо производственные активы эксплуатируются “по максимуму”, обеспечивая максимальную прибыль “на данный момент”.

В обоих случаях ситуацию усугубляют такие объективные факторы, как серьезный износ основных фондов, их возрастная и технологическая неоднородность, снижение профессионального уровня эксплуатационного и ремонтного персонала, снижение качества выпускаемых запасных частей и комплектующих, эксплуатация оборудования в экстремальных и запредельных режимах нагрузки, устаревшая нормативно-правовая база процессов эксплуатации, технического обслуживания и капитального ремонта, не соответствующая действительности.

Вышеперечисленные проблемы могут быть радикально решены путем полной модернизации технологической базы с переходом к “беспилотному” обслуживанию или эксплуатации. Но этот путь очень дорогостоящий. Более прагматичный подход заключается в создании системы управления производственными активами, где можно найти компромисс между стоимостью и надежностью.

Такой подход должен быть направлен на обеспечение баланса между потенциальным риском убытков, связанных с эксплуатацией оборудования, и затратами на работу с ним. Главное здесь – ответить на два вопроса:

– Какова вероятность и сроки наступления неблагоприятных событий и связанных с ними убытков?

– Каков наилучший план действий по предотвращению неблагоприятных событий с учетом существующих ограничений (финансовых, кадровых, технологических и т.д.)?

Точность этого подхода привела к появлению на рынке программного обеспечения нового класса систем – Predictive Maintenance.

Этот класс систем является развитием, расширением классических систем управления активами (EAM) и систем технического обслуживания и капитального ремонта и имеет задачу планирования замены, технического обслуживания и капитального ремонта на основе реальной действительности – текущего и прогнозного состояния оборудования, условий работы, производственных планов и ограничений, целевых KPI завода. Эти системы позволяют непосредственно в процессе эксплуатации оборудования оценить его техническое состояние – прогнозируемое время развития отказа до критического уровня, возможные виды и последствия функциональных отказов и вызванных ими неисправностей.

Эта информация служит основой для проактивного планирования, своевременное осуществление которого позволяет снизить количество аварийных и незапланированных ремонтов, минимизировать время простоя оборудования, повысить безопасность эксплуатации, минимизировать воздействие на окружающую среду, расходы на страхование и другие риски.

Алгоритм планирования в этом подходе в общем случае представляет собой следующую последовательность:

I. Различные объективные показания, характеризующие текущее состояние оборудования, условия его эксплуатации и другие соответствующие данные собираются в ходе регулярной и случайной диагностики, проверок, технического обслуживания и ремонта.

II. На основе этих данных определяются тип и степень развития неисправностей/дефектов, а также прогнозируемый остаточный срок службы оборудования для каждой такой неисправности – время, оставшееся до достижения критического уровня развития, при котором дальнейшая эксплуатация уже невозможна. Прогнозирование осуществляется на основе регрессионной модели, специфичной для каждого типа дефекта, где в качестве исходных данных выступает вся история эксплуатации и ремонта рассматриваемого оборудования.

III. Для каждого обнаруженного дефекта определяются возможные последствия в случае, если в результате дефекта произойдет сбой. Последствия определяются для всех аспектов безопасности – экономические потери из-за простоя, затраты на устранение последствий поломки/аварии, риски для людей, окружающей среды и т.д.

IV. Для каждого дефекта определяется необходимый и достаточный вид, состав и объем упреждающих работ по устранению. Составляется предварительный план, в котором сроки выполнения отдельных работ определяются оставшимся сроком службы данного дефекта. Этот план обеспечивает максимальную надежность оборудования, но не учитывает экономические и производственные реалии.

V. На основе такого предварительного плана создается оптимальный график технического обслуживания и ремонта, сбалансированный по заданным KPI: надежность, затраты на техническое обслуживание и ремонт, полезная отдача от оборудования, стоимость владения активом и т.д. Затем план утверждается и передается в службы для обслуживания и реализации.

Управление надежностью как система естественным образом “отсортирует” все критические аспекты бизнес-организации – процессы и регламенты, персонал, НТД и НСИ, техническую политику и стандарты, данные и программное обеспечение. Во всех этих областях система будет “требовать” большей ясности, точности и подотчетности.

Этому способствует международный опыт, обобщенный в различных методологиях, подходах и стандартах. К ним относятся такие методы, как RCM (обслуживание надежности), FMEA (анализ режимов и причин отказов), RBI (диагностика на основе рисков) и др. Стандарт PAS 55 (ISO 55000) может стать хорошим ориентиром при “разборе” процессов, регламентов, квалификации сотрудников. Как часть системы менеджмента надежности все эти стандарты приобретают четкий практический смысл, переставая быть абстрактными упражнениями или “новомодными гаджетами”.

Описанный подход не является новым для российской промышленности. Были разработаны методики оценки состояния и риска, а также автоматизированы расчеты этих оценок. Но сегодня мы можем сказать, что ситуация остается прежней. Казалось бы, явных провалов не было, но и успешными такие проекты назвать нельзя. Каковы, на наш взгляд, причины неудачи? Мы видим две ключевые проблемы:

I. Нам не известен ни один проект, который был бы выполнен в полном объеме поставленных перед ним задач – от мониторинга и оценки состояния до планирования фактических работ и составления сметы на реконструкцию. Все попытки, так или иначе, останавливались на каком-то этапе, не дойдя до завершения. В результате эти системы оставались чем-то самим по себе, не были интегрированы в реальный процесс принятия решений по эксплуатации и техническому обслуживанию и постепенно канули в Лету.

II. В некоторых случаях дополнительной проблемой был неправильный выбор программного обеспечения, необходимого для автоматизации процессов нетривиальных расчетов с большим количеством входных данных. Наиболее ярким примером является попытка “улучшить” систему SAP ERP, широко распространенную в российской электроэнергетике, для решения проблемы управления надежностью.

SO, Если организовать системный подход к управлению надежностью, можно превратить проблемные, дорогостоящие мероприятия по обслуживанию оборудования в инструмент для решения бизнес-задач: увеличения прибыли за счет более эффективного использования оборудования, снижения накладных расходов при сохранении загрузки оборудования. Насколько это возможно, зависит от каждого конкретного случая, но на практике наши специалисты могут снизить общие затраты на обслуживание оборудования на 25-20%, и это вполне достижимая цель.

 

Читайте далее:
Сохранить статью?