Термин · Глоссарий B2B-ПО

RAS (Надежность, доступность и удобство обслуживания) (RAS (Reliability, Availability and Serviceability))

RAS (Reliability, Availability and Serviceability) – комплекс характеристик надёжности серверного оборудования и ПО, включающий: надёжность (безотказность и целостность данных), доступность (процент времени работы, «пять девяток») и удобство обслуживания (скорость диагностики и ремонта без простоя).

Буква «R» В категориях: 4 Платформ: 6+

Введение

RAS – аббревиатура от Reliability, Availability and Serviceability (надёжность, доступность и удобство обслуживания). Термин был введён компанией IBM для описания характеристик надёжности мейнфреймов и впоследствии распространился на все типы серверного оборудования, сетевых устройств и критически важного ПО. Системы с высоким уровнем RAS обеспечивают непрерывную работу корпоративных приложений, защищают целостность данных и позволяют выполнять техническое обслуживание без остановки сервисов.

В современных дата-центрах RAS является обязательным требованием для оборудования класса mission-critical: финансовых платформ, телекоммуникационного ядра, промышленных систем управления и медицинских информационных систем.

История и контекст

Концепция RAS зародилась в IBM в 1960-х годах при разработке серии мейнфреймов System/360. Задача состояла в обеспечении непрерывной работы банковских и государственных систем, где любой сбой влечёт критические последствия. Термин RAS закрепился как отраслевой стандарт оценки серверного оборудования.

С распространением x86-серверов в 1990–2000-х производители Intel, AMD, HP, Dell и Lenovo начали встраивать RAS-функции (ECC-память, горячая замена компонентов, резервные блоки питания) в серверные платформы. Сегодня RAS-характеристики являются ключевыми критериями при выборе серверов для корпоративных дата-центров и облачных провайдеров.

Как это работает

Каждый из трёх компонентов RAS описывает отдельный аспект надёжности системы:

  • Reliability (Надёжность) – вероятность корректной работы системы в течение заданного времени. Измеряется через MTBF (Mean Time Between Failures). Реализуется через ECC-память (исправление однобитных ошибок), контрольные суммы, механизмы обнаружения и изоляции неисправностей. Система не должна молча выдавать некорректные данные – при обнаружении неисправимой ошибки она изолирует отказавший компонент или выполняет аварийное завершение с диагностическим сообщением.
  • Availability (Доступность) – доля времени, в течение которого система готова к работе. Выражается в процентах: доступность «пять девяток» (99,999%) означает не более 5,25 минуты простоя в год. Достигается через кластеризацию, горячее резервирование, автоматическое переключение при отказе (failover), RAID-массивы и резервные источники питания.
  • Serviceability (Удобство обслуживания) – простота и скорость диагностики и ремонта. Измеряется через MTTR (Mean Time To Repair). Включает удалённое управление (BMC/IPMI/iDRAC), горячую замену компонентов, предиктивную диагностику и автоматическое оповещение сервисного центра без участия оператора.

Ключевая формула доступности: A = MTBF / (MTBF + MTTR). Для достижения «пяти девяток» необходимо одновременно максимизировать MTBF и минимизировать MTTR.

Где применяется

  • Банковские и финансовые системы: АБС, процессинг платежей, торговые системы требуют доступности 99,99% и выше.
  • Телекоммуникации: коммутаторы, маршрутизаторы и серверы OSS/BSS работают в режиме 24/7 без права на плановые простои.
  • Промышленные системы управления (АСУ ТП): отказ системы управления производственным процессом может привести к аварии.
  • Облачные инфраструктуры: гипервизоры и серверы хранения данных должны обеспечивать SLA для сотен арендаторов одновременно.
  • Медицина: системы мониторинга пациентов и МИС требуют непрерывной работы.

Преимущества и ограничения

Преимущества: снижение риска потери данных и финансовых потерь от простоев; возможность технического обслуживания без остановки сервисов; соответствие требованиям SLA; предсказуемость поведения системы при отказе компонентов.

Ограничения: RAS-функции существенно увеличивают стоимость оборудования; избыточность требует дополнительных ресурсов (площадь, электроэнергия, охлаждение); высокая доступность не гарантирует надёжности ПО – приложение может работать непрерывно, но выдавать некорректные результаты.

Связь с другими понятиями

RAS тесно связан с концепцией высокой доступности (High Availability) и стратегиями Disaster Recovery. Показатель RTO (Recovery Time Objective) является практическим измерением компонента Serviceability, а RPO – дополняет Reliability с точки зрения допустимых потерь данных. В контексте ПО RAS-принципы реализуются через отказоустойчивую архитектуру: репликацию, circuit breaker паттерны и graceful degradation.

Понятия из глоссария Цифрового маркетплейса, которые часто встречаются вместе с термином «RAS (Надежность, доступность и удобство обслуживания)».

Платформы класса «RAS (Надежность, доступность и удобство обслуживания)»

Решения из каталога Цифрового маркетплейса, относящиеся к этому классу ПО. Карточки ведут на полные карточки платформ с тарифами, обзорами и кейсами внедрения.

Field Connect

Field Connect

ИТ-инфраструктура
Программное обеспечение для удалённого управления и мониторинга сельскохозяйственного оборудования: дождевальн...
Цена по запросу
★ 4.7
Подробнее →
Гослинукс

Гослинукс

Серверные ОС
Гослинукс (GosLinux) - операционная система на базе GNU/Linux-дистрибутива CentOS 6.4 для 32-битных и 64-битны...
Цена по запросу
Подробнее →
ClickHouse

ClickHouse

ИТ-инфраструктура
ClickHouse — колоночная аналитическая СУБД (OLAP), созданная Яндексом и открытая в 2016 году. Обеспечивает обр...
Цена по запросу
★ 4.8
Подробнее →

Категории каталога

Разделы каталога Цифрового маркетплейса, в которые входят решения, использующие «RAS (Надежность, доступность и удобство обслуживания)».

Где применяется

Отрасли, в которых «RAS (Надежность, доступность и удобство обслуживания)» используется на практике. Откройте отраслевой раздел Цифрового маркетплейса, чтобы увидеть подходящие решения, кейсы и новости.

Частые вопросы про RAS (Надежность, доступность и удобство обслуживания)

Что означает аббревиатура RAS?

RAS – Reliability (надёжность), Availability (доступность), Serviceability (удобство обслуживания). Термин введён IBM для описания характеристик надёжности серверного оборудования.

Чем отличается надёжность (Reliability) от доступности (Availability)?

Надёжность – вероятность корректной работы без ошибок (MTBF). Доступность – процент времени работоспособности. Система может быть доступна, но ненадёжна – работать, но выдавать некорректные данные.

Что означает доступность «пять девяток» (99,999%)?

Это не более 5,25 минуты суммарного простоя в год. Достигается через горячее резервирование, кластеризацию, автоматическое переключение при отказе и отсутствие одиночных точек отказа.

Как RAS связан с ECC-памятью?

ECC (Error Correcting Code) – технология, позволяющая обнаруживать и исправлять однобитные ошибки памяти. Это ключевой механизм реализации компонента Reliability в серверных платформах.

Применимо ли понятие RAS к программному обеспечению?

Да. В ПО Reliability реализуется через тестирование и обработку ошибок, Availability – через кластеризацию и репликацию, Serviceability – через диагностику, логирование и удалённое управление.

Как RAS соотносится с SLA дата-центра?

SLA формализует требования к доступности (например, 99,9% uptime). Характеристики RAS оборудования определяют техническую возможность выполнения этих обязательств.