Восстановление деятельности после наступления чрезвычайной ситуации
#MAKEITWORKAGAIN
DRP
DRP является частью ОНиВД и входит в совокупность мероприятий, направленных на обеспечение непрерывности и/или восстановление деятельности организации (например, кредитной) в случае возникновения непредвиденных обстоятельств. Это внутренний документ, который определяет комплекс действий по предотвращению или своевременной ликвидации последствий нарушения режима работы компании, вызванного возникновением чрезвычайной ситуации.
Disaster Recovery Plan (DRP) — это план аварийного восстановления всех ИТ-систем после катастрофы. DRP cодержит детальный пошаговый план по восстановлению ИТ-инфраструктуры, информационных систем и данных.
Disaster Recovery
Процесс аварийного восстановления — это часть мероприятий по обеспечению непрерывности бизнеса.
Что становится причиной простоев или недоступности бизнеса?
Природные катастрофы
Антропогенные катастрофы
Сбой в ИТ системах
Всплеск потребления (клиентская активность)
Атака
Аварийное восстановление
Что собой представляет процесс разработки DRP
Требования к системе резервирования ИТ-сервисов
Подготовленный бизнесом Business Impact Analysis (BIA) — анализ воздействия на бизнес
Список ИТ-сервисов
Карта ИТ-сервисов с привязкой к ИТ-ресурсам
Схема текущей инфраструктуры
RTO/RPO/MTDT для резервируемых ИТ-сервисов
Анализ рисков
Анализ оценки бизнес рисков
Оценка возможных угроз ИТ-сервисам
Карта рисков и угроз
Документация для резервирования
Схема системы резервирования
Описание ИТ-сервисов
Дизайн системы резервирования
Основные документы
План восстановления деятельности (DRP)
Орг. структура команды воссановления (DR Team)
Категории инцидентов и сценарии по реагированию
Схема взаимодействия и процесс оповещения сотрудников
Списки ключевых поставщиков и контактов
Детальные Планы действий в режиме ЧС и действий для возврата в штатный режим работы
Проведение тестовых испытаний и учений
Планирование: определение целей, рамок и объема тестов
Проведение тестов:
выполнение разработанных планов действий,
проверка временных рамок и инструкций,
оценка результатов тестирования.
Обучение сотрудников
Определение целей обучения разных групп сотрудников
Периодическое проведение обучения
Поддержание Плана (DRP) и инструкций в актуальном состоянии
Процедуры контроля изменений
Определение ответственных за каждую часть плана
Изменение плана по результатам тестирования
Maximum tolerable downtime
Максимально допустимое время простоя
Recovery Time Objective
Целевое время восстановления, согласованный с бизнесом интервал времени после аварии, необходимый для восстановления IT-сервисов
Recovery Point Objective
Целевая точка восстановления – это согласованный с бизнесом интервал времени, предшествующий аварии, за который допускается потеря данных
Ключевые точки
Ключевыми характеристиками, определяющими требования к непрерывности ИТ-сервисов, являются параметры — PRO, RTO, MTDT
Тестирование проводится в соответствии с календарем тестирования
Тестирование проводится в целях:
Совершенствования и своевременной актуализации Планов
Выявления любых недостатков или противоречий в DRP плане
Отработка навыков работы во время ЧС у сотрудников
Тестирование DRP плана может проводиться в формате:
Оповещение сотрудников («Call-tree» тестирование)
Тестирования на основе симуляции за круглым столом (Table-Top-Drill)
Тестирование бизнес-функций и процессов (Business Function Testing)
Совместное с бизнесом тестирование BCP
Тестирование ИТ-инфраструктуры и ИТ-сервисов (DR Test)
Тестирование резервного центра (Alternate Site Testing), например, переключение в резервный ЦОД или выезд пользователей на работу на резервную площадку
Тестирования в реальных условиях
Тестирование BCP и DRP планов должно осуществляться не реже одного раза в год и/или по итогам изменений
Тестирование BCP и DRP
Обучение сотрудников
Определение и закрепление зон ответственности
Выстраивание взаимодействия ИТ и ИБ команд
Отработка планов восстановления и реагирования на ЧС
DRP
Разработка DR стратегии и необходимого пакета документов в рамках требований ОНиВД (BCM)
Разработка Плана аварийного восстановления систем (DRP)
BIA и критичные системы
Определение и закрепление зон ответственности
Выстраивание взаимодействия ИТ и ИБ команд
Выстраивание взаимодействия ИТ и ИБ команд
DR документы
Координация работ по разработке DR инструкций для каждой системы
Подготовка плана проведения тестирования
Координация и сопровождение DR тестов:
Полное или частичное переключение в резервный ЦОД
Тестирование восстановления из резервных копий
Тестирование процедуры информирования о сбое (Call Tree test)
Тестирование на основе симуляции за круглым столом
Что я предлагаю
Опыт разработки DRP, тестирования и реальных боевых переключений!