Восстановление деятельности после наступления чрезвычайной ситуации
DRP
Disaster Recovery Plan (DRP) — это план аварийного восстановления всех ИТ-систем после катастрофы. DRP cодержит детальный пошаговый план по восстановлению ИТ-инфраструктуры, информационных систем и данных.
DRP
DRP является частью ОНиВД и входит в совокупность мероприятий, направленных на обеспечение непрерывности и/или восстановление деятельности организации (например, кредитной) в случае возникновения непредвиденных обстоятельств. Это внутренний документ, который определяет комплекс действий по предотвращению или своевременной ликвидации последствий нарушения режима работы компании, вызванного возникновением чрезвычайной ситуации.
Процесс аварийного восстановления — это часть мероприятий по обеспечению непрерывности бизнеса.
Disaster Recovery
Атака
Всплеск потребления (клиентская активность)
Сбой в ИТ системах
Антропогенные катастрофы
Природные катастрофы
Что становится причиной простоев или недоступности бизнеса?
Что собой представляет процесс разработки DRP
1
Требования к системе резервирования ИТ-сервисов
Подготовленный бизнесом Business Impact Analysis (BIA) — анализ воздействия на бизнес
Список ИТ-сервисов
Карта ИТ-сервисов с привязкой к ИТ-ресурсам
Схема текущей инфраструктуры
RTO/RPO/MTDT для резервируемых ИТ-сервисов
2
Анализ рисков
Анализ оценки бизнес рисков
Оценка возможных угроз ИТ-сервисам
Карта рисков и угроз
3
Документация для резервирования
Схема системы резервирования
Описание ИТ-сервисов
Дизайн системы резервирования
4
Основные документы
План восстановления деятельности (DRP)
Орг. структура команды воссановления (DR Team)
Категории инцидентов и сценарии по реагированию
Схема взаимодействия и процесс оповещения сотрудников
Списки ключевых поставщиков и контактов
Детальные Планы действий в режиме ЧС и действий для возврата в штатный режим работы
5
Проведение тестовых испытаний и учений
Планирование: определение целей, рамок и объема тестов
Проведение тестов:
выполнение разработанных планов действий,
проверка временных рамок и инструкций,
оценка результатов тестирования.
6
Обучение сотрудников
Определение целей обучения разных групп сотрудников
Периодическое проведение обучения
7
Поддержание Плана (DRP) и инструкций в актуальном состоянии
Процедуры контроля изменений
Определение ответственных за каждую часть плана
Изменение плана по результатам тестирования
Ключевые точки
Ключевыми характеристиками, определяющими требования к непрерывности ИТ-сервисов, являются параметры — PRO, RTO, MTDT
Максимально допустимое время простоя
Maximum tolerable downtime
Целевое время восстановления, согласованный с бизнесом интервал времени после аварии, необходимый для восстановления IT-сервисов
Recovery Time Objective
Целевая точка восстановления – это согласованный с бизнесом интервал времени, предшествующий аварии, за который допускается потеря данных
Recovery Point Objective
Тестирование BCP и DRP планов должно осуществляться не реже одного раза в год и/или по итогам изменений
Тестирование BCP и DRP
Тестирование проводится в соответствии с календарем тестирования
Отработка навыков работы во время ЧС у сотрудников
Выявления любых недостатков или противоречий в DRP плане
Совершенствования и своевременной актуализации Планов
Тестирование проводится в целях:
Тестирования в реальных условиях
Тестирование резервного центра (Alternate Site Testing), например, переключение в резервный ЦОД или выезд пользователей на работу на резервную площадку
Тестирование ИТ-инфраструктуры и ИТ-сервисов (DR Test)
Совместное с бизнесом тестирование BCP
Тестирование бизнес-функций и процессов (Business Function Testing)
Тестирования на основе симуляции за круглым столом (Table-Top-Drill)
Оповещение сотрудников («Call-tree» тестирование)
Тестирование DRP плана может проводиться в формате:
Что я предлагаю
Отработка планов восстановления и реагирования на ЧС
Выстраивание взаимодействия ИТ и ИБ команд
Определение и закрепление зон ответственности
Обучение сотрудников
Разработка Плана аварийного восстановления систем (DRP)
Разработка DR стратегии и необходимого пакета документов в рамках требований ОНиВД (BCM)
DRP
Выстраивание взаимодействия ИТ и ИБ команд
Выстраивание взаимодействия ИТ и ИБ команд
Определение и закрепление зон ответственности
BIA и критичные системы
Подготовка плана проведения тестирования
Координация работ по разработке DR инструкций для каждой системы
DR документы
Тестирование на основе симуляции за круглым столом
Тестирование процедуры информирования о сбое (Call Tree test)
Тестирование восстановления из резервных копий
Полное или частичное переключение в резервный ЦОД
Координация и сопровождение DR тестов:
Почему Я?
Рекоментации доступны по запросу
Внедрила с нуля в 4 банках — топ 30
Опыт разработки DRP, тестирования и реальных боевых переключений!