План аварийного восстановления

В этом разделе приведен шаблон, на основе которого можно создать собственный план восстановления при аварии.

Раздел 1. Основные цели планирования

Ниже перечислены основные цели этого плана:

Раздел 2. Персонал

Табл. 1. Персонал
Обслуживающий персонал
ФИО Должность Адрес Номер телефона
       
       
       
       
       
       
       
       
       
       
       
       
       
       
       
       
Прим.: К данному разделу должна прилагаться схема организации.

Раздел 3. Профайл приложений

Заполните эту таблицу с помощью команды Показать ресурсы программного обеспечения (DSPSFWRSC).

Табл. 2. Профайл приложений
Профайл приложений
Приложение Ответственное? Да/Нет Постоянный ресурс? Да/Нет Изготовитель Комментарии
         
         
         
         
         
         
         
Обозначения:
  1. Выполняется ежедневно ____________.
  2. Выполняется еженедельно ________.
  3. Выполняется ежемесячно ________.

Раздел 4. Профайл оборудования

Заполните эту таблицу с помощью команды WRKHDWPRD (Работа с оборудованием): Перечень должен включать описание следующих компонентов:

Табл. 3. Профайл аппаратного компонента
Профайл аппаратного компонента
Изготовитель Описание Модель Серийный номер В собственности или арендовано Цена
           
           
           
           
           
           
           
Прим.: Этот перечень должен пересматриваться каждые ________ месяцев.
Табл. 4. Прочее оборудование
Прочее оборудование
Описание Количество Комментарии
     
     
     
     
     
Примечание: Перечень должен включать описание следующих компонентов:
  • Магнитные ленты
  • Программное обеспечение компьютера
  • Оглавление картотеки
  • Оглавление хранилища магнитных лент
  • Пакеты программ-эмуляторов
  • Программы для работы с языками программирования
  • Принадлежности для принтеров (например, бумага и формы)

Раздел 5. Процедуры резервного копирования для информационных служб

Раздел 6. Процедуры аварийного восстановления

Любой план аварийного восстановления должен включать следующие три компонента:

Процедуры реакции на аварийную ситуацию
Здесь должны быть зафиксированы действия персонала в случае пожара или стихийного бедствия, направленные на спасение жизней и уменьшение ущерба.
Процедуры обеспечения работоспособности
Процедуры, обеспечивающие продолжение выполнения основных функций организации после аварии.
Процедуры восстановления
Здесь должны быть описаны действия по восстановлению систем обработки данных после чрезвычайного происшествия.

Справочная таблица действий в случае аварии:

  1. Принятие решения о реализации плана
    1. Уведомление руководства.
    2. Обращение к аварийной группе.
    3. Оценка степени серьезности ситуации.
    4. Начало действий по плану в соответствии с масштабами аварии (см. Раздел 7. План восстановления - мобильный узел).
    5. Контроль за выполнением.
    6. Обращение к резервным системам и составление расписания.
    7. Обращение к персоналу (пользователям и сотрудникам, обеспечивающим обработку данных).
    8. Обращение к поставщикам (программного и аппаратного обеспечения).
    9. Уведомление пользователей о временном прекращении обслуживания.
  2. Последующие действия:
    1. Составление списков рабочих групп и их задач.
    2. Получение резервных денежных средств и налаживание транспортного сообщения с резервным узлом.
    3. Оборудование жилых помещений.
    4. Обеспечение питания персонала.
    5. Составление списка сотрудников с номерами телефонов.
    6. Определение обязанностей сотрудников.
    7. Обеспечение отправки и получения почты.
    8. Обеспечение своевременного снабжения.
    9. Приобретение или аренда необходимого оборудования.
    10. Определение перечня и последовательности запуска необходимых приложений.
    11. Определение необходимого количества рабочих станций.
    12. Определение дополнительного оборудования, необходимого для каждого приложения.
    13. Определение форм, необходимых для каждого приложения.
    14. Проверка всех данных, отправляемых на резервный узел; сохранение копий профайла оборудования на исходном узле.
    15. Обращение за помощью в устранении возникших неполадок к основным поставщикам.
    16. Планирование отправки необходимых дополнительных компонентов на резервный узел.
    17. Составление инструкций по поиску резервного узла.
    18. Проверка наличия дополнительных магнитных лент.
    19. Создание копий системной, рабочей и другой документации.
    20. Проверка знаний сотрудниками своих обязанностей в случае аварийной ситуации.
    21. Уведомление страховых компаний.

Начальные процедуры аварийного восстановления

  1. Уведомление _________ аварийной группы о необходимости аварийного восстановление и передача плана восстановления.
    Прим.: После уведомления _________ о выборе плана восстановления начинается отсчет времени гарантированного ответа.
    1. Номера телефонов для уведомления об аварийной ситуации:

      ________ или
      ________

    По этим номерам следует звонить с ________ до ________ часов с понедельника по пятницу.

  2. Дополнительный номер: ________

    Этот номер для уведомления об аварии в нерабочее время и по нерабочим дням (в выходные и праздничные дни). Пользуйтесь этим номером только для уведомления о действительной аварии.

  3. Передача _________ адреса узла поставщиков оборудования, обеспечение связи, в том числе вспомогательной - для координации действий, а также передача телефонных номеров, по которым связь будет поддерживаться 24 часа в сутки.
  4. Свяжитесь с обслуживающей электростанцией и телефонной станцией, при необходимости организуйте дополнительную служебную связь.
  5. Уведомление _________ в случае необходимости изменения какого-либо плана.

Раздел 7. План восстановления - мобильный узел

  1. Уведомление _________ о природе чрезвычайной ситуации и о необходимости выбора плана организации мобильного узла.
  2. В течение 48 часов с момента телефонного уведомления _________ обеспечение письменного подтверждения.
  3. Подтверждение готовности всех резервных носителей, необходимых для загрузки резервного компьютера.
  4. Подготовка заказа на использование резервного оборудования.
  5. Уведомление _________ о планах по использованию трейлера и о его местоположении (_________ ). (См. План организации мобильного узла.)
  6. Передача телефонной компании (_________) сведений о возможных изменениях в схеме подключения телефонных линий.
  7. Установка систем электропитания и средств связи в _________:
    1. Электропитание и связь должны быть готовы к моменту прибытия трейлера.
    2. Отсоединение административных контроллеров (________) в точке, где к зданию подходят телефонные кабели (________). Эти телефонные линии будут соединены с мобильным узлом. Они будут подключены к модемам мобильного узла.

      Телефонные линии, идущие от ________ к ________, будут затем подключены к мобильному блоку с помощью модемов.

    3. Возможно, от ________ потребуется перенаправление линий комплекса ________ в более защищенное место на случай чрезвычайной ситуации.
  8. Включение питания и проверка работы оборудования после прибытия трейлера.
  9. Установка и проверка работы системы связи.
  10. Загрузка системы с резервных носителей (см. Раздел 9. Восстановление системы).
  11. Обеспечение нормальной работы системы:
    1. Выполнение ежедневных заданий
    2. Выполнение ежедневных операций сохранения
    3. Выполнение еженедельных операций сохранения
  12. Составление расписания резервного копирования системы для ее восстановления на исходном компьютере после введения узла в работу. (Используются стандартные процедуры резервного копирования системы).
  13. Защита мобильного узла и рассылка ключей.
  14. Обязательное ведение протокола обслуживания оборудования мобильного узла.

План организации мобильного узла:

Здесь должен прилагаться план организации мобильного узла.

План действий при аварии системы связи:

Включите в документ план действий по аварийному восстановлению системы связи, в частности схему линий связи.

Обслуживание линий электропитания:

Включите в документ схему линий электропитания.

Раздел 8. План восстановления - Резервный узел

Служба аварийного восстановления обеспечивает работу резервного узла. Этот узел содержит резервную систему, которая будет использоваться временно, пока не продолжит работу основной узел.

  1. Уведомление _________ о природе чрезвычайной ситуации и о необходимости перехода к резервному узлу.
  2. Запрос доставки модемов в _________ для обеспечения связи. (Информацию о системе связи резервного узла можно получить у _________ .)
  3. Составление письменного подтверждения в течение 48 часов с момента телефонного уведомления _________.
  4. Подготовьте отправку рабочей группы на резервный узел.
  5. Проверка готовности всех необходимых магнитных лент к отправке и к последующей загрузке резервной системы.
  6. Подготовка заказа на использование резервной системы.
  7. Перед отъездом на резервный узел проверьте перечень необходимых материалов.
  8. Проверка наличия всей необходимой для восстановления узла информации у аварийной группы, работающей на аварийном узле. (См. Раздел 12. Восстановление аварийного узла).
  9. Обеспечение оплаты транспортных расходов.
  10. По прибытии на резервный узел установите связь с основным узлом.
  11. Проверка доставки всех необходимых материалов на резервный узел.
  12. Загрузка системы с лент, содержащих резервную копию.
  13. Обеспечение нормальной работы системы:
    1. Выполнение ежедневных заданий
    2. Выполнение ежедневных операций сохранения
    3. Выполнение еженедельных операций сохранения
  14. Составление расписания резервного копирования системы для ее восстановления на исходном компьютере после введения основного узла в работу.

Конфигурация резервной системы:

Здесь нужно указать конфигурацию резервной системы.

Раздел 9. Восстановление системы

Для полного восстановления системы после аварийной ситуации выполните действия, указанные в книге Управление системами: Резервное копирования и восстановление.

Перед тем, как начать, найдите в хранилище магнитных лент узла или во внешнем хранилище следующие магнитные ленты, компоненты оборудования и информацию:
  • Изменено Если для установки используется альтернативное устройство, то потребуется как магнитная лента, так и DVD с лицензионным внутренним кодом. Конец изменений
  • Все магнитные ленты с результатами последнего полного сохранения.
  • Магнитные ленты с результатами последнего сохранения идентификационных данных (SAVSECDTA или SAVSYS).
  • Магнитные ленты с результатами последнего сохранения конфигурации.
  • Все ленты, содержащие журналы и получатели журналов, сохраненные во время последней операции ежедневного сохранения.
  • Все магнитные ленты с результатами последнего ежедневного сохранения.
  • Список PTF (сохраненный во время последней операции полного сохранения и/или еженедельного сохранения).
  • Список магнитных лент, сохраненный во время последней операции полного сохранения.
  • Список магнитных лент, сохраненный во время последней операции еженедельного сохранения.
  • Список магнитных лент, сохраненный во время ежедневного сохранения.
  • Протокол хронологии, сохраненный во время последней операции полного сохранения.
  • Протокол хронологии, сохраненный во время последней операции еженедельного сохранения.
  • Протокол хронологии, сохраненный во время последнего ежедневного сохранения.
  • Раздел Установка, обновление и удаление IBM i и связанных программ.
  • Раздел Управление системами: Резервное копирование и восстановление.
  • Телефонный справочник.
  • Руководство по модему.
  • Набор инструментов.

Раздел 10. Процесс восстановления

Управляющая группа должна оценить размер причиненного ущерба и начать восстановление информационного центра.

При восстановлении исходного узла необходимо учитывать следующие факторы:

После того как решение о воссоздании центра обработки данных принято, обратитесь к Раздел 12. Восстановление аварийного узла.

Раздел 11. Тестирование плана аварийного восстановления

Планирование действий в чрезвычайной ситуации должно включать регулярное тестирование и оценку эффективности плана. На процесс обработки данных влияют частые изменения оборудования, программ и документации. Таким образом, план аварийного восстановления - это постоянно изменяющийся документ. Используйте эти справочные таблицы при тестировании, чтобы определить, нужно ли тестировать тот или иной компонент.

Табл. 5. Тестирование плана восстановления
Элемент Да Нет Применимо Не применимо Комментарии
Определите цель тестирования. Какие характеристики плана будут оцениваться?          
Выберите критерии тестирования. Как будет оцениваться эффективность плана?          
Разъясните менеджерам суть и цели тестирования. Заручитесь их согласием и поддержкой.          
Проследите, что менеджеры объявили персоналу о тестировании и об ожидаемом времени выполнения работ.          
По окончании тестирования соберите результаты.          
Оцените результаты. Восстановление выполнено успешно? Если нет, то выясните причины.          
Сделайте выводы на основе результатов тестирования. Если восстановление в простейшем случае прошло успешно, значит ли это, что все основные функции будут восстановлены за приемлемое время?          
Разработайте рекомендации по изменению плана. Установите срок выполнения рекомендаций.          
Проинформируйте всех, кого могут касаться результаты тестирования, включая пользователей и службу контроля.          
Внесите необходимые изменения в документацию по аварийному восстановлению.          
Табл. 6. Объекты тестирования
Элемент Да Нет Применимо Не применимо Комментарии
Восстановление конкретных прикладных систем с помощью файлов и документации, хранящихся вне помещений узла.          
Загрузка системных магнитных носителей и выполнение IPL с помощью файлов и документации, хранящихся вне помещений узла.          
Использование для работы другого компьютера.          
Определение управляющим персоналом приоритетов при использовании систем с ограниченными возможностями.          
Восстановление и нормальное функционирование организации в отсутствие основного персонала.          
Четкость определения в плане областей ответственности и цепочек управления.          
Эффективность мер по защите и возможность их частичной отмены на период восстановительных работ.          
Возможность срочной эвакуации и оказания первой медицинской помощи.          
Способность пользователей систем реального времени работать в условиях временной потери электронной информации.          
Способность пользователей выполнять ежедневные операции при отсутствии в системе второстепенных приложений и заданий.          
Возможность связаться с главными сотрудниками организации или их заместителями.          
Способность персонала, ответственного за ввод данных, обеспечить данными особо важные системы с помощью резервных узлов и альтернативных носителей.          
Доступность периферийного оборудования, например принтеров и сканеров.          
Доступность вспомогательного оборудования, например кондиционеров и средств контроля влажности.          
Работа служб снабжения, транспорта и связи.          
Доставка по назначению выходных данных восстанавливаемого узла.          
Доступность необходимых форм и бумаги.          
Возможность изменить план в случае менее серьезной аварии.          

Раздел 12. Восстановление аварийного узла

Вендоры:

План этажей:

Здесь должен прилагаться поэтажный план здания.

Раздел 13. Запись изменений плана

Регулярно обновляйте план. Сохраняйте записи об изменениях конфигурации, приложений, а также изменения расписания и процедур резервного копирования. Например, список текущего локального аппаратного обеспечения можно получить с помощью следующей команды:
DSPHDWRSC OUTPUT(*PRINT)