100% людей, потерявшихся в лесу и попавших в неприятности, не планировали потеряться и попасть в неприятности. 100% админов, пострадавших от критического падения инфраструктуры в результате тяжелой аварии в датацентре, не планировали, что датацентр может упасть.

Поставим точку в этой проблеме. Мы разберём самый (прям самый) крайний случай и ответим на вопрос: как сделать так, чтобы ваши данные пережили самый настоящий апокалипсис

Нужно ли думать об атаках пришельцев?

Датацентры строятся так, чтобы в случае критических проблем серверная инфраструктура, которая в них размещается, продолжала работать, несмотря ни на что:

  • На случай обрыва соединения с сетью каждый ДЦ подключается к нескольким провайдерам по разным линиям.
  • На случай сбоев в подаче электроэнергии ставятся дизельные генераторы.
  • На случай выхода из строя жестких дисков ставятся дублирующие винты и RAID массивы.
  • На случай войны и взрывов строятся толстые стены и пуленепробиваемые двери.
  • На случай атак террористов ставятся сложные замки и системы ограничения доступа посторонних в помещения.

А вот на случай ядерного взрыва, войны с пришельцами, масштабного землетрясения или падения матеорита — не делается ничего.

Логика в том, что от происшествий такого масштаба инфраструктуру датацентра защитить с гарантией невозможно. Атака пришельцев может привести, например, к полному обрыву всех наземных линий связи. Ядерный взрыв может полностью уничтожить данные на винтах — электромагнитное излучение физически сотрет все данные на дисках. И от этого (ох-ах!) не защититься.

Но спасение — есть!

Как сделать бизнес устойчивым ко всем этим катаклизмам?

Если враждебное государство скинуло атомную бомбу на датацентр, в котором находились все ваши серверы и лежали все данные — то все, вашему бизнесу конец. У вас не останется ни инфраструктуры, ни данных.

Возможно, вы были мудры и делали бэкапы в датацентре в другом городе — тогда у вас останутся данные. Но даже в этом случае ваш бизнес уйдет в даунтайм до тех пор, пока админы не поднимут новую инфраструктуру в новом датацентре и не накатят бэкапы. Для этого им нужно будет пересоздать с нуля и сконфигурировать все серверы приложений и баз данных. Только после этого можно будет загрузить в систему из бэкапов баз данных последние наборы данных. А это занимает кучу времени.

Единственное решение на случай катастроф такого масштаба можно образно назвать «бэкапом датацентра». Вы задействует несколько датацентров, которые находятся как можно дальше друг от друга, и поддерживаете между ними полную синхронную репликацию инфраструктуры и данных. В резервных датацентрах наготове стоят резервные наборы сконфигурированных серверов с полным и актуальным набором данных. С такой подготовкой сразу после начала войны с зелеными человечками с Марса вы за несколько минут переведете всю операционную деятельность в другой датацентр, который не попал под раздачу, и продолжите работу дальше. Такой перескок на другой датацентр называется аварийным восстановлением IT-инфраструктуры, а сама инфраструктура в такой конфигурации называется катастрофоустойчивой.

Облачный сервис для аварийного восстановления инфраструктуры
Надежность с SLA 99,95%, финансовые гарантии
Перейти

Готовимся к апокалиписису

Допустим, ваш бизнес — банковские услуги. И вам никак нельзя оставить людей без денег, даже если банда пьяных экскаваторщиков своими экскаваторами одновременно перерубит все подземные линии связи в датацентре.

Вы решаете продублировать инфраструктуру и данные сразу в несколько датацентров. Зовете админов и ставите ему задачу. А админы вам и говорят: «Дядь, дублировать инфраструктуру и мониторить сбои сложно и недешево. Нужно закупать больше оборудования и настраивать всю инфраструктуру сразу в нескольких датацентрах. А ещё надо бы нанять двух дополнительных админов и их начальника. В каждый резервный датацентр». Так как админы совершенно правы, вы впадаете в уныние. Но задачу доступности вашего банка в случае конца света решать как-то нужно.

Чтобы выручить вас в этой непростой ситуации, некоторые (далеко не все) провайдеры облачной инфраструктуры разработали для вас системы восстановления инфраструктуры на случай Судного Дня — в виде сервиса.

Главный принцип этого сервиса — в том, что вы ни покупаете сервера, ни нанимаете новых админов. Всё это предоставляет вам провайдер. Для этого сразу в нескольких датацентрах под вашу компанию резервируются дополнительные серверы. Данные, которые вы пишете в основном датацентре, автоматически реплицируются во все резервные датацентры сразу. Система поддержания работоспособности мониторит доступность всех копий инфраструктуры и в случае выхода из строя основного датацентра за несколько минут автоматически перезапускает все ваше хозяйство вместе с данными на резервной площадке.

В случае атаки марсиан ваш банк снова будет полностью доступен уже через несколько минут. Все ваши клиенты смогут пойти в ближайший оружейный магазин за дробовиками и расплатиться картами вашего банка. Клиенты банков с менее предусмотрительными админами останутся без дробовиков и падут жертвами инопланетной агрессии.

Какие преимущества?

  1. Все тяжелые и дорогие работы по резервированию мощностей, мониторингу и репликации уже решены за вас. Квалифицированные администраторы провайдера облачных мощностей все сами настраивают и готовят оптимальным образом.
  2. Вам не нужно покупать второй-третий-четвёртый резервный датацентр и забивать их новыми серверами. Так что вместо оплаты дорогостоящей резервной инфраструктуры (кратно стоимости вашей основной) вы оплачиваете некую разумную сумму за то, что провайдер организует синхронизацию данных между рабочим датацентром и резервными площадками и держит для вас наготове мощности, которые будут задействованы в случае сбоя. Для более требовательных клиентов можно держать уже прогретые, настроенные и готовые к работе серверы — это подороже, но переключение на резервный ДЦ пройдет намного быстрее. А это важно для тех, кто работает, скажем, с финансовыми операциями.
  3. Мониторить состояния разных датацентров вам тоже не нужно — провайдер все делает за вас и в случае сбоя переключение на дублирующиеся мощности произойдет без вашего участия.

Кому это надо и зачем?

Если вы держите небольшой бизнес, которому позволителен даунтайм в пару часов на время атаки инопланетян — резервная инфраструктура вам, скорее всего, не понадобится. Но если для пользователей вашего бизнеса даже 10 минут простоя критичны — обязательно готовьте резервную инфраструктуру.

Это касается финансовых и транспортных компаний, медицинских сервисов, телекоммуникационных операторов, провайдеров важных системообразующих услуг, правительственных организаций.

Возможно, резервная инфраструктура на случай конца света вам никогда и не понадобится. Но если Апокалипсис произойдет — это не станет апокалипсисом для вашей компании.