Новости

Новости 27-12-2019

Описание событий 51 недели 2019 года. Недоступность сервиса.

В этом сообщении хотелось бы описать события последних нескольких дней.

Все, кто активно пользуется нашей системой, знает, что утром 17.12.2019 произошел сбой в работе нашего сайта.

Эта ситуация возникла в результате того, что у нашего хостинг-провайдера ihor.ru, с которым мы без видимых проблем работали последние три года, случился конфликт интересов собственников.

Вдаваться в подробности не будем, кто захочет их сам найдет, однако в результате этого конфликта в ДЦ (Дата-центр), в котором мы арендовали серверы, просто отключили питание и не включали в течение 2 суток.

Все это время никто не мог работать в системе, а мы не могли даже забрать данные, поскольку актуальные бэкапы хранились там же (это, конечно, было нашей ошибкой, которая могла привести к плачевным последствиям).

Но мы не теряли зря время, а восстанавливали систему на новом сервере, который арендовали на Яндекс Облаке.

Вечером 18.12.2019 победил здравый смысл над жадностью, и питание в вышеупомянутом ДЦ восстановили на время, для того чтобы все арендаторы смогли забрать свои данные.

Таким образом, несмотря на двухдневный простой, нам удалось восстановить актуальные данные на момент отключения.

19.12.2019 мы запустили систему в работу, однако понадобилось еще некоторое время для того чтобы заново настроить правильную работу сервера со всеми службами системы.

И вот на данный момент можно говорить с уверенностью, что мы полностью восстановились и готовы дальше работать в штатном режиме.

В результате этого сбоя мы пересмотрели наш подход к отказоустойчивости системы и решили применить следующие меры:

  1. Мы арендовали основной сервер у одного из самых надежных хостинг-провайдеров России Яндекс Облако (на заграничных серверах мы не имеем права хранить данные пользователей).
  2. Мы делаем ежесуточные бэкапы системы на 3 независимых друг от друга ресурса Яндекс.Диск, Google Drive, Dropbox.
  3. В ближайшее время мы арендуем еще один сервер, который будет работать параллельно с основным в другом ДЦ и будет в режиме онлайн синхронизироваться с основным.

Таким образом, при возникновении проблем на основном сервере мы в течении 5 минут сможем переключиться на резервный без потери данных и времени на восстановление.

Все вышеперечисленное должно будет позволить нам качественно поднять отказоустойчивость системы.

Далее наша команда хотела бы выразить благодарность всем, кто попал в зависимость от этой ситуации, и тем, кто был максимально сдержан и корректен в высказывании возмущений в наш адрес, и тем, кто, понимая, молча ждал восстановления системы, и, особенно, тем, кто поддерживал нас добрым словом, верил в нашу команду и тестировал вместе с нами наши новые настройки.

Мы с пониманием примем решение тех, кто захочет расстаться с нами и поискать что-то другое, и с благодарностью тех, кто останется с нами.

В качестве компенсации 2-х дневного простоя, и периода перебоев во время настройки системы, сроки действия лицензий будут продлены на 7 дней. Обновление сроков лицензий будет произведено 27.12.2019.

Надеемся в данном сообщении есть ответы на все ваши вопросы касаемо последних событий произошедших с нашим проектом.

Закончить хотелось бы всем известной фразой Ницше «Все что нас не убивает, делает нас сильнее.».

С наступающим Новым годом!

Удачи и успехов в бизнесе в новом году.

С уважением, команда проекта webmoika.ru

Записаться на автомойку