ПРОБЛЕМА
У хостинг-провайдера было арендовано 12 серверов по довольно высоким тарифам, это должно было обеспечить хорошее качество работы. Изначально серверы работали приемлемо, пока мощности компании не начали стремительно расти. C ростом количества страниц сайтов, качество хостинга сильно упало. После детального анализа было обнаружено огромное количество багов в системе виртуализации (от некорректного учета расхода ОЗУ в гостевой ОС до проблем с подсчетом inode при использовании всего 50% дискового пространства). Мониторинг всей инфраструктуры ограничивался баш-скриптами на самих машинах и практически не информативным и плохо настроенным Cacti. Любая из возникших проблем приводила к даунтайму от 10 минут до 2х часов
РЕШЕНИЕ
В первую очередь было принято решение снизить даунтайм в условиях текущего хостинга. Для этого была проделана большая работа по кластеризации web-приложений, баз данных, файлов сайта и CRM компании, проведена оптимизация настроек web-приложения. Мы смогли устранить нестабильно работающую структуру серверов и продумать решение систем отказоустойчивости. Стоит отметить, что удалось также победить проблему отдельных страниц CRM, которые могли загружаться до 5-10 минут, сайт плохо держал нагрузку, скрипты проверки часто фиксировали время ответа страниц каталога 10 и более секунд.
__________________________________________________________________________________
После проведенных работ все сайты были перенесены на более совеременные и скоростные серверы. Был создан кластер базы данных с оптимизированным распределением запросов и последовательной проверкой доступности каждой ноды в кластере перед отправкой запроса. Кроме того, специально для потребностей клиента была реализована уникальная настройка мониторинга zabbix с смс-оповешением. В результате удалось добиться показателя доступности сайтов KPI=100%
Проведите конкурс среди участников CMS Magazine
Узнайте цены и сроки уже завтра. Это бесплатно и займет ≈5 минут.