Несколько лет назад нас вызвали на диагностику после аварии. IT-компания. Серверная 40 кв. м, два обычных бытовых кондиционера по 3,5 кВт каждый. Летом в жаркую неделю один из кондиционеров вышел из строя. Второй не справлялся один. Температура в серверной за несколько часов поднялась до +38°C. Часть серверов ушла в защитное выключение, часть продолжала работать — и через несколько часов несколько из них вышли из строя от перегрева.
Что потеряла компания
Три сервера вышли из строя физически: сгорели процессоры и материнские платы. Стоимость замены — около 400 тысяч рублей. Данные на одном из серверов оказались повреждены — частичная потеря базы данных клиентов. Восстановление из резервной копии заняло почти сутки. Сутки простоя для IT-компании с 50 клиентами — это аварийные уведомления, возврат оплаты за простой, репутационные потери.
Примерная оценка прямых и косвенных потерь: 1,5-2 миллиона рублей. Стоимость нормальной прецизионной системы охлаждения по схеме N+1 для той же серверной — 350-500 тысяч рублей.
То есть правильное охлаждение окупилось бы от первой же аварии которую предотвратило бы.
Почему обычные кондиционеры не подходят для серверных
Три причины. Первая: обычный кондиционер не рассчитан на работу 24/7/365. У него нет резервирования. Когда он ломается — система встаёт. Серверная не может ждать пока приедет мастер в рабочее время.
Вторая: точность поддержания температуры. Обычный кондиционер держит температуру с погрешностью ±3-5°C. Включился, охладил до +19, выключился. Пока не включится снова — температура ползёт вверх. Прецизионный кондиционер держит ±1°C непрерывно — компрессор не выключается.
Третья: влажность. Обычный кондиционер в режиме охлаждения снижает влажность, иногда до 20-30%. При такой влажности возникает статическое электричество — риск для электронных компонентов. Прецизионный кондиционер поддерживает влажность в диапазоне 40-60% через встроенный увлажнитель.
Как правильно организовать охлаждение серверной
Схема N+1 как минимум. Два прецизионных кондиционера: один рабочий, второй в горячем резерве. При выходе из строя основного второй автоматически берёт нагрузку. Никакого участия человека, никакого времени реакции.
Правильное воздухораспределение. Для серверных со стоечным оборудованием — напольная подача холодного воздуха через фальш-пол. Стойки расставляются по принципу «холодный коридор — горячий коридор»: серверы забирают холодный воздух спереди, выбрасывают горячий сзади. Горячий коридор изолируется и горячий воздух направляется обратно к кондиционерам. КПД такой схемы значительно выше чем при подаче с потолка.
Мониторинг. Датчики температуры и влажности в нескольких точках серверной. Уведомления на телефон при выходе параметров за пределы нормы. Это позволяет среагировать до того как стало критично — а не когда уже началось аварийное выключение.
Питание системы охлаждения. Это часто упускают: кондиционеры серверной должны питаться от отдельного ввода или от ИБП. При отключении основного питания серверы переходят на ИБП и продолжают работать — выделяя тепло. Если кондиционеры при этом встали — через 20-30 минут серверная превратится в духовку.
Сколько стоит правильное решение
Небольшая корпоративная серверная 30-50 кв. м: два прецизионных кондиционера по 12-15 кВт по схеме N+1 — 300-500 тысяч рублей под ключ. Для коммерческого дата-центра с требованиями Tier III — значительно дороже, там другой масштаб и требования к резервированию.
Многие компании смотрят на эту цифру и выбирают «пока поставим два бытовых кондиционера, сэкономим». Это работает — до первой аварии. После первой аварии обычно всё-таки ставят нормальное оборудование. Жаль только что с уже понесёнными потерями.
Серверная — это не место для экономии на охлаждении. Стоимость оборудования внутри и стоимость простоя бизнеса несопоставимы со стоимостью правильной системы охлаждения.
Мониторинг: как не пропустить проблему
Серверная без людей большую часть времени. Никто не заходит и не замечает что стало жарче. Проблема обнаруживается когда уже поздно — серверы начали уходить в защиту или вышли из строя.
Минимальный мониторинг: датчик температуры с уведомлениями на телефон при превышении порогового значения. Пороги: предупреждение при +25°C, критическое при +28°C. Это даёт время среагировать до того как оборудование начнёт страдать.
Нормальный мониторинг: несколько датчиков в разных точках серверной (температура у входа воздуха, на выходе из стоек, общая температура в зале), датчик влажности, статус обоих кондиционеров. Всё это в одном интерфейсе с историей и уведомлениями. Стоимость такой системы — 30-80 тысяч рублей в зависимости от количества точек. На фоне стоимости оборудования — незначительно.
Что делать если серверная уже есть с обычными кондиционерами
Не нужно срочно всё менять если пока всё работает. Но стоит сделать несколько вещей.
Первое: поставить датчик температуры с уведомлениями. Это минимальная страховка и стоит копейки.
Второе: убедиться что кондиционеры реально справляются с нагрузкой. Измерить температуру в серверной в жаркий летний день в час пик нагрузки на оборудование. Если выше +25°C — система не справляется.
Третье: запланировать переход на нормальное решение. Не обязательно прямо сейчас, но при следующем обновлении оборудования или расширении — заложить в бюджет нормальное охлаждение. Это дешевле чем восстановление после аварии.