💼

Аналитика ИТ-инфраструктуры

Комплексный обзор ресурсов и эффективности

Октябрь 2025 • ЦОД Байт • Цифротека

Резюме

Что важно знать за 30 секунд

🖥
728
Серверных мощностей

Имеется в распоряжении: 800

📊
2.2 ТБ
Оперативной памяти

Имеется в распоряжении: 3 ТБ

💾
34 ТБ
Хранилище данных

Имеется в распоряжении: 58 ТБ

🎯
74%
Утилизация мощностей
↑ Эффективно
💡 Ключевой вывод: Инфраструктура работает стабильно и эффективно. Есть возможности для оптимизации (~15% экономии) через консолидацию виртуальных машин.

Как устроена наша инфраструктура

Простым языком о сложном

🎯 Контур 1: Kubernetes

75%
548
Серверных ядер
1.4 ТБ
Памяти

Современная платформа для запуска приложений. Автоматически распределяет нагрузку.

VS

🖥️ Контур 2: Виртуальные машины

25%
180
Серверных ядер
0.8 ТБ
Памяти

Традиционные виртуальные серверы. Используются для специальных задач (ML, инфраструктура).

👥 Для чего это нужно: Контур 1 обслуживает все продуктовые системы (сайты, приложения). Контур 2 - для машинного обучения и вспомогательных сервисов. Это как офис с open-space (Контур 1) и отдельными кабинетами (Контур 2).

Распределение ресурсов по назначению

На что тратятся вычислительные мощности

По окружениям

Продуктив (39%) - боевые системы для клиентов
Разработка (24%) - создание новых функций
Тестирование (22%) - проверка перед выпуском
Инфраструктура (15%) - внутренние сервисы
🚀
39%
На продуктивных системах

Это системы, которые используют наши клиенты прямо сейчас

↑ Приоритет #1
🧪
46%
На разработку и тесты

Создание новых функций и проверка качества

⚠ Можно оптимизировать
⚙️
15%
Служебная инфраструктура

Системы мониторинга, безопасности, хранения кода

Крупнейшие потребители ресурсов

Топ-6 проектов по загрузке инфраструктуры

🧠
Машинное обучение
502 GB памяти
🎪
Мероприятия
Сложные базы данных
🧭
Навигатор
19 серверов
📊
Аналитика
Обработка больших данных
📌 Интересный факт: Проект "Машинное обучение" на 2 серверах использует столько же памяти, сколько все остальные проекты на 43 серверах вместе взятые.

Эффективность и утилизация

Насколько полно мы используем ресурсы

CPU

~2%
Средняя загрузка
Есть резерв для роста

Память (RAM)

~18%
Средняя загрузка
Оптимальный уровень

Хранилище

~20%
Средняя загрузка
Некоторые диски заполнены
✅ Хорошие новости: Низкая загрузка CPU и памяти означает, что система работает без перегрузок и готова к росту нагрузки. Однако есть возможность сократить избыточные мощности для экономии.

Наши продукты на инфраструктуре

Что мы обслуживаем

🎯 Основные продукты

🧭
Навигатор
19 серверов • Все окружения
📊
Вектор
6 серверов • Разработка + Тест
💜
Виолетта
4 сервера • Разработка + Прод
🎪
Мероприятия
Мощные базы данных

🗄️ Базы данных

Всего 16 инстансов баз данных обслуживают все продукты
16
Баз данных
4
Хранилища S3
45
Виртуальных машин
25
Узлов Kubernetes

Возможности для улучшения

Где можно повысить эффективность

1. Консолидация проекта "Навигатор"

Высокий эффект
38
CPU Cores
76 GB
RAM
1.3 ТБ
Storage

Текущая ситуация: 19 виртуальных машин для одного проекта

Предложение: Миграция в контур Kubernetes

Эффект: Экономия ~10-15% ресурсов, упрощение управления

Фаза 1 (1-2 мес)

Подготовка и пилот

Фаза 2 (2-3 мес)

Миграция окружений

Фаза 3 (1 мес)

Оптимизация и вывод из эксплуатации старых ВМ

2. Балансировка окружений

Средний эффект
134
CPU Cores
268 GB
RAM
~1.1 ТБ
Storage

Текущая ситуация: Препрод и Разработка используют одинаково ресурсов (по 134 cores и 268 GB RAM)

Предложение: Оптимизация размера препрод окружения до 50-70% от прода

Эффект: Освобождение 50-100 CPU cores и 80-130 GB RAM

3. Аудит инфраструктурных ВМ

Средний эффект

Текущая ситуация: 12 ВМ в категории "Инфраструктура" занимают 80% RAM виртуального контура

Предложение: Анализ необходимости каждой ВМ

Эффект: Возможная экономия 20-30% ресурсов VM

4. Мониторинг утилизации

Долгосрочный эффект

Предложение: Внедрение системы автоматического мониторинга загрузки

Цель: Выявление недоиспользуемых ресурсов

Эффект: Непрерывная оптимизация, экономия 5-10% ежегодно

Потенциал оптимизации

Прогнозируемый эффект от внедрения рекомендаций

💰
10-15%
Потенциал экономии

От текущих затрат на инфраструктуру

↑ Быстрый эффект
30%
Упрощение управления

Меньше серверов = меньше сложности

↑ Снижение рисков
🚀
2x
Запас для роста

Готовность к удвоению нагрузки

↑ Масштабируемость

Ожидаемый эффект по этапам

🎯 Итого: Внедрение всех рекомендаций позволит высвободить 100-150 CPU cores и 200-300 GB RAM, что эквивалентно 10-15% текущей инфраструктуры. Срок окупаемости работ: 3-4 месяца.

План действий на следующие 6 месяцев

Пошаговая стратегия оптимизации

Месяц 1-2: Подготовка

• Детальный аудит проекта "Навигатор"
• Разработка плана миграции
• Подготовка тестовой среды в Kubernetes

Месяц 2-3: Пилот

• Миграция Dev окружения Навигатора
• Тестирование и отладка
• Оценка результатов

Месяц 3-4: Масштабирование

• Миграция Preprod и Demo окружений
• Балансировка ресурсов
• Оптимизация конфигураций

Месяц 5: Продуктив

• Миграция Production окружения
• Мониторинг стабильности
• Документирование процессов

Месяц 6: Завершение

• Вывод из эксплуатации старых ВМ
• Внедрение системы мониторинга
• Подготовка отчета об экономии

6
Месяцев
3-4
Месяца окупаемость
10-15%
Экономия
Низкий
Риск

Ключевые выводы

Что важно запомнить

✅ Что работает хорошо
  • Инфраструктура стабильна и надежна
  • Kubernetes эффективно обслуживает основные продукты
  • Есть запас мощности для роста (2x)
  • Все критичные системы резервированы
⚠️ Что можно улучшить
  • Избыточность виртуальных машин (особенно Навигатор)
  • Неоптимальная балансировка между окружениями
  • Отсутствие автоматического мониторинга утилизации
🎯

Следующие шаги

1. Немедленно (эта неделя)
Утверждение концепции оптимизации
2. Краткосрочно (1 месяц)
Начало аудита и планирования миграции
3. Среднесрочно (3-6 мес)
Реализация плана оптимизации
4. Долгосрочно (постоянно)
Непрерывный мониторинг и улучшение
💡 Итоговая рекомендация:

Начать с пилотного проекта миграции Навигатора в Kubernetes. Это принесет быстрый измеримый результат (10-15% экономии) с минимальными рисками. После успешного завершения масштабировать подход на другие проекты.

🎯

Спасибо за внимание!

1 / 12