Мы — команда, создающая и поддерживающая высоконагруженный онлайн-проект (онлайн-казино), где ключевые процессы завязаны на Kubernetes, Bare Metal-инфраструктуру и облачные решения. Мы строим надёжную, автоматизированную и безопасную платформу, используя DevSecOps-подход, GitOps-стратегии и принципы Observability.
Сейчас мы ищем Lead DevOps/SRE-инженера, который возьмёт на себя архитектуру, управление командой и оптимизацию инфраструктуры.
Чем предстоит заниматься?
Руководство командой SRE/DevOps
- Планирование задач, формирование roadmap по развитию инфраструктуры.
- Координация с разработчиками, QA и отделом безопасности.
- Наставничество, код-ревью, повышение эффективности команды.
☁️ Архитектура и управление Kubernetes
- Развёртывание кластеров Kubernetes на Bare Metal (HA, 3+ мастер-ноды).
- Выстраивание гибридной инфраструктуры (on-prem + облако через VPN, Terraform, Ansible/Kubespray).
- Внедрение GitOps-практик (Argo CD, Flux), автоматизация деплоя и обновлений.
DevSecOps и безопасность
- Автоматизированное сканирование уязвимостей (SAST/DAST), проверка контейнеров (Trivy, Clair).
- Управление секретами (HashiCorp Vault, Sealed Secrets, External Secrets).
- Настройка RBAC, NetworkPolicy, OPA/Gatekeeper/Kyverno, Pod Security Policies.
- Ведение аудита безопасности и логов Kubernetes.
Observability и мониторинг
- Настройка метрик (VictoriaMetrics, Prometheus), логирования (EFK, Loki), дашбордов (Grafana).
- Определение SLA/SLO/SLI, настройка Alertmanager и автоматизация инцидент-менеджмента.
- Регулярные постмортемы, улучшение отказоустойчивости.
⚙️ Автоматизация инфраструктуры
- Управление инфраструктурным кодом (Terraform, Ansible, Kubespray).
- Разработка CI/CD-процессов (GitLab CI, Jenkins).
- Оптимизация артефакт-хранилищ (Harbor, Nexus, Artifactory).
Эксплуатация и оптимизация
- Обеспечение HA (High Availability) и масштабируемости платформы.
- Инцидент-менеджмент (ротация 24/7 on-call), анализ первых симптомов.
- Оптимизация затрат между on-prem и облаком, авто-масштабирование.
Что важно для этой роли?
✅ Опыт работы с Kubernetes в продакшене (3+ года), предпочтительно на Bare Metal.
✅ Глубокое понимание контейнеризации (Docker/containerd, CRI), сетевых плагинов (Calico/Cilium).
✅ Навыки GitOps (Argo CD, Flux), CI/CD (GitLab CI, Jenkins, Tekton).
✅ Практический опыт DevSecOps (сканирование уязвимостей, shift-left security, безопасные конфиги).
✅ Инфраструктура как код: Terraform, Talos, Ansible, Rancher, Kubeadm.
✅ Безопасность и управление доступами: HashiCorp Vault, Sealed Secrets, RBAC, cert-manager.
✅ Мониторинг и Observability: Prometheus, VictoriaMetrics, Grafana, Loki, SLA/SLO/SLI.
✅ Лидерские навыки: опыт управления командой (2–5+ инженеров), планирование задач, менторство.
✅ Networking: VPN/IPSec/OpenVPN/WireGuard, балансировка L7 (Nginx, HAProxy, Traefik).
Будет плюсом:
➕ Опыт работы с сервис-мешами (Istio, Linkerd, Kuma), OpenStack, Proxmox.
➕ Знание Go/Python для написания операторов и автоматизации процессов.
➕ Участие в Open Source-проектах, выступления на конференциях.
➕ Опыт работы в FinTech, iGaming или High-load-проектах.
Что предлагаем?
✔️ Развитие гибридной высоконагруженной инфраструктуры (Bare Metal + облако).
✔️ Возможность влиять на архитектуру и технологический стек.
✔️ Работа с современными DevOps/SRE-инструментами: Kubernetes, GitOps, DevSecOps, Observability.
✔️ Команда профессионалов, с которой ты будешь строить надёжную и безопасную платформу.
✔️ Конкурентная компенсация, гибкий график, бонусы за SLA uptime.
✔️ Поддержка профессионального развития (сертификации, конференции, курсы).
✔️ Рост до Head of Infrastructure.
Если тебя интересует эта роль — будем рады обсудить детали!
Ключевые навыки
- Kubernetes
- Bare Metal
- Docker/containerd, CRI
- Calico/Cilium
- GitOps
- CI/CD
- DevSecOps
- Terraform, Talos, Ansible, Rancher, Kubeadm
- HashiCorp Vault, Sealed Secrets, RBAC, cert-manager
- Prometheus, VictoriaMetrics, Grafana, Loki, SLA/SLO/SLI
- VPN/IPSec/OpenVPN/WireGuard, балансировка L7
Задайте вопрос работодателю
Вакансия опубликована 1 апреля 2025 в Москве