Вакансия
Город

Вакансия • Senior DevOps / Site Reliability Engineer, SRE, Москва

New,
📆 2026-01-10
Работа • Москва
З/п 3000 ք
Нейротехнологии (Вакансия работодателя)
Адрес места работы:
Москва
Тип занятости: Полная занятость
График работы: Удаленная работа

Наш проект — GPU-платформа на ранней стадии, где мы строим собственную инфраструктуру для ML / AI-нагрузок с фокусом на безопасность, изоляцию клиентов и стабильную работу GPU-серверов.

Сейчас мы в поиске сильного Senior DevOps / SRE, который возьмёт на себя построение и развитие GPU-инфраструктуры, автоматизацию onboarding’а серверов, безопасность и orchestration вычислений, а также станет ключевым техническим партнёром для продукта.

Задачи:

- Подключение и активация GPU-серверов (host onboarding): установка и поддержка daemon’а платформы, автоматические проверки GPU, драйверов, CUDA/cuDNN, стабильности
- Формирование и поддержка “паспорта машины” (inventory): модель GPU, VRAM, состояние, ошибки, метрики
- Проектирование и реализация изоляции клиентов:
* Docker + NVIDIA Container Toolkit
* namespaces / cgroups
* управление секретами (tokens, SSH keys)
* сетевая изоляция (firewall, zero-trust подход)
- Запуск и управление вычислительными задачами (training / inference):
* лимиты CPU / RAM / Disk / GPU
* очереди, статусы, retry-механики
- Настройка логирования, метрик и алертов
- Интеграции с S3-совместимыми хранилищами, volumes, кеширование датасетов, checkpointing

Что нам важно:

- Уровень Middle+ / Senior DevOps или SRE
- Сильный Linux (администрирование, а не “пользователь”)
- Практический опыт с Docker и контейнерной изоляцией
- Опыт работы с NVIDIA stack: drivers, CUDA, nvidia-smi, NVIDIA Container Toolkit
- Понимание сетевой безопасности и изоляции
- Опыт работы с GPU-серверами — обязателен

Будет большим плюсом:

- Kubernetes + GPU scheduling
- Terraform / Ansible
- опыт с RunPod / Vast / Lambda / CoreWeave
- понимание ML-нагрузок (training vs inference)

Условия:
- Формат работы: удалённо
- График работы: full-time 5/2, готовность быть гибким и работать на результат
- Заработная плата: обсуждается индивидуально (фикс + бонусы)

Опыт работы (лет): От 1 года до 3 лет
Адрес на карте:
Updated: 11 January 2026


ПОДЕЛИТЬСЯ


Дистанционное обучение ВКонтакте онлайн Дистанционное обучение TikTok онлайн Дистанционное обучение YouTube онлайн Дистанционное обучение онлайн

Похожие вакансии:

Ведущий менеджер по продажам B2B
Алматы •
Центр профессиональной подготовки Nurikon
З/п: от 300000 до 1500000 KZT

Помощник бухгалтера
Ташкент •
Everest Building Group
З/п: от 7000000 UZS

Администратор
Брест •
Центр микрохирургии глаза Макарчука
З/п: от 1300 BYR

Бухгалтер на первичную документацию
Петропавловск •
КУБЕРА.KZ
З/п: от 350000 KZT

Заместитель директора по эксплуатации
Усть-Каменогорск •
Astranium
З/п: от 800000 до 1000000 KZT

Помощник бухгалтера
Актау •
TenizStroy
З/п: от 200000 до 250000 KZT

Работа в России, Москва - Свежие вакансии на Kit-Jobs.Ru

Работа в городах России - свежие вакансии (469927) на Kit-Jobs.Ru: Вакансия работодателя • Нейротехнологии - Senior DevOps / Site Reliability Engineer, SRE, Москва. Здесь Вы можете ознакомиться с вакансией работодателя бесплатно онлайн.

Наш портал является бесплатным онлайн сервисом поиска работы по базе вакансий от прямых работодателей, по размеру заработной платы и прочим параметрам в регионе Москва. На портале также имеются такие разделы как: ежедневно обновляемая база свежих вакансий по всем городам России, юридические консультации, сервисы, форма для создания резюме онлайн в формате .DOC, новости рынка труда России и другие разделы.





Возможно вам это интересно:


Работа в России от прямых работодателей свежие вакансии - Kit-Jobs.Ru Work in Russia 
Сбор на IT-проект
ПОЖЕРТВОВАТЬ




Sunday 11 January 2026


+
facebook