Вакансия • ML / LLM Engineer (Production Agentic Systems), Москва
Команда Production IT растет и развивается.
Нам нужен специалист с практическим, коммерческим опытом внедрения MCP-агентов (Model Context Protocol) в production-среду. Это ваш главный козырь. Вы — человек, который понимает, как заставить агентов работать в реальном мире, а не только в демо-режиме.
При этом вы крепко стоите на ногах в фундаментальных вещах: вы знаете базу машинного обучения. У вас есть опыт разработки (Python или JS — не принципиально, важна архитектурная мысль), и вы способны синхронизировать между собой разные части проекта и мнения менторов. Вы — тот самый человек, который превращает разрозненные задачи в работающую систему.
Обязанности:
Агентные системы и RAG:
- Внедрение и поддержка MCP-агентов для AI-ассистента.
- Реализация и оптимизация RAG-пайплайнов (подготовка .md документации, структурирование данных).
- Работа с LangGraph (проектирование state и nodes для сложных сценариев).
- Логирование и трассировка через LangSmith.
ML и LLM (NLP/CV):
- Подбор и тестирование LLM (Qwen, Llama, Solar, Saiga) под узкие бизнес-кейсы.
- Prompt engineering и работа со structured output.
- Обучение и дообучение моделей: NER, детекция layout документов (целевой mAP 0.85), детекция текста (MMOCR), классификация шрифтов и стилей (ResNet18, YOLOv7).
- Оценка качества изображений (шум, размытие, перспектива).
Продакшн и инфраструктура:
- Разработка ML API на FastAPI, рефакторинг и переработка существующих API (в т.ч. Django-сервисов).
- Оптимизация инференса под капотом: потребление памяти, скорость (vLLM, работа на CPU/GPU).
- Работа с очередями и БД: Redis Streams, InfluxDB.
- Мониторинг и визуализация: построение дашбордов в Grafana, сбор метрик качества и производительности (mAP, F1, precision/recall).
- Контейнеризация сервисов через Docker-compose.
Ожидаем от кандидата:
- Коммерческий опыт внедрения MCP-агентов (обязательно).
- Практический опыт построения RAG-архитектур и работы с LLM в продакшне.
- Уверенное знание Python (FastAPI / Django) и понимание принципов инференса моделей.
- Опыт обучения CV/NLP моделей и понимание метрик качества.
- Опыт контейнеризации (Docker) и построения ML-сервисов с системой логирования/мониторинга.
- Навыки системного мышления и коммуникации: вы умеете синхронизировать задачи между разными участниками процесса (менторами, разработчиками, аналитиками).
Будет плюсом:
- Опыт работы с банковскими или финтех-проектами (понимание специфики безопасности и надежности).
- Опыт оптимизации инференса под ограниченные ресурсы (экономия железа без потери качества).
- Опыт построения пайплайнов автоматического переобучения моделей.
- Рост ЗП, в зависимости от результатов.
- Через полгода возможность взять оплачиваемый отпуск.
- Работа как самозанятому или через ИП по договору.
- Стандартный график по будням, не считая праздники.
ПОДЕЛИТЬСЯ
Похожие вакансии:
Работа в России, Москва - Свежие вакансии на Kit-Jobs.Ru
Работа в городах России - свежие вакансии (469922) на Kit-Jobs.Ru: Вакансия работодателя • Production IT - ML / LLM Engineer (Production Agentic Systems), Москва. Здесь Вы можете ознакомиться с вакансией работодателя бесплатно онлайн.
Наш портал является бесплатным онлайн сервисом поиска работы по базе вакансий от прямых работодателей, по размеру заработной платы и прочим параметрам в регионе Москва. На портале также имеются такие разделы как: ежедневно обновляемая база свежих вакансий по всем городам России, юридические консультации, сервисы, форма для создания резюме онлайн в формате .DOC, новости рынка труда России и другие разделы.





