Вакансия
Город

Вакансия • ML-инженер, Москва

New,
📆 2026-03-16
Работа • Москва
З/п по договоренности ք
НТЦ Вулкан (Вакансия работодателя)
Адрес места работы:
Москва, Электрозаводская улица, 27с4
Тип занятости: Полная занятость
График работы: Полный день
Обязанности:
  • разработка приложений с использованием LLM (агентные и RAG системы, системы обработки текстов)
  • разработка способов оценивания качества работы LLM приложений
  • оптимизация инференса
  • построение web-интерфейсов для MVP и PoC.

Стек:

  • разработка: Python 3.10+, FastAPI (+ сопутствующие инструменты), Docker
  • базовый инструментарий: PyTorch, инструменты экосистемы HuggingFace, pandas, scikit-learn, matplotlib .
  • языковые модели: энкодерные и декодерные языковые модели, инференс на vLLM, transformers, Llama.cpp (+ollama)
  • хранилища: Elasticsearch, mongo, pgvecto-rs, HellixDB
  • интерфейсы: streamlit, gradio
  • MLOps: DVC.
Требования:
  • уверенное знание Python
  • знание основ работы с Linux (shell, файловая система, процессы)
  • математическая подготовка: математическая статистика (оценка параметров, их характеристики, доверительные интервалы, бутстрап), основы машинного обучения (регрессоры, классификаторы, деревья, метрики, EDA)
  • базовое понимание работы LLM: понимание архитектуры, работа с внутренним состоянием, понимание принципов инференса (KV кэш, стратегии декодирования, структурированный вывод)
  • опыт построения языковых моделей: SFT, DPO + RL, LoRA, контрастное обучение, метрики качества
  • опыт работы с RAG системами: понимание принципов функционирования, опыт участие в разработке
  • агентные системы: понимание архитектур и их проблем
  • способы замера качества LLM-приложений: метрики поиска данных, LLM-as-a-judge, сбор и разметка данных для специализированных бенчмарков, принципы работы общих бенчмарков.

Будет плюсом:

  • опыт проектирования RAG и агентных систем, наличие опыта работы с LLM фреймворками, такими как Flowise, n8n (low code) или LlamaIndex, Langchain, CrewAI (python)
  • опыт работы в других областях ML, таких как обработка аудио (TTS, STT, атрибуция), работа с изображениями (детекция объектов с Yolo, подготовка и разметка датасетов в CVAT), работа с мультимодальными LLM
  • опыт в оптимизации инференса: квантизация, дистиляция, использование эффективных фреймворков (TRT, SGLang), спекулятивный декодинг, continuous batching.
Опыт работы (лет): От 3 до 6 лет
Адрес на карте:
Updated: 17 March 2026


ПОДЕЛИТЬСЯ


Дистанционное обучение ВКонтакте онлайн Дистанционное обучение TikTok онлайн Дистанционное обучение YouTube онлайн Дистанционное обучение онлайн

Похожие вакансии:

Backend-разработчик (Kotlin / Java)
Санкт-Петербург •
ЦРТ | Группа компаний

UX/UI Designer
Москва •
Aston

Инженер по тестированию (AI/LLM)
Санкт-Петербург •
Napoleon IT

Стажер Data Analyst
Санкт-Петербург •
Napoleon IT

Frontend-разработчик (Data-продукты)
Москва •
АТОЛ, группа компаний

ML-инженер
Москва •
НТЦ Вулкан

Работа в России, Москва - Свежие вакансии на Kit-Jobs.Ru

Работа в городах России - свежие вакансии (469925) на Kit-Jobs.Ru: Вакансия работодателя • НТЦ Вулкан - ML-инженер, Москва. Здесь Вы можете ознакомиться с вакансией работодателя бесплатно онлайн.

Наш портал является бесплатным онлайн сервисом поиска работы по базе вакансий от прямых работодателей, по размеру заработной платы и прочим параметрам в регионе Москва. На портале также имеются такие разделы как: ежедневно обновляемая база свежих вакансий по всем городам России, юридические консультации, сервисы, форма для создания резюме онлайн в формате .DOC, новости рынка труда России и другие разделы.





Новое:


Работа в России от прямых работодателей свежие вакансии - Kit-Jobs.Ru Work in Russia 
Сбор на IT-проект
ПОЖЕРТВОВАТЬ




Tuesday 17 March 2026


+
facebook