Вакансия • Стажер Data Scientist (Classic ML), Москва
Сейчас мы ищем стажеров в команду разработки и улучшения классических ML-моделей для прогнозирования заказов, нагрузки и оттока курьеров, персонализированных коммуникаций и скидок, а также оптимизации логистики.
Стек технологий:
-
Разработка: Python, Git, FastAPI, GitLab, Docker, Prometheus, Grafana.
-
ML инфраструктура: JupyterHub, MLFlow, Airflow.
-
ML: Scikit-learn, XGBoost, LightGBM, CatBoost, Optuna/Hyperopt, SciPy.
-
Данные: SQL (PostgreSQL/ClickHouse/GreenPlum), S3, Polars, Pandas, NumPy.
-
Процессы: Jira, Confluence.
Обязательные навыки и знания:
-
Знания и умение работать с Python, ООП.
-
Умение работать с git.
-
Знания в области классического ML: линейная/логистическая регрессия, деревья решений, методы кластеризации, оптимизации, градиентный бустинг, различные виды лесов.
-
Знание каких-либо библиотек классического ML (Scikit-learn, XGBoost, LightGBM, CatBoost)
-
Понимание основных метрик качества моделей (accuracy, precision, recall, F1, ROC-AUC, RMSE, MAE) и методов валидации (кросс-валидация, train/test split).
-
Уверенное владение SQL и Python для анализа данных (Polars, Pandas, NumPy, JupyterHub).
-
Знание основ feature engineering, отбора признаков и работы с пропущенными значениями.
Навыки которые будут плюсом:
-
Знакомство с фреймворками для оптимизации гиперпараметров (Optuna, Hyperopt).
-
Базовое понимание концепций A/B-тестирования.
-
Обучение и инференс классических ML алгоритмов на GPU.
-
Прогнозирование временных рядов: декомпозиция, кросс-валидация во времени, базовые модели (AR, сглаживание).
-
Uplift-моделирование: понимание отличий от классификации, типы клиентов.
-
Рекомендательные системы: виды фидбека, базовые подходы (collaborative, content-based), метрики ранжирования (Precision@k, NDCG).
-
Оптимизация: базовые алгоритмы (жадные, графовые), понимание постановок задач.
-
Сбор, постановка задачи разметки, предобработка, EDA данных, выбор offline/online метрик
-
Составление и согласование дизайна ML решения
-
Обучение классических ML моделей
-
Продуктовизация (пайплайны данных, перетренировка)
Процесс отбора на стажировку выглядит так:
-
резюме и короткая анкета в ответ
-
тестовое задание объемом ~3 часа
-
интервью с командой
-
предложение работы.
Наши стажировки оплачиваемые, длятся 3 месяца или дольше, 30-40 рабочих часов в неделю в гибком графике.
Вы будете постепенно включаться в реальные процессы разработки ML моделей: от выполнения небольших, хорошо структурированных задач, под присмотром опытного наставника до участия в обсуждении архитектуры и принятия решений. В конце стажировки сможете работать с проектами на уровне junior+ рDS, понимать бизнес-задачи и вносить осознанный вклад в развитие платформы.
ПОДЕЛИТЬСЯ
Похожие вакансии:
Работа в России, Москва - Свежие вакансии на Kit-Jobs.Ru
Работа в городах России - свежие вакансии (469927) на Kit-Jobs.Ru: Вакансия работодателя • Ecom.tech - Стажер Data Scientist (Classic ML), Москва. Здесь Вы можете ознакомиться с вакансией работодателя бесплатно онлайн.
Наш портал является бесплатным онлайн сервисом поиска работы по базе вакансий от прямых работодателей, по размеру заработной платы и прочим параметрам в регионе Москва. На портале также имеются такие разделы как: ежедневно обновляемая база свежих вакансий по всем городам России, юридические консультации, сервисы, форма для создания резюме онлайн в формате .DOC, новости рынка труда России и другие разделы.





