Junior Data Scientist
ГородМосква
НаправлениеАнализ данных
КомандаCollateral Machine
Дата публикации14.01.2022
Нажимайте смело — отклик произойдет только на следующем шаге

Junior Data Scientist

Collateral machine — это система автоматической оценки объектов залогов, основанная на машинном обучении. Она поможет оказывать более быстрый и качественный сервис оценки залога для сотрудников бизнес-подразделений банка. Наша команда уже успешно внедрила несколько продуктов. Мы постоянно растем, не боимся экспериментировать и будем рады сделать все для того, чтобы вам было интересно с нами и вы могли развиваться. Для этого в банке есть комьюнити, которые помогают в обучении по различным направлениям: Data Science, Python, Data Engineering.
Команда Collateral machine — часть Управления рисками. В команде работают 4 Backend Developer’а/Data Engineer’а, 2 Data Scientist’a, DevOps Engineer.
Наша инфраструктура: Spark, Hive, AirFlow, postgresql, MlFlow, docker, fastapi, Jira (проставлю стикерами).
Все задачи будут обсуждаться с продуктовой командой и отдельно (более детально) с командой DS. Если что-либо будет непонятно в ходе решения задачи – мы всегда готовы вместе направить в верное русло и все детально объяснить.
Чем предстоит заниматься
  • анализировать исходные «сырые» данные (почему распределения у фичей в трейне и на валидации разные Оо);
  • совместно с коллегами обучать, валидировать и внедрять новые ML-модели для разных типов залогового имущества (в основном задачи регрессии), аргументировать выбор метрик при оценке модели и стратегии валидации;
  • брейнштормить совместно с командой для выработки гипотез по улучшению модели
  • интерпретировать полученные результаты и модели (почему я добавил 100500 интересных фич, докинул данных, а качество стало хуже)
  • искать новые пути для улучшения моделей (я могу попробовать еще 100500 новых фичей из других источников вместо 100500 проверенных).
Требования
  • теоретические и практические знания в ML (в основном таблички и time series). Если есть примеры на гите и/или есть успехи в конкурсах, это заметно ускоряет процесс рассмотрения;
  • общее знание python (базовые либы + стандартный набор для ML);
  • SQL (базовый уровень);
  • огонь в глазах и готовность обучать и улучшать разные модельки (не в jupyter notebook’ах, а полноценные пайплайны).
Для middle дополнительно необходимо наличие 1+ практического опыта работы со схожим стеком технологий.
Будет очень круто если у вас есть практический опыт в одном или несколькими из следующих направлений:
  • оценка стоимости недвижимого и/или движимого имущества;
  • опыт с внедрением ML моделей в prod;
  • опыт с Hadoop инфраструктурой;
  • CI/CD.
Вашими преимуществами при рассмотрении резюме станут:
  • наличие интересных pet project’ов (не в рамках каких-либо курсов)
  • практический опыт в ML с python
  • опыт работы с геоданными
  • опыт работы с Flask/FastAPI
  • опыт работы с Docker и микросервисной архитектурой
  • опыт работы с Hadoop инфраструктурой
  • желание изучать новое и искать лучшие решения для задач команды.
Что мы предлагаем
  • лучшее оборудование, необходимое для работы;
  • активно развивающиеся Data Science, Python, Data Engineering (и много других) комьюнити внутри банка с конференциями, обучением и общением;
  • личную лицензию на Coursera без ограничений по курсам;
  • скидки на продукты банка и партнеров (рестораны, отели и многое другое), программу primezone.ru;
  • удаленную работу до конца пандемии (пока до сих пор полная удаленка), а после — график: два дня в офисе, три дня дома;
  • ДМС со стоматологией с первых дней работы и дополнительные компенсации по больничным листам;
  • гибкое время рабочего дня, не нарушающее командные договоренности;
  • отсутствие формализма и дресс-кода;
  • организацию обучения для профессионального развития;
  • большую бесплатную электронную библиотеку для сотрудников, доступную через аккаунт MyBook.