Data Engineer в команду CRM
Откликнуться
  • Дата публикации:
    29.01.2020
  • Код вакансии:
    VMSK6937.NiL.DEC

Райффайзенбанк ищет data engineer"а, который станет частью CRM IT-команды. Вместе мы будем использовать open-source стэк технологий (Hadoop, Spark, NiFi, Hive, Kafka, Airflow, Java etc.) для
· построения современной аналитической платформы, наполнении ее актуальными данными, как внутренними, так и внешними
· автоматизации и оптимизации процесса запуска коммуникаций с клиентами банка в режиме реального времени с использованием ML&AI
В твои ежедневные задачи будет входить проработка вопросов архитектуры и интеграции, построение ETL-пайплайнов по обработке данных, проектирование витрин данных, вывод ML-моделей в Прод, тесное взаимодействие с data scientist"ами.
Мы также понимаем, что современный open-source стэк динамично развивается, поэтому, чтобы быть в курсе последних изменений, мы регулярно занимаемся исследованием новинок и самых последних релизов. По результатам исследований мы проводим демо, и, если инструмент нравится команде, мы планируем внедрение и использование таких инструментов в ежедневной работе.

  • Дата публикации:
    29.01.2020
  • Код вакансии:
    VMSK6937.NiL.DEC

Что мы ожидаем:

- использовал Hadoop, знаешь, как работает Yarn, как эффективно хранить данные на HDFS, писал запросы в Hive;
- работал с SQL и не раз писал сложные запросы;
- имел дело с key-value БД (Hbase, Cassandra...);
- пишешь читабельный код, разделяешь его на классы, применяешь паттерны;
- знаешь, что такое Unit-тесты;
- обязательно и часто коммитишь сделанные изменения;
- писал код на Spark и можешь считать данные сервиса используя его Rest API, отсортировать, отфильтровать их и сохранить результат на HDFS;
- имел дело с Kafkой и баловался со стримингом;
- можешь деплоить приложения в Docker;
- разбираешься в CI/CD практиках и инструментах;
- умеешь работать самостоятельно.
+, если ты:
- знаком с банковской предметной областью;
- имеешь опыт работы с любой из "классических" РСУБД (Oracle, MS-SQL PostgreSQL);
- можешь продемонстрировать один из своих проектов на GitHub.

Чем предстоит заниматься:

- определять с бизнесом, какие данные нужны для решения задач и оперативно строить пайплайны по загрузке данных в Data Lake на регулярной основе;
- строить витрины под аналитические цели, выбирая оптимальный формат и структуру хранения данных;
- помощь Data Scientist"истам в разработке и выводе в продакшн моделей машинного обучения, как в батче, так и в реал-тайм;
- применять техники потоковой обработки данных для решения реал-тайм задач;
- поддерживать инфраструктуру и развивать на open source;
- использовать такие технологии, языки и инструменты, как Hadoop, Spark, NiFi, Hive, Hbase, Kafka, Airflow, ClickHouse, Java, Python.

Что мы предлагаем:

- работать в сплочённом IT-сообществе, где коллеги становятся настоящими друзьями;
- развиваться: мы оплачиваем профессиональные тренинги и образовательные курсы (в т.ч. на Сoursera, Udemy и т.д.), отправляем на российские и зарубежные конференции, а также проводим внутрибанковские митапы с приглашёнными экспертами;
- влиять на конечный результат и понимать бизнес-логику продуктов: следуем принципам Agile;
- чувствовать комфорт каждый день: обитаем в просторном и современном офисе в минуте ходьбы от м. Технопарк, можем предложить гибкий график;
- заботиться о здоровье: занимаемся спортом в бесплатном тренажёрном зале, пользуемся одним из лучших полисов ДМС в Москве с первого дня.
Откликнуться на вакансию
Ваше имя
Фамилия
Email
Телефон
Дата рождения
Город проживания
Гражданство
Ссылка на резюме
Если у вас нет резюме, заполните анкету
Область образования
Учебное заведение
Иностранный язык
Уровень владения
+ добавить поле
Удалить
Текущая/последняя должность
Опыт работы
+ добавить поле
Удалить
Дополнительное образование
+ добавить поле
Удалить
Иные заслуги
О себе
Отправить