Data Engineer в команду CRM
Откликнуться
  • Дата публикации:
    18.07.2019
  • Код вакансии:
    VMSK5795.NiL.DEC

Райффайзенбанк ищет data engineer"а, который станет частью CRM IT-команды (~9 человек). Вместе мы будем использовать open-source стэк технологий (Hadoop, Spark, NiFi, Hive, Kafka, Airflow, Java etc.) для
· построения современной аналитической платформы, наполнении ее актуальными данными, как внутренними, так и внешними
· автоматизации и оптимизации процесса запуска коммуникаций с клиентами банка в режиме реального времени с использованием ML&AI
В твои ежедневные задачи будет входить проработка вопросов архитектуры и интеграции, построение ETL-пайплайнов по обработке данных, проектирование витрин данных, вывод ML-моделей в Прод, тесное взаимодействие с data scientist"ами.
Мы также понимаем, что современный open-source стэк динамично развивается, поэтому, чтобы быть в курсе последних изменений, мы регулярно занимаемся исследованием новинок и самых последних релизов. По результатам исследований мы проводим демо, и, если инструмент нравится команде, мы планируем внедрение и использование таких инструментов в ежедневной работе.

  • Дата публикации:
    18.07.2019
  • Код вакансии:
    VMSK5795.NiL.DEC

Эта вакансия для тебя, если ты:

- использовал Hadoop, знаешь, как работает Yarn, как эффективно хранить данные на HDFS, писал запросы в Hive;
- работал с SQL и не раз писал сложные запросы;
- имел дело с key-value БД (Hbase, Cassandra...);
- пишешь читабельный код, разделяешь его на классы, применяешь паттерны;
- знаешь, что такое Unit-тесты;
- обязательно и часто коммитишь сделанные изменения;
- писал код на Spark и можешь считать данные сервиса используя его Rest API, отсортировать, отфильтровать их и сохранить результат на HDFS;
- имел дело с Kafkой и баловался со стримингом;
- можешь деплоить приложения в Docker;
- разбираешься в CI/CD практиках и инструментах;
- умеешь работать самостоятельно.
+, если ты:
- знаком с банковской предметной областью;
- имеешь опыт работы с любой из "классических" РСУБД (Oracle, MS-SQL PostgreSQL);
- можешь продемонстрировать один из своих проектов на GitHub.

В этой роли ты будешь:

- определять с бизнесом, какие данные нужны для решения задач и оперативно строить пайплайны по загрузке данных в Data Lake на регулярной основе;
- строить витрины под аналитические цели, выбирая оптимальный формат и структуру хранения данных;
- помощь Data Scientist"истам в разработке и выводе в продакшн моделей машинного обучения, как в батче, так и в реал-тайм;
- применять техники потоковой обработки данных для решения реал-тайм задач;
- поддерживать инфраструктуру и развивать на open source;
- использовать такие технологии, языки и инструменты, как Hadoop, Spark, NiFi, Hive, Hbase, Kafka, Airflow, ClickHouse, Java, Python

Мы тебе обещаем:

- свободу в выборе инструментов для решения задач;
- регулярное посещение тренингов, митапов и конференций (в том числе как спикер) за наш счет;
- командную работу и поддержку;
- гибкий график;
- отличный социальный пакет (ДМС, скидки на корпоративные продукты, спортзал в здании);
- вкусное кафе в здании, где можно обедать и пить свежесваренный кофе;
- ты сможешь за одну минуту добраться от ст.м.Технопарк до комфортного офиса;
- отсутствие формализма и позитивный настрой.
Откликнуться на вакансию
Ваше имя
Фамилия
Email
Телефон
Дата рождения
Город проживания
Гражданство
Ссылка на резюме
Если у вас нет резюме, заполните анкету
Область образования
Учебное заведение
Иностранный язык
Уровень владения
+ добавить поле
Удалить
Текущая/последняя должность
Опыт работы
+ добавить поле
Удалить
Дополнительное образование
+ добавить поле
Удалить
Иные заслуги
О себе
Отправить