Аналитик по обработке данных
Откликнуться
  • Дата публикации:
    11.08.2020

В команду валидации внутренних моделей требуется аналитик по обработке данных для проведения валидации, а также проверки качества данных, используемых в рамках разработки и применения моделей.

Мы готовы рассмотреть специалистов разного уровня — у нас есть задачи и перспективы для специалистов уровней Junior и Middle. Наш идеальный кандидат имеет опыт программирования на Python, SAS и применения SQL, использования Hadoop, HDFS, а также обладает теоретическими знаниями в области разработки статистических моделей.

  • Дата публикации:
    11.08.2020

Требования

На позиции младшего аналитика по обработке данных:

  • умение работать с SQL (join’ы, подзапросы, агрегатные функции, DDl, DML, DCL, CTE, транзакции);
  • способность объянсить, что такое ООП;
  • умение писать код на Python, SAS (или R);
  • знания теории: теория вероятностей, математическая статистика, эконометрика, понимание алгоритмов моделирования (в том числе ML);
  • желание учиться новому (особенно в банковской сфере) и активно развивать технические навыки.

На позиции аналитика по обработке данных:

  • соответствие требованиям к младшему аналитику;
  • знание специфики банковской предметной области;
  • опыт работы с SQL и написания сложных запросов;
  • опыт использования Hadoop;
  • практический опыт разработки моделей (в том числе ML);
  • умение тестировать гипотезы, визуализировать результаты анализа данных;
  • умение писать читабельный код, разделять его на классы, применять паттерны;
  • обязательный и частый коммитмент сделанных изменений в коде;
  • умение работать самостоятельно.

Дополнительными преимуществами станут:

  • опыт работы с любой из «классических» РСУБД (Oracle, MS-SQL PostgreSQL);
  • опыт написания кода на Spark и способность считать данные сервиса, используя его Rest API, отсортировать, отфильтровать их и сохранить результат на HDFS;
  • возможность продемонстрировать один из своих проектов на GitHub.

Обязанности

  • собирать и подготавливать данные для валидации и мониторинга моделей (работа с хранилищами SAS, Oracle, Hadoop);
  • проверять данные, используемые для разработки моделей и скрипты по их сбору;
  • применять техники потоковой обработки данных для решения real time задач;
  • строить витрины данных, выбирая оптимальный формат и структуру хранения данных;
  • придумывать индикаторы качества данных;
  • использовать SQL, Python, SAS, Hadoop, Spark, Hive.

Мы предлагаем

  • свободу в выборе инструментов для решения задач;
  • регулярное посещение тренингов, митапов и конференций (в том числе в роли спикера);
  • командную работу и поддержку;
  • гибкое время начала рабочего дня;
  • отличный социальный пакет (ДМС, скидки на корпоративные продукты, спортзал в здании офиса);
  • уютное кафе в здании, где можно пообедать и в любое время выпить свежесваренный кофе;
  • комфортный офис в одной минуте от станции метро «Технопарк»;
  • позитивный настрой и отсутствие бюрократии.
Откликнуться на вакансию
Ваше имя
Фамилия
Email
Телефон
Дата рождения
Город проживания
Гражданство
Ссылка на резюме
Если у вас нет резюме, заполните анкету
Область образования
Учебное заведение
Иностранный язык
Уровень владения
+ добавить поле
Удалить
Текущая/последняя должность
Опыт работы
+ добавить поле
Удалить
Дополнительное образование
+ добавить поле
Удалить
Иные заслуги
О себе
Отправить