Opis działu/projektu:

Dział Insights & Data dostarcza najwyższej klasy rozwiązania związane z przetwarzaniem danych.

Większość naszych projektów dotyczy technologii Big Data oraz rozwiązań chmurowych. Dostarczamy rozwiązania pozwalające na przetwarzanie dużych oraz nieustrukturyzowanych zbiorów danych z wykorzystaniem takich platform chmurowych jak AWS, Azure oraz GCP.

Odpowiadamy za pełny cykl życia systemu (SDLC): oprócz wykorzystywania narzędzi do przetwarzania danych (np. ETL), piszemy dużo kodu w Pythonie, Scali lub Javie, równocześnie stosując najlepsze praktyki i narzędzia DevOps. Dane są dostarczane do docelowych systemów za pomocą interfejsów / API  lub wizualizowane i przedstawiane w postaci zestawień i raportów.

W naszym AI CoE realizujemy projekty z obszaru Data Science i Machine Learning, skupiając się w szczególności na przetwarzaniu języka naturalnego (NLP), modelach wykrywania anomalii oraz Computer Vision.

Dodatkowo, jako Insights & Data zgłębiamy obszary Quantum Computing, poszukując praktycznych rozwiązań umożliwiających rozwój naszych klientów.

Obecnie w naszym dziale pracuje ponad 250 architektów danych, inżynierów i analityków, wspólnie realizując ciekawe projekty dla ponad 30 klientów z różnych branż (finanse, logistyka, motoryzacja, telekomunikacja oraz innych).

Dołącz do nas! Serdecznie zapraszamy 😊

Twoje codzienne zadania:

  • projektowanie rozwiązań na podstawie wymagań funkcjonalnych i techniczych;
  • wdrażanie skalowalnych i wydajnych rozwiązań do przetwarzania danych przy użyciu Spark i Scala;
  • projektowanie i wdrażanie oprogramowania do przetwarzania dużych i nieustrukturyzowanych zbiorów danych (noSQL, Data Lake Architecture);
  • optymalizacja i testowanie nowoczesnych rozwiązań Big Data, także w Cloud i środowisku Continuous Delivery / Continuous Integration.

Najczęściej używane technologie:

  • Spark
  • Scala
  • Cloud Data Services: AWS / Azure / GCP
  • Python
  • SQL

Nasze oczekiwania:

  • 3-letnie doświadczenie komercyjne w pracy nad projektami Data Engineering, Big Data i/lub Cloud z wykorzystaniem Apache Spark i Scala;
  • dobra znajomość przynajmniej jednego (nie)relacyjnego systemu baz danych i język SQL;
  • znajomość co najmniej jednej z wymienionych (lub podobnych) technologii i narzędzi: Oozie, Hive, Hadoop, Sqoop, Kafka, Flume, Hbase;
  • bardzo dobra znajomość języka angielskiego (chęć do nauki języka niemieckiego będzie dodatkowym atutem).