Data discovery analytik (PySpark, SQL)

„Přijměte výzvu, staňte se součástí našeho datového týmu a pojďte s námi pracovat na datové transformaci MPSV!“


Challenge
Stavíme nový datový sklad v Azure, který integruje data z celé sociální oblasti. Naše projekty jsou vedeny inovacemi a zaměřeny na efektivní využití dat v rámci resortu. 

Co bude náplní Vaší práce

  • Analýza dat a procesů ve zdrojových systémech – zodpovědnost za data discovery fázi
  • Tvorba konsolidovaného popisu dat v primárních systémech jejich vazeb,  datových domén
  • Spolupráce na tvorbě architektury jednotlivých datových vrstev platformy
  • Tvorba podkladů pro vývoj ETL zejména pomocí kódu SQL, alternativně PySpark
  • Spolupráce na vývoji metadata frameworku
  • Návrh struktury datových přenosů do / z platformy

Kvalifikace a požadavky

  • Minimálně 2 roky praxe s tvorbou pokročilých SQL nebo Pyspark skriptů
  • Znalost procesů analýzy rozsáhlých datových modelů a datového modelování výhodou
  • Znalost ETL procesů výhodou
  • Dobrá znalost PySpark výhodou

Nabízíme

  • Práci na projektech s reálným dopadem na život občanů ČR
  • Přístup k moderním a inovativním nástrojům
  • Silnou podporu vedení pro digitalizaci státu
  • Podporu v osobním rozvoji formou školení
  • Flexibilní pracovní dobu
  • Dlouhodobou spolupráci