Aplikuj teraz

Data Engineer (GCP)

Randlab

Warszawa, Centrum
100 - 130 PLN
Hybrydowa
B2B
BigQuery
SQL
Pub/Sub
📊 dataform
GCP
📊 Dataflow
📊 Datastream
🐍 Python
📊 Dataplex
Composer
💼 B2B
Hybrydowa
freelance

Projekt realizowany jest w obszarze budowy i utrzymania Customer Data Platform (CDP) opartej o architekturę Data Lakehouse w środowisku Google Cloud Platform (GCP).Zakres współpracy obejmuje tworzenie i rozwój potoków danych batch/stream, integracje CDC (Change Data Capture) oraz budowę warstw danych Bronze / Silver / Gold w BigQuery.Priorytetem jest jakość danych, zgodność z regulacjami RODO oraz utrzymanie pełnego data lineage.Twój zakres obowiązków Projektowanie i rozwój potoków danych (ETL/ELT) w GCP: Dataflow (Apache Beam, Python), Composer (Airflow), Pub/Sub. Implementacja i utrzymanie strumieniowania/CDC (np. MySQL → Datastream → BigQuery). Modelowanie danych w BigQuery (partycje, klastrowanie, optymalizacja zapytań) i praca w warstwach Bronze/Silver/Gold. Zarządzanie katalogiem/metadanymi, DQ i lineage (Dataplex) oraz transformatami SQL (Dataform). Współpraca z IT/PM, code review, CI/CD, monitoring i alertowanie w chmurze. Nasze wymagania Doświadczenie jako Data Engineer w kilku projektach cloud (preferencyjnie GCP). GCP: BigQuery, Cloud Storage, Dataflow (Beam, Python), Composer (Airflow), Pub/Sub, Datastream, Dataplex, Dataform. Bardzo dobra znajomość Python oraz SQL (dialekt BigQuery). Doświadczenie z MySQL jako źródłem danych (transakcyjne), praktyka w CDC. Architektura Medalionowa (Bronze/Silver/Gold), ETL/ELT. Data Governance/RODO, Data Quality, Data Lineage, deduplikacja klientów, wersjonowanie danych. Git i CI/CD (np. Cloud Build), monitoring/logging w GCP. Komunikacja i współpraca w zespole, angielski do pracy w środowisku międzynarodowym. Mile widziane Doświadczenie z PostgreSQL/MS SQL jako dodatkowymi źródłami. Optymalizacja kosztów BigQuery (partycjonowanie/klastrowanie, MV). Praktyka w projektowaniu kontraktów danych i testów w Dataform/dbt-like.

Wyświetlenia: 24
Opublikowana5 dni temu
Wygasaza 25 dni
Rodzaj umowyB2B
Tryb pracyHybrydowa
Źródło
Logo

Podobne oferty, które mogą Cię zainteresować

Na podstawie "Data Engineer (GCP)"