Aplikuj teraz

Senior Site Reliability Engineer (Praca zdalna)

TQLO SPÓŁKA Z OGRANICZONĄ ODPOWIEDZIALNOŚCIĄ

Warszawa, Skierniewicka 10a
180 - 210 PLN
Zdalna
B2B
☁️ AWS
🚢 Kubernetes
SRE
Grafana
☁️ Azure
💼 B2B
🌐 Zdalna
Pełny etat

Nasz Klient to międzynarodowa organizacja rozwijająca nowoczesną, wysokodostępną platformę digital obsługiwaną przez miliony użytkowników.Projekt koncentruje się na budowie i utrzymaniu skalowalnej infrastruktury chmurowej, automatyzacji procesów, poprawie niezawodności oraz wdrażaniu dobrych praktyk Site Reliability Engineering (SRE).Szukamy doświadczonej osoby na stanowisko Senior Site Reliability Engineer, która przejmie odpowiedzialność za rozwój środowisk produkcyjnych, ulepszanie obserwowalności i automatyzację całego cyklu życia aplikacji. 100% zdalnie CZYM BĘDZIESZ SIĘ ZAJMOWAĆ? Projektowaniem, wdrażaniem i skalowaniem odpornej infrastruktury w chmurze AWS (wielokrotne konta, środowiska produkcyjne i pre-prod). Utrzymaniem i rozwijaniem środowisk Kubernetes (EKS) z użyciem Helm, ArgoCD i Terraform, dbając o przewidywalne i audytowalne procesy deployów. Współpracą z zespołami produktowymi i platformowymi w zakresie dobrych praktyk SRE (SLI/SLO, error budgets, reliability reviews). Budową i ulepszaniem obserwowalności przy pomocy Dynatrace, Grafana, metryk cloud-native i narzędzi open-source. Optymalizacją konfiguracji Cloudflare WAF, reguł cache/routing oraz zabezpieczeń perymetrycznych w celu poprawy wydajności i bezpieczeństwa. Automatyzacją infrastruktury, deployów i rutynowych zadań z wykorzystaniem GitHub Actions, Python/Bash. Udziałem w incident response, prowadzeniem post-mortemów i przekuwaniem wniosków w realne usprawnienia. CZEGO OD CIEBIE OCZEKUJEMY? Minimum 5 lat doświadczenia w roli SRE/DevOps w środowiskach produkcyjnych opartych o AWS (preferowany) lub Azure. Biegłości w Terraform, Helm, ArgoCD, GitHub Actions. Bardzo dobrej znajomości Kubernetes (EKS) – autoscaling, rollout strategies, troubleshooting, architektura klastra. Doświadczenia w budowie i utrzymaniu observability pipelines (logi, metryki, trace’y, SLO/SLI, alerting). Umiejętności projektowania systemów o wysokiej dostępności i odporności na awarie. Znajomości zasad CI/CD oraz podejścia GitOps. Doświadczenia z Cloudflare (DNS, CDN, WAF, rulesets). Praktyki w pracy z narzędziami monitoringu: Dynatrace, Prometheus, Grafana. Bardzo dobrej znajomości języka angielskiego (współpraca z zespołami w Europie i USA). Doświadczenia w incident response: on-call, RCA, post-mortem. Nice to have: Przykłady wprowadzonych usprawnień w zakresie SLO/SLI lub redukcji alert fatigue. Kontrybucje do narzędzi automatyzujących lub poprawiających obserwowalność. Doświadczenie w prowadzeniu reliability reviews i promowaniu kultury post-mortem. Zainteresowanie resilience engineering i dzieleniem się wiedzą w obszarze SRE.  DLACZEGO WARTO? Stabilna długofalowa współpraca w formule B2B bezpośrednio z Klientem końcowym. Praca w projektach o wysokiej skali i realnym wpływie na działanie platformy używanej przez miliony użytkowników. Pełna autonomia technologiczna: realny wpływ na architekturę, rozwiązania i standardy niezawodności. 100% pracy zdalnej, elastyczne godziny, środowisko async-friendly. Dojrzała kultura inżynierska, partnerskie podejście i współpraca z ekspertami z Europy i USA. Dostęp do nowoczesnego stacku: AWS, EKS, Terraform, ArgoCD, Cloudflare, Dynatrace i narzędzia cloud-native. TQLO Sp. z o.o. – Agencja Zatrudnienia (KRAZ nr 33580)Dziękujemy za wszystkie zgłoszenia! Skontaktujemy się z wybranymi osobami.

Wyświetlenia: 17
Opublikowanaokoło 23 godziny temu
Wygasaza 29 dni
Rodzaj umowyB2B
Tryb pracyZdalna
Źródło
Logo

Podobne oferty, które mogą Cię zainteresować

Na podstawie "Senior Site Reliability Engineer"