Site Reliability Engineer (SRE) (Vaste aanstelling) – Bangalore, India
Overzicht
Onze klant in de financiële dienstverlening is op zoek naar nieuwe medewerkers. twee vaste Site Reliability Engineers (SRE's) in Bangalore om de betrouwbaarheid, schaalbaarheid, observeerbaarheid en operationele excellentie van het platform te verbeteren. cloud-first Dit is een praktische engineeringfunctie gericht op productiestabiliteit, automatisering en continue verbetering in een gereguleerde omgeving.
Functieomschrijving
- Locatie: Bangalore, India
- Werkgelegenheidstype: Vaste aanstelling (2 functies)
- Werkmodel: Op locatie/Hybride (afhankelijk van het beleid van de klant)
Belangrijkste verantwoordelijkheden
- Verwerf en verbeter betrouwbaarheid van de dienstverlening, beschikbaarheid, latentie en prestaties op kritieke platformen.
- Bouwen en verbeteren monitoring, waarschuwingen en observeerbaarheid (metrieken, logboeken, traceringen) om de MTTR te verlagen en herhaling te voorkomen.
- Lead incident reactie en evaluaties na incidenten (RCA), die leiden tot permanente oplossingen en verbeteringen in de betrouwbaarheid.
- Automatiseer operationele taken en verminder de fysieke inspanning door scripting en tools.
- Ondersteunen en verbeteren CI / CD-pijpleidingen en releaseprocedures om veilige en frequente implementaties mogelijk te maken.
- Werk samen met de engineering- en infrastructuurteams om de beste praktijken op het gebied van betrouwbaarheid te implementeren (SLO's/SLI's, foutenbudgetten, capaciteitsplanning).
- Bijdragen aan beslissingen over cloudarchitectuur binnen AWS en Azurewaarbij de nadruk ligt op veerkracht en een evenwicht tussen kosten en prestaties.
- Zorg ervoor dat de platformactiviteiten aansluiten op de beveiligings- en compliance-eisen die gangbaar zijn in de financiële sector.
Vereiste vaardigheden en ervaring
- Aantoonbare ervaring als een SRE / DevOps / Productie-engineer ondersteuning van bedrijfskritische systemen.
- Sterk Cloudervaring met AWS en Azure. (praktische, productieomgeving).
- Solide basiskennis van Linux en netwerken (DNS, TLS, load balancing, routingconcepten).
- ervaring met Infrastructuur als code (bijv. Terraform, CloudFormation, ARM/Bicep).
- Sterke vaardigheden op het gebied van automatisering/scripting (bijv. Python, Bash, PowerShell).
- Ervaring met containers en orchestratie (bijv. Docker, Kubernetes).
- Ervaring met tools voor observatie (bijv. CloudWatch/Azure Monitor, Prometheus/Grafana, ELK/Splunk, Datadog/New Relic - elke relevante combinatie is mogelijk).
- Ik voel me op mijn gemak bij het werken in een oproep-/ondersteuningsdienst en kan grote incidenten kalm en methodisch afhandelen.
Goed om te hebben
- Ervaring in financiële diensten of andere gereguleerde omgevingen.
- Grondige kennis van SRE-praktijken: SLO/SLIFoutbudgetten, capaciteitsplanning, chaostesten, betrouwbaarheidsontwerppatronen.
- Ervaring met service mesh, API gateways of gedistribueerde tracering in microservices-omgevingen.
- Basiskennis van beveiliging in cloudomgevingen (IAM, beheer van geheimen, beveiligingsverharding).
