Aufgabenspektrum
Du brennst für Kubernetes, liebst komplexe API-Architekturen und behältst auch in kritischen Situationen einen kühlen Kopf? Wir suchen einen Platform Operations Engineer (m/w/d) der die Infrastruktur nicht nur am Laufen hält, sondern aktiv stabilisiert und skalierbar macht. Werde Teil unseres Teams und sorge als technisches Rückgrat für die Verfügbarkeit unserer Services.
Operations & Platform Management
- Du verantwortest den stabilen Betrieb und die Weiterentwicklung von APIs, Kubernetes-Umgebungen (K8s) sowie zugehörigen Tools.
- Du führst Installationen, Updates und Patchings von APIs, K8s und Tools durch – inklusive Rollouts in neue Regionen.
- Du überwachst kontinuierlich die Infrastruktur (Health Monitoring) und kümmerst Dich um Kapazitätsmanagement.
- Du bearbeitest Service Requests und stellst den reibungslosen Betrieb der Plattform sicher.
- Du arbeitest aktiv in Slack-Workflows und sorgst für eine strukturierte Kommunikation im Betrieb.
Incident Management
- Du priorisierst, steuerst, trackst und löst Incidents entlang definierter Prozesse.
- Du unterstützt bei Troubleshooting und der schnellen Behebung von Störungen.
- Du informierst Kunden proaktiv über Incidents und übernimmst Eskalationen – auch in Zusammenarbeit mit externen Vendoren.
- Du eskalierst technische Themen gezielt an fortgeschrittene interne Support- und Entwicklungsteams.
Problem Management
- Du unterstützt die nachhaltige Wiederherstellung und Stabilisierung von Services.
- Du bearbeitest und dokumentierst Problem Records (PRs).
- Du führst Root Cause Analysen durch – bei Bedarf gemeinsam mit internen Teams oder externen Partnern.
Dokumentation & Continuous Improvement
- Du erstellst und pflegst Betriebsdokumentationen, SOPs und operative Playbooks.
- Du erstellst Jira-Tickets oder Git-Issues für Entwicklungsteams, wenn Defects identifiziert werden.
- Du arbeitest kontinuierlich an der Verbesserung von Betriebsprozessen und der Aktualisierung von Dokumentationen.

