Crashing Pods: How to Compensate for such an Outage?
Kubernetes bietet eine Menge an Funktionalitäten, um die Downtime von Pods sehr gering zu halten. Graceful Shutdown und Zero Downtime Deployments sind mit Kubernetes durchaus möglich. Dies betrifft jedoch nur den geordneten Austausch von Containern oder Pods. Trotz aller Vorkehrungen durch Kubernetes kann es vorkommen, dass der Crash eines Services zu HTTP-5xx-Antworten führt. Zur vollständigen Kompensation von Services, welche sich im Fehlerzustand befinden, müssen andere Maßnahmen ergriffen werden. In dieser Session wird gezeigt, warum der klassische Ansatz mit einem Resilienz-Framework diese Art von Probleme nicht vollständig lösen kann. Dazu wird der Pod-Lifecycle betrachtet und das Vorgehen von Kubernetes beim Ersetzen von fehlerhaften Pods analysiert. Eine mögliche Lösungsstrategie bietet das Client-side Loadbalancing. Am Beispiel des Service-Mesh-Tools Istio wird gezeigt, was nötig ist, um eine vollständige Kompensation mit Hilfe dieser Strategie zu erreichen.