Die Arbeit behandelt das Scheduling/Placement Problem von Containern in Cloud bzw. Edge Systemen. Speziellen Fokus lege ich auf Serverless Functions, die in Anbetracht der hohen Heterogenität der Hardware im Edge Bereich für Platform Provider neue Herausforderungen darstellen. Aber auch in der Public Cloud ist Heterogenität anzutreffen und die Performance von Applikation kann durch “Nachbar”-Container verringert werden.
Neben den klassischen Ressourcen wie CPU,RAM, Netzwerk & Disk, gibt es heute viele Workloads die mit HW-Beschleunigern arbeiten. Bspw. GPU/TPU im AI Bereich.
Kubernetes berücksichtigt aber nur CPU & RAM Limits bzw. manuellen Input bei der Platzierung wodurch es zu Kämpfen um andere Ressourcen kommen kann.
Mein Ziel ist es mit Hilfe von Machine Learning optimale Platzierungen automatisch und zur Laufzeit zu erkennen um bessere Performance und Ressourcenstaus zu verhindern und verwenden ua. Edge Devices.
Der Großteil meiner Arbeit ist bereits öffentlich zugänglich: https://github.com/phip123/workload-aware-k8s