Cloudiax AG
Cloudiax AG

DevOps/Platform Expert (AI & Agentic Systems)

Remote (Deutschland)
Angestellte/r
Softwareentwicklung

Cloudiax ist ein führender Anbieter von Cloud-Technologien mit mehr als 280 internationalen Partnern und über 1100 SAP-Kunden in 90 Ländern. Wir ermöglichen kleinen und mittelständischen Unternehmen weltweit die Nutzung von Anwendungen wie SAP Business One und KI-Lösungen in unserer Cloud. Als globaler Marktführer bieten wir eine sichere, schnelle und zuverlässige Cloud-Plattform – Made in Germany.

Mit Rechenzentren in Deutschland, Kanada und Singapur stellen wir rund um die Uhr höchste Servicequalität sicher.

Zur Verstärkung unseres Teams suchen wir dich – engagiert, technisch stark und bereit, Verantwortung zu übernehmen. Ab sofort und Remote.

Aufgaben

Cloud-Native & Infrastruktur

  • Kubernetes: Tiefe Erfahrung in Cluster-Orchestrierung, GPU-Scheduling, Device-Plugins und Mandanten-Isolierung in Rechenzentren.
  • Hardware-Abstraktion: Praktische Erfahrung mit Multi-Instance GPU (MIG) zur effizienten, sicheren Aufteilung physischer GPUs auf unterschiedliche Kunden-Workloads.
  • Managed Backends: Sicherer Betrieb von Managed Postgres und Skalierung von Vektor-Datenbanken für performante Retrieval-Architekturen.
  • Schnittstellen & Security: Kenntnisse in Keycloak, Kong API Gateway oder vergleichbaren Tools für sicheren Zugriff und exakte Abrechnung.
  • DevOps & CI/CD: Erfahrung mit Git, CI/CD-Pipelines und Infrastructure-as-Code für schnelle, zuverlässige und dokumentierte Deployments.

    KI-Expertise & Inferenz-Logik

  • Inferenz-Optimierung: Erfahrung mit KV-Caching, Batching, Quantisierung und Serving-Frameworks wie vLLM oder NVIDIA Triton.
  • Modell-Kombination & Kostenmanagement: Wissen, wie kleine spezialisierte und große Generalisten-Modelle kombiniert werden, um Kosten und Latenz zu optimieren – Open und Closed Models.
  • Qualitätssicherung: Techniken zur Reduzierung von Halluzinationen, z. B. Retrieval-Augmented Generation (RAG) und Bereitstellung valider Datenkontexte auf Infrastruktur-Ebene.
  • Agenten & Frameworks: Operationalisierung von LangChain, LangGraph oder AutoGen sowie Management komplexer Deep Agents, die autonom mehrere Schritte ausführen.

Monitoring & Skalierung (AI-Native)

  • Observability: Tracing für Agenten-Entscheidungen (z. B. OpenTelemetry, LangSmith), um Abläufe im Rechenzentrum nachvollziehbar zu machen.
  • KI-spezifisches Auto-Scaling: Skalierung basierend auf Token-Durchsatz oder Modell-Kontext-Auslastung, nicht nur CPU-Metriken.

Qualifikation

Du musst kein Prompt-Engineer sein, aber du verstehst, wie KI „arbeitet“. Wichtig ist, dass du neue Ansätze (z. B. Inferenzmethoden oder Agenten-Strukturen) schnell erfassen und in stabile, mandantenfähige Rechenzentrums-Infrastrukturen integrieren kannst.

  • Experimentierfreude: Freude an Systemen, die nicht immer deterministisch reagieren.
  • Security & Safety: Bewusstsein für AI-Security (Sandboxing, Schutz vor Prompt-Injections) bei jedem System.

Benefits

100% Remote-Arbeitsplatz mit großer zeitlicher Flexibilität

  • attraktives Jahresgehalt, sowie automatische KPI-basierte Gehaltserhöhungen und attraktive Jahresboni.
  • 30+ Tage Erholungsurlaub.
  • Voll ausgestatteter Premium-Homeoffice-Arbeitsplatz.
  • Firmen-(e)Bike, betriebliche Kranken-Zusatzversicherung und weitere Corporate Benefits.
  • Arbeiten in einem internationalen Umfeld bei einem der weltweit führenden Cloud-Provider im SAP-Umfeld.

Haben wir dein Interesse geweckt? Dann lade hier gerne deine vollständigen Bewerbungsunterlagen hoch (Lebenslauf, Zeugnisse, Gehaltsvorstellung, frühestmöglicher Eintrittstermin).

Aktualisiert: vor 1 Minute
Job ID 15665722
Problem melden

Cloudiax AG

11-50 Mitarbeitende
Technologie, Information und Internet

Unsere weltweiten Kunden vertrauen darauf, dass wir ihre mittelständische SAP-Lösung 24 Stunden am Tag und 365 Tage im Jahr sicher, schnell und zuverlässig aus der Cloud bereitste…

Mehr lesen
  1. DevOps/Platform Expert (AI & Agentic Systems)