Cloudiax ist ein führender Anbieter von Cloud-Technologien mit mehr als 280 internationalen Partnern und über 1100 SAP-Kunden in 90 Ländern. Wir ermöglichen kleinen und mittelständischen Unternehmen weltweit die Nutzung von Anwendungen wie SAP Business One und KI-Lösungen in unserer Cloud. Als globaler Marktführer bieten wir eine sichere, schnelle und zuverlässige Cloud-Plattform – Made in Germany.
Mit Rechenzentren in Deutschland, Kanada und Singapur stellen wir rund um die Uhr höchste Servicequalität sicher.
Zur Verstärkung unseres Teams suchen wir dich – engagiert, technisch stark und bereit, Verantwortung zu übernehmen. Ab sofort und Remote.
Aufgaben
Cloud-Native & Infrastruktur
- Kubernetes: Tiefe Erfahrung in Cluster-Orchestrierung, GPU-Scheduling, Device-Plugins und Mandanten-Isolierung in Rechenzentren.
- Hardware-Abstraktion: Praktische Erfahrung mit Multi-Instance GPU (MIG) zur effizienten, sicheren Aufteilung physischer GPUs auf unterschiedliche Kunden-Workloads.
- Managed Backends: Sicherer Betrieb von Managed Postgres und Skalierung von Vektor-Datenbanken für performante Retrieval-Architekturen.
- Schnittstellen & Security: Kenntnisse in Keycloak, Kong API Gateway oder vergleichbaren Tools für sicheren Zugriff und exakte Abrechnung.
DevOps & CI/CD: Erfahrung mit Git, CI/CD-Pipelines und Infrastructure-as-Code für schnelle, zuverlässige und dokumentierte Deployments.
KI-Expertise & Inferenz-Logik
- Inferenz-Optimierung: Erfahrung mit KV-Caching, Batching, Quantisierung und Serving-Frameworks wie vLLM oder NVIDIA Triton.
- Modell-Kombination & Kostenmanagement: Wissen, wie kleine spezialisierte und große Generalisten-Modelle kombiniert werden, um Kosten und Latenz zu optimieren – Open und Closed Models.
- Qualitätssicherung: Techniken zur Reduzierung von Halluzinationen, z. B. Retrieval-Augmented Generation (RAG) und Bereitstellung valider Datenkontexte auf Infrastruktur-Ebene.
- Agenten & Frameworks: Operationalisierung von LangChain, LangGraph oder AutoGen sowie Management komplexer Deep Agents, die autonom mehrere Schritte ausführen.
Monitoring & Skalierung (AI-Native)
- Observability: Tracing für Agenten-Entscheidungen (z. B. OpenTelemetry, LangSmith), um Abläufe im Rechenzentrum nachvollziehbar zu machen.
- KI-spezifisches Auto-Scaling: Skalierung basierend auf Token-Durchsatz oder Modell-Kontext-Auslastung, nicht nur CPU-Metriken.
Qualifikation
Du musst kein Prompt-Engineer sein, aber du verstehst, wie KI „arbeitet“. Wichtig ist, dass du neue Ansätze (z. B. Inferenzmethoden oder Agenten-Strukturen) schnell erfassen und in stabile, mandantenfähige Rechenzentrums-Infrastrukturen integrieren kannst.
- Experimentierfreude: Freude an Systemen, die nicht immer deterministisch reagieren.
- Security & Safety: Bewusstsein für AI-Security (Sandboxing, Schutz vor Prompt-Injections) bei jedem System.
Benefits
100% Remote-Arbeitsplatz mit großer zeitlicher Flexibilität
- attraktives Jahresgehalt, sowie automatische KPI-basierte Gehaltserhöhungen und attraktive Jahresboni.
- 30+ Tage Erholungsurlaub.
- Voll ausgestatteter Premium-Homeoffice-Arbeitsplatz.
- Firmen-(e)Bike, betriebliche Kranken-Zusatzversicherung und weitere Corporate Benefits.
- Arbeiten in einem internationalen Umfeld bei einem der weltweit führenden Cloud-Provider im SAP-Umfeld.
Haben wir dein Interesse geweckt? Dann lade hier gerne deine vollständigen Bewerbungsunterlagen hoch (Lebenslauf, Zeugnisse, Gehaltsvorstellung, frühestmöglicher Eintrittstermin).