Wir suchen einen Data Engineer für ein Projekt, das sich auf den Aufbau und die Optimierung von Data-Engineering-Lösungen konzentriert. Die Rolle beinhaltet die Arbeit mit Databricks und modernen Datenpraktiken.
Key Facts
Start: 01.05.2025
Duration: not known
Capacity: 80 %
Employment type:
Job site: Berlin
Job country: Deutschland
Ihre Aufgaben
• Databricks-Notebooks und strukturierte Workflows für effiziente und wartbare Datentransformationen entwerfen, erstellen und optimieren
• Verwaltung von Databricks-Tabellen, Optimierung von Speicher-Layern und Implementierung von Partitionierungs-, Indexierungs- und Datenkomprimierungsstrategien für Leistung, Kosteneffizienz und Skalierbarkeit
• Datenpipelines und Analyse-Lösungen unter Verwendung der Databricks-Best Practices bereitstellen, einschließlich Versionskontrolle, CI, Tests und Überwachung.
• Arbeiten Sie mit Datenprodukten, konzentrieren Sie sich auf Performance-SLAs, Caching-Strategien und REST/nachrichtenbasierte Ausgangsports
• Entwerfen und Entwickeln von Datenpipelines und Automatisierungsskripten, Durchführung von Python-Code-Reviews in Abstimmung mit dem Entwicklungsteam
• Sicheren und qualitativ hochwertigen Code im Einklang mit den Organisationsstandards liefern
• Koordination mit verschiedenen Stakeholdern zur Abstimmung der Entwicklung mit Governance-, Sicherheits- und Compliance-Anforderungen
• Teilnahme an technischen Verfeinerungssitzungen zur Hinterfragung der technischen Projektanforderungen
• Dokumentation der technischen Aspekte des Projekts zum Verständnis
Muss-Anforderungen
• Mindestens 4 Jahre Erfahrung im Data Engineering mit Python
• Mindestens 3 Jahre Erfahrung mit Datenprodukten wie Databricks oder Data Lake
• Erfahrung mit Ausgangsports, die Performance-SLAs, Caching-Strategien und REST/Nachrichten-basierte Ausgangsports definieren
• Erfahrung mit Git, Versionskontrolle, Release Management und CI/CD
• Deutschkenntnisse min. B2 oder vergleichbar
• Englischkenntnisse mindestens C1 oder vergleichbar
Kann-Anforderungen
• Branchenkenntnisse in der Energiebranche sind von Vorteil
• Kenntnisse in Apache Spark, Airflow, Kafka und dem Azure Data Engineering Stack sind von Vorteil
• Erfahrung in der Arbeit mit einem .NET-Stack + Blazor (optional)
• Kernarchitektur, Verständnis von Datenmodellierung und Datenstrategie
• Erfahrung in der Bereitstellung von Projektverweisen, die Vertragsgegenstand, Leistungszeitraum, Kunde, durchgeführte Tätigkeit und eine kurze Beschreibung der Tätigkeit detailliert beschreiben
Weitere Informationen
Diese Rolle ist zu 90% remote strukturiert, mit einer 10%igen Präsenz vor Ort in Berlin.
Let’s power the future together
From Business Case to Implementation: As a leading consulting firm for strategic transformations, we are a trusted partner for our clients—and for our employees. Responsible, high-performing, and always with a focus on people. #WeAreWavestone
With our 360° portfolio of consulting services, we combine top-tier industry expertise with a wide range of cross-sector skills, work interdisciplinary, and think outside the box. This allows us to offer our partner companies and freelancers comprehensive perspectives within our own projects, while also supporting them as a long-standing framework agreement partner in filling project vacancies—promptly and directly.
We look forward to hearing from you!
Your direct contact at Wavestone
Mirza Tahirovic
Phone: +498945599291
E-Mail: [email protected]