LLM Infrastructure Engineer · Cloud / Infrastruktur
LLM Projekt — Europäischer Cloud-Provider
Repräsentatives Beispielmandat aus laufender Vergabe. Klarnamen anonymisiert.
- Tagessatz
- 900–1300 EUR
- Start
- kurzfristig oder nach Vereinbarung
- Dauer
- 6 Monate
- Remote
- Remote nach Vereinbarung
- Konzern
- Europäischer Cloud-Provider
- Standort
- Remote EU, Vor-Ort nach Vereinbarung
Projektbeschreibung
Ein europäischer Sovereign-Cloud-Provider baut sein LLM-Hosting-Angebot aus. Multi-Tenancy auf vLLM/TGI, kuratierter Modell-Katalog für regulierte Branchen. Du arbeitest im Platform-Engineering-Kern, mit klarem Auftrag, gegen kommerzielle APIs bestehen zu können.
Aufgaben
- Multi-Tenancy-LLM-Hosting auf vLLM/TGI.
- GPU-Scheduling und Cost-Optimierung.
- Benchmark gegen kommerzielle APIs (Latenz, Qualität, $).
- Documentation und Customer-Enablement.
- Modell-Onboarding-Playbook.
- Security-Hardening (Tenant-Isolation, Logging).
Voraussetzungen
- 5+ Jahre vLLM/TGI in Produktion.
- Tiefes Kubernetes + GPU-Workload-Wissen.
- Erfahrung mit Multi-Tenancy in Cloud-Produkten.
- Englisch C1+ Pflicht.
Must-have
- vLLM/TGI in Produktion
- Kubernetes + GPU
- Englisch C1+
Nice-to-have
- Sovereign-Cloud-Kontext
Bewerbung in 60 Sekunden
In 60 Sekunden bewerben
Wir melden uns innerhalb von 48 Stunden, wenn dein Profil zu diesem Mandat passt.
- Direkter Draht zum Auftraggeber, kein Recruiter-Pingpong.
- Tagessatz wird vor dem ersten Call abgeklärt — keine versteckte Range.
- Klare Aufgabe, klares Budget, klare Entscheidungswege.
- Antwort in 48 h, nur wenn das Mandat wirklich zu dir passt.
- Wiederkehrende Mandate möglich: gute Profile bleiben im Talent-Pool.
Hinweis: Profil-Link ist optional LinkedIn, freelance.de, freelancermap, Malt, GitHub oder eigene Portfolio-URL.
