Foundation Model Researcher
Forschungsprofil mit Fokus auf Pretraining, Architektur und Skalierung großer Basismodelle.
Foundation Model Researchers arbeiten an den Grundlagen großer Basismodelle: Pretraining-Daten, Architekturen, Skalierungsgesetze, Trainingsstabilität. In Europa primär bei Modellanbietern, Hochschul-Spin-offs und einigen Großkonzernen.
- Festanstellung
- 150.000–250.000 € + Bonus
- Umfelder
- Modellanbieter, Hochschulen, Großindustrie
Aufgaben
Design und Training von Basismodellen, Skalierungsexperimente, Datenkuration im großen Maßstab, Eval-Methodik, Forschungsergebnisse.
Skills
Top-Mathematik, PyTorch/JAX, Distributed Training (Megatron, DeepSpeed), Erfahrung mit Multi-Node-GPU-Setups, Publikationen.
Markt 2026
Festanstellung: 150.000–250.000 € + Bonus, in europäischen Modellanbietern eigene Pakete. Freelance praktisch nicht relevant.
Recruiting
Internationaler Wettbewerb mit US-Labs. In DACH gezielt über Headhunting und Reputation.
Praxis & Empfehlung 2026
Für die meisten DACH-Unternehmen sind Foundation Model Researchers schlicht nicht relevant – die Wertschöpfung passiert in Anwendung, Adaption und Integration vorhandener Modelle. Relevant wird die Rolle, wenn Sie als Modellanbieter, Hochschul-Spin-off oder regulierter Konzern eigene Basismodelle (z. B. für Medizin, Recht, Pharma) trainieren wollen. In dem Fall sollten Sie mit klarem Mehrjahresplan rekrutieren: GPU-Cluster, Datenstrategie, Trainings-Operations, Publikationsstrategie und Compliance. Spitzenbesetzung arbeitet hier oft eng mit Aufsichtsräten, weil die Investitionssumme über 5–10 Jahre realistisch im hohen einstelligen bis dreistelligen Millionenbereich liegt. Ohne diese Klarheit produziert die Rolle teure Unzufriedenheit.
Häufige Fragen
- Brauche ich diese Rolle?
- Nur, wenn Sie selbst Basismodelle trainieren. Für Anwendung und Anpassung reichen LLM/AI Engineers und Applied Scientists.
Passende Leistungen
Verwandte Begriffe
- Research Scientist (KI) – Forschungsprofil, das neue ML-/LLM-Methoden entwickelt und meist publikationsorientiert arbeitet.
- Applied Scientist – Forschungsnaher Engineer, der neue ML-/LLM-Verfahren auswählt, adaptiert und in produktive Lösungen überführt.
- Deep-Learning-Spezialist – Engineer- oder Wissenschaftsprofil mit Fokus auf moderne neuronale Netze für Sprache, Bild, Audio oder multimodale Aufgaben.
