Spitzenbesetzung

Foundation Model Researcher: Aufgaben und Gehalt

Ein Foundation Model Researcher entwickelt die Basisarchitekturen von Large Language Models oder multimodalen Modellen von Grund auf. Er konzipiert skalierbare Trainingsrezepte, optimiert Distributed Training auf Clustern mit tausenden GPUs und verbessert die Transformer-Architektur. Dies ist eine der höchstqualifizierten, meist PhD-getriebenen Rollen der Branche.

Notizbuch mit unscharfer Handschrift, Lesebrille und Laptop

Was macht ein Foundation Model Researcher?

Der Foundation Model Researcher gehört zu den höchstqualifizierten Profilen der Branche. Er entwickelt die Basisarchitekturen von Large Language Models oder multimodalen Modellen von Grund auf, auf Compute-Clustern aus tausenden GPUs. Seine Arbeit liegt vor allem, was Anwendungs-Engineers später nutzen: Er konzipiert skalierbare Trainingsrezepte, optimiert das verteilte Training und verbessert die zugrunde liegende Transformer-Architektur.

  • Pre-Training: Trainingsrezepte für die nächste Modellgeneration entwickeln.
  • Distributed Training: Training auf Clustern mit tausenden GPU-Knoten optimieren.
  • Architektur: Transformer-Architektur für Skalierbarkeit weiterentwickeln.
  • Forschung: Neue Ansätze evaluieren und in Top-Venues (NeurIPS, ICML, ICLR) publizieren.

Kernkonzept: Distributed Training und Parallelism

Der fachliche Kern dieser Rolle liegt im verteilten Training. Beim Training auf tausenden GPUs entstehen massive Kommunikations-Herausforderungen bei der Synchronisation von Gradienten, etwa durch begrenzte InfiniBand-Bandbreiten und die physischen Speichergrenzen einzelner GPUs. Ein erfahrener Researcher unterscheidet sicher zwischen den Parallelisierungsstrategien.

  • Data Parallelism: Gleiches Modell, verschiedene Datenbatches je GPU.
  • Tensor Parallelism: Aufteilung einzelner Modellgewichte über mehrere GPUs.
  • Pipeline Parallelism: Aufteilung der Modellschichten über GPUs hinweg.
  • Engpässe: Netzwerk-Bandbreite und Speicherkapazität als limitierende Faktoren verstehen.

Wann brauchen Sie einen Foundation Model Researcher?

  • Sie trainieren eigene Foundation Models und nicht nur Anwendungen darauf.
  • Sie brauchen Forschungstiefe bei Architektur und Trainingsmethodik.
  • Sie betreiben oder planen große Compute-Cluster und müssen sie effizient nutzen.
  • Sie wollen wissenschaftlichen Vorsprung, nicht nur die Anwendung bestehender Modelle.

Skills und Anforderungsprofil

  • Forschungsexzellenz: PhD und Publikationen in Top-ML-Venues (NeurIPS, ICML, ICLR, ACL).
  • Distributed Training: Multi-Node-GPU-Training, Data/Tensor/Pipeline Parallelism.
  • Frameworks: PyTorch, Megatron-LM, DeepSpeed.
  • Tiefes Systemwissen: Netzwerk-Engpässe (InfiniBand), GPU-Speichergrenzen, Skalierungsgesetze.

Gehalt und Vergütung im DACH-Raum (2026)

Im DACH-Raum gibt es nur wenige Arbeitgeber mit echtem Pre-Training, allen voran Aleph Alpha. Entsprechend dünn ist die Datenlage. International, bei den führenden Laboren, liegt die Vergütung um ein Vielfaches höher, was die DACH-Suche stark erschwert.

Vergütung Foundation Model Researcher, DACH (Proxy-Werte)

  • AI R&D nach Rang (Aleph Alpha)~65.000–130.000 € / Jahr(eujobs Career Guide 2025)
  • Research Engineer LLM Training (Aleph Alpha)~48.000–84.000 € / Jahr(Reale Stellenausschreibung 2026 (Einzelfall))
  • Typische VoraussetzungPhD + Top-Venue-Publikationen(Stellenanzeigen Aleph Alpha 2026)
  • Internationale Frontier-Labsum ein Vielfaches höher(Kontext, keine DACH-Festanstellung)
  • Freelance-Tagessatzmeist nicht relevant (Festanstellung/Forschung)(Rolle ist überwiegend angestellt)

Recruiting-Realität: Verfügbarkeit

Dies ist die seltenste der hier behandelten Rollen. Der DACH-Talentpool ist sehr klein und steht in direkter Konkurrenz zu internationalen Spitzenlaboren. Besetzungen laufen fast ausschließlich über persönliche Netzwerke, akademische Kontakte und gezielte Direktansprache, nicht über klassische Ausschreibungen.

Sie forschen an Foundation Models?

Pre-Training-Erfahrung auf Cluster-Ebene ist im DACH-Raum extrem rar. Wenn Sie eigene Modelle trainiert und in Top-Venues publiziert haben, sind Sie ein gesuchtes Profil. Lassen Sie sich für passende Mandate vorschlagen.

Profil im Talent-Pool hinterlegen

Für Auftraggeber

Sie suchen einen Foundation Model Researcher?

Erstberatung anfragen – wir schlagen passende Profile aus unserem Netzwerk vor.

Für Kandidaten

Sie SIND Foundation Model Researcher?

In den Talent-Pool aufnehmen. Wir melden uns nur bei konkret passenden Mandaten.

Mehr Angaben (optional)

Hinweis nach Art. 13 DSGVO: Verantwortlich ist die im Impressum genannte Stelle. Deine Daten werden ausschließlich zur Aufnahme in den Talent-Pool und zur Kontaktaufnahme bei passenden Mandaten verarbeitet. Rechtsgrundlage ist deine Einwilligung (Art. 6 Abs. 1 lit. a DSGVO). Du kannst sie jederzeit widerrufen und die Löschung verlangen.

Häufige Fragen

Was macht ein Foundation Model Researcher?

Er entwickelt die Basisarchitekturen von Large Language Models oder multimodalen Modellen von Grund auf, konzipiert skalierbare Trainingsrezepte, optimiert Distributed Training auf großen GPU-Clustern und verbessert die Transformer-Architektur.

Was ist der Unterschied zwischen Tensor und Pipeline Parallelism?

Tensor Parallelism teilt einzelne Modellgewichte über mehrere GPUs auf, Pipeline Parallelism teilt die Modellschichten über GPUs hinweg. Beide adressieren unterschiedliche Engpässe beim Training sehr großer Modelle, etwa Speichergrenzen und Kommunikationsbandbreite.

Was verdient ein Foundation Model Researcher in Deutschland?

Belastbare Daten gibt es kaum, da nur wenige DACH-Arbeitgeber Pre-Training betreiben. Bei Aleph Alpha liegt der AI-R&D-Pfad je nach Rang bei rund 65.000 bis 130.000 €. International liegt das Niveau um ein Vielfaches höher.

Braucht man einen PhD für diese Rolle?

In der Regel ja. Typisch sind ein PhD in Machine Learning oder einem verwandten Feld sowie Publikationen in Top-Venues wie NeurIPS, ICML oder ICLR. Die Rolle ist forschungsgetrieben.

Nächster Schritt

Welcher Weg passt zu Ihrer Situation?

Wählen Sie den Pfad, der zu Ihrem Bedarf passt. Jede Erstberatung ist unverbindlich und führt zu einer ehrlichen Markt-Einschätzung.

Verwandte Themen
Begriffe & Tiefenwissen

Passende Glossar-Einträge