Was kostet ein RAG Projekt im DACH-Raum?

Typischer Prototyp 60.000–120.000 EUR. Produktion mit Härtung und Roll-out je nach Datenraum 250.000–800.000 EUR.

Wie lange dauert ein RAG Projekt?

Vom Discovery bis zur Produktion 3–6 Monate. Prototyp meist 4–6 Wochen.

Brauche ich GPUs für RAG?

Für Embeddings ja, oft reichen Managed-Services. Für die Generierung kann ein API-LLM ausreichen.

Welche Vektor-DB ist die richtige?

Qdrant für Self-Hosting, pgvector wenn Postgres bereits existiert, Pinecone als Managed-Service.

Wie misst man die Qualität von RAG?

Ragas, manuell kuratierte Goldsets, LLM-as-Judge. Immer kombiniert, nie nur automatisch.

RAG Projekt — Aufbau, Stack und Tagessätze

Ein RAG Projekt verbindet ein LLM mit firmeneigenem Wissen, ohne das Modell selbst zu trainieren. Es ist der schnellste Weg zu produktiver Generativer KI, wenn das Wissen schon irgendwo geschrieben steht — in Confluence, in PDFs, in Tickets, in Datenbanken.

Wann sich dieser Projekttyp lohnt

Wissen ist vorhanden, aber verteilt.
Antwortqualität muss zitierfähig sein.
Datenschutz erfordert eigene Vektor-DB.
Schnelle Iteration ist wichtiger als perfekte Generation.

Typische Phasen

Phase 1 · 2 Wochen
Discovery
Use Case, Datenraum, KPI
Phase 2 · 4–6 Wochen
Prototyp
Erstes End-to-End-RAG, manuelle Eval
Phase 3 · 6–10 Wochen
Härtung
Latency, Eval-Loop, Monitoring
Phase 4 · 4–8 Wochen
Produktion
Roll-out, Drift- und Quality-Monitoring

Rollen und Tagessätze

LLM Engineer950 – 1.350 EUR
RAG Developer950 – 1.250 EUR
Data Engineer900 – 1.200 EUR
Solution Architect AI1.100 – 1.450 EUR

Risiken und Stolperfallen

Halluzinationen ohne Eval-Disziplin.
Datenraum schlecht gepflegt, Chunking falsch.
Vendor-Lock-in ohne Abstraktion.
Datenschutz unklar bei externem Vektor-Hosting.

Häufige Fragen (FAQ)

Was kostet ein RAG Projekt im DACH-Raum?: Typischer Prototyp 60.000–120.000 EUR. Produktion mit Härtung und Roll-out je nach Datenraum 250.000–800.000 EUR.
Wie lange dauert ein RAG Projekt?: Vom Discovery bis zur Produktion 3–6 Monate. Prototyp meist 4–6 Wochen.
Brauche ich GPUs für RAG?: Für Embeddings ja, oft reichen Managed-Services. Für die Generierung kann ein API-LLM ausreichen.
Welche Vektor-DB ist die richtige?: Qdrant für Self-Hosting, pgvector wenn Postgres bereits existiert, Pinecone als Managed-Service.
Wie misst man die Qualität von RAG?: Ragas, manuell kuratierte Goldsets, LLM-as-Judge. Immer kombiniert, nie nur automatisch.

Bewerbung in 60 Sekunden

Für diesen Projekttyp vormerken

Sag uns, was du suchst — wir melden uns, wenn ein passendes Mandat dieser Art reinkommt.

Direkter Draht zum Auftraggeber, kein Recruiter-Pingpong.
Tagessatz wird vor dem ersten Call abgeklärt — keine versteckte Range.
Klare Aufgabe, klares Budget, klare Entscheidungswege.
Antwort in 48 h, nur wenn das Mandat wirklich zu dir passt.
Wiederkehrende Mandate möglich: gute Profile bleiben im Talent-Pool.

Hinweis: Profil-Link ist optional LinkedIn, freelance.de, freelancermap, Malt, GitHub oder eigene Portfolio-URL.

Ich bin *

Rolle *

Name *

E-Mail *

Profil * (eins genügt)

Verfügbarkeit *

Mehr Angaben (optional)

Tagessatz-Range in EUR (optional)

Standort

Remote ist OK

Ich willige in die Aufnahme in den Talent-Pool zur Vermittlung passender KI-Mandate ein. Ihr informiert mich nur bei konkreten passenden Projekten. Einwilligung jederzeit widerrufbar. Datenschutz

Hinweis nach Art. 13 DSGVO: Verantwortlich ist die im Impressum genannte Stelle. Deine Daten werden ausschließlich zur Aufnahme in den Talent-Pool und zur Kontaktaufnahme bei passenden Mandaten verarbeitet. Rechtsgrundlage ist deine Einwilligung (Art. 6 Abs. 1 lit. a DSGVO). Du kannst sie jederzeit widerrufen und die Löschung verlangen.