RAG Projekt — Aufbau, Stack und Tagessätze
Ein RAG Projekt verbindet ein LLM mit firmeneigenem Wissen, ohne das Modell selbst zu trainieren. Es ist der schnellste Weg zu produktiver Generativer KI, wenn das Wissen schon irgendwo geschrieben steht — in Confluence, in PDFs, in Tickets, in Datenbanken.
Wann sich dieser Projekttyp lohnt
- Wissen ist vorhanden, aber verteilt.
- Antwortqualität muss zitierfähig sein.
- Datenschutz erfordert eigene Vektor-DB.
- Schnelle Iteration ist wichtiger als perfekte Generation.
Typische Phasen
- Phase 1 · 2 WochenDiscoveryUse Case, Datenraum, KPI
- Phase 2 · 4–6 WochenPrototypErstes End-to-End-RAG, manuelle Eval
- Phase 3 · 6–10 WochenHärtungLatency, Eval-Loop, Monitoring
- Phase 4 · 4–8 WochenProduktionRoll-out, Drift- und Quality-Monitoring
Rollen und Tagessätze
- LLM Engineer950 – 1.350 EUR
- RAG Developer950 – 1.250 EUR
- Data Engineer900 – 1.200 EUR
- Solution Architect AI1.100 – 1.450 EUR
Risiken und Stolperfallen
- Halluzinationen ohne Eval-Disziplin.
- Datenraum schlecht gepflegt, Chunking falsch.
- Vendor-Lock-in ohne Abstraktion.
- Datenschutz unklar bei externem Vektor-Hosting.
Häufige Fragen (FAQ)
- Was kostet ein RAG Projekt im DACH-Raum?
- Typischer Prototyp 60.000–120.000 EUR. Produktion mit Härtung und Roll-out je nach Datenraum 250.000–800.000 EUR.
- Wie lange dauert ein RAG Projekt?
- Vom Discovery bis zur Produktion 3–6 Monate. Prototyp meist 4–6 Wochen.
- Brauche ich GPUs für RAG?
- Für Embeddings ja, oft reichen Managed-Services. Für die Generierung kann ein API-LLM ausreichen.
- Welche Vektor-DB ist die richtige?
- Qdrant für Self-Hosting, pgvector wenn Postgres bereits existiert, Pinecone als Managed-Service.
- Wie misst man die Qualität von RAG?
- Ragas, manuell kuratierte Goldsets, LLM-as-Judge. Immer kombiniert, nie nur automatisch.
Bewerbung in 60 Sekunden
Für diesen Projekttyp vormerken
Sag uns, was du suchst — wir melden uns, wenn ein passendes Mandat dieser Art reinkommt.
- Direkter Draht zum Auftraggeber, kein Recruiter-Pingpong.
- Tagessatz wird vor dem ersten Call abgeklärt — keine versteckte Range.
- Klare Aufgabe, klares Budget, klare Entscheidungswege.
- Antwort in 48 h, nur wenn das Mandat wirklich zu dir passt.
- Wiederkehrende Mandate möglich: gute Profile bleiben im Talent-Pool.
Hinweis: Profil-Link ist optional LinkedIn, freelance.de, freelancermap, Malt, GitHub oder eigene Portfolio-URL.
