Andrea Raab, Customer Service
+49 341 99 15 36 00
Retrieval-Augmented Generation (RAG) verbindet große Sprachmodelle (LLMs) mit dem Wissen Ihres Unternehmens – von Produktdaten aus PIM- oder ERP-Systemen über PDFs bis hin zu Kundenbewertungen. Für den Vertrieb bedeutet das: präzisere Produktempfehlungen, hilfreiche Einkaufsberatung durch Chatbots und ein Kundenservice, der fundierte Antworten liefert.
Retrieval-Augmented Generation (RAG) ist ein Architekturansatz, bei dem ein Sprachmodell während der Antworterzeugung gezielt externe Wissensbausteine abruft – etwa Produktdaten, Handbücher, FAQ-Artikel oder CRM-Einträge. Statt nur auf statische Trainingsdaten zurückzugreifen, werden die Modellantworten mit aktuellen, geprüften Fakten unterlegt. Das reduziert Halluzinationen, erhöht die Relevanz und ermöglicht die Kontrolle über Quellen und Zitate.
Im Unterschied zu einem aufwendigen Fine-Tuning verändert RAG das Verhalten des Modells ohne erneutes Training – ideal, wenn Inhalte sich häufig ändern (Sortimente, Aktionen, Lieferzeiten) oder sensible Informationen nicht in das Modell einfließen dürfen. Inzwischen gilt RAG als De-facto-Standard, wenn LLMs für unternehmensspezifische Anwendungen genutzt werden.
Standard-LLMs sind leistungsstark – aber sie wissen nichts über Ihre Produkte, Richtlinien oder Zielgruppen. Ihr Wissen veraltet (Knowledge-Cutoff) und in Nischenthemen liefern sie oft falsche Antworten. Genau hier setzt RAG an: Eine semantische Suche findet passende Text- oder Tabellenauszüge (z. B. Garantiebedingungen oder Kompatibilitätslisten), die das Modell beim Formulieren der Antwort nutzt. Das Ergebnis sind aktuelle, überprüfbare Ausgaben – auf Wunsch mit Quellenhinweisen.
Entdecken Sie in nur 60 Minuten 2 praktische Use Cases aus dem B2B-Mittelstand, die Ihnen zeigen, wie Sie Ihre Daten für KI aufbereiten, die richtigen Tools auswählen sowie kombinieren und Ihren Mitarbeitern und Kunden effizient Mehrwerte bieten. Für schnelle Ergebnisse ohne monatelange Projekte. Technisch fundiert. Praktisch erklärt. Sofort umsetzbar. 07.10.2025 / 11:00 Uhr / Online Webinar mit FactFinder
Zur Aufzeichnung
Klassische Empfehlungssysteme basieren meist auf Klick- und Kaufhistorien. RAG geht einen Schritt weiter: Es integriert beschreibendes Wissen aus ERP-, PIM- oder CMS-Systemen, unstrukturierte Kundenbewertungen, FAQ und Kompatibilitätslisten. So können Vorschläge begründet werden („passt zu deinem Gerät XY“), Unterschiede zwischen Produkten erklärt („leichter, aber weniger geeignet für Anwendung XY als andere Produkte“) oder Rezensionen in Form von Vor- und Nachteilen zusammengefasst werden. Das Ergebnis ist Personalisierung mit Beratungscharakter statt reiner Mustererkennung.
Beispiele:
Bedarfsorientierte Produktsuche: Der Assistent stellt 3–5 Fragen (Anlass, Budget, Präferenzen), zieht Produktattribute und Bewertungen heran und liefert transparent begründete Trefferlisten.
Bundles & Cross-Selling: Zubehör und Kompatibilitäten werden automatisch berücksichtigt.
„Cold Start“ mildern: Neue Produkte können über ihre Merkmale empfohlen werden, auch ohne Nutzungsdaten.
Das steigert Conversion-Rates, Warenkorbwerte und reduziert Retouren – weil Kund:innen verstehen, warum ein Artikel passt (oder nicht).
Service-Bots gewinnen durch RAG deutlich an Nutzwert. Sie beantworten komplexe Fragen (Garantie, Retoure, Pflegehinweise) auf Basis derselben Dokumente wie das Help-Center: Richtlinien, PDFs, Tickets oder Makros. Zusätzlich können interne Systeme eingebunden werden (Bestellstatus, SLA, Kulanzregeln) – mit rollen- und fallbasierter Zugriffskontrolle.
Typische Effekte:
First Contact Resolution steigt: Kundenprobleme werden häufiger direkt beim ersten Kontakt gelöst.
Bearbeitungszeit sinkt: Weniger Rückfragen, weniger Eskalationen.
Kundenzufriedenheit verbessert sich: nachvollziehbare, quellengestützte Antworten schaffen Vertrauen.
Virtuelle Assistenten agieren wie eine persönliche Beratung: Sie verstehen Vorlieben, stellen Rückfragen, erklären Unterschiede, berücksichtigen Lagerbestand und Lieferzeiten – und führen direkt zu passenden Varianten. In der Praxis reduziert das Warenkorbabbrüche, steigert Conversion-Rates und entlastet Vertriebsteams.
Besonders wirksam ist die Kombination von RAG (Produktwissen, Bewertungen, Richtlinien) mit Intent-Erkennung und Dialoglogik – so entsteht ein Gespräch, das sich natürlich anfühlt und auf echtem Shop-Wissen basiert.
RAG erweitert die klassische Suche um sprachliche Antworten mit Quellen, z. B. auf Produktdetailseiten („Ist das Gerät mit iPhone 15 kompatibel?“) oder in der globalen Suche („Welche Regenjacke eignet sich für eine Wanderung im Herbst?“). LLM und Retriever liefern zusammengefasste, belegte Antworten statt langer Trefferlisten. Technologien wie Vektor-Suche und Hybrid Retrieval (Semantik + Keywords) sind hier Standard.
Nach dem Kauf unterstützt RAG beim Onboarding (Erstinstallation, Pflege), erklärt Ersatzteile, verknüpft Anleitungen mit konkreten Produkten – und reduziert so das Anfragevolumen und die Retourenquote. Auch in Treueprogrammen (FAQ, Vorteils-Erklärungen) oder bei Garantie- und Kulanzfällen sorgt RAG für klare, belegte Informationen.
Ein RAG-System (Retrieval-Augmented Generation) besteht im Kern aus fünf Bausteinen:
1. Wissensquellen
PIM- und CMS-Systeme
Produktblätter (PDFs)
Size Guides
Kompatibilitätslisten
Rückgabe- und Garantierichtlinien
Kundenbewertungen (Reviews)
Help-Center-Inhalte und FAQs
CRM-Daten
Gegebenenfalls Echtzeit-Feeds (z. B. Bestände, Preise)
2. Aufbereitung & Indexierung
Extraktion von Inhalten (inklusive PDFs und strukturierter Daten)
Aufteilung in Abschnitte (Chunking)
Normalisierung und Filterung sensibler Daten (PII-Filter)
Erzeugung von Embeddings und Aufbau eines Vektorindex
Optional: hybrides Retrieval (Kombination aus BM25 und Vektor-Suche)
3. Retrieval-Logik
Umformung von Nutzeranfragen (Query Rewriting)
Re-Ranking relevanter Ergebnisse
Deduplizierung von Quellen
Bereitstellung zitierfähiger Textauszüge
Optional: Anbindung eines Wissensgraphen oder Ensemble-Retrievers
4. Generator / LLM
Steuerung von Antwortstil und Tonalität
Einheitliches Zitier- und Referenzformat
Mehrschrittige Reasoning-Prompts für komplexe Fragestellungen
Guardrails zur Sicherstellung von Richtlinien- und Compliance-Vorgaben
5. Orchestrierung & Monitoring
Caching und Optimierung von Kosten sowie Latenzen
Feedback-Schleifen für kontinuierliche Verbesserung
Automatisierte Evaluationen (z. B. Nützlichkeit, Korrektheit, Zitattreue)
Phase 0 – Workshop
Abgleich der Vision: Was ist möglich, was haben andere bereits erreicht?
Erstellung eines High-Level Solution Blueprints
Kosten- und ROI-Kalkulation
Phase 1 – Fokussieren
Geschäftsziele und KPIs präzisieren, z. B. „+1 Prozentpunkt Conversion durch Guided Selling“ oder „–20 % AHT im Service“.
Use-Cases eingrenzen (MVP), z. B. „Produktsuche“, „Bestellstatus/Retoure“, „Größenberatung“.
Wissens-Audit: Wo liegen welche Informationen (PIM, PDFs, CMS, Help-Center, CRM)? DSGVO-/PII-Konformität prüfen.
Phase 2 – Datenaufbereitung
Extraktion, Normalisierung, Chunking, Metadatenpflege (SKU, Kategorie, Region, Sprache).
PII-Filter und RBAC-Konzepte für sensible Bereiche (z. B. Kulanzregeln).
Phase 3 – Prototyp
Aufbau der RAG-Kette: Retriever (Hybrid), LLM-Kette, Antwortvorlagen (Tonfall, Zitate, Call-to-Actions).
Integrierte Evaluierungen: Antworttreue mit Quellenangabe, Ranking-Qualität, Konsistenz mit dem Markenstil.
UX-Flows für Webchat und PDP-Widgets.
Phase 4 – Rollout & Tuning
Schattenbetrieb oder Teil-Rollout, mit Eskalation an menschliche Agenten.
Telemetriegestütztes Feintuning (Prompt-Anpassungen, Re-Ranking, neue Quellen).
Betriebsmodelle: Monitoring, Kostenkontrolle, Content-Governance.
Produktempfehlungen & Guided Selling
Conversion-Rate in geführten Sessions im Vergleich zur Baseline
Umsatz pro Session / Warenkorbwert (Cross-/Upsell)
Retourenquote (insbesondere passungsbedingte Retouren reduzieren)
„Why this?“-Klicks (Interesse an Erklärbarkeit)
Kundenservice
FCR – First Contact Resolution, AHT – Average Handling Time, CSAT – Customer Satisfaction Score
Deflection-Rate (Anteil an Self-Service-Lösungen)
Qualitätssicherung: Quellentreue, Policy-Konformität
Chatbots & Assistenten
Engagement und Erfolgsquote (gelöste Intents)
Weiterleitungen an menschliche Agenten (sinnvoll reduzieren, aber nicht vollständig vermeiden)
Commerce-KPIs aus Chat-Interaktionen (z. B. Adds-to-Cart, Quote-to-Order)
Geschäftsziele und Use-Case klar definieren (eine Seite, ein KPI).
Quelleninventur: Welche PDFs, PIM-Attribute, Richtlinien, Rezensionen, Chat-Makros stehen zur Verfügung?
Datenhygiene sicherstellen: Dubletten entfernen, Chunk-Größen festlegen, Metadaten ergänzen (SKU, Region, Sprache).
Retriever auswählen: Hybrid (BM25 + Vektor) als Basis, Re-Ranking und Query-Rewrites einplanen.
Antwortdesign festlegen: Tonalität, Zitierformat (Abschnittslinks/IDs), „Don’t-know“-Regeln, Eskalationspfade.
Evaluierungen & Guardrails: Messbare Kriterien (Korrektheit, Zitat-Treue), DSGVO-/PII-Kontrollen.
Pilot & Iteration: Kleiner Rollout (eine Kategorie, ein Service-Thema), Feedback sammeln, Quellen aktuell halten.
Skalierung: Agentische Schritte (z. B. Lieferstatus prüfen), Kosten- und Latenzoptimierung (Caching, Prompt-Budget), Monitoring etablieren.
Retrieval-Augmented Generation (RAG) ist ein entscheidender Hebel, um generative KI im Handel praxisnah einzusetzen: Beratung, die erklärt – Empfehlungen, die begründet – Service, der wirklich löst.
Der Weg ist pragmatisch: Inhalte kuratieren, sauber indexieren, Antworten zitierfähig machen und mit klaren KPIs ausrollen. Wer heute mit einem fokussierten MVP startet (z. B. Guided Selling oder Service-FAQ), hat bereits nach wenigen Wochen belastbare Nachweise für Wirkung und Wirtschaftlichkeit – und schafft die Grundlage, um von dort aus in agentenbasierte Workflows und Omnichannel-Erlebnisse zu wachsen.
Mit unseren Whitepapern, Webinaren, Blogbeiträgen eintauchen in die Welt des eCommerce und immer auf dem aktuellsten Stand bleiben!
Von entscheidenden Key Performance Indikatoren, bis zur Integration der Daten in den B2B-Verkaufszyklus – in diesem Artikel werfen wir einen umfassenden Blick auf die Bedeutung der Webanalyse im B2B.
Wir freuen uns über Ihre Kontaktaufnahme!
Erfahren Sie in unserem Whitepaper, wie moderne Sprachmodelle mit Retrieval-Augmented Generation den B2B-Vertrieb und Kundenservice revolutionieren. Wir zeigen Anwendungsbeispiele, praktische Use Cases aus dem B2B und konkrete Schritte für die Implementierung Ihrer KI-Lösung.
Jetzt herunterladen
Patrick Lorenz besitzt über 16 Jahren Erfahrung in der Software-Entwicklung. Seit 2023 ist er Head of Frontend bei Smart Commerce und AI Operations Officer. In der Vergangenheit war er bei verschiedenen Kunden unter anderem für die Analyse bisheriger eCommerce Systeme zuständig und hat die Planung, Architektur und Angebotserstellung durchgeführt.
Entdecken Sie unseren einzigartigen Ansatz für Ihren Online Erfolg - Analysen, Workshops und strategische Beratung.
Maximiere dein eCommerce-Potenzial mit unseren Digital Experience Platform – personalisierte Erlebnisse, nahtlose Integrationen, mehr Conversion!
Wir entwickeln & implementieren für Sie maßgeschneiderte E-Commerce-Systeme mit führenden Technologiepartnern.
Optimiere dein Produktmanagement mit unseren PIM-Services – zentral, effizient, fehlerfrei. Mehr Konsistenz, weniger Aufwand!
Moderne Public Cloud Lösungen mit maximaler Automatisierung zum Betrieb effizienter E-Commerce Systeme.
Nutze Künstliche Intelligenz für deinen Online-Erfolg – smartere Prozesse, personalisierte Erlebnisse, mehr Umsatz. Zukunftssicher und effizient!
Tauchen Sie ein in die Welt des eCommerce. Mit dem Smart Commerce SE Newsletter sind Sie immer up-to-date. Alles was Sie dafür tun müssen: Jetzt anmelden!
Zum Newsletter anmelden