Bei der Nutzung generativer KI in Geschäftsprozessen stehen Unternehmen vor der Herausforderung, das am besten geeignete Modell für ihre Einsatzzwecke zu identifizieren. “Die größten, leistungsfähigsten Modelle sind oftmals zu kostspielig und liefern mehr, als eigentlich benötigt wird”, so Clara Shih, CEO von Salesforce AI. In vielen Fällen seien Open-Source und/oder kleinere Modelle zu geringeren Kosten für viele Aufgaben mindestens genauso gut geeignet. Auch Geschwindigkeit und Benutzerfreundlichkeit bereiten Kopfzerbrechen. Der größte Hemmschuh liegt bei der Datensicherheit, wenn gegebenenfalls vertrauliche Daten in das LLM eingespeist werden. Zu guter Letzt erschwert das exponentielle Wachstum der Modelllandschaft die Übersicht noch weiter.

Anwendungsfälle in Vertrieb und Kundenservice

Der LLM Benchmark für CRM ist für Einsatzszenarien in Vertrieb und Kundenservice zugeschnitten. Er bildet Anwendungsfälle wie Zusammenfassungen von Verkaufschancen, Interessentengewinnung, Vorfallsberichte, wissensbasierte Empfehlungen für Support-Antworten und mehr ab. Da andere LLM-Benchmarks akademische und private Anwendungsfälle fokussieren, zu wenige Bewertungen durch Experten berücksichtigen sowie Kriterien wie Genauigkeit, Geschwindigkeit, Kosten und Vertrauen nicht miteinbeziehen, sind sie für Unternehmen kaum relevant. Deshalb umfasst der Benchmark auch ein öffentlich einsehbares Leaderboard, das Unternehmen dabei hilft, die Effektivität von generativen, KI-gestützten CRM-Lösungen zu beurteilen und informierter zu entscheiden, welches LLM für ihre CRM-Anforderungen am besten geeignet ist.

Die Kriterien im Überblick

Genauigkeit
Diese Metrik umfasst die vier Unterkategorien Richtigkeit, Vollständigkeit, Verständlichkeit und die Berücksichtigung der Eingabebefehle/Prompts. Denn nur präzise und korrekte Vorhersagen und Empfehlungen können durch informierte Aktionen in bessere Geschäftsergebnisse und Kundenerfahrungen münden.

Kosten
Die Messgröße für Kosten bezieht sich auf die geschätzten Betriebskosten, die je nach CRM-Anwendungsfall variieren können, und wird basierend auf Perzentilen in die Kategorien hoch, mittel und niedrig eingeteilt.

Geschwindigkeit
Die Reaktionsfähigkeit und Effizienz des LLMs bei der Verarbeitung und Bereitstellung von Informationen verbessert das Nutzererlebnis, verkürzt beispielsweise die Wartezeiten für Kund:innen und ermöglicht es Vertriebs- und Serviceteams, Anfragen und Aufgaben zeitnah zu bearbeiten.

Vertrauen und Sicherheit
Hierbei geht es um die Fähigkeit des LLMs, sensible Kundendaten abzuschirmen, die Datenschutzbestimmungen einzuhalten, Informationen zu sichern sowie Voreingenommenheit und Toxizität zu vermeiden. Daraus ergibt sich ein Wert für die Zuverlässigkeit von LLMs für CRM, der für mehr Transparenz im Hinblick auf Vertrauen und Sicherheit sorgt. Mit dem Einstein Trust Layer können Unternehmen ihre vertrauenswürdigen Daten und Metadaten unabhängig von dem erreichten Wert in jedem Modell sicher nutzen, ohne dass diese dort gespeichert oder für Trainingszwecke genutzt werden.

Roger Homrich

Recent Posts

REWE Group treibt digitale Transformation voran

Seit Januar 2025 überführt REWE digital schrittweise 73 neue SAP-Systeme in die Google Cloud.

1 Tag ago

Kälte smart geregelt

Dank cleverer KI-Lösung sparen die Stadtwerke Karlsruhe bis zu 40 Prozent Strom bei der Kälteerzeugung…

2 Tagen ago

Domain-Hijacking: Angriff auf verwaiste Assets

Die unberechtigte Übernahme von Domains durch Dritte kann ernstzunehmende Folgen für Markenführung, Cybersecurity und Business…

2 Tagen ago

Bundesland Schleswig-Holstein setzt auf Open Source

Landesverwaltung wendet sich konsequent von Microsoft ab und setzt künftig auf Open Source Software.

3 Tagen ago

Cybersicherheitssoftware: Der digitale Schutzschild für Unternehmen

In einer zunehmend digitalisierten Welt wird Cybersicherheit zu einer der zentralen Herausforderungen für Unternehmen aller…

3 Tagen ago

Kostengünstiger Schutz gegen Quantenangriffe?

Das Karlsruher Institut für Technologie hat ein Verfahren vorgestellt, das klassische Kryptografie-Verfahren und herkömmliche Hardware…

3 Tagen ago