VoiceAI auf Basis von realtime speech-to-speech LLMs in Verbindung mit agentischen Systemen.

Björn Schotte demonstrierte live die Contact Center Solution der Mayflower GmbH im Rahmen des 23. Expertenkreises „Customer Contact“ der ServiceRating Analyse und Beratung GmbH.

VoiceAI im Kundenservice

VoiceAI steht dabei für eine neue Generation von KI-gestützter Kommunikation, die nicht nur schneller und effizienter ist, sondern auch natürlicher und empathischer wirkt. Durch agentische KI-Systeme, die autonom agieren und sich in Echtzeit mit Kunden austauschen, werden klassische Herausforderungen wie lange Warteschleifen, unpersönliche Bots oder fragmentierte Systemlandschaften überwunden.

Realtime speech-to-speech… Was hat sich 2025 geändert?

Traditionelle Voice-Systeme arbeiten meist mit einer Pipeline aus Speech-to-Text, Textverarbeitung und anschließendem Text-to-Speech. Diese Architektur führt zu spürbaren Latenzen, stockenden Dialogen und einem unnatürlichen Gesprächsfluss. Moderne Speech-to-Speech-Modelle hingegen ermöglichen direkte, flüssige Kommunikation in Echtzeit – ohne Umwege über Text. Sie bieten natürliche Prosodie (u. a. Betonung, Tonhöhe, Tempo), emotionale Tonalität und die Fähigkeit zur Unterbrechung, was zu einer deutlich besseren Customer Experience führt. Die Technologie ist damit nicht nur schneller, sondern wirkt auch menschlicher und intuitiver.

Was bedeutet agentisch? Was ist MCP?

Agentische Systeme arbeiten autonom in Bezug auf ein (externes) Ziel. Das bedeutet, sie arbeiten nicht völlig frei und sie arbeiten auch nicht an eigenen ZielenSie nutzen zur Lösung des vorgegebenen Problems keine festen Lösungswege (fester Prozess), sondern entscheiden autonom und nutzen dabei ggf. weitere Systeme, Instrumente und Datentöpfe.

MCP steht für „Model Context Protocol“ und wurde von Anthropic entwickelt. Es handelt sich um einen Schnittstellenstandard, der es ermöglicht, KI-Systeme effizient mit internen IT-Systemen zu verbinden. MCP erlaubt es, Kontextinformationen aus CRM, ERP oder anderen Systemen bereitzustellen, die die KI für ihre Entscheidungen nutzen kann. Wichtig ist jedoch: MCP allein macht ein System nicht „agentisch“. Es stellt lediglich die Verbindung her, erst durch agentische KI, die diese Schnittstellen nach Bedarf nutzt, um Aufgaben selbstständig auszuführen, entsteht der große Mehrwert dieser Systeme.

Live Demos mit Wechsel zwischen Agent und Mensch

In den ersten live-Demos wurden mit VoiceAI u.a. Events und Hotelverfügbarkeiten erfragt, eher einfache Use-Cases, die vom Agenten solide abgearbeitet wurden. Dann wurde es richtig spannend: Ein Gespräch, das mit dem Agenten gestartet wurde, wurde auf Wunsch des Kunden zunächst an einen menschlichen Berater weitergeleitet. Später übernahm der Agent wieder nahtlos und führte das Gespräch fort. Hierbei konnte der Agent auch auf die Informationen aus dem Gespräch mit dem menschlichen Berater zugreifen und umgekehrt. Die letzte Demo mit dem neuesten Modell von OpenAI zeigte, dass man diese Modelle mit einer neuen Frage unterbrechen kann und sie im Hintergrund an der übergeordneten Frage weiterarbeiten, um deren Lösung später wieder nutzen zu können.

Was bringt‘s den Kunden?

Die Technologie ermöglicht eine Steigerung der First Contact Resolution, wenn die internen Systeme dem KI-Agenten das nötige Wissen bereitstellen. Mehrsprachige und kontextsensitive Kundenkontakte sind möglich. Die Systeme lassen sich sehr gut skalieren.

Was bringt’s den Unternehmen

Drastische Kostenreduktion bei höherer Kundenzufriedenheit sind durch schnellere Lösungen möglich.

Was heißt das für die Mitarbeitenden?

Zunächst bedeutet es, dass Mitarbeiter mehr Kundenkommunikation in der gleichen Zeit begleiten können. Zunächst könnten also die Erreichbarkeiten deutlich gesteigert und die Wartezeiten für Kunden reduziert werden. Für Mitarbeitende ergeben sich neue Rollen. Sie werden Supervisoren der Kundenkommunikation, die auch beim Training der Agenten helfen, deren Gespräche überwachen und notfalls übernehmen. Sie bleiben die Experten für komplexe Fälle, für die dann mehr Zeit zur Verfügung steht. Ggf. bleibt sogar noch Zeit, um die Kundenbedürfnisse tiefer zu beleuchten und das Bindungspotential echter menschlicher Kommunikation zu aktivieren.

Aber…

Eigentlich kein aber, aber… die Gesamtperformance, die Kunden erfahren, hängt natürlich von der Geschwindigkeit der genutzten Schnittstellen und Wissenssysteme ab. Rattert im Keller noch die Bandmaschine, dann wird auch das beste agentische System mit dem neuesten Voice-Modell keine schnelle Auskunft geben können.

Außerdem ist die Qualität der Daten wichtig: Gute Auskünfte brauchen eine solide Datengrundlage. Wenn die nicht da ist, kann kein Agent – im Übrigen auch kein Mensch – sinnvolle Auskünfte geben.

Fazit:

VoiceAI auf Basis von realtime speech-to-speech LLMs in Verbindung mit agentischen Systemen ist nicht nur ein technisches ist nicht nur ein technisches Upgrade, sondern verändert die Interaktion mit dem Kunden grundlegend. Sie als technisches, Daten oder IT-Projekt zu verstehen, greift deutlich zu kurz. Vielmehr handelt es sich um einen strategischen Wandel mit enormem Potential. Unternehmen, die heute starten, sichern sich Wettbewerbsvorteile, die durch herkömmliche Prozessoptimierungen nicht erreichbar sind.

Ein paar Kundenorientierungs-, Prozess- und Digitalisierungshausaufgaben müssen aber in dem Zusammenhang endlich gemacht werden. Die sind aber eh überfällig!

Vielen Dank an Björn Schotte für den spannenden Vortrag und allen Teilnehmern für die gute Diskussion.
Hier findet ihr die Mayflower GmbH.

Bei Interesse am Expertenkreis und am Vortrag bitte Mail an: info@servicerating.de

Multicaller-Monitor und Kostenersparnis aus dem Vortrag

1 Mensch beobachtet 4 Gespräche

Kostenersparnis AI vs. Mensch

Herzlichen an Dank an die TeilnehmerInnen!

Der Expertenkreis Customer Contact ist eine Gruppe von EntscheiderInnen, die eine Vielzahl von Kundenkontakten verantwortet. Der Expertenkreis entstand aus einem Workshop auf einer ServiceRating-Veranstaltung vor ca. 8 Jahren und trifft sich seither online und offline mehrfach im Jahr. Grundsätzlich findet der Expertenkreis als Lean Coffee statt, das heißt alle TeilnehmerInnen können ihre Fragen / Themen mitbringen. Die Gruppe stimmt darüber ab und dann werden die Themen der Reihe nach besprochen. Immer wieder finden auch Vorträge von TeilnehmerInnen des Expertenkreises oder von externen SprecherInnen statt.  Auf diese Weise werden immer aktuelle und konkrete Fragestellungen rund um das Thema Kundenkontakt besprochen.

Weitere Informationen zum Expertenkreis gibt es hier: Expertenkreis Contact Center – ServiceRating

Teilnehmer des ExpertInnenkreises Customer Contact der ServiceRating Analyse und Beratung GmbH im Vortrag zu realtime speech-to-speech voiceAI von Björn Schotte