Bertin IT (CNIM-Gruppe) meldet die Veröffentlichung der jüngsten Version
von MediaSpeech®,
der mehrsprachigen Spracherkennungslösung des Unternehmens.
Diese konvertiert Audioaufzeichnungen in durchsuchbare Textdateien. Auf
diese Weise können Audio- und Videoquellen indexiert, durchsucht und
analysiert werden. MediaSpeech® ist jetzt für die
Echtzeitverarbeitung von Audioquellen auch als Live-Version erhältlich. Damit
ist der Weg für neue interaktive, innovative Kommunikationsanwendungen
geebnet.
Diese Pressemitteilung enthält multimediale Inhalte. Die vollständige Mitteilung hier ansehen:
https://www.businesswire.com/news/home/20190605005518/de/
Bertin IT introduces MediaSpeech v6, its latest multilingual speech recognition solution (Photo: Business Wire)
Mithilfe von tiefen neuronalen Netzwerken (DNN), die
üblicherweise in Systemen mit künstlicher Intelligenz eingesetzt werden,
erstellt MediaSpeech® ein extrem differenziertes Modell des akustischen
Raumes, das zuverlässig auch unterschiedliche Sprecher und akustische
Bedingungen erfasst und dadurch eine noch schnellere, präzisere
Transkriptionsleistung bietet.
Funktionen:
-
Spracherkennung mit Transkription der einzelnen Wörter innerhalb
einer Millisekunde mit ausgewiesenem Verlässlichkeitswert -
Automatische Erkennung der gerade gesprochenen Sprache (Language
Identification bzw. LID) -
Automatische Segmentierung von Sprechakten und Sprechern mit
Geschlechtererkennung -
Identifizierung des Sprechers anhand einer biometrischen
Datenbank -
Automatische und halbautomatische Anpassung an verschiedene Vokabulare
und Fachgebiete
All diese Funktionen werden in 17 verschiedenen Sprachen unterstützt.
MediaSpeech® ist in verschiedenen Ausführungen erhältlich: MediaSpeech®
Factory als Vor-Ort-Lösung oder als SaaS-Lösung, die in der Cloud
von Bertin IT gehostet wird, ist in der Lage, umfangreiche
Dateimengen mit garantierter Leistungsfähigkeit zu verarbeiten. Die
neue Version MediaSpeech® Live ist in der Lage, Audiostreams in
Echtzeit zu transkribieren. Damit ist der Weg für innovative
Echtzeitanwendungen geebnet, etwa zu sprachgesteuerten Chatbots,
Callbots oder funktionserweiterten Callcentern (charakteristisch für
solche Callcenter ist, dass die Berater während des Anrufs unterstützt
werden und so die Qualität der Dialoge optimiert werden kann.)
Einige der wichtigsten Verbesserungen in der neuen Version von
MediaSpeech®:
- MediaSpeech® Live zur Verarbeitung von Audiostreams in Echtzeit
-
Neue neuronale Modelle sorgen für eine zwei- bis dreimal schnellere
und genauere Transkription -
Alle Sprachverarbeitungsmodule sind jetzt „vollständig“ neuronal:
noch höhere Präzision durch Sprechpausenerkennung (VAD) und
Unterscheidung verschiedener Sprecher (Sprecher-Diarisation) - Einfache Installation, höhere Sicherheit und neue Schnittstellen
-
Vollständig neuronales Sprachidentifikationsmodul (LID) mit
verbesserter Genauigkeit, auch bei relativ kurzen
Sprachabschnitten.
MediaSpeech®
6 wird bereits von mehreren Kunden genutzt, beispielsweise
von einer großen französischen Investment- und Finanzbank. Die Version
MediaSpeech Live wurde vor Kurzem an eine weitere große Bankengruppe
ausgeliefert, wo sie in deren Kundenkontaktcentern zum Einsatz kommt.
Die Ausgangssprache, in der der Originaltext veröffentlicht wird, ist
die offizielle und autorisierte Version. Übersetzungen werden zur
besseren Verständigung mitgeliefert. Nur die Sprachversion, die im
Original veröffentlicht wurde, ist rechtsgültig. Gleichen Sie deshalb
Übersetzungen mit der originalen Sprachversion der Veröffentlichung ab.
Originalversion auf businesswire.com ansehen: https://www.businesswire.com/news/home/20190605005518/de/