Categories: SoftwareUnternehmen

Linux-Desktop lernt sprechen

Können Sie sich noch an den ‘Star Trek’-Film erinnern, als die Enterprise-Besatzung sich überraschend in der heutigen Zeit wiederfand und einen Computer durch lautes Brüllen in die Maus “ansprechen” wollten? So etwas soll den Nutzern von Linux-Desktops erspart bleiben. Auch sie sollen die heute verfügbaren Sprachbefehle für ihre Anwendungen bequem nutzen können. Eine ganze Reihe von Firmen hat sich laut dem Linux-Fachmagazin NewsForge in dieser Frage engagiert.
Eine Testerin aus der Community hat sich dabei auf die Anwendung ‘Sphinx-2’ beschränkt. Diese Version des Sphinx-Projektes soll ihrer Ansicht nach zusammen mit der Texterkennung ‘Festival’ eine komplette und einfache Lösung ergeben, die alltäglichen Anforderungen genügt. Sphinx habe zwar noch weitere Versionen nachgeschoben – aber die Features seien für ihren Gebrauch uninteressante Spielereien und außerdem sei Sphinx-2 die schnellste Version.

Problematisch sei allerdings der Befehlssatz für Festival. Dieser lasse sich am besten mit KDEs ‘Text-to-Speech’-System und mit ‘Perlbox Voice’ entwirren, rät sie. Andererseits sei auch KDE geeignet in der Version 3.4 zusammen mit Festival Lite den Desktop sprechen zu lassen. Dabei hat sie den Vorteil ausgemacht, dass sogar mehrere Sprachen denkbar sind, die offenbar in “ausreichender Qualität” arbeiten würden. Hierfür empfiehlt die Linux-Nutzerin den KDE Text-to-Speech-Manager. Diese Software verwaltet die verwendeten Sprachen, die Speech Engine und ihre Funktionen, sowie das Leseverhalten und die Lernfunktion des Desktops.

Für weitere Sprachen empfiehlt sie das MBROLA-Projekt. Die dort angebotenen Sprachen seien ebenfalls mit der Festival-Texterkennung koppelbar und die Ausgabe erfolge über den  genannten KDE-Werkzeugkasten. Ihrer Ansicht nach, so die Nutzerin, seien die bisher angebotenen Werkzeuge nicht nur ausgereift, sondern überträfen die vergleichbaren proprietären Systeme bei weitem. Ihre Sicherheit, Robustheit und Nutzerfreundlichkeit könne die Linux-basierten Spracherkennungssysteme zu einer der bevorzugten Lösungen für Sehbehinderte in aller Welt machen.

Silicon-Redaktion

Recent Posts

Pure Storage: Cloud, KI und Energieeffizienz

Trends 2025: Rasante Entwicklungen bei Automatisierung, KI und in vielen anderen Bereichen lassen Unternehmen nicht…

7 Stunden ago

GenKI verbessert Datenmanagement und Angebotsgenauigkeit

DHL Supply Chain nutzt generative KI-Anwendungen für Datenbereinigung und präzisere Beantwortung von Angebotsanforderungen (RFQ).

1 Tag ago

Rolls-Royce Power Systems nutzt industrielle KI aus der IFS Cloud​

Marke mtu will globale Serviceabläufe optimieren und strategische Ziele hinsichtlich Effizienz, Nachhaltigkeit und Wachstum unterstützen.

1 Tag ago

Thomas-Krenn.AG: viele Pflichten, knappe Ressourcen, mehr freie IT-Welt

IT-Infrastruktur-Trends 2025: Open-Source-Projekte sowie aufwändige regulatorische und Pflichtaufgaben werden das Jahr prägen.

1 Tag ago

Stadt Kempen nutzt Onsite Colocation-Lösung

IT-Systeme werden vor Ort in einem hochsicheren IT-Safe betrieben, ohne auf bauliche Maßnahmen wie die…

2 Tagen ago

SoftwareOne: Cloud-Technologie wird sich von Grund auf verändern

Cloud-Trends 2025: Zahlreiche neue Technologien erweitern die Grenzen von Cloud Computing.

2 Tagen ago