Categories: SoftwareUnternehmen

Linux-Desktop lernt sprechen

Können Sie sich noch an den ‘Star Trek’-Film erinnern, als die Enterprise-Besatzung sich überraschend in der heutigen Zeit wiederfand und einen Computer durch lautes Brüllen in die Maus “ansprechen” wollten? So etwas soll den Nutzern von Linux-Desktops erspart bleiben. Auch sie sollen die heute verfügbaren Sprachbefehle für ihre Anwendungen bequem nutzen können. Eine ganze Reihe von Firmen hat sich laut dem Linux-Fachmagazin NewsForge in dieser Frage engagiert.
Eine Testerin aus der Community hat sich dabei auf die Anwendung ‘Sphinx-2’ beschränkt. Diese Version des Sphinx-Projektes soll ihrer Ansicht nach zusammen mit der Texterkennung ‘Festival’ eine komplette und einfache Lösung ergeben, die alltäglichen Anforderungen genügt. Sphinx habe zwar noch weitere Versionen nachgeschoben – aber die Features seien für ihren Gebrauch uninteressante Spielereien und außerdem sei Sphinx-2 die schnellste Version.

Problematisch sei allerdings der Befehlssatz für Festival. Dieser lasse sich am besten mit KDEs ‘Text-to-Speech’-System und mit ‘Perlbox Voice’ entwirren, rät sie. Andererseits sei auch KDE geeignet in der Version 3.4 zusammen mit Festival Lite den Desktop sprechen zu lassen. Dabei hat sie den Vorteil ausgemacht, dass sogar mehrere Sprachen denkbar sind, die offenbar in “ausreichender Qualität” arbeiten würden. Hierfür empfiehlt die Linux-Nutzerin den KDE Text-to-Speech-Manager. Diese Software verwaltet die verwendeten Sprachen, die Speech Engine und ihre Funktionen, sowie das Leseverhalten und die Lernfunktion des Desktops.

Für weitere Sprachen empfiehlt sie das MBROLA-Projekt. Die dort angebotenen Sprachen seien ebenfalls mit der Festival-Texterkennung koppelbar und die Ausgabe erfolge über den  genannten KDE-Werkzeugkasten. Ihrer Ansicht nach, so die Nutzerin, seien die bisher angebotenen Werkzeuge nicht nur ausgereift, sondern überträfen die vergleichbaren proprietären Systeme bei weitem. Ihre Sicherheit, Robustheit und Nutzerfreundlichkeit könne die Linux-basierten Spracherkennungssysteme zu einer der bevorzugten Lösungen für Sehbehinderte in aller Welt machen.

Silicon-Redaktion

Recent Posts

IT 2025: IT-Führungskräfte erwarten massiven KI-Ruck

Einsatz von KI-Lösungen wirbelt auch in deutschen Unternehmen die Liste der Top-Technologieanbieter durcheinander.

16 Stunden ago

Sofortzahlungen im Wandel: Sicherheit und KI als treibende Kräfte

Echtzeitüberweisungen erfüllen die Erwartungen der Nutzer an Geschwindigkeit, sind jedoch anfällig für spezifische Sicherheits- und…

19 Stunden ago

Blockaden und Risiken bei APM-Projekten vermeiden

Application Portfolio Management (APM) verspricht Transparenz, mehr IT-Leistung und Effizienz – theoretisch.

3 Tagen ago

BSI-Bericht: Sicherheitslage im Cyberraum bleibt angespannt

Im Berichtszeitraum Mitte 2023 bis Mitte 2024 wurden täglich durchschnittlich 309.000 neue Schadprogramm-Varianten bekannt.

3 Tagen ago

KI-Hype in der Cybersicherheit – oder besser doch nicht?

KI kommt in der Cybersicherheit zum Einsatz, etwa um Abweichungen im Netzwerkverkehr zu identifizieren. Ist…

4 Tagen ago

Netzwerksegementierung schützt vor Angriffen über die OT

Ungepatchte und veraltetete Maschinen-Software ist ein beliebtes Einfallstor für Hacker, warnt Nils Ullmann von Zscaler…

5 Tagen ago