Suchmaschine für Fernsehbeiträge

Denn die Systeme, die diese Suche übernehmen können, müssen in regelmäßigen Abständen von Fachleuten aktualisiert werden und sind mit hohen laufenden Kosten verbunden. Basis dieser Systeme ist eine Art Lexikon, das alle erkennbaren Wörter enthält. Neue Themen und Köpfe bringen neue Wörter mit sich, seien es ‘Finanzkrise’ oder Namen wie ‘Obama’. Um diese Begriffe finden zu können, müssen sie zuvor in das Lexikon übertragen werden.

Forscher am Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS in Sankt Augustin haben jetzt nach eigenen Angaben ein Spracherkennungssystem entwickelt, das ohne kostenintensive Aktualisierung auskommt. “Unser System basiert auf einem Silbenlexikon statt auf einem Wortlexikon”, sagte Daniel Schneider, Forscher am IAIS.

Klassische Spracherkenner könnten nur eine begrenzte Zahl von Worten erkennen – die Zahl der existierenden Wörter sei jedoch unüberschaubar groß. Im Unterschied dazu sei die Anzahl verschiedener Silben handhabbar. “Mit etwa 10.000 gespeicherten Silben können wir jedes Wort zusammensetzen”. Das Programm erschließe sich auch neue Worte selbst, indem es sie aus den gespeicherten Silben zusammensetzt: Fi-nanz-kri-se. Es müsse nicht aktualisiert werden und verursacht keine laufenden Kosten.

Für die Suche werden die Fernsehsendungen demnach zunächst segmentiert: Ändert sich beispielsweise der Sprecher oder kommt ein Filmbeitrag – variiert also der Inhalt der Audiospur -, speichert das Programm die folgenden Szenen als neues Segment ab. Der Anwender kann von Sprecher zu Sprecher navigieren, etwa nur die Beiträge eines Interviewpartners anschauen.

In einem weiteren Schritt analysieren Sprachalgorithmen die einzelnen Worte. Für den Anwender präsentiert sich das Programm wie eine herkömmliche Suchmaschine. Er gibt den Suchbegriff ein, Sekunden später hat das Programm 10.000 Stunden aufgearbeitetes Datenmaterial durchsucht. Die Ergebnisse werden wie bei Internet-Suchmaschinen im Satzzusammenhang angezeigt. Ein Klick und die entsprechende Stelle des Filmmaterials wird abgespielt. Das System findet nach IAIS-Angaben über 85 Prozent der gesprochenen Begriffe, 99 von 100 gefundenen Beiträgen seien korrekt. Ein Lizenzmodell des Programms gibt es bereits.

Silicon-Redaktion

Recent Posts

Wie KI den Jobeinstieg verändertWie KI den Jobeinstieg verändert

Wie KI den Jobeinstieg verändert

Aus Sicht vieler Führungskräfte sind junge Talente oft unzureichend auf ihre Jobprofile vorbereitet, da sie…

20 Stunden ago
Deutsche DefTechs: Nur jedes dritte würde erneut hier gründenDeutsche DefTechs: Nur jedes dritte würde erneut hier gründen

Deutsche DefTechs: Nur jedes dritte würde erneut hier gründen

Umfrage: Bürokratisches Beschaffungswesen, strikte Regulierung und fehlendes Risikokapital bremsen digitale Verteidigungs-Innovationen.

21 Stunden ago
Pilotprojekt: Digitalisierung der IT-Infrastruktur im deutschen StromnetzPilotprojekt: Digitalisierung der IT-Infrastruktur im deutschen Stromnetz

Pilotprojekt: Digitalisierung der IT-Infrastruktur im deutschen Stromnetz

Initiative von Cisco und Amperion ermöglicht schnellere Datenübertragungsgeschwindigkeiten mithilfe der Routed Optical Networking (RON)-Technologie.

1 Tag ago

Manufacturing-X: Warum diese Initiative für Europa von Bedeutung ist

Manufacturing-X als Antwort auf internationale Zollkonflikte, globale Lieferkettenprobleme und Abhängigkeit von meist US-amerikanischen Tech-Konzernen.

1 Tag ago

Wie verbreitet ist Secure-by-Design in Deutschland?

Laut Studie ist jeder dritte Security-Experte davon überzeugt, dass Cyber-Immunität die Häufigkeit von Angriffen reduzieren…

2 Tagen ago

Kletternde Roboter im Warenlager

Intralogistikspezialist SSI Schäfer integriert Bots, Regale, Arbeitsstationen und IT-Umgebungen zu Komplettlösungen für Lagerbetreiber.

2 Tagen ago