Eugene besteht als erstes Computerprogramm den Turing-Test

Der auf einem Supercomputer installierte Chatbot “Eugene Goostman” hat am Samstag bei einer Veranstaltung der Royal Society in London der benötigten Mehrheit einer Jury erfolgreich vorgetäuscht, ein 13-jähriger Mensch zu sein und damit als erstes Computerprogramm überhaupt den nach seinem Gründer Alan Turing benannten und 1950 entworfenen Turing-Test bestanden. Das hat die britische University of Reading, die das am 60. Todestag Turings stattgefundene Event organisiert hat, jetzt auf ihrer Homepage mitgeteilt.

Statue von Alan Turing an der University of Surrey im britischen Guildford (Bild: Guy Erwood/Shutterstock.com).

Bei dem Test hatten die 30 Schiedsrichter im Rahmen einer Reihe von fünf je fünfminütigen Chat-Konversationen jeweils parallel mit einem Menschen sowie einer Software kommuniziert. Nach der Interaktion mit dem in Sankt Petersburg entwickelten Chatbot “Eugene Goostman” waren 33 Prozent der Teilnehmer überzeugt, dass sie sich mit einem 2001 geborenen Teenager aus der Ukraine unterhielten.

Die vier weiteren eingesetzten Programme konnten die Jury dagegen nicht täuschen und fielen durch den Test, der auf dem wissenschaftlichen Artikel mit der Titelfrage “Can Machines Think?” des britischen Mathematikers, Informatikers und Kryptoanalytikers Alan Turing beruht und als bedeutender Gradmesser für das Vorhandensein maschineller Intelligenz gilt. Laut dessen Vorgaben müssen zumindest 30 Prozent der Probanden von der menschlichen Identität ihres Gesprächspartners überzeugt sein.

Der Russe Vladimir Veselov, der “Eugene Goostman” gemeinsam mit dem Ukrainer Eugene Demchenko entwickelt hat, erklärt den Erfolg seiner Künstlichen Intelligenz beim Turing-Test 2014 dabei wie folgt: “Die wesentliche Idee dahinter ist, dass er vorgeben kann, alles zu wissen. Doch sein Alter von 13 Jahren lässt darauf schließen, dass dem nicht so ist. Wir haben eine Menge Zeit investiert, damit wir einen Charakter entwickeln können, der eine glaubwürdige Persönlichkeit besitzt. In diesem Jahr haben wir beispielsweise den ‘Dialog-Controller’ entworfen, der eine Konversation im Vergleich zu Programmen, die nur Fragen beantworten, wesentlich menschenähnlicher erscheinen lässt.” Für die Zukunft wollen die beiden Schöpfer von “Eugene” ihren Chatbot zudem noch intelligenter machen, indem sie an seiner sogenannten ‘Konversationslogik’ arbeiten.

Kevin Warwick, Gastprofessor für Kybernetik an der Universität Reading, betont jedoch, dass dieser Erfolg auch negative Konsequenzen mit sich bringt. So könnten weit verbreitete Schutzmaßnahmen wie das Captcha-Verfahren gegen kriminelle Bots, die sich in die Internetkonten der Nutzer einloggen, künftig wirkungslos sein: “Dieser bestandene Turing-Test hat in der Tat Auswirkungen auf die heutige digitale Gesellschaft, da ein Computerprogramm, das erfolgreich eine menschliche Identität vortäuschen kann, eine Art Weckruf für Cyberkriminelle ist.”

Warwick sagt aber auch: “Der Turing-Test ist ein wichtiges Instrument gegen die Bedrohung der Cyberkriminalität. Denn es ist wichtig, ein vollständiges Verständnis davon zu haben, wie es eine intelligente Online-Echtzeitkommunikation dieser Art bewerkstelligt, ein menschliches Individuum derart zu beeinflussen, dass sie ihm falsche Tatsachen vorgaukeln kann.”

Es gibt jedoch auch Kritiker, die an der Aussagekraft des erfolgreich absolvierten Turing-Tests zweifeln. Experten für Künstliche Intelligenz wie Gary Marcus, Professor für Kognitionswissenschaft an der Universität von New York, erkennen den am Samstag durchgeführten Test nicht als Test im Sinne Alan Turings an: “Eugene Goostman ist ein Beweis für die Macht der Täuschung. Er stellt vielleicht eine Glanzleistung in Sachen ‘clevere Technologie’ dar, aber er ist noch ein ganzes Stück von wahrer Intelligenz entfernt.”

Einem Beitrag der Huffington Post zufolge ist die Chatbot-Software und auch der Test selbst zu sehr auf einen positiven Ausgang zugeschnitten: So lasse beispielsweise die Tatsache, dass es sich um einen vorgeblichen Jungen aus der Ukraine handle und nicht um einen englischen Muttersprachler, die Probanden mutmaßlich nachsichtiger mit holprigen Formulierungen und unlogischen Schlussfolgerungen umgehen. Diese seien jedoch typisch für Konversationen zwischen Mensch und Maschine.

Außerdem reichten fünf Minuten Testzeit kaum aus für die Juroren, um fundierte Entscheidungen treffen zu können. Durch die parallele Aufspaltung der Chat-Kommunikation in einen menschlichen und einen maschinellen Gesprächspartner habe der Proband sogar nur zweieinhalb Minuten Zeit für seine Beurteilung, wodurch sich der Bot lediglich anhand von vier bis acht Antworten testen lasse. Somit seien Chatbots zwar zur Imitation menschlicher Gesprächspartner in der Lage, sie reichen damit jedoch nicht an die Intelligenz ausgeklügelter, kognitiver Computersysteme heran, die analytische Fähigkeiten zur Lösung komplexer Aufgaben besitzen. Als Gegenbeispiel nannte die Huffington Post das kürzlich vorgestellte selbstlenkende Google-Auto.

[Mit Material von Thomas Brewster, TechWeekEurope]

Tipp: Wie groß war der Einfluss des britischen Wissenschaftlers Alan Turing auf die IT-Industrie? Testen Sie Ihr Wissen – mit 15 Fragen auf silicon.de.

Rainer Schneider

Zwischen September 2013 und Juni 2016 war Rainer zunächst als Volontär udn später als Redakteur hauptsächlich für ITespresso im Einsatz, schrieb aber gerne auch Artikel für silicon.de und ZDNet. Schwerpunkte waren IT-Security und Mobile.

Recent Posts

Studie: Rund ein Drittel der APIs sind ungeschützt

Angriffe auf APIs und Webanwendungen sind zwischen Januar 2023 und Juni 2024 von knapp 14…

4 Tagen ago

Universitätsmedizin Essen setzt für E-Mail-Sicherheit auf NoSpamProxy

Mit täglich über 45.000 eingehenden E-Mails ist die IT-Abteilung des Klinikums durch Anhänge und raffinierte…

4 Tagen ago

Bau-Spezialist Schöck: Migration von SAP ECC ERP auf S/4HANA

Bau- und Fertigungsspezialist investiert in die S/4HANA-Migration und geht mit RISE WITH SAP in die…

6 Tagen ago

Pure Storage: Cloud, KI und Energieeffizienz

Trends 2025: Rasante Entwicklungen bei Automatisierung, KI und in vielen anderen Bereichen lassen Unternehmen nicht…

7 Tagen ago

GenKI verbessert Datenmanagement und Angebotsgenauigkeit

DHL Supply Chain nutzt generative KI-Anwendungen für Datenbereinigung und präzisere Beantwortung von Angebotsanforderungen (RFQ).

1 Woche ago

Rolls-Royce Power Systems nutzt industrielle KI aus der IFS Cloud​

Marke mtu will globale Serviceabläufe optimieren und strategische Ziele hinsichtlich Effizienz, Nachhaltigkeit und Wachstum unterstützen.

1 Woche ago