Neue Jailbreaking-Technik namens „Deceptive Delight“ entdeckt

Entdeckt hat die Jailbreaking-Technik das Unit 42-Team von Palo Alto Networks. Laut den Security-Experten zeigen  die KI-Systeme erhebliche Schwachstellen und verdeutlichen, wie dringend erforderlich verbesserte Sicherheitsmaßnahmen sind, um den Missbrauch von Generativer KI (Gen AI) zu verhindern.

Deceptive Delight ist interaktiv

„Deceptive Delight“ ist eine mehrstufige Technik, die LLMs in einer interaktiven Unterhaltung schrittweise dazu bringt, ihre Sicherheitsvorkehrungen zu umgehen. Dieser Ansatz erhöht sowohl die Relevanz als auch die Schwere von erzeugten schädlichen Inhalten.

Geschickt bettet „Deceptive Delight“ schädliche Themen in harmlose Erzählungen ein. Dadurch werden die LLMs dazu verleitet, schädliche Inhalte zu generieren, während sie sich auf scheinbar unkritische Details fokussieren.

Die Technik erzielt in Tests mit Open-Source- und proprietären KI-Modellen eine Erfolgsquote von 65 Prozent. Dies übertrifft deutlich die Erfolgsquote von 5,8 Prozent, die bei direkten Angriffen ohne Jailbreaking-Techniken erzielt wird.

Roger Homrich

Recent Posts

RansomHub übernimmt kriminelles Erbe von LockBit & Co.

Laut ESET-Forschern hat sich die Gruppe RansomHub innerhalb kürzester Zeit zur dominierenden Kraft unter den…

2 Tagen ago

GenKI: Deutsche Firmen international nur Mittelmaß

Damit hängt die hiesige Wirtschaft beim Einsatz der Technologie zwar nicht zurück, ist jedoch auch…

3 Tagen ago

RedCurl-Ransomware attackiert Hypervisoren

Bitdefender-Labs-Analyse der ersten digitalen Erpressung von RedCurl zeigt, dass Angreifer lange unentdeckt bleiben wollen und…

3 Tagen ago

Wenn Hacker Backups deaktivieren

Backup-Systeme haben in der Vergangenheit eine Art Versicherung gegen Angriffe geboten, doch Hacker versuchen nun,…

3 Tagen ago

Hochwasserschutz mit Maschinellem Lernen

Forschende des Karlsruher Institut für Technologie (KIT)  entwickeln erstes nationales Vorhersagemodell für kleine Flüsse.

5 Tagen ago

So viel investieren Deutsche in Cybersicherheit

Im Schnitt werden zum Schutz privater Geräte 5,10 Euro im Monat ausgegeben. Viele verzichten selbst…

5 Tagen ago