Neue Jailbreaking-Technik namens „Deceptive Delight“ entdeckt

Entdeckt hat die Jailbreaking-Technik das Unit 42-Team von Palo Alto Networks. Laut den Security-Experten zeigen  die KI-Systeme erhebliche Schwachstellen und verdeutlichen, wie dringend erforderlich verbesserte Sicherheitsmaßnahmen sind, um den Missbrauch von Generativer KI (Gen AI) zu verhindern.

Deceptive Delight ist interaktiv

„Deceptive Delight“ ist eine mehrstufige Technik, die LLMs in einer interaktiven Unterhaltung schrittweise dazu bringt, ihre Sicherheitsvorkehrungen zu umgehen. Dieser Ansatz erhöht sowohl die Relevanz als auch die Schwere von erzeugten schädlichen Inhalten.

Geschickt bettet „Deceptive Delight“ schädliche Themen in harmlose Erzählungen ein. Dadurch werden die LLMs dazu verleitet, schädliche Inhalte zu generieren, während sie sich auf scheinbar unkritische Details fokussieren.

Die Technik erzielt in Tests mit Open-Source- und proprietären KI-Modellen eine Erfolgsquote von 65 Prozent. Dies übertrifft deutlich die Erfolgsquote von 5,8 Prozent, die bei direkten Angriffen ohne Jailbreaking-Techniken erzielt wird.

Roger Homrich

Recent Posts

Kommunikation in OT-/IoT-Umgebungen absichern und verschlüsseln

Rolle von Maschinenidentitäten und Zertifikaten bei der Umsetzung von Richtlinien wie NIS-2 und CRA.

21 Stunden ago

14,6 Millionen geleakte Konten in Deutschland

Laut Global Data Breach Monitoring Tool von Surfshark lag Deutschland in Q3/2024 auf Platz 4…

21 Stunden ago

Mythos E-Rechnung: Irrtürmer und Vorbereitung

Die E-Rechnung kommt schrittweise ab 2025. Aber was genau ist eine E-Rechnung und welche Fristen…

1 Tag ago

Cybersicherheitsstrategie: Lehren aus Bletchley Park

Zu viele Unternehmen konzentrieren ihre Sicherheitsstrategie nach wie vor auf die Erweiterung und Optimierung rein…

2 Tagen ago

Innovationstreiber Private KI

Wie können Unternehmen ihr KI-Potenzial ausschöpfen und gleichzeitig die eigenen und Daten der Kunden schützen?

4 Tagen ago

SaaS Data Protection nach dem CrowdStrike-Ausfall

70 Prozent der Unternehmen erleiden Datenverluste und trotzdem verlassen sich 60 Prozent immer noch auf…

4 Tagen ago