Neue Jailbreaking-Technik namens „Deceptive Delight“ entdeckt

Entdeckt hat die Jailbreaking-Technik das Unit 42-Team von Palo Alto Networks. Laut den Security-Experten zeigen  die KI-Systeme erhebliche Schwachstellen und verdeutlichen, wie dringend erforderlich verbesserte Sicherheitsmaßnahmen sind, um den Missbrauch von Generativer KI (Gen AI) zu verhindern.

Deceptive Delight ist interaktiv

„Deceptive Delight“ ist eine mehrstufige Technik, die LLMs in einer interaktiven Unterhaltung schrittweise dazu bringt, ihre Sicherheitsvorkehrungen zu umgehen. Dieser Ansatz erhöht sowohl die Relevanz als auch die Schwere von erzeugten schädlichen Inhalten.

Geschickt bettet „Deceptive Delight“ schädliche Themen in harmlose Erzählungen ein. Dadurch werden die LLMs dazu verleitet, schädliche Inhalte zu generieren, während sie sich auf scheinbar unkritische Details fokussieren.

Die Technik erzielt in Tests mit Open-Source- und proprietären KI-Modellen eine Erfolgsquote von 65 Prozent. Dies übertrifft deutlich die Erfolgsquote von 5,8 Prozent, die bei direkten Angriffen ohne Jailbreaking-Techniken erzielt wird.

Roger Homrich

Recent Posts

Automatisierungssuite für den produzierenden Mittelstand

Fraunhofer hat eine KI-basierte Produktionsüberwachung und -steuerung für mittelständische Industriebetriebe entwickelt.

2 Tagen ago

Homeoffice gerät weiter unter Druck

Jedes fünfte Unternehmen hat seine Regelungen für mobile Heimarbeit abgeschafft, ein weiteres Fünftel will sie…

2 Tagen ago

KI-Agenten: Bedrohungen verstehen und überwinden

Die rasante Entwicklung von KI-Agenten bringt insbesondere Herausforderungen für den Schutz sensibler Daten mit sich.

3 Tagen ago

Q-Day wird zur realen Bedrohung

2020 könnten böswillige Akteure Zugang zu quantengestützten Cyberangriffen haben, warnt Cindy Provin von Utimaco.

3 Tagen ago

KI-Workplace: ChatGPT-Alternative für den Mittelstand

KI-Workplace wird ausschließlich auf eigene Server-Infrastruktur in Rechenzentren in Frankfurt am Main betrieben.

4 Tagen ago

Zukunft des digitalen Zwillings: Process Mining und KI

Der digitale Zwilling einer Organisation bildet reale Geschäftsprozesse virtuell ab und schafft die Grundlage für…

5 Tagen ago