//
sign in
Post
by @danabra.mov
PostEmbed
by @danabra.mov
Record
by @jimpick.com
Record
by @atsui.org
+ new component
Post
Les hackers ajoutent en en-tête des prompts mentionnant des armes nucléaires et biologiques pour contraindre les systèmes de sécurité des IA à ne pas poursuivre l'analyse jusqu'aux codes contenant les vrais scripts pour pirater les logiciels.
12h
NEW: malware developers added nuclear & biological weapons text to to their spyware. Goal? To trigger LLM safety refusals... so that their spyware wouldn't be analyzed by an AI security scanner. Cleanest practical example I can think of for why over-indexing on first order "safety" is risky. 1/
17h
Jérôme Vallès͚͔̩̓̆ 🍁φ‬
John Scott-Railton