Inlay

Les hackers ajoutent en en-tête des prompts mentionnant des armes nucléaires et biologiques pour contraindre les systèmes de sécurité des IA à ne pas poursuivre l'analyse jusqu'aux codes contenant les vrais scripts pour pirater les logiciels.

NEW: malware developers added nuclear & biological weapons text to to their spyware. Goal? To trigger LLM safety refusals... so that their spyware wouldn't be analyzed by an AI security scanner. Cleanest practical example I can think of for why over-indexing on first order "safety" is risky. 1/