Inlay

Choix difficile : ne pas défendre les LLMs utilisés en cybersécurité contre l'injection de prompts dangereux, ou ne pas leur permettre d'analyser certains malwares. Les sociétés d'IA et de cybersécurité vont devoir encore plus se prendre la tête.

NEW: malware developers added nuclear & biological weapons text to to their spyware. Goal? To trigger LLM safety refusals... so that their spyware wouldn't be analyzed by an AI security scanner. Cleanest practical example I can think of for why over-indexing on first order "safety" is risky. 1/