Sicurezza AI, i limiti strutturali dei guardrail nei modelli generativi
Le nuove ricerche sui jailbreak mostrano la fragilità dei guardrail nei sistemi di AI generativa. I filtri di sicurezza restano probabilistici e manipolabili, con rischi crescenti per cybersecurity, disinformazione, modelli open source, responsabilità dei provider e governance digitale L'articolo Sicurezza AI, i limiti strutturali dei guardrail nei modelli generativi proviene da Agenda Digitale.