Quando i modelli AI si giudicano tra loro: la sfida AutoBench
I benchmark AI tradizionali mostrano limiti evidenti. AutoBench propone un sistema rivoluzionario in cui i modelli si valutano reciprocamente attraverso peer assessment. Una collaborazione tra industria e accademia italiana valida scientificamente l'approccio per l'era della superintelligenza L'articolo Quando i modelli AI si giudicano tra loro: la sfida AutoBench proviene da Agenda Digitale.