DiffusionGemma sfida gli LLM tradizionali: generazione parallela e fino a 4 volte più veloce su GPU
Google DeepMind ha annunciato DiffusionGemma, un modello open source sperimentale basato sulla generazione testuale tramite diffusione. Grazie alla produzione parallela di blocchi di testo, il sistema raggiunge velocità fino a quattro volte superiori rispetto agli LLM autoregressivi tradizionali in scenari locali.