DiffusionGemma sfida gli LLM tradizionali: generazione parallela e fino a 4 volte più veloce su GPU

Google DeepMind ha annunciato DiffusionGemma, un modello open source sperimentale basato sulla generazione testuale tramite diffusione. Grazie alla produzione parallela di blocchi di testo, il sistema raggiunge velocità fino a quattro volte superiori rispetto agli LLM autoregressivi tradizionali in scenari locali.

Giu 11, 2026 - 11:41
 0  0
DiffusionGemma sfida gli LLM tradizionali: generazione parallela e fino a 4 volte più veloce su GPU
Google DeepMind ha annunciato DiffusionGemma, un modello open source sperimentale basato sulla generazione testuale tramite diffusione. Grazie alla produzione parallela di blocchi di testo, il sistema raggiunge velocità fino a quattro volte superiori rispetto agli LLM autoregressivi tradizionali in scenari locali.
Hardware Upgrade Le News di Hardware Upgrade sulla tecnologia e sul mondo informatico - https://www.hwupgrade.it

Questo sito utilizza i cookie. Continuando a navigare nel sito accetterai l'uso dei cookie.