DiffusionGemma sfida gli LLM tradizionali: generazione parallela e fino a 4 volte più veloce su GPU

Google DeepMind ha annunciato DiffusionGemma, un modello open source sperimentale basato sulla generazione testuale tramite diffusione. Grazie alla produzione parallela di blocchi di testo, il sistema raggiunge velocità fino a quattro volte superiori rispetto agli LLM autoregressivi tradizionali in scenari locali.

Hardware Upgrade

Giu 11, 2026 - 11:41

0 0

DiffusionGemma sfida gli LLM tradizionali: generazione parallela e fino a 4 volte più veloce su GPU

Google DeepMind ha annunciato DiffusionGemma, un modello open source sperimentale basato sulla generazione testuale tramite diffusione. Grazie alla produzione parallela di blocchi di testo, il sistema raggiunge velocità fino a quattro volte superiori rispetto agli LLM autoregressivi tradizionali in scenari locali.

Continua a leggere ...

Tag:

Hardware Upgrade Le News di Hardware Upgrade sulla tecnologia e sul mondo informatico - https://www.hwupgrade.it

Post correlati

NVIDIA può vendere di nuovo le GPU H20 in Cina

NVIDIA può vendere di nuovo le GPU H20 in Cina

Punto Informatico Lug 15, 2025 0 10

Nvidia Neural Texture Compression riduce l’uso VRAM del 90%

Nvidia Neural Texture Compression riduce l’uso VRAM del...

Punto Informatico Lug 16, 2025 0 3

Apple MLX si apre a CUDA: in arrivo il supporto alle GPU NVIDIA

Apple MLX si apre a CUDA: in arrivo il supporto alle GP...

Hardware Upgrade Lug 16, 2025 0 5

Questo sito utilizza i cookie. Continuando a navigare nel sito accetterai l'uso dei cookie.