Gemma 4 corre su hardware consumer: i nuovi drafter di Google triplicano la velocità
Google ha rilasciato i nuovi drafter Multi-Token Prediction per la famiglia Gemma 4, una soluzione software capace di triplicare le prestazioni in inferenza locale tramite speculative decoding, garantendo massima qualità e zero latenza