TurboQuant: Google ha trovato il modo di comprimere l'AI senza perdere qualità
Due nuovi algoritmi di Google Research riducono di sei volte la memoria necessaria per far girare i modelli linguistici, con implicazioni importanti per l'AI sui dispositivi, i costi dei datacenter e la carenza globale di chip di memoria. ... Leggi tutto