I nuovi e potenti chip AI Blackwell di Nvidia, ancora non rilasciati ufficialmente, stanno creando parecchio malcontento. Secondo The Information, questi chip stanno soffrendo di problemi di surriscaldamento quando connessi ai server rack, che possono ospitarne fino a 72 unità. Questo non fa che peggiorare la situazione per i clienti, che si trovano già a fare i conti con spedizioni ritardate, temendo ora ulteriori slittamenti.
Problemi di surriscaldamento e ritardi continui
I problemi legati al surriscaldamento sono talmente gravi che Nvidia ha recentemente informato Microsoft di un ulteriore ritardo di almeno tre mesi nella consegna dei chip. Questo è solo l’ultimo di una serie di rinvii che stanno affliggendo l’azienda sin da quando i chip Blackwell sono stati presentati a marzo.
Secondo dipendenti Nvidia e fonti vicine ai fornitori e ai clienti, l’azienda ha ripetutamente chiesto ai propri fornitori di ridisegnare i server rack per risolvere i problemi di surriscaldamento. Tuttavia, i cambiamenti non sembrano aver portato ancora a una soluzione definitiva.
Questa situazione potrebbe avere gravi ripercussioni per le aziende che stanno investendo enormi risorse nella costruzione di server farm per supportare le loro infrastrutture AI. Ogni ritardo potrebbe rappresentare un ostacolo significativo per lo sviluppo e il lancio di nuovi prodotti basati sull’AI.
Una domanda elevata, ma con difetti di progettazione
Nvidia ha affermato che le sue nuove GPU sono estremamente potenti, 30 volte più veloci dei modelli precedenti per le applicazioni AI. Come ha dichiarato il CEO Jensen Huang alla CNBC il mese scorso, la domanda per i chip Blackwell è stata “incredibile”, con ordini già confermati per chip che costano decine di migliaia di dollari ciascuno.
Eppure, nonostante tutto l’hype, voci di difetti di progettazione hanno afflitto la linea Blackwell per mesi. Alla fine, lo stesso Huang ha ammesso che alcune di queste voci erano fondate. “Abbiamo avuto un difetto di progettazione nei chip Blackwell: era funzionante, ma il difetto ha causato una bassa resa produttiva”, ha dichiarato Huang in una conferenza stampa del 23 ottobre, riportata da Reuters. “È stata colpa al 100% di Nvidia”.
Mentre questa ammissione sembra riguardare un altro problema di produzione, ha comunque portato a un ulteriore e non necessario ritardo nelle spedizioni.
Raffreddamento ad acqua: una nuova sfida
Nel frattempo, un portavoce di Nvidia ha cercato di minimizzare la questione del surriscaldamento, affermando che “le iterazioni ingegneristiche sono normali e previste”. Tuttavia, il problema rimane: i rack di 72 GPU pesano oltre 1.360 kg e devono essere raffreddati con acqua, una scelta diversa rispetto al raffreddamento ad aria su cui molti data center per l’AI hanno fatto affidamento fino ad oggi. Secondo The Information, Nvidia sta faticando a mantenere le temperature sotto controllo anche con rack più piccoli, da 36 GPU.
Con l’enorme hype che circonda il rilascio di nuovi prodotti AI, la pressione su Nvidia è crescente. I clienti sono già stati colpiti da vari ritardi sui nuovi chip Blackwell, e l’ultima notizia non sembra destinata a migliorare l’umore generale.
Quali sono i tuoi pensieri su questi ritardi e problemi di surriscaldamento? Pensi che Nvidia riuscirà a risolvere queste problematiche in tempi brevi? Condividi la tua opinione e resta aggiornato sulle ultime novità del settore tech!