Le sfide per alimentare i processori per l’AI (intelligenza artificiale) devono mantenere l’efficienza e consentire la massima qualità di esecuzione degli algoritmi. I processori AI richiedono una potenza enorme e una diminuzione dell’efficienza energetica corrisponde a un aumento delle perdite nell’intera rete di distribuzione dell’alimentazione (PDN). Nei data center, l’aggiunta di intelligenza artificiale, machine learning e deep learning fa aumentare la potenza del rack di oltre il 200% fino a 20 kW, portando a una rivalutazione dei PDN utilizzando nuove soluzioni a 48 V. La capacità di riprogettare i rack da 48 V e le soluzioni dei data center ha risolto il problema del PDN ad alta corrente, ma ha portato a nuove sfide per la conversione di potenza.
Richieste al PDN
La fornitura di energia e l’efficienza energetica sono diventate la principale preoccupazione nei sistemi informatici su larga scala (figura 1). Il settore ha assistito a un drammatico aumento della potenza impiegata dai processori con l’avvento di ASIC e GPU che elaborano complesse funzioni per l’AI. Le richieste di alimentazione del rack sono anche aumentate proporzionalmente alla capacità di intelligenza artificiale utilizzata nelle distribuzioni di applicazioni di apprendimento e inferenza su larga scala. Nella maggior parte dei casi, la fornitura di energia è ora il fattore limitante nelle prestazioni di elaborazione poiché le nuove CPU cercano di consumare correnti in costante aumento. L’erogazione ottimale della potenza implica non solo la distribuzione della potenza, ma anche l’efficienza, le dimensioni, i costi e le prestazioni termiche.
Figura 1: Andamento dei requisiti di corrente di picco della CPU / FPGA (Fonte: Vicor)
Per supportare una grande quantità di elaborazione dati, i PDN tradizionali sono soggetti a enormi richieste di alimentazione, che influiscono sulla gestione termica. Ridurre la resistenza allungando i cavi dei sistemi PDN o aumentare la tensione di esercizio per ridurre la corrente sono due opzioni adottate. Per soddisfare l’aumento di potenza, i design moderni stanno adottando la seconda opzione per soddisfare in modo più efficace le rigorose esigenze dei data center. Attualmente la domanda di energia sta superando di gran lunga le reti tradizionali di fornitura di energia. Il passaggio a un’architettura a 48 V e l’adozione di approcci più innovativi alla fornitura di energia è l’unico modo per fornire potenza ad alte prestazioni per soddisfare le grandi richieste di AI / HPC. Quando la potenza del processore nel 2015 ha iniziato ad aumentare notevolmente, il consorzio Open Compute Project (OCP), che ha il maggior numero di aziende di cloud, server e CPU come membri, ha continuato a sviluppare il suo design rack da 12 V. La risposta è stata quella di passare dai cavi alle busbar e di distribuire più convertitori CA monofase da 12 V all’interno del rack per ridurre al minimo la distanza PDN e la resistenza ai server blade. Il cambiamento principale è stato che la CA monofase è stata derivata dalle singole fasi di un’alimentazione trifase al rack a causa della maggiore potenza. Successivamente, l’introduzione dell’IA nei data center con processori da 500 A a 1000 A ha indotto alcune aziende a passare alla distribuzione a 48 V. Ciò ha ridotto il problema del PDN ad alta corrente a 250 A per un rack da 12 kW, ma ha introdotto nuove sfide alla conversione di potenza dell’intero sistema. Poiché i PDN che alimentano i circuiti stanno passando a 48 V, è necessario un cambio di conversione di potenza. In ogni caso, il passaggio a 48 V dalla distribuzione a 12 V riduce il fabbisogno di corrente in ingresso di un fattore 4 e riduce le perdite di 16 volte.
Adozione dell’architettura 48-V
L’utilizzo di 48 V è dovuto all’utilizzo di sistemi di batterie tampone ricaricabili per alimentare le apparecchiature di telecomunicazione. L’architettura comune tradizionalmente utilizzata in questi sistemi era chiamata architettura bus intermedia, che consisteva in un convertitore bus isolato non regolato per convertire 48 V in +12 V, che veniva quindi alimentato a un banco di regolatori buck multifase per gestire la conversione a 12 V e regolazione del punto di carico (PoL). Con l’aumento delle correnti dei processori AI e delle CPU, la densità della soluzione di erogazione dell’alimentazione al PoL è diventato l’elemento più critico nelle applicazioni AI a causa della resistenza PDN tra il regolatore e il PoL. Le perdite PDN sono un fattore dominante nel calcolo dell’efficienza e delle prestazioni del progetto del regolatore CC / CC. Per ridurre le perdite Vicor suggerisce di utilizzare un modulo di preregolazione (PRM) da 48 V, seguito da uno stadio di trasformazione della tensione (VTM) a rapporto fisso (fattore 1 / K). Questa architettura proprietaria consente di ottimizzare le prestazioni di ogni fase. Il PRM utilizza una topologia di commutazione a tensione zero, mentre il VTM utilizza una topologia proprietaria di convertitore di ampiezza sinusoidale (SAC) ad alta frequenza. Il VTM può essere visto come un trasformatore CC / CC con un rapporto di 1 / K per la tensione e K per la corrente. Il VTM offre un’elevata densità di potenza e può essere posizionato molto vicino al processore. VTM implementa una topologia SAC (Sine Amplitude Converter) in modo che le sue emissioni siano basse e a banda stretta rispetto a quelle degli interruttori multifase e dei loro induttori associati. Fornisce inoltre una maggiore densità di potenza rispetto ai modelli multifase, con il singolo VTM che sostituisce sei stadi di commutazione multifase. Il VTM si adatta a un ingombro ridotto, ben entro i vincoli di layout dei processori avanzati che supportano la memoria a quattro canali senza invadere le aree di layout del sottosistema di memoria.
Figura 2: alimentazione laterale (Fonte: Vicor): L’erogazione di corrente elevata viene fornita tramite moduli MCM (Modular Current Multiplier) che sono posizionati adiacenti al processore sulla scheda madre o sul substrato del processore. Il posizionamento degli MCM sul substrato riduce al minimo le perdite PDN e riduce il numero di pin BGA del substrato del processore necessari per l’alimentazione. L’LPD è progettato per supportare le richieste di alimentazione e il fattore di forma unico delle schede OCP Accelerator Module (OAM) e delle schede acceleratrici AI personalizzate.
Figura 3: erogazione di potenza verticale (fonte: Vicor). Il Vertical Power Delivery (VPD) elimina ulteriormente le perdite di distribuzione dell’alimentazione e il consumo di area della scheda PCB VR. VPD è simile nel design alla soluzione Vicor LPD, con l’aggiunta della capacità di bypass nel moltiplicatore di corrente o nel modulo GCM.
A seconda della corrente elettrica del processore, gli ingegneri possono scegliere tra erogazione di potenza laterale (LPD) o erogazione di potenza verticale (VPD). Nel primo caso, il moltiplicatore di corrente si trova accanto al processore AI sullo stesso substrato o direttamente sulla scheda madre entro pochi millimetri, consentendo di ridurre il PDN a circa 50 microOhm. Per prestazioni ancora più elevate, VPD sposta il moltiplicatore di corrente direttamente sotto il processore, integrando anche condensatori di terra ad alta frequenza. Questo tipo di moltiplicatore di corrente è chiamato moltiplicatore di corrente a ingranaggi. Il VPD riduce la resistenza PDN a 5–7 microOhm, consentendo ai processori AI di essere liberi di sfruttare la piena potenza.
Figura 4: Questa soluzione Ai evidenzia la soluzione VR Vicor a carico diretto da 48 V che supporta l’erogazione di corrente di picco fino a 650 A continua e oltre 1000 A. (Fonte: Vicor)
Ottimizzazione delle prestazioni del processore AI
Una tipica soluzione Vicor VR per moduli di accelerazione del processore AI avanzati è mostrata nella Figura 4. Vicor VR è composto da tre moduli powertrain, un MCD (Modular Current Driver) e 2 MCM (Modular Current Multipliers), che fornisce un 48Vin a 0,8Vout VR con capacità fino a 650 A di corrente continua e oltre 1000 A di erogazione di corrente di picco. Come il carburante per aviogetti per un aereo, questo livello di erogazione di potenza garantisce che il processore AI possa funzionare a frequenze di clock ottimali e massimizzare le prestazioni. “Se la nostra tecnologia non fosse stata impiegata in queste applicazioni AI avanzate, il numero di dispositivi VR multifase avrebbe superato le dimensioni della scheda e non manterrebbe lo stesso fattore di forma. Inoltre, il contributo del rumore sarebbe stato molto probabilmente troppo alto per mantenere l’integrità del segnale “, ha affermato Gendron. Utilizzando un Vicor NBM2317, viene mantenuta la compatibilità con la distribuzione di alimentazione del rack del server legacy da 12 V e fornisce 48 V a Vicor VR. Questo convertitore da 12V a 48V può anche funzionare in direzione “opposta” consentendo la conversione da 48V a 12V. Le architetture di potenza convenzionali non tengono il passo con gli odierni processori di intelligenza artificiale assetati di potere e la loro adozione nel cloud computing. L’approccio di alimentazione Vicor consente la distribuzione a 48 V e una VR che supporta le esigenze di elaborazione AI avanzate. Partendo dal design multifase convenzionale utilizzato con le CPU, la soluzione Vicor è stata sviluppata specificamente per affrontare una nuova classe di processori che migrano rapidamente all’interno dei server cloud. E’ necessario un nuovo approccio per alimentare l’AI / HPC. La distribuzione di 12V dal rack del server cloud non è più sostenibile, poiché le aziende leader spingono sulla potenza. Per alimentare, gli ASIC e le GPU di oggi richiedono più di una semplice maggiore potenza sostituendo le parti. Le soluzioni più efficaci iniziano con l’alimentazione ad alta tensione e incorporano architetture e topologie innovative e utilizzano moduli di alimentazione ad alta densità altamente efficienti.
Leggi articolo originale qui