Con la crescita esplosiva dell'IA generativa e dei modelli linguistici di grandi dimensioni, le richieste di potenza computazionale dei data center stanno aumentando a un ritmo senza precedenti. L'ultima generazione di GPU e acceleratori AI di produttori come NVIDIA e AMD presenta ora un consumo energetico di una singola scheda superiore a 1000W, con velocità di trasmissione dati che entrano nell'era di PCIe 5.0/6.0 e oltre. Essendo l'hub centrale che gestisce tutto questo, la progettazione delle schede madri e dei backplane dei server affronta sfide senza precedenti. In questo contesto, la PCB per scheda madre di server AI a bassa perdita non è più un'opzione, ma una pietra angolare per garantire un funzionamento stabile ed efficiente del sistema.
Come ingegnere specializzato in soluzioni ad alta densità di potenza, comprendo la difficoltà di gestire kilowatt di potenza e terabit al secondo (Tbps) di dati in un'architettura a 48V. Attenuazione del segnale, rumore di alimentazione, accumulo di calore: qualsiasi minima svista può portare a colli di bottiglia delle prestazioni del sistema o addirittura a guasti catastrofici. Dal punto di vista di un ingegnere, questo articolo approfondirà le principali sfide tecniche nella costruzione di una PCB per scheda madre di server AI a bassa perdita ad alte prestazioni, coprendo tutto, dalla selezione dei materiali e il routing ad alta velocità alla produzione e ai test, garantendo che la qualità finale della PCB della scheda madre del server AI soddisfi gli standard più elevati.
Perché i materiali a bassa perdita sono la pietra angolare dei backplane dei server AI?
Quando le frequenze del segnale passano da 16 GT/s di PCIe 4.0 a 64 GT/s di PCIe 6.0, l'attenuazione del segnale (perdita di inserzione) nel mezzo di trasmissione cresce in modo esponenziale. I materiali FR-4 tradizionali agiscono come una "spugna" che assorbe l'energia del segnale a frequenze così elevate, causando il collasso completo dei diagrammi ad occhio del segnale e un aumento vertiginoso del tasso di errore dei dati. Pertanto, la scelta del materiale a bassa perdita giusto è il primo e più critico passo nella progettazione di un PCB per scheda madre di server AI a bassa perdita.
Le metriche principali da considerare sono la costante dielettrica (Dk) e il fattore di dissipazione (Df) del materiale:
- Costante dielettrica (Dk): Influisce sulla velocità di propagazione del segnale e sul controllo dell'impedenza. Un valore Dk più basso e più stabile aiuta a ottenere un adattamento di impedenza più preciso, riducendo le riflessioni del segnale.
- Fattore di dissipazione (Df): Determina direttamente la misura in cui l'energia del segnale viene convertita in calore nel mezzo. Più basso è il Df, minore è l'attenuazione del segnale, il che è cruciale per la trasmissione a lunga distanza.
Per i PCB ad alta velocità comunemente utilizzati nei server AI, i materiali sono tipicamente classificati in diverse categorie:
- Perdita standard: Come il FR-4 convenzionale, adatto per applicazioni da 1-3 GHz.
- Perdita media: Valori Df tra 0,009-0,015, adatti per PCIe 3.0/4.0.
- Perdita bassa: Valori Df tra 0,005-0,009, la base per le applicazioni PCIe 5.0.
- A bassissima perdita: Valori Df inferiori a 0,005, come Tachyon 100G, Megtron 6/7/8, ecc., essenziali per i collegamenti PCIe 6.0 e 224G SerDes.
Scegliere il materiale giusto significa gettare solide basi per l'integrità del segnale fin dall'inizio.
Sfide chiave nell'instradamento PCB del backplane di server AI ad alta velocità
Con materiali di alta qualità a disposizione, il passo successivo è massimizzare le loro prestazioni attraverso un instradamento PCB preciso della scheda madre del server AI. Su una scheda madre di server AI, BGA densi, connettori ad alta densità e migliaia di coppie differenziali ad alta velocità rendono l'instradamento simile a danzare sulla punta di un ago.
Controllo preciso dell'impedenza: L'impedenza delle coppie differenziali ad alta velocità (come PCIe/CXL) deve essere strettamente controllata a valori target di 85/92/100 ohm (±7% o maggiore precisione). Qualsiasi deviazione può causare riflessioni del segnale e degradare la qualità del segnale. Ciò richiede ai produttori di PCB di avere eccezionali capacità di controllo del processo per parametri come larghezza della traccia, spaziatura, spessore del dielettrico e spessore del rame.
Soppressione del crosstalk: Quando le coppie differenziali parallele sono troppo vicine, si verifica un accoppiamento del campo elettromagnetico (cioè, crosstalk). In scenari ad alta densità come le schede madri AI, devono essere impiegate strategie come l'aumento della spaziatura delle coppie (tipicamente seguendo la regola 3W o 5W), l'uso dell'isolamento del piano di massa e l'ottimizzazione dell'allocazione dei layer per minimizzare il Near-End Crosstalk (NEXT) e il Far-End Crosstalk (FEXT).
Ottimizzazione dei Via: I via sono "punti di discontinuità" inevitabili nei progetti di schede multistrato. Per segnali a velocità ultra-elevata, i via tradizionali a foro passante creano un "stub" indesiderato, che agisce come un'antenna e causa gravi riflessioni del segnale. Per ovviare a ciò, è necessario utilizzare la retro-foratura per rimuovere con precisione lo stub di rame in eccesso dal retro del PCB. Per progetti HDI PCB più complessi, i via ciechi/interrati e i microvia offrono percorsi del segnale più brevi e prestazioni migliori, ma impongono requisiti di produzione più elevati. Ogni dettaglio ottimizzato è fondamentale per migliorare la qualità complessiva del PCB della scheda madre del server AI.
Confronto delle prestazioni dei materiali PCB ad alta velocità
| Grado del Materiale | Valore Df tipico (@10GHz) | Valore Dk tipico (@10GHz) | Scenario di Applicazione | Costo Relativo |
|---|---|---|---|---|
| Perdita standard (FR-4) | ~0,020 | ~4,5 | < 5 Gbps (es. PCIe 2.0) | 1x |
| Perdita media | ~0,010 | ~3,8 | ~16 Gbps (es. PCIe 4.0) | 1,5x - 2x |
| Perdita bassa | ~0,005 | ~3,5 | ~32 Gbps (es. PCIe 5.0) | 3x - 5x |
| Perdita ultra bassa | <0,003 | ~3,2 | > 56 Gbps (es. PCIe 6.0, 224G Ethernet) | > 6x |
Come ottimizzare la rete di distribuzione dell'alimentazione (PDN) per supportare centinaia di ampere?
La corrente di picco degli acceleratori AI può raggiungere centinaia o addirittura migliaia di ampere, ponendo sfide significative alla rete di distribuzione dell'alimentazione (PDN). Una PDN mal progettata può portare a gravi cadute di tensione (IR Drop), influenzando direttamente il funzionamento stabile del chip.
La chiave per l'ottimizzazione risiede nel raggiungimento di un'impedenza PDN estremamente bassa:
- Piani di alimentazione/massa ad ampia superficie: Nelle stratificazioni PCB, dovrebbero essere utilizzati strati di alimentazione e massa completi e continui ogni volta che è possibile. Ciò non solo fornisce percorsi di corrente a bassa impedenza, ma aiuta anche con il disaccoppiamento ad alta frequenza attraverso la capacità interstrato.
- Architettura a 48V e processo con rame pesante: L'adozione di un'architettura di alimentazione a 48V può ridurre significativamente la corrente, minimizzando così le perdite I²R. Nell'area VRM (Voltage Regulator Module) della scheda madre, è tipicamente richiesto rame pesante da 3oz o più spesso per gestire correnti elevate, insieme a grandi array di via per fornire alimentazione ai pin del chip.
- Strategia di disaccoppiamento a strati: Un gran numero di condensatori di disaccoppiamento deve essere posizionato attorno al chip. Questi condensatori devono coprire l'intero spettro di frequenze, dalle alte alle basse, formando una "banca di condensatori". Ciò include condensatori ad alta frequenza di piccole dimensioni (ad es. 0201/01005) posizionati sotto il BGA, nonché condensatori ad alta capacità altrove sulla scheda per gestire le variazioni di carico transitorie. In qualità di produttore esperto di PCB, HILPCB vanta una vasta esperienza nella gestione di progetti PDN ad alta potenza. Attraverso precisi processi di simulazione e produzione, garantiamo che il vostro sistema di alimentazione sia estremamente solido.
Gestione Termica: Più che Semplici Dissipatori di Calore
Quando una scheda madre gestisce kilowatt di potenza, la gestione termica diventa una sfida a livello di sistema. Il PCB stesso agisce sia come fonte di calore (a causa delle perdite del foglio di rame) sia come percorso critico di dissipazione del calore.
Le strategie efficaci di gestione termica a livello di PCB includono:
- Ottimizzazione dei Percorsi Termici: Posizionando numerose vie termiche sotto i componenti che generano calore (ad esempio, VRM, chip), il calore viene rapidamente trasferito agli strati interni di rame o al lato posteriore del PCB, dove può essere dissipato tramite dissipatori di calore.
- Materiali ad Alto Tg: I server AI operano a temperature interne elevate, rendendo necessari substrati con alte temperature di transizione vetrosa (Alto Tg, tipicamente Tg > 170°C) per garantire resistenza meccanica e stabilità dimensionale sotto stress termico.
- Compatibilità con il Raffreddamento a Liquido: Poiché il raffreddamento ad aria raggiunge i suoi limiti, il raffreddamento a liquido sta diventando la norma. I progetti di PCB devono prevedere fori di montaggio per piastre fredde e strutture di rinforzo per garantire l'affidabilità. Alcuni progetti possono persino integrare circuiti di rilevamento delle perdite, allineandosi ai rigorosi requisiti di affidabilità dei PCB per schede madri di server AI di grado automobilistico.
Considerazioni chiave di progettazione per PCB di schede madri di server AI ad alte prestazioni e a bassa perdita
- Selezione dei materiali: Scegliere materiali a bassissima perdita in base alle velocità del segnale per bilanciare prestazioni e costi.
- Controllo dell'impedenza: Mantenere rigorosamente l'impedenza delle coppie differenziali entro ±7%, verificata tramite TDR durante la produzione.
- Integrità PDN: Implementare progetti PDN a bassa impedenza per garantire la stabilità della tensione in condizioni transitorie di alta corrente.
- Percorsi termici: Progettare attentamente via termiche e fogli di rame per dissipare efficientemente il calore dalle aree centrali.
