Avec la croissance explosive de l'IA générative et des grands modèles linguistiques, les demandes en puissance de calcul des centres de données augmentent à un rythme sans précédent. La dernière génération de GPU et d'accélérateurs IA de fabricants comme NVIDIA et AMD présente désormais une consommation électrique d'une seule carte dépassant 1000W, avec des débits de données entrant dans l'ère de PCIe 5.0/6.0 et au-delà. En tant que hub central supportant tout cela, la conception des cartes mères et des fonds de panier de serveurs fait face à des défis sans précédent. Dans ce contexte, la carte mère de serveur IA à faible perte n'est plus une option mais une pierre angulaire pour assurer un fonctionnement stable et efficace du système.
En tant qu'ingénieur spécialisé dans les solutions à haute densité de puissance, je comprends la difficulté de gérer des kilowatts de puissance et des térabits par seconde (Tbps) de données dans une architecture 48V. Atténuation du signal, bruit d'alimentation, accumulation de chaleur – le moindre oubli peut entraîner des goulots d'étranglement des performances du système ou même des défaillances catastrophiques. Du point de vue d'un ingénieur, cet article examinera les défis techniques clés de la construction d'une carte mère de serveur IA à faible perte haute performance, couvrant tout, de la sélection des matériaux et du routage haute vitesse à la fabrication et aux tests, garantissant que la qualité finale de la carte mère de serveur IA répond aux normes les plus élevées.
Pourquoi les matériaux à faible perte sont-ils la pierre angulaire des fonds de panier de serveurs IA ?
Lorsque les fréquences des signaux passent de 16 GT/s pour PCIe 4.0 à 64 GT/s pour PCIe 6.0, l'atténuation du signal (perte d'insertion) dans le milieu de transmission augmente de manière exponentielle. Les matériaux FR-4 traditionnels agissent comme une "éponge" absorbant l'énergie du signal à des fréquences ultra-élevées, provoquant l'effondrement complet des diagrammes en œil du signal et une flambée des taux d'erreur de données. Par conséquent, choisir le bon matériau à faible perte est la première étape et la plus critique dans la conception d'un PCB de carte mère de serveur AI à faible perte.
Les principales métriques à considérer sont la constante diélectrique (Dk) et le facteur de dissipation (Df) du matériau :
- Constante diélectrique (Dk) : Affecte la vitesse de propagation du signal et le contrôle de l'impédance. Une valeur Dk plus faible et plus stable permet d'obtenir une adaptation d'impédance plus précise, réduisant les réflexions du signal.
- Facteur de dissipation (Df) : Détermine directement la mesure dans laquelle l'énergie du signal est convertie en chaleur dans le milieu. Plus le Df est faible, plus l'atténuation du signal est faible, ce qui est crucial pour la transmission sur de longues distances.
Pour les PCB haute vitesse couramment utilisés dans les serveurs AI, les matériaux sont généralement classés en plusieurs catégories :
- Perte standard : Comme le FR-4 conventionnel, adapté aux applications de 1-3 GHz.
- Perte moyenne : Valeurs Df entre 0,009-0,015, adaptées pour PCIe 3.0/4.0.
- Perte faible : Valeurs Df entre 0,005-0,009, la base pour les applications PCIe 5.0.
- Ultra-faible perte : Valeurs Df inférieures à 0,005, telles que Tachyon 100G, Megtron 6/7/8, etc., essentielles pour les liaisons PCIe 6.0 et 224G SerDes.
Choisir le bon matériau, c'est jeter des bases solides pour l'intégrité du signal dès le départ.
Défis clés du routage de PCB de fond de panier de serveurs AI haute vitesse
Avec des matériaux de haute qualité en main, l'étape suivante consiste à maximiser leurs performances grâce à un routage de PCB précis de la carte mère de serveur AI. Sur une carte mère de serveur AI, les BGA denses, les connecteurs haute densité et les milliers de paires différentielles haute vitesse rendent le routage comparable à une danse sur la pointe d'une aiguille.
Contrôle précis de l'impédance : L'impédance des paires différentielles haute vitesse (telles que PCIe/CXL) doit être strictement contrôlée à des valeurs cibles de 85/92/100 ohms (±7% ou plus de précision). Toute déviation peut provoquer des réflexions de signal et dégrader la qualité du signal. Cela exige des fabricants de PCB qu'ils possèdent des capacités de contrôle de processus exceptionnelles pour des paramètres tels que la largeur de trace, l'espacement, l'épaisseur diélectrique et l'épaisseur de cuivre.
Suppression de la diaphonie : Lorsque des paires différentielles parallèles sont trop proches, un couplage de champ électromagnétique (c'est-à-dire la diaphonie) se produit. Dans les scénarios à haute densité comme les cartes mères AI, des stratégies telles que l'augmentation de l'espacement des paires (généralement en suivant la règle 3W ou 5W), l'utilisation de l'isolation du plan de masse et l'optimisation de l'allocation des couches doivent être employées pour minimiser la diaphonie proche (NEXT) et la diaphonie lointaine (FEXT).
Optimisation des Vias : Les vias sont des "points de discontinuité" inévitables dans les conceptions de cartes multicouches. Pour les signaux à très haute vitesse, les vias traversants traditionnels créent un "moignon" indésirable, qui agit comme une antenne et provoque de graves réflexions de signal. Pour y remédier, le contre-perçage doit être utilisé pour retirer précisément le moignon de cuivre excédentaire de l'arrière du PCB. Pour les conceptions HDI PCB plus complexes, les vias borgnes/enterrés et les microvias offrent des chemins de signal plus courts et de meilleures performances, mais imposent des exigences de fabrication plus élevées. Chaque détail optimisé est essentiel pour améliorer la qualité globale du PCB de la carte mère de serveur IA.
Comparaison des performances des matériaux PCB haute vitesse
| Grade du Matériau | Valeur Df typique (@10GHz) | Valeur Dk typique (@10GHz) | Scénario d'Application | Coût Relatif |
|---|---|---|---|---|
| Perte standard (FR-4) | ~0,020 | ~4,5 | < 5 Gbps (ex. PCIe 2.0) | 1x |
| Perte moyenne | ~0,010 | ~3,8 | ~16 Gbps (ex. PCIe 4.0) | 1,5x - 2x |
| Faible perte | ~0,005 | ~3,5 | ~32 Gbps (ex. PCIe 5.0) | 3x - 5x |
| Perte ultra faible | <0,003 | ~3,2 | > 56 Gbps (ex. PCIe 6.0, 224G Ethernet) | > 6x |
Comment optimiser le réseau de distribution d'alimentation (PDN) pour supporter des centaines d'ampères ?
Le courant de crête des accélérateurs d'IA peut atteindre des centaines, voire des milliers d'ampères, posant des défis significatifs au réseau de distribution d'énergie (PDN). Un PDN mal conçu peut entraîner des chutes de tension sévères (chute IR), affectant directement le fonctionnement stable de la puce.
La clé de l'optimisation réside dans l'obtention d'une impédance PDN extrêmement faible :
- Plans d'alimentation/masse de grande surface : Dans les empilements de PCB, des couches d'alimentation et de masse complètes et continues doivent être utilisées chaque fois que possible. Cela fournit non seulement des chemins de courant à faible impédance, mais aide également au découplage haute fréquence grâce à la capacité intercouche.
- Architecture 48V et procédé de cuivre épais : L'adoption d'une architecture d'alimentation 48V peut réduire considérablement le courant, minimisant ainsi les pertes I²R. Dans la zone VRM (Voltage Regulator Module) de la carte mère, du cuivre épais de 3oz ou plus est généralement requis pour gérer les courants élevés, ainsi que de grands réseaux de vias pour fournir l'alimentation aux broches de la puce.
- Stratégie de découplage en couches : Un grand nombre de condensateurs de découplage doivent être placés autour de la puce. Ces condensateurs doivent couvrir l'ensemble du spectre de fréquences, des hautes aux basses fréquences, formant une « banque de condensateurs ». Cela inclut des condensateurs haute fréquence de petite taille (par exemple, 0201/01005) placés sous le BGA, ainsi que des condensateurs de grande capacité ailleurs sur la carte pour gérer les variations de charge transitoires. En tant que fabricant de PCB expérimenté, HILPCB possède une expertise approfondie dans la gestion des conceptions PDN haute puissance. Grâce à des processus de simulation et de fabrication précis, nous garantissons que votre système d'alimentation est d'une solidité à toute épreuve.
Gestion Thermique : Plus que de Simples Dissipateurs de Chaleur
Lorsqu'une carte mère gère des kilowatts de puissance, la gestion thermique devient un défi au niveau du système. Le PCB lui-même agit à la fois comme source de chaleur (en raison des pertes de feuille de cuivre) et comme voie critique de dissipation de la chaleur.
Les stratégies efficaces de gestion thermique au niveau du PCB incluent :
- Optimisation des Chemins Thermiques : En plaçant de nombreuses vias thermiques sous les composants générateurs de chaleur (par exemple, VRM, puces), la chaleur est rapidement transférée aux couches de cuivre internes ou à l'arrière du PCB, où elle peut être dissipée via des dissipateurs thermiques.
- Matériaux à Tg Élevé : Les serveurs IA fonctionnent à des températures internes élevées, nécessitant des substrats avec des températures de transition vitreuse élevées (Tg élevé, typiquement Tg > 170°C) pour assurer la résistance mécanique et la stabilité dimensionnelle sous contrainte thermique.
- Compatibilité avec le Refroidissement Liquide : Alors que le refroidissement par air atteint ses limites, le refroidissement liquide devient courant. Les conceptions de PCB doivent prévoir des trous de montage pour les plaques froides et des structures de renforcement pour assurer la fiabilité. Certaines conceptions peuvent même intégrer des circuits de détection de fuite, s'alignant sur les exigences strictes de fiabilité des PCB de cartes mères de serveurs IA de qualité automobile.
Considérations clés de conception pour les PCB de cartes mères de serveurs IA haute performance à faible perte
- Sélection des matériaux : Choisir des matériaux à très faible perte en fonction des débits de signal pour équilibrer performance et coût.
- Contrôle d'impédance : Maintenir strictement l'impédance des paires différentielles à ±7%, vérifiée par TDR pendant la production.
- Intégrité du PDN : Mettre en œuvre des conceptions de PDN à faible impédance pour assurer la stabilité de la tension dans des conditions transitoires de courant élevé.
- Chemins thermiques : Concevoir soigneusement les vias thermiques et les feuilles de cuivre pour dissiper efficacement la chaleur des zones centrales.
