В условиях взрывного роста генеративного ИИ и больших языковых моделей требования к вычислительной мощности центров обработки данных растут беспрецедентными темпами. Последнее поколение графических процессоров и ускорителей ИИ от таких производителей, как NVIDIA и AMD, теперь имеет энергопотребление одной карты, превышающее 1000 Вт, а скорость передачи данных вступает в эру PCIe 5.0/6.0 и выше. Будучи центральным узлом, несущим все это, проектирование серверных материнских плат и объединительных плат сталкивается с беспрецедентными вызовами. В этом контексте материнская плата для ИИ-сервера с низкими потерями больше не является опцией, а краеугольным камнем для обеспечения стабильной и эффективной работы системы.
Как инженер, специализирующийся на решениях с высокой плотностью мощности, я понимаю сложность управления киловаттами мощности и терабитами в секунду (Тбит/с) данных в архитектуре 48 В. Затухание сигнала, шумовые помехи по питанию, накопление тепла — любой незначительный недосмотр может привести к узким местам в производительности системы или даже катастрофическим сбоям. С точки зрения инженера, эта статья рассмотрит ключевые технические проблемы создания высокопроизводительной материнской платы для ИИ-сервера с низкими потерями, охватывая все: от выбора материалов и высокоскоростной трассировки до производства и тестирования, обеспечивая соответствие конечного качества материнской платы для ИИ-сервера самым высоким стандартам.
Почему материалы с низкими потерями являются краеугольным камнем объединительных плат ИИ-серверов?
Когда частоты сигналов переходят с 16 GT/s PCIe 4.0 на 64 GT/s PCIe 6.0, затухание сигнала (потери при вставке) в передающей среде растет экспоненциально. Традиционные материалы FR-4 действуют как "губка", поглощающая энергию сигнала на таких сверхвысоких частотах, что приводит к полному коллапсу глазковых диаграмм сигнала и резкому увеличению частоты ошибок данных. Поэтому выбор правильного материала с низкими потерями является первым и самым важным шагом при проектировании печатной платы материнской платы сервера ИИ с низкими потерями.
Основные показатели, которые следует учитывать, - это диэлектрическая проницаемость (Dk) и тангенс угла потерь (Df) материала:
- Диэлектрическая проницаемость (Dk): Влияет на скорость распространения сигнала и контроль импеданса. Более низкое и стабильное значение Dk помогает достичь более точного согласования импеданса, уменьшая отражения сигнала.
- Тангенс угла потерь (Df): Прямо определяет степень преобразования энергии сигнала в тепло в среде. Чем ниже Df, тем меньше затухание сигнала, что критически важно для передачи на большие расстояния.
Для высокоскоростных печатных плат, обычно используемых в серверах ИИ, материалы обычно делятся на несколько категорий:
- Стандартные потери: Например, обычный FR-4, подходит для приложений 1-3 ГГц.
- Средние потери: Значения Df между 0,009-0,015, подходит для PCIe 3.0/4.0.
- Низкие потери: Значения Df между 0,005-0,009, базовый уровень для приложений PCIe 5.0.
- Сверхнизкие потери: Значения Df ниже 0,005, такие как Tachyon 100G, Megtron 6/7/8 и т. д., необходимые для каналов PCIe 6.0 и 224G SerDes.
Выбор правильного материала означает закладку прочного фундамента для целостности сигнала с самого начала.
Ключевые проблемы трассировки печатных плат объединительных панелей высокоскоростных серверов ИИ
Имея высококачественные материалы, следующим шагом является максимизация их производительности за счет точной трассировки печатных плат материнских плат серверов ИИ. На материнской плате сервера ИИ плотные BGA, высокоплотные разъемы и тысячи высокоскоростных дифференциальных пар делают трассировку сродни танцу на кончике иглы.
Точный контроль импеданса: Импеданс высокоскоростных дифференциальных пар (таких как PCIe/CXL) должен строго контролироваться до целевых значений 85/92/100 Ом (±7% или более высокая точность). Любое отклонение может вызвать отражения сигнала и ухудшить его качество. Это требует от производителей печатных плат исключительных возможностей контроля процесса для таких параметров, как ширина трассы, расстояние, толщина диэлектрика и толщина меди.
Подавление перекрестных помех: Когда параллельные дифференциальные пары расположены слишком близко, возникает электромагнитная связь (т. е. перекрестные помехи). В сценариях высокой плотности, таких как материнские платы ИИ, необходимо применять стратегии, такие как увеличение расстояния между парами (обычно следуя правилу 3W или 5W), использование изоляции плоскости заземления и оптимизация распределения слоев для минимизации ближних перекрестных помех (NEXT) и дальних перекрестных помех (FEXT).
Оптимизация переходных отверстий: Переходные отверстия являются неизбежными «точками разрыва» в многослойных конструкциях плат. Для сверхвысокоскоростных сигналов традиционные сквозные переходные отверстия создают нежелательный «пенек», который действует как антенна и вызывает сильные отражения сигнала. Для решения этой проблемы необходимо использовать обратное сверление для точного удаления избыточного медного пенька с обратной стороны печатной платы. Для более сложных конструкций HDI PCB глухие/скрытые переходные отверстия и микропереходные отверстия обеспечивают более короткие пути сигнала и лучшую производительность, но предъявляют более высокие производственные требования. Каждая оптимизированная деталь имеет решающее значение для повышения общего качества печатной платы материнской платы AI-сервера.
Сравнение характеристик высокоскоростных материалов для печатных плат
| Класс материала | Типичное значение Df (@10ГГц) | Типичное значение Dk (@10ГГц) | Сценарий применения | Относительная стоимость |
|---|---|---|---|---|
| Стандартные потери (FR-4) | ~0,020 | ~4,5 | < 5 Гбит/с (например, PCIe 2.0) | 1x |
| Средние потери | ~0,010 | ~3,8 | ~16 Гбит/с (например, PCIe 4.0) | 1,5x - 2x |
| Низкие потери | ~0,005 | ~3,5 | ~32 Гбит/с (например, PCIe 5.0) | 3x - 5x |
| Ультранизкие потери | <0,003 | ~3,2 | > 56 Гбит/с (например, PCIe 6.0, 224G Ethernet) | > 6x |
Как оптимизировать сеть распределения питания (PDN) для поддержки сотен ампер?
Пиковый ток ускорителей ИИ может достигать сотен или даже тысяч ампер, что создает значительные проблемы для сети распределения питания (PDN). Плохо спроектированная PDN может привести к серьезным падениям напряжения (IR Drop), напрямую влияя на стабильную работу чипа.
Ключ к оптимизации заключается в достижении чрезвычайно низкого импеданса PDN:
- Большие плоскости питания/земли: В стеках печатных плат по возможности следует использовать полные и непрерывные слои питания и земли. Это не только обеспечивает токовые пути с низким импедансом, но и помогает в высокочастотной развязке за счет межслойной емкости.
- Архитектура 48В и процесс с толстой медью: Принятие архитектуры питания 48В может значительно снизить ток, тем самым минимизируя потери I²R. В области VRM (модуля регулятора напряжения) материнской платы обычно требуется толстая медь 3 унции или толще для работы с высокими токами, а также большие массивы переходных отверстий для подачи питания на выводы чипа.
- Многоуровневая стратегия развязки: Большое количество развязывающих конденсаторов должно быть размещено вокруг чипа. Эти конденсаторы должны охватывать весь частотный спектр от высоких до низких частот, образуя «банк конденсаторов». Это включает малогабаритные высокочастотные конденсаторы (например, 0201/01005), размещенные под BGA, а также высокоемкостные конденсаторы в других местах платы для устранения переходных изменений нагрузки. Являясь опытным производителем печатных плат, HILPCB обладает обширным опытом в разработке высокомощных PDN. Благодаря точным процессам моделирования и производства мы гарантируем исключительную надежность вашей системы электропитания.
Терморегулирование: Больше, чем просто радиаторы
Когда материнская плата обрабатывает киловатты мощности, терморегулирование становится системной задачей. Сама печатная плата действует как источник тепла (из-за потерь в медной фольге), так и как критически важный путь рассеивания тепла.
Эффективные стратегии терморегулирования на уровне печатной платы включают:
- Оптимизация тепловых путей: Размещая многочисленные тепловые переходные отверстия под тепловыделяющими компонентами (например, VRM, чипами), тепло быстро передается во внутренние медные слои или на обратную сторону печатной платы, где оно может рассеиваться через радиаторы.
- Материалы с высоким Tg: Серверы ИИ работают при высоких внутренних температурах, что требует использования подложек с высокими температурами стеклования (High Tg, обычно Tg > 170°C) для обеспечения механической прочности и стабильности размеров при термическом напряжении.
- Совместимость с жидкостным охлаждением: Поскольку воздушное охлаждение достигает своих пределов, жидкостное охлаждение становится основным направлением. Конструкции печатных плат должны предусматривать монтажные отверстия для холодных пластин и усиливающие конструкции для обеспечения надежности. Некоторые конструкции могут даже интегрировать схемы обнаружения утечек, что соответствует строгим требованиям надежности печатных плат материнских плат серверов ИИ автомобильного класса.
Ключевые аспекты проектирования высокопроизводительных материнских плат для AI-серверов с низкими потерями
- Выбор материалов: Выбирайте материалы со сверхнизкими потерями, исходя из скорости сигнала, чтобы сбалансировать производительность и стоимость.
- Контроль импеданса: Строго поддерживайте импеданс дифференциальных пар в пределах ±7%, проверяемый с помощью TDR во время производства.
- Целостность PDN: Внедряйте конструкции PDN с низким импедансом для обеспечения стабильности напряжения в условиях переходных высоких токов.
- Тепловые пути: Тщательно проектируйте тепловые переходные отверстия и медные фольги для эффективного отвода тепла из основных областей.
