Проектирование печатных плат материнских плат AI-серверов: Решение проблем высокоскоростных межсоединений в печатных платах объединительных панелей AI-серверов

С взрывным ростом генеративного ИИ, больших языковых моделей (LLM) и высокопроизводительных вычислений (HPC) AI-серверы стали вычислительным ядром центров обработки данных. Эти серверы размещают GPU, CPU и специализированные ускорители с энергопотреблением, достигающим нескольких киловатт, в то время как пропускная способность данных достигла диапазона Тб/с. В качестве "нейронного узла", соединяющего все основные компоненты, сложность проектирования и проблемы материнских плат или объединительных плат AI-серверов достигли беспрецедентных высот. Исключительное проектирование печатных плат материнских плат AI-серверов больше не сводится только к схемным соединениям, а скорее к точному управлению высокоскоростными сигналами, массивной мощностью и экстремальными тепловыми потоками.

Как инженер, специализирующийся на решениях с высокой плотностью мощности, я понимаю, что в сегодняшнюю эпоху, когда 48В архитектуры, системы жидкостного охлаждения и высокоплотные межсоединения являются мейнстримом, проектирование печатных плат само по себе является критически важной задачей системной инженерии. От выбора материалов до планирования стека слоев, от сетей распределения питания (PDN) до теплового менеджмента — каждое решение напрямую влияет на конечную производительность, стабильность и стоимость AI-серверов. Эта статья углубляется в основные проблемы и ключевые технологии проектирования печатных плат материнских плат AI-серверов, рассказывая о том, как тщательное проектирование, производство и тестирование могут создать прочную основу, способную поддерживать будущие вычислительные потребности.

Почему проектирование стека слоев печатной платы является краеугольным камнем производительности для AI-серверов?

В серверах ИИ проектирование стека слоев печатной платы является отправной точкой и основой всего проектирования печатных плат материнских плат серверов ИИ. Оно не только определяет физическую структуру платы, но и напрямую устанавливает верхние пределы целостности сигнала (SI), целостности питания (PI) и электромагнитной совместимости (ЭМС). Для материнских плат серверов ИИ, работающих с высокоскоростными шинами, такими как PCIe 5.0/6.0, CXL или NVLink, плохое проектирование стека слоев может значительно ухудшить производительность даже самых передовых чипов.

Основа проектирования стека слоев заключается в выборе материалов и последовательности слоев:

  1. Применение материалов со сверхнизкими потерями: Традиционные материалы FR-4 демонстрируют чрезмерные диэлектрические потери (Df) на высоких частотах, что делает их непригодными для высокоскоростных сигналов, таких как 28/56/112 Гбит/с PAM4. Поэтому в печатных платах серверов ИИ обычно используются материалы со сверхнизкими или чрезвычайно низкими потерями, такие как Tachyon 100G и Megtron 6/7/8. Эти материалы имеют более низкие значения Dk (диэлектрической проницаемости) и Df, эффективно снижая затухание сигнала и обеспечивая дальность передачи и четкость глазковой диаграммы.

  2. Многослойные платы и симметричные структуры: Материнские платы AI-серверов обычно имеют более 20 слоев, часто достигая 30 и более. При планировании стека слоев крайне важно придерживаться симметричных и сбалансированных принципов – обеспечивая симметричное распределение толщины ядра, толщины препрега (PP) и веса меди по обеим сторонам центрального слоя. Это предотвращает деформацию или скручивание платы из-за неравномерных внутренних напряжений во время ламинирования и термических циклов, что критически важно для последующего массового производства печатных плат материнских плат AI-серверов.

  3. Непрерывность опорной плоскости: Каждая высокоскоростная сигнальная трасса должна иметь полную и непрерывную опорную плоскость (обычно GND или PWR). Прерывистые опорные плоскости вызывают разрывы импеданса, отражения сигнала и антенные эффекты, ухудшая электромагнитные помехи (EMI). При проектировании стека слоев мы тщательно планируем распределение плоскостей питания и земли, чтобы обеспечить кратчайшие и чистейшие обратные пути для критических сигналов.

Как решить проблемы целостности высокоскоростного сигнала (SI) для соединений PCIe 5.0/6.0?

Когда скорость передачи данных достигает 32 ГТ/с (PCIe 5.0) или даже 64 ГТ/с (PCIe 6.0), передача сигнала по печатной плате становится похожей на гонку через «болото», где даже малейший недостаток увеличивается. Обеспечение целостности сигнала является одной из самых сложных задач при проектировании печатных плат материнских плат AI-серверов.

  • Строгий контроль импеданса: Точность контроля дифференциального импеданса (обычно 90Ω или 100Ω) должна достигать ±7% или даже ±5%. Это не только зависит от точных симуляционных расчетов, но и предъявляет чрезвычайно высокие требования к процессам травления и ламинирования производителей печатных плат. На заводе Highleap PCB Factory (HILPCB) мы гарантируем, что каждая партия высокоскоростных печатных плат соответствует строгим спецификациям импеданса клиентов благодаря передовому контролю процессов и тестированию TDR (рефлектометр временной области).

  • Оптимизация переходных отверстий: Переходные отверстия являются одним из наиболее значительных «препятствий» на высокоскоростных сигнальных трактах. Традиционные сквозные отверстия создают ненужные отрезки (stubs), которые могут вызывать резонанс на высоких частотах и серьезно ухудшать качество сигнала. Для решения этой проблемы мы используем технологию обратного сверления для точного удаления избыточных отрезков с обратной стороны печатной платы. Для областей сверхвысокой плотности мы используем микропереходные отверстия и конструкции глухих/скрытых переходных отверстий из технологии HDI (High-Density Interconnect) для достижения кратчайших межслойных соединений.

  • Подавление перекрестных помех: Разводка высокой плотности сближает дифференциальные пары, делая перекрестные помехи основным источником интерференции. Мы придерживаемся правила 3W/5W (расстояние между трассами в 3/5 раза больше ширины трассы), используем защитные трассы (guard traces) и ортогональную разводку в соседних сигнальных слоях, чтобы поддерживать ближние перекрестные помехи (NEXT) и дальние перекрестные помехи (FEXT) в допустимых пределах.

Ключевые моменты для проектирования целостности высокоскоростных сигналов

  • Выбор материала: Отдавайте предпочтение ламинатам со сверхнизкими потерями со стабильными и постоянными значениями Dk/Df на целевой частоте.
  • Геометрия трасс: Точно контролируйте ширину трасс, расстояние между ними и расстояние до опорных плоскостей для обеспечения целевого импеданса.
  • Конструкция переходных отверстий: Минимизируйте заглушки переходных отверстий и оптимизируйте размеры анти-площадок для уменьшения эффектов емкости переходных отверстий.
  • Области разъемов: Выполняйте точные 3D-симуляции электромагнитного поля для контактных площадок разъемов (например, BGA, DIMM, PCIe) и оптимизируйте трассировку вывода/выхода.

Оптимизация проектирования сети распределения питания (PDN) для высокопроизводительных серверов ИИ

Графический процессор ИИ может иметь пиковое энергопотребление 700 Вт или даже 1000 Вт, при рабочем напряжении ядра ниже 1 В и токах, достигающих сотен ампер. Обеспечение стабильного, чистого питания для этих "энергоемких монстров" предъявляет экстремальные требования к проектированию PDN.

  • Архитектура питания 48 В: Для снижения потерь I²R от высоких токов в трактах передачи данных, AI-серверы широко перешли от традиционных 12-вольтовых архитектур к 48-вольтовым. Питание 48 В распределяется по материнской плате через шинопроводы или толстые медные слои на печатной плате, затем понижается до требуемого напряжения DC-DC преобразователями (VRM) рядом с нагрузкой. Такая конструкция значительно повышает эффективность подачи питания.

  • Целевое сопротивление PDN: Цель PDN состоит в поддержании чрезвычайно низкого сопротивления в очень широком диапазоне частот (от постоянного тока до сотен МГц) для обработки переходных требований нагрузок GPU. Это требует тщательно разработанной сети развязывающих конденсаторов, включающей высокоемкие электролитические или полимерные конденсаторы (для низких частот), десятки среднечастотных керамических конденсаторов (MLCC) и высокочастотные конденсаторы, расположенные внутри корпуса чипа или на обратной стороне печатной платы.

  • Размещение VRM и тепловое управление: Сам VRM также является основным источником тепла. При проектировании он должен быть расположен как можно ближе к GPU/CPU, чтобы сократить пути с высоким током и уменьшить падение напряжения. В то же время должны быть спланированы эффективные пути рассеивания тепла, как правило, с использованием больших медных заливок и плотных тепловых переходных отверстий на печатной плате для отвода тепла к радиаторам или пластинам жидкостного охлаждения.

Каковы стратегии теплового управления для печатных плат AI-серверов?

Терморегулирование имеет решающее значение для обеспечения долгосрочной стабильной работы серверов ИИ. Являясь основным носителем тепловыделения и теплопроводности, конструкция печатной платы напрямую влияет на общую эффективность охлаждения системы.

  1. Улучшенные пути теплопроводности: Под тепловыделяющими компонентами (такими как VRM и высокоскоростные трансиверы) мы проектируем плотные массивы тепловых переходных отверстий (Thermal Vias Farm). Эти отверстия заполняются проводящей пастой или гальванической медью, образуя эффективные вертикальные каналы теплопроводности для быстрой передачи тепла от верхнего слоя к внутренним слоям заземления/питания или нижнему слою печатной платы.

  2. Распределение тепла с использованием медных фольг: Внутренние слои питания и заземления служат не только электрическими цепями, но и отличными плоскостями рассеивания тепла (Heatsink Plane). Увеличение толщины меди (например, использование меди толщиной 3 унции или более) может значительно улучшить теплопроводность этих плоскостей, распределяя локализованные горячие точки по всей печатной плате, чтобы избежать перегрева.

  3. Выбор материалов с высоким Tg: Серверы ИИ работают при чрезвычайно высоких внутренних температурах, поэтому материалы печатных плат должны обладать отличной термической стабильностью. Мы обычно используем материалы с высокими температурами стеклования (Tg) (например, Tg170°C или Tg180°C), такие как High-Tg PCB. Эти материалы сохраняют лучшую механическую прочность и стабильность размеров при высоких температурах, предотвращая расслоение или деформацию.

  4. Интеграция с системными решениями для охлаждения: Дизайн печатной платы должен тесно соответствовать системным решениям для охлаждения, таким как воздушный поток шасси, радиаторы и жидкостные охлаждающие пластины. Например, мы оптимизируем расположение высоконагреваемых компонентов в зависимости от направления воздушного потока или резервируем монтажные отверстия и уплотнительные зоны на печатной плате для установки жидкостных охлаждающих пластин.

Получить предложение по печатным платам

Традиционная серверная печатная плата против печатной платы AI-сервера: Сравнение ключевых параметров

Параметр Традиционная серверная печатная плата Печатная плата AI-сервера
Скорость передачи данных PCIe 3.0/4.0 (8-16 GT/s) PCIe 5.0/6.0 (32-64 GT/s), 112G PAM4
Количество слоев 12-18 слоев 20-30+ слоев
Класс потерь материала Средние потери / Низкие потери Сверхнизкие потери / Чрезвычайно низкие потери
Потребляемая мощность платы Сотни ватт Тысячи ватт
Толщина меди 1-2 унции 2-6 унций (даже более толстая встроенная шина)
## Как снизить производственные риски с помощью обзора DFM/DFT/DFA на ранних этапах проектирования?

Философия "проектирования для производства" особенно важна в области печатных плат для серверов ИИ. Любой "идеальный" дизайн, оторванный от реальных производственных возможностей, является лишь воздушным замком. Поэтому проведение углубленного обзора DFM/DFT/DFA на ранней стадии проектирования является ключевым шагом для предотвращения рисков на поздних этапах, контроля затрат и обеспечения своевременного выхода на рынок.

  • DFM (Design for Manufacturability): Мы тесно сотрудничаем с командами разработчиков клиентов, чтобы проверить каждую деталь проекта на соответствие нашим производственным возможностям. Это включает минимальную ширину/расстояние трасс, размер и соотношение сторон сверлильных отверстий, технологию via-in-pad, дизайн контактных площадок BGA и многое другое. Благодаря профессиональному анализу DFM/DFT/DFA мы можем заранее выявить и устранить потенциальные производственные проблемы, такие как поломка сверла из-за чрезмерно малых отверстий или неравномерное травление, вызванное слишком плотной трассировкой.

  • DFT (Design for Testability): Как проверить сложную печатную плату с десятками тысяч узлов? DFT отвечает на этот вопрос. Мы советуем клиентам включать критические контрольные точки в проект и обеспечивать их доступность для зондов после сборки. Это крайне важно для последующего внутрисхемного тестирования (ICT) и функционального тестирования (FCT), формируя основу для эффективного тестирования печатных плат материнских плат AI-серверов.

  • DFA (Design for Assembly): DFA фокусируется на том, как печатные платы могут быть собраны эффективно и надежно. Мы проверяем, позволяет ли расстояние между компонентами выполнять операции SMT-монтажа, имеют ли крупные разъемы или радиаторы достаточные запретные зоны, и не могут ли компоновки компонентов вызывать эффекты затенения во время пайки. Хорошо выполненный анализ DFA значительно повышает выход годных изделий при сборке и снижает затраты на доработку. Фабрика печатных плат Highleap (HILPCB) предоставляет всем клиентам бесплатные и комплексные услуги по анализу DFM/DFT/DFA, помогая оптимизировать проекты до их наилучшего состояния перед производством.

Каковы ключевые процессы в производстве печатных плат для материнских плат AI-серверов?

Преобразование сложных проектных схем в надежные физические печатные платы основано на серии высокоточных производственных процессов. Производство печатных плат для материнских плат AI-серверов — это технологически интенсивное предприятие, основные процессы которого включают:

  1. Высокоточное ламинирование и выравнивание: Для печатных плат с более чем 20 слоями обеспечение точного выравнивания рисунков каждого слоя является серьезной проблемой. Мы используем передовые системы пробивки с CCD-выравниванием и высокоточные ламинаторы для контроля допусков межслойного выравнивания в пределах ±25 мкм, что является необходимым условием для качества высокоскоростных сигнальных переходных отверстий.

  2. Сверление с контролируемой глубиной (обратное сверление): Как упоминалось ранее, обратное сверление является ключом к устранению заглушек переходных отверстий. Наше сверлильное оборудование обеспечивает контроль глубины на микронном уровне, максимально удаляя ненужные медные столбики без повреждения соседних дорожек.

  3. Равномерное покрытие и травление: Для соответствия строгим требованиям к импедансу толщина меди и ширина дорожек должны быть очень постоянными. Мы используем передовые линии вертикального непрерывного покрытия (VCP) и технологию вакуумного дифференциального травления для обеспечения однородности по всей плате и между платами, закладывая основу для надежного массового производства печатных плат для материнских плат AI-серверов.

  4. Усовершенствованные финишные покрытия поверхности: В печатных платах для ИИ-серверов обычно используются финишные покрытия ENIG (химическое никелирование с иммерсионным золочением) или ENEPIG (химическое никелирование с химическим палладированием и иммерсионным золочением). Они не только обеспечивают отличную паяемость – особенно для корпусов BGA и LGA высокой плотности – но их плоские поверхности также помогают снизить потери от скин-эффекта в высокочастотных сигналах.

Производственные возможности HILPCB для высокопроизводительных печатных плат ИИ-серверов

Параметр Спецификация
Максимальное количество слоев 64 слоя
Минимальная ширина/зазор линии 2/2 mil (50/50 μm)
Максимальное соотношение сторон 20:1
Допуск контроля импеданса ±5%
Поддерживаемые материалы Megtron 6/7/8, Tachyon 100G, Rogers, и т.д.

Как обеспечить надежность и качество печатных плат материнских плат для серверов ИИ?

Для высокопроизводительных серверов ИИ любой отказ печатной платы может привести к значительным экономическим потерям. Поэтому строгий процесс тестирования печатных плат материнских плат для серверов ИИ служит последней и наиболее важной линией защиты для поставки высококачественной продукции.

  • Тестирование голой платы (Bare Board Testing): Перед сборкой каждая печатная плата должна пройти 100% электрическое тестирование, чтобы убедиться в отсутствии обрывов или коротких замыканий. Для прототипов и мелкосерийного производства тест летающего зонда (Flying Probe Test) является идеальным выбором. Он устраняет необходимость в дорогостоящих тестовых приспособлениях, используя подвижные зонды для прямого контакта с тестовыми точками, предлагая исключительную гибкость. Для массового производства используются специализированные приспособления типа "ложе из гвоздей" (Bed-of-Nails) для тестирования, что значительно повышает эффективность.

  • Контроль качества процесса: Помимо окончательного тестирования, контроль качества интегрирован на протяжении всего процесса производства печатных плат для материнских плат AI-серверов. Мы используем AOI (автоматический оптический контроль) для проверки качества травления каждого слоя схемы, рентген для проверки точности выравнивания внутренних слоев и проводим анализ поперечного сечения полосок контроля импеданса, чтобы гарантировать, что все параметры процесса остаются в контролируемых пределах.

  • Тестирование на сертификацию надежности: В соответствии с требованиями заказчика мы также можем проводить более строгие испытания на надежность, такие как термошок, THB (температура, влажность, смещение) и испытания на устойчивость к CAF (проводящие анодные нити), чтобы подтвердить долгосрочную надежность печатных плат в экстремальных условиях.

Переход к успешному массовому производству: От прототипа к крупносерийному производству

Переход от нескольких успешных прототипов к стабильному массовому производству тысяч единиц является критически важным шагом в массовом производстве печатных плат для материнских плат AI-серверов. Этот процесс требует бесперебойного сотрудничества между производителем и заказчиком.

  1. Замораживание и валидация процесса: После успешной валидации прототипа мы работаем с заказчиком над «замораживанием» процессов проектирования и производства. Все параметры, от ламинатных материалов до программ сверления, закрепляются в стандартных операционных процедурах (СОП) для обеспечения согласованности в последующем массовом производстве.

  2. Управление цепочками поставок: Материалы со сверхнизкими потерями, используемые в серверах ИИ, часто имеют длительные сроки поставки и высокую стоимость. Надежный производитель должен обладать сильными возможностями управления цепочками поставок для заблаговременного обеспечения критически важных материалов, гарантируя бесперебойное массовое производство. HILPCB установила долгосрочные стратегические партнерства с ведущими мировыми поставщиками материалов, предоставляя клиентам стабильные гарантии материалов.

  3. Комплексное обслуживание: Чтобы упростить цепочку поставок и ускорить вывод продукции на рынок, все больше клиентов предпочитают партнеров, предлагающих комплексные услуги по сборке печатных плат (PCBA). HILPCB является не только профессиональным производителем объединительных плат (backplane PCB), но также предоставляет комплексные услуги, включая закупку компонентов, монтаж SMT и окончательное тестирование, обеспечивая бесшовную интеграцию на этапах проектирования, производства и сборки.

Получить предложение по печатной плате

Заключение

Проектирование печатных плат материнских плат для ИИ-серверов — это сложное системное инженерное предприятие, которое объединяет материаловедение, теорию электромагнитных полей, термодинамику и прецизионное производство. Оно требует от проектировщиков и производителей постоянно расширять границы по трем измерениям: высокая скорость, высокое энергопотребление и высокая плотность. От выбора материалов со сверхнизкими потерями до тщательной оптимизации каждого переходного отверстия и дорожки; от создания надежных сетей распределения питания до проектирования эффективных путей теплопроводности; и, наконец, обеспечение безупречной поставки продукции посредством строгих проверок DFM/DFT/DFA и всестороннего тестирования печатных плат материнских плат для ИИ-серверов — каждый шаг имеет решающее значение.

Являясь ведущим поставщиком решений для печатных плат, Highleap PCB Factory (HILPCB) использует свой глубокий опыт в области высокоскоростных, высокочастотных печатных плат и печатных плат с высокой плотностью мощности для предоставления комплексных услуг глобальным клиентам в сфере ИИ и высокопроизводительных вычислений — от оптимизации дизайна и быстрого прототипирования до массового производства. Если вы ищете надежного партнера для вашего проекта ИИ-сервера следующего поколения, наша команда профессиональных инженеров готова оказать вам поддержку.