OCP и открытые стандарты: как меняется архитектура AI-серверов

ocpopen-computedata-centerinfrastructurenvidiastandards

Open Compute Project (OCP) — инициатива, запущенная Meta в 2011 году с целью стандартизировать серверное оборудование и убрать vendor lock-in. Пятнадцать лет спустя OCP — основа инфраструктуры гиперскейлеров, но для остального рынка картина сложнее.

ORv3: стойка нового поколения

Open Rack v3 (ORv3, текущая ревизия — v3.1) — ключевая спецификация OCP для физической инфраструктуры. Главные отличия от стандартных 19-дюймовых EIA-стоек:

  • 21-дюймовый формат — больше пространства для воздушного потока и кабельной разводки
  • 48V DC bus bar — вертикальная медная шина питания вместо традиционных кабелей, blind-mate подключение блоков питания. Токи до 2500 A при 48V, а NVIDIA предложила усиленный дизайн на 1400 A на сегмент
  • Интеграция liquid cooling — спецификация предусматривает in-rack манифолды для подвода хладоносителя к серверным cold plates с blind-mate коннекторами

48V DC — не каприз. При мощности стойки 100+ кВт (а GB200 NVL72 потребляет ~120 кВт) потери на 12V-конверсии становятся существенными. 48V снижает токи в 4 раза при той же мощности, упрощая шины и разъёмы.

NVIDIA и OCP: GB200 NVL72 в открытом доступе

В октябре 2024 NVIDIA передала в OCP электромеханические дизайны GB200 NVL72: архитектуру стойки, механику compute- и switch-треев, спецификации жидкостного охлаждения и габариты NVLink cable cartridge. Всё это — производные от модульной архитектуры NVIDIA MGX.

Партнёры — AsRock Rack, ASUS, Dell, GIGABYTE, HPE, MSI, QCT, Supermicro, Wiwynn — строят собственные варианты серверов на базе этих дизайнов. Проект Stargate (Microsoft/OpenAI, $100 млрд на AI-инфраструктуру) стандартизирует развёртывание на 48V liquid-cooled ORv3 стойках с GB200 NVL72.

Кто реально использует OCP

Рынок OCP-серверов растёт на ~22% в год (Mordor Intelligence), но потребители — преимущественно гиперскейлеры. «Большая семёрка» (Meta, Google, Amazon, Microsoft, Apple, Alibaba, ByteDance) имеет инженерные ресурсы для эксплуатации white-box оборудования. Тайваньские ODM — Foxconn, Wiwynn, Quanta, Inventec — производят 60% всех OCP-серверов.

Остальной рынок продолжает покупать Dell PowerEdge и HPE ProLiant. Причины прагматичны: 4-часовой on-site сервис, единое управление через iDRAC/iLO, проверенный софтверный стек. Dell и HPE выпускают OCP-совместимые линейки, но управляющий firmware остаётся проприетарным.

Когда OCP имеет смысл

СценарийOCPПроприетарный
Кластер 100+ узловЭкономия 15–30% на железеПереплата за управляемость
2–10 узловOverhead на интеграциюПроще и быстрее
Нестандартная конфигурацияГибкость дизайнаОграничен каталогом
Нет DC-инженеров в штатеРискованноВендорская поддержка

OCP — не замена Dell или HPE для среднего бизнеса. Это инструмент для тех, кто строит инфраструктуру на масштабе, где стоимость vendor lock-in перевешивает стоимость собственной инженерии.

Источники: