QCT QuantaGrid D76V-1U: сервер под Vera Rubin NVL72 с 3600 PFLOPS
Vera Rubin — следующая после Blackwell платформа NVIDIA, и вокруг неё уже формируется экосистема серверных вендоров. QCT (Quanta Cloud Technology) представила на GTC 2026 свой вариант: QuantaGrid D76V-1U под платформу Vera Rubin NVL72.
Что внутри
72 GPU архитектуры Rubin — это центральный элемент. Каждый GPU получает 288 ГБ HBM4: следующее поколение памяти после HBM3e с более высокой пропускной способностью и плотностью. Суммарно по памяти — более 20 ТБ HBM4 на одну стойку, что открывает возможности для inference гигантских моделей без шардирования по нескольким физическим узлам.
NVLink 6-го поколения связывает GPU внутри системы. По сравнению с NVLink 4-го поколения (использовался в Hopper) и 5-го (Blackwell), 6-е поколение — это дальнейший рост bandwidth между чипами, что критично при tensor-parallel и pipeline-parallel тренировках, где данные постоянно перекачиваются между GPU.
Сетевое подключение — ConnectX-9 SuperNIC с пропускной способностью 1,6 Тбит/с на GPU. Это удвоение по сравнению с ConnectX-8 на 800 Гбит/с, который устанавливается в текущие Blackwell-серверы. Для задач distributed training, где inter-node коммуникация напрямую влияет на scaling efficiency, это важный шаг.
Производительность
QCT заявляет 3600 PFLOPS в режиме NVFP4 inference. NVFP4 — это формат с плавающей точкой, оптимизированный NVIDIA для inference-нагрузок: меньший битрейт при сохранении достаточной точности для большинства production-сценариев. 3600 PFLOPS на один сервер — уровень, при котором один физический узел закрывает inference для очень крупных моделей без необходимости строить multi-node pipeline.
Охлаждение
100% жидкостное охлаждение — не маркетинговый термин, а требование платформы. При TDP уровня Vera Rubin воздух физически не справляется с теплоотводом в разумных габаритах. D76V-1U рассчитан на инфраструктуру с прямым жидкостным охлаждением (direct liquid cooling, DLC) — нужна подготовленная серверная с подводкой охлаждающей жидкости.
Позиционирование
QCT — ODM-производитель с многолетним опытом поставок в облачные дата-центры Microsoft, Meta и других гиперскейлеров. Для этого рынка типичны очень большие заказы и высокие требования к надёжности и однородности конфигураций. QuantaGrid D76V-1U — это не продукт для единичных инсталляций, а платформа под масштабные GPU-кластеры.
Для тех, кто смотрит на горизонт 2026–2027 и планирует строить или расширять AI-кластер: Vera Rubin NVL72 — это следующая точка технологической зрелости после Blackwell. D76V-1U от QCT — один из первых конкретных серверных продуктов под эту платформу с заявленными характеристиками, а не просто reference design.
Единственное существенное ограничение — сроки поставки. Vera Rubin ещё в процессе вывода на рынок, и реальная доступность серверов будет известна позже. Анонс на GTC означает готовность вендора, но не немедленную поставку.