Supermicro первым показал CMX-сервер на NVIDIA BlueField-4 STX

supermicronvidiabluefieldstxinferencebare-metalstorage

На GTC 2026 NVIDIA представила новую модульную архитектуру STX, и Supermicro оказался в числе первых, кто показал на ней реальное железо. Речь идёт о прототипе CMX (context memory) storage сервера — платформы, которая объединяет GPU, BlueField-4 DPU и высокоскоростное хранилище в единую связку для ускорения всего цикла AI-задач: от обучения до инференса.

Что такое NVIDIA STX

STX — это не просто следующее поколение GPU. Это модульная платформа, где GPU, DPU и хранилище проектируются как единое целое, а не собираются из независимых компонентов постфактум. BlueField-4 DPU в этой схеме берёт на себя управление сетевым трафиком, разгружает хост-процессор и обеспечивает прямой доступ к NVMe-накопителям с минимальными задержками.

Ключевая идея CMX — держать контекст моделей (KV-cache, активации, промежуточные состояния) как можно ближе к вычислениям. Когда мы говорим об инференсе длинных контекстов или запуске нескольких моделей параллельно, узкое место чаще всего не в FLOPS, а в пропускной способности памяти и хранилища. CMX-архитектура как раз атакует этот bottleneck.

Почему first-to-market важно

Supermicro традиционно держит курс на скорость вывода продуктов для NVIDIA-платформ. Статус first-to-market в данном случае означает, что они работали с NVIDIA в рамках референсного дизайна STX с самого начала, а не адаптировали уже готовую спецификацию. Для заказчиков это практически значит, что тестировать железо можно раньше, чем конкуренты выпустят свои версии.

Это особенно актуально для тех, кто строит inference-кластеры под длинный контекст — RAG-системы, агентные пайплайны, мультимодальные модели. Именно там CMX-подход даёт наибольший выигрыш: снижает latency при обращениях к KV-cache и позволяет масштабировать хранилище независимо от GPU-ресурса.

Что пока неизвестно

Supermicro анонсировал прототип, но не назвал конкретных характеристик: ёмкость NVMe-пула, интерфейсы подключения, форм-фактор шасси. Бенчмарков в пресс-релизе тоже нет. По сути, пока мы видим заявку на позицию в новом сегменте — CMX-хранилищ для AI-кластеров, — но детальные спецификации придут позже, когда продукт будет ближе к commercial availability.

Тем не менее направление понятно: хранилище перестаёт быть периферией и становится частью compute-платформы. BlueField-4 как «умный» коммутатор между GPU и NVMe — это шаг к тому, чтобы убрать лишние хопы на пути данных и дать моделям доступ к расширенному контексту без деградации производительности.

Следить за апдейтами стоит особенно тем, кто планирует обновление inference-инфраструктуры под новые поколения LLM с контекстами от 128K токенов и выше.