HPE занимает 18 первых мест в MLPerf Inference v6.0
HPE заняла 18 первых мест в MLPerf Inference v6.0 — звучит внушительно, но без контекста эта цифра мало что говорит. Разбираем, что именно стоит за этими числами: какие платформы участвовали, по каким задачам и конфигурациям, и что это значит для тех, кто выбирает AI-серверы.
Как устроена система рейтингов в MLPerf
MLPerf не выстраивает единую таблицу лидеров. Вместо этого каждая комбинация из четырёх переменных — задача (модель), сценарий (Offline/Server), размер системы (число ускорителей), и accelerator — образует отдельную категорию. Это значит, что «18 первых мест» — это 18 конкретных категорий, где HPE показала лучший результат среди всех участников.
Это честный способ считать: нет единого победителя, есть лучший на каждом конкретном типе нагрузки.
Какие платформы HPE участвовали
Основную долю результатов принёс ProLiant DL385 Gen11 — двухпроцессорный сервер на AMD EPYC 9004 (Genoa) с поддержкой до 8 GPU PCIe. В раунде v6.0 он конфигурировался с AMD Instinct MI325X — это прямой предшественник MI355X, тоже на HBM3, но с чуть меньшим объёмом памяти на борту.
Отдельные категории закрыл ProLiant DL380 Gen11 с NVIDIA H100 PCIe и Cray XD670 — HPC-платформа HPE с NVLink-соединением GPU, предназначенная для high-density кластеров.
Такая разбивка по платформам — намеренная стратегия HPE: покрыть как можно больше категорий бенчмарка разными конфигурациями, а не концентрировать усилия на одной.
По каким задачам лидируют
Большинство из 18 первых мест сосредоточены в задачах на моделях среднего размера — Llama-3.1 70B и Mistral 7B — в конфигурациях с 8 GPU в сценарии Offline. Именно здесь DL385 Gen11 с MI325X показывает лучшее соотношение вычислений к пропускной способности памяти.
По задаче GPT-OSS 120B HPE представила результаты с Cray XD670 на H100 SXM — это уже другой ценовой сегмент, ориентированный на HPC-заказчиков.
Что это значит для выбора платформы
HPE — не производитель GPU, а системный интегратор. Поэтому их результаты в MLPerf важны с другого угла: они показывают, насколько хорошо конкретные серверные платформы раскрывают потенциал GPU от AMD и NVIDIA.
18 первых мест на ProLiant DL385 Gen11 с MI325X — это фактически сертификация того, что эта платформа оптимально настроена для данного GPU. Если вы рассматриваете эту конфигурацию для своего кластера, результаты MLPerf служат воспроизводимой базой для расчёта ROI: конкретная модель, конкретная задача, конкретные числа throughput и latency.
Для enterprise-закупщиков, которые предпочитают работать с одним вендором для hardware и поддержки, 18 первых мест — это ещё и аргумент в переговорах с IT-отделом. MLPerf не субъективен: каждый результат воспроизводим.