Графический процессор NVIDIA Ampere A100 с TDP 250 Вт на PCIe 4.0, созданный для искусственного интеллекта, обработки данных и суперкомпьютеров, запущен с обещанной 90-процентной производительностью модели 400 Вт

Оборудование / Графический процессор NVIDIA Ampere A100 с TDP 250 Вт на PCIe 4.0, созданный для искусственного интеллекта, обработки данных и суперкомпьютеров, запущен с обещанной 90-процентной производительностью модели 400 Вт 2 минуты чтения

Nvidia



NVIDIA официально выпустила A100, графический процессор с поддержкой PCIe 4.0, основанный на архитектуре Ampere следующего поколения. Несмотря на более низкий профиль TDP 250 Вт, NVIDIA обещает, что графический процессор PCIe 4.0 Ampere A100 сможет обеспечить до 90 процентов производительности полного графического процессора A100 HGX мощностью 400 Вт. Третий вариант своего растущего семейства графических процессоров Ampere A100, A100 PCIe, предназначен для серверов, на которых работают кластеры искусственного интеллекта (AI), Data Science и Supercomputing.

NVIDIA представила вариант графического процессора A100 с интерфейсом PCI-Express 4.0. Графический процессор основан на 7-нм микроархитектуре Ampere. Кроме того, компания также анонсировала несколько систем на базе A100 от ведущих производителей серверов, включая Asus, Dell, Cisco, Lenovo и других. Графический ускоритель A100 PCIe 4.0 мощностью 250 Вт очень похож на вариант с полным TDP 400 Вт, и NVIDIA также обещает почти такую ​​же производительность, несмотря на значительное падение профиля TDP.



Графический процессор NVIDIA A100 Ampere в форм-факторе PCIe 4.0 с той же конфигурацией графического процессора A100 HGX 400 Вт, но при 250 Вт:

NVIDIA анонсировала свой GPU-ускоритель PCIe 4.0 A100 PCIe. Графический процессор Ampere доступен для разнообразного набора промышленных сценариев использования с системами от одного графического процессора A100 PCIe до серверов, использующих две карты одновременно через 12 каналов NVLINK, которые обеспечивают в общей сложности 600 ГБ / с пропускной способности межсоединения. Ускоритель GPU A100 PCIe с TDP 250 Вт не сильно меняет конфигурацию ядер по сравнению с графическим процессором A100 HGX 400 Вт.



Графический процессор GA100 имеет характеристики варианта A100 HGX мощностью 400 Вт с 6912 ядрами CUDA, размещенными в 108 SM-модулях, 432 тензорных ядрах и 40 ГБ памяти HBM2, которая обеспечивает такую ​​же пропускную способность памяти 1,55 ТБ / с (округлено до 1,6 ТБ / с). с). Однако развертывание пакета GPU на Стандарт PCIe 4.0 имел свой недостаток в виде значительного снижения TDP. Сообщается, что это означает снижение производительности от 10 до 50 процентов в зависимости от рабочей нагрузки. Более того, вариант графического процессора A100 с TDP 250 Вт больше подходит для коротких всплесков, а не для длительных нагрузок.

Графический процессор NVIDIA A100 Ampere в форм-факторе PCIe 4.0 Производительность:

Из-за значительного сокращения профиля TDP можно было предположить, что карта будет иметь более низкие частоты, чтобы компенсировать меньший вход TDP. Тем не менее, показатели производительности, которые выпустила NVIDIA, действительно удивляют, поскольку они довольно близки к варианту TDP 400 Вт. Производительность FP64 по-прежнему оценивается на уровне 9,7 / 19,5 TFLOP, производительность FP32 оценивается в 19,5 / 156/312 TFLOP (разреженность), производительность FP16 оценивается в 312/624 TFLOP (разреженность), а INT8 оценивается в 624/1248 TOP ( Редкость).



Простая математика показывает, и NVIDIA заверяет, что графический процессор A100 на базе Ampere PCIe 4.0 250 Вт может обеспечить 90 процентов производительности карты A100 HGX (400 Вт) в лучших серверных приложениях. Это оправдано, поскольку новый вариант требует меньшего времени для выполнения вышеуказанных задач. Однако числа должны быть действительными только для коротких интервалов. В сложных ситуациях, требующих стабильных возможностей графического процессора, графический процессор PCIe 4.0 мощностью 250 Вт может обеспечить от 90 до 50 процентов производительности графического процессора A100 HGX мощностью 400 Вт.

Микроархитектура Ampere, несомненно, принесет пользу новому A100. NVIDIA обещает как минимум 20-кратный прирост производительности по сравнению с предшественником на базе Volta. Графический процессор PCIe 4.0 A100 поддерживает технологию нескольких экземпляров графического процессора. Это означает, что один A100 можно разделить на семь отдельных графических процессоров для обработки различных вычислительных задач. Хотя это улучшает сегментацию, существует NVLink 3-го поколения, который позволяет объединить несколько графических процессоров в один гигантский графический процессор.

Теги nvidia