Выпущен стек Radeon Open Compute «ROCm» v3.1 с RAS для 7-нм Vega, поддержкой SLURM для лучшего управления ресурсами, но Navi все еще отсутствует

Оборудование / Выпущен стек Radeon Open Compute «ROCm» v3.1 с RAS для 7-нм Vega, поддержкой SLURM для лучшего управления ресурсами, но Navi все еще отсутствует 2 минуты на чтение

AMD Radeon



Выпущена новая версия стека Radeon Open Compute или «ROCm» имеется в наличии для скачивания. Radeon Open Compute v3.1 имеет несколько функций, но, как ни странно, поддержка AMD Navi, а также GFX10 все еще отсутствует.

ROCm, наиболее широко распространенная универсальная платформа для вычислений с ускорением на GPU, теперь находится в версии 3.1. Последнее обновление модульной платформы, которое позволяет поставщикам оборудования создавать драйверы, поддерживающие структуру ROCm, включает некоторые долгожданные функции, такие как поддержка RAS для 7-нм Vega и поддержка SLURM для графических процессоров AMD. Однако по пока неизвестным причинам ROCm все еще не полностью поддерживает архитектуру AMD Navi следующего поколения.



Что нового в Radeon ROCm v3.1:

Самое большое и наиболее очевидное изменение в новой установке Radeon ROCm v3.1 - это структура каталога установки ROCm. При новой установке инструментария ROCm пакеты устанавливаются в / opt / rocm- папка. Ранее пакеты инструментов ROCm были установлены в / opt / rocm папка.



В новой версии ROCm улучшена поддержка надежности, доступности и удобства обслуживания (RAS) для 7-нм графических процессоров Vega. Эта 7-нанометровая работа Vega предположительно находится под микроскопом еще для «Арктур» на базе Vega вычислительный ускоритель появится в этом году. Поддержка включает:



  • UMC RAS ​​- HBM ECC (введение неисправимой ошибки), удаление страниц, восстановление RAS через сброс графического процессора (BACO)
  • GFX RAS - GFX, MMHUB ECC (введение неисправимой ошибки), восстановление RAS через сброс графического процессора (BACO)
  • PCIE RAS - PCIE_BIF ECC (введение неисправимой ошибки), восстановление RAS через сброс графического процессора (BACO)

Radeon ROCm v3.1 также получает поддержку SLURM для графических процессоров AMD. SLURM или Простая утилита Linux для управления ресурсами - одна из наиболее предпочтительных и часто используемых систем управления кластерами и планирования заданий для кластеров Linux. SLURM предпочтительнее из-за того, что он имеет открытый исходный код, отказоустойчив и хорошо масштабируется.

Эта система теперь может хорошо взаимодействовать с графическими процессорами AMD. Последняя версия 20.02.0 SLURM включает плагины AMD, которые позволяют SLURM автоматически обнаруживать и настраивать графические процессоры AMD. Он также собирает и сообщает об энергопотреблении графических чипов. Поддержка SLURM - полезное дополнение, учитывая растущее число развертываний суперкомпьютеров с использованием графических процессоров Radeon и других более крупных кластеров графических процессоров AMD.

Несмотря на включение нескольких функций, все еще нет никаких признаков поддержки GFX10 / Navi в ROCm. В Страница GitHub для ROCm был обновлен, чтобы отразить все изменения, примечания по установке и известные проблемы.



Теги и