<ul id="i6e2g"><center id="i6e2g"></center></ul>
<ul id="i6e2g"></ul>

    幣圈網(wǎng)

    AMD正式發(fā)布ROCm 7開發(fā)平臺:AI訓練、推理性能暴漲至高3.8倍

    本站6月13日美國圣何塞現(xiàn)場報道——

    AMD今天正式發(fā)布了新一代AI加速卡Instinct MI350系列,硬件能力再次取得飛躍,進一步強化了面對NVIDIA的競爭力。

    但是我們知道,硬件性能和技術(shù)要想完全釋放潛力,尤其是在AI加速系統(tǒng)中,強大的軟件開發(fā)平臺是必不可少的。NVIDIA能在AI行業(yè)有如今的地位,最大的功臣和護城河就是CUDA。

    AMD也有自己的一套ROCm開發(fā)平臺,一直和NVIDIA CUDA都存在一定的差距,好在最近的進步幅度也是非常喜人的,包括對眾多AI大模型、框架的即時支持,全方位的開源。

    現(xiàn)在,我們又迎來了全新的ROCm 7版本,在最新模型與算法支持、高級AI特性、新硬件支持、集群管理、企業(yè)級特性等各方面,都再次有了長足的進步。

    訓練方面,ROCm 7支持一系列新特性,包括多個AMD開源模型、增強的AI框架、增強的內(nèi)核與算法、新的數(shù)據(jù)類型(BF16/FP8)等等。

    官方聲稱對比ROCm 6,實測在Llama 2/3.1、千問1.5等多個模型中,性能提升普遍達到了3倍乃至更高。

    推理方面,新的變化同樣不少,包括增強框架、Serving優(yōu)化、內(nèi)核與算法改進、高級數(shù)據(jù)類型(FP8/FP6/FP4/混合)等。

    性能提升同樣喜人,Llama 3.1、千問2、DeepSeek R1等模型實測平均達3.5倍,最高更是可達3.8倍。

    有了ROCm 7的加持,MI355X面對NVIDIA B200也是絲毫不弱,比如DeepSeek R1 FP8吞吐量可以領(lǐng)先達30%。

    當然這只是一個例子,AMD并未更多地對比自家新品和友商競品。

    除了數(shù)據(jù)中心、企業(yè)端,ROCm 7在消費端也有全面改進,新增原生支持Red Hat EPEL、Ubuntu、OpenSUSE等更多的Linux系統(tǒng)發(fā)行版,其中前兩者下半年實現(xiàn)。

    Windows平臺上,也新增支持PyTorch、ONNX-EP兩大框架,分別在三季度和7月份開放預覽。

    AMD還順帶介紹了下全線的消費級AI解決方案,比如移動端的銳龍AI 300系列最高可以本地端側(cè)運行240億參數(shù)大模型,銳龍AI Max 300系列更是能跑到700億參數(shù),而新一代線程撕裂者處理器、Radeon AI顯卡組合最高可以搞定1280億參數(shù)。

    鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。

    女同久久另类99精品国产| 日韩不卡手机视频在线观看| 完整观看高清秒播国内外精品资源| 午夜精品视频在线| 免费精品久久天干天干| 亚洲精品无码久久毛片| 中文字幕无码亚洲欧洲日韩| 久久精品人人做人人爽97 | 骚片AV蜜桃精品一区| 亚洲日韩精品一区二区三区| 国产精品无打码在线播放| 国产精品香蕉一区二区三区| 漂亮人妻被黑人久久精品| 久久99精品国产99久久6男男| 波多野结衣精品一区二区三区 | 国产精品自在线拍国产电影| 精品成人一区二区三区免费视频| 日韩在线视频播放免费视频完整版| 精品久久中文字幕有码| 久久精品午夜福利| 亚洲日韩乱码久久久久久| 国产精品综合视频| 99久久精品国产第一页| 久久棈精品久久久久久噜噜| 国产成人久久精品二区三区| 亚洲日韩在线中文字幕综合| 精品国产日韩亚洲一区| 国产精品妇女一二三区| 在线观看精品国产福利片尤物| 久久精品成人一区二区三区| 无码人妻精品一区二区三区久久| 国产亚洲精品自在久久| 国产日韩精品SUV| 成人精品视频一区二区三区不卡| 亚洲热线99精品视频| 国产在线精品一区二区中文| 久久r热这里有精品视频| 国产产无码乱码精品久久鸭| 一区精品麻豆入口| 婷婷国产成人精品一区二| 一区二区国产精品 |