咨詢電話
021-80392549
每年升級的Grace與Hopper
與發(fā)布消費(fèi)級CPU的AMD不同,英偉達(dá)在此次Computex上的內(nèi)容則更加ToB一些,尤其是數(shù)據(jù)中心。今年年初,英偉達(dá)公布了GraceCPU、HopperGPU等一系列數(shù)據(jù)中心產(chǎn)品,支持不同的配置選項(xiàng),給到了極高的靈活性。作為CPU+GPU配置的忠實(shí)擁護(hù)者,英偉達(dá)打算將這個戰(zhàn)略方針貫徹到底。
此次Computex上,英偉達(dá)宣布,其數(shù)據(jù)中心產(chǎn)品將每兩年更新一次架構(gòu),每年更新一批產(chǎn)品,一年針對Arm,一年針對x86。與此同時,英偉達(dá)也針對數(shù)據(jù)中心公布了四項(xiàng)Grace參考設(shè)計(jì),分別是面向云游戲的CGX、面向數(shù)字孿生與Omniverse的OVX、用于HPC或用于AI訓(xùn)練推理的HGX。
Grace數(shù)據(jù)中心參考設(shè)計(jì)/ 英偉達(dá)
CGX集成了GraceSuperchipCPU,雖是用于云游戲場景,但該設(shè)計(jì)并未集成英偉達(dá)的消費(fèi)級GPU,而是采用了面向虛擬桌面VDI應(yīng)用 A16 GPU,這種選擇也很好理解,云游戲追求的就是高密度和低擁有成本,A16 GPU可以完美這一要求。
由于數(shù)字孿生與Omniverse的工作負(fù)載不盡相同,小到對一個物體的復(fù)制,大到對整個地球的數(shù)字孿生,所以O(shè)VX支持多種英偉達(dá)GPU。同樣為了減輕網(wǎng)絡(luò)計(jì)算的壓力,CGX與OVX都用到了BlueField-3 DPU。
HGX則分為兩種,一種是主打HPC,一種主打AI訓(xùn)練與推理,前者的瓶頸主要在CPU上,所以僅配置了GraceSuperchipCPU,而后者則更需要CPU+GPU的強(qiáng)強(qiáng)聯(lián)手,因此,選擇了GraceHopperSuperchip。此外,由于HPC領(lǐng)域不少客戶用的都是OEM定義的IO系統(tǒng),所以并沒有綁定自家的NVlink,至于AI訓(xùn)練推理這類所需帶寬更高的場景,英偉達(dá)的第四代NVlink技術(shù)無疑是提供最高性能的首選。
不過Grace與Hopper要想量產(chǎn)還得等到明年,今年數(shù)據(jù)中心的主角無疑還是A100,而這次A100也迎來了更新。
數(shù)據(jù)中心的GPU也要液冷散熱
在數(shù)據(jù)中心中,有著這么一個指標(biāo),名為PowerUsageEffectiveness功耗使用效率,簡稱PUE。PUE等于數(shù)據(jù)中心的總能耗/IT設(shè)備能耗,總能耗中包含了散熱和配電等系統(tǒng)的能耗,因此PUE值越接近于1,證明該數(shù)據(jù)中心的能效水平越高。降低這一指標(biāo)的方式有很多種,其中之一就是從散熱入手。
改善散熱的一種方式是改善數(shù)據(jù)中心的散熱系統(tǒng),另一種則是改善IT設(shè)備本身的散熱系統(tǒng)。而英偉達(dá)的GPU此前均是風(fēng)冷散熱,而這次英偉達(dá)決定先拿數(shù)據(jù)中心賣得最火熱的A100來嘗試液冷散熱。
液冷A100 PCIeGPU / 英偉達(dá)
Equinix率先測試了液冷版的A100 80GBPCIeGPU,并與風(fēng)冷版的A100進(jìn)行了對比。在對比過程中,單個液冷機(jī)架的功耗達(dá)到了30kW,是15kW風(fēng)冷機(jī)架的兩倍,然而由于液冷的A100只需占據(jù)一個PCIe插槽,而風(fēng)冷版的A100需要兩個,所以同樣的空間內(nèi)可以放置兩倍的計(jì)算資源。
最終得出的結(jié)果中,用了液冷的A100機(jī)架數(shù)量可以減少至三分之一,功耗也降低了28%。正是因?yàn)檫@樣的散熱節(jié)能,液冷A100將PUE從風(fēng)冷GPU的1.6降低至了1.15。很明顯,各國的能效方案已經(jīng)開始望向數(shù)據(jù)中心,英偉達(dá)也必須緊跟這一節(jié)能減排的趨勢。而明年正式推出的HGX Grace和HGX GraceHopper,也將推出風(fēng)冷和液冷兩種版本。
頂配AMR
為了推行其機(jī)器人仿真與數(shù)據(jù)生成軟件IsaacSim,英偉達(dá)也公布了其IsaacNovaOrinAMR機(jī)器人開發(fā)套件的更多情報。該設(shè)計(jì)集成了兩個JetsonAGX Orin芯片,加上兩個立體鏡頭、兩個廣角鏡頭、2個2D雷達(dá)、8個超聲波傳感器和一個3D激光雷達(dá),可以說是頂級硬件配置的AMR了。
除了IsaacSim以外,這一開發(fā)套件與英偉達(dá)旗下的其他軟件框架完美契合,包括路線優(yōu)化cuOPT、視頻數(shù)據(jù)分析的Metropolis,以及新增的DeepMap。英偉達(dá)于去年收購了高精地圖企業(yè)DeepMap,如今已經(jīng)開始相關(guān)技術(shù)的集成,結(jié)合傳感器數(shù)據(jù),DeepMap的技術(shù)可以加速3D地圖的創(chuàng)建、部署和動態(tài)更新。由此來看,英偉達(dá)是打算從自動駕駛和機(jī)器人雙向發(fā)力了,OrinSoC和DeepMap能在這兩個領(lǐng)域都發(fā)揮最大的潛力。