人人狠狠综合久久亚洲-脱岳裙子从后面挺进去在线观看-午夜无码片在线观看影院-波多野结衣在线播放

AI推理能力優(yōu)于英特爾,192核!這家初創(chuàng)公司的芯片想以量取勝

來源:界面新聞| 發(fā)布日期:2023-06-09 11:00

AI推理能力優(yōu)于英特爾,192核!這家初創(chuàng)公司的芯片想以量取勝

發(fā)布192核Arm服務器芯片后,芯片初創(chuàng)公司Ampere希望拓展更多CPU市場份額,并在AI能力上戰(zhàn)勝競爭對手。

近日, Ampere首席產(chǎn)品官Jeff Wittich接受了包括界面新聞在內(nèi)的媒體采訪,解析芯片架構(gòu)并展望產(chǎn)品路線圖。

AmpereOne采用小芯片(Chiplet)設計,使用5納米工藝制造,并首次采用Ampere自研內(nèi)核,還擴展了內(nèi)存容量、帶寬和IO帶寬等,支持PCIe 5.0和DDR5規(guī)格。

據(jù)Jeff Wittich介紹,該芯片為云原生設計,意味著在芯片設計環(huán)節(jié),從核心到SoC,均考慮到云計算場景,以實現(xiàn)最好的能效。“它不是其他產(chǎn)品稍加更改而來的衍生產(chǎn)品線,更不是我們?nèi)ダ盟^的傳統(tǒng)架構(gòu),來打造出適應市場變化的產(chǎn)品。”

192核心(Core)是此次AmpereOne處理器的核心特點,為業(yè)內(nèi)最高,遠超同期英特爾、AMD兩大x86架構(gòu)廠商處理器核心數(shù)量。通常而言,處理器核心數(shù)量越多,可同時處理任務的能力越強。Ampere宣稱,192核心的AmpereOne處理器在云端環(huán)境時,可運行虛擬機的數(shù)量要遠大于同期的旗艦x86處理器,也擁有更好的能效表現(xiàn)。

隨著AmpereOne處理器的推出,Ampere已擁有Altra、AmpereOne兩大產(chǎn)品線系列,覆蓋不同計算需求。Jeff Wittich舉例,在邊緣計算場景,客戶僅需部署32核、功耗40瓦的Ampere Altra處理器。而對于在大規(guī)模數(shù)據(jù)中心環(huán)境、有更大算力需求的客戶,AmpereOne認為更高核心數(shù)可以提供更好性能。

Jeff Wittich稱,邊緣作為云端的延伸,也是Ampere關(guān)注的領(lǐng)域,其許多需求與云類似。但在部署邊緣算力上,由于供電、制冷、網(wǎng)絡、部署條件等限制,資源的限制更多。Ampere Altra高性能、低能耗的特點,可以在冷卻設備受限的場景下工作,“許多邊緣場景為了規(guī)避能耗的增加,可能還在使用原來的低性能產(chǎn)品?!彼J為,Ampere處理器將改變現(xiàn)狀。

在云端,諸如英特爾至強、AMD霄龍等處理器用于AI推理工作,是AI計算的一大主流負載,Ampere芯片同樣可應用于此?!癆mpere的產(chǎn)品不只適用于當前常見的大型語言模型,也適用于過去幾年相對舊的模型?!盝eff Wittich稱,云廠商在AI計算中追求高能效以降低成本,而GPU服務器功耗極大,成本高昂,擴展和可部署的服務器數(shù)量受到限制,Ampere可以滿足云廠商需求。

AI是當前芯片廠商重要的負載類型,生成式AI的流行加速了廠商投入。Jeff Wittich分析稱,AI訓練發(fā)生在服務器上的CPU、GPU,而AI推理在整個云端基礎(chǔ)設施中均有涉及,在負載特征上需要不斷地進行重復推理,并向用戶快速交付結(jié)果。他稱,Ampere兩年多前就組建了AI團隊。此次AmpereOne針對流媒體推薦、商品智能推薦、生成式AI等AI負載進行優(yōu)化。

根據(jù)Ampere展示的產(chǎn)品性能對比,在生成式AI負載的文本提示生成圖像模型Stable Diffusion推理中,AmpereOne以每機架性能高出2.3倍優(yōu)勢領(lǐng)先AMD霄龍9654處理器。Ampere未提供與英特爾芯片對比數(shù)據(jù)。

Ampere介紹稱,包括谷歌、微軟、甲骨文、阿里巴巴、騰訊在內(nèi)的云服務廠商,以及慧與、Supermicro等服務器廠商已經(jīng)與Ampere合作,測試或使用Ampere產(chǎn)品。

基于成本、性能考慮,云計算廠商對不同架構(gòu)處理器保持開放態(tài)度。2018年11月,亞馬遜發(fā)布基于Arm架構(gòu)的首款服務器芯片Graviton,主打性價比。亞馬遜宣稱,與主流的英特爾x86架構(gòu)CPU(中央處理器)相比,基于Graviton芯片的云服務在處理一些簡單的工作負載時,成本可最多降低45%。隨后該芯片多次迭代,性能提升數(shù)倍,可應付更多、更復雜的工作類型,至今已經(jīng)迭代多代。