半導體聯盟消息,AMD近日發布了旗下新一代GPU架構CDNA,面向數據中心等高性能計算業務。英偉達則有望在3月22日線上舉行的GTC 2020大會中發布新一代GPU架構Ampere。此外,更有消息稱英特爾將繼22年之后發布用于獨立顯卡的GPU架構Xe。2020年,隨著人工智能深度學習對高性能計算的需求越來越迫切,GPU正在成為芯片大廠的角力焦點。

三方角力GPU市場

在近日舉行的“金融分析師日”活動上,AMD發布了針對數據中心工作負載優化的新一代GPU架構。據了解,CDNA架構包含了第二代Infinity技術,可增強GPU和CPU之間的連接,并針對機器學習和高性能計算應用而優化,可專注于計算/張量操作,從而加速機器學習計算,而且可以通過Infinity Fabric互連的靈活設計,支持增強的企業級RAS特性與虛擬化技術。此外,它還將提供更高的能效比。AMD首席執行官Lisa Su表示,路線圖的發布意味著AMD可獲得收入上的加速增長,為股東帶來可觀的回報。

英偉達也于近日發布消息,由于擔心新冠病毒疫情,將原定于3月22日—26日舉行的GTC 2020大會改為網上舉辦??紤]到英偉達一直以來的慣例,在GTC大會上多會發布新一代計算型GPU。因此,業界預期還未露面的7nm Ampere有望面世。元大證券投資咨詢公司的一份報告指出,Ampere有望較英偉達當前采用的“圖靈”(Turing)架構性能增加50%,同時功耗減半。Ampere GPU將面向數據中心業務。

GPU一向是英特爾的弱項,雖然不乏產品推出,卻一直被集成于系統芯片當中。然而,英特爾CFO首席財務官George Davis日前確認,2020年將會推出一款面向獨立顯卡的Xe架構GPU。這是英特爾自1998年推出i740顯卡后,再次進軍獨顯市場。根據之前透露出來的信息,英特爾將要推出的獨立顯卡DG1,采用Xe架構,擁有96組EU執行單元,基礎頻率1GHz,加速頻率1.5GHz,1MB二級緩存以及3GB顯存,TDP為25W。在DG1之后,英特爾還會發布針對高端市場的DG2獨立顯卡。

競爭人工智能大市場

英偉達、AMD與英特爾三大芯片之所以如此積極的推進GPU的發展,與數據中心對高性能計算的需求密不可分。有專家分析指出,數據中心是人工智能深度學習最重要工作平臺,快速完成對海量數據的多層次、多迭代模型分析處理是其一項關鍵性的工作。從2011年人工智能研究人員首次使用英偉達GPU為深度學習加速之后,GPU就在人工智能領域發揮著巨大作用。雖然許多廠商也在開發基于FPGA或者ASIC的人工智能芯片,但目前采用GPU加速的服務器仍是數據中心的主流。

這也就使得芯片大廠不得不重視GPU的開發。2017年,英偉達推出面向數據中心業務的GPU TeslaV100 GPU,受到業界的廣泛采用。此后英偉達繼續在人工智能數據中心云端發力,研發面向不同平臺的GPU加速解決方案,今年更將推出新一代GPU架構Ampere。研觀天下報告指出,目前人工智能應用領域的發展速度快于底層芯片的發展速度,GPU是目前發展最為完善的一類人工智能芯片,是現階段人工智能應用開發的首選。英偉達憑借其GPU的先發優勢在人工智能的前端推理應用領域搶占了先機。

此前,AMD雖然也有很多GPU和顯卡產品,但采用的Vega核心本質上還是一款游戲型GPU。此次,AMD發布CDNA架構,專門針對數據中心計算進行了優化??梢钥闯觯珹MD在GPU的策略上,也正在走專業化,將面向數據中心的GPU架構與面向游戲優化的RDNA架構分開。

技術分析師Patrick Moorhead表示,數據中心GPU并不需要消費類顯卡的許多功能,比如顯示和像素引擎、光線追蹤等。計算型GPU通過刪除這些元素可以節省成本,同時又可添加更多有助數據中心性能提升的邏輯組件,比如張量計算單元等。不過在高性能數據中心部署CDNA 架構GPU之前,AMD仍需在軟件上加大投入。

競爭從工藝到架構

從技術趨勢上看,隨著數據中心深度學習對芯片處理能力以及低功耗需求的提高,GPU對制造工藝的選擇也越來越嚴苛。三大GPU公司目前基本上都選擇采用最先進的制造工藝。此前,英特爾財務官George Davis曾經表示,針對14納米制程的產能不足問題,2020年將增加更多產能填補空缺。面對2020年陸續推出的新品,英特爾勢必要想辦法解決先進工藝產能的問題。近日有消息傳出,英特爾計劃將旗下獨立顯示GPU交由臺積電6納米工藝代工。更有消息稱2022年英特爾還將采用臺積電的3納米工藝來生產。有業內人士分析,假如英特真的打算擴大外包代工份額,除了已經部分外包的芯片組之外,首先可能就是GPU,因為GPU相對CPU來說制造工藝上更為簡單,而且以往臺積電與英偉達在GPU制造上有著大量的合作,因而更有經驗。

至于AMD方面,CDNA架構GPU預計會在今年年底到明年年初面世,繼續采用7nm工藝。AMD沒有透露第二代CDNA 2的具體工藝,只說是更先進的節點,因而有可能采用5nm工藝。GPU也是先進工藝的追逐者。

此外,GPU在計算架構上的革新也十分關鍵。GPU+CPU異構架構成為面向人工智能服務器的主流架構。研觀天下指出,隨著數據處理復雜度的逐步提升,服務器采用的處理系統并非只有采用GPU,或者只采用CPU。而是由CPU和GPU組合而成的異構系統,兩種處理器各取所長,密集的處理任務交給GPU,復雜的邏輯運算交給CPU,兩種處理器協同工作,提升系統的運算速率。

AMD是目前唯一一家同時擁有x86處理器和獨立顯卡的供應商,這使其在CPU-GPU互連技術上具有優勢。AMD在CPU和GPU之間采用Infinity Fabric技術進行連接,實現內存的一致性,可以減輕許多編碼負擔。此次發布的CDNA架構便采用了第二代Infinity技術,增強了GPU和CPU之間的連接。AMD還透露第三代Infinity Fabric將具有更高的性能,包括更高帶寬、更低延遲的CPU-GPU互連,增強內存一體性能,以簡化編程。