巨頭“火拼”AI芯片!AMD力抗英偉達(dá)
圖源:攝圖網(wǎng)
作者|弗雷迪 來(lái)源|格隆匯APP(ID:hkguruclub)
人工智能浪潮席卷近半年,也讓英偉達(dá)一把推開(kāi)了美股萬(wàn)億俱樂(lè)部的大門(mén)。
當(dāng)初只是想在游戲圖像計(jì)算上分一杯羹的英偉達(dá),沒(méi)想到在二十多年后成為AI計(jì)算的領(lǐng)軍者,幾乎壟斷了整個(gè)AI服務(wù)器芯片市場(chǎng)。
上一個(gè)摧枯拉朽般占領(lǐng)服務(wù)器市場(chǎng)的是英特爾,但它的CPU在高性能計(jì)算上敗給了英偉達(dá)的GPU。同時(shí),英特爾在芯片制程技術(shù)上也落后于臺(tái)積電,其產(chǎn)品戰(zhàn)略一直處于被動(dòng)狀態(tài)。相比之下,領(lǐng)先的英偉達(dá)已經(jīng)一騎絕塵,而AMD也在后面緊追不舍,直抄英特爾的老窩。
隨著英偉達(dá)的成功,下一代芯片研發(fā)方向更聚焦在如何深度結(jié)合AI模型上來(lái),選擇不僅僅只有GPU,因?yàn)樘岣咚懔Φ母甙捍鷥r(jià)絕大部分要?dú)w功于AI芯片,所以英偉達(dá)在模型訓(xùn)練芯片端的領(lǐng)先地位無(wú)疑會(huì)遭受挑戰(zhàn),英特爾、AMD、高通等企業(yè)開(kāi)始摩拳擦掌,做好準(zhǔn)備。
那么,在AI芯片,會(huì)有下一個(gè)英偉達(dá)嗎?
01
AI芯片必須先過(guò)一道檻
按照部署位置,AI芯片可以分為云端、終端和邊緣側(cè);按照任務(wù)劃分又可以分為訓(xùn)練芯片和推理芯片。云端就是在數(shù)據(jù)中心進(jìn)行模型訓(xùn)練,芯片需要支撐大量的數(shù)據(jù)運(yùn)算,終端和邊緣側(cè)對(duì)算力要求稍弱一些,但要求快速響應(yīng)的能力和低功耗,英偉達(dá)霸占了訓(xùn)練芯片這一領(lǐng)域,不過(guò)推理方面不乏比GPU更合適的芯片。
性能各異的專(zhuān)用AI芯片包括GPU、ASIC、FPGA、NPU等,可以簡(jiǎn)稱(chēng)為XPU,名稱(chēng)的不同反映了各自架構(gòu)層面上的差異。專(zhuān)用AI芯片在所擅長(zhǎng)的領(lǐng)域里有匹配GPU的能力,雖然少了可擴(kuò)展性,但在效能和算力上領(lǐng)先更通用的GPU,盡管后者能做更多的事情。
這就回到了當(dāng)初CPU在機(jī)器學(xué)習(xí)領(lǐng)域被棄用的邏輯,將來(lái)是否會(huì)有一款新的芯片可以對(duì)GPU發(fā)起沖擊?
目前全球大廠(chǎng)們都尤愛(ài)造芯,不過(guò)通用芯片人家沒(méi)必要自己做,只會(huì)切合自己重要的業(yè)務(wù)方向來(lái)布局。
比如谷歌的TPU采用了ASIC,只針對(duì)卷積神經(jīng)網(wǎng)絡(luò)的加速器,特斯拉的Dojo是專(zhuān)門(mén)用于FSD的機(jī)器視覺(jué)分析芯片,以及國(guó)內(nèi)百度、阿里也花費(fèi)大量精力在自研芯片上。
一直以來(lái),專(zhuān)用處理器并未真正給GPU帶來(lái)過(guò)威脅,這主要與市場(chǎng)容量,資金投入,摩爾定律形成的正向循環(huán)有關(guān)。
根據(jù)IDC數(shù)據(jù),21年中國(guó)AI芯片市場(chǎng)里,GPU占據(jù)89%的份額;NPU處理速度比GPU快上10倍,占據(jù)9.6%的份額,ASIC和FPGA占比較小,市場(chǎng)份額分別1%和0.4%。
過(guò)去三十年,臺(tái)積電、三星等晶圓代工廠(chǎng)的崛起塑造了分工專(zhuān)業(yè)化的趨勢(shì),設(shè)備和先進(jìn)制程的技術(shù)進(jìn)步允許像英偉達(dá)、高通等芯片設(shè)計(jì)企業(yè)一展身手,也讓蘋(píng)果、谷歌等科技大廠(chǎng)開(kāi)始用芯片定義產(chǎn)品和服務(wù),專(zhuān)用芯片設(shè)計(jì)的土壤是肥沃的,大家都是受益者。
在競(jìng)爭(zhēng)對(duì)手看來(lái),GPU并非專(zhuān)門(mén)為機(jī)器學(xué)習(xí)而設(shè)計(jì)的芯片,之所以能成功,主要在于結(jié)合框架軟件層形成的復(fù)雜生態(tài),提高了芯片的通用性。
實(shí)際上,自2012年以來(lái),每年頭部訓(xùn)練模型算力需求按10倍在增長(zhǎng),一直在逼近摩爾定律下的算力極限。
而從11年Tesla M2090開(kāi)始,數(shù)據(jù)中心產(chǎn)品GPU一直在更新迭代,先后推出Volta、Ampere、Hopper等針對(duì)高性能訓(xùn)練計(jì)算和AI訓(xùn)練的架構(gòu),保持每?jī)赡晖瞥鲆淮庐a(chǎn)品的速度,浮點(diǎn)算力也從7.8 TFLOPS增至30 TFLOPS,漲幅接近4倍。
最新的H100,甚至已經(jīng)把大模型訓(xùn)練的時(shí)間從一周縮短至一天。
基于英偉達(dá)在AI芯片領(lǐng)域的高份額,可以說(shuō),過(guò)去AI模型訓(xùn)練的算力增長(zhǎng)主要由英偉達(dá)的GPU系列所支撐,這形成了一個(gè)正向反饋,隨著芯片出貨規(guī)模的增長(zhǎng),攤平了英偉達(dá)芯片的開(kāi)發(fā)成本。
相比較未來(lái)的算力需求,一款通用芯片的技術(shù)迭代最終也會(huì)逐漸放緩,專(zhuān)用處理器只有跑通這個(gè)正向循環(huán),才有可能在成本上與通用芯片們并駕齊驅(qū)。
不過(guò)難度在于,專(zhuān)用處理器僅僅著力在細(xì)分市場(chǎng),市場(chǎng)規(guī)模根本比不上通用市場(chǎng),相對(duì)于通用芯片的每單位性能提升,往往需要花上更長(zhǎng)的時(shí)間,或者更大的出貨量來(lái)攤薄成本,可是隨著AI在應(yīng)用場(chǎng)景中加速滲透,未來(lái)AI芯片的開(kāi)支也會(huì)大幅增長(zhǎng),專(zhuān)用AI芯片、 CPU、GPU有望成為三條并行的線(xiàn)。
根據(jù)Precedence Research,2022年全球AI芯片市場(chǎng)規(guī)模為168.6億美元,將以每年約30%的速度增長(zhǎng),預(yù)計(jì)到2032年達(dá)到約2274.8億美元。
02
三家分晉,如何分庭抗禮?
英偉達(dá)對(duì)算力的壟斷地位在如今大模型戰(zhàn)爭(zhēng)下加速?gòu)?qiáng)化,矛盾日益加劇,GPU采購(gòu)需求超出臺(tái)積電和英偉達(dá)的預(yù)料,供應(yīng)不足,價(jià)格便水漲船高,繼續(xù)循環(huán)。
國(guó)內(nèi)外科技大廠(chǎng)們?cè)谶x擇自研芯片上保持一致的態(tài)度,又或者,幫助其他芯片廠(chǎng)和英偉達(dá)競(jìng)爭(zhēng),刺激新的供給同時(shí)降低芯片成本。
上月初AMD盤(pán)中大漲12%,原因來(lái)自一則消息指出,微軟正在與AMD合作,資助后者向AI芯片擴(kuò)張,并與這家芯片制造商合作一款代號(hào)為Athena(雅典娜)的芯片,但之后微軟官方否認(rèn)了這一消息。
這讓人聯(lián)想到上世紀(jì)九十年代的“WINTEL”聯(lián)盟,互相成就了微軟在PC操作系統(tǒng),以及英特爾在CPU的地位。此時(shí)的AMD,已經(jīng)成為了英特爾市場(chǎng)份額最強(qiáng)有力的威脅。
去年計(jì)算機(jī)市場(chǎng)經(jīng)受重創(chuàng),企業(yè)服務(wù)器和消費(fèi)電子兩端的疲弱對(duì)CPU出貨量造成不小拖累,英特爾與AMD兩家公司均出現(xiàn)了30多年來(lái)最大的下滑,分別降低21%和19%。
雖然主業(yè)俱顯疲態(tài),但行業(yè)的競(jìng)爭(zhēng)格局卻再次發(fā)生了巨大變化。
據(jù)Passmark數(shù)據(jù)監(jiān)測(cè),在數(shù)據(jù)中心市場(chǎng),去年AMD的份額猛增至20%,搶走了英特爾(2022年,70.77%)接近1成的份額,而截止今年1月2日,AMD重新逼近40%,回到了2004年的水平。
AMD之所以得以窮追不舍,一方面是借助臺(tái)積電的力量,讓其產(chǎn)品組合不斷優(yōu)化,用于數(shù)據(jù)中心的EPYC Milan處理器采用率提高,去年這項(xiàng)業(yè)務(wù)營(yíng)收增長(zhǎng)64%。
另一方面則與競(jìng)爭(zhēng)對(duì)手糟糕的戰(zhàn)略決策有關(guān)。過(guò)去十年,一直保持領(lǐng)先地位的英特爾在CPU上的創(chuàng)新乏善可陳,產(chǎn)品力相對(duì)競(jìng)爭(zhēng)對(duì)手一路下滑。
當(dāng)初蘋(píng)果想要英特爾為初代iPhone開(kāi)發(fā)手機(jī)CPU,CEO保羅·歐德寧因?yàn)閳?bào)價(jià)太低回絕,這位x86領(lǐng)頭羊錯(cuò)估了移動(dòng)端的機(jī)會(huì)。
除了戰(zhàn)略眼光不足,還有不斷跳票的產(chǎn)品推新計(jì)劃,英特爾是舊IDM時(shí)代的老頭,如今臺(tái)積電、三星領(lǐng)導(dǎo)著先進(jìn)制程的迭代,是CPU這類(lèi)通用芯片繼續(xù)升級(jí)的基座,英特爾本身工藝技術(shù)的掉隊(duì)反噬著產(chǎn)品的更新節(jié)奏,更多的是“擠牙膏”式的添頭。從2021年高點(diǎn)至今,其市值削去了一半不止。
反觀AMD,則一路拓寬產(chǎn)品品類(lèi),追逐高性?xún)r(jià)比的策略,先后收購(gòu)了ATI,Xilinx,成為第一家同時(shí)拿下CPU+GPU+FPGA的芯片廠(chǎng)商。2018年AMD在PC端的CPU制程首次彎道超車(chē),市場(chǎng)份額開(kāi)始加速提升,2019年聯(lián)手臺(tái)積電率先躍入7nm,在服務(wù)器端也實(shí)現(xiàn)制程超越,去年市值超過(guò)了英特爾。
前不久,AMD推出結(jié)合CPU+GPU雙架構(gòu)的Instinct MI 300正式進(jìn)軍AI訓(xùn)練端,這款芯片在規(guī)格和性能直接對(duì)標(biāo)了英偉達(dá)的Grace Hopper。
這是AMD管理層強(qiáng)調(diào)AI作為戰(zhàn)略重點(diǎn)后的重棋,與英偉達(dá)同時(shí)出租自家算力不同,AMD著力于構(gòu)建具有競(jìng)爭(zhēng)力的芯片矩陣,與其正面交鋒,或?qū)脑茝S(chǎng)商的數(shù)據(jù)中心開(kāi)始突破,預(yù)計(jì)今年四季度開(kāi)始放量。
實(shí)際上,并不是這兩CPU巨頭打架,把英偉達(dá)晾在一邊,結(jié)果趕不上趟兒。
英特爾從2015年開(kāi)始花巨資收購(gòu)了一大批人工智能公司,如Altera、Mobileye、Nervana等,結(jié)果并沒(méi)有給業(yè)務(wù)帶來(lái)多少幫助,更像是養(yǎng)著這些公司等著刮彩票。
英特爾也一直計(jì)劃推出一款能媲美英偉達(dá)的GPU,只是計(jì)劃一直跳票。
2021年,英特爾曾宣布一款代號(hào)為“Ponte Vecchio”的旗艦GPU,用于數(shù)據(jù)中心,結(jié)果卻在交付上不斷拖延。作為繼任者,F(xiàn)alcon Shores GPU結(jié)合了x86 CPU和Xe GPU,也跳票到了2025年。
誠(chéng)然,英偉達(dá)的成功并不只是硬件做得好,有別于英特爾過(guò)去硬件第一的路徑,英偉達(dá)GPU架構(gòu)保持了兩年一代的速度演進(jìn),憑借著通用的計(jì)算框架構(gòu)筑起了軟件生態(tài)壁壘。
芯片發(fā)展歷程中,定義標(biāo)準(zhǔn)的贏家往往強(qiáng)者恒強(qiáng),要與英偉達(dá)分庭抗禮,性?xún)r(jià)比是必需砝碼,生態(tài)圈同樣關(guān)鍵。算力發(fā)展推動(dòng)AI進(jìn)步,還要倚仗這些廠(chǎng)商的競(jìng)爭(zhēng)和互相超越。
在這些方面,無(wú)論是AMD、英特爾,還是其他的后來(lái)者大廠(chǎng),都還有很長(zhǎng)的路要走。(全文完)
編者按:本文轉(zhuǎn)載自微信公眾號(hào):格隆匯APP(ID:hkguruclub),作者:弗雷迪
前瞻經(jīng)濟(jì)學(xué)人
專(zhuān)注于中國(guó)各行業(yè)市場(chǎng)分析、未來(lái)發(fā)展趨勢(shì)等。掃一掃立即關(guān)注。