英偉達(dá)高山仰止的優(yōu)勢,是如何建立起來的?中國芯片行業(yè)在這座大山面前,除了仰望,還有什么機(jī)會?
從上世紀(jì)末開始創(chuàng)業(yè),到市值突破萬億美元,英偉達(dá)(NVIDIA)用了20多年的時間。如今的英偉達(dá)芯片,不僅成為人工智能大模型訓(xùn)練最好的加速器,更成為市場上可以抵押變現(xiàn)的硬通貨。隨著主流AI廠商都進(jìn)入了“千億參數(shù)時代”,英偉達(dá)的GPU成了AI“軍備競賽”上的必備武器。盡管A100的價格一路上漲,但市面上幾乎“一卡難求”。
8月23日,英偉達(dá)公布其截至2023年7月31日的最新季度財報顯示,當(dāng)季公司營收創(chuàng)歷史新高,達(dá)135.1億美元,同比增
長101%;凈利潤達(dá)61.88億美元,同比增長843%;其毛利率也達(dá)到驚人的70.1%。利潤太高了,高到讓人咋舌。在這一領(lǐng)域,英偉達(dá)確實(shí)沒有對手。因?yàn)闃I(yè)績的超預(yù)期表現(xiàn),英偉達(dá)市值再創(chuàng)新高,達(dá)1.16萬億美元。財報發(fā)布后的盤后交易中,英偉達(dá)股價更是一度漲超10%,股價上漲直接破了500美元。
英偉達(dá)最大的優(yōu)勢,就是其GPU芯片因?yàn)樵趫D形計算方面的性能優(yōu)勢,成為大模型訓(xùn)練和部署的核心部件。當(dāng)算力已經(jīng)成為一眾云廠商發(fā)展大模型、爭奪客戶的戰(zhàn)略級資源的時候,全球AI公司算力的比拼已經(jīng)變成了有多少英偉達(dá)GPU芯片的比拼。國內(nèi)百度、字節(jié)、阿里、騰訊等大型科技公司,也被媒體爆出向英偉達(dá)下了總計50億美元的A800芯片訂單。其中,只有10億美元的貨能趕在年內(nèi)交付,另外八成訂單也要等到2024年才能陸續(xù)交付。
美銀證券半導(dǎo)體分析師維韋克 · 阿里亞甚至將英偉達(dá)的AI芯片,比作“硅谷的硬通貨”。由英偉達(dá)領(lǐng)投的云初創(chuàng)公司CoreWeave近期宣布融資23億美金,其給予投資機(jī)構(gòu)的抵押物正是其擁有的英偉達(dá)GPU。
那么,英偉達(dá)高山仰止的優(yōu)勢,是如何建立起來的?中國芯片行業(yè)在這座大山面前,除了仰望,還有什么機(jī)會?
1993年,在AMD和LSI Logi打了幾年工后,黃仁勛開始創(chuàng)業(yè),專攻圖形處理器,他給公司起名NVIDIA,起源于Invidia,即古希臘泰坦神Nemesis的羅馬名字,是仇恨和嫉妒的化身。黃仁勛看重的是單詞的前兩個字母N和V,即next version(下一代),代表了他想要主導(dǎo)未來技術(shù)趨勢的抱負(fù)。
在經(jīng)歷了兩代產(chǎn)品NV1和NV2的失敗后,NVIDIA靠1997年4月推出的第三代產(chǎn)品NV3即Riva 128站穩(wěn)了腳跟,此后推出了一系列顯示芯片把市面上所有的競爭對手打得找不著北,1999年推出的GeForce 256,更是號稱世界上第一款GPU。開創(chuàng)了個人電腦業(yè)即時的圖形顯示標(biāo)準(zhǔn)。
在微軟提出統(tǒng)一渲染架構(gòu)之后,英偉達(dá)果斷的把自己從前的GPU架構(gòu)推倒重來。其GPU流處理器被進(jìn)行了細(xì)致的分組,變成一個個小型流處理器且能單獨(dú)運(yùn)行,解決了流處理器此前被綁定無法獨(dú)立運(yùn)行而被迫閑置的問題。英偉達(dá)當(dāng)時的競爭對手ATI,因?yàn)樵缙跊]有投入硬件架構(gòu)變革,沿用過去的串行設(shè)計,最后成功被英偉達(dá)擠出顯卡市場。
此后,依靠為微軟Xbox和索尼PlayStation提供顯示芯片,英偉達(dá)成為消費(fèi)電子市場中芯片龍頭之一。
2006年,英偉達(dá)推出了CUDA(Compute Unified Device Architecture)架構(gòu),這是一種GPU計算平臺和編程模型。CUDA提供了一個簡單且靈活的編程模型,包括核函數(shù)的調(diào)用、內(nèi)存管理、線程同步等功能,使得開發(fā)人員能夠更輕松地利用GPU的并行計算能力,開發(fā)高性能的通用計算應(yīng)用程序。CUDA架構(gòu)的推出,使得英偉達(dá)的GPU在多個領(lǐng)域得以應(yīng)用,包括科學(xué)計算、數(shù)據(jù)分析、深度學(xué)習(xí)、虛擬現(xiàn)實(shí)等。這些領(lǐng)域?qū)τ诟咝阅苡嬎愫筒⑿刑幚淼男枨蠛芨?,英偉達(dá)的GPU提供了強(qiáng)大的計算能力和優(yōu)化工具。通過與軟件開發(fā)商、研究機(jī)構(gòu)、學(xué)術(shù)界等眾多合作伙伴建立緊密的合作關(guān)系,共同推動了CUDA生態(tài)系統(tǒng)的發(fā)展,并為開發(fā)者提供了更多的資源和支持,英偉達(dá)更進(jìn)一步擴(kuò)大了CUDA的影響力和應(yīng)用范圍。
2007年,英偉達(dá)在美國加州圣克拉拉市舉辦了第一屆CUDA技術(shù)大會,當(dāng)時CUDA已經(jīng)初步建立了生態(tài)系統(tǒng),包括圍繞CUDA平臺形成的一系列支持軟件、工具和硬件設(shè)備等資源的集合。然而,這個時候的CUDA生態(tài)系統(tǒng)還不夠完善,并且缺乏市場的廣泛認(rèn)可。
隨著時間的推移,CUDA的生態(tài)系統(tǒng)逐漸發(fā)展壯大。NVIDIA積極與軟件開發(fā)商、硬件制造商以及學(xué)術(shù)界合作,提供更多的支持和資源,也逐漸涌現(xiàn)出了許多基于CUDA的各種應(yīng)用程序、庫和工具。到了2010年左右,CUDA開始受到市場的真正認(rèn)可。這歸功于CUDA在高性能計算領(lǐng)域的卓越表現(xiàn)和廣泛應(yīng)用。越來越多的科研機(jī)構(gòu)、大學(xué)和企業(yè)意識到CUDA的潛力,并開始使用CUDA進(jìn)行加速計算。此外,NVIDIA持續(xù)改進(jìn)和推出新的GPU產(chǎn)品,以滿足不同領(lǐng)域的需求,也為CUDA贏得了更多的用戶和市場份額。一位投資人說,CUDA在一段時間內(nèi)看不到落地的場景,但在試錯過程中它建立起了完整的生態(tài),并在一股新風(fēng)向襲來的時候,成功站上了風(fēng)口。
2012 年,AI研究者發(fā)現(xiàn)了CUDA,他們發(fā)現(xiàn),基于CUDA架構(gòu)的大規(guī)模并行運(yùn)算芯片Tesla,在人工智能、深度神經(jīng)網(wǎng)絡(luò)技術(shù)上有著天然的契合性,大大降低了訓(xùn)練神經(jīng)網(wǎng)絡(luò)等高算力模型的難度,此時提供算力基礎(chǔ)設(shè)施的英偉達(dá)在多年的苦熬之后,終于迎來了勝利的曙光。在人工智能和深度學(xué)習(xí)應(yīng)用中,英偉達(dá)的GPU專門設(shè)計的Tensor Cores能夠加速矩陣運(yùn)算,從而提高深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和推理速度。這使得英偉達(dá)GPU成為許多機(jī)器學(xué)習(xí)和人工智能項(xiàng)目的首選。
2017 年虛擬貨幣價格飛漲,以太坊和比特幣礦工大量使用英偉達(dá)圖形芯片加入挖礦大軍。為了加速挖礦,不少礦工同時使用上百張顯卡,加上全天 24 小時連續(xù)運(yùn)行導(dǎo)致電子元件壽命大幅縮減,全球顯卡銷量一時劇增。其旗艦產(chǎn)品賣得斷了貨。向加密貨幣礦工出售芯片,每季度賺得數(shù)億美元。
從2016年到2018年9月,英偉達(dá)市值一路高歌猛漲,從140億美元猛增到1750億美元,成為新業(yè)界神話。New Street Research報告,自 2021 年以來,礦工購買 30 億美元顯卡。英偉達(dá)市值再次大漲,突破5千億美元。與臺積電一起成為業(yè)界唯二超過 5 千億美元市值的半導(dǎo)體公司。
隨著晶圓制程已經(jīng)逼近原子量級,每18個月單位面積上的晶體管數(shù)量可以翻一番的“摩爾定律”已經(jīng)走向失效,但是黃仁勛提出的GPU將推動AI性能實(shí)現(xiàn)逐年翻倍的“黃氏定律”,依然穩(wěn)步前行。NVIDIA GTC 2020中國線上大會上,NVIDIA首席科學(xué)家Bill Dally說,“如果我們真的想提高計算機(jī)性能,黃氏定律就是一項(xiàng)重要指標(biāo),且在可預(yù)見的未來都將一直適用。”
由于英偉達(dá)每一代新的GPU架構(gòu)都提供了更高的性能和更豐富的功能,使得開發(fā)者能夠開發(fā)出更復(fù)雜、更高效的應(yīng)用程序。強(qiáng)大的生態(tài)系統(tǒng),CUDA架構(gòu)的開放性和工具支持吸引了眾多開發(fā)者和合作伙伴的參與,使得CUDA成為一個廣泛應(yīng)用的GPU計算平臺。這種生態(tài)系統(tǒng)的發(fā)展又進(jìn)一步促進(jìn)了英偉達(dá)GPU的創(chuàng)新和市場份額的增長,形成了良性循環(huán)。
英特爾一位資深芯片專家介紹,過去那么多年,NVIDIA的GPU把生態(tài)建立完整以后,已經(jīng)占領(lǐng)了百分之七八十的市場,無論是開發(fā)者還是使用者,都已經(jīng)習(xí)慣了英偉達(dá)產(chǎn)品上的使用,從絕對性能和每瓦性能來講,確實(shí)是行業(yè)最領(lǐng)先的,加上它是fabless的架構(gòu),他們只需要做產(chǎn)品和設(shè)計,然后臺積電提供先進(jìn)的制程去實(shí)現(xiàn),英偉達(dá)在產(chǎn)品迭代的過程中,又非常高效。
國內(nèi)一家GPU獨(dú)角獸的相關(guān)負(fù)責(zé)人介紹,首先是硬件上,英偉達(dá)的最大優(yōu)勢在于芯片設(shè)計的相關(guān)經(jīng)驗(yàn)以及與臺積電等供應(yīng)鏈企業(yè)的深度合作,特別是在芯片的通用性設(shè)計上具有很大的優(yōu)勢。而供應(yīng)鏈上的優(yōu)勢,則是國內(nèi)廠商很難去匹敵的,比如英偉達(dá)擁有足夠的技術(shù)實(shí)力與臺積電開展先進(jìn)制程上的聯(lián)合研發(fā),從而以4nm制程制造最新的產(chǎn)品,領(lǐng)先國內(nèi)企業(yè)一代,包括HBM3、PCIE Gen5等最新的內(nèi)存、接口等技術(shù),英偉達(dá)都能率先獲取和使用,并獲得更高的議價權(quán)。
其次是軟件生態(tài),英偉達(dá)的CUDA生態(tài)是英偉達(dá)對標(biāo)國內(nèi)廠商的最大優(yōu)勢。目前CUDA有400萬開發(fā)者,基本壟斷了GPU的軟件生態(tài)。下游廠商的開發(fā)者基本都使用CUDA進(jìn)行應(yīng)用開發(fā),這也是英偉達(dá)硬件產(chǎn)品能夠壟斷市場的關(guān)鍵之一。軟件生態(tài)的建立和發(fā)展沒有捷徑,只有通過大量時間、投入和用戶反饋的積累才能做到,英偉達(dá)的CUDA生態(tài)做了20多年,已經(jīng)形成了壁壘。
身為獨(dú)立顯卡起家的公司,英偉達(dá)先是搭上AI東風(fēng),又廣泛用于“挖礦”,再然后智能車產(chǎn)業(yè)崛起,車用芯片業(yè)務(wù)也迅速生長。這讓英偉達(dá)避開大部分公司都煩惱的行業(yè)周期:游戲業(yè)不景氣時,可以靠AI產(chǎn)業(yè)需求補(bǔ)上,AI虛火褪去時,可用汽車業(yè)務(wù)繼續(xù);甚至疫情期間,更是在家上班的受益者。
隨著人工智能大模型的熱度持續(xù)升溫,英偉達(dá)的GPU供應(yīng)量難以滿足市場需求。Analytics India Magazine 的一份報告稱,OpenAI 僅運(yùn)行其人工智能服務(wù)ChatGPT每天就要花費(fèi)約70萬美元。據(jù)悉,英偉達(dá)的訂單量已經(jīng)排滿到2024年,其中性能最強(qiáng)的AI訓(xùn)練H100 GPU更是備受追捧。H100 GPU的成本為3320美元,而英偉達(dá)以25000至30000美元的價格出售這些GPU,今年計劃銷售量超過55萬塊。
2023年7月底,瑞穗分析師Vijay Rakesh在最新的報告中指出,英偉達(dá)在人工智能芯片市場的優(yōu)勢是“統(tǒng)治級的”,未來也將占據(jù)相當(dāng)大的市場份額。Rakesh指出,英偉達(dá)今年的營收可能達(dá)到250億至300億美元,預(yù)計該公司今年將出貨約10萬臺人工智能產(chǎn)品,平均售價為25萬至30萬美元。雖然隨著時間推移,英偉達(dá)可能會面臨比現(xiàn)在更激烈的競爭,但預(yù)計該公司扔將占據(jù)“相當(dāng)大”的市場份額,平均售價可能會降至20萬美元左右,但那時可能會出貨150萬臺芯片產(chǎn)品,銷售額可能大幅提升,AI相關(guān)收入將達(dá)3000億美元。
今年迄今為止,英偉達(dá)股價飆升超200%,市場突破萬億美元大關(guān)。Rakesh認(rèn)為,股價還能繼續(xù)走高,將目標(biāo)價從400美元上調(diào)至530美元,并表示新目標(biāo)是較為保守。Rakesh認(rèn)為,人工智能給英偉達(dá)股價帶來的助推力可能超乎想象,人工智能的增量價值約為20-300美元/股,這表明英偉達(dá)的潛在價值約為486- 760美元/股。
中國芯片公司如何趕超?
國內(nèi)某GPU獨(dú)角獸相關(guān)負(fù)責(zé)人表示,首先在硬件上,中國公司由于沒有芯片設(shè)計上的歷史包袱,因此可以大膽使用更高效的芯片架構(gòu),所以在芯片設(shè)計層面已經(jīng)能夠?qū)崿F(xiàn)一定程度上的趕超,這也是國內(nèi)廠商能夠生存的關(guān)鍵。但是在供應(yīng)鏈上,國內(nèi)廠商由于中美關(guān)系的影響,在獲取國際供應(yīng)鏈最新技術(shù)上存在很大的隱患,甚至有些廠商已經(jīng)受到了來自美國的制裁和阻礙。這個方面就需要國內(nèi)整個產(chǎn)業(yè)鏈的共同提升。
其次在軟件上,軟件生態(tài)的建設(shè)需要時間和用戶的積累,因此國內(nèi)需要更多鼓勵下游應(yīng)用廠商使用國產(chǎn)芯片,從而在軟件生態(tài)上給到芯片公司更多的反饋,形成“用戶使用-用戶反饋-迭代-更多用戶使用”的滾雪球式發(fā)展。只有這樣才能追趕上英偉達(dá)在軟件生態(tài)層面的水平。在理想的情況下,這種發(fā)展也需要5-10年時間才能看到成效。
《IT時報》報道,在今年的世界人工智能大會上,一家國產(chǎn)GPU廠商銷售人員就透露,目前國內(nèi)第一批大模型廠商使用的基本都是英偉達(dá)A100、A800的芯片,因?yàn)橛ミ_(dá)構(gòu)建了完善的CUDA生態(tài)。“如果你用慣了這個生態(tài),”該銷售人員說,“貿(mào)然換一個生態(tài),意味著你的學(xué)習(xí)成本、試錯成本、調(diào)試成本都會增加,自然沒人會想要換了”。
目前,國內(nèi)AI芯片第一梯隊(duì)包括海光、華為和寒武紀(jì)等廠商,第二梯隊(duì)包括燧原、昆侖芯、天數(shù)等公司,對他們來說,不僅需要接近CUDA兼容問題,生態(tài)建設(shè)更是不得不面對的難題。8月24日-27日在深圳召開的2023年亞布力論壇夏季高峰會上。科大訊飛創(chuàng)始人、董事長劉慶峰表示,中國在人工智能算法方面沒有問題,但算力似乎始終被英偉達(dá)按住。“我特別高興告訴大家,華為的GPU能力已經(jīng)跟英偉達(dá)A100一樣了。”
今年3月,《科技部辦公廳關(guān)于開展國家新一代人工智能公共算力開放創(chuàng)新平臺申報工作的通知》明確表示,公共算力平臺應(yīng)使用自主研發(fā)的人工智能計算芯片,并優(yōu)先采用自主研發(fā)的系統(tǒng)軟件。對于混合部署的公共算力平臺,基于自主研發(fā)芯片的算力標(biāo)稱值占全部系統(tǒng)算力標(biāo)稱值的比值應(yīng)不低于 60%。公共算力平臺應(yīng)優(yōu)先使用國產(chǎn)開發(fā)框架,使用率應(yīng)不低于60%。
今年6月2日,《臨港新片區(qū)加快構(gòu)建算力產(chǎn)業(yè)生態(tài)行動方案》發(fā)布,其中提出:到2025年,臨港新片區(qū)將形成以智算算力為主、基礎(chǔ)算力和超算算力協(xié)同的多元算力供給體系,算力產(chǎn)業(yè)總體規(guī)模突破100億元。
同一天,中國電信臨港公共智算服務(wù)平臺暨國產(chǎn)GPU聯(lián)合創(chuàng)新基地啟動。首批國產(chǎn)GPU廠商華為、燧原、天數(shù)、寒武紀(jì)、沐曦等宣布入駐。該基地將面向開發(fā)者或開發(fā)企業(yè)在模型算法算力的需求,搭建異構(gòu)國產(chǎn)算力開發(fā)環(huán)境。同時,基地還將與國產(chǎn)GPU廠家一起提升國產(chǎn)GPU芯片的性能和兼容性。
相關(guān)芯片專家指出,對國內(nèi)的廠商來講,性能方面基本上難以達(dá)到英偉達(dá)產(chǎn)品的性能,也拿不到臺積電最先進(jìn)的制程,而且GPU的設(shè)計里面的核心的IP也不是自己擁有的,這基本上來講實(shí)際上很難,更難的事情在于,現(xiàn)在國內(nèi)的這些GPU想在這個領(lǐng)域發(fā)展,就需要擴(kuò)大API兼容,就是為了方便的去移植英偉達(dá)的生態(tài),代碼的移植層面要簡單,但是代碼移植過來了,不等于性能就能夠達(dá)到最優(yōu),所以說需要的工作還是蠻多。
他認(rèn)為,當(dāng)然這中間的機(jī)會在于,因?yàn)槊绹写罅康南拗疲ミ_(dá)的產(chǎn)品到了中國以后,實(shí)際上不是一個完整性能的產(chǎn)品,而美國的限制卡在連接帶寬上。大模型訓(xùn)練的時候,需要多卡訓(xùn)練,因此卡與卡之間的連接就是一個致命傷。從這個角度來講。再往前演進(jìn)一兩年,如果說美國不改變現(xiàn)在策略,這或許是國產(chǎn)GPU的機(jī)會,雖然性能上達(dá)不到最優(yōu),但是沒有帶寬上的限制,實(shí)際上的表現(xiàn)不見得會比海外產(chǎn)品的差。
在核心技術(shù)的原創(chuàng)能力上,生態(tài)環(huán)境上,國內(nèi)廠商還是要差一些。但是國內(nèi)最大的特點(diǎn)就是說沒有一個廠商能夠統(tǒng)治的這個市場,更像是一個充分競爭的市場,應(yīng)用場景是比較多,把一個先進(jìn)技術(shù)快速的進(jìn)行迭代和應(yīng)用,這種再創(chuàng)造能力是要比海外強(qiáng)的。“從這個角度來講,國內(nèi)還是充滿著很多的想象空間,不能說我們沒有最頂尖的硬件產(chǎn)品和最頂尖的研發(fā)的原創(chuàng)能力,這個市場我們就會落后。”這位專家表示,要善于把自己的長板做好,然后,克服在短板上的一些劣勢。
本文轉(zhuǎn)自于 財新網(wǎng)