A800、H800是英偉達(dá)在華銷售的最先進(jìn)GPU,通常被部署到中國(guó)互聯(lián)網(wǎng)云廠商、大模型公司、智算中心的數(shù)據(jù)中心,用于AI推理、訓(xùn)練。斷供風(fēng)險(xiǎn)下,中國(guó)不少公司急搶貨
美國(guó)升級(jí)對(duì)華出口管制,波及英偉達(dá)在華售賣的最先進(jìn)GPU(圖形處理器)——A800和H800。這兩款芯片通常被部署到中國(guó)互聯(lián)網(wǎng)云廠商、大模型公司、智算中心的數(shù)據(jù)中心,用于AI推理、訓(xùn)練。在迫在眉睫的斷供風(fēng)險(xiǎn)下,中國(guó)不少公司急搶貨,這兩款芯片價(jià)格飆漲。
“一個(gè)多月前,我就聽(tīng)說(shuō)了美國(guó)將升級(jí)芯片管制,當(dāng)時(shí)就將下訂的AI計(jì)算機(jī)數(shù)量由幾十臺(tái)增至上百臺(tái)。這兩天跟渠道努力溝通,目前鎖定了200臺(tái),確保公司未來(lái)1-2年的AI訓(xùn)練需求。”一家AI創(chuàng)業(yè)公司創(chuàng)始人對(duì)財(cái)新稱,“我手里訂單都是一個(gè)月之前下的,現(xiàn)在下單根本不可能拿到貨。即便國(guó)內(nèi)有H800現(xiàn)貨,也都在倉(cāng)庫(kù)里放著,現(xiàn)在不會(huì)拿出來(lái)賣了”。
該創(chuàng)始人介紹,10月17日美國(guó)升級(jí)管制前,一臺(tái)包含8張英偉達(dá)H800訓(xùn)練卡的標(biāo)準(zhǔn)AI計(jì)算機(jī)現(xiàn)貨價(jià)格在230萬(wàn)元左右,現(xiàn)已飆至超過(guò)270萬(wàn)元,且基本沒(méi)有現(xiàn)貨供應(yīng)。一名互聯(lián)網(wǎng)大廠內(nèi)部人士亦透露,通過(guò)中間商從海外帶貨,單張H800的報(bào)價(jià)也上漲到35-40萬(wàn)元。
A800、H800是英偉達(dá)最先進(jìn)的兩代GPU——A100、H100的中國(guó)特供版。A100、H100是如今數(shù)據(jù)中心、人工智能領(lǐng)域最主流的產(chǎn)品。A100峰值算力超過(guò)4800TOPS、帶寬達(dá)到600GB/s,H100性能較A100更高,按照2022年限芯令,這兩款芯片都無(wú)法向中國(guó)出口。為搶中國(guó)市場(chǎng),英偉達(dá)在2022年第三季度投產(chǎn)“特供”中國(guó)市場(chǎng)的A800芯片,峰值算力與A100一致,但傳輸速率被限制在A100的三分之二。此后,英偉達(dá)又推出中國(guó)特供版的H800,性能稍有差異,重點(diǎn)仍在“閹割”傳輸速率。
美國(guó)時(shí)間10月17日,BIS升級(jí)限芯政策,將對(duì)華出口芯片的參數(shù)紅線改為“總處理性能”(Total processing performance)。在美《出口管理?xiàng)l例》(EAR)下,集成電路(ECCN代碼:3A090)的管制紅線為:對(duì)于集成電路(不用于數(shù)據(jù)中心),總處理性能大于等于4800,或總處理性能大于等于1600并且“性能密度”(performance density)達(dá)到5.92;對(duì)一個(gè)或多個(gè)數(shù)字處理單元的集成電路(用于數(shù)據(jù)中心),“總處理性能”為2400或以上且低于4800,“性能密度”大于1.6且小于5.92;“總處理性能”大于等于1600或以上,“性能密度”為3.2或以上且小于5.92。“總處理性能”為2 דMacTOPS”ד操作的bit長(zhǎng)度”,而“性能密度”為“總處理性能”除以適用的芯片單元(die)面積。(詳見(jiàn)財(cái)新網(wǎng)《美國(guó)升級(jí)芯片管制①|從芯片到生產(chǎn)設(shè)備,管控如何升級(jí)?》)
當(dāng)日,英偉達(dá)披露,上述出口管制修訂中對(duì)芯片性能閾值的額外許可要求,將影響到英偉達(dá)A800、H800等產(chǎn)品,甚至涵蓋主要應(yīng)用于游戲PC(個(gè)人電腦)消費(fèi)級(jí)旗艦產(chǎn)品RTX 4090。集成上述芯片的DGX、HGX等計(jì)算機(jī)系統(tǒng)產(chǎn)品,也為新規(guī)所覆蓋。(詳見(jiàn)財(cái)新網(wǎng)《美國(guó)升級(jí)芯片管制②|美國(guó)芯片巨頭業(yè)務(wù)受阻 股價(jià)暴跌》)
一名國(guó)內(nèi)頭部服務(wù)器廠商人士對(duì)財(cái)新介紹,英偉達(dá)10月17日已經(jīng)停止接單;至于此前的訂單,在BIS芯片管制新規(guī)的30天寬限期內(nèi)會(huì)繼續(xù)交付,之后未能交付的可能會(huì)取消訂單。“即便是浪潮、新華三、超聚變這些服務(wù)器OEM廠商向英偉達(dá)采購(gòu),也就剩這30天的寬限期了,寬限期結(jié)束后還沒(méi)有完成交付就直接取消訂單。”
半導(dǎo)體行業(yè)咨詢機(jī)構(gòu)蓉和咨詢CEO吳梓豪對(duì)財(cái)新介紹,在臺(tái)積電cowos(即先進(jìn)封裝)仍陷產(chǎn)能瓶頸、全球大算力GPU供不應(yīng)求的背景下,英偉達(dá)原本采取了2023年優(yōu)先供應(yīng)國(guó)際市場(chǎng)通用版產(chǎn)品,2024年再大批量交付針對(duì)中國(guó)市場(chǎng)開(kāi)發(fā)的H800等定制產(chǎn)品的策略。“現(xiàn)在看來(lái),英偉達(dá)的應(yīng)對(duì)之策就是在30天緩沖期內(nèi)調(diào)度內(nèi)部資源、沖刺交付,能給中國(guó)客戶交多少算多少。”
他提及,對(duì)于英偉達(dá)來(lái)說(shuō),風(fēng)險(xiǎn)在于這些已在臺(tái)積電投片的“特供”GPU,只有中國(guó)客戶肯埋單,“能正常買到A100的客戶不會(huì)買A800”。新規(guī)發(fā)布之前,吳梓豪曾測(cè)算,英偉達(dá)“800系列”GPU在2023年的出貨金額約為10億美元,2024年有望升至50億美元。
去年10月美國(guó)發(fā)布半導(dǎo)體出口管制后,國(guó)內(nèi)大模型公司、互聯(lián)網(wǎng)云廠商、智算中心等主要需求方,就加速對(duì)GPU的囤貨。百度、字節(jié)、阿里等互聯(lián)網(wǎng)大廠均向英偉達(dá)下訂、儲(chǔ)備算力,并對(duì)外提供服務(wù)。此次芯片管制新規(guī)落地后,已有一些云廠商開(kāi)始收緊對(duì)外算力服務(wù),轉(zhuǎn)而更多支撐內(nèi)部業(yè)務(wù),比如字節(jié)跳動(dòng)。此前字節(jié)跳動(dòng)旗下的火山云希望用手中的部分硬件獲取行業(yè)客戶,借機(jī)開(kāi)拓云業(yè)務(wù)。財(cái)新從接近火山引擎人士處了解到,字節(jié)已開(kāi)始回收此前出租給外部客戶的GPU,已經(jīng)交付的硬件出售項(xiàng)目也面臨撤回的可能。
不過(guò),目前,總體上云廠商算力供應(yīng)正常,各云廠商官網(wǎng)仍可以租用GPU服務(wù)器。云廠商的客戶——金山辦公回復(fù)財(cái)新稱,各大云服務(wù)商年初就準(zhǔn)備了較大的算力供應(yīng),目前也供貨正常,公司推理和訓(xùn)練算力充足。
一名國(guó)內(nèi)AI企業(yè)芯片策略負(fù)責(zé)人向財(cái)新坦言,中國(guó)半導(dǎo)體業(yè)界已經(jīng)認(rèn)清美國(guó)制裁是大勢(shì),只是時(shí)間早晚、程度深淺問(wèn)題。當(dāng)下,企業(yè)大多都有了自己的計(jì)劃,提前進(jìn)行相應(yīng)的算力儲(chǔ)備及合同安排,因此此次芯片管制新規(guī)落地對(duì)全行業(yè)影響有限。不過(guò),隨著未來(lái)業(yè)務(wù)拓展和客戶、項(xiàng)目增長(zhǎng),新需求的滿足仍是挑戰(zhàn)。(未完待續(xù))
本王轉(zhuǎn)自于 財(cái)新網(wǎng)