2025 -01
華為攻AI 另闢蹊徑
在輝達(dá)(NVIDIA)受到美國(guó)管制,晶片無法向大陸銷售之際,華為正透過自研的昇騰(Ascend)晶片,完成人工智慧(AI)中的“推論”(Inference)任務(wù),并推薦給其他陸企採(cǎi)用,藉此在AI晶片市場(chǎng)中搶占更多市占率。
生成式AI的學(xué)習(xí)通??煞譃橛?xùn)練與推論兩個(gè)階段。推論是指大型語言模型(LLM)在生成回應(yīng)時(shí)所進(jìn)行的計(jì)算。
華為預(yù)測(cè),隨著AI訓(xùn)練階段的飽和,以及未來聊天機(jī)器人等AI應(yīng)用程序變得更加普及,市場(chǎng)對(duì)AI“推論”的應(yīng)用將有更大需求。
中華經(jīng)濟(jì)研究院第二研究所國(guó)際鏈結(jié)組副組長(zhǎng)江泰槿指出,面對(duì)美國(guó)愈來愈嚴(yán)格的科技管制,大陸正採(cǎi)取多管齊下的突破策略。大陸政府本身推出研發(fā)費(fèi)用加倍扣抵、高科技企業(yè)租稅優(yōu)惠等政策,積極扶植本土企業(yè)創(chuàng)新。
在運(yùn)算能力方面,江泰槿表示,大陸透過分散式運(yùn)算和演算法優(yōu)化,整合中低階晶片運(yùn)算力,開發(fā)專用AI加速器。其次,加速產(chǎn)業(yè)鏈在地化,從晶片設(shè)計(jì)到封裝測(cè)試全面布局。最后,探索替代性技術(shù)路線,透過改進(jìn)演算法效率和優(yōu)化模型架構(gòu),降低對(duì)高階硬體的依賴。
英國(guó)金融時(shí)報(bào)(FT)報(bào)導(dǎo),大陸主要AI企業(yè)都仰賴輝達(dá)的繪圖處理器(GPU)訓(xùn)練大型語言模型,但華為不想挑戰(zhàn)輝達(dá)晶片在訓(xùn)練領(lǐng)域的地位,而是把最新的昇騰AI晶片,定位為大陸企業(yè)在執(zhí)行“推論”工作時(shí)的硬體選擇,押注若模型訓(xùn)練腳步放慢以及聊天機(jī)器人等AI應(yīng)用更廣獲採(cǎi)用,推論的需求將升高。
報(bào)導(dǎo)引述華為的員工和昇騰的客戶指出,華為聚焦于技術(shù)挑戰(zhàn)較低,但也有利可圖的路徑,也就是翻新以輝達(dá)晶片訓(xùn)練的AI模型,用昇騰晶片運(yùn)行。
由于輝達(dá)和昇騰的軟體系統(tǒng)不同,華為正幫助企業(yè)使用另一套軟體工具,讓兩個(gè)系統(tǒng)相容。
華為蘇黎世研究室研究推論加速的資深A(yù)I研究員薩查洛波洛斯(Georgios Zacharopoulos)表示,訓(xùn)練很重要,但只會(huì)進(jìn)行幾次,華為主要聚焦于最終將服務(wù)更多客戶的推論。
大陸已要求當(dāng)?shù)乜萍季揞^採(cǎi)購(gòu)更多華為的AI晶片,降低對(duì)輝達(dá)的依賴。
報(bào)導(dǎo)引述一名熟悉輝達(dá)大陸營(yíng)運(yùn)的消息人士的話指出,華為被輝達(dá)內(nèi)部視為在大陸的最重大競(jìng)爭(zhēng)對(duì)手,華為的晶片設(shè)計(jì)能力“非常先進(jìn)”。
美國(guó)已針對(duì)管制出口管制AI晶片的對(duì)大陸出口,希望阻礙大陸在敏感科技的進(jìn)展,因此大陸企業(yè)無法取得最先進(jìn)的GPU,而是只能獲得效能較低的輝達(dá)H20晶片,但因?yàn)槿员犬?dāng)?shù)仄渌x擇更好,因此需求依然熱門。
據(jù)半導(dǎo)體研究與顧問公司SemiAnalysis估算,輝達(dá)去年在大陸出貨100萬組H20晶片,銷售額120億美元,銷量為昇騰910B的兩倍。
2024-12-23
2025-02-07
2025-02-07
2025-02-07
2025-02-07
2025-02-07
2025-02-07
2025-02-07
2025-02-07
2025-02-07
2025-02-07