路透:字節跳動擬用華為晶片 研發新AI大型語言模型
路透社引述3名知情人士說法報導,受到美國製裁影響,短影音平臺TikTok的中國母公司「字節跳動」計劃採用華爲晶片進行訓練,以研發新的人工智慧(AI)模型。路透
路透社引述3名知情人士說法報導,受到美國製裁影響,短影音平臺TikTok的中國母公司「字節跳動」計劃採用華爲晶片進行訓練,以研發新的人工智慧(AI)模型。
路透社報導,美國2022年開始限制輝達(Nvidia)等先進AI晶片出口以來,字節跳動(ByteDance)轉向發展國內AI晶片供應商多元化,並加速研發自有技術。
AI已成爲科技產業核心。遊戲、電子商務等領域的企業都透過整合客製化AI模型,即採用模式識別來做決策的程式,以提供與衆不同的產品選項。
消息人士說,字節跳動在這場AI競賽中的下一步,是利用華爲的升騰(Ascend)910B晶片來訓練AI大型語言模型。
另名消息人士也稱,字節跳動正計劃推出新的AI模型,但無法證實是否將採用華爲的晶片。
3名知情人士和另名消息人士指出,字節跳動已將升騰910B晶片用於運算強度較低的推理任務,這些任務採用預訓AI模型來進行預測。
然而,訓練AI模型所需晶片的要求遠高於此,不僅要能處理極大量資料,效能也要極佳,例如輝達的高階繪圖處理器(GPU)。
消息人士透露,依運算參數來衡量,新模型的效能和複雜性將不像字節跳動現有的AI模型「豆包」那麼強大。
針對報導內容,字節跳動和華爲均未回覆置評請求。TikTok駐華府發言人休斯(Michael Hughes)則代表字節跳動表示:「這裡的整個前提都是錯的。(我們)沒有在研發新模型。」
一名知情人士說,字節跳動今年已訂購至少10萬個升騰910B晶片,但截至7月,僅拿到不到3萬個,交貨速度顯然無法滿足字節跳動的需求。
兩名知情人士說,由於供應受限,運算能力又不如輝達在中國銷售的晶片,導致字節跳動無法爲新模型設定時間表。
自今年初以來,聊天機器人這類應用程式使用率愈來愈高,「豆包」已是中國最受歡迎的應用程式之一,每月有超過1000萬名活躍用戶。
消息人士說,AI日益受到重視,也讓字節跳動成爲華爲AI晶片最大買家之一。
消息人士還說,字節跳動也是輝達H20晶片的最大買家。輝達爲遵守美國當局的制裁措施,專爲中國市場推出這款晶片。