陸科技巨頭華爲入局AI 即將公佈千億級大模型盤古Chat

華爲公司即將正式發佈一款類似ChatGPT的多模態千億級大模型產品,名爲「盤古Chat」。(圖/新華社)

大陸通訊科技龍頭企業華爲公司在全球一片人工智慧(AI)熱潮中亦不落人後,即將發佈一款類似ChatGPT的多模態千億級大模型產品,名爲「盤古Chat」,這意味着繼阿里、百度之後,大陸又一重要科技巨頭入局AI賽場。

據大陸《鈦媒體》獨家報導,預計今年7月7日的華爲雲開發者大會上將對外發布以及內測,產品主要面向政府與企業端客戶。基於華爲的技術能力,盤古Chat有望成爲大陸技術能力最強的ChatGPT產品,同時華爲生態產業鏈企業也將因此受益。

報導指出,盤古大模型於2020年11月在華爲雲內部立項成功,華爲內部團隊爲盤古大模型確立了3項最關鍵的核心設計原則:1.模型要大,可以吸收海量資料;2.網路結構要強,能夠真正發揮出模型的性能;3.要具有優秀的泛化能力,可以真正落地到各行各業的工作場景。

華爲發佈的訊息指出,盤古NLP大模型是首個千億參數中文預訓練大模型,CV大模型則首次達到30億參數。2022年4月,華爲盤古升級到2.0,發佈層次化開發方案並打造工業級盤古大模型。

華爲雲人工智慧領域首席科學家田奇今年4月曾表示,盤古NLP大模型覆蓋的智慧文檔檢索、智慧 ERP、小語種大模型等落地領域,2022年華爲剛交付了一個阿拉伯語的千億參數大模型。在應用方面,盤古大模型可以應用於智慧客服、機器翻譯、語音辨識等多個領域,提供AI技術支援。

報導說,去年華爲將盤古大模型在垂直產業領域落地應用。例如華爲基於盤古AI大模型在礦山領域打造首個「基於大模型的人工智慧訓練中心」,實現Al應用工業化開發,不僅降低成本而且增加效益。

與其他廠商相比,華爲的優勢或在於擁有完整的產業鏈和較強的算力調配能力。據浙商證券披露,在訓練千億參數的盤古大模型時,華爲團隊調用了超過2000塊的升騰910晶片,進行了超2個月的資料訓練能力。華爲內部稱,每年大模型訓練調用GPU/TPU卡超過4000片,3年的大模型算力成本高達9.6億元人民幣(約合臺幣41.8億元)。

報導表示,由於盤古大模型擁有超大規模的參數,因此訓練成本較高。同時,盤古Chat大模型也將面臨着行業激烈的競爭壓力,需要不斷優化和提高模型的性能和品質,才能以保持在市場中的領先地位。