智見丨阿里雲李飛飛:算力服務化會像電力一樣普及,就是計算能力那樣

出品|本站科技《智見訪談》

作者|趙芙瑤

編輯|丁廣勝

雲計算時代以來,雲數據庫以高可靠、高可用、高性能,高彈性、自動化智能部署與運維等優勢,對傳統數據庫市場發起衝擊。雲原生數據庫作爲一種新型數據庫技術,逐漸在國內外市場崛起,引領了行業的發展趨勢。當前,雲原生數據庫已成爲越來越多企業和開發者的首選。

與此同時,人工智能、5G技術、ChatGPT的發展也爲雲原生數據庫帶來了新的機遇。越來越多的數據庫廠商開始將人工智能技術融入雲原生數據庫,以實現智能化數據處理。這些技術的應用能夠幫助企業更高效地處理數據,提高數據處理質量,降低成本,從而爲企業帶來更大的競爭優勢。

在這一大背景下,以PolarDB爲代表的阿里雲瑤池數據庫正積極推進“雲原生+一站式”的數據管理與服務。那麼AI將爲數據庫帶來哪些“質變”?AIGC又將給數據庫帶來哪些挑戰?PolarDB如何與其他技術進行深度結合?此次本站科技深度對話阿里巴巴集團副總裁、阿里雲智能數據庫事業部總負責人李飛飛,探尋其對未來雲數據庫領域的展望以及戰略考量。

深度解讀“四化”與“四做”

本站科技:阿里雲此次反覆提到“四化”的概念,您認爲在數據庫行業,新“四化”的發展趨勢是怎樣的?對開發者有怎樣的意義?

李飛飛:提“四化”是因爲它帶來了正向衝擊和變化,類似於中國改革開放40年前的“四個現代化”。在數據庫領域,各方面看似不同,但本質相似。雲計算和數據庫領域面臨關鍵、重要且具有巨大機會的轉折點。我們提出“四化”概念:雲原生化、平臺化、一體化、智能化,這不僅僅是從阿里雲瑤池數據庫的角度提出,而是站在整個雲數據庫賽道上思考。

首先是雲原生化,現在應該沒有人質疑數據庫向雲原生化演進的必要性和現實緊迫感。例如,存儲計算分離技術、存儲池化、計算池化等,這些都是雲原生的具體表現。

其次是平臺化,這意味着構建一個具有多個引擎的平臺,提供一整套一站式能力和解決方案。平臺化能降低邊際成本,實現商業效益。平臺化還要求支持標準API,以適應未來人機交互、機器與機器交互的趨勢。

第三是一體化,基於平臺化的基礎上,打破數據孤島,實現TP、AP、NoSQL、大數據PaaS之間的一體化。包括離在線一體化、處理分析一體化、多模數據一體化和集中分佈一體化。客戶無需再關心什麼時候使用集中式或分佈式數據庫,數據庫應自動在兩者之間切換和轉化。

最後是智能化,AI可用於數據庫運維,如異常檢測、HA切換、參數調參等。同時,數據庫也可爲AI服務,例如在PolarDB中使用自然語言進行查詢。今年下半年,我們將正式發佈PolarDB全新接口。

簡而言之,“四化”指的是雲原生化、平臺化、一體化和智能化,我個人認爲,今天想在數據庫這麼競爭激烈的賽道上走到下一個春天,接下來必須全面擁抱“四化”,不擁抱“四化”的廠商是沒有任何機會的,阿里雲瑤池數據庫肯定會全力以赴做“四化”,我們也提到是“四做”,做深基礎、做強核心、做精場景、做好體驗。

AIGC爲數據庫帶來新的挑戰

本站科技:未來操作數據庫的還是程序員嗎,還是誰都可以來操作數據庫?

李飛飛:今天早上CTO提到了一個核心理念:以算力爲基礎,以數據爲核心,以技術爲牽引。算力服務化就是將計算能力變得像電力一樣普及,雲計算正是實現這個目標的關鍵。將獨立服務器整合到一個或多個IDC中,像超級大電腦一樣統一調動資源。

第二點是以數據爲核心。算力服務化之後,沒有數據,這些算力就毫無意義。數字化已經基本完成,接下來的任務是實現物理世界和生物世界的數字化。數據庫在這個過程中扮演着至關重要的角色。

最後是以智能爲牽引。我認爲這句話可以改爲“以智能爲裂變”。數據爲基礎,結合代表性的人工智能技術,如ChatGPT和多模技術,實現數據和智能的核裂變。數據庫將成爲這個核裂變過程中的關鍵組件之一,這是一個令人振奮的時代。核心要素是算力+數據+智能,共同構成信息化、數字化時代的核裂變,這是我對未來的預測。

本站科技:AIGC應用近期非常火爆,您認爲這種需求對數據庫帶來哪些挑戰?我們應該如何應對?

李飛飛:我認爲有三個層面。首先是運維管控層面,隨着AI平民化,運維和調優將變得更智能化。智能調參、智能運維、高可用檢測告警等方面都會與AI深度結合。這個趨勢已經發展幾年,未來一兩年會加速。

其次,在數據庫方面,支持AIGC應用的前提是能處理海量多模態數據。靈動已具備這一基礎,但還需支持豐富、靈活、強大的模型導入和使用。我們要通過開放平臺化方式,無縫導入第三方模型,包括開源模型和用戶自建模型。爲保證模型安全,用戶導入的模型將放在機密容器裡。結合多模態數據和第三方模型,想象空間將非常廣闊。

第三,除多模態數據庫外,傳統結構化關係型數據庫的交互方式也將變得更自然、智能。例如,我們已實現自然語言生成SQL的技術,並正與PolarDB深度結合。

5G催生數實融合 PolarDB實現集中分佈一體化

本站科技:關於5G在雲原生數據庫和中小企業數字化轉型方面的影響,您有什麼看法?

李飛飛:5G確實是個爭議話題,尤其是關於5G應用爆發的疑問。我認爲5G將催生數實融合,雲原生數據庫已成事實標準。如果AI在未來一兩年加速演進,比如ChatGPT,AI也將成爲事實標準,那麼5G、6G、XG等技術需求將變得剛性。5G尚未實現爆炸式應用的一個原因是缺乏高效智能處理數據的能力,導致下游應用無法爆發式產生,影響5G需求。

未來,AI將催生物理世界和生物世界的數字化。物理世界數字化將推動5G發揮關鍵作用,例如在大廠區或運營商提供的公共5G網絡。馬斯克的星鏈也是XG的一種形態,即太空中的基站。

數據庫在此過程中將扮演關鍵角色,支持多模態數據成爲事實標準,因爲宏觀和微觀世界數字化將產生大量數據。同時,要支持多模態數據的存儲和處理,如PolarDB+Ganos實現對數字孿生世界的處理能力。結合AI,我們可以看到未來五到十年將是一個波瀾壯闊、令人激動的時刻。總之,隨着宏觀和微觀世界的數字化,5G和XG等技術一定會有更大的應用空間。

本站科技:分佈式與集中式數據庫一體化時,我們常談論前移和兼容,站在PolarDB角度(基於分佈式),一體化體徵如何理解?是否更多關注兼容性?

李飛飛:首先,我們要理解數據庫分類應該分爲傳統數據庫和雲時代數據庫。在這兩個類別下,又分別有集中式和分佈式。雲原生數據庫的特點是資源池化和資源解耦,這使得集中式和分佈式之間的轉換變得平滑,業務無感知。

在雲原生框架下,資源池化和資源解耦使得集中式和分佈式數據庫一體化成爲可能。在這個前提下,一體化的具體表現就是集中分佈一體化。此外,離在線一體化也是一種趨勢,它使得客戶無需關心在線和離線數據搬遷和同步等問題,平臺會自動處理。

今天發佈的PolarDB一體化就是把處理分析一體化,PolarDB自身實現了集中分佈一體化。從PolarDB雲原生共享存儲、共享狀態到無共享狀態,這也是集中分佈一體化的具體表現。所以,一體化是指在雲原生框架下,通過資源池化、資源解耦和智能化調度等技術,實現集中式和分佈式數據庫的無縫融合,以及在線和離線處理的統一。