人工智能2.0浪潮下 更早一批AI創業企業現在怎麼樣了?

《科創板日報》4月30日訊(記者 敖瑾)由大語言模型催生的新一輪人工智能浪潮,在資本和行業領域都掀起了又一圈波瀾。生成式AI概念成爲了行業大咖躬身入局的創業熱點,它在資本市場也成爲了一時無兩的新風口。

而更早一批打着人工智能標籤進入市場的創業企業,在行業再度成爲市場關注的熱點之際,又經歷了什麼?

博瀚智能創始人郭瑋在近日接受《科創板日報》記者採訪時表示,公司總體而言受益於這輪人工智能2.0的浪潮,但與此同時也受到了負面影響。

“大模型代表了AI2.0時代非常重要的模型技術發展,但由於大模型的火熱,大家的關注度更多地集中在算法本身,一定程度上忽略了各類模型在複雜場景中落地。因此,像博瀚智能這類以數據爲中心,聚焦AI場景落地的企業,在這一波熱潮中受到投資機構的關注度會低一些。”

博瀚智能成立於2019年,是一家聚焦於打造數據和模型管理體系平臺的人工智能企業,業務核心在於依託平臺基礎設施,爲不同垂直場景提供AI解決方案。

近期,博瀚智能宣佈完成新一輪融資,投資方爲海創匯。此前,公司已完成五輪融資,投資方包括力合科創、金浦投資、中信創投以及卓源亞洲等。

大模型熱度帶來拓寬應用場景機遇

郭瑋告訴《科創板日報》記者,人工智能領域曾在2022年落入最低谷,“那時候很多公司恨不得把AI標籤扒掉,人工智能可以說是企業的一個負面標籤。”

情況在2023年發生轉變。隨着ChatGPT的火爆,整個人工智能行業發生了鉅變,人工智能又成爲了創業熱點以及資本追逐的風口,社會大衆對人工智能的認知也出現了前所未有的提升。

郭瑋認爲,儘管當前行業內外對大語言模型的關注,讓以數據爲中心聚焦AI應用的博瀚智能在資本層面的關注度不足,但大模型接下來的落地應用,將進一步拓寬以數據爲中心這一技術路線的落地應用空間。

“隨着開源成爲大模型領域的趨勢,整個行業的側重點會從模型體系本身,轉移到模型的應用,尤其是對於基礎模型相對穩定的語言類大模型LLM。而模型應用,又涉及到使用什麼樣的技術路線進行落地。”因此,郭瑋認爲,大模型的興起,將給博瀚智能這樣的以數據爲中心的企業帶來新的機遇。

郭瑋表示,博瀚智能目前的數據服務及大模型落地服務,包含了爲客戶提供智能數據平臺和LLMOps大模型平臺兩大方面,“最終目的是讓客戶實現人工智能更高效的落地。”其預期,明後兩年大模型以及數據兩大板塊會爲博瀚智能的營收帶來提振。

《科創板日報》記者關注到,近年來已出現不少以數據爲中心構建AI系統的創業企業。前百度首席科學家吳恩達成立的Landing AI也是其中之一。

據公開資料,Landing AI開發了一個計算機視覺平臺LandingLens,它利用深度學習技術來幫助製造商進行機器視覺檢測,發現產品缺陷;以數據爲中心的方法,是該平臺快速且易於使用的關鍵。

該公司在2021年完成數億元融資,由工業物聯網公司McRock Capital領投,英特爾投資、三星旗下的催化劑基金、投資公司Insight Partners和加拿大養老金計劃投資委員會等跟投。

在平臺工具軟件之外,博瀚智能以工業質檢作爲目前公司AI商業化落地的突破口。郭瑋表示,公司對於落地應用,有過一段不短時間的探索。最初,公司落地聚焦的是醫療領域。“一開始是用在皮膚科診斷方面,但最終落地仍然遇到了商業問題,其核心原因是在於,如何將AI輔助診斷與當前的醫療診斷流程和付費體系融合起來。”

其表示,在落地應用探索過程中,深圳清華大學研究院及包括力合科創等在內的投資方給予了很大的幫助,“除了產業鏈上下游的對接,力合科創從公司發展早期還提供了創業資金、辦公場地、政府對接等賦能。”

據悉,當前,博瀚智能亦在新能源、汽車製造、與食品以及航天領域客戶進行對接,進一步拓寬公司的落地場景。

數據爲核心的人工智能可適應複雜場景應用

除了企業本身的變化,2019年就入局人工智能領域的郭瑋,看到並經歷了整個行業近年來的演進。他認爲,整個人工智能領域,事實上在大趨勢上都在進一步強調數據的重要性。

其介紹,在2021年之前,人工智能領域聚焦的重點突破在於如何提升深度學習網絡的性能以及打造性能更加優異的模型,模型成爲了AI發展、技術發展以及落地的技術瓶頸。因此,大量公司圍繞着人工智能模型展開工作,如當時非常典型的AI四小龍就是以模型爲中心的代表。

在以模型爲中心的技術路線中,對企業最核心的價值和能力的衡量是以算法能力爲基礎的,而衡量的實施方式之一,便是讓各企業團隊基於固定的數據集開發模型,再去評估企業算法模型的優劣,例如各類AI算法大賽的排名等。

“這種價值評估方式,在人工智能發展過程中確實起到了很大的推進作用,大幅度推動了包括CNN、RNN、Transformer等技術的發展,產生了一批非常優秀的算法網絡結構和模型,包括大模型。”

但在實施AI場景落地方面,通過調整模型結構、超參數等手段的模型爲中心的技術路徑有其侷限性。

郭瑋表示,在2021年之前,除了人臉識別、車牌識別等相對固定的場景外,以模型爲中心的AI技術在很多場景中必須通過高度定製化的方式進行落地,難以實現橫向高效拓展。這是因爲當數據變化較少、場景變化較小時,開發好的模型可以快速實施應用;但當面臨少見場景或快速變化的場景時,例如自動駕駛和工業質檢等應用領域,僅依賴前期的訓練數據以及當前模型本身的泛化能力,是難以滿足需求場景中長尾數據以及變化數據帶來的挑戰。

“拿工業質檢來講,當中的缺陷類型不可能通過提前準備一個數據集的方式來收集,因爲工業生產過程中的缺陷本來就是變化的、不可預測的,且很多生產缺陷出現的頻率也很低。其次,工業領域也是一個變化很快的場景,即工廠生產產品種類也非常多,且產品更新迭代也很快。因此,很難通過提前採集數據的方式開發模型,然後落地到這一場景中。”

因此,以數據爲中心的技術路線應運而生,以更好地將人工智能技術落地到包括工業製造和自動駕駛在內的複雜長尾場景。

郭瑋介紹,以數據爲中心的路線,本質上是前期開發完成了基礎模型,然後通過高效的數據抓取手段,在場景中採集到核心數據並以之實現基礎模型的快速迭代和能力的提升,在整個環節中,數據抓取和模型能力提升的效率是重點。“以模型爲中心的路線,核心訴求是算法科學家,而以數據爲中心,最大的訴求就變成了打造一個能夠對數據和模型全生命週期進行自動化管理的工具體系。”

目前,博瀚智能基於其自研的數據爲中心AI基礎設施,構建了一系列適配國內外AI軟硬件生態體系的AI開發平臺產品體系,以及能夠服務於工業製造和其他場景的解決方案,並正在行業頭部生產製造企業、自動駕駛、智算中心等實現規模化商用落地。