大模型進入公考行業

大模型正在教育領域加速落地。

7月12日,職教巨頭粉筆(02469.HK)推出公考行業內首個自研的垂直大模型,並宣佈將於8月1日上線粉筆AI老師“粉筆頭”。

在此之前,本站有道(NYSE:DAO)、好未來(NYSE:TAL)、作業幫、猿輔導等教企均已推出各自訓練的教育大模型,並結合口語陪練、作文批改、個性化學習等場景,在學習機、詞典筆等硬件中落地。

此前業內有觀點認爲,隨着通用大模型能力的普遍增強,垂直領域的模型沒有存在的必要。對此,粉筆CTO陳建華有不同的看法。

據其介紹,粉筆從2023年一季度開始探索大模型和教育的結合。他發現,某些場景裡,通用大模型的表現不及預期,比如在回答行測這類客觀題時,正確率非常低。在命題方面,通用大模型只能做到模仿題目的形態,在題目的難度、內容和考點設置上無法滿足需求。

但通用大模型在面試點評環節這類受限的小場景下,效果非常好且可控。面試點評是學生備考的剛需,之前主要由老師人工完成,工作量大、效率低、單價高,如果藉助於AI輔助老師進行面試點評,老師的點評時間可以從20分鐘縮短到5分鐘之內。AI面試點評的可用率也可在90%以上。

面對通用大模型和垂直大模型之間的“紛爭”,好未來CTO田密也曾公開表示,現在通用大模型可以來解決很多尋常的通用問題,但在某個專項任務上只能解決到六七分的水平,如果想取得更好的結果,必須在垂直領域上做更專項的訓練。

“大模型在B端(企業)內部提效方面會更容易落地。”陳建華稱,例如上述提到的面試點評場景,通過大模型給出點評的內容,再由輔導老師把關,輸出到學生端,可提高效率。

在他看來,對於準確性要求比較高的教育場景,C端(用戶)應用的落地會面臨着非常大的挑戰,其中最大的挑戰就是大模型的“幻覺”問題,例如在一些歷史人物類的嘗試問題中,可能會存在張冠李戴的效果,“這一點對教育行業來說是非常致命的”。

目前,粉筆的做法是藉助於RAG(Retrieval-Augmented Generation)檢索增強生成的輔助來克服幻覺,同時利用CoT(思維鏈)讓大模型按照步驟一步步進行推理。

另一方面,採用分治法,嘗試將複雜的問題拆分成足夠簡單的任務再讓模型處理,陳建華稱,效果會遠遠好過於直接將整個複雜的任務交給模型處理。

“每個產品都值得用大模型技術重做一遍。”陳建華認爲,這裡的重做不是要推倒過去已有的成果,而是要藉助於大模型從效率、過程和結果上重塑整個流程,以提供更多可能性。

在應用場景上,粉筆AI老師已覆蓋學員的入班測試、理論學習、強化練習、模擬套卷,直到最後的衝刺階段。陳建華預計今年將上線申論AI老師。此外,面試AI老師、事業單位和教師項目的AI老師也在籌備中。

粉筆副總裁劉帥表示,粉筆AI老師將是未來粉筆主流的最高端的產品之一。

越來越多的AI老師上線,真人老師會失業嗎?

當日發佈會上,粉筆創始人、CEO張小龍對此予以否定,技術進步並不意味着就能取代行業人士,學習的過程不僅僅是知識學習,與此同時還伴隨着老師提供的情緒價值。相反,技術解放了人之後,身體會變得越來越強,人也會變得越來越有智慧,更有趣、更有意識。

張小龍還表示,粉筆AI老師作爲一款C端的AI產品,是“收費”且“收得起費”的。他同時呼籲:“中國科技領域的朋友們,不要都盯着通用大模型,可以多一些針對具體領域的具體服務,早日實現商業化。”