☰

大模型進入公考行業

大模型正在教育領域加速落地。

7月12日，職教巨頭粉筆(02469.HK)推出公考行業內首個自研的垂直大模型，並宣佈將於8月1日上線粉筆AI老師“粉筆頭”。

在此之前，本站有道(NYSE:DAO)、好未來(NYSE:TAL)、作業幫、猿輔導等教企均已推出各自訓練的教育大模型，並結合口語陪練、作文批改、個性化學習等場景，在學習機、詞典筆等硬件中落地。

此前業內有觀點認爲，隨着通用大模型能力的普遍增強，垂直領域的模型沒有存在的必要。對此，粉筆CTO陳建華有不同的看法。

據其介紹，粉筆從2023年一季度開始探索大模型和教育的結合。他發現，某些場景裡，通用大模型的表現不及預期，比如在回答行測這類客觀題時，正確率非常低。在命題方面，通用大模型只能做到模仿題目的形態，在題目的難度、內容和考點設置上無法滿足需求。

但通用大模型在面試點評環節這類受限的小場景下，效果非常好且可控。面試點評是學生備考的剛需，之前主要由老師人工完成，工作量大、效率低、單價高，如果藉助於AI輔助老師進行面試點評，老師的點評時間可以從20分鐘縮短到5分鐘之內。AI面試點評的可用率也可在90%以上。

面對通用大模型和垂直大模型之間的“紛爭”，好未來CTO田密也曾公開表示，現在通用大模型可以來解決很多尋常的通用問題，但在某個專項任務上只能解決到六七分的水平，如果想取得更好的結果，必須在垂直領域上做更專項的訓練。

“大模型在B端（企業）內部提效方面會更容易落地。”陳建華稱，例如上述提到的面試點評場景，通過大模型給出點評的內容，再由輔導老師把關，輸出到學生端，可提高效率。

在他看來，對於準確性要求比較高的教育場景，C端（用戶）應用的落地會面臨着非常大的挑戰，其中最大的挑戰就是大模型的“幻覺”問題，例如在一些歷史人物類的嘗試問題中，可能會存在張冠李戴的效果，“這一點對教育行業來說是非常致命的”。

目前，粉筆的做法是藉助於RAG(Retrieval-Augmented Generation)檢索增強生成的輔助來克服幻覺，同時利用CoT（思維鏈）讓大模型按照步驟一步步進行推理。

另一方面，採用分治法，嘗試將複雜的問題拆分成足夠簡單的任務再讓模型處理，陳建華稱，效果會遠遠好過於直接將整個複雜的任務交給模型處理。

“每個產品都值得用大模型技術重做一遍。”陳建華認爲，這裡的重做不是要推倒過去已有的成果，而是要藉助於大模型從效率、過程和結果上重塑整個流程，以提供更多可能性。

在應用場景上，粉筆AI老師已覆蓋學員的入班測試、理論學習、強化練習、模擬套卷，直到最後的衝刺階段。陳建華預計今年將上線申論AI老師。此外，面試AI老師、事業單位和教師項目的AI老師也在籌備中。

粉筆副總裁劉帥表示，粉筆AI老師將是未來粉筆主流的最高端的產品之一。

越來越多的AI老師上線，真人老師會失業嗎？

當日發佈會上，粉筆創始人、CEO張小龍對此予以否定，技術進步並不意味着就能取代行業人士，學習的過程不僅僅是知識學習，與此同時還伴隨着老師提供的情緒價值。相反，技術解放了人之後，身體會變得越來越強，人也會變得越來越有智慧，更有趣、更有意識。

張小龍還表示，粉筆AI老師作爲一款C端的AI產品，是“收費”且“收得起費”的。他同時呼籲：“中國科技領域的朋友們，不要都盯着通用大模型，可以多一些針對具體領域的具體服務，早日實現商業化。”

相關資訊