中國教育科技大會作業幫發力OCR+AI技術,持續打造技術壁壘

(原標題:中國教育科技大會作業發力OCR+AI技術持續打造技術壁壘

12月23日,2020中國教育科技大會於北京召開。本屆教育科技大會以“新業態·新動能·新教育”爲主題,圍繞中國教育進行深度剖析,並以最新、最全、最優的視角,全方位深入教育本質,聚焦業態發展。作業幫智能技術實驗室負責人王巖出席會議,並進行了《創新科技助力作業幫在線教育》主題演講,對教育科技的應用和創新發表前瞻性觀點。

據瞭解,中國教育科技大會由中國計算機用戶協會指導,iTechClub(互聯網技術精英俱樂部)教育專委會主辦,是國內互聯網技術領域最專業、最具影響力的大型教育科技類行業盛會,通過站在行業前沿角度,以演講、分享、討論、交流等不同的方式,深耕教育科技本源,促進中國教育行業的創新發展。

王巖表示,目前在線教育已經進入了新的發展階段,不僅需要對優質內容進行嚴格把控,同時還必須深耕用戶體驗。爲此,作業幫持續更迭OCR技術進階拍搜體系,以多線性思路兜底知識索取,同時發力AI技術在直播課中的深度應用,打造強交互和場景化在線課堂

作業幫拍搜技術向上突破,承接全國中小學生釋疑需求

近年來,作業幫拍照搜題成爲全國中小學生快速獲取知識的重要工具。據王巖介紹,早期經過研發和探索,作業幫拍搜系統在後臺開發及測試階段已經能達到較高的準確率。“簡單來看,初級的文字識別基本框架僅分爲前處理、文本行分割、文本識別和結果輸出四個部分。對於一位熟悉計算機視覺和深度學習的研究生而言,利用公開的資源和數據集,以及現成的深度學習框架,也許兩週內就可以搭建出一個系統,並能有效識別清晰圖片。”

然而在實際上線之後,系統在識別過程中遇到難題。隨着用戶體量日益擴大,用戶使用設備、拍照習慣、題目呈現效果存在顯著差異性,從而產生模糊、傾斜、低像素、干擾等現象,使得實際識別準確率下降。

爲解決拍搜系統遇到的一系列問題,作業幫發力OCR識別技術,自研拍搜架構。王巖介紹,這套系統是作業幫通過持續5年的自主研發和數據積累,不斷進行功能迭代的重要成果。在完整的文字識別流水線中,超過30種不同的神經網絡各司其職,每做一次拍搜文字識別,將運行260個以上神經網絡的預測。而如此複雜的算法,則通過大規模的並行化、集羣化的服務器,實現200ms內完成的極高效率,甚至可以對整張試卷進行快速識別。

依託於自研的拍搜架構,作業能夠有效擊破用戶識別場景多元而衍生的系列問題,提升識別精準性,幫助用戶實現提問與釋疑的無縫銜接,優化知識獲取效率。

精準識別+完整視頻講解+即時在線問答,作業幫搜題體系全面進化

在快和準上進行極致化探索僅僅是拍照搜題功能升級的第一關,將重心置於教學思路的講解和輸出,纔是契合教育本質的發展方向。

以教育普惠爲核心理念作業幫早已孵化出完備的拍搜業務線,用戶在精準匹配到題目之後,還能夠獲取詳細的解析過程以便於思考和歸納。同時,針對書面講解不夠直觀易懂痛點,作業幫錄製了大量解題視頻,實現圖文並茂、細緻解說。據瞭解,目前五成以上的搜索結果均配備講解視頻。此外,爲全面兜底搜題需求,作業幫還設置真人老師在線答題,能夠針對學生疑問進行進一步解答,幫助用戶對題目考察內容產生深入、透徹的理解,真正掌握知識點

王巖介紹道,結構化的拍搜體系不再是一項簡單的輔助型工具,而是穿透整個教研的重要力量。據瞭解,目前作業幫拍搜系統每分鐘可以處理100萬次的完整識別流水線,識別完成後,內容立刻被傳送至搜索引擎,匯聚成包含超3億題目的海量題庫。基於題庫,作業幫還運用大數據算法深入洞察全網學習動態,智能分析熱門知識點分佈及難點,賦能自身及全國各地教研體系。

在拍搜系統、大數據和龐大用戶體量的多重加持下,作業幫教研團隊可以快速明確某地區某時間甚至某學校中,最困擾學生的知識點、最容易錯的題目。此技術或將有效幫助教育部門制定教學計劃,提高教學效率,發揮在線教育的社會價值。

音視頻AI嵌入直播課架構,作業幫開啓學習場景化全面探索

不限於拍照搜題,作業幫還將直播課作爲輸出優質教育資源的關鍵抓手,通過發力AI技術,瞄準線下教育特性,深入探索場景化學習,匹配用戶對於課堂體驗的多重訴求。

具體而言,作業幫運用RTC協議自研音視頻互動直播技術架構,完整支持1對1輔導、一對多大班課、1對6小班互動課、多對多互動大班課等等各類班型。王巖介紹,這一套系統基於遍佈全國的節點,可以爲老師和學生提供足夠好的音視頻互動交互。其中,視覺AI的運用則能夠在直播課中實現監測上課狀態、優化課堂效果的雙向效果,拉齊線下課程面對面的教育價值,輻射全國孩子的學習圈,帶來在線教育的高位運行。

就課堂效果而言,作業幫面向低年級孩子推出自研課堂手勢交互功能,通過本地AI能力進行準確的手勢識別,規避了點選參與感不足的問題,提升課堂趣味性語音彈幕功能則使用自研語音識別能力,避免打字互動時鍵盤遮擋影響教學效果的情況。

演講中,王巖分享了語音功能升級帶來的強互動性。“在語言課程的拼讀環節中,可以給每一個學生都提供評價功能,在答題環節,老師能請學生直接用語音彈幕回答,回答內容將會被迅速識別,並在教師端進行彙總。”在作業幫的直播課堂上,沒有一個孩子被“隱身”,每位學生都有公平互動和表達的機會,老師也可以掌握臺下所有學生的回答情況。

在對學生上課狀態的把握上,作業幫則利用部署在用戶終端的神經網絡搭配雲端集羣,對學生進行智能識別,包括是否在座位、是否有家人陪同上課、是否專心聽課、離屏幕的距離是否過近或過遠。而主講老師通過學生狀態採集、課中實時彙總、課後分析報告,反哺老師教學能力,輔導老師則能夠運用專注力彙總,近距離與學生互動,全面感知學生個體。

基於近五年對於OCR、AI等教育技術的深耕,作業幫實現了在線教育效率化、實感化,化解了與線下教育的顯著區隔,並將彌補傳統課程的諸多壁壘,輻射多元學習場景。對於下一個五年的願景,王巖表示,作業幫仍在對在線教育進行更加深入的研究,今後也將持續聚焦教育科技,以成熟化的新技術強化學習場景感官,推動新教育行業的更大變革。