界面新聞記者 | 查沁君
界面新聞編輯 | 宋佳楠
“大模型可以作為教育工具的一部分,但不能替代專業(yè)的教育設(shè)計和教學(xué)過程?!?/p>
日前,智能學(xué)習(xí)科創(chuàng)公司洋蔥學(xué)園推出了最新一代AI智能學(xué)伴,并首次公開集團旗下的智能學(xué)習(xí)產(chǎn)品矩陣。該公司聯(lián)合創(chuàng)始人兼董事長楊臨風(fēng)在接受界面教育采訪時表達了上述觀點。
“比如讓一個沒有學(xué)過方程的孩子通過提問來學(xué)習(xí)一元一次方程,這是不現(xiàn)實的?!?/span>楊臨風(fēng)認為,大模型公司訓(xùn)練的是底層的互聯(lián)網(wǎng)廣義語料,可能并不系統(tǒng),無法根據(jù)個人的認知水平深入淺出地解釋復(fù)雜概念。在教育未成年人的過程中,最重要的是認知水平的匹配,即如何將復(fù)雜概念以孩子能理解的方式解釋清楚。
他提到行業(yè)目前應(yīng)用大模型的現(xiàn)狀,很多公司急于推出所謂的AI助教,但實際上這些產(chǎn)品只是一個3D或2D的人物頭像,下面是一個對話框,帶有一個人設(shè)。用戶只能進行一些淺層的、表面的互動,而無法得到系統(tǒng)性的深度引導(dǎo)和支持,沒有真正深入到教育的本質(zhì)。
在他看來,真正的智能學(xué)伴應(yīng)該是深入到學(xué)習(xí)科學(xué)底層,分析學(xué)習(xí)場景,找到學(xué)習(xí)痛點,并針對性地提供相關(guān)功能,如激勵、交互、互動、學(xué)習(xí)方法和內(nèi)容等,形成一個有機的服務(wù)整體。
十多年前,畢業(yè)于美國哈佛大學(xué)計算機科學(xué)專業(yè)的楊臨風(fēng),出于對教育領(lǐng)域的興趣,與幾個學(xué)生時期的伙伴開始研究科技在教育行業(yè)中的應(yīng)用。
在正式創(chuàng)建洋蔥學(xué)園前,他曾花兩年時間在中國農(nóng)村地區(qū)的學(xué)校走訪,感受到人機交互在教學(xué)中的重要性——低成本地將數(shù)字課程資源帶給農(nóng)村地區(qū)學(xué)生,這也是后來洋蔥學(xué)園的創(chuàng)辦動力。
2013年,“洋蔥數(shù)學(xué)”(洋蔥學(xué)園前身)成立,早期僅提供數(shù)學(xué)課程,如今已覆蓋小、初、高全科以及中職數(shù)學(xué)。其創(chuàng)辦理念是用微課和數(shù)字化學(xué)習(xí)的模式,讓學(xué)生尤其是農(nóng)村學(xué)生改變單向接受老師“灌輸”,對學(xué)習(xí)產(chǎn)生興趣來更高效地學(xué)習(xí)。
與當(dāng)時市面流行的大班課、一對一、小班課等在線直播模式不同,洋蔥學(xué)園可以說是一家“非典型”的在線教育企業(yè),采取100%人機交互學(xué)習(xí)的教學(xué)模式,不搞直播、不做校外培訓(xùn)、不用真人教學(xué),取而代之的是以創(chuàng)意動畫視頻課程來輔助學(xué)校課堂教學(xué),自主研發(fā)課程體系,實現(xiàn)人機交互的AI教學(xué)創(chuàng)新模式。
這家公司用十年時間制作了8000多節(jié)課程,區(qū)別于常規(guī)的課程形態(tài),洋蔥微課時長5到8分鐘左右,包含了課堂上20到30分鐘的知識容量。
一節(jié)課程在公司內(nèi)部的流水線大概要做兩個月,約幾十個環(huán)節(jié),需要把至少一個學(xué)科、一個學(xué)段所有的課程進行精細化拆分和教研,再給每一節(jié)課制作動畫、視頻,做逐字稿的拆分,逐幀制作、剪輯、配音。
“雖然這種模式在初期發(fā)展較慢,短期內(nèi)收益不明顯,但一旦成型,市場和用戶口碑就會起來?!焙饬恳粋€智能學(xué)習(xí)產(chǎn)品是否真正智能,關(guān)鍵在于它是否能夠吸引學(xué)生主動使用,而不僅僅是依賴家長的引導(dǎo)。洋蔥學(xué)園注冊學(xué)生用戶已超過1.1億,是國內(nèi)目前應(yīng)用最普及的AI智能學(xué)伴。
楊臨風(fēng)透露,在微課制作方面,其投入遠超十億,已實現(xiàn)盈虧平衡,每年都有盈余。2014年至今,洋蔥學(xué)園已融資至E輪,投資方包括春華資本、昆侖萬維、騰訊投資等。
其課程收費也低于傳統(tǒng)輔導(dǎo)班的費用,目前一二線城市的輔導(dǎo)班年費用約一萬元左右,而洋蔥教育的年費是488元。該公司業(yè)務(wù)也從最早的學(xué)科教育拓展至素質(zhì)教育、職業(yè)教育、和硬件產(chǎn)品。
目前,C端(面向個人用戶)業(yè)務(wù)約占收入的八成,B端(面向教育局、學(xué)校)業(yè)務(wù)占兩成。洋蔥智課為學(xué)校提供了兩種模式:“人機雙師教學(xué)”和“人機精準教學(xué)”模式,這兩種模式均為學(xué)校開放并收費,但在特定條件下,如貧困山區(qū)的學(xué)校可免費使用。
他對界面教育表示,之所以堅持用“學(xué)伴”模式,是因為希望把學(xué)生作為主體和尊重對象。“我們經(jīng)常開玩笑說,家長典型常犯的20個無意識的教育錯誤,其中排第一的就是盯著孩子寫作業(yè)?!?/span>
在他看來,孩子在成長過程中需要意識到問題并自己解決,如果家長總是控制孩子的思考和解決問題的過程,孩子就無法學(xué)會獨立。從教育的底層邏輯來講,所有的學(xué)習(xí)都有輸入和輸出,學(xué)生需要內(nèi)化,可能每個人內(nèi)化知識的方法不一樣,但共性是一定要自己完成。
“十年前,我們決定培養(yǎng)學(xué)生的自學(xué)能力,讓中國學(xué)生主動愛上學(xué)習(xí)。當(dāng)時,全行業(yè)都覺得我們瘋了,因為沒有人相信中國孩子能自主學(xué)習(xí)。”但楊臨風(fēng)堅信,每個學(xué)渣心里都有一顆成為學(xué)霸的心,只是需要正確的方法和工具。就像攀爬一座高峰,如果提供清晰的路徑,讓他們每一步都能看到自己的進步,就能持續(xù)前進并最終達到目標(biāo)。
洋蔥學(xué)園于2017年左右開始探索自適應(yīng)學(xué)習(xí),這是將AI能力嵌入已有核心學(xué)習(xí)流程的重要探索。洋蔥學(xué)園App產(chǎn)品負責(zé)人林健日前在多知網(wǎng)Open Talk上介紹,在推出這一功能前,團隊思考的問題是,到底是用AI能力為學(xué)生創(chuàng)造新的學(xué)習(xí)場景或?qū)W習(xí)能力,還是將AI能力嵌入學(xué)生已有的學(xué)習(xí)流程、助力現(xiàn)有的學(xué)習(xí)場景?
市場上很多產(chǎn)品都提供了幫助學(xué)生總結(jié)課程重點、生產(chǎn)學(xué)科素材、進行作文批改等能力,這些功能可讓學(xué)生以更便捷的方式、更低廉的成本獲得學(xué)習(xí)內(nèi)容,具有一定價值,但仍是“授人以魚”。在林健看來,為學(xué)生創(chuàng)造新的學(xué)習(xí)場景或者學(xué)習(xí)能力,并不是最能夠彰顯AI能力價值的點。
AI工具是一種新的交付方式,但是否是“更好”的交付方式,則完全取決于背后將技術(shù)產(chǎn)品化的教育者。例如當(dāng)涉及到文章批改、總結(jié)等,AI在經(jīng)過精心設(shè)計的prompt和工作流的基礎(chǔ)上,可以做到以較高的水平給到用戶一些建議,但要提升交付的質(zhì)量和可用性,背后少不了有經(jīng)驗的教育者參與。
基于現(xiàn)有的用戶基數(shù)和學(xué)習(xí)行為數(shù)據(jù),洋蔥學(xué)園為所有課程內(nèi)容、習(xí)題和講義打了科學(xué)系統(tǒng)的標(biāo)簽,再加上AI能力的加持,希望能讓用戶學(xué)到的是適合內(nèi)容。“我們已經(jīng)能夠在用戶學(xué)習(xí)數(shù)據(jù)比較少的情況下,評估某一道題用戶做對做錯的概率,準確率已超過70%。”林健稱。
如何平衡技術(shù)推薦與教師的專業(yè)判斷,以確保學(xué)生能夠得到最適合他們的教育內(nèi)容?
楊臨風(fēng)的觀點是,技術(shù)難以判斷學(xué)習(xí)順序和效果,其主要用于評估學(xué)生在哪些方面存在困難,而具體的學(xué)習(xí)方法則更多依賴于人的教研經(jīng)驗。
關(guān)于大模型常見的“幻覺問題”,他表示目前行業(yè)還沒有完美的解決方案,但有一些共識的做法。例如,基于標(biāo)準答案對題目進行解析擴展,并讓系統(tǒng)自我核查解析是否正確。如果解析出現(xiàn)錯誤,系統(tǒng)會重新生成解析,通過這種方式反復(fù)核驗來提高準確性。
作為“偏科生”的大模型,在文科尤其是語文方面的應(yīng)用相對成熟,但在數(shù)學(xué)上卻經(jīng)常碰壁。楊臨風(fēng)認為,目前大模型端到端地給學(xué)生提供教學(xué)是不現(xiàn)實的?!拔覀儾粦?yīng)該神話大模型,它目前還遠未達到通用人工智能(AGI)的水平?!?/span>
在他看來,大模型能更多地在情感陪伴和文科類的互動溝通方面發(fā)揮作用,比如將其用作留言回復(fù)和情感互動的輔助工具,而不是直接用于心理診斷。“大模型的能力有其邊界,我們必須清楚這一點?!?/span>