正在閱讀:

大模型進(jìn)入公考行業(yè)

掃一掃下載界面新聞APP

大模型進(jìn)入公考行業(yè)

對(duì)于準(zhǔn)確性要求較高的教育場(chǎng)景,大模型在C端應(yīng)用落地最大的挑戰(zhàn)是“幻覺(jué)”問(wèn)題。

圖片來(lái)源:圖蟲(chóng)

界面新聞?dòng)浾?| 查沁君

界面新聞編輯 | 文姝琪

大模型正在教育領(lǐng)域加速落地。

7月12日,職教巨頭粉筆(02469.HK)推出公考行業(yè)內(nèi)首個(gè)自研的垂直大模型,并宣布將于8月1日上線(xiàn)粉筆AI老師“粉筆頭”。

在此之前,網(wǎng)易有道(NYSE:DAO)、好未來(lái)(NYSE:TAL)、作業(yè)幫、猿輔導(dǎo)等教企均已推出各自訓(xùn)練的教育大模型,并結(jié)合口語(yǔ)陪練、作文批改、個(gè)性化學(xué)習(xí)等場(chǎng)景,在學(xué)習(xí)機(jī)、詞典筆等硬件中落地。

此前業(yè)內(nèi)有觀(guān)點(diǎn)認(rèn)為,隨著通用大模型能力的普遍增強(qiáng),垂直領(lǐng)域的模型沒(méi)有存在的必要。對(duì)此粉筆CTO陳建華有不同的看法。

據(jù)其介紹,粉筆從2023年一季度開(kāi)始探索大模型和教育的結(jié)合。發(fā)現(xiàn),某些場(chǎng)景里,通用大模型的表現(xiàn)不預(yù)期,比如在回答行測(cè)這類(lèi)客觀(guān)題時(shí),正確率非常低。在命題方面,通用大模型只能做到模仿題目的形態(tài),在題目的難度、內(nèi)容和考點(diǎn)設(shè)置上無(wú)法滿(mǎn)足需求。

但通用大模型在面試點(diǎn)評(píng)環(huán)節(jié)這類(lèi)受限的小場(chǎng)景下,效果非常且可控。面試點(diǎn)評(píng)是學(xué)生備考的剛需,之前主要由老師人工完成,工作量大、效率低、單價(jià)高,如果借助于A(yíng)I輔助老師進(jìn)行面試點(diǎn)評(píng),老師的點(diǎn)評(píng)時(shí)間可以從20分鐘縮短到5分鐘之內(nèi)。AI面試點(diǎn)評(píng)的可用率也可在90%以上。

面對(duì)通用大模型和垂直大模型之間的“紛爭(zhēng)”,好未來(lái)CTO田密也曾公開(kāi)表示,現(xiàn)在通用大模型可以來(lái)解決很多尋常的通用問(wèn)題,但在某個(gè)專(zhuān)項(xiàng)任務(wù)上只能解決到六七分的水平,如果想取得更好的結(jié)果,必須在垂直領(lǐng)域上做更專(zhuān)項(xiàng)的訓(xùn)練。

“大模型在B端(企業(yè))內(nèi)部提效方面會(huì)更容易落地?!?/span>陳建華稱(chēng),例如上述提到的面試點(diǎn)評(píng)場(chǎng)景,通過(guò)大模型給出點(diǎn)評(píng)的內(nèi)容,再輔導(dǎo)老師把關(guān),輸出到學(xué)生端,可提高效率。

在他看來(lái),對(duì)于準(zhǔn)確性要求比較高的教育場(chǎng)景,C端(用戶(hù))應(yīng)用的落地會(huì)面臨著非常大的挑戰(zhàn),其中最大的挑戰(zhàn)就是大模型的“幻覺(jué)”問(wèn)題,例如在一些歷史人物類(lèi)的嘗試問(wèn)題中,可能會(huì)存在張冠李戴的效果,“這一點(diǎn)對(duì)教育行業(yè)來(lái)說(shuō)是非常致命的”。

目前,粉筆的做法是借助于RAG(Retrieval-Augmented Generation)檢索增強(qiáng)生成輔助來(lái)克服幻覺(jué),同時(shí)利用CoT(思維鏈)讓大模型按照步驟一步步進(jìn)行推理。

另一方面,采用分治法,嘗試將復(fù)雜的問(wèn)題拆分成足夠簡(jiǎn)單的任務(wù)再讓模型處理,陳建華稱(chēng),效果會(huì)遠(yuǎn)遠(yuǎn)好過(guò)于直接將整個(gè)復(fù)雜的任務(wù)交給模型處理。

“每個(gè)產(chǎn)品都值得用大模型技術(shù)重做一遍?!?/span>陳建華認(rèn)為,這里的重做不是要推倒過(guò)去已有的成果,而是要借助于大模型從效率、過(guò)程和結(jié)果上重塑整個(gè)流程,以提供更多可能性。

在應(yīng)用場(chǎng)景上,粉筆AI老師已覆蓋學(xué)員的入班測(cè)試、理論學(xué)習(xí)、強(qiáng)化練習(xí)、模擬套卷,直到最后的沖刺階段陳建華預(yù)計(jì)今年上線(xiàn)申論AI老師。此外,面試AI老師、事業(yè)單位和教師項(xiàng)目的AI老師也在籌備中。

粉筆副總裁劉帥表示,粉筆AI老師將是未來(lái)粉筆主流的最高端的產(chǎn)品之一。

越來(lái)越多的AI老師上線(xiàn),真人老師會(huì)失業(yè)嗎?

當(dāng)日發(fā)布會(huì)上,粉筆創(chuàng)始人、CEO張小龍對(duì)此予以否定,技術(shù)進(jìn)步并不意味著就能取代行業(yè)人士,學(xué)習(xí)的過(guò)程不僅僅是知識(shí)學(xué)習(xí),與此同時(shí)還伴隨著老師提供的情緒價(jià)值。相反,技術(shù)解放了人之后,身體會(huì)變得越來(lái)越強(qiáng),人也會(huì)變得越來(lái)越有智慧,更有趣、更有意識(shí)。

張小龍還表示,粉筆AI老師作為一款C端的AI產(chǎn)品,是“收費(fèi)”且“收得起費(fèi)”的。他同時(shí)呼吁:“中國(guó)科技領(lǐng)域的朋友們,不要都盯著通用大模型,可以多一些針對(duì)具體領(lǐng)域的具體服務(wù),早日實(shí)現(xiàn)商業(yè)化。”

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。

粉筆科技

  • 粉筆:上半年收入16.3億元,同比減少3.1%
  • 公考培訓(xùn)龍頭粉筆上半年賺了2.8億,AI是大功臣

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

大模型進(jìn)入公考行業(yè)

對(duì)于準(zhǔn)確性要求較高的教育場(chǎng)景,大模型在C端應(yīng)用落地最大的挑戰(zhàn)是“幻覺(jué)”問(wèn)題。

圖片來(lái)源:圖蟲(chóng)

界面新聞?dòng)浾?| 查沁君

界面新聞編輯 | 文姝琪

大模型正在教育領(lǐng)域加速落地。

7月12日,職教巨頭粉筆(02469.HK)推出公考行業(yè)內(nèi)首個(gè)自研的垂直大模型,并宣布將于8月1日上線(xiàn)粉筆AI老師“粉筆頭”。

在此之前,網(wǎng)易有道(NYSE:DAO)、好未來(lái)(NYSE:TAL)、作業(yè)幫、猿輔導(dǎo)等教企均已推出各自訓(xùn)練的教育大模型,并結(jié)合口語(yǔ)陪練、作文批改、個(gè)性化學(xué)習(xí)等場(chǎng)景,在學(xué)習(xí)機(jī)、詞典筆等硬件中落地。

此前業(yè)內(nèi)有觀(guān)點(diǎn)認(rèn)為,隨著通用大模型能力的普遍增強(qiáng),垂直領(lǐng)域的模型沒(méi)有存在的必要對(duì)此,粉筆CTO陳建華有不同的看法。

據(jù)其介紹,粉筆從2023年一季度開(kāi)始探索大模型和教育的結(jié)合。發(fā)現(xiàn),某些場(chǎng)景里,通用大模型的表現(xiàn)不預(yù)期,比如在回答行測(cè)這類(lèi)客觀(guān)題時(shí),正確率非常低。在命題方面,通用大模型只能做到模仿題目的形態(tài),在題目的難度、內(nèi)容和考點(diǎn)設(shè)置上無(wú)法滿(mǎn)足需求。

但通用大模型在面試點(diǎn)評(píng)環(huán)節(jié)這類(lèi)受限的小場(chǎng)景下,效果非常且可控。面試點(diǎn)評(píng)是學(xué)生備考的剛需,之前主要由老師人工完成,工作量大、效率低、單價(jià)高,如果借助于A(yíng)I輔助老師進(jìn)行面試點(diǎn)評(píng),老師的點(diǎn)評(píng)時(shí)間可以從20分鐘縮短到5分鐘之內(nèi)。AI面試點(diǎn)評(píng)的可用率也可在90%以上。

面對(duì)通用大模型和垂直大模型之間的“紛爭(zhēng)”,好未來(lái)CTO田密也曾公開(kāi)表示,現(xiàn)在通用大模型可以來(lái)解決很多尋常的通用問(wèn)題,但在某個(gè)專(zhuān)項(xiàng)任務(wù)上只能解決到六七分的水平,如果想取得更好的結(jié)果,必須在垂直領(lǐng)域上做更專(zhuān)項(xiàng)的訓(xùn)練。

“大模型在B端(企業(yè))內(nèi)部提效方面會(huì)更容易落地。”陳建華稱(chēng),例如上述提到的面試點(diǎn)評(píng)場(chǎng)景,通過(guò)大模型給出點(diǎn)評(píng)的內(nèi)容,再輔導(dǎo)老師把關(guān),輸出到學(xué)生端,可提高效率

在他看來(lái),對(duì)于準(zhǔn)確性要求比較高的教育場(chǎng)景,C端(用戶(hù))應(yīng)用的落地會(huì)面臨著非常大的挑戰(zhàn),其中最大的挑戰(zhàn)就是大模型的“幻覺(jué)”問(wèn)題,例如在一些歷史人物類(lèi)的嘗試問(wèn)題中,可能會(huì)存在張冠李戴的效果,“這一點(diǎn)對(duì)教育行業(yè)來(lái)說(shuō)是非常致命的”。

目前,粉筆的做法是借助于RAG(Retrieval-Augmented Generation)檢索增強(qiáng)生成輔助來(lái)克服幻覺(jué),同時(shí)利用CoT(思維鏈)讓大模型按照步驟一步步進(jìn)行推理。

另一方面,采用分治法,嘗試將復(fù)雜的問(wèn)題拆分成足夠簡(jiǎn)單的任務(wù)再讓模型處理,陳建華稱(chēng),效果會(huì)遠(yuǎn)遠(yuǎn)好過(guò)于直接將整個(gè)復(fù)雜的任務(wù)交給模型處理。

“每個(gè)產(chǎn)品都值得用大模型技術(shù)重做一遍?!?/span>陳建華認(rèn)為,這里的重做不是要推倒過(guò)去已有的成果,而是要借助于大模型從效率、過(guò)程和結(jié)果上重塑整個(gè)流程,以提供更多可能性。

在應(yīng)用場(chǎng)景上,粉筆AI老師已覆蓋學(xué)員的入班測(cè)試理論學(xué)習(xí)、強(qiáng)化練習(xí)、模擬套卷,直到最后的沖刺階段。陳建華預(yù)計(jì)今年上線(xiàn)申論AI老師。此外,面試AI老師、事業(yè)單位和教師項(xiàng)目的AI老師也在籌備中。

粉筆副總裁劉帥表示,粉筆AI老師將是未來(lái)粉筆主流的最高端的產(chǎn)品之一。

越來(lái)越多的AI老師上線(xiàn),真人老師會(huì)失業(yè)嗎?

當(dāng)日發(fā)布會(huì)上,粉筆創(chuàng)始人、CEO張小龍對(duì)此予以否定,技術(shù)進(jìn)步并不意味著就能取代行業(yè)人士,學(xué)習(xí)的過(guò)程不僅僅是知識(shí)學(xué)習(xí),與此同時(shí)還伴隨著老師提供的情緒價(jià)值。相反,技術(shù)解放了人之后,身體會(huì)變得越來(lái)越強(qiáng),人也會(huì)變得越來(lái)越有智慧,更有趣、更有意識(shí)。

張小龍還表示,粉筆AI老師作為一款C端的AI產(chǎn)品,是“收費(fèi)”且“收得起費(fèi)”的。他同時(shí)呼吁:“中國(guó)科技領(lǐng)域的朋友們,不要都盯著通用大模型,可以多一些針對(duì)具體領(lǐng)域的具體服務(wù),早日實(shí)現(xiàn)商業(yè)化?!?/span>

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。