正在閱讀:

上海數(shù)交所上線語(yǔ)料庫(kù),首批掛牌近30個(gè)語(yǔ)料庫(kù)產(chǎn)品

掃一掃下載界面新聞APP

上海數(shù)交所上線語(yǔ)料庫(kù),首批掛牌近30個(gè)語(yǔ)料庫(kù)產(chǎn)品

上海數(shù)交所官網(wǎng)已經(jīng)于7月7日正式上線語(yǔ)料庫(kù),累計(jì)掛牌近30個(gè)語(yǔ)料數(shù)據(jù)產(chǎn)品,包含文本、音頻、圖像等多模態(tài),覆蓋金融、交通運(yùn)輸和醫(yī)療等領(lǐng)域。

圖片來(lái)源:圖蟲(chóng)

界面新聞2023年7月8日從2023世界人工智能大會(huì)“大模型時(shí)代下的數(shù)據(jù)要素流通”主題論壇上獲悉,上海數(shù)交所官網(wǎng)已經(jīng)于7月7日正式上線語(yǔ)料庫(kù),累計(jì)掛牌近30個(gè)語(yǔ)料數(shù)據(jù)產(chǎn)品,包含文本、音頻、圖像等多模態(tài),覆蓋金融、交通運(yùn)輸和醫(yī)療等領(lǐng)域。

語(yǔ)料庫(kù)是大模型訓(xùn)練不可或缺的要素。

上海數(shù)交所總經(jīng)理湯奇峰認(rèn)為,大模型時(shí)代下的語(yǔ)料庫(kù)建設(shè)存在語(yǔ)料庫(kù)供給不足、語(yǔ)料庫(kù)質(zhì)量不高、語(yǔ)料庫(kù)多樣性匱乏、語(yǔ)料庫(kù)標(biāo)準(zhǔn)欠缺等問(wèn)題?!罢Z(yǔ)料庫(kù)建設(shè)不是單一企業(yè)的責(zé)任,需要多方共同推進(jìn),如果每個(gè)企業(yè)都單獨(dú)建設(shè)維護(hù)語(yǔ)料庫(kù),會(huì)拉低效率,也會(huì)增加企業(yè)成本,數(shù)交所希望通過(guò)自己的努力加強(qiáng)數(shù)據(jù)要素建設(shè)提升語(yǔ)料庫(kù)建設(shè)效率?!?/p>

為此,上海數(shù)據(jù)交易所在上線語(yǔ)料庫(kù)的同時(shí),牽頭發(fā)起語(yǔ)料數(shù)據(jù)生態(tài)創(chuàng)新合作伙伴計(jì)劃。

據(jù)其透露,上海數(shù)據(jù)交易所首批合作伙伴包括上海人工智能實(shí)驗(yàn)室、商湯科技、中國(guó)知網(wǎng)、瀾舟科技、OpenKG、拓爾思、新致和蜜度,旨在引導(dǎo)不同行業(yè)、不同領(lǐng)域、具有一定規(guī)模的高質(zhì)量語(yǔ)料數(shù)據(jù)產(chǎn)品掛牌交易,推動(dòng)人工智能大模型技術(shù)創(chuàng)新與應(yīng)用落地,進(jìn)一步豐富語(yǔ)料庫(kù)多樣性,助力數(shù)據(jù)要素市場(chǎng)建設(shè)。

上海數(shù)交所總經(jīng)理湯奇峰表示,大模型建設(shè)中,語(yǔ)料庫(kù)是一個(gè)非常重要的方向,語(yǔ)料庫(kù)采購(gòu)已經(jīng)在不少大模型企業(yè)成本中占據(jù)重要比重,上海數(shù)交所希望以市場(chǎng)配置的方式組織數(shù)據(jù)要素推動(dòng)語(yǔ)料庫(kù)建設(shè)。

上海數(shù)交所建設(shè)語(yǔ)料庫(kù)主要考慮兩個(gè)維度,一是語(yǔ)料庫(kù)的質(zhì)量,另一個(gè)是語(yǔ)料庫(kù)的開(kāi)放程度?!氨热缬械钠髽I(yè)具有海量高質(zhì)量數(shù)據(jù)資源,開(kāi)放意愿度也很高,但需要組織大量社會(huì)第三方企業(yè)幫助組織相關(guān)的大模型訓(xùn)練,我們針對(duì)四類(lèi)數(shù)據(jù)產(chǎn)品開(kāi)發(fā)情況不同、實(shí)際需求不同的供方企業(yè)制定了差異化工作策略,著力打造語(yǔ)料數(shù)據(jù)生態(tài)?!睖娣逭f(shuō)。

目前,上海正在引導(dǎo)、扶持企業(yè)積極發(fā)展以大模型為代表的人工智能技術(shù)。

上海市經(jīng)濟(jì)和信息化委員會(huì)信息化推進(jìn)處處長(zhǎng)錢(qián)曉在會(huì)上透露,2022年上海市數(shù)據(jù)核心企業(yè)突破1200家,核心產(chǎn)業(yè)規(guī)模近3400億元;建設(shè)了上海數(shù)據(jù)交易所,累計(jì)掛牌數(shù)據(jù)產(chǎn)品超1300個(gè),率先提出數(shù)商體系,數(shù)商新業(yè)態(tài)蓬勃興起,全國(guó)首個(gè)數(shù)據(jù)要素產(chǎn)業(yè)集聚區(qū)在張江啟動(dòng)建設(shè)。

他表示,未來(lái)將繼續(xù)加強(qiáng)技術(shù)創(chuàng)新,形成行業(yè)領(lǐng)先的高質(zhì)量語(yǔ)料標(biāo)準(zhǔn)操作流程和技術(shù)規(guī)范;完善組織機(jī)制,形成包括圖書(shū)館、媒體、互聯(lián)網(wǎng)平臺(tái)、大數(shù)據(jù)企業(yè)等在內(nèi)的核心數(shù)據(jù)伙伴群;做好評(píng)估機(jī)制,加快構(gòu)建高質(zhì)量數(shù)據(jù)集的評(píng)價(jià)指標(biāo)體系。

 

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

上海數(shù)交所上線語(yǔ)料庫(kù),首批掛牌近30個(gè)語(yǔ)料庫(kù)產(chǎn)品

上海數(shù)交所官網(wǎng)已經(jīng)于7月7日正式上線語(yǔ)料庫(kù),累計(jì)掛牌近30個(gè)語(yǔ)料數(shù)據(jù)產(chǎn)品,包含文本、音頻、圖像等多模態(tài),覆蓋金融、交通運(yùn)輸和醫(yī)療等領(lǐng)域。

圖片來(lái)源:圖蟲(chóng)

界面新聞2023年7月8日從2023世界人工智能大會(huì)“大模型時(shí)代下的數(shù)據(jù)要素流通”主題論壇上獲悉,上海數(shù)交所官網(wǎng)已經(jīng)于7月7日正式上線語(yǔ)料庫(kù),累計(jì)掛牌近30個(gè)語(yǔ)料數(shù)據(jù)產(chǎn)品,包含文本、音頻、圖像等多模態(tài),覆蓋金融、交通運(yùn)輸和醫(yī)療等領(lǐng)域。

語(yǔ)料庫(kù)是大模型訓(xùn)練不可或缺的要素。

上海數(shù)交所總經(jīng)理湯奇峰認(rèn)為,大模型時(shí)代下的語(yǔ)料庫(kù)建設(shè)存在語(yǔ)料庫(kù)供給不足、語(yǔ)料庫(kù)質(zhì)量不高、語(yǔ)料庫(kù)多樣性匱乏、語(yǔ)料庫(kù)標(biāo)準(zhǔn)欠缺等問(wèn)題?!罢Z(yǔ)料庫(kù)建設(shè)不是單一企業(yè)的責(zé)任,需要多方共同推進(jìn),如果每個(gè)企業(yè)都單獨(dú)建設(shè)維護(hù)語(yǔ)料庫(kù),會(huì)拉低效率,也會(huì)增加企業(yè)成本,數(shù)交所希望通過(guò)自己的努力加強(qiáng)數(shù)據(jù)要素建設(shè)提升語(yǔ)料庫(kù)建設(shè)效率?!?/p>

為此,上海數(shù)據(jù)交易所在上線語(yǔ)料庫(kù)的同時(shí),牽頭發(fā)起語(yǔ)料數(shù)據(jù)生態(tài)創(chuàng)新合作伙伴計(jì)劃。

據(jù)其透露,上海數(shù)據(jù)交易所首批合作伙伴包括上海人工智能實(shí)驗(yàn)室、商湯科技、中國(guó)知網(wǎng)、瀾舟科技、OpenKG、拓爾思、新致和蜜度,旨在引導(dǎo)不同行業(yè)、不同領(lǐng)域、具有一定規(guī)模的高質(zhì)量語(yǔ)料數(shù)據(jù)產(chǎn)品掛牌交易,推動(dòng)人工智能大模型技術(shù)創(chuàng)新與應(yīng)用落地,進(jìn)一步豐富語(yǔ)料庫(kù)多樣性,助力數(shù)據(jù)要素市場(chǎng)建設(shè)。

上海數(shù)交所總經(jīng)理湯奇峰表示,大模型建設(shè)中,語(yǔ)料庫(kù)是一個(gè)非常重要的方向,語(yǔ)料庫(kù)采購(gòu)已經(jīng)在不少大模型企業(yè)成本中占據(jù)重要比重,上海數(shù)交所希望以市場(chǎng)配置的方式組織數(shù)據(jù)要素推動(dòng)語(yǔ)料庫(kù)建設(shè)。

上海數(shù)交所建設(shè)語(yǔ)料庫(kù)主要考慮兩個(gè)維度,一是語(yǔ)料庫(kù)的質(zhì)量,另一個(gè)是語(yǔ)料庫(kù)的開(kāi)放程度?!氨热缬械钠髽I(yè)具有海量高質(zhì)量數(shù)據(jù)資源,開(kāi)放意愿度也很高,但需要組織大量社會(huì)第三方企業(yè)幫助組織相關(guān)的大模型訓(xùn)練,我們針對(duì)四類(lèi)數(shù)據(jù)產(chǎn)品開(kāi)發(fā)情況不同、實(shí)際需求不同的供方企業(yè)制定了差異化工作策略,著力打造語(yǔ)料數(shù)據(jù)生態(tài)。”湯奇峰說(shuō)。

目前,上海正在引導(dǎo)、扶持企業(yè)積極發(fā)展以大模型為代表的人工智能技術(shù)。

上海市經(jīng)濟(jì)和信息化委員會(huì)信息化推進(jìn)處處長(zhǎng)錢(qián)曉在會(huì)上透露,2022年上海市數(shù)據(jù)核心企業(yè)突破1200家,核心產(chǎn)業(yè)規(guī)模近3400億元;建設(shè)了上海數(shù)據(jù)交易所,累計(jì)掛牌數(shù)據(jù)產(chǎn)品超1300個(gè),率先提出數(shù)商體系,數(shù)商新業(yè)態(tài)蓬勃興起,全國(guó)首個(gè)數(shù)據(jù)要素產(chǎn)業(yè)集聚區(qū)在張江啟動(dòng)建設(shè)。

他表示,未來(lái)將繼續(xù)加強(qiáng)技術(shù)創(chuàng)新,形成行業(yè)領(lǐng)先的高質(zhì)量語(yǔ)料標(biāo)準(zhǔn)操作流程和技術(shù)規(guī)范;完善組織機(jī)制,形成包括圖書(shū)館、媒體、互聯(lián)網(wǎng)平臺(tái)、大數(shù)據(jù)企業(yè)等在內(nèi)的核心數(shù)據(jù)伙伴群;做好評(píng)估機(jī)制,加快構(gòu)建高質(zhì)量數(shù)據(jù)集的評(píng)價(jià)指標(biāo)體系。

 

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。