【界面會·對話】孫亞彬:文本自動處理技術(shù)加速企業(yè)向智能時代邁進(jìn)

2018年是人工智能的時代,勞動密集型企業(yè)依托文本智能處理將向智能化公司轉(zhuǎn)型,技術(shù)將成為時代核心。在1月24日界面主辦的浦江?新時代發(fā)展論壇上,界面新聞記者采訪了達(dá)觀數(shù)據(jù)高級運(yùn)營經(jīng)理孫亞彬。以下內(nèi)容為專訪文字實(shí)錄整理。

受訪嘉賓:達(dá)觀數(shù)據(jù)高級運(yùn)營經(jīng)理孫亞彬
采訪記者:界面記者
文字整理:陳昕媛

記者:達(dá)觀數(shù)據(jù)的定位是?

孫亞彬:我們達(dá)觀數(shù)據(jù)是一家專門做文本智能處理的一家公司,我們所有的產(chǎn)品包括我們的技術(shù),都是以文本處理為核心的,像我們目前接觸到的一些行業(yè)里面的客戶也是因?yàn)樗麄兤髽I(yè)內(nèi)部存在大量的文本數(shù)據(jù),他們沒有辦法來去挖掘其中的價(jià)值,就會找到像我們這樣的公司,由我們來給他提供一整套的系統(tǒng),來幫助他進(jìn)行文本數(shù)據(jù)的挖掘,從而可以幫助他們簡化整個工作的流程,提高他們整體運(yùn)營效率。

記者:那您能不能具體舉一下例子,你們現(xiàn)在主要服務(wù)哪些行業(yè)?哪些企業(yè)?

孫亞彬:我們現(xiàn)在大部分服務(wù)的行業(yè)集中在金融、銀行、保險(xiǎn)、法律等等,您可以看到其實(shí)像這些企業(yè)來說,他們有一個特點(diǎn),就是他們會招聘大量的人員來從事文檔資料審核的工作,舉個例子來說,我們有一個客戶,他在成都建立了一個數(shù)據(jù)服務(wù)中心,招聘了大概有1000名左右的本科畢業(yè)生,去幫助他來進(jìn)行公司內(nèi)部的文檔校對和審閱工作。我們?yōu)樗峁┝艘惶孜臋n智能審閱系統(tǒng)以后,可以幫助他大大節(jié)約這樣的人力。我們都知道文本校對其實(shí)是一個比較機(jī)械化的工作,需要人肉眼不斷地去看,不斷地去校對,而且一份文檔大部分都會有1000頁以上。

對于人來說,不僅是效率比較低,同時也經(jīng)常會出現(xiàn)一些錯誤,我們的系統(tǒng)等于是會自動化地把校對審閱的工作幫他解決掉,把其中的一些關(guān)鍵信息提取出來,我們的客戶只要把我們提取出來的一小部分的信息再重新進(jìn)行校對整理就可以了,大大地節(jié)約了客戶的人力成本以及時間成本。

記者:能否請您介紹一下公司在獲得A輪融資之后,主要做了哪些方面的布局?在2017年公司有哪些業(yè)務(wù)上的亮點(diǎn)?

孫亞彬:我們達(dá)觀數(shù)據(jù)是一家以技術(shù)驅(qū)動為核心的公司,我們公司的技術(shù)研發(fā)人員也占到了60%以上,所以在進(jìn)行A輪融資以后,我們也花了大量的精力在研發(fā)人員招募上。我們雖然是一家創(chuàng)業(yè)公司,但實(shí)際上我們對于技術(shù)人員的要求來說還是比較嚴(yán)苛的,因?yàn)榧夹g(shù)是我們最核心的點(diǎn),所以我們是希望能夠招募到更多的技術(shù)性人才來到我們的公司,來幫助我們夯實(shí)自身的技術(shù)實(shí)力。在2017年我們也逐漸發(fā)現(xiàn)在傳統(tǒng)的大型企業(yè)里面,有大量的文本處理需求,所以我們也針對這些傳統(tǒng)大型企業(yè),有一系列的新的產(chǎn)品,比方說合同智能審閱系統(tǒng),因?yàn)榇笃髽I(yè)里面有大量的合同文檔,這一類來說我們能夠幫他解決。

第二塊是我們的人才智能搜索平臺,因?yàn)閷τ谝恍┐笮推髽I(yè)來說,本身內(nèi)部就有可能有幾十萬人,本身在自己內(nèi)部招聘體系下面會有大量的需求,我們提供了一套整體的智能人才搜索平臺給我們客戶。

記者:能否透露一下公司在人員規(guī)模上,技術(shù)是公司的核心,現(xiàn)在規(guī)模人數(shù)有多少?

孫亞彬:我們現(xiàn)在差不多已經(jīng)將近100人,在今年2018年也會招募更多的技術(shù)人才,因?yàn)槲覀儸F(xiàn)在越來越多的大型企業(yè),是有私有化部署需求,所以我們也會在客戶現(xiàn)場進(jìn)行更多的項(xiàng)目人員實(shí)施。所以技術(shù)人才的需求還是比較多的。

記者:那您覺得2018年達(dá)觀數(shù)據(jù)主要有哪些布局?

孫亞彬:2018年大家都知道現(xiàn)在是一個人工智能的時代,大家都在喊用機(jī)器代替人,我們的話也是,對于我們公司來說,其實(shí)最核心的根本是讓機(jī)器代替人,當(dāng)然并不是說完全取代人,我們更多地是取代一些人去做機(jī)械化的工作,讓人騰出更多的時間去進(jìn)行一些更加富有創(chuàng)造性的工作。所以我們更多地在今年會與更多的傳統(tǒng)以勞動力密集的企業(yè),跟他們有更深入的合作,來幫助他們做這樣的一個傳統(tǒng)行業(yè)進(jìn)行到人工智能企業(yè)的轉(zhuǎn)型。像我們很多客戶,他們都說每個部門都在強(qiáng)調(diào)AI,我們也是希望通過達(dá)觀數(shù)據(jù)AI技術(shù),去幫助我們這些傳統(tǒng)的客戶進(jìn)行轉(zhuǎn)型。

記者:我也很好奇,你剛剛說為各種不同的企業(yè)做轉(zhuǎn)型,具體到項(xiàng)目實(shí)施的過程當(dāng)中,達(dá)觀是怎么樣去給這些客戶做個性化定制服務(wù)的呢?

孫亞彬:是這樣的,在人工智能行業(yè)里面,我們經(jīng)常說的是叫一秒鐘原則,所謂的一秒鐘原則就是說我們?nèi)嗽谝幻腌娭惪梢赃M(jìn)行判斷的事情,比方說我看到你,我知道我認(rèn)不認(rèn)識你,知道你是男是女,你是長發(fā)短發(fā),或者是我們?nèi)タ窜嚺?,我能一秒鐘把車牌號碼報(bào)出來等等,類似這樣的。我們叫做一秒鐘原則,就是說只要是人在一秒鐘能完成的事情,我們都能夠通過機(jī)械,通過系統(tǒng)計(jì)算機(jī)去代替人來完成。像現(xiàn)在行業(yè)里面很多做計(jì)算機(jī)視覺的,語音識別的和圖象識別的等等,我們其實(shí)是專注于在做文本識別的這一塊,像我剛才跟您提到的,像合同,還是說我們法院里面有這樣的法律文書,或者說我們在企業(yè)招聘的內(nèi)部每個人簡歷還是崗位描述等等,其實(shí)每一個都是跟文字相關(guān)的。

所以說我們的這項(xiàng)技術(shù)其實(shí)是可以運(yùn)用到企業(yè)只要有文字出現(xiàn)的地方,我們都可以去運(yùn)用。這邊再舉一個例子來說,其實(shí)我們大家都知道,以前每個公司都會有自己的客服部門,我們客服部門都是通過人工去接電話,或者說網(wǎng)上各種的客戶評論等等,當(dāng)他們需要對你某一個推出的產(chǎn)品進(jìn)行市場反饋的時候,也可能是去收集我們的客服人員主觀上的感受。通過達(dá)觀這邊,我們就可以把這些所有某個產(chǎn)品在市場上所有的客戶聲音收集過來,無論是語音的,還是文字的,最后都能轉(zhuǎn)化成文本數(shù)據(jù)。通過我們這些數(shù)據(jù)進(jìn)行分析,從這些數(shù)據(jù)里面挖掘出市場對具體某一塊產(chǎn)品的真實(shí)反饋,我們再把這些反饋的結(jié)果反饋給我們的客戶,這種是更加客觀性,更加全面地來做這樣的客戶評論分析。

比過去只是通過人工去進(jìn)行統(tǒng)計(jì)效果會更好,所以說我們更多地是聚焦于企業(yè)內(nèi)部的文本數(shù)據(jù),只要有文本的數(shù)據(jù),我們都可以把它轉(zhuǎn)化成這樣的可行產(chǎn)品來服務(wù)于我們的企業(yè)。

記者:知道大數(shù)據(jù)其實(shí)也是一個風(fēng)口行業(yè),包括像國內(nèi)外的一些互聯(lián)網(wǎng)巨頭,其實(shí)也都是在布局,國內(nèi)也是有不少創(chuàng)業(yè)公司不斷地在涌現(xiàn),您覺得行業(yè)在未來2-3年內(nèi),還有怎樣的挑戰(zhàn)和機(jī)遇呢?作為一個業(yè)內(nèi)人士。

孫亞彬:我覺得目前來說,其實(shí)人工智能這一塊還是有很多的機(jī)會,現(xiàn)在可能大家面向于對于每一個普通的用戶來說,其實(shí)我們能看到有做無人駕駛的也好,還是人臉識別也好,還有交互的智能機(jī)器人也好,其實(shí)我們更多的是C端用戶能夠感受到的,而實(shí)際上在背后其實(shí)還有很多企業(yè)服務(wù)級的應(yīng)用產(chǎn)品,這一片會有很多的未來,有這樣的獨(dú)角獸公司涌現(xiàn)出來,他們可能對于現(xiàn)在普通的用戶來說,可能感受不到,但是對于我們這種面向to B的企業(yè)來說,發(fā)現(xiàn)企業(yè)中有迫切要實(shí)現(xiàn)的需求。就像我剛才前面跟您提到的,所有的傳統(tǒng)企業(yè)都在希望自己從勞動型密集的企業(yè)轉(zhuǎn)化成一家更加智能化的公司,那我覺得這塊在未來有更多的機(jī)會。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。

評論

暫無評論哦,快來評價(jià)一下吧!

【界面會·對話】孫亞彬:文本自動處理技術(shù)加速企業(yè)向智能時代邁進(jìn)

2018年是人工智能的時代,勞動密集型企業(yè)依托文本智能處理將向智能化公司轉(zhuǎn)型,技術(shù)將成為時代核心。在1月24日界面主辦的浦江?新時代發(fā)展論壇上,界面新聞記者采訪了達(dá)觀數(shù)據(jù)高級運(yùn)營經(jīng)理孫亞彬。以下內(nèi)容為專訪文字實(shí)錄整理。

受訪嘉賓:達(dá)觀數(shù)據(jù)高級運(yùn)營經(jīng)理孫亞彬
采訪記者:界面記者
文字整理:陳昕媛

記者:達(dá)觀數(shù)據(jù)的定位是?

孫亞彬:我們達(dá)觀數(shù)據(jù)是一家專門做文本智能處理的一家公司,我們所有的產(chǎn)品包括我們的技術(shù),都是以文本處理為核心的,像我們目前接觸到的一些行業(yè)里面的客戶也是因?yàn)樗麄兤髽I(yè)內(nèi)部存在大量的文本數(shù)據(jù),他們沒有辦法來去挖掘其中的價(jià)值,就會找到像我們這樣的公司,由我們來給他提供一整套的系統(tǒng),來幫助他進(jìn)行文本數(shù)據(jù)的挖掘,從而可以幫助他們簡化整個工作的流程,提高他們整體運(yùn)營效率。

記者:那您能不能具體舉一下例子,你們現(xiàn)在主要服務(wù)哪些行業(yè)?哪些企業(yè)?

孫亞彬:我們現(xiàn)在大部分服務(wù)的行業(yè)集中在金融、銀行、保險(xiǎn)、法律等等,您可以看到其實(shí)像這些企業(yè)來說,他們有一個特點(diǎn),就是他們會招聘大量的人員來從事文檔資料審核的工作,舉個例子來說,我們有一個客戶,他在成都建立了一個數(shù)據(jù)服務(wù)中心,招聘了大概有1000名左右的本科畢業(yè)生,去幫助他來進(jìn)行公司內(nèi)部的文檔校對和審閱工作。我們?yōu)樗峁┝艘惶孜臋n智能審閱系統(tǒng)以后,可以幫助他大大節(jié)約這樣的人力。我們都知道文本校對其實(shí)是一個比較機(jī)械化的工作,需要人肉眼不斷地去看,不斷地去校對,而且一份文檔大部分都會有1000頁以上。

對于人來說,不僅是效率比較低,同時也經(jīng)常會出現(xiàn)一些錯誤,我們的系統(tǒng)等于是會自動化地把校對審閱的工作幫他解決掉,把其中的一些關(guān)鍵信息提取出來,我們的客戶只要把我們提取出來的一小部分的信息再重新進(jìn)行校對整理就可以了,大大地節(jié)約了客戶的人力成本以及時間成本。

記者:能否請您介紹一下公司在獲得A輪融資之后,主要做了哪些方面的布局?在2017年公司有哪些業(yè)務(wù)上的亮點(diǎn)?

孫亞彬:我們達(dá)觀數(shù)據(jù)是一家以技術(shù)驅(qū)動為核心的公司,我們公司的技術(shù)研發(fā)人員也占到了60%以上,所以在進(jìn)行A輪融資以后,我們也花了大量的精力在研發(fā)人員招募上。我們雖然是一家創(chuàng)業(yè)公司,但實(shí)際上我們對于技術(shù)人員的要求來說還是比較嚴(yán)苛的,因?yàn)榧夹g(shù)是我們最核心的點(diǎn),所以我們是希望能夠招募到更多的技術(shù)性人才來到我們的公司,來幫助我們夯實(shí)自身的技術(shù)實(shí)力。在2017年我們也逐漸發(fā)現(xiàn)在傳統(tǒng)的大型企業(yè)里面,有大量的文本處理需求,所以我們也針對這些傳統(tǒng)大型企業(yè),有一系列的新的產(chǎn)品,比方說合同智能審閱系統(tǒng),因?yàn)榇笃髽I(yè)里面有大量的合同文檔,這一類來說我們能夠幫他解決。

第二塊是我們的人才智能搜索平臺,因?yàn)閷τ谝恍┐笮推髽I(yè)來說,本身內(nèi)部就有可能有幾十萬人,本身在自己內(nèi)部招聘體系下面會有大量的需求,我們提供了一套整體的智能人才搜索平臺給我們客戶。

記者:能否透露一下公司在人員規(guī)模上,技術(shù)是公司的核心,現(xiàn)在規(guī)模人數(shù)有多少?

孫亞彬:我們現(xiàn)在差不多已經(jīng)將近100人,在今年2018年也會招募更多的技術(shù)人才,因?yàn)槲覀儸F(xiàn)在越來越多的大型企業(yè),是有私有化部署需求,所以我們也會在客戶現(xiàn)場進(jìn)行更多的項(xiàng)目人員實(shí)施。所以技術(shù)人才的需求還是比較多的。

記者:那您覺得2018年達(dá)觀數(shù)據(jù)主要有哪些布局?

孫亞彬:2018年大家都知道現(xiàn)在是一個人工智能的時代,大家都在喊用機(jī)器代替人,我們的話也是,對于我們公司來說,其實(shí)最核心的根本是讓機(jī)器代替人,當(dāng)然并不是說完全取代人,我們更多地是取代一些人去做機(jī)械化的工作,讓人騰出更多的時間去進(jìn)行一些更加富有創(chuàng)造性的工作。所以我們更多地在今年會與更多的傳統(tǒng)以勞動力密集的企業(yè),跟他們有更深入的合作,來幫助他們做這樣的一個傳統(tǒng)行業(yè)進(jìn)行到人工智能企業(yè)的轉(zhuǎn)型。像我們很多客戶,他們都說每個部門都在強(qiáng)調(diào)AI,我們也是希望通過達(dá)觀數(shù)據(jù)AI技術(shù),去幫助我們這些傳統(tǒng)的客戶進(jìn)行轉(zhuǎn)型。

記者:我也很好奇,你剛剛說為各種不同的企業(yè)做轉(zhuǎn)型,具體到項(xiàng)目實(shí)施的過程當(dāng)中,達(dá)觀是怎么樣去給這些客戶做個性化定制服務(wù)的呢?

孫亞彬:是這樣的,在人工智能行業(yè)里面,我們經(jīng)常說的是叫一秒鐘原則,所謂的一秒鐘原則就是說我們?nèi)嗽谝幻腌娭惪梢赃M(jìn)行判斷的事情,比方說我看到你,我知道我認(rèn)不認(rèn)識你,知道你是男是女,你是長發(fā)短發(fā),或者是我們?nèi)タ窜嚺?,我能一秒鐘把車牌號碼報(bào)出來等等,類似這樣的。我們叫做一秒鐘原則,就是說只要是人在一秒鐘能完成的事情,我們都能夠通過機(jī)械,通過系統(tǒng)計(jì)算機(jī)去代替人來完成。像現(xiàn)在行業(yè)里面很多做計(jì)算機(jī)視覺的,語音識別的和圖象識別的等等,我們其實(shí)是專注于在做文本識別的這一塊,像我剛才跟您提到的,像合同,還是說我們法院里面有這樣的法律文書,或者說我們在企業(yè)招聘的內(nèi)部每個人簡歷還是崗位描述等等,其實(shí)每一個都是跟文字相關(guān)的。

所以說我們的這項(xiàng)技術(shù)其實(shí)是可以運(yùn)用到企業(yè)只要有文字出現(xiàn)的地方,我們都可以去運(yùn)用。這邊再舉一個例子來說,其實(shí)我們大家都知道,以前每個公司都會有自己的客服部門,我們客服部門都是通過人工去接電話,或者說網(wǎng)上各種的客戶評論等等,當(dāng)他們需要對你某一個推出的產(chǎn)品進(jìn)行市場反饋的時候,也可能是去收集我們的客服人員主觀上的感受。通過達(dá)觀這邊,我們就可以把這些所有某個產(chǎn)品在市場上所有的客戶聲音收集過來,無論是語音的,還是文字的,最后都能轉(zhuǎn)化成文本數(shù)據(jù)。通過我們這些數(shù)據(jù)進(jìn)行分析,從這些數(shù)據(jù)里面挖掘出市場對具體某一塊產(chǎn)品的真實(shí)反饋,我們再把這些反饋的結(jié)果反饋給我們的客戶,這種是更加客觀性,更加全面地來做這樣的客戶評論分析。

比過去只是通過人工去進(jìn)行統(tǒng)計(jì)效果會更好,所以說我們更多地是聚焦于企業(yè)內(nèi)部的文本數(shù)據(jù),只要有文本的數(shù)據(jù),我們都可以把它轉(zhuǎn)化成這樣的可行產(chǎn)品來服務(wù)于我們的企業(yè)。

記者:知道大數(shù)據(jù)其實(shí)也是一個風(fēng)口行業(yè),包括像國內(nèi)外的一些互聯(lián)網(wǎng)巨頭,其實(shí)也都是在布局,國內(nèi)也是有不少創(chuàng)業(yè)公司不斷地在涌現(xiàn),您覺得行業(yè)在未來2-3年內(nèi),還有怎樣的挑戰(zhàn)和機(jī)遇呢?作為一個業(yè)內(nèi)人士。

孫亞彬:我覺得目前來說,其實(shí)人工智能這一塊還是有很多的機(jī)會,現(xiàn)在可能大家面向于對于每一個普通的用戶來說,其實(shí)我們能看到有做無人駕駛的也好,還是人臉識別也好,還有交互的智能機(jī)器人也好,其實(shí)我們更多的是C端用戶能夠感受到的,而實(shí)際上在背后其實(shí)還有很多企業(yè)服務(wù)級的應(yīng)用產(chǎn)品,這一片會有很多的未來,有這樣的獨(dú)角獸公司涌現(xiàn)出來,他們可能對于現(xiàn)在普通的用戶來說,可能感受不到,但是對于我們這種面向to B的企業(yè)來說,發(fā)現(xiàn)企業(yè)中有迫切要實(shí)現(xiàn)的需求。就像我剛才前面跟您提到的,所有的傳統(tǒng)企業(yè)都在希望自己從勞動型密集的企業(yè)轉(zhuǎn)化成一家更加智能化的公司,那我覺得這塊在未來有更多的機(jī)會。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。