文 | 硅兔賽跑 Lexie
編輯|Lu
在關(guān)于A(yíng)I的大討論中,人們?yōu)槠滟x予的角色要么是我們最得力的高效助手,要么則是將顛覆我們的“機(jī)器軍團(tuán)”,不管是敵是友, AI不僅要能完成人類(lèi)布置的任務(wù),還要能“讀懂”人心,而這一讀心能力也正是今年以來(lái)AI領(lǐng)域的重頭戲。
在PitchBook今年發(fā)布的企業(yè)Saas新興技術(shù)研究報(bào)告中,「情感AI」成為了一大技術(shù)亮點(diǎn),它指的是使用情感計(jì)算和人工智能技術(shù)來(lái)感知、了解和進(jìn)行對(duì)人類(lèi)情感的互動(dòng),試圖通過(guò)分析文字、面部表情、聲音和其他生理信號(hào)來(lái)理解人類(lèi)的情緒,簡(jiǎn)單來(lái)說(shuō),情感AI就是希望機(jī)器能像人類(lèi)一樣,甚至比人類(lèi)更好地“讀懂”情感。
它的主要技術(shù)包括:
面部表情分析:通過(guò)攝像頭、計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí),檢測(cè)微表情與面部肌肉運(yùn)動(dòng)。
聲音分析:通過(guò)聲紋、語(yǔ)調(diào)、節(jié)奏識(shí)別情緒狀態(tài)。
文本分析:借助自然語(yǔ)言處理(NLP)技術(shù)解讀語(yǔ)句和上下文。
生理信號(hào)監(jiān)測(cè):使用可穿戴設(shè)備分析心率、皮膚反應(yīng)等,提升互動(dòng)個(gè)性化和情感豐富度。
Emotion AI
情感AI的前身是情感分析技術(shù),它主要是通過(guò)文本互動(dòng)進(jìn)行分析,比如在社交媒體上通過(guò)文字進(jìn)行用戶(hù)情感的分析和提取,而有了AI的加持,整合視覺(jué)和音頻等多種輸入方式,情感AI承諾著更加精準(zhǔn)和完整的情感分析。
01 VC撒錢(qián),創(chuàng)企獲巨額融資
硅兔君觀(guān)察,情感AI的潛力吸引了眾多投資者的關(guān)注,一些專(zhuān)注于這個(gè)領(lǐng)域的初創(chuàng)公司像Uniphore、MorphCast等,已經(jīng)在這一賽道上獲得了大量投資。
來(lái)自加州的Uniphore從2008年起就在探索為企業(yè)提供自動(dòng)化對(duì)話(huà)解決方案,已經(jīng)開(kāi)發(fā)出包括U-Self Serve、U-Assist、U-Capture和U-Analyze等多個(gè)產(chǎn)品線(xiàn),幫助客戶(hù)通過(guò)語(yǔ)音、文本、視覺(jué)和情感AI技術(shù)進(jìn)行更加個(gè)性化和情感豐富的互動(dòng)。U-Self Serve主打精準(zhǔn)識(shí)別對(duì)話(huà)中的情感和語(yǔ)氣,讓企業(yè)能夠提供更加個(gè)性化的服務(wù),來(lái)提升用戶(hù)參與滿(mǎn)意度;
U-Self Serve
U-Assist則能通過(guò)實(shí)時(shí)指導(dǎo)和工作流程的自動(dòng)化來(lái)提高客服代理的工作效率;U-Capture可以通過(guò)自動(dòng)化的情感數(shù)據(jù)收集和分析,讓企業(yè)擁有對(duì)客戶(hù)需求和滿(mǎn)意度的深度洞察;而U-Analyze則能夠幫助客戶(hù)識(shí)別互動(dòng)中的關(guān)鍵趨勢(shì)和情感變化,提供由數(shù)據(jù)驅(qū)動(dòng)的決策支持來(lái)增強(qiáng)品牌忠誠(chéng)度。
Uniphore的技術(shù)并不僅僅是讓機(jī)器理解語(yǔ)言,而是希望它們能在與人類(lèi)互動(dòng)時(shí),捕捉和解讀隱藏在語(yǔ)氣、表情背后的情感。這種能力讓企業(yè)在與客戶(hù)互動(dòng)時(shí),不再只是機(jī)械化應(yīng)對(duì),而是能夠更好地滿(mǎn)足客戶(hù)的情感需求,通過(guò)使用Uniphore, 企業(yè)的用戶(hù)滿(mǎn)意度能夠達(dá)到87%,客服表現(xiàn)提升30%。
Uniphore至今已經(jīng)完成了超6.2億美元融資,最近一輪投資來(lái)自于2022年由NEA領(lǐng)投的4億美元,March Capital等現(xiàn)有的投資者也進(jìn)行了參投,此輪后估值達(dá)到了25億美元。
Uniphore
Hume AI則推出了世界上第一個(gè)能夠共情的語(yǔ)音AI,由前Google科學(xué)家Alan Cowen創(chuàng)立,他曾以開(kāi)創(chuàng)了語(yǔ)義空間理論而出名,這一理論通過(guò)揭示聲音、面部和手勢(shì)的細(xì)微差別,來(lái)理解情緒體驗(yàn)和表達(dá),Cowen的研究成果發(fā)表在“自然“和“認(rèn)知科學(xué)趨勢(shì)”等眾多期刊上,涉及迄今為止研究范圍最廣、最多樣化的情緒樣本。
以此研究驅(qū)動(dòng)的Hume開(kāi)發(fā)出了對(duì)話(huà)式語(yǔ)音 API - EVI,它結(jié)合了大型語(yǔ)言模型和同理心算法,能夠深入理解和解析人類(lèi)的情感狀態(tài),它不但能識(shí)別語(yǔ)音中的情感,還能在與用戶(hù)的互動(dòng)中做出更加細(xì)膩和個(gè)性化的反應(yīng),而開(kāi)發(fā)人員只需幾行代碼即可使用這些功能,并可將其內(nèi)置到任何應(yīng)用程序中。
Hume AI
當(dāng)前大多數(shù)AI系統(tǒng)的主要限制之一在于它的指令主要由人類(lèi)給出,這些指令和提示容易出錯(cuò)且無(wú)法挖掘出人工智能的巨大潛力,而Hume所開(kāi)發(fā)出的共情大型語(yǔ)言模型 (eLLM) 能夠根據(jù)上下文和用戶(hù)的情緒表達(dá)調(diào)整其使用的詞語(yǔ)和語(yǔ)調(diào),通過(guò)將人類(lèi)快樂(lè)作為第一原則進(jìn)行機(jī)器的學(xué)習(xí)、調(diào)整和互動(dòng),在心理健康、教育培訓(xùn)、急救呼叫、品牌分析等多個(gè)場(chǎng)景中都能為用戶(hù)帶來(lái)更加自然和真實(shí)的體驗(yàn)。
就在今年3月,Hume AI 完成了由EQT Ventures領(lǐng)投的5000萬(wàn)美元B輪融資,投資方還包括Union Square Ventures、Nat Friedman &Daniel Gross、Metaplanet和Northwell Holdings等機(jī)構(gòu)。
在這一領(lǐng)域的還有專(zhuān)門(mén)衡量消費(fèi)者認(rèn)知和情感反應(yīng)的Entropik,通過(guò) Decode這一融合了情感AI、行為AI、生成AI和預(yù)測(cè)AI綜合力量的功能,它能夠更好了解消費(fèi)者的行為和偏好,從而提供更個(gè)性化的營(yíng)銷(xiāo)建議,Entropik最近在2023年2月完成了2500萬(wàn)美元的B輪融資,投資方包括SIG Venture Capital和Bessemer Venture Partners。
Entropik
02 巨頭參與,一片混戰(zhàn)
科技大廠(chǎng)憑借自身優(yōu)勢(shì),在情感AI這一領(lǐng)域也有所布局。
包括 Microsoft Azure認(rèn)知服務(wù)的情感API,能夠通過(guò)分析面部表情和情緒,來(lái)識(shí)別圖片和視頻中的喜悅、憤怒、悲傷、驚訝等多種情緒;
IBM Watson的自然語(yǔ)言理解API可以處理大量文本數(shù)據(jù),識(shí)別出背后的情感傾向(如積極、消極或中性),來(lái)更精準(zhǔn)的解讀用戶(hù)意圖;
Google Cloud AI 的 Cloud Vision API 擁有強(qiáng)大的圖像分析功能,能夠快速識(shí)別圖片中的情緒表達(dá),且支持文字識(shí)別和情緒關(guān)聯(lián);
AWS 的 Rekognition也能夠檢測(cè)情緒、識(shí)別面部特征并追蹤表情變化,還可以與其他AWS服務(wù)結(jié)合使用,成為完整的社媒分析或情感AI驅(qū)動(dòng)的營(yíng)銷(xiāo)應(yīng)用。
Cloud Vision API
有些初創(chuàng)公司在情感AI領(lǐng)域的研發(fā)腳步更快,甚至到了科技巨頭都要“挖人”的地步,比如獨(dú)角獸Inflection AI就被投資方微軟看中了AI團(tuán)隊(duì)和模型,微軟在與Bill Gates、Eric Schmidt和NVIDIA等多方共同為Inflection AI投下了13億美元后,向AI領(lǐng)軍人物也是Inflection AI的聯(lián)合創(chuàng)立者之一Mustafa Suleyman拋出橄欖枝,隨后Suleyman連帶70多位員工轉(zhuǎn)投微軟,而微軟也為此支付了近6.5億美元。
不過(guò),Inflection AI也很快重整旗鼓,組建了來(lái)自擁有谷歌翻譯、 AI咨詢(xún)和AR 多個(gè)背景的新團(tuán)隊(duì),繼續(xù)在其核心產(chǎn)品Pi上持續(xù)發(fā)力。Pi是一款能夠理解并回應(yīng)用戶(hù)情感的個(gè)人助手,與傳統(tǒng)的AI不同,Pi 更加注重與用戶(hù)建立情感連接,通過(guò)分析語(yǔ)音、文字等輸入感知情緒,在對(duì)話(huà)中展現(xiàn)出同理心。Inflection AI將Pi視為教練、知己、傾聽(tīng)者和創(chuàng)意伙伴,而不是簡(jiǎn)單的AI助手。此外,Pi 擁有強(qiáng)大的記憶功能,能夠記住用戶(hù)的多次對(duì)話(huà)歷史,以此來(lái)提升互動(dòng)的連續(xù)性和個(gè)性化體驗(yàn)。
Inflection AI Pi
03 發(fā)展之路,關(guān)注和質(zhì)疑并存
雖然情感AI寄托著我們對(duì)更加人性化互動(dòng)方式的期許,但就像所有的AI技術(shù)一樣,它的推廣更伴隨著關(guān)注和質(zhì)疑。首先,情感AI是否真的能夠準(zhǔn)確解讀人類(lèi)的情感?在理論上,這項(xiàng)技術(shù)的確能夠使服務(wù)、設(shè)備和技術(shù)的體驗(yàn)更加豐富,但從現(xiàn)實(shí)的角度來(lái)看,人類(lèi)的情感本質(zhì)上是模糊和主觀(guān)的,早在2019年就有研究人員曾對(duì)這項(xiàng)技術(shù)提出質(zhì)疑,表示面部表情并不能可靠的反映人類(lèi)的真實(shí)情感,因此單純依賴(lài)機(jī)器來(lái)模擬人類(lèi)的面部表情、體態(tài)和語(yǔ)調(diào)來(lái)理解情感, 存在著一定的局限性。
其次,嚴(yán)格的法規(guī)監(jiān)管也一直是AI發(fā)展路上的絆腳石,比如歐盟的AI法案禁止在類(lèi)似教育等領(lǐng)域使用使用計(jì)算機(jī)視覺(jué)情感檢測(cè)系統(tǒng),因此可能會(huì)限制某些情感AI解決方案的推廣;像是美國(guó)伊利諾伊等州也有法律禁止在未獲許可的情況下進(jìn)行生物識(shí)別數(shù)據(jù)的收集,這就直接限制了情感AI某些技術(shù)使用的前提。同時(shí),數(shù)據(jù)隱私和保護(hù)更是一個(gè)重要問(wèn)題,情感AI通常應(yīng)用于教育、健康、保險(xiǎn)等對(duì)數(shù)據(jù)隱私要求格外嚴(yán)格的領(lǐng)域,因此確保情感數(shù)據(jù)的安全和合法使用,是每一家情感AI公司都需要面對(duì)的課題。
最后,不同文化地域的人與人之間進(jìn)行交流和情緒解讀都是難題,對(duì)AI來(lái)說(shuō)更是考驗(yàn),比如不同地區(qū)對(duì)情感的理解和表達(dá)方式各不相同,這可能影響情感AI系統(tǒng)的有效性和完整性,此外,情感AI在處理種族、性別和性別認(rèn)同偏見(jiàn)時(shí),也可能面臨不小的困難。
情感AI不僅承諾著減少人力的高效,還有著讀人心的體貼,但它是否能夠真的成為人類(lèi)互動(dòng)中的萬(wàn)能解決方案,還是會(huì)成為和Siri大同小異的智能助手,在需要真正情感理解的任務(wù)中表現(xiàn)平平?或許在未來(lái),AI的“讀心術(shù)”將會(huì)顛覆人機(jī)甚至是人類(lèi)互動(dòng),但至少在現(xiàn)在,真正理解和回應(yīng)人類(lèi)情感,或許還是更需要人的參與和審慎。
參考來(lái)源:
Uniphore Announces $400 Million Series E(Uniphore)
Hume AI Announces $50 Million Fundraise and Empathic Voice Interface(Yahoo Finance)
Introducing Pi, Your Personal AI(Inflection AI)
‘Emotion AI’ may be the next trend for business software, and that could be problematic(TechCrunch)
EMERGING TECH RESEARCH Enterprise Saas Report (PitchBook)