正在閱讀:

大模型時(shí)代來(lái)臨,基于LLM的生成式AI正在快速變革RPA人機(jī)交互

掃一掃下載界面新聞APP

大模型時(shí)代來(lái)臨,基于LLM的生成式AI正在快速變革RPA人機(jī)交互

LLM如何影響人機(jī)交互?生成式AI怎么改變RPA人機(jī)交互?一篇文章看明白。

文|王吉偉

如果問(wèn)RPA對(duì)程序開(kāi)發(fā)以及自動(dòng)化有哪些貢獻(xiàn),其中一個(gè)答案便是它改變了人機(jī)交互(HCI,human-computer interaction)。

在傳統(tǒng)工作流自動(dòng)化工具中,軟件開(kāi)發(fā)人員不得不生成一個(gè)操作列表,使用內(nèi)部應(yīng)用程序編程接口(API)或?qū)S媚_本語(yǔ)言自動(dòng)執(zhí)行任務(wù)和與后端系統(tǒng)的接口。

RPA系統(tǒng)則通過(guò)觀察用戶在應(yīng)用程序的圖形用戶界面(GUI)中執(zhí)行該任務(wù)來(lái)開(kāi)發(fā)操作列表,然后通過(guò)直接在GUI 中重復(fù)這些任務(wù)來(lái)執(zhí)行自動(dòng)化,并且能夠給在多個(gè)應(yīng)用程序之間處理數(shù)據(jù)。

這個(gè)看似簡(jiǎn)單并被稱作“外掛”的形式,有效降低了產(chǎn)品中使用自動(dòng)化的障礙,并進(jìn)一步讓更多組織的端到端自動(dòng)化成為可能。

作為一種改變數(shù)字工作者工作形式的業(yè)務(wù)流程自動(dòng)化技術(shù),二十多年來(lái)它不僅將人力資源從簡(jiǎn)單重復(fù)的工作解放出來(lái),還讓程序開(kāi)發(fā)變得更加簡(jiǎn)單。同時(shí)它還締造了一種“人+RPA”的人機(jī)交互模式,讓廣大組織能夠更簡(jiǎn)單地實(shí)現(xiàn)人機(jī)協(xié)同。

尤其是近些年足夠成熟、有彈性、可擴(kuò)展和可靠性強(qiáng)的RPA平臺(tái)出現(xiàn)后,很多大型組織都可以RPA改善與優(yōu)化其業(yè)務(wù)流程和開(kāi)發(fā)模式,實(shí)現(xiàn)增效降本。

以上這些的實(shí)現(xiàn),皆因RPA不斷改善和優(yōu)化業(yè)務(wù)流程自動(dòng)化以及程序開(kāi)發(fā)中的人機(jī)交互。

沒(méi)錯(cuò),得到眾多技術(shù)加持的RPA在不斷滲透到更多行業(yè)的同時(shí),也在持續(xù)改變不同領(lǐng)域多種業(yè)務(wù)場(chǎng)景的人機(jī)交互。

尤其是近幾年RPA的再次火爆,正是因?yàn)樗疃热诤狭薃I技術(shù)。以RPA為核心的超自動(dòng)化技術(shù)合集更是囊括了所有與自動(dòng)化相關(guān)的技術(shù),讓端到端自動(dòng)化的人機(jī)交互體驗(yàn)持續(xù)增強(qiáng),進(jìn)而受到更多組織的青睞。

現(xiàn)在,AI大模型時(shí)代到來(lái),不斷進(jìn)化的RPA同樣也在融合生成式AI技術(shù)。當(dāng)前融合LLM(Large Language Model,大型語(yǔ)言模型)的RPA,可以說(shuō)在人機(jī)交互上是一次巨大進(jìn)步,甚至是一種對(duì)以往RPA模式的顛覆。

既然要聊LLM對(duì)RPA人機(jī)交互的影響,自然要從人機(jī)交互談起。到底LLM對(duì)人機(jī)交互有什么影響?RPA是如何改善人機(jī)交互的?LLM又對(duì)RPA有什么影響?

本文,王吉偉頻道就跟大家聊聊這些。

從人機(jī)交互談起

上世紀(jì)70年代,大多數(shù)辦公室的業(yè)務(wù)運(yùn)行仍舊使用金屬文件、打字機(jī)和大量紙張。而體積龐大的計(jì)算機(jī),只能存放在只有少數(shù)人可以操作的冷藏室中。

為了解決這些問(wèn)題,一些公司開(kāi)始研發(fā)個(gè)人計(jì)算機(jī)。施樂(lè)公司于1973年開(kāi)發(fā)了施樂(lè)Alto,雖然因?yàn)樵靸r(jià)太高等問(wèn)題該產(chǎn)品始終未能上市,但它卻成了GUI的第一個(gè)草圖,成為了Macintosh(麥金塔電腦)和Windows的靈感來(lái)源。

受到一系列研究和相應(yīng)研發(fā)的影響,以及當(dāng)時(shí)市場(chǎng)對(duì)于小型計(jì)算機(jī)的強(qiáng)烈需求,作為研究如何以及為什么使計(jì)算機(jī)對(duì)用戶更加友好的一種手段,人機(jī)交互這個(gè)概念以及全新學(xué)科便出現(xiàn)于70年代末80年代初。

從那時(shí)起,HCI領(lǐng)域不斷發(fā)展,主要用于剖析人類行為以解決社會(huì)最復(fù)雜的問(wèn)題,研究人們?nèi)绾闻c計(jì)算機(jī)交互以及用戶能夠在多大程度上與計(jì)算機(jī)交互,目標(biāo)是在計(jì)算機(jī)和用戶之間進(jìn)行成功的交互,并探索哪些領(lǐng)域需要更多的相關(guān)開(kāi)發(fā)。

由于能夠解決當(dāng)時(shí)社會(huì)生產(chǎn)力的尖銳矛盾,HCI的研究領(lǐng)域在很短時(shí)間內(nèi)就擴(kuò)展到所有IT領(lǐng)域。

同時(shí)研究人員意識(shí)到,他們必須將與計(jì)算機(jī)的交互擴(kuò)展到每個(gè)人,而不僅僅是信息技術(shù)專業(yè)人員。因此在幾年之內(nèi),HCI就快速擴(kuò)展到幾乎所有信息技術(shù)設(shè)計(jì)的變化。

在史蒂夫喬布斯等人的努力之下,蘋(píng)果公司在1984年推出了Macintosh個(gè)人計(jì)算機(jī),人機(jī)交互形式由此徹底改變了。它使得計(jì)算機(jī)的使用變得更加容易,使通信變得更加簡(jiǎn)單,鍵盤(pán)、鼠標(biāo)和基于圖標(biāo)的用戶界面開(kāi)始流行。

后來(lái),蘋(píng)果公司成為個(gè)人PC先驅(qū),微軟推出了windows系統(tǒng),這些產(chǎn)品和軟件完全改變并顛覆了全球的業(yè)務(wù)流程與辦公的人機(jī)交互形式。

這些大家都熟悉,這里就不用多介紹了。

直到今天,IoT已成為網(wǎng)絡(luò)連接基礎(chǔ),人工智能也已無(wú)處不在,而人機(jī)交互仍舊是各種技術(shù)、產(chǎn)品及解決方案的重點(diǎn)。

通過(guò)前面的發(fā)展簡(jiǎn)史,相信大家應(yīng)該已經(jīng)對(duì)人機(jī)交互有一個(gè)大體認(rèn)知。那么到底什么是人機(jī)交互呢?且看下一節(jié)。

人機(jī)交互的四要素、六目標(biāo)和七原則

通用定義認(rèn)為,人機(jī)交互技術(shù)(Human-Computer Interaction Techniques)是指通過(guò)計(jì)算機(jī)輸入、輸出設(shè)備,以有效的方式實(shí)現(xiàn)人與計(jì)算機(jī)對(duì)話的技術(shù)。

人機(jī)交互技術(shù)包括機(jī)器通過(guò)輸出或顯示設(shè)備給人提供大量有關(guān)信息及提示請(qǐng)示等,人通過(guò)輸入設(shè)備給機(jī)器輸入有關(guān)信息,回答問(wèn)題及提示請(qǐng)示等。因此,人機(jī)交互技術(shù)是計(jì)算機(jī)用戶界面設(shè)計(jì)中的重要內(nèi)容之一。

在學(xué)術(shù)上,人機(jī)交互是一門(mén)與人類使用的交互式計(jì)算系統(tǒng)的設(shè)計(jì),評(píng)估和實(shí)施有關(guān)的,以及研究圍繞它們的主要現(xiàn)象的學(xué)科。

人機(jī)交互關(guān)注人(用戶)與計(jì)算機(jī)之間接口(交互界面),關(guān)注計(jì)算機(jī)技術(shù)的設(shè)計(jì)和使用。人機(jī)交互涵蓋多門(mén)學(xué)科,包括計(jì)算機(jī)科學(xué),心理學(xué),社會(huì)學(xué),圖形設(shè)計(jì),工業(yè)設(shè)計(jì)等,是一門(mén)綜合性非常強(qiáng)的現(xiàn)代科學(xué)。

維基百科認(rèn)為,人與計(jì)算機(jī)之間的接口對(duì)于促進(jìn)這種互動(dòng)至關(guān)重要。桌面應(yīng)用程序,互聯(lián)網(wǎng)瀏覽器,掌上電腦等利用了當(dāng)今流行的GUI。語(yǔ)音識(shí)別和合成系統(tǒng)利用了語(yǔ)音用戶界面(VUI)。

新興的多模態(tài)和圖形用戶界面,則允許人們以其他界面無(wú)法實(shí)現(xiàn)的方式與具體的角色和智能體交互。

所以,人機(jī)交互領(lǐng)域的發(fā)展導(dǎo)致了交互質(zhì)量的提高,并導(dǎo)致了許多新的研究領(lǐng)域。不同的研究分支不是設(shè)計(jì)常規(guī)接口,而是專注于多模態(tài)而不是單模態(tài)的概念、智能自適應(yīng)接口而不是基于命令/操作的接口以及主動(dòng)接口而不是被動(dòng)接口的概念。

從人機(jī)交互的名字中,我們可以推導(dǎo)出它由三部分組成,即用戶,計(jì)算機(jī)本身以及它們協(xié)同工作的方式。

后來(lái)這三部分?jǐn)U展為四個(gè)基本要素,也就是用戶、任務(wù)、工具/界面和背景。

  • 用戶,即在項(xiàng)目上一起工作的個(gè)人或一組個(gè)人稱為用戶組件。HCI研究用戶的需求,目標(biāo)和交互方式。
  • 任務(wù),即以目標(biāo)為導(dǎo)向的任務(wù),使用計(jì)算機(jī)時(shí),用戶總是有一個(gè)目的或目標(biāo)。為了實(shí)現(xiàn)這一點(diǎn),計(jì)算機(jī)呈現(xiàn)事物的數(shù)字表示。
  • 界面,也就是可以提高用戶交互質(zhì)量的基本HCI元素是界面。需要考慮許多與界面相關(guān)的因素,包括交互類型、屏幕分辨率、顯示尺寸,甚至顏色對(duì)比度。
  • 背景,HCI不僅涉及在用戶和計(jì)算機(jī)之間提供更好的通信,還涉及考慮訪問(wèn)系統(tǒng)的上下文和環(huán)境。

同時(shí)HCI具備六個(gè)目標(biāo),分別是高效使用(效率)、 安全使用(安全)、 具有良好的效用(實(shí)用性)、 易于學(xué)習(xí)(可學(xué)習(xí)性)以及易于記憶如何使用(可記憶性)。

在此基礎(chǔ)上,也衍生出了HCI的7個(gè)設(shè)計(jì)原則,如下:

原則1:公平使用;

原則2:使用靈活;

原則3:簡(jiǎn)單直觀地使用;

原則4:可感知的信息;

原則5:容錯(cuò)能力;

原則6:低體力勞動(dòng);

原則7:接近和使用的大小和空間。

在具體應(yīng)用中,物聯(lián)網(wǎng)、眼動(dòng)追蹤技術(shù)、語(yǔ)音識(shí)別技術(shù)、AR/VR的使用以及云計(jì)算等,都是非常典型的人機(jī)交互案例。

HCI發(fā)展史以及大量觀點(diǎn)及案例證明,技術(shù)可以明顯改善HCI。

伴隨著通訊與信息技術(shù)的突破與發(fā)展,它們持續(xù)為HCI帶來(lái)明顯的影響與改善。比如這些年借助AI技術(shù)蓬勃發(fā)展的RPA,就為業(yè)務(wù)流程自動(dòng)化以及辦公業(yè)務(wù)場(chǎng)景帶來(lái)了極大的人機(jī)交互帶來(lái)體驗(yàn)改善。

人機(jī)交互與RPA

前文我們提到,人機(jī)交互的目標(biāo)是使計(jì)算機(jī)能夠更好地適應(yīng)人的需求,提供更友好、更智能、更自然的交互方式,如語(yǔ)音識(shí)別、圖像識(shí)別、自然語(yǔ)言處理、手勢(shì)控制等。

RPA是一種利用軟件機(jī)器人模擬人類操作的技術(shù),它可以通過(guò)用戶界面與企業(yè)的應(yīng)用系統(tǒng)交互,并完成預(yù)期任務(wù)的技術(shù)。

當(dāng)代RPA還融合了人工智能(AI)和機(jī)器學(xué)習(xí)(ML)相結(jié)合,實(shí)現(xiàn)智能流程自動(dòng)化(IPA),處理更復(fù)雜的用例,如自然語(yǔ)言處理(NLP)、計(jì)算機(jī)視覺(jué)(CV)和數(shù)據(jù)分析等。

RPA可以實(shí)現(xiàn)重復(fù)性、基于規(guī)則的工作流程的自動(dòng)化,提高工作效率、準(zhǔn)確性和合規(guī)性,降低人力成本,減少錯(cuò)誤率,節(jié)省成本和時(shí)間,適用于各種重復(fù)性、標(biāo)準(zhǔn)化的業(yè)務(wù)場(chǎng)景,如財(cái)務(wù)、人力資源、供應(yīng)鏈、信息技術(shù)等。

王吉偉頻道曾在《數(shù)字化轉(zhuǎn)型時(shí)代,RPA+AI是打開(kāi)人機(jī)協(xié)同的最佳方式》一文中講過(guò),在當(dāng)代企業(yè)管理軟件系統(tǒng)以及各種自動(dòng)化工具中,從操作難度、部署周期、投資成本等角度而言,RPA可以算是廣大組織應(yīng)用人機(jī)協(xié)同最好的方式。

在這其中,RPA最大的優(yōu)勢(shì)就是降低了程序開(kāi)發(fā)難度,可以讓一線的業(yè)務(wù)人員參與到簡(jiǎn)單應(yīng)用的開(kāi)發(fā)之中,讓全民開(kāi)發(fā)成為進(jìn)一步成為現(xiàn)實(shí)。

RPA之所以能做到這一點(diǎn),在于它改變了程序開(kāi)發(fā)的人機(jī)交互模式。使得不會(huì)編程的普通員工借助RPA工具,也能像程序員一樣開(kāi)發(fā)他們需要的自動(dòng)化程序或者說(shuō)軟件機(jī)器人。

一方面RPA讓開(kāi)發(fā)程序變得更加簡(jiǎn)單,從寫(xiě)代碼變成了“拖拉拽”各種功能組件;另一方面可以讓更多的業(yè)務(wù)流程實(shí)現(xiàn)自動(dòng)化,不再需要人力去重復(fù)執(zhí)行。可以說(shuō),RPA同時(shí)改變了程序開(kāi)發(fā)和業(yè)務(wù)執(zhí)行的人機(jī)交互。

所以,RPA與人機(jī)交互有著密切的聯(lián)系。因?yàn)镽PA本質(zhì)上是一種人機(jī)協(xié)同的工作模式,它需要人來(lái)定義規(guī)則、監(jiān)督執(zhí)行、優(yōu)化改進(jìn),機(jī)器則負(fù)責(zé)執(zhí)行規(guī)則、提供反饋、學(xué)習(xí)改進(jìn)。

RPA不僅可以模擬人類的操作,還可以結(jié)合AI技術(shù),實(shí)現(xiàn)對(duì)人類的理解和決策。比如利用OCR(光學(xué)字符識(shí)別)技術(shù)識(shí)別圖像中的文字,利用NLP技術(shù)理解語(yǔ)言中的意圖,利用智能決策技術(shù)制定最優(yōu)方案等。

融合AI等技術(shù)的RPA,具備以下幾個(gè)優(yōu)勢(shì):

1、有效減輕工作負(fù)擔(dān),讓人們從繁瑣的后臺(tái)任務(wù)中解放出來(lái),專注于更有價(jià)值的創(chuàng)新和戰(zhàn)略性的工作;

2、提高人機(jī)交互的速度和質(zhì)量,軟件機(jī)器人可以全天候地工作,不受時(shí)間、地點(diǎn)和情緒的影響,也不會(huì)犯錯(cuò)或遺漏;

3、拓展人機(jī)交互的范圍和深度,軟件機(jī)器人可以訪問(wèn)和整合多個(gè)不相關(guān)的軟件系統(tǒng),處理大量結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),并利用AI和ML的能力進(jìn)行學(xué)習(xí)和優(yōu)化。

由此,RPA是一種有效且典型的優(yōu)化人機(jī)交互的技術(shù)。它可以實(shí)現(xiàn)流程自動(dòng)化、智能化和優(yōu)化,為企業(yè)帶來(lái)效率、質(zhì)量和價(jià)值的提升。

LLM對(duì)人機(jī)交互的影響

LLM是一種利用神經(jīng)網(wǎng)絡(luò)在大量無(wú)標(biāo)注文本上進(jìn)行自監(jiān)督學(xué)習(xí)或半監(jiān)督學(xué)習(xí)的語(yǔ)言模型。LLM具有海量的參數(shù)(通常為數(shù)十億或更多),能夠在多種任務(wù)上表現(xiàn)出優(yōu)異的性能。

從目前各領(lǐng)域的應(yīng)用來(lái)看,基于LLM的生成式AI技術(shù)的出現(xiàn),為人機(jī)交互帶來(lái)了顛覆性的變化。

生成式AI給人們最直接的感觸就是,原來(lái)工作流中的好多各種軟件操作以及跨軟件操作,現(xiàn)在只需要跟生成式AI進(jìn)行幾輪對(duì)話就完成了。

比如用Midjourney生成圖片或者是ChatGPT Plus生成軟件應(yīng)用代碼,已經(jīng)完全不需要使用繪圖軟件及編程軟件。并且ChatGPT 的插件生態(tài)正在快速完善,以后將會(huì)有越來(lái)越多應(yīng)用場(chǎng)景的業(yè)務(wù)操作,只需要對(duì)話就能搞定。

這就是交互方式的改變,它直接將原有的與各種軟件UI的人機(jī)交互,變成了與一個(gè)聊天窗口進(jìn)行交互,是一種前所未有的交互體驗(yàn)。

總結(jié)起來(lái),LLM或者說(shuō)生成式AI對(duì)人機(jī)交互產(chǎn)生了以下幾點(diǎn)影響:

首先,提高了人機(jī)交互的效率、質(zhì)量和便利性。通過(guò)生成式AI,用戶可以快速獲取想要的信息或服務(wù),不需要花費(fèi)大量的時(shí)間和精力。同時(shí)LLM可以根據(jù)用戶輸入和上下文生成合適的回復(fù),減少用戶輸入負(fù)擔(dān),提高交互流暢性和自然性。此外,生成式AI還可以根據(jù)用戶的反饋和偏好,動(dòng)態(tài)地調(diào)整自己的輸出,以達(dá)到更好的交互效果。

比如ChatGPT可以幫助用戶完成寫(xiě)作、設(shè)計(jì)、編程等復(fù)雜的任務(wù),或者為用戶提供個(gè)性化的推薦、咨詢、娛樂(lè)等內(nèi)容。

其次,增加人機(jī)交互的多樣性和創(chuàng)造性。LLM可以根據(jù)用戶需求和偏好生成不同風(fēng)格的文本、音頻、視頻等內(nèi)容,滿足用戶的個(gè)性化和多元化的需求。通過(guò)生成式AI,用戶可以接觸和選擇更多的內(nèi)容,從而拓展視野和思維。當(dāng)然,生成式AI也可以與用戶進(jìn)行更深入和靈活的對(duì)話,滿足用戶不同的情感和情緒需求。

比如通過(guò)生成式AI為用戶提供不同風(fēng)格和主題的文本、圖像、音樂(lè)等,或者為用戶生成一些新穎和有趣的內(nèi)容,如詩(shī)歌、故事、笑話等。

第三,改變?nèi)藱C(jī)交互的關(guān)系和意義。通過(guò)生成式AI,用戶可以與人工智能建立更緊密和信任的聯(lián)系,甚至產(chǎn)生一種共創(chuàng)與合作的感覺(jué)。

基于LLM的聊天機(jī)器人,可以為用戶提供更多的反饋和建議,或者與用戶共享自己的想法和感受。生成式AI還可以讓用戶更加了解自己和人工智能的優(yōu)勢(shì)和局限,以及如何更好地利用和發(fā)展它們。

第四,拓展人機(jī)交互的領(lǐng)域和場(chǎng)景。ChatGPT等生成式AI應(yīng)用具有強(qiáng)大的適應(yīng)性和泛化性,可以應(yīng)用于各種不同的領(lǐng)域和場(chǎng)景,如教育、娛樂(lè)、醫(yī)療、商業(yè)等。無(wú)論用戶想要學(xué)習(xí)、游戲、咨詢、購(gòu)物等,都可以通過(guò)與ChatGPT等應(yīng)用交流來(lái)達(dá)到目的。

第五,增強(qiáng)人機(jī)交互的趣味性和親切感?;贚LM的生成式AI應(yīng)用具有豐富的知識(shí)和個(gè)性,可以根據(jù)用戶的興趣和情緒來(lái)調(diào)整自己的語(yǔ)言風(fēng)格和話題,甚至可以生成一些幽默、詩(shī)歌、故事等創(chuàng)意內(nèi)容來(lái)娛樂(lè)用戶。

這樣,用戶不會(huì)感到與機(jī)器人交流是一件枯燥無(wú)味的事情,而會(huì)覺(jué)得與機(jī)器人交流是一件有趣和溫馨的事情。

LLM對(duì)人機(jī)交互有著重要而復(fù)雜的影響,使得它在各個(gè)領(lǐng)域都有著巨大發(fā)展?jié)摿托袠I(yè)應(yīng)用價(jià)值。廣大組織應(yīng)該積極地探索和利用LLM以及生成式AI,提升人機(jī)交互的水平和體驗(yàn),提高人機(jī)交互效率和質(zhì)量,增強(qiáng)人機(jī)交互關(guān)系,拓展人機(jī)交互的領(lǐng)域和場(chǎng)景。

當(dāng)然,我們也應(yīng)該注意其帶來(lái)的風(fēng)險(xiǎn)和挑戰(zhàn),以及如何合理地使用和監(jiān)督它。

需要說(shuō)明的是,目前基于大語(yǔ)言模型的生成式AI正在與RPA快速融合,生成式AI將會(huì)為RPA的人機(jī)交互帶來(lái)質(zhì)的飛躍。

LLM改變RPA人機(jī)交互

RPA可以自動(dòng)化執(zhí)行重復(fù)性、規(guī)則性和低價(jià)值的業(yè)務(wù)流程,可以提高效率、降低成本和減少錯(cuò)誤。但它也面臨著一些挑戰(zhàn)和局限性,比如難以處理復(fù)雜、多變和高價(jià)值的業(yè)務(wù)場(chǎng)景,以及難以適應(yīng)業(yè)務(wù)流程的變化,需要不斷地維護(hù)和更新,難以處理復(fù)雜的、非結(jié)構(gòu)化的、需要?jiǎng)?chuàng)造性或判斷力的任務(wù)等。

雖然超自動(dòng)化架構(gòu)已經(jīng)讓RPA的運(yùn)行足夠穩(wěn)定,但對(duì)于復(fù)雜流程而言也會(huì)存在穩(wěn)定運(yùn)行的隱患。

之前廠商們想盡各種辦法解決這些問(wèn)題,但無(wú)法從根本上杜絕這些問(wèn)題。直到基于LLM的生成式AI橫空出世,一下就解決了之前RPA遇到的多重難題。

對(duì)于LLM如何影響RPA,王吉偉頻道(id:jiwei1122)已經(jīng)在《GPT等AI大模型震撼來(lái)襲,基于RPA的超級(jí)自動(dòng)化仍是最佳落地載體》一文中有過(guò)詳細(xì)介紹。

這里,再簡(jiǎn)單說(shuō)說(shuō)LLM如何改變RPA的人機(jī)交互。

LLM可以為RPA提供更強(qiáng)大的自然語(yǔ)言處理能力,提供更強(qiáng)大的知識(shí)獲取和推理能力,以及提供更強(qiáng)大的生成和創(chuàng)造能力。

具體而言,LLM對(duì)于RPA人機(jī)交互的影響可以體現(xiàn)于以下幾個(gè)方面:

提高RPA的智能水平。應(yīng)用LLM,能夠更好地識(shí)別和理解用戶的自然語(yǔ)言輸入以及生成自然語(yǔ)言,更好地滿足用戶的需求和意圖。還可以根據(jù)上下文和目標(biāo)生成合適的操作步驟,進(jìn)行多輪對(duì)話和推理,處理更復(fù)雜和多樣的業(yè)務(wù)場(chǎng)景,實(shí)現(xiàn)更復(fù)雜和靈活的業(yè)務(wù)流程自動(dòng)化。

用戶可以通過(guò)語(yǔ)音或文字與RPA進(jìn)行對(duì)話,告訴它要執(zhí)行什么任務(wù),而不需要通過(guò)復(fù)雜的編程或拖拽組件來(lái)設(shè)計(jì)流程。

此外,LLM也可以幫助RPA進(jìn)行知識(shí)抽取和推理,從而提供更有價(jià)值的信息和建議。

擴(kuò)展RPA的應(yīng)用范圍。LLM可以有效擴(kuò)大RPA的應(yīng)用范圍,讓軟件機(jī)器人能夠處理更多涉及自然語(yǔ)言的任務(wù),比如文本分類、文本摘要、文本生成、機(jī)器翻譯、問(wèn)答系統(tǒng)等。也可以通過(guò)與其他模態(tài)的數(shù)據(jù)進(jìn)行交互,比如圖像、音頻、視頻等,從而實(shí)現(xiàn)更豐富和多維的業(yè)務(wù)流程。

LLM還可以讓軟件機(jī)器人能夠與其他AI技術(shù)如OCR、NLP、低代碼、流程挖掘、chatbot等進(jìn)行集成和協(xié)作,實(shí)現(xiàn)超級(jí)自動(dòng)化。

通過(guò)使用LLM,RPA可以跨越語(yǔ)言和文化的障礙,服務(wù)更廣泛和多元的客戶和市場(chǎng)。

增加RPA的創(chuàng)新潛力。LLM可以增強(qiáng)RPA的創(chuàng)造力和靈活性,使其能夠根據(jù)不同的場(chǎng)景和數(shù)據(jù)生成適合的文本,如報(bào)告、摘要、建議等。例如,RPA可以根據(jù)用戶提供的關(guān)鍵詞或主題,自動(dòng)生成一篇博客文章,并在文章中插入相關(guān)的圖片、視頻、鏈接等。

通過(guò)使用LLM,RPA可以進(jìn)行更靈活和自適應(yīng)的學(xué)習(xí)和生成,產(chǎn)生更多新穎和有趣的內(nèi)容和方案。LLM也可以與人類進(jìn)行更有效和友好的協(xié)作和溝通,激發(fā)更多的創(chuàng)意和靈感。

提升RPA的開(kāi)發(fā)效率。生成式AI可以讓用戶通過(guò)簡(jiǎn)單的語(yǔ)言描述來(lái)定義和修改業(yè)務(wù)流程,而不需要編寫(xiě)復(fù)雜的代碼或者使用圖形化界面。并可以根據(jù)用戶的反饋和數(shù)據(jù)分析來(lái)優(yōu)化和調(diào)整業(yè)務(wù)流程,實(shí)現(xiàn)持續(xù)改進(jìn)。

優(yōu)化RPA交互體驗(yàn)和用戶滿意度。融合LLM的RPA能夠與用戶進(jìn)行更加自然、友好、有趣的對(duì)話,增加用戶的信任和參與感。RPA可以根據(jù)用戶的情緒和興趣,調(diào)整語(yǔ)氣和風(fēng)格,甚至講一些幽默或者引用一些名人名言來(lái)調(diào)節(jié)氣氛。

擴(kuò)展閱讀:ChatGPT與RPA集成,生成式AI+自動(dòng)化流程讓AIGC價(jià)值倍增

當(dāng)然,LLM對(duì)RPA人機(jī)交互的影響不只是智能、效率和創(chuàng)新層面的,它還直接影響了RPA的軟件架構(gòu)變化。

后記:LLM影響下的RPA架構(gòu)變遷

在LLM之前,RPA已經(jīng)極大地改善了程序開(kāi)發(fā)以及流程自動(dòng)化的人機(jī)交互。并且,很多廠商都已經(jīng)打出了“RPA人人可用”的概念。在這個(gè)概念的背后,其實(shí)就是RPA的易用性越來(lái)越強(qiáng),應(yīng)用它開(kāi)發(fā)程序并實(shí)施流程自動(dòng)化越發(fā)簡(jiǎn)單。

在易用性方面,從CV到屏幕抓取再到AI模型,廠商們做了大量的探索與嘗試。在RPA的程序開(kāi)發(fā)環(huán)節(jié)上,基于AI、0代碼等技術(shù),RPA正在逐步擺脫原有的“拖拉拽”形式,向“點(diǎn)選用”以及對(duì)話式(包括語(yǔ)音驅(qū)動(dòng))流程創(chuàng)建的方式過(guò)渡。

在人機(jī)交互上,對(duì)話式流程創(chuàng)建,可以說(shuō)是RPA乃至超自動(dòng)化的終極狀態(tài)。未來(lái)我們要使用超自動(dòng)化,只要在系統(tǒng)內(nèi)打幾行字或者說(shuō)一句話就能創(chuàng)建各種軟件機(jī)器人或者自動(dòng)化程序。

但是之前的對(duì)話式創(chuàng)建,僅適用于簡(jiǎn)單的預(yù)設(shè)置流程。稍微復(fù)雜的流程便無(wú)能為力,或者需要更多流程步驟去觸發(fā)和調(diào)動(dòng)更多流程才能實(shí)現(xiàn)。流程的健壯性難以經(jīng)受考驗(yàn),并且用戶必須熟悉相應(yīng)語(yǔ)法及指令才能使用。

在應(yīng)用體驗(yàn)上,仍然存在一些不足或者說(shuō)進(jìn)步空間。

LLM出現(xiàn)之后,對(duì)于融合生成式AI的RPA產(chǎn)品,用戶使用自然語(yǔ)言都能驅(qū)動(dòng)RPA去創(chuàng)建流程。

并且生成式AI以生成內(nèi)容的形式彌補(bǔ)RPA在情緒識(shí)別、非結(jié)構(gòu)化數(shù)據(jù)處理等方面的不足,可以讓任何人無(wú)需太多學(xué)習(xí)就能更加簡(jiǎn)單、快速、高效的驅(qū)動(dòng)RPA開(kāi)發(fā)各種自動(dòng)化程序,真正讓RPA實(shí)現(xiàn)了人人可用。

多家廠商引入ChatGPT,集成與融合生成式AI成為RPA技術(shù)新趨勢(shì)

以前使用RPA,是人直接操作RPA通過(guò)托拉拽搭積木的方式搭建各種程序。現(xiàn)在則是人通過(guò)自然語(yǔ)言與GPT等生成式AI溝通,多模態(tài)AI在理解人類操作意圖后,進(jìn)一步驅(qū)動(dòng)RPA連接企業(yè)管理軟件去自動(dòng)化執(zhí)行各種業(yè)務(wù)流程。

GPT等AI大模型則進(jìn)一步連接了人與RPA等系統(tǒng),向上連接人的意圖,向下指揮RPA機(jī)器人,成為人和RPA等自動(dòng)化系統(tǒng)之間的一個(gè)紐帶,讓程序開(kāi)發(fā)與自動(dòng)化流程的操作更加簡(jiǎn)單。

GPT把人和基于RPA的超自動(dòng)化連接起來(lái),這是人機(jī)交互體驗(yàn)上一個(gè)巨大的進(jìn)步。

在王吉偉頻道看來(lái),從過(guò)去的“人+RPA”到現(xiàn)在的“人+生成式AI+RPA”,引入LLM以及集成生成式AI,表面看是極大地提升了RPA產(chǎn)品的人機(jī)交互,本質(zhì)上是LLM影響了RPA的架構(gòu)變化。

現(xiàn)在幾乎所有廠商都在重度研究LLM與RPA以及超自動(dòng)化的全面融合,RPA都已在產(chǎn)品架構(gòu)中加入了模型層。

這意味著,不管是調(diào)用第三方模型還是自研模型,RPA都已成為標(biāo)準(zhǔn)的模型層上的應(yīng)用。

可以預(yù)見(jiàn),接下來(lái)隨著LLM成為RPA的標(biāo)配,它也將全面變革大模型時(shí)代的RPA。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

大模型時(shí)代來(lái)臨,基于LLM的生成式AI正在快速變革RPA人機(jī)交互

LLM如何影響人機(jī)交互?生成式AI怎么改變RPA人機(jī)交互?一篇文章看明白。

文|王吉偉

如果問(wèn)RPA對(duì)程序開(kāi)發(fā)以及自動(dòng)化有哪些貢獻(xiàn),其中一個(gè)答案便是它改變了人機(jī)交互(HCI,human-computer interaction)。

在傳統(tǒng)工作流自動(dòng)化工具中,軟件開(kāi)發(fā)人員不得不生成一個(gè)操作列表,使用內(nèi)部應(yīng)用程序編程接口(API)或?qū)S媚_本語(yǔ)言自動(dòng)執(zhí)行任務(wù)和與后端系統(tǒng)的接口。

RPA系統(tǒng)則通過(guò)觀察用戶在應(yīng)用程序的圖形用戶界面(GUI)中執(zhí)行該任務(wù)來(lái)開(kāi)發(fā)操作列表,然后通過(guò)直接在GUI 中重復(fù)這些任務(wù)來(lái)執(zhí)行自動(dòng)化,并且能夠給在多個(gè)應(yīng)用程序之間處理數(shù)據(jù)。

這個(gè)看似簡(jiǎn)單并被稱作“外掛”的形式,有效降低了產(chǎn)品中使用自動(dòng)化的障礙,并進(jìn)一步讓更多組織的端到端自動(dòng)化成為可能。

作為一種改變數(shù)字工作者工作形式的業(yè)務(wù)流程自動(dòng)化技術(shù),二十多年來(lái)它不僅將人力資源從簡(jiǎn)單重復(fù)的工作解放出來(lái),還讓程序開(kāi)發(fā)變得更加簡(jiǎn)單。同時(shí)它還締造了一種“人+RPA”的人機(jī)交互模式,讓廣大組織能夠更簡(jiǎn)單地實(shí)現(xiàn)人機(jī)協(xié)同。

尤其是近些年足夠成熟、有彈性、可擴(kuò)展和可靠性強(qiáng)的RPA平臺(tái)出現(xiàn)后,很多大型組織都可以RPA改善與優(yōu)化其業(yè)務(wù)流程和開(kāi)發(fā)模式,實(shí)現(xiàn)增效降本。

以上這些的實(shí)現(xiàn),皆因RPA不斷改善和優(yōu)化業(yè)務(wù)流程自動(dòng)化以及程序開(kāi)發(fā)中的人機(jī)交互。

沒(méi)錯(cuò),得到眾多技術(shù)加持的RPA在不斷滲透到更多行業(yè)的同時(shí),也在持續(xù)改變不同領(lǐng)域多種業(yè)務(wù)場(chǎng)景的人機(jī)交互。

尤其是近幾年RPA的再次火爆,正是因?yàn)樗疃热诤狭薃I技術(shù)。以RPA為核心的超自動(dòng)化技術(shù)合集更是囊括了所有與自動(dòng)化相關(guān)的技術(shù),讓端到端自動(dòng)化的人機(jī)交互體驗(yàn)持續(xù)增強(qiáng),進(jìn)而受到更多組織的青睞。

現(xiàn)在,AI大模型時(shí)代到來(lái),不斷進(jìn)化的RPA同樣也在融合生成式AI技術(shù)。當(dāng)前融合LLM(Large Language Model,大型語(yǔ)言模型)的RPA,可以說(shuō)在人機(jī)交互上是一次巨大進(jìn)步,甚至是一種對(duì)以往RPA模式的顛覆。

既然要聊LLM對(duì)RPA人機(jī)交互的影響,自然要從人機(jī)交互談起。到底LLM對(duì)人機(jī)交互有什么影響?RPA是如何改善人機(jī)交互的?LLM又對(duì)RPA有什么影響?

本文,王吉偉頻道就跟大家聊聊這些。

從人機(jī)交互談起

上世紀(jì)70年代,大多數(shù)辦公室的業(yè)務(wù)運(yùn)行仍舊使用金屬文件、打字機(jī)和大量紙張。而體積龐大的計(jì)算機(jī),只能存放在只有少數(shù)人可以操作的冷藏室中。

為了解決這些問(wèn)題,一些公司開(kāi)始研發(fā)個(gè)人計(jì)算機(jī)。施樂(lè)公司于1973年開(kāi)發(fā)了施樂(lè)Alto,雖然因?yàn)樵靸r(jià)太高等問(wèn)題該產(chǎn)品始終未能上市,但它卻成了GUI的第一個(gè)草圖,成為了Macintosh(麥金塔電腦)和Windows的靈感來(lái)源。

受到一系列研究和相應(yīng)研發(fā)的影響,以及當(dāng)時(shí)市場(chǎng)對(duì)于小型計(jì)算機(jī)的強(qiáng)烈需求,作為研究如何以及為什么使計(jì)算機(jī)對(duì)用戶更加友好的一種手段,人機(jī)交互這個(gè)概念以及全新學(xué)科便出現(xiàn)于70年代末80年代初。

從那時(shí)起,HCI領(lǐng)域不斷發(fā)展,主要用于剖析人類行為以解決社會(huì)最復(fù)雜的問(wèn)題,研究人們?nèi)绾闻c計(jì)算機(jī)交互以及用戶能夠在多大程度上與計(jì)算機(jī)交互,目標(biāo)是在計(jì)算機(jī)和用戶之間進(jìn)行成功的交互,并探索哪些領(lǐng)域需要更多的相關(guān)開(kāi)發(fā)。

由于能夠解決當(dāng)時(shí)社會(huì)生產(chǎn)力的尖銳矛盾,HCI的研究領(lǐng)域在很短時(shí)間內(nèi)就擴(kuò)展到所有IT領(lǐng)域。

同時(shí)研究人員意識(shí)到,他們必須將與計(jì)算機(jī)的交互擴(kuò)展到每個(gè)人,而不僅僅是信息技術(shù)專業(yè)人員。因此在幾年之內(nèi),HCI就快速擴(kuò)展到幾乎所有信息技術(shù)設(shè)計(jì)的變化。

在史蒂夫喬布斯等人的努力之下,蘋(píng)果公司在1984年推出了Macintosh個(gè)人計(jì)算機(jī),人機(jī)交互形式由此徹底改變了。它使得計(jì)算機(jī)的使用變得更加容易,使通信變得更加簡(jiǎn)單,鍵盤(pán)、鼠標(biāo)和基于圖標(biāo)的用戶界面開(kāi)始流行。

后來(lái),蘋(píng)果公司成為個(gè)人PC先驅(qū),微軟推出了windows系統(tǒng),這些產(chǎn)品和軟件完全改變并顛覆了全球的業(yè)務(wù)流程與辦公的人機(jī)交互形式。

這些大家都熟悉,這里就不用多介紹了。

直到今天,IoT已成為網(wǎng)絡(luò)連接基礎(chǔ),人工智能也已無(wú)處不在,而人機(jī)交互仍舊是各種技術(shù)、產(chǎn)品及解決方案的重點(diǎn)。

通過(guò)前面的發(fā)展簡(jiǎn)史,相信大家應(yīng)該已經(jīng)對(duì)人機(jī)交互有一個(gè)大體認(rèn)知。那么到底什么是人機(jī)交互呢?且看下一節(jié)。

人機(jī)交互的四要素、六目標(biāo)和七原則

通用定義認(rèn)為,人機(jī)交互技術(shù)(Human-Computer Interaction Techniques)是指通過(guò)計(jì)算機(jī)輸入、輸出設(shè)備,以有效的方式實(shí)現(xiàn)人與計(jì)算機(jī)對(duì)話的技術(shù)。

人機(jī)交互技術(shù)包括機(jī)器通過(guò)輸出或顯示設(shè)備給人提供大量有關(guān)信息及提示請(qǐng)示等,人通過(guò)輸入設(shè)備給機(jī)器輸入有關(guān)信息,回答問(wèn)題及提示請(qǐng)示等。因此,人機(jī)交互技術(shù)是計(jì)算機(jī)用戶界面設(shè)計(jì)中的重要內(nèi)容之一。

在學(xué)術(shù)上,人機(jī)交互是一門(mén)與人類使用的交互式計(jì)算系統(tǒng)的設(shè)計(jì),評(píng)估和實(shí)施有關(guān)的,以及研究圍繞它們的主要現(xiàn)象的學(xué)科。

人機(jī)交互關(guān)注人(用戶)與計(jì)算機(jī)之間接口(交互界面),關(guān)注計(jì)算機(jī)技術(shù)的設(shè)計(jì)和使用。人機(jī)交互涵蓋多門(mén)學(xué)科,包括計(jì)算機(jī)科學(xué),心理學(xué),社會(huì)學(xué),圖形設(shè)計(jì),工業(yè)設(shè)計(jì)等,是一門(mén)綜合性非常強(qiáng)的現(xiàn)代科學(xué)。

維基百科認(rèn)為,人與計(jì)算機(jī)之間的接口對(duì)于促進(jìn)這種互動(dòng)至關(guān)重要。桌面應(yīng)用程序,互聯(lián)網(wǎng)瀏覽器,掌上電腦等利用了當(dāng)今流行的GUI。語(yǔ)音識(shí)別和合成系統(tǒng)利用了語(yǔ)音用戶界面(VUI)。

新興的多模態(tài)和圖形用戶界面,則允許人們以其他界面無(wú)法實(shí)現(xiàn)的方式與具體的角色和智能體交互。

所以,人機(jī)交互領(lǐng)域的發(fā)展導(dǎo)致了交互質(zhì)量的提高,并導(dǎo)致了許多新的研究領(lǐng)域。不同的研究分支不是設(shè)計(jì)常規(guī)接口,而是專注于多模態(tài)而不是單模態(tài)的概念、智能自適應(yīng)接口而不是基于命令/操作的接口以及主動(dòng)接口而不是被動(dòng)接口的概念。

從人機(jī)交互的名字中,我們可以推導(dǎo)出它由三部分組成,即用戶,計(jì)算機(jī)本身以及它們協(xié)同工作的方式。

后來(lái)這三部分?jǐn)U展為四個(gè)基本要素,也就是用戶、任務(wù)、工具/界面和背景。

  • 用戶,即在項(xiàng)目上一起工作的個(gè)人或一組個(gè)人稱為用戶組件。HCI研究用戶的需求,目標(biāo)和交互方式。
  • 任務(wù),即以目標(biāo)為導(dǎo)向的任務(wù),使用計(jì)算機(jī)時(shí),用戶總是有一個(gè)目的或目標(biāo)。為了實(shí)現(xiàn)這一點(diǎn),計(jì)算機(jī)呈現(xiàn)事物的數(shù)字表示。
  • 界面,也就是可以提高用戶交互質(zhì)量的基本HCI元素是界面。需要考慮許多與界面相關(guān)的因素,包括交互類型、屏幕分辨率、顯示尺寸,甚至顏色對(duì)比度。
  • 背景,HCI不僅涉及在用戶和計(jì)算機(jī)之間提供更好的通信,還涉及考慮訪問(wèn)系統(tǒng)的上下文和環(huán)境。

同時(shí)HCI具備六個(gè)目標(biāo),分別是高效使用(效率)、 安全使用(安全)、 具有良好的效用(實(shí)用性)、 易于學(xué)習(xí)(可學(xué)習(xí)性)以及易于記憶如何使用(可記憶性)。

在此基礎(chǔ)上,也衍生出了HCI的7個(gè)設(shè)計(jì)原則,如下:

原則1:公平使用;

原則2:使用靈活;

原則3:簡(jiǎn)單直觀地使用;

原則4:可感知的信息;

原則5:容錯(cuò)能力;

原則6:低體力勞動(dòng);

原則7:接近和使用的大小和空間。

在具體應(yīng)用中,物聯(lián)網(wǎng)、眼動(dòng)追蹤技術(shù)、語(yǔ)音識(shí)別技術(shù)、AR/VR的使用以及云計(jì)算等,都是非常典型的人機(jī)交互案例。

HCI發(fā)展史以及大量觀點(diǎn)及案例證明,技術(shù)可以明顯改善HCI。

伴隨著通訊與信息技術(shù)的突破與發(fā)展,它們持續(xù)為HCI帶來(lái)明顯的影響與改善。比如這些年借助AI技術(shù)蓬勃發(fā)展的RPA,就為業(yè)務(wù)流程自動(dòng)化以及辦公業(yè)務(wù)場(chǎng)景帶來(lái)了極大的人機(jī)交互帶來(lái)體驗(yàn)改善。

人機(jī)交互與RPA

前文我們提到,人機(jī)交互的目標(biāo)是使計(jì)算機(jī)能夠更好地適應(yīng)人的需求,提供更友好、更智能、更自然的交互方式,如語(yǔ)音識(shí)別、圖像識(shí)別、自然語(yǔ)言處理、手勢(shì)控制等。

RPA是一種利用軟件機(jī)器人模擬人類操作的技術(shù),它可以通過(guò)用戶界面與企業(yè)的應(yīng)用系統(tǒng)交互,并完成預(yù)期任務(wù)的技術(shù)。

當(dāng)代RPA還融合了人工智能(AI)和機(jī)器學(xué)習(xí)(ML)相結(jié)合,實(shí)現(xiàn)智能流程自動(dòng)化(IPA),處理更復(fù)雜的用例,如自然語(yǔ)言處理(NLP)、計(jì)算機(jī)視覺(jué)(CV)和數(shù)據(jù)分析等。

RPA可以實(shí)現(xiàn)重復(fù)性、基于規(guī)則的工作流程的自動(dòng)化,提高工作效率、準(zhǔn)確性和合規(guī)性,降低人力成本,減少錯(cuò)誤率,節(jié)省成本和時(shí)間,適用于各種重復(fù)性、標(biāo)準(zhǔn)化的業(yè)務(wù)場(chǎng)景,如財(cái)務(wù)、人力資源、供應(yīng)鏈、信息技術(shù)等。

王吉偉頻道曾在《數(shù)字化轉(zhuǎn)型時(shí)代,RPA+AI是打開(kāi)人機(jī)協(xié)同的最佳方式》一文中講過(guò),在當(dāng)代企業(yè)管理軟件系統(tǒng)以及各種自動(dòng)化工具中,從操作難度、部署周期、投資成本等角度而言,RPA可以算是廣大組織應(yīng)用人機(jī)協(xié)同最好的方式。

在這其中,RPA最大的優(yōu)勢(shì)就是降低了程序開(kāi)發(fā)難度,可以讓一線的業(yè)務(wù)人員參與到簡(jiǎn)單應(yīng)用的開(kāi)發(fā)之中,讓全民開(kāi)發(fā)成為進(jìn)一步成為現(xiàn)實(shí)。

RPA之所以能做到這一點(diǎn),在于它改變了程序開(kāi)發(fā)的人機(jī)交互模式。使得不會(huì)編程的普通員工借助RPA工具,也能像程序員一樣開(kāi)發(fā)他們需要的自動(dòng)化程序或者說(shuō)軟件機(jī)器人。

一方面RPA讓開(kāi)發(fā)程序變得更加簡(jiǎn)單,從寫(xiě)代碼變成了“拖拉拽”各種功能組件;另一方面可以讓更多的業(yè)務(wù)流程實(shí)現(xiàn)自動(dòng)化,不再需要人力去重復(fù)執(zhí)行??梢哉f(shuō),RPA同時(shí)改變了程序開(kāi)發(fā)和業(yè)務(wù)執(zhí)行的人機(jī)交互。

所以,RPA與人機(jī)交互有著密切的聯(lián)系。因?yàn)镽PA本質(zhì)上是一種人機(jī)協(xié)同的工作模式,它需要人來(lái)定義規(guī)則、監(jiān)督執(zhí)行、優(yōu)化改進(jìn),機(jī)器則負(fù)責(zé)執(zhí)行規(guī)則、提供反饋、學(xué)習(xí)改進(jìn)。

RPA不僅可以模擬人類的操作,還可以結(jié)合AI技術(shù),實(shí)現(xiàn)對(duì)人類的理解和決策。比如利用OCR(光學(xué)字符識(shí)別)技術(shù)識(shí)別圖像中的文字,利用NLP技術(shù)理解語(yǔ)言中的意圖,利用智能決策技術(shù)制定最優(yōu)方案等。

融合AI等技術(shù)的RPA,具備以下幾個(gè)優(yōu)勢(shì):

1、有效減輕工作負(fù)擔(dān),讓人們從繁瑣的后臺(tái)任務(wù)中解放出來(lái),專注于更有價(jià)值的創(chuàng)新和戰(zhàn)略性的工作;

2、提高人機(jī)交互的速度和質(zhì)量,軟件機(jī)器人可以全天候地工作,不受時(shí)間、地點(diǎn)和情緒的影響,也不會(huì)犯錯(cuò)或遺漏;

3、拓展人機(jī)交互的范圍和深度,軟件機(jī)器人可以訪問(wèn)和整合多個(gè)不相關(guān)的軟件系統(tǒng),處理大量結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),并利用AI和ML的能力進(jìn)行學(xué)習(xí)和優(yōu)化。

由此,RPA是一種有效且典型的優(yōu)化人機(jī)交互的技術(shù)。它可以實(shí)現(xiàn)流程自動(dòng)化、智能化和優(yōu)化,為企業(yè)帶來(lái)效率、質(zhì)量和價(jià)值的提升。

LLM對(duì)人機(jī)交互的影響

LLM是一種利用神經(jīng)網(wǎng)絡(luò)在大量無(wú)標(biāo)注文本上進(jìn)行自監(jiān)督學(xué)習(xí)或半監(jiān)督學(xué)習(xí)的語(yǔ)言模型。LLM具有海量的參數(shù)(通常為數(shù)十億或更多),能夠在多種任務(wù)上表現(xiàn)出優(yōu)異的性能。

從目前各領(lǐng)域的應(yīng)用來(lái)看,基于LLM的生成式AI技術(shù)的出現(xiàn),為人機(jī)交互帶來(lái)了顛覆性的變化。

生成式AI給人們最直接的感觸就是,原來(lái)工作流中的好多各種軟件操作以及跨軟件操作,現(xiàn)在只需要跟生成式AI進(jìn)行幾輪對(duì)話就完成了。

比如用Midjourney生成圖片或者是ChatGPT Plus生成軟件應(yīng)用代碼,已經(jīng)完全不需要使用繪圖軟件及編程軟件。并且ChatGPT 的插件生態(tài)正在快速完善,以后將會(huì)有越來(lái)越多應(yīng)用場(chǎng)景的業(yè)務(wù)操作,只需要對(duì)話就能搞定。

這就是交互方式的改變,它直接將原有的與各種軟件UI的人機(jī)交互,變成了與一個(gè)聊天窗口進(jìn)行交互,是一種前所未有的交互體驗(yàn)。

總結(jié)起來(lái),LLM或者說(shuō)生成式AI對(duì)人機(jī)交互產(chǎn)生了以下幾點(diǎn)影響:

首先,提高了人機(jī)交互的效率、質(zhì)量和便利性。通過(guò)生成式AI,用戶可以快速獲取想要的信息或服務(wù),不需要花費(fèi)大量的時(shí)間和精力。同時(shí)LLM可以根據(jù)用戶輸入和上下文生成合適的回復(fù),減少用戶輸入負(fù)擔(dān),提高交互流暢性和自然性。此外,生成式AI還可以根據(jù)用戶的反饋和偏好,動(dòng)態(tài)地調(diào)整自己的輸出,以達(dá)到更好的交互效果。

比如ChatGPT可以幫助用戶完成寫(xiě)作、設(shè)計(jì)、編程等復(fù)雜的任務(wù),或者為用戶提供個(gè)性化的推薦、咨詢、娛樂(lè)等內(nèi)容。

其次,增加人機(jī)交互的多樣性和創(chuàng)造性。LLM可以根據(jù)用戶需求和偏好生成不同風(fēng)格的文本、音頻、視頻等內(nèi)容,滿足用戶的個(gè)性化和多元化的需求。通過(guò)生成式AI,用戶可以接觸和選擇更多的內(nèi)容,從而拓展視野和思維。當(dāng)然,生成式AI也可以與用戶進(jìn)行更深入和靈活的對(duì)話,滿足用戶不同的情感和情緒需求。

比如通過(guò)生成式AI為用戶提供不同風(fēng)格和主題的文本、圖像、音樂(lè)等,或者為用戶生成一些新穎和有趣的內(nèi)容,如詩(shī)歌、故事、笑話等。

第三,改變?nèi)藱C(jī)交互的關(guān)系和意義。通過(guò)生成式AI,用戶可以與人工智能建立更緊密和信任的聯(lián)系,甚至產(chǎn)生一種共創(chuàng)與合作的感覺(jué)。

基于LLM的聊天機(jī)器人,可以為用戶提供更多的反饋和建議,或者與用戶共享自己的想法和感受。生成式AI還可以讓用戶更加了解自己和人工智能的優(yōu)勢(shì)和局限,以及如何更好地利用和發(fā)展它們。

第四,拓展人機(jī)交互的領(lǐng)域和場(chǎng)景。ChatGPT等生成式AI應(yīng)用具有強(qiáng)大的適應(yīng)性和泛化性,可以應(yīng)用于各種不同的領(lǐng)域和場(chǎng)景,如教育、娛樂(lè)、醫(yī)療、商業(yè)等。無(wú)論用戶想要學(xué)習(xí)、游戲、咨詢、購(gòu)物等,都可以通過(guò)與ChatGPT等應(yīng)用交流來(lái)達(dá)到目的。

第五,增強(qiáng)人機(jī)交互的趣味性和親切感?;贚LM的生成式AI應(yīng)用具有豐富的知識(shí)和個(gè)性,可以根據(jù)用戶的興趣和情緒來(lái)調(diào)整自己的語(yǔ)言風(fēng)格和話題,甚至可以生成一些幽默、詩(shī)歌、故事等創(chuàng)意內(nèi)容來(lái)娛樂(lè)用戶。

這樣,用戶不會(huì)感到與機(jī)器人交流是一件枯燥無(wú)味的事情,而會(huì)覺(jué)得與機(jī)器人交流是一件有趣和溫馨的事情。

LLM對(duì)人機(jī)交互有著重要而復(fù)雜的影響,使得它在各個(gè)領(lǐng)域都有著巨大發(fā)展?jié)摿托袠I(yè)應(yīng)用價(jià)值。廣大組織應(yīng)該積極地探索和利用LLM以及生成式AI,提升人機(jī)交互的水平和體驗(yàn),提高人機(jī)交互效率和質(zhì)量,增強(qiáng)人機(jī)交互關(guān)系,拓展人機(jī)交互的領(lǐng)域和場(chǎng)景。

當(dāng)然,我們也應(yīng)該注意其帶來(lái)的風(fēng)險(xiǎn)和挑戰(zhàn),以及如何合理地使用和監(jiān)督它。

需要說(shuō)明的是,目前基于大語(yǔ)言模型的生成式AI正在與RPA快速融合,生成式AI將會(huì)為RPA的人機(jī)交互帶來(lái)質(zhì)的飛躍。

LLM改變RPA人機(jī)交互

RPA可以自動(dòng)化執(zhí)行重復(fù)性、規(guī)則性和低價(jià)值的業(yè)務(wù)流程,可以提高效率、降低成本和減少錯(cuò)誤。但它也面臨著一些挑戰(zhàn)和局限性,比如難以處理復(fù)雜、多變和高價(jià)值的業(yè)務(wù)場(chǎng)景,以及難以適應(yīng)業(yè)務(wù)流程的變化,需要不斷地維護(hù)和更新,難以處理復(fù)雜的、非結(jié)構(gòu)化的、需要?jiǎng)?chuàng)造性或判斷力的任務(wù)等。

雖然超自動(dòng)化架構(gòu)已經(jīng)讓RPA的運(yùn)行足夠穩(wěn)定,但對(duì)于復(fù)雜流程而言也會(huì)存在穩(wěn)定運(yùn)行的隱患。

之前廠商們想盡各種辦法解決這些問(wèn)題,但無(wú)法從根本上杜絕這些問(wèn)題。直到基于LLM的生成式AI橫空出世,一下就解決了之前RPA遇到的多重難題。

對(duì)于LLM如何影響RPA,王吉偉頻道(id:jiwei1122)已經(jīng)在《GPT等AI大模型震撼來(lái)襲,基于RPA的超級(jí)自動(dòng)化仍是最佳落地載體》一文中有過(guò)詳細(xì)介紹。

這里,再簡(jiǎn)單說(shuō)說(shuō)LLM如何改變RPA的人機(jī)交互。

LLM可以為RPA提供更強(qiáng)大的自然語(yǔ)言處理能力,提供更強(qiáng)大的知識(shí)獲取和推理能力,以及提供更強(qiáng)大的生成和創(chuàng)造能力。

具體而言,LLM對(duì)于RPA人機(jī)交互的影響可以體現(xiàn)于以下幾個(gè)方面:

提高RPA的智能水平。應(yīng)用LLM,能夠更好地識(shí)別和理解用戶的自然語(yǔ)言輸入以及生成自然語(yǔ)言,更好地滿足用戶的需求和意圖。還可以根據(jù)上下文和目標(biāo)生成合適的操作步驟,進(jìn)行多輪對(duì)話和推理,處理更復(fù)雜和多樣的業(yè)務(wù)場(chǎng)景,實(shí)現(xiàn)更復(fù)雜和靈活的業(yè)務(wù)流程自動(dòng)化。

用戶可以通過(guò)語(yǔ)音或文字與RPA進(jìn)行對(duì)話,告訴它要執(zhí)行什么任務(wù),而不需要通過(guò)復(fù)雜的編程或拖拽組件來(lái)設(shè)計(jì)流程。

此外,LLM也可以幫助RPA進(jìn)行知識(shí)抽取和推理,從而提供更有價(jià)值的信息和建議。

擴(kuò)展RPA的應(yīng)用范圍。LLM可以有效擴(kuò)大RPA的應(yīng)用范圍,讓軟件機(jī)器人能夠處理更多涉及自然語(yǔ)言的任務(wù),比如文本分類、文本摘要、文本生成、機(jī)器翻譯、問(wèn)答系統(tǒng)等。也可以通過(guò)與其他模態(tài)的數(shù)據(jù)進(jìn)行交互,比如圖像、音頻、視頻等,從而實(shí)現(xiàn)更豐富和多維的業(yè)務(wù)流程。

LLM還可以讓軟件機(jī)器人能夠與其他AI技術(shù)如OCR、NLP、低代碼、流程挖掘、chatbot等進(jìn)行集成和協(xié)作,實(shí)現(xiàn)超級(jí)自動(dòng)化。

通過(guò)使用LLM,RPA可以跨越語(yǔ)言和文化的障礙,服務(wù)更廣泛和多元的客戶和市場(chǎng)。

增加RPA的創(chuàng)新潛力。LLM可以增強(qiáng)RPA的創(chuàng)造力和靈活性,使其能夠根據(jù)不同的場(chǎng)景和數(shù)據(jù)生成適合的文本,如報(bào)告、摘要、建議等。例如,RPA可以根據(jù)用戶提供的關(guān)鍵詞或主題,自動(dòng)生成一篇博客文章,并在文章中插入相關(guān)的圖片、視頻、鏈接等。

通過(guò)使用LLM,RPA可以進(jìn)行更靈活和自適應(yīng)的學(xué)習(xí)和生成,產(chǎn)生更多新穎和有趣的內(nèi)容和方案。LLM也可以與人類進(jìn)行更有效和友好的協(xié)作和溝通,激發(fā)更多的創(chuàng)意和靈感。

提升RPA的開(kāi)發(fā)效率。生成式AI可以讓用戶通過(guò)簡(jiǎn)單的語(yǔ)言描述來(lái)定義和修改業(yè)務(wù)流程,而不需要編寫(xiě)復(fù)雜的代碼或者使用圖形化界面。并可以根據(jù)用戶的反饋和數(shù)據(jù)分析來(lái)優(yōu)化和調(diào)整業(yè)務(wù)流程,實(shí)現(xiàn)持續(xù)改進(jìn)。

優(yōu)化RPA交互體驗(yàn)和用戶滿意度。融合LLM的RPA能夠與用戶進(jìn)行更加自然、友好、有趣的對(duì)話,增加用戶的信任和參與感。RPA可以根據(jù)用戶的情緒和興趣,調(diào)整語(yǔ)氣和風(fēng)格,甚至講一些幽默或者引用一些名人名言來(lái)調(diào)節(jié)氣氛。

擴(kuò)展閱讀:ChatGPT與RPA集成,生成式AI+自動(dòng)化流程讓AIGC價(jià)值倍增

當(dāng)然,LLM對(duì)RPA人機(jī)交互的影響不只是智能、效率和創(chuàng)新層面的,它還直接影響了RPA的軟件架構(gòu)變化。

后記:LLM影響下的RPA架構(gòu)變遷

在LLM之前,RPA已經(jīng)極大地改善了程序開(kāi)發(fā)以及流程自動(dòng)化的人機(jī)交互。并且,很多廠商都已經(jīng)打出了“RPA人人可用”的概念。在這個(gè)概念的背后,其實(shí)就是RPA的易用性越來(lái)越強(qiáng),應(yīng)用它開(kāi)發(fā)程序并實(shí)施流程自動(dòng)化越發(fā)簡(jiǎn)單。

在易用性方面,從CV到屏幕抓取再到AI模型,廠商們做了大量的探索與嘗試。在RPA的程序開(kāi)發(fā)環(huán)節(jié)上,基于AI、0代碼等技術(shù),RPA正在逐步擺脫原有的“拖拉拽”形式,向“點(diǎn)選用”以及對(duì)話式(包括語(yǔ)音驅(qū)動(dòng))流程創(chuàng)建的方式過(guò)渡。

在人機(jī)交互上,對(duì)話式流程創(chuàng)建,可以說(shuō)是RPA乃至超自動(dòng)化的終極狀態(tài)。未來(lái)我們要使用超自動(dòng)化,只要在系統(tǒng)內(nèi)打幾行字或者說(shuō)一句話就能創(chuàng)建各種軟件機(jī)器人或者自動(dòng)化程序。

但是之前的對(duì)話式創(chuàng)建,僅適用于簡(jiǎn)單的預(yù)設(shè)置流程。稍微復(fù)雜的流程便無(wú)能為力,或者需要更多流程步驟去觸發(fā)和調(diào)動(dòng)更多流程才能實(shí)現(xiàn)。流程的健壯性難以經(jīng)受考驗(yàn),并且用戶必須熟悉相應(yīng)語(yǔ)法及指令才能使用。

在應(yīng)用體驗(yàn)上,仍然存在一些不足或者說(shuō)進(jìn)步空間。

LLM出現(xiàn)之后,對(duì)于融合生成式AI的RPA產(chǎn)品,用戶使用自然語(yǔ)言都能驅(qū)動(dòng)RPA去創(chuàng)建流程。

并且生成式AI以生成內(nèi)容的形式彌補(bǔ)RPA在情緒識(shí)別、非結(jié)構(gòu)化數(shù)據(jù)處理等方面的不足,可以讓任何人無(wú)需太多學(xué)習(xí)就能更加簡(jiǎn)單、快速、高效的驅(qū)動(dòng)RPA開(kāi)發(fā)各種自動(dòng)化程序,真正讓RPA實(shí)現(xiàn)了人人可用。

多家廠商引入ChatGPT,集成與融合生成式AI成為RPA技術(shù)新趨勢(shì)

以前使用RPA,是人直接操作RPA通過(guò)托拉拽搭積木的方式搭建各種程序?,F(xiàn)在則是人通過(guò)自然語(yǔ)言與GPT等生成式AI溝通,多模態(tài)AI在理解人類操作意圖后,進(jìn)一步驅(qū)動(dòng)RPA連接企業(yè)管理軟件去自動(dòng)化執(zhí)行各種業(yè)務(wù)流程。

GPT等AI大模型則進(jìn)一步連接了人與RPA等系統(tǒng),向上連接人的意圖,向下指揮RPA機(jī)器人,成為人和RPA等自動(dòng)化系統(tǒng)之間的一個(gè)紐帶,讓程序開(kāi)發(fā)與自動(dòng)化流程的操作更加簡(jiǎn)單。

GPT把人和基于RPA的超自動(dòng)化連接起來(lái),這是人機(jī)交互體驗(yàn)上一個(gè)巨大的進(jìn)步。

在王吉偉頻道看來(lái),從過(guò)去的“人+RPA”到現(xiàn)在的“人+生成式AI+RPA”,引入LLM以及集成生成式AI,表面看是極大地提升了RPA產(chǎn)品的人機(jī)交互,本質(zhì)上是LLM影響了RPA的架構(gòu)變化。

現(xiàn)在幾乎所有廠商都在重度研究LLM與RPA以及超自動(dòng)化的全面融合,RPA都已在產(chǎn)品架構(gòu)中加入了模型層。

這意味著,不管是調(diào)用第三方模型還是自研模型,RPA都已成為標(biāo)準(zhǔn)的模型層上的應(yīng)用。

可以預(yù)見(jiàn),接下來(lái)隨著LLM成為RPA的標(biāo)配,它也將全面變革大模型時(shí)代的RPA。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。