文|數(shù)智前線 徐鑫
編輯|周路平
過去幾十年里,工業(yè)質(zhì)檢領(lǐng)域是傳統(tǒng)機(jī)器視覺廠商的主場,典型代表有基恩士和康耐視等國際巨頭和老牌機(jī)器視覺廠商,他們用標(biāo)準(zhǔn)化的軟硬件產(chǎn)品占據(jù)了大部分工業(yè)質(zhì)檢市場。
不過,在一些光學(xué)成像環(huán)境相對復(fù)雜,以及瑕疵類型很難被明確定義的場景,或者目前的機(jī)器視覺設(shè)備無法達(dá)到檢測要求的混檢場景,依然依賴人工。而隨著深度學(xué)習(xí)技術(shù)進(jìn)步,不少企業(yè)選擇通過AI 算法的視覺檢測技方案進(jìn)入這一市場。
但問題也非常明顯。在很多場景里,AI算法的定制色彩濃厚,對瑕疵的識別能力很難從一個場景遷移到其他類似場景。同時(shí),工業(yè)制造中質(zhì)量要求高,罕見的瑕疵數(shù)據(jù)很難收集,負(fù)樣本不足,使得算法的識別能力有待加強(qiáng)。
大模型到來后,這些痛點(diǎn)有望得到解決。市場分析機(jī)構(gòu)IDC中國高級分析師楊雯告訴數(shù)智前線,目前,AI質(zhì)檢與大模型的結(jié)合在業(yè)界已經(jīng)有了一些探索和落地。相比原有的小模型方案,大模型對瑕疵識別的泛化能力更高,一個場景訓(xùn)練的模型可以遷移到類似場景而不需要更多算法調(diào)整,同時(shí)還能更好應(yīng)用多模態(tài)數(shù)據(jù),提取特征,提升質(zhì)檢的準(zhǔn)確性。
在大模型真正解決這些行業(yè)瓶頸前,競爭仍在持續(xù)。老牌的機(jī)器視覺標(biāo)準(zhǔn)化方案商力圖增加軟件方面的能力,而此前長于算法的團(tuán)隊(duì)則在加強(qiáng)產(chǎn)品的標(biāo)準(zhǔn)化能力,軟硬件一體交付。有資深人士認(rèn)為,在逐漸相融的戰(zhàn)場里,一些僅憑算法想切入場景的公司會越來越艱難。
01、非標(biāo)場景正在被攻破
蘇州常熟的一家印刷電路板工廠的終檢車間,工人們頂著工作臺上的LED光,在電腦屏幕前,細(xì)致地復(fù)檢一塊又一塊指甲蓋大小的電路板。
這些電路板剛剛通過一臺外觀檢測機(jī)的檢測,被設(shè)備判定為了“瑕疵品”。外觀檢測機(jī)在電子元件和半導(dǎo)體行業(yè)里非常常見,原本需要人工在顯微鏡上完成的作業(yè),有了它之后,可由一套機(jī)器視覺設(shè)備自動處理。它包含了光源、工業(yè)相機(jī)和機(jī)器視覺軟件等一套完整的軟硬件解決方案,作業(yè)時(shí)需要在軟件上定義瑕疵的類型,例如設(shè)置色差和灰階值等,判定出瑕疵。
但這種設(shè)備也有短板,為了確保良率,經(jīng)常會出現(xiàn)“誤殺”的情況,行業(yè)內(nèi)稱為“假點(diǎn)”。工人們之所以需要在電腦屏幕上進(jìn)行復(fù)檢,就是把被“誤殺”的良品挑出來。這也是傳統(tǒng)的機(jī)器視覺解決方案在工業(yè)現(xiàn)場經(jīng)常碰到的情況。自動化設(shè)備可以降低質(zhì)檢的人力成本,但如果準(zhǔn)確率達(dá)不到要求時(shí),還需要人工去完成假點(diǎn)復(fù)核,才能確保質(zhì)檢的準(zhǔn)確性。
AI質(zhì)檢解決方案就在這種時(shí)刻登場。在上述工廠里,百度智能云的AI質(zhì)檢解決方案,可以用AI算法去學(xué)習(xí)假點(diǎn)的特性,原有的外觀檢測機(jī)發(fā)現(xiàn)假點(diǎn)后,用人工智能的算法學(xué)習(xí)假點(diǎn)的特點(diǎn),自動去除絕大多數(shù)假點(diǎn),就能免去人工復(fù)核時(shí)大量的不必要工作。
焊點(diǎn)和點(diǎn)膠等也是傳統(tǒng)機(jī)器視覺解決方案很難有很好檢測效果的場景。AI質(zhì)檢解決方案商偲倢科技的AI技術(shù)總監(jiān)黃靖瑋告訴數(shù)智前線,傳統(tǒng)的機(jī)器視覺方案,需要寫一些規(guī)則來定義需要檢測的場景。它能處理一些容易定義的特征,如顏色、面積、規(guī)則的形狀和距離等指標(biāo)。但焊點(diǎn)這個場景,由人去定義規(guī)則其實(shí)很困難。比如焊點(diǎn)的大小和顏色的情況等,在定義規(guī)則時(shí)會變得很復(fù)雜,人的肉眼去判斷則更為直觀。通常情況下這類場景都是人肉眼識別完成。
偲倢科技是一家總部在臺北的工業(yè)AI創(chuàng)業(yè)公司,目前他們的質(zhì)檢整體解決方案已經(jīng)應(yīng)用在半導(dǎo)體、連接器等多個高附加值行業(yè)?!翱蛻粲型袋c(diǎn),但是傳統(tǒng)的視覺方案不好做的場景,也是客戶對我們有需求的地方?!秉S靖瑋介紹,例如產(chǎn)線可能有10種瑕疵,原來的視覺檢測的方案可檢查出7種,針對后面沒有辦法檢測的3種,客戶可能會用AI方案去做。
質(zhì)量檢測是工業(yè)大生產(chǎn)的重要一環(huán)。在全球,利用機(jī)器視覺來檢查產(chǎn)品的外觀,提升產(chǎn)品的一致性,保證質(zhì)量穩(wěn)定,催生了繁榮的機(jī)器視覺質(zhì)檢市場,行業(yè)里還出現(xiàn)了基恩士這樣的年?duì)I收超過六十億美金,市值超過1000億美元的機(jī)器視覺龍頭。GGII數(shù)據(jù)顯示,2021年全球機(jī)器視覺市場規(guī)模約為804億元,同比2020年增長12.15%,預(yù)計(jì)至2025年該市場規(guī)模將超過1200億元。
近年來隨著深度學(xué)習(xí)技術(shù)進(jìn)步,基于深度學(xué)習(xí)等 AI 算法的視覺檢測技術(shù),被用于工業(yè)生產(chǎn),對產(chǎn)品圖像進(jìn)行視覺檢測,幫助發(fā)現(xiàn)和消除缺陷,相關(guān)的解決方案商也已嶄露頭角。百度、騰訊、阿里、華為等多家云廠商以及創(chuàng)新奇智等一批創(chuàng)新企業(yè)都在這一賽道布局。
IDC統(tǒng)計(jì),2022 年工業(yè)質(zhì)檢解決方案(不包含硬件) 整體市場規(guī)模為 2.7 億美元,較 2021 年增長了 27.4%,增長趨勢有所放緩,但對比其他 AI市場仍然屬于相對較高的水平。業(yè)界人士認(rèn)為,作為新興賽道,這一領(lǐng)域處于初期發(fā)展階段,但增長勢頭迅猛。
02、復(fù)雜工業(yè)場景遇到落地瓶頸
資深人士指出,附加值高的行業(yè)正率先應(yīng)用和探索AI質(zhì)檢方案。IDC介紹,目前AI質(zhì)檢解決方案在通信和電子制造、汽車及零部件、消費(fèi)品和原材料等行業(yè)里的需求相對旺盛,是目前市場的主要應(yīng)用行業(yè)。其中3C和汽車(包括鋰電池制造)行業(yè)成熟的應(yīng)用場景較多,應(yīng)用的范圍也比較廣。2022年,AI 質(zhì)檢有不少新行業(yè)和新應(yīng)用場景出現(xiàn),例如裝備制造、包裝印刷、食品飲料等。
也有不少企業(yè)在探索紡織行業(yè)應(yīng)用AI質(zhì)檢方案。但這個市場有特殊性。一方面,市場規(guī)模龐大,但此前的行業(yè)標(biāo)準(zhǔn)化程度及信息化建設(shè)水平相對較低,傳統(tǒng)的機(jī)器視覺質(zhì)檢方案落地難度大。近年來,行業(yè)里一些企業(yè)的自動化流程提升,加上成熟工人招工變困難,而業(yè)務(wù)場景里切實(shí)存在痛點(diǎn),人工檢測方案容易漏檢影響質(zhì)量。另外一些新的趨勢如小單快反等市場需求也倒逼行業(yè)的生產(chǎn)效率提速,這使得不少服裝企業(yè)重視AI的解決方案在質(zhì)檢環(huán)節(jié)應(yīng)用。
不過,AI算法要解決復(fù)雜工業(yè)場景里的問題,客觀上需要跨越多重挑戰(zhàn)。
兩年前,在將企業(yè)的AI質(zhì)檢解決方案AINavi落地到一些半導(dǎo)體、連接器等行業(yè)時(shí),黃靖瑋和他的同事們?yōu)殍Υ脭?shù)據(jù)不足感到困擾。實(shí)際上這也是行業(yè)里普遍面臨的問題。要訓(xùn)練AI算法需要不少的負(fù)樣本數(shù)據(jù),但是由于工業(yè)生產(chǎn)對質(zhì)量要求嚴(yán)苛,通常良率很高,一個半導(dǎo)體元件的某類瑕疵,半年可能也很難遇見一次。
同時(shí),工廠環(huán)境里的瑕疵樣本需要嚴(yán)格遵守客戶的保密要求,除非經(jīng)過允許,一般很難被解決方案商拿出客戶環(huán)境做訓(xùn)練,這客觀上也限制了AI算法的性能提升。一位資深人士還告訴數(shù)智前線,目前工業(yè)質(zhì)檢相關(guān)的公開數(shù)據(jù)集非常缺乏。例如他們關(guān)注的某一類半導(dǎo)體相關(guān)的公開數(shù)據(jù)圖片只有幾百張,這大大影響了訓(xùn)練出來的算法模型的智能程度。
除了數(shù)據(jù)缺乏,工業(yè)現(xiàn)場的各種變化也考驗(yàn)AI算法的落地能力。例如,企業(yè)最初應(yīng)用AI算法時(shí),希望能解決某個場景里的所有瑕疵。但隨著應(yīng)用落地后,企業(yè)經(jīng)營狀況可能發(fā)生了變化。比如出現(xiàn)產(chǎn)量不足問題時(shí),企業(yè)就想要增加產(chǎn)量。這時(shí)如果某一類瑕疵對品質(zhì)沒有太多的影響,企業(yè)可能希望放過不檢。
上述資深人士介紹,要讓AI模型知道,某一類瑕疵不檢測,一般要重新訓(xùn)練模型,讓它適應(yīng)新的場景。算法無法適應(yīng)業(yè)務(wù)需要,這也是許多企業(yè)應(yīng)用AI質(zhì)檢方案有疑慮的地方?!跋啾榷?,傳統(tǒng)的工業(yè)視覺解決方案可能只需要調(diào)整幾個參數(shù)就能繼續(xù)服務(wù),但AI質(zhì)檢解決方案可能需要重新訓(xùn)練模型”,該人士說。
另外,產(chǎn)品本身可能也在更新。比如產(chǎn)品增加了新的型號,涉及到不同的材料、顏色或者形狀,這時(shí)可能也需要重新去訓(xùn)練算法來適應(yīng)新場景。一位制造業(yè)智能化的資深人士評價(jià),“做單一場景的算法很容易出現(xiàn)ROI算不過來的情況。”因此許多潛在應(yīng)用方非常關(guān)注AI質(zhì)檢解決方案上線后,未來企業(yè)自己能否自主調(diào)整或擴(kuò)充算法,使其更具適應(yīng)性。
IDC楊雯也告訴數(shù)智前線,AI質(zhì)檢領(lǐng)域發(fā)展到現(xiàn)在,主要的瓶頸有,數(shù)據(jù)的質(zhì)量和數(shù)量不足,難以訓(xùn)練出高性能的模型;以及場景的碎片化,算法模型的泛化能力和魯棒性不能適應(yīng)各種復(fù)雜的應(yīng)用場景,新場景算法開發(fā)成本偏高等。目前,行業(yè)是否能落地應(yīng)用AI質(zhì)檢技術(shù),主要取決于場景的技術(shù)難度和投入產(chǎn)出比。
03、平臺是沉淀標(biāo)準(zhǔn)的關(guān)鍵
為了解決場景的碎片化難題,提升算法的泛化能力和魯棒性,行業(yè)也有一些新的思路。
一位業(yè)界資深人士告訴數(shù)智前線,針對同一個產(chǎn)線里的算法適應(yīng)性問題,有些廠商會開發(fā)一些工具,并在算法上線前就與應(yīng)用企業(yè)充分討論瑕疵的定義和未來調(diào)整與變動可能性。未來場景變動,需要重新訓(xùn)練算法時(shí),企業(yè)能自己上手并快速調(diào)整。
AI質(zhì)檢服務(wù)商還把AI質(zhì)檢解決方案落地抽象成固化的流程,并用軟件和工具去簡化過程,從而加速其在不同企業(yè)的落地。例如,偲倢科技把AI算法落地到產(chǎn)線上固化為幾步:瑕疵定義(使其符合實(shí)際產(chǎn)線上的規(guī)范)、標(biāo)注方式(并與標(biāo)注員同步)、模型訓(xùn)練和驗(yàn)證,最后要上產(chǎn)線去調(diào)整模型。黃靖瑋介紹,他們做了軟件工具,雖然算法每落地一個企業(yè)都要走這個流程,但有了規(guī)范,在軟件工具的幫助下,過程會更為順利。
一些新趨勢也在出現(xiàn)。隨著企業(yè)內(nèi)部智能化應(yīng)用場景逐步增加,企業(yè)應(yīng)用AI的程度深入,大型企業(yè)里存在大量的智能化視覺設(shè)備,里面有各類算法,不管是標(biāo)準(zhǔn)的還是定制的,這些算法都需要針對場景變化做一些迭代和復(fù)用。
比如,企業(yè)跟高校合作開發(fā)某個場景的視覺智能算法,算法的后期運(yùn)維需要企業(yè)來做,這是個令人頭疼的問題。阿里云的資深制造業(yè)解決方案專家華超杰認(rèn)為,“這里面就出現(xiàn)了類似于整體的視覺算法平臺化能力的機(jī)會。”阿里云把工業(yè)場景里與質(zhì)量有關(guān)的場景需求和能力抽象成了質(zhì)量智能管理解決方案(AIQS),這個開放性平臺提供了質(zhì)量分析的完整工具鏈,滿足企業(yè)從全局出發(fā)管理視覺能力的需求。
目前主流大廠的產(chǎn)品或解決方案都非常重視從平臺層面建設(shè)與AI質(zhì)檢相關(guān)的能力,沉淀相對標(biāo)準(zhǔn)化的解決方案,一方面解決復(fù)制性問題,另外也能滿足企業(yè)更系統(tǒng)建設(shè)智能化能力的需求。
例如,百度智能云在工業(yè)質(zhì)檢領(lǐng)域的能力沉淀到了“開物”旗下的工業(yè)視覺智能平臺上,其中封裝了從底層算法、算子到上層的行業(yè)性模型等多層能力,并能夠提供完備的端到端解決方案。相關(guān)工程師此前接受數(shù)智前線采訪時(shí)表示,一個新的案例出現(xiàn),如果在有成熟模型的行業(yè),就可以基于初始模型,快速去做模型訓(xùn)練和迭代。如果是全新的場景,也可以基于AI框架和結(jié)構(gòu),從算法、算式和整個模型層快速作零代碼開發(fā)。
騰訊云在AI質(zhì)檢領(lǐng)域則形成了TI平臺、工業(yè)質(zhì)檢訓(xùn)練平臺等AI視覺檢測產(chǎn)品矩陣,覆蓋工業(yè)質(zhì)檢全流程。以騰訊云TI平臺為例,它能幫助研發(fā)人員提高AI應(yīng)用開發(fā)、調(diào)試效率。在一站式的平臺上打通標(biāo)注、建模、調(diào)優(yōu)、封裝、服務(wù)發(fā)布全流程,輔助客戶做數(shù)據(jù)可視化與統(tǒng)一納管,提供可視化與低碼建模工具,降低AI建模與調(diào)試的門檻。
除了AI的視覺檢測技術(shù)布局,一些廠商還重視基于設(shè)備數(shù)據(jù)的數(shù)據(jù)智能能力,用于一些無法通過視覺觀察表面判定質(zhì)量水平的場景。以阿里云的AIQS為例,他們除了AI視覺質(zhì)檢產(chǎn)品,也在重點(diǎn)打造質(zhì)檢等數(shù)據(jù)智能解決方案。在流程制造領(lǐng)域,利用設(shè)備每秒產(chǎn)生的數(shù)據(jù)用于監(jiān)控質(zhì)量問題。比如,焊接過程中,把兩個金屬件焊接在一起時(shí),采集設(shè)備產(chǎn)生的連續(xù)數(shù)據(jù),通過算法去分析,可以判定質(zhì)量是否有異常,也可以提前去做質(zhì)量的預(yù)測,并做相關(guān)工藝的干預(yù)和推薦。
04、大模型帶來的行業(yè)思考
大模型的風(fēng)刮到了AI質(zhì)檢領(lǐng)域。無論是視覺類AI檢測方案,還是數(shù)據(jù)智能類產(chǎn)品,都有利用大模型升級的潛力。
IDC分析師楊雯指出,在視覺類場景里,大模型的優(yōu)越性主要體現(xiàn)在對瑕疵識別的泛化能力更高。大模型由于具有更多的參數(shù)和更大的容量,能夠更好地遷移到其他場景。同時(shí),它可以通過更深層次的神經(jīng)網(wǎng)絡(luò)和更復(fù)雜的算法,更好地提取圖像和數(shù)據(jù)的特征,從而更準(zhǔn)確地識別瑕疵和異常。
另外,大模型還可以更好地利用自監(jiān)督學(xué)習(xí)方法,從大量的無標(biāo)注數(shù)據(jù)中學(xué)習(xí)到復(fù)雜表征,進(jìn)一步提高模型的魯棒性。這種自監(jiān)督學(xué)習(xí)能力對于解決工業(yè)AI質(zhì)檢中的數(shù)據(jù)標(biāo)注困難和數(shù)據(jù)稀缺問題具有重要意義。
百度智能云工業(yè)互聯(lián)網(wǎng)解決方案首席架構(gòu)師楊文旭則介紹,除了用大模型解決數(shù)據(jù)不足的問題,基于大模型的遷移學(xué)習(xí)技術(shù),企業(yè)還可以利用自己的小數(shù)據(jù)集進(jìn)行微調(diào),從而使其模型更具針對性。
同時(shí)他認(rèn)為,大模型結(jié)合跨模態(tài)技術(shù),將進(jìn)一步擴(kuò)大AI模型的應(yīng)用范圍。AI質(zhì)檢大模型具備對缺陷影像的解讀能力,用戶不僅僅可以對單一的質(zhì)量缺陷數(shù)據(jù)進(jìn)行深入了解,而且模型可以針對影像的特征,面向用戶提出改進(jìn)建議,進(jìn)而推動企業(yè)進(jìn)行工藝和質(zhì)量改進(jìn)。
黃靖瑋則透露,未來他們將重點(diǎn)在兩個應(yīng)用上探索與大模型的結(jié)合。一個是資料標(biāo)注領(lǐng)域。此前AI質(zhì)檢應(yīng)用過程里,資料數(shù)據(jù)標(biāo)注需要花很長時(shí)間,還經(jīng)常遇到數(shù)據(jù)不足問題。他認(rèn)為,如果能訓(xùn)練出一個比較大型的通用瑕疵模型,在一些新的瑕疵出現(xiàn)時(shí),不用去重新訓(xùn)練模型,就能找出大部分瑕疵。未來在數(shù)據(jù)標(biāo)注環(huán)節(jié),它可以大幅減少數(shù)據(jù)標(biāo)注的成本。
另外大模型的泛化性強(qiáng),使用少量的瑕疵數(shù)據(jù),把通用大模型蒸餾成一個小的質(zhì)檢模型。這樣這個質(zhì)檢模型可以部署到邊緣設(shè)備上,既能在準(zhǔn)確率上達(dá)到客戶的要求,同時(shí)又一定程度保留了大模型的泛用能力。
華超杰告訴數(shù)智前線,基于大模型加AI質(zhì)量分析,阿里云將圍繞兩個核心應(yīng)用場景作探索。一個應(yīng)用場景在視覺場景中。比如在電網(wǎng)側(cè)做自動巡檢,巡檢算法需要有一些異常樣本,例如輸電線上的鳥巢。這些場景不是一直有,但可以通過大模型的AIGC能力,讓大模型去生成一些想要的場景,幫助去做模型的訓(xùn)練。
另一個核心場景在數(shù)據(jù)智能產(chǎn)品上。利用設(shè)備的連續(xù)數(shù)據(jù)去分析質(zhì)量變化,這里面應(yīng)用到了時(shí)序大模型。大語言模型本質(zhì)是預(yù)測下一個詞匯的概率然后生成。時(shí)序大模型里,設(shè)備的數(shù)據(jù)天然符合一個時(shí)間序列,用大模型的手段去實(shí)現(xiàn)這種神經(jīng)網(wǎng)絡(luò)的任務(wù)自動構(gòu)建,機(jī)器運(yùn)轉(zhuǎn)有大量的歷史數(shù)據(jù),最后也能夠得出一個概率,運(yùn)用到生產(chǎn)實(shí)踐中,能產(chǎn)生一些智能化結(jié)果,最終就能夠在長時(shí)間段和短時(shí)間精準(zhǔn)捕捉異常。
目前,他們正在加緊用時(shí)序大模型加原有的AI質(zhì)量分析的方法結(jié)合在一起,去提升AI的質(zhì)檢分析能力。
而隨著AI質(zhì)檢解決方案商積極擁抱大模型技術(shù),加強(qiáng)通用軟件平臺或硬件系統(tǒng)的研發(fā)和推廣以實(shí)現(xiàn)規(guī)?;瘡?fù)制,一些傳統(tǒng)的機(jī)器視覺玩家也在“變軟”。
一位云廠商的資深人士評價(jià),設(shè)備廠商們增加智能能力,硬件公司增加算法等軟件能力的趨勢,會讓單一場景的算法企業(yè)變得非常被動?!白鰴z測設(shè)備的廠商們場景的標(biāo)準(zhǔn)化程度高,產(chǎn)線的價(jià)值也高,廠商們與企業(yè)本身就有采購關(guān)聯(lián)。在固有的采購上加一個智能算法,它進(jìn)入工廠的難度更小。而如果純做軟件或算法服務(wù)商,可能能吃第一口,但后面就很容易被人家模仿?!?/p>
他也提到,有些算法企業(yè)為了能夠拿下項(xiàng)目,甚至以算法、硬件都免費(fèi)的方式給企業(yè)做POC驗(yàn)證。但這種模式從長遠(yuǎn)看難以為繼。
對從AI算法起家的玩家而言,向老牌玩家們學(xué)習(xí),從定制解決方案往標(biāo)準(zhǔn)化方向拓展,正成為能力建設(shè)的重點(diǎn)。
“未來,深入挖掘行業(yè),發(fā)現(xiàn)新的技術(shù)應(yīng)用場景,利用大模型、AIGC 等新技術(shù)提高工業(yè)質(zhì)檢精度,可能是AI質(zhì)檢廠商們站穩(wěn)腳跟的重要途徑之一”,楊雯說。