正在閱讀:

算力焦慮有救了:憶阻器(RRAM)存算一體路線再次被肯定

掃一掃下載界面新聞APP

算力焦慮有救了:憶阻器(RRAM)存算一體路線再次被肯定

學(xué)界與產(chǎn)界為何要選擇研發(fā)該路線?該路線的發(fā)展前景如何?

文 | 偲睿洞察 Renee

編輯 | 孫越

近日,清華大學(xué)發(fā)布的一顆憶阻器存算一體芯片,火了。該芯片的火爆源于一個(gè)月前,清華大學(xué)發(fā)的一篇論文:

2023年9月14日,清華大學(xué)吳華強(qiáng)及高濱共同通訊在Science在線發(fā)表題為“Edge learning using a fully integrated neuro-inspired memristor chip”的研究論文,論文顯示,團(tuán)隊(duì)基于存算一體計(jì)算范式,研制出全系統(tǒng)集成、支持高效片上學(xué)習(xí)(機(jī)器學(xué)習(xí)能在硬件端直接完成)的憶阻器存算一體芯片。

“憶阻器存算一體”這一概念瞬間引爆學(xué)界與產(chǎn)業(yè)界,甚至登上了微博高位熱搜。據(jù)筆者獲悉,清華大學(xué)所用的憶阻器件就是RRAM(ReRAM)。

此次清華大學(xué)科研成果的意義,不僅在于研發(fā)出首顆基于憶阻器(RRAM)的片上學(xué)習(xí)存算一體芯片,更在于為產(chǎn)業(yè)界存算一體存儲(chǔ)介質(zhì)的應(yīng)用和發(fā)展給出了更多方向,以及在技術(shù)實(shí)踐上的引導(dǎo)性意見。

本文試圖探究,學(xué)界與產(chǎn)界為何要選擇研發(fā)該路線?該路線的發(fā)展前景如何?

PART-01 憶阻器存算一體是為何物?

無論是從其官方表述,還是論文中“可重構(gòu)的憶阻器存算一體架構(gòu)圖”,我們都能明確知道,清華大學(xué)所說憶阻器便是阻變存儲(chǔ)器RRAM(ReRAM)。

2022年9月,清華大學(xué)集成電路學(xué)院錢鶴、吳華強(qiáng)教授課題組聯(lián)合斯坦福大學(xué)、加州大學(xué)圣地亞哥分校(UCSD)、圣母大學(xué)等在《自然》(Nature)發(fā)表的題為A compute-in-memory chip based on resistive random-access memory研究論文。

該論文報(bào)道了一款基于憶阻器(阻變存儲(chǔ)器)的存算一體芯片NeuRRAM。該芯片具有可重新配置的計(jì)算核心(reconfiguring CIM cores),可以兼容不同的模型結(jié)構(gòu)。

(可重構(gòu)的憶阻器存算一體架構(gòu) 圖源:清華大學(xué))

專家表示,從定義來看,憶阻器(英文:memristor)為電阻受先前通過電荷量控制的電子器件,其特點(diǎn)為通常具有電流電壓蝴蝶形回滯曲線。憶阻器的概念最早由蔡少棠教授提出,最早由阻變存儲(chǔ)器,即RRAM實(shí)驗(yàn)驗(yàn)證,因此經(jīng)常以RRAM作為憶阻器的代表。

當(dāng)然,嚴(yán)格來說,根據(jù)材料和物理機(jī)制,憶阻器件可分為阻變存儲(chǔ)器(Resistive Random-Access Memory, 簡(jiǎn)稱RRAM或ReRAM),相變存儲(chǔ)器(PCRAM),磁隨機(jī)存儲(chǔ)器(MRAM)和鐵電隨機(jī)存儲(chǔ)器(FeRAM)等不同種類。此外還有光電憶阻器、有機(jī)材料憶阻器、流體憶阻器等。也就是說,憶阻器有著諸多選項(xiàng),那么為何要選擇阻變存儲(chǔ)器RRAM?

我們都知道的是,傳統(tǒng)馮·諾依曼結(jié)構(gòu)下,數(shù)據(jù)的存儲(chǔ)和計(jì)算相互分離,即數(shù)據(jù)存儲(chǔ)在儲(chǔ)存器中,需要計(jì)算時(shí)再把它搬運(yùn)到運(yùn)算器里。然而,AI類應(yīng)用(例如大模型)需要對(duì)大量數(shù)據(jù)進(jìn)行矩陣運(yùn)算,其核心是乘法和加法,在此情形下算力是比較吃緊的,面臨著很大挑戰(zhàn)。

如何拉近“存”“算”距離,即打破存儲(chǔ)墻,成為AI計(jì)算的當(dāng)務(wù)之急,清華大學(xué)給的解決方案便是基于憶阻器(RRAM)的存算一體。

具體來說,如果用交叉陣列的方式做憶阻器,就可獲得一種與矩陣很類似的結(jié)構(gòu),這種結(jié)構(gòu)既可以存數(shù)據(jù),也可以做計(jì)算。需要存儲(chǔ)時(shí),憶阻器本身就是存儲(chǔ)器;而需要運(yùn)算時(shí),也無需把數(shù)據(jù)從存儲(chǔ)器中搬到運(yùn)算器里,因?yàn)閼涀杵骺芍苯佑脷W姆定律來做乘法運(yùn)算。

如此,數(shù)據(jù)便能“原地”計(jì)算,大大降低了由于數(shù)據(jù)“跑來跑去”所帶來的消耗。

除此之外,憶阻器(RRAM)還有著其他優(yōu)點(diǎn):比如尺寸小、速度快、與 CMOS(互補(bǔ)式金氧半導(dǎo)體)工藝可兼容等。

于是,又能算又能存的憶阻器(RRAM)成了緩解算力焦慮的良藥,引得包括清華大學(xué)在內(nèi)的多方精英競(jìng)相布局。

PART-02 憶阻器(RRAM),學(xué)界與產(chǎn)界公認(rèn)的存算一體最佳器件

盡管有著諸多好處,憶阻器(RRAM)作為存儲(chǔ)器的發(fā)展卻十分坎坷。

2000年便有企業(yè)著手研發(fā)——夏普購(gòu)買了美國(guó)休斯敦大學(xué)憶阻器(RRAM)的相關(guān)專利進(jìn)行相關(guān)布局,但到了去年才真正在業(yè)內(nèi)迎來應(yīng)用的爆發(fā)。那么,為何憶阻器(RRAM)在去年才迎來爆發(fā)時(shí)刻?

這是因?yàn)椋鶕?jù)以往經(jīng)驗(yàn),找到合適的賽道,往往是存儲(chǔ)器大放光彩的轉(zhuǎn)折點(diǎn)。現(xiàn)如今,憶阻器(RRAM)作為存算一體AI計(jì)算的存儲(chǔ)介質(zhì),在AI大算力場(chǎng)景發(fā)光發(fā)熱。

例如NOR Flash,便是憑借更快的讀取速度、可隨機(jī)訪問等特點(diǎn),在功能機(jī)時(shí)代奪得一席之地;所以,當(dāng)功能機(jī)時(shí)代過去后,NOR Flash一度低迷。而當(dāng)外掛一個(gè)高可靠性、快速讀取的存儲(chǔ)器又成為解決AMOLED面板的藍(lán)色光會(huì)隨時(shí)間消退的問題的最優(yōu)解,NOR Flash,又隨著AMOLED的需求迎來自己的第二春。

而在存算一體芯片的存儲(chǔ)器件選擇中,基于憶阻器(RRAM)設(shè)計(jì)的存算一體芯片具有非易失性、讀寫速度快、穩(wěn)定性強(qiáng)、功耗低、 CMOS工藝兼容、微縮化發(fā)展天花板高等優(yōu)勢(shì),相比于SRAM、Flash,憶阻器(RRAM)更適用于存算一體AI大算力賽道。

不過,據(jù)EETOP表示,憶阻器依然面臨著嚴(yán)峻的挑戰(zhàn),其中一個(gè)關(guān)鍵挑戰(zhàn)就是模擬計(jì)算的誤差累積。

在機(jī)器之心有關(guān)清華大學(xué)可重構(gòu)數(shù)字存算一體架構(gòu)主題的文章中提到,模擬計(jì)算由于工藝偏差、信號(hào)噪聲等因素容易產(chǎn)生計(jì)算誤差,通常最高只能支持INT8數(shù)據(jù)格式,難以支持更高位寬計(jì)算。

這就導(dǎo)致當(dāng)前的模擬存算一體AI芯片通常只能同時(shí)激活很小部分存儲(chǔ)器陣列。這限制了它們單位面積下的計(jì)算能力,使得兼顧能效和精度變得更加困難。

而數(shù)字存算一體并不受信噪比影響,精度可以達(dá)32bit甚至更高,且可支持浮點(diǎn)計(jì)算。同時(shí),數(shù)字存算一體對(duì)于不同制造工藝、電源電壓和溫度的變化呈現(xiàn)很強(qiáng)的魯棒性。

故,相比于模擬存算,數(shù)字存算的方式可以實(shí)現(xiàn)更高的運(yùn)算精度以及更好的可靠性。據(jù)筆者對(duì)國(guó)內(nèi)存算一體項(xiàng)目的了解,現(xiàn)階段僅有億鑄科技基于憶阻器(RRAM)實(shí)現(xiàn)了數(shù)字存算一體POC芯片的回片及成功驗(yàn)證。

現(xiàn)如今,隨著工藝的不斷成熟,學(xué)界關(guān)于憶阻器(RRAM)存算一體的研究正愈發(fā)積極:在2022年度ISSCC會(huì)議上,臺(tái)積電發(fā)表六篇關(guān)于存內(nèi)計(jì)算存儲(chǔ)器IP的論文,大力推進(jìn)基于憶阻器(RRAM)的存內(nèi)計(jì)算方案。

盡管過去業(yè)內(nèi)對(duì)憶阻器(RRAM)有著“不夠成熟、主要面向小算力應(yīng)用場(chǎng)景”等誤解,不過自2023年始,多家存算一體AI芯片初創(chuàng)公司也紛紛公開表示,未來將布局基于憶阻器(RRAM)的存算一體產(chǎn)品。

在2023 AI芯片峰會(huì)上,同樣是以研發(fā)SRAM存算芯片為主的千芯科技董事長(zhǎng)陳巍直言憶阻器(RRAM)存算一體的好處:以RRAM為代表的存算一體方案的存儲(chǔ)架構(gòu)縮短為兩層,幾乎是大模型運(yùn)算的極限,因此更有助于進(jìn)行大模型的運(yùn)算。

現(xiàn)如今,基于馮諾依曼傳統(tǒng)架構(gòu)的摩爾定律走向物理極限,“算力焦慮”無法再通過提升先進(jìn)制程緩解。以憶阻器(RRAM)存算一體等為代表的一系列新技術(shù),才是真正的“對(duì)癥下藥”。

越來越多的AI芯片廠商們,正通過硬件層面的革新,把AI技術(shù),帶進(jìn)數(shù)據(jù)中心、自動(dòng)駕駛等大算力場(chǎng)景之中。憶阻器(RRAM)存算一體,終于迎來自己的“美麗人生”。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

算力焦慮有救了:憶阻器(RRAM)存算一體路線再次被肯定

學(xué)界與產(chǎn)界為何要選擇研發(fā)該路線?該路線的發(fā)展前景如何?

文 | 偲睿洞察 Renee

編輯 | 孫越

近日,清華大學(xué)發(fā)布的一顆憶阻器存算一體芯片,火了。該芯片的火爆源于一個(gè)月前,清華大學(xué)發(fā)的一篇論文:

2023年9月14日,清華大學(xué)吳華強(qiáng)及高濱共同通訊在Science在線發(fā)表題為“Edge learning using a fully integrated neuro-inspired memristor chip”的研究論文,論文顯示,團(tuán)隊(duì)基于存算一體計(jì)算范式,研制出全系統(tǒng)集成、支持高效片上學(xué)習(xí)(機(jī)器學(xué)習(xí)能在硬件端直接完成)的憶阻器存算一體芯片。

“憶阻器存算一體”這一概念瞬間引爆學(xué)界與產(chǎn)業(yè)界,甚至登上了微博高位熱搜。據(jù)筆者獲悉,清華大學(xué)所用的憶阻器件就是RRAM(ReRAM)。

此次清華大學(xué)科研成果的意義,不僅在于研發(fā)出首顆基于憶阻器(RRAM)的片上學(xué)習(xí)存算一體芯片,更在于為產(chǎn)業(yè)界存算一體存儲(chǔ)介質(zhì)的應(yīng)用和發(fā)展給出了更多方向,以及在技術(shù)實(shí)踐上的引導(dǎo)性意見。

本文試圖探究,學(xué)界與產(chǎn)界為何要選擇研發(fā)該路線?該路線的發(fā)展前景如何?

PART-01 憶阻器存算一體是為何物?

無論是從其官方表述,還是論文中“可重構(gòu)的憶阻器存算一體架構(gòu)圖”,我們都能明確知道,清華大學(xué)所說憶阻器便是阻變存儲(chǔ)器RRAM(ReRAM)。

2022年9月,清華大學(xué)集成電路學(xué)院錢鶴、吳華強(qiáng)教授課題組聯(lián)合斯坦福大學(xué)、加州大學(xué)圣地亞哥分校(UCSD)、圣母大學(xué)等在《自然》(Nature)發(fā)表的題為A compute-in-memory chip based on resistive random-access memory研究論文。

該論文報(bào)道了一款基于憶阻器(阻變存儲(chǔ)器)的存算一體芯片NeuRRAM。該芯片具有可重新配置的計(jì)算核心(reconfiguring CIM cores),可以兼容不同的模型結(jié)構(gòu)。

(可重構(gòu)的憶阻器存算一體架構(gòu) 圖源:清華大學(xué))

專家表示,從定義來看,憶阻器(英文:memristor)為電阻受先前通過電荷量控制的電子器件,其特點(diǎn)為通常具有電流電壓蝴蝶形回滯曲線。憶阻器的概念最早由蔡少棠教授提出,最早由阻變存儲(chǔ)器,即RRAM實(shí)驗(yàn)驗(yàn)證,因此經(jīng)常以RRAM作為憶阻器的代表。

當(dāng)然,嚴(yán)格來說,根據(jù)材料和物理機(jī)制,憶阻器件可分為阻變存儲(chǔ)器(Resistive Random-Access Memory, 簡(jiǎn)稱RRAM或ReRAM),相變存儲(chǔ)器(PCRAM),磁隨機(jī)存儲(chǔ)器(MRAM)和鐵電隨機(jī)存儲(chǔ)器(FeRAM)等不同種類。此外還有光電憶阻器、有機(jī)材料憶阻器、流體憶阻器等。也就是說,憶阻器有著諸多選項(xiàng),那么為何要選擇阻變存儲(chǔ)器RRAM?

我們都知道的是,傳統(tǒng)馮·諾依曼結(jié)構(gòu)下,數(shù)據(jù)的存儲(chǔ)和計(jì)算相互分離,即數(shù)據(jù)存儲(chǔ)在儲(chǔ)存器中,需要計(jì)算時(shí)再把它搬運(yùn)到運(yùn)算器里。然而,AI類應(yīng)用(例如大模型)需要對(duì)大量數(shù)據(jù)進(jìn)行矩陣運(yùn)算,其核心是乘法和加法,在此情形下算力是比較吃緊的,面臨著很大挑戰(zhàn)。

如何拉近“存”“算”距離,即打破存儲(chǔ)墻,成為AI計(jì)算的當(dāng)務(wù)之急,清華大學(xué)給的解決方案便是基于憶阻器(RRAM)的存算一體。

具體來說,如果用交叉陣列的方式做憶阻器,就可獲得一種與矩陣很類似的結(jié)構(gòu),這種結(jié)構(gòu)既可以存數(shù)據(jù),也可以做計(jì)算。需要存儲(chǔ)時(shí),憶阻器本身就是存儲(chǔ)器;而需要運(yùn)算時(shí),也無需把數(shù)據(jù)從存儲(chǔ)器中搬到運(yùn)算器里,因?yàn)閼涀杵骺芍苯佑脷W姆定律來做乘法運(yùn)算。

如此,數(shù)據(jù)便能“原地”計(jì)算,大大降低了由于數(shù)據(jù)“跑來跑去”所帶來的消耗。

除此之外,憶阻器(RRAM)還有著其他優(yōu)點(diǎn):比如尺寸小、速度快、與 CMOS(互補(bǔ)式金氧半導(dǎo)體)工藝可兼容等。

于是,又能算又能存的憶阻器(RRAM)成了緩解算力焦慮的良藥,引得包括清華大學(xué)在內(nèi)的多方精英競(jìng)相布局。

PART-02 憶阻器(RRAM),學(xué)界與產(chǎn)界公認(rèn)的存算一體最佳器件

盡管有著諸多好處,憶阻器(RRAM)作為存儲(chǔ)器的發(fā)展卻十分坎坷。

2000年便有企業(yè)著手研發(fā)——夏普購(gòu)買了美國(guó)休斯敦大學(xué)憶阻器(RRAM)的相關(guān)專利進(jìn)行相關(guān)布局,但到了去年才真正在業(yè)內(nèi)迎來應(yīng)用的爆發(fā)。那么,為何憶阻器(RRAM)在去年才迎來爆發(fā)時(shí)刻?

這是因?yàn)?,根?jù)以往經(jīng)驗(yàn),找到合適的賽道,往往是存儲(chǔ)器大放光彩的轉(zhuǎn)折點(diǎn)?,F(xiàn)如今,憶阻器(RRAM)作為存算一體AI計(jì)算的存儲(chǔ)介質(zhì),在AI大算力場(chǎng)景發(fā)光發(fā)熱。

例如NOR Flash,便是憑借更快的讀取速度、可隨機(jī)訪問等特點(diǎn),在功能機(jī)時(shí)代奪得一席之地;所以,當(dāng)功能機(jī)時(shí)代過去后,NOR Flash一度低迷。而當(dāng)外掛一個(gè)高可靠性、快速讀取的存儲(chǔ)器又成為解決AMOLED面板的藍(lán)色光會(huì)隨時(shí)間消退的問題的最優(yōu)解,NOR Flash,又隨著AMOLED的需求迎來自己的第二春。

而在存算一體芯片的存儲(chǔ)器件選擇中,基于憶阻器(RRAM)設(shè)計(jì)的存算一體芯片具有非易失性、讀寫速度快、穩(wěn)定性強(qiáng)、功耗低、 CMOS工藝兼容、微縮化發(fā)展天花板高等優(yōu)勢(shì),相比于SRAM、Flash,憶阻器(RRAM)更適用于存算一體AI大算力賽道。

不過,據(jù)EETOP表示,憶阻器依然面臨著嚴(yán)峻的挑戰(zhàn),其中一個(gè)關(guān)鍵挑戰(zhàn)就是模擬計(jì)算的誤差累積。

在機(jī)器之心有關(guān)清華大學(xué)可重構(gòu)數(shù)字存算一體架構(gòu)主題的文章中提到,模擬計(jì)算由于工藝偏差、信號(hào)噪聲等因素容易產(chǎn)生計(jì)算誤差,通常最高只能支持INT8數(shù)據(jù)格式,難以支持更高位寬計(jì)算。

這就導(dǎo)致當(dāng)前的模擬存算一體AI芯片通常只能同時(shí)激活很小部分存儲(chǔ)器陣列。這限制了它們單位面積下的計(jì)算能力,使得兼顧能效和精度變得更加困難。

而數(shù)字存算一體并不受信噪比影響,精度可以達(dá)32bit甚至更高,且可支持浮點(diǎn)計(jì)算。同時(shí),數(shù)字存算一體對(duì)于不同制造工藝、電源電壓和溫度的變化呈現(xiàn)很強(qiáng)的魯棒性。

故,相比于模擬存算,數(shù)字存算的方式可以實(shí)現(xiàn)更高的運(yùn)算精度以及更好的可靠性。據(jù)筆者對(duì)國(guó)內(nèi)存算一體項(xiàng)目的了解,現(xiàn)階段僅有億鑄科技基于憶阻器(RRAM)實(shí)現(xiàn)了數(shù)字存算一體POC芯片的回片及成功驗(yàn)證。

現(xiàn)如今,隨著工藝的不斷成熟,學(xué)界關(guān)于憶阻器(RRAM)存算一體的研究正愈發(fā)積極:在2022年度ISSCC會(huì)議上,臺(tái)積電發(fā)表六篇關(guān)于存內(nèi)計(jì)算存儲(chǔ)器IP的論文,大力推進(jìn)基于憶阻器(RRAM)的存內(nèi)計(jì)算方案。

盡管過去業(yè)內(nèi)對(duì)憶阻器(RRAM)有著“不夠成熟、主要面向小算力應(yīng)用場(chǎng)景”等誤解,不過自2023年始,多家存算一體AI芯片初創(chuàng)公司也紛紛公開表示,未來將布局基于憶阻器(RRAM)的存算一體產(chǎn)品。

在2023 AI芯片峰會(huì)上,同樣是以研發(fā)SRAM存算芯片為主的千芯科技董事長(zhǎng)陳巍直言憶阻器(RRAM)存算一體的好處:以RRAM為代表的存算一體方案的存儲(chǔ)架構(gòu)縮短為兩層,幾乎是大模型運(yùn)算的極限,因此更有助于進(jìn)行大模型的運(yùn)算。

現(xiàn)如今,基于馮諾依曼傳統(tǒng)架構(gòu)的摩爾定律走向物理極限,“算力焦慮”無法再通過提升先進(jìn)制程緩解。以憶阻器(RRAM)存算一體等為代表的一系列新技術(shù),才是真正的“對(duì)癥下藥”。

越來越多的AI芯片廠商們,正通過硬件層面的革新,把AI技術(shù),帶進(jìn)數(shù)據(jù)中心、自動(dòng)駕駛等大算力場(chǎng)景之中。憶阻器(RRAM)存算一體,終于迎來自己的“美麗人生”。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。