粗粒度可配置計算結(jié)構(gòu)的研究與發(fā)展
出處:fdp8135 發(fā)布于:2007-04-28 11:56:15
摘要:論述了粗粒度可配置計算結(jié)構(gòu)的特點、發(fā)展現(xiàn)狀和未來發(fā)展方向。
關(guān)鍵詞:粗粒度 配置 并行計算
可配置計算又稱為自適應(yīng)計算。它是由多個具有可重配置功能的功能單元(PE)和可以配置不同數(shù)據(jù)傳遞方向的連續(xù)線路一起構(gòu)成的計算機(jī)結(jié)構(gòu),如所示。現(xiàn)在,可重配置計算分為兩類:細(xì)粒度配置和粗粒度配置。細(xì)粒度配置計算主要體現(xiàn)在FPGA(現(xiàn)場可編程邏輯陣列),它在數(shù)字邏輯芯片開發(fā)和系統(tǒng)設(shè)計等方面應(yīng)用非常廣泛,但由于細(xì)粒度的原因,其實際邏輯單元僅占實際芯片面積的10%,其余被開關(guān)、RAM、布線網(wǎng)絡(luò)所占有,功耗和工作頻率都不是非常理想,在處理一些規(guī)則運(yùn)算,如乘法時效率不高。相對的,粗粒度配置計算的粒度一般為4、8、16、32位,非常適合進(jìn)行算法級操作。試想一下,如果要處理10000×20000像素的圖片,用現(xiàn)在的計算機(jī)能夠?qū)崟r完成嗎?但應(yīng)用粗粒度可配置計算結(jié)構(gòu)設(shè)計的計算機(jī)能夠完成。在數(shù)字信號處理領(lǐng)域,算法一般都遵循90/10的規(guī)律。即在一個算法中,90%是重復(fù)單一或類似功能的規(guī)則操作,不規(guī)則的靜態(tài)操作只占10%。如果針對算法中的規(guī)則操作設(shè)計處理單元(PE),并通過多個處理單元(PE)組成網(wǎng)絡(luò)進(jìn)行并行計算,在功耗比較小時,其計算能力或者說處理速度將非???,能夠完成大數(shù)據(jù)量、大運(yùn)算量的算法。同時隨著超大規(guī)模集成電路的發(fā)展,特別是SOC(單芯片系統(tǒng)集成)技術(shù)的興起,在一個芯片中,可以很容易集成幾百萬門的電路,為粗粒度可配置計算的研究和應(yīng)用提供了基礎(chǔ)。
1 粗粒度可配置結(jié)構(gòu)的數(shù)據(jù)處理
在可重配置計算中,一般提供了配置過程和計算過程。根據(jù)計算任務(wù)的不同,首先對處理單元和連接網(wǎng)絡(luò)進(jìn)行相應(yīng)的配置,之后再對數(shù)據(jù)流進(jìn)行計算。是傳統(tǒng)的處理器與粗粒度可重配置結(jié)構(gòu)數(shù)據(jù)處理流程的比較。從中可以看到,馮·諾曼類型的指令流被配置流和數(shù)據(jù)流所代替。粗粒度可配置計算結(jié)構(gòu)將軟件的靈活與硬件的高速結(jié)合在一起,從嶄新的角度設(shè)計數(shù)字信號處理器。與傳統(tǒng)的處理器相比,具有以下特點:
(1)傳統(tǒng)數(shù)據(jù)處理的指令流被配置流所代替,不再是單個指令的乘加或移位運(yùn)算,而是不同功能如濾波、FFT、矩陣相乘等的順序執(zhí)行。
(2)各單元功能可以配置,與傳統(tǒng)的處理器指令不同,設(shè)計全新的配置指令。通過配置為不同功能單元的組合,完成相應(yīng)的功能。由于是用硬件實現(xiàn)各功能,功耗低。
(3)不存在傳統(tǒng)處理器從RAM中讀取指令問題,且結(jié)構(gòu)中有多個RAM區(qū)和I/O可用,可有效解決馮·諾曼瓶頸,加快數(shù)據(jù)處理速度。
(4)多個單元的網(wǎng)絡(luò)結(jié)構(gòu),鏈路可配,具有極強(qiáng)的并行處理能力。將編譯之后的算子網(wǎng)表與實際結(jié)構(gòu)中的處理單元一一對應(yīng)的過程是映射與路徑尋優(yōu)的過程,主要指map(映射)、place(放置)、route(路由)三步。涉及的優(yōu)化算法主要有:模擬退火算法、遺傳算法、談判擁塞算法等。
2 發(fā)現(xiàn)現(xiàn)狀
粗粒度重配置計算早見于20世紀(jì)60年代,是Gerald Estrin教授提出的“固定加可變結(jié)構(gòu)計算機(jī)”,但因為受當(dāng)時芯片制造水平的限制,只是一個概念而已。進(jìn)入90年代,隨著VLSI(超大規(guī)模集成電路)技術(shù)的發(fā)展,以“可編程開關(guān)(programswitch)”為基礎(chǔ)的粗粒度可配置計算結(jié)構(gòu)不斷被開發(fā)出來,并在圖像濾波、特征提取、目標(biāo)識別與跟蹤、通訊算法等方面展示出了非凡的性能與潛力。表1列出的是國外部分粗粒度計算項目,國內(nèi)此項研究尚未見報道。在商業(yè)應(yīng)用中,做得比較好的是PACT極端并行處理公司,其包含64個PE的XPP64A1在主頻200MHz時MAC(乘加)運(yùn)算已經(jīng)達(dá)到了12.8GigaMACs/秒。
從表1可以發(fā)現(xiàn),現(xiàn)有粗粒度可重配置計算都有其相應(yīng)的應(yīng)用領(lǐng)域,沒有形成一個統(tǒng)一固定的模式,系統(tǒng)結(jié)構(gòu)、組織方式、粒度大小及編譯環(huán)境各不相同。開發(fā)高效通用的粗粒度計算結(jié)構(gòu)仍有一定的難度,這也是可配置計算結(jié)構(gòu)的重要研究方向。
表1 粗粒度結(jié)構(gòu)技術(shù)總結(jié)
| 項目名稱 | 結(jié)構(gòu) | 粒度 | 組織 | 映射方法 | 應(yīng)用目標(biāo) |
| PADDI | 交叉條 | 16位 | 中央交叉條 | 選通 | DSP |
| DFFC | 3維陣列 | 8,16位 | 直接與可配連接 | 協(xié)同編譯 | 圖像處理 |
| PADDI-2 | 交叉條 | 16位 | 多交叉條 | 選通 | DSP |
| DP-FPGA | 2維陣列 | 1&4位,多粒度 | 不均一布線通道 | 天關(guān)箱選通 | 規(guī)則路徑 |
| KressArray | 2維陣列 | 可選路徑寬度 | NN&總線分段 | 協(xié)同編譯 | 自適應(yīng) |
| Colt | 2維陣列 | 1&16位,不均一 | 實時配置 | 高動態(tài)可配 | |
| RaPID | 1維陣列 | 16位 | 可分段總線 | 通道選通 | 流水線 |
| ACM | 2維陣列 | 32位,多粒度 | 矩陣連接 | 協(xié)同編譯 | 普通 |
| Lirmm | 環(huán)形 | 16位 | 主次數(shù)據(jù)流 | 協(xié)同編譯 | 運(yùn)動估計等 |
| Matrix | 2維網(wǎng)格 | 8位,多粒度 | 8NN,全局線 | 多級長度 | 普通 |
| RAW | 2維網(wǎng)格 | 8位,多粒度 | 8NN,開關(guān)連接 | 開關(guān)箱選通 | 普通 |
| Pleiades | 網(wǎng)格/交叉條 | 多粒度 | 可分段的交叉條 | 開關(guān)箱選通 | 多媒體 |
| PipeRench | 1維陣列 | 128位 | 調(diào)度 | 流水線 | |
| REMARC | 2維陣列 | 16位 | NN,全長度總線 | 多媒體 | |
| MorphoSys | 2維網(wǎng)格 | 16位 | NN,長度2&3線段 | 手動Place&route | |
| CHESS | 六角形網(wǎng)格 | 4位,多粒度 | 8NN,總線 | JHDL編譯 | 多媒體 |
| DreAM | 2維陣列 | 8&16位 | NN,分段總線 | 協(xié)同編譯 | 下一代無線 |
| CS2000 | 2維陣列 | 16&32位 | 不均一陣列 | 協(xié)同編譯 | 通訊 |
| XPP64A1 | 2維陣列 | 24位 | NN,分段配置總線 | 協(xié)同編譯 | 圖像處理 |
3 未來的發(fā)展
粗粒度可配置計算將軟件的靈活與硬件的高效、低功耗結(jié)合在一起,利用硬件來實現(xiàn)軟件算法。雖然靈活性上要比DSP和計算機(jī)差一些,但計算效率和處理能力上卻有很大的提高。是數(shù)字信號處理領(lǐng)域目前各類器件性能的簡單比較。
此結(jié)構(gòu)芯片非常適合圖像數(shù)據(jù)處理,同時另一應(yīng)用方面——軟件無線電的硬件平臺,也正促進(jìn)其發(fā)展。
現(xiàn)在,軟件無線電的研究在我國正不斷深入。其目標(biāo)之一是將不同制式、不同頻段的信號利用單一器件進(jìn)行接收和發(fā)送,并且越早地將射頻信號變?yōu)閿?shù)字信號進(jìn)行處理越好。這一方面促進(jìn)了智能天線和軟件接口協(xié)議的研究,另一方面也要求有高速低功耗、功能可變的硬件相配合?,F(xiàn)階段國內(nèi)應(yīng)用的硬件主要是DSP和計算機(jī),它們在功耗和速度方面都不及粗粒度可配置計算。粗粒度可配置計算結(jié)構(gòu),通過處理單元的配置、數(shù)據(jù)路徑的配置,使數(shù)據(jù)在流動中完成運(yùn)算。在接近ASIC(專用集成電路)性能的同時,又具有一定的靈活性。應(yīng)用可配置計算系統(tǒng),既可以更早地將模擬信號轉(zhuǎn)變?yōu)閿?shù)字信號進(jìn)行處理,利于系統(tǒng)性能的提高,又可以進(jìn)一步將其包裝為IP(知識產(chǎn)權(quán))核,與目前微電子正在興起的系統(tǒng)集成技術(shù)(SOC)相結(jié)合,形成單一系統(tǒng)芯片,適應(yīng)并促進(jìn)我國無線通訊設(shè)備的改進(jìn),如所示。
這是新的計算機(jī)結(jié)構(gòu),克服了傳統(tǒng)計算機(jī)的馮·諾曼瓶頸,結(jié)構(gòu)中固有的并行處理能力,使其具有非常好的性能。微電子技術(shù)的發(fā)展、芯片集成度的提高,為此結(jié)構(gòu)計算機(jī)的實現(xiàn)提供了可能。因此研究這種計算機(jī)結(jié)構(gòu),對計算機(jī)科學(xué)的發(fā)展是有價值的。
版權(quán)與免責(zé)聲明
凡本網(wǎng)注明“出處:維庫電子市場網(wǎng)”的所有作品,版權(quán)均屬于維庫電子市場網(wǎng),轉(zhuǎn)載請必須注明維庫電子市場網(wǎng),http://m.58mhw.cn,違反者本網(wǎng)將追究相關(guān)法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明自其它出處的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或證實其內(nèi)容的真實性,不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品出處,并自負(fù)版權(quán)等法律責(zé)任。
如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。
- 工業(yè)5G技術(shù)在智能制造中的應(yīng)用與實踐解析2025/12/31 10:57:21
- 工業(yè)以太網(wǎng)交換機(jī)選型與現(xiàn)場應(yīng)用技術(shù)指南2025/12/18 10:48:14
- 無線傳輸電路基礎(chǔ),射頻前端設(shè)計、天線匹配與鏈路預(yù)算計算2025/10/27 13:55:50
- ASK 解調(diào)的核心要點與實現(xiàn)方式2025/9/5 16:46:17
- 雙偶極子天線:結(jié)構(gòu)、特性與應(yīng)用全解析2025/9/3 10:29:21









