粗粒度可配置計算結(jié)構(gòu)的研究與發(fā)展

出處：fdp8135 發(fā)布于：2007-04-28 11:56:15

摘要：論述了粗粒度可配置計算結(jié)構(gòu)的特點、發(fā)展現(xiàn)狀和未來發(fā)展方向。

關(guān)鍵詞：粗粒度配置并行計算

可配置計算又稱為自適應(yīng)計算。它是由多個具有可重配置功能的功能單元（PE）和可以配置不同數(shù)據(jù)傳遞方向的連續(xù)線路一起構(gòu)成的計算機(jī)結(jié)構(gòu)，如所示。現(xiàn)在，可重配置計算分為兩類：細(xì)粒度配置和粗粒度配置。細(xì)粒度配置計算主要體現(xiàn)在FPGA（現(xiàn)場可編程邏輯陣列），它在數(shù)字邏輯芯片開發(fā)和系統(tǒng)設(shè)計等方面應(yīng)用非常廣泛，但由于細(xì)粒度的原因，其實際邏輯單元僅占實際芯片面積的10%，其余被開關(guān)、RAM、布線網(wǎng)絡(luò)所占有，功耗和工作頻率都不是非常理想，在處理一些規(guī)則運(yùn)算，如乘法時效率不高。相對的，粗粒度配置計算的粒度一般為4、8、16、32位，非常適合進(jìn)行算法級操作。試想一下，如果要處理10000×20000像素的圖片，用現(xiàn)在的計算機(jī)能夠?qū)崟r完成嗎？但應(yīng)用粗粒度可配置計算結(jié)構(gòu)設(shè)計的計算機(jī)能夠完成。在數(shù)字信號處理領(lǐng)域，算法一般都遵循90/10的規(guī)律。即在一個算法中，90%是重復(fù)單一或類似功能的規(guī)則操作，不規(guī)則的靜態(tài)操作只占10%。如果針對算法中的規(guī)則操作設(shè)計處理單元（PE），并通過多個處理單元（PE）組成網(wǎng)絡(luò)進(jìn)行并行計算，在功耗比較小時，其計算能力或者說處理速度將非?？?，能夠完成大數(shù)據(jù)量、大運(yùn)算量的算法。同時隨著超大規(guī)模集成電路的發(fā)展，特別是SOC（單芯片系統(tǒng)集成）技術(shù)的興起，在一個芯片中，可以很容易集成幾百萬門的電路，為粗粒度可配置計算的研究和應(yīng)用提供了基礎(chǔ)。
1 粗粒度可配置結(jié)構(gòu)的數(shù)據(jù)處理

在可重配置計算中，一般提供了配置過程和計算過程。根據(jù)計算任務(wù)的不同，首先對處理單元和連接網(wǎng)絡(luò)進(jìn)行相應(yīng)的配置，之后再對數(shù)據(jù)流進(jìn)行計算。是傳統(tǒng)的處理器與粗粒度可重配置結(jié)構(gòu)數(shù)據(jù)處理流程的比較。從中可以看到，馮·諾曼類型的指令流被配置流和數(shù)據(jù)流所代替。粗粒度可配置計算結(jié)構(gòu)將軟件的靈活與硬件的高速結(jié)合在一起，從嶄新的角度設(shè)計數(shù)字信號處理器。與傳統(tǒng)的處理器相比，具有以下特點：

（1）傳統(tǒng)數(shù)據(jù)處理的指令流被配置流所代替，不再是單個指令的乘加或移位運(yùn)算，而是不同功能如濾波、FFT、矩陣相乘等的順序執(zhí)行。

（2）各單元功能可以配置，與傳統(tǒng)的處理器指令不同，設(shè)計全新的配置指令。通過配置為不同功能單元的組合，完成相應(yīng)的功能。由于是用硬件實現(xiàn)各功能，功耗低。

（3）不存在傳統(tǒng)處理器從RAM中讀取指令問題，且結(jié)構(gòu)中有多個RAM區(qū)和I/O可用，可有效解決馮·諾曼瓶頸，加快數(shù)據(jù)處理速度。

（4）多個單元的網(wǎng)絡(luò)結(jié)構(gòu)，鏈路可配，具有極強(qiáng)的并行處理能力。將編譯之后的算子網(wǎng)表與實際結(jié)構(gòu)中的處理單元一一對應(yīng)的過程是映射與路徑尋優(yōu)的過程，主要指map(映射)、place(放置)、route(路由)三步。涉及的優(yōu)化算法主要有：模擬退火算法、遺傳算法、談判擁塞算法等。
2 發(fā)現(xiàn)現(xiàn)狀

粗粒度重配置計算早見于20世紀(jì)60年代，是Gerald Estrin教授提出的“固定加可變結(jié)構(gòu)計算機(jī)”，但因為受當(dāng)時芯片制造水平的限制，只是一個概念而已。進(jìn)入90年代，隨著VLSI（超大規(guī)模集成電路）技術(shù)的發(fā)展，以“可編程開關(guān)（programswitch）”為基礎(chǔ)的粗粒度可配置計算結(jié)構(gòu)不斷被開發(fā)出來，并在圖像濾波、特征提取、目標(biāo)識別與跟蹤、通訊算法等方面展示出了非凡的性能與潛力。表1列出的是國外部分粗粒度計算項目，國內(nèi)此項研究尚未見報道。在商業(yè)應(yīng)用中，做得比較好的是PACT極端并行處理公司，其包含64個PE的XPP64A1在主頻200MHz時MAC（乘加）運(yùn)算已經(jīng)達(dá)到了12.8GigaMACs/秒。
從表1可以發(fā)現(xiàn)，現(xiàn)有粗粒度可重配置計算都有其相應(yīng)的應(yīng)用領(lǐng)域，沒有形成一個統(tǒng)一固定的模式，系統(tǒng)結(jié)構(gòu)、組織方式、粒度大小及編譯環(huán)境各不相同。開發(fā)高效通用的粗粒度計算結(jié)構(gòu)仍有一定的難度，這也是可配置計算結(jié)構(gòu)的重要研究方向。

表1 粗粒度結(jié)構(gòu)技術(shù)總結(jié)

項目名稱	結(jié)構(gòu)	粒度	組織	映射方法	應(yīng)用目標(biāo)
PADDI	交叉條	16位	中央交叉條	選通	DSP
DFFC	3維陣列	8，16位	直接與可配連接	協(xié)同編譯	圖像處理
PADDI-2	交叉條	16位	多交叉條	選通	DSP
DP-FPGA	2維陣列	1&4位，多粒度	不均一布線通道	天關(guān)箱選通	規(guī)則路徑
KressArray	2維陣列	可選路徑寬度	NN&總線分段	協(xié)同編譯	自適應(yīng)
Colt	2維陣列	1&16位，不均一		實時配置	高動態(tài)可配
RaPID	1維陣列	16位	可分段總線	通道選通	流水線
ACM	2維陣列	32位，多粒度	矩陣連接	協(xié)同編譯	普通
Lirmm	環(huán)形	16位	主次數(shù)據(jù)流	協(xié)同編譯	運(yùn)動估計等
Matrix	2維網(wǎng)格	8位，多粒度	8NN，全局線	多級長度	普通
RAW	2維網(wǎng)格	8位，多粒度	8NN，開關(guān)連接	開關(guān)箱選通	普通
Pleiades	網(wǎng)格/交叉條	多粒度	可分段的交叉條	開關(guān)箱選通	多媒體
PipeRench	1維陣列	128位		調(diào)度	流水線
REMARC	2維陣列	16位	NN，全長度總線		多媒體
MorphoSys	2維網(wǎng)格	16位	NN，長度2&3線段	手動Place&route
CHESS	六角形網(wǎng)格	4位，多粒度	8NN，總線	JHDL編譯	多媒體
DreAM	2維陣列	8&16位	NN，分段總線	協(xié)同編譯	下一代無線
CS2000	2維陣列	16&32位	不均一陣列	協(xié)同編譯	通訊
XPP64A1	2維陣列	24位	NN，分段配置總線	協(xié)同編譯	圖像處理

3 未來的發(fā)展

粗粒度可配置計算將軟件的靈活與硬件的高效、低功耗結(jié)合在一起，利用硬件來實現(xiàn)軟件算法。雖然靈活性上要比DSP和計算機(jī)差一些，但計算效率和處理能力上卻有很大的提高。是數(shù)字信號處理領(lǐng)域目前各類器件性能的簡單比較。

此結(jié)構(gòu)芯片非常適合圖像數(shù)據(jù)處理，同時另一應(yīng)用方面——軟件無線電的硬件平臺，也正促進(jìn)其發(fā)展。

現(xiàn)在，軟件無線電的研究在我國正不斷深入。其目標(biāo)之一是將不同制式、不同頻段的信號利用單一器件進(jìn)行接收和發(fā)送，并且越早地將射頻信號變?yōu)閿?shù)字信號進(jìn)行處理越好。這一方面促進(jìn)了智能天線和軟件接口協(xié)議的研究，另一方面也要求有高速低功耗、功能可變的硬件相配合?，F(xiàn)階段國內(nèi)應(yīng)用的硬件主要是DSP和計算機(jī)，它們在功耗和速度方面都不及粗粒度可配置計算。粗粒度可配置計算結(jié)構(gòu)，通過處理單元的配置、數(shù)據(jù)路徑的配置，使數(shù)據(jù)在流動中完成運(yùn)算。在接近ASIC（專用集成電路）性能的同時，又具有一定的靈活性。應(yīng)用可配置計算系統(tǒng)，既可以更早地將模擬信號轉(zhuǎn)變?yōu)閿?shù)字信號進(jìn)行處理，利于系統(tǒng)性能的提高，又可以進(jìn)一步將其包裝為IP（知識產(chǎn)權(quán)）核，與目前微電子正在興起的系統(tǒng)集成技術(shù)（SOC）相結(jié)合，形成單一系統(tǒng)芯片，適應(yīng)并促進(jìn)我國無線通訊設(shè)備的改進(jìn)，如所示。
這是新的計算機(jī)結(jié)構(gòu)，克服了傳統(tǒng)計算機(jī)的馮·諾曼瓶頸，結(jié)構(gòu)中固有的并行處理能力，使其具有非常好的性能。微電子技術(shù)的發(fā)展、芯片集成度的提高，為此結(jié)構(gòu)計算機(jī)的實現(xiàn)提供了可能。因此研究這種計算機(jī)結(jié)構(gòu)，對計算機(jī)科學(xué)的發(fā)展是有價值的。

關(guān)鍵詞：粗粒度可配置計算結(jié)構(gòu)的研究與發(fā)展

上一篇：超寬帶(UWB)極窄脈沖的產(chǎn)生與實現(xiàn)

下一篇：網(wǎng)格資源調(diào)用中支持技術(shù)的研究與實現(xiàn)

版權(quán)與免責(zé)聲明

凡本網(wǎng)注明“出處：維庫電子市場網(wǎng)”的所有作品，版權(quán)均屬于維庫電子市場網(wǎng)，轉(zhuǎn)載請必須注明維庫電子市場網(wǎng)，http://m.58mhw.cn，違反者本網(wǎng)將追究相關(guān)法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明自其它出處的作品，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點或證實其內(nèi)容的真實性，不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時，必須保留本網(wǎng)注明的作品出處，并自負(fù)版權(quán)等法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題，請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系，否則視為放棄相關(guān)權(quán)利。

相關(guān)技術(shù)資料

工業(yè)5G技術(shù)在智能制造中的應(yīng)用與實踐解析2025/12/31 10:57:21
工業(yè)以太網(wǎng)交換機(jī)選型與現(xiàn)場應(yīng)用技術(shù)指南2025/12/18 10:48:14
無線傳輸電路基礎(chǔ)，射頻前端設(shè)計、天線匹配與鏈路預(yù)算計算2025/10/27 13:55:50
ASK 解調(diào)的核心要點與實現(xiàn)方式2025/9/5 16:46:17
雙偶極子天線：結(jié)構(gòu)、特性與應(yīng)用全解析2025/9/3 10:29:21

技術(shù)分類

熱門技術(shù)資料

最新技術(shù)資料

維庫電子市場網(wǎng)-十六年專注打造電子元器件采購網(wǎng)

粗粒度可配置計算結(jié)構(gòu)的研究與發(fā)展

版權(quán)與免責(zé)聲明

建議反饋