尋找傳統(tǒng)工業(yè)之外的機遇——機器視覺
出處:電子工程專輯 發(fā)布于:2014-08-25 09:46:50
上世紀70年代中,MIT人工智能實驗室正式開設(shè)“機器視覺”課程,近半個世紀來機器視覺持續(xù)是一個非?;钴S的研究領(lǐng)域,性的研究熱潮,使得機器視覺獲得了蓬勃發(fā)展,機器視覺在工業(yè)制造領(lǐng)域已獲得了廣泛的應(yīng)用,比如在不適合人類工作的環(huán)境中,利用機器視覺代替?zhèn)鹘y(tǒng)人工測量/試;或用于需要高性能、精密機器視覺組件的設(shè)備制造領(lǐng)域。但總體來講,機器視覺不僅依然一個相當新且仍有很多工作要做的研究領(lǐng)域,更是一個深藏無限潛力的金礦。
在此次采訪中,大部分的廠商的關(guān)注焦點都更貼近大眾生活相關(guān),放在了消費電子、可穿戴產(chǎn)品、汽車ADAS以及智能化監(jiān)控等領(lǐng)域。比如CEVA公司投資者關(guān)系與企業(yè)傳播副總裁Richard Kingston就透露“我們已經(jīng)將計算機視覺DSP授權(quán)許可予八家企業(yè),其中包括三家移動領(lǐng)域的OEM廠商。”加拿大CogniVue公司業(yè)務(wù)開發(fā)副總裁Tom Wilson認為“可穿戴和汽車領(lǐng)域?qū)⒋嬖诜浅娏业脑鲩L機遇?!?/FONT>
視覺處理向3D跨越
隨著谷歌正式發(fā)布了Project Tango后,3D機器視覺變得愈加熱門。“我們認為消費領(lǐng)域3D處理的主要應(yīng)用會是3D成像、自然用戶界面(NUI)和3D視覺應(yīng)用,比如PC、筆記本電腦、平板電腦、智能手機和其它消費類設(shè)備。”Kingston表示。
業(yè)界追尋3D視覺的原因還是為了解決2D機器視覺的固有局限,若能更好的實現(xiàn)在分割(分離近景和遠景)、照明(用于人臉識別時)、相對位置(場景中的物體)等方面的功能,許多應(yīng)用可以通過采用3D空間信息簡化并提高視覺系統(tǒng)的和可靠性。
但無論是3D傳感器(例如飛行時間法(ToF)相機)、或以2個2D圖像傳感器實現(xiàn)的立體傳感器,他們對處理能力的要求都更高?!傲Ⅲw匹配(使用來自兩個圖像傳感器輸入)要求差異映射來生成3D景深圖。這是一個非常困難的計算機視覺問題,學(xué)術(shù)界也積極研究來優(yōu)化立體識別算法。”CogniVue公司業(yè)務(wù)開發(fā)副總裁Tom Wilson指出。每一種實現(xiàn)3D傳感的方法都存在性能上的折衷,CogniVue目前在開發(fā)一種算法,能針對低成本3D傳感器有效計算其視差圖。
處理大量實時數(shù)據(jù)需要密集的計算能力。若是想實現(xiàn)穩(wěn)定的3D傳感地圖是非常困難的,特別是對那些低功耗的設(shè)備來說?!癈ogniVue的APEX圖像識別處理(ICP)技術(shù)能在電量有限的3D視覺應(yīng)用中發(fā)揮關(guān)鍵作用?!彼a充道。
對于系統(tǒng)設(shè)計者來說,設(shè)計能有效運行不同視覺算法的硬件是非常巨大的挑戰(zhàn)。系統(tǒng)廠商選擇圖像/視頻處理解決方案時,可以選擇全部集中在CPU完成,也可以選擇卸載一部分圖像處理工作給GPU,或者專為圖像處理增加硬件邏輯。在需要3D處理的應(yīng)用中,GPU已經(jīng)將系統(tǒng)的一部分,運行多種計算機視覺算法來協(xié)助通用CPU.
“i.MX6擁有強大的GPU運算能力,其3D引擎GC2000內(nèi)部包含4個shader,可提供高達30GFLOPS的運算能力,支持OpenCL 1.1 EP.”飛思卡爾微控制器事業(yè)部亞太區(qū)市場營銷和業(yè)務(wù)拓展經(jīng)理李星宇介紹道,“此外,i.MX6Q還擁有一個專用的2D引擎(1Gpixel/s)和一個矢量圖形處理引擎?!?/FONT>
此外,在一個軟硬件無縫集成的圖形開發(fā)環(huán)境中設(shè)計其3D視覺應(yīng)用無疑會簡化工程師的工作?!癗I LabVIEW為3D視覺應(yīng)用提供了全新雙目立體視覺功能,用戶可利用豐富的雙目立體視覺功能來提取并利用LabVIEW應(yīng)用的3D信息?!盢I中國技術(shù)市場工程師崔鵬介紹道。
在圖像采集領(lǐng)域,除了飛行時間法(TOF)3D成像(給目標連續(xù)發(fā)送光脈沖,然后用傳感器接收從物體返回的光,通過探測光脈沖的往返飛行時間來得到目標物距離),還有一種是在工業(yè)制造檢測方面獲得比較廣泛應(yīng)用的3D激光傳感器,區(qū)別就是3D激光傳感器是逐點掃描,而TOF相機則是同時得到整幅圖像的深度信息。
大恒圖像的3D成像采用的是激光成像法,其產(chǎn)品不僅包括專門的3D結(jié)構(gòu)光激光器、還有將激光器集成的一體式3D智能傳感器Gocator,該產(chǎn)品還繼承標定算法,出廠前標定完畢,開箱即可用于測量。
無論是何種嵌入式視覺處理應(yīng)用,都是典型的計算密集型需求,這使得它比之前的處理器多了很多挑戰(zhàn)。
“在過去的幾十年里,處理器結(jié)構(gòu)發(fā)展了不同階段來滿足不斷變化的應(yīng)用需求。1980年代的是用于臺式電腦和和服務(wù)器的CPU;1990年代DSP出現(xiàn)以加速音頻編解碼和無線/有線語音/數(shù)據(jù)編解碼的要求;2000年GPU達到新層面的性能和并行性從而實現(xiàn)2D和3D圖像;現(xiàn)在,嵌入式視覺處理需要的是完全不同的處理器架構(gòu):ICP.”
上述這段話是分享在CogniVue公司的英文網(wǎng)站上,該公司業(yè)務(wù)開發(fā)副總裁Tom Wilson在采訪中指出,“新一代的應(yīng)用需要100倍以上的嵌入式視覺性能/功耗,為滿足這些應(yīng)用的性能和功率需求,與傳統(tǒng)處理架構(gòu)相比,我們需要在同樣功耗下實現(xiàn)100倍-400倍的性能躍進,CogniVue通過其APEX ICP技術(shù)實現(xiàn)了這樣的性能提升?!?/FONT>
連同APEX ICP核,還有APEX編程工具以及一個APEX-CV嵌入式視覺功能庫,涵蓋多種視覺應(yīng)用。例如特征檢測和匹配適用于可穿戴(增強現(xiàn)實)和汽車(光流和運動跟蹤)等?!俺诉@些常見的計算機視覺功能。我們還提供更別的產(chǎn)品來特定于具體應(yīng)用,例如用于人臉識別的FaceVue,用于監(jiān)控應(yīng)用中運動監(jiān)測的MotionVue、用于汽車車道偏離警告的FrontVue、和用于汽車盲點監(jiān)測的SideVue等。”他補充道。
針對密集型計算需求,CEVA公司的包括CEVA-MM3101在內(nèi)的CEVA-MM3000系列則使用了非常高效的、功能強大的矢量引擎,從而實現(xiàn)計算機視覺所需的大量并行計算。此外,集成的功率調(diào)節(jié)單元(PSU)可以在處理器內(nèi)實現(xiàn)動態(tài)電壓調(diào)節(jié),助力實現(xiàn)“始終在線”應(yīng)用類型。
除了CogniVue和CEVA,大批的致力于機器視覺的IP廠商還包括有Mobileye、Tensilica,以及Imagination Technology等,后者基于“Raptor”的可合成ISP IP內(nèi)核于2014年季上市,使得IP陣營的競爭愈發(fā)激烈。
半導(dǎo)體廠商不少也是通過和IP廠商合作/授權(quán),來推出其專用視覺處理器,包括Freescale、TI、以及意法半導(dǎo)體等。意法半導(dǎo)體使用與Mobileye共同開發(fā)的EyeQ3圖像處理器,實現(xiàn)行人檢測技術(shù);飛思卡爾基于CogiVue推出圖像識別處理器家族SCP2200;以色列Inuitive公司使用雙CEVA-MM3101引擎的3D視覺處理器,實現(xiàn)3D景深圖;Xilinx利用MVTec公司的HALCON和Silicon Software公司的VisualApplets開發(fā)平臺為Zynq-7000 All Programmable SoC打造端對端Smarter Vision開發(fā)環(huán)境。
機器視覺的接口之爭
機器視覺對速度的追求催生了新一代傳感器,它們能在極高的速度下拍攝大分辨率影像,但這種數(shù)據(jù)量遠遠超出了傳統(tǒng)接口的容納限度。目前較為流行的接口是GigE和USB3.0,這兩種接口各有優(yōu)勢與不足。
加拿大Point Grey(灰點)公司是USB3.0 Vision技術(shù)委員會的聯(lián)合創(chuàng)始者,在2011年推出了世界上款量產(chǎn)的USB3.0相機,該公司中國區(qū)銷售代表馮宇認為,“除了更低的成本外,USB3.0行業(yè)標準互操作性強(USB3.0 Vision),帶有幀緩存器支持的可靠的成像機制,在不犧牲系統(tǒng)性能下,帶來更低的整體系統(tǒng)成本?!?/FONT>
馮宇曾在演講中展示了USB3.0與其他多種接口的成本對比,圖1為GigE PoE與USB3.0的對比。

圖1:GigE PoE與USB3.0的對比。
USB3.0 帶寬遠高于GigE POE,且能實現(xiàn)更低的CPU使用率。幾乎所有的主流計算機系統(tǒng)制造商都提供主板上具有USB3.0接口的系統(tǒng)?!癠SB3.0一定會是市場主流,因為這個接口比較通用。”長芯盛(武漢)科技有限公司營銷總監(jiān)張昕也支持這種觀點。去年底成立的長芯盛已經(jīng)量產(chǎn)了其USB 3.0有源光纜,并與業(yè)界主流USB3.0芯片公司的產(chǎn)品通過了一致性測試,該公司是由武漢長飛光纖光纜與臺灣威盛電子合資組建的。
不過,“真正的工業(yè)應(yīng)用肯定是要用以太網(wǎng)的,” 嘉恒圖像銷售部副經(jīng)理張小偉認為,“因為工業(yè)應(yīng)用的距離都比較長,而且以太網(wǎng)的抗干擾性非常好。”
對于傳輸距離來說,UBS3.0的通電纜長度現(xiàn)在推薦為5米,而實際應(yīng)用中一般只用到3米?!斑@的確是個問題,但現(xiàn)在很多公司包括長芯盛會提供中繼器(Hub),可以將其轉(zhuǎn)接到以太網(wǎng)上?!睆堦勘硎荆摴镜腍ub如移動硬盤大小。
除此之外,機器視覺領(lǐng)域還有一個接口CoaXPress似乎是以競爭者的身份出現(xiàn)的。該接口于2009年推出,容許設(shè)備(如照相機)通過單根同軸電纜以高達6.25Gbps的速度傳輸數(shù)據(jù),若使用四根線纜,速率可達25Gbps/相機。
對于其他接口來說,線纜長度是個限制,全速狀態(tài)下,長可達35米,而半速狀態(tài)下,長可達100米。

圖2:不同接口的帶寬與線纜長度。
對于CoaXpress連接方法簡單,“這種推拉自鎖系統(tǒng),保證了在工業(yè)應(yīng)用中的可靠性。”比利時Euresys公司CEO Marc Damhaut在演講中展示了自鎖方式(圖),該公司采用此接口的包括Coaxlink系列全面支持Coaxpress接口。但是,CoaXPress高昂的成本仍是其普及路上的一塊絆腳石。

圖3:工業(yè)機器視覺產(chǎn)業(yè)鏈
版權(quán)與免責聲明
凡本網(wǎng)注明“出處:維庫電子市場網(wǎng)”的所有作品,版權(quán)均屬于維庫電子市場網(wǎng),轉(zhuǎn)載請必須注明維庫電子市場網(wǎng),http://m.58mhw.cn,違反者本網(wǎng)將追究相關(guān)法律責任。
本網(wǎng)轉(zhuǎn)載并注明自其它出處的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或證實其內(nèi)容的真實性,不承擔此類作品侵權(quán)行為的直接責任及連帶責任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品出處,并自負版權(quán)等法律責任。
如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。
- 掌握 DSP:原理剖析與應(yīng)用實踐2025/5/8 14:03:24
- 模糊邏輯在 DSP 上實時執(zhí)行2023/7/25 17:13:30
- 多速率DSP及其在數(shù)模轉(zhuǎn)換中的應(yīng)用2023/6/12 15:28:52
- 使用 DSP 加速 CORDIC 算法2023/3/29 15:46:30
- 高速DSP系統(tǒng)的信號完整性2022/9/26 16:45:38









