行業(yè)資訊
多核技術(shù)將是未來處理器發(fā)展的主要趨勢
從上世紀(jì)70年代微處理器誕生以來,性能、功能和功耗表現(xiàn)一直按照摩爾定律在提高。但是從大型機(jī)時(shí)代一直到現(xiàn)在的移動(dòng)互聯(lián)網(wǎng)時(shí)代,不同的應(yīng)用對各類處理器提出了非常不同的需求,由此產(chǎn)生了種類繁多的微處理器。由于技術(shù)的進(jìn)步和具體應(yīng)用的需求變化,處理器的發(fā)展有點(diǎn)紛繁復(fù)雜的味道。
以多核提升性能功耗比
Tensilica亞太區(qū)銷售總監(jiān)Sam Wang聲稱,多核技術(shù)將是未來處理器發(fā)展的主要趨勢,包括同構(gòu)和異構(gòu)多核技術(shù),而不是一味追求更高的處理器主頻。
多核處理器把多個(gè)處理器核集成到同一個(gè)芯片之上。得益于片上更高的通信帶寬和更短的通信時(shí)延,多核處理器在并行性方面具有天然的優(yōu)勢。通過動(dòng)態(tài)調(diào)節(jié)電壓/頻率、負(fù)載優(yōu)化分布等,可有效降低功耗。研究表明利用大量簡單的處理器核提高并行性可以取得更好的性能功耗比。
Sam Wang認(rèn)為這種趨勢是多種因素綜合決定的。首先隨著半導(dǎo)體制造工藝進(jìn)入深亞微米時(shí)代,增加芯片中門電路的邊際成本變得越來越小,因此我們可以在單個(gè)芯片中集成更多的功能。考慮到漏電功耗對整個(gè)芯片功耗的影響,靠提升主頻來提高單核性能不如將任務(wù)分配到運(yùn)行在較低主頻的多顆處理器上運(yùn)行,這樣設(shè)計(jì)團(tuán)隊(duì)可以更好的控制整個(gè)芯片的功耗。而后PC時(shí)代到來,越來越多的芯片將用于電池供電的設(shè)備,3C設(shè)備將在單個(gè)手持或口袋設(shè)備中融合在一起,使得低功耗成為芯片設(shè)計(jì)的重要需求,而不再是摩爾定律帶來的“免費(fèi)贈(zèng)品”。
正是這些方面的巨大優(yōu)勢,所有的處理器廠商都推出了多核處理器產(chǎn)品,從最高端的服務(wù)器處理器到對功耗非常敏感的嵌入式處理器,都走上了多核處理器的道路。在移動(dòng)處理器市場占據(jù)絕對份額的ARM發(fā)布的Cortex A9是它首個(gè)多核心處理內(nèi)核,由此所有的主流處理器架構(gòu)都走上了多核化的道路。
即使在DSP領(lǐng)域,這一趨勢也有體現(xiàn)。德州儀器半導(dǎo)體事業(yè)部業(yè)務(wù)拓展經(jīng)理丁剛就表示,在某些苛求高性能的應(yīng)用中,DSP多核方案會(huì)越來越多。
回顧整個(gè)計(jì)算機(jī)架構(gòu)發(fā)展史,從大型機(jī)到x86架構(gòu)的PC,發(fā)展趨勢從來都是以分布式的多核運(yùn)算替代高主頻的單核架構(gòu),因此相信嵌入式微處理器設(shè)計(jì)也將按照這樣的趨勢發(fā)展下去。
多線程也是一個(gè)方向
在嵌入式處理器領(lǐng)域,MIPS的MIPS34K內(nèi)核是目前業(yè)界唯一可公開授權(quán)得到的多線程CPU內(nèi)核。MIPS中國區(qū)市場總監(jiān)費(fèi)浙平認(rèn)為多核處理器和多線程技術(shù)是未來嵌入式處理器的一個(gè)方向,因?yàn)槎嗑€程處理器在一個(gè)CPU核上對軟件模擬出兩個(gè)邏輯處理器,以極小的硬件代價(jià)獲得相當(dāng)比例的總體性能和吞吐量提高。這可以算是MIPS的一個(gè)構(gòu)架方面的優(yōu)勢,因?yàn)樗闹饕獙κ諥RM還沒有支持同時(shí)多線程技術(shù)的內(nèi)核產(chǎn)品。
原來的ARM處理器內(nèi)核確實(shí)沒有支持同時(shí)多線程技術(shù),但ARM市場部經(jīng)理Kumaran Siva在Linley技術(shù)處理器大會(huì)上表示,ARM會(huì)根據(jù)不同領(lǐng)域的應(yīng)用需求來支持多線程技術(shù),首先可能會(huì)用于網(wǎng)絡(luò)和通信領(lǐng)域。網(wǎng)絡(luò)和通信市場是對處理器要求最高的領(lǐng)域之一,多核多線程屬于基本的要求。在思科、華為等通訊設(shè)備商的網(wǎng)絡(luò)設(shè)備里,大量存在幾十核的微處理器。當(dāng)然在高性能領(lǐng)域,ARM還是一個(gè)追趕者,它的優(yōu)勢還是在低功耗方面。
多核和多線程技術(shù)的聯(lián)合使用是目前處理器理論和實(shí)踐中能實(shí)現(xiàn)的最強(qiáng)并行處理技術(shù),多核和多線程技術(shù)的軟件基礎(chǔ)是多線程編程,如何分配和管理任務(wù)的線程,以及由此帶來的性能開銷都是整個(gè)計(jì)算機(jī)科學(xué)最核心的研究課題。
超標(biāo)量超流水線技術(shù)闖進(jìn)嵌入式領(lǐng)域
超標(biāo)量和超流水線技術(shù)現(xiàn)在廣泛用于高性能通用處理器上。在嵌入式市場,功耗從來是重中之重,這些技術(shù)應(yīng)用的相對較少。但是隨著半導(dǎo)體生產(chǎn)工藝的提高和對高性能的個(gè)人/家庭娛樂/信息終端的巨大需求,嵌入式處理器的主頻和性能都在大幅增長,其中最大的代表就是ARM的Cortex A系列,原來的ARM11處理器一般主頻只能達(dá)到500MHz左右,而現(xiàn)在高端手機(jī)使用的Cortex A8已經(jīng)達(dá)到了1GHz主頻,A9更上層樓,最高可達(dá)1.5GHz,最新發(fā)布的A15內(nèi)核可以達(dá)到2.5GHz。提高主頻的方式主要靠兩個(gè)方式:制造工藝的改進(jìn)和拉長的流水線。這種主頻倍增的情況顯然是兩種方式共同作用的結(jié)果,肯定也加入了大量的分支預(yù)測電路做到亂序執(zhí)行,否則新的內(nèi)核也不可能達(dá)到原來內(nèi)核的3~5倍性能。而MIPS的費(fèi)浙平也自豪地宣稱,僅使用普通設(shè)計(jì)流程和物理IP,MIPS74K 主頻在TSMC 40nm 工藝下能達(dá)到2.4GHz以上的主頻。MIPS74K正是雙發(fā)射不對稱亂序執(zhí)行超標(biāo)量處理器,擁有業(yè)界最高單核全速性能。
顯然,在服務(wù)器和桌面市場曾經(jīng)發(fā)生過的主頻和性能大戰(zhàn)在嵌入式領(lǐng)域又要上演了,手機(jī)和平板電腦市場是其主戰(zhàn)場,高主頻多核心的處理器是所有消費(fèi)類電子產(chǎn)品的主要賣點(diǎn)。當(dāng)然由于嵌入式產(chǎn)品的特性,功耗永遠(yuǎn)不會(huì)被各大廠商忘記。英特爾甚至為了降低產(chǎn)品功耗進(jìn)入嵌入式市場,把Atom處理器的分支預(yù)測電路都閹割了,真可謂是殊途同歸,目的當(dāng)然是為了達(dá)到特定應(yīng)用的要求。
DSP和MCU的指令擴(kuò)展
指令集構(gòu)架屬于計(jì)算機(jī)體系結(jié)構(gòu)的核心,它的發(fā)展歷程也就是整個(gè)處理器的發(fā)展史。歷史上的計(jì)算機(jī)分為CISC和RISC兩種指令集構(gòu)架。這兩種指令體系在80和90年代曾經(jīng)有大量的爭論,現(xiàn)在RISC處理器占據(jù)了絕對主流的地位,就是以CISC面目出現(xiàn)的x86處理器也早開始使用RISC內(nèi)核。
指令體系的進(jìn)步可能是計(jì)算機(jī)體系結(jié)構(gòu)最核心的改進(jìn),也是難度最大的部分,近年來也難以有實(shí)質(zhì)的突破。但在RISC微處理器發(fā)展過程中,產(chǎn)生了超長指令字(VLIW)微處理器,它使用非常長的指令組合,把許多條指令連在一起,就可以并行執(zhí)行。VLIW技術(shù)在DSP領(lǐng)域得到了實(shí)際廣泛的應(yīng)用,TI、ADI和CEVA的DSP內(nèi)核都采用了這種指令構(gòu)架。
德州儀器的丁剛和ADI的張鐵虎都認(rèn)為:SIMD (多通道結(jié)構(gòu)和單指令多重?cái)?shù)據(jù))和VLIW (超長指令字)將會(huì)在新一代高性能DSP處理器中占據(jù)主導(dǎo)地位。
Tencilica的Sam Wang指出,傳統(tǒng)的固定架構(gòu)處理器靠提升主頻來提高性能,而Tensilica的可配置處理器通過添加專用指令提高數(shù)據(jù)處理的效率,從而在較低主頻下達(dá)到相同或更高的性能。
飛思卡爾微控制器事業(yè)部高級系統(tǒng)工程師 Charlie Wu則認(rèn)為,32位MCU也會(huì)增加DSP所具有的乘累加指令,但是只是整數(shù)指令。這樣MCU也具有一些DSP的功能,可以進(jìn)行一些對實(shí)時(shí)性要求不高的濾波器計(jì)算。
愛特梅爾公司亞太區(qū)戰(zhàn)略營銷總監(jiān)曹介龍則強(qiáng)調(diào),隨著新一代具DSP功能的MCU的面世,入門級DSP和普通MCU的差別變得越來越小,界限也變得越來越模糊。愛特梅爾具有整數(shù)、定點(diǎn)DSP算法、單周期乘法和累加指令的32位AVR MCU就是一個(gè)很好的示例。
異構(gòu)微處理器日趨流行
多核處理器可以分成對稱多處理SMP和非對稱多處理AMP,而非AMP又可分為異構(gòu)和同構(gòu)。異構(gòu)多處理使用不同類型的處理核心運(yùn)行不同的應(yīng)用,最典型的搭配方式有MCU+DSP、DSP+FPGA、MCU+FPGA等。異構(gòu)多處理的好處是可以同時(shí)發(fā)揮不同類型處理器各自的長處來滿足不同種類應(yīng)用的性能和功耗需求。應(yīng)用在索尼PS3游戲機(jī)上的CELL處理器就是這樣一種典型的異構(gòu)多處理結(jié)構(gòu),這種處理器內(nèi)含一個(gè)PowerPC處理器核心和8個(gè)SPE單元,當(dāng)時(shí)給整個(gè)業(yè)界帶來空前的性能和不凡的功耗表現(xiàn)。而且為了讓異構(gòu)處理有統(tǒng)一的標(biāo)準(zhǔn),Kronos組織發(fā)布了OPENCL標(biāo)準(zhǔn),可以協(xié)調(diào)不同的處理單元共同計(jì)算。
前面提到的處理器里面增加DSP指令擴(kuò)展,也可以看作是一種異構(gòu)多處理,等于把MCU和DSP融合在了一起。而NXP即將推出集成Cortex M0和M4的所謂非對稱多處理器,也是這一趨勢的最佳注腳。
ADI技術(shù)市場經(jīng)理張鐵虎認(rèn)為:“微控制器是低成本的,主要執(zhí)行智能定向控制任務(wù)的通用處理器能很好執(zhí)行智能控制任務(wù),但是它的缺點(diǎn)就是數(shù)字信號處理功能比較差,而DSP則能彌補(bǔ)這一功能缺陷。許多應(yīng)用都需要兼具智能控制和數(shù)字信號處理兩種功能,因而,把DSP和微處理器進(jìn)行結(jié)合,用單一芯片實(shí)現(xiàn)這兩種功能,將會(huì)大大加速個(gè)人通信機(jī)、智能電話、無線網(wǎng)絡(luò)產(chǎn)品的開發(fā),簡化設(shè)計(jì),減小PCB體積,減小功耗,降低整個(gè)系統(tǒng)成本。”
FPGA與MCU兩個(gè)產(chǎn)品的融合也并不新鮮。熟悉Altera產(chǎn)品線的工程師們都清楚,除了Altera自己的Nios核之外,還有ARM的Cortex M1、飛思卡爾的Coldfire。而Xilinx本身,也是在自產(chǎn)自銷的MicroBlaze核之外,還有PowerPC核。即使是ARM公司與FPGA的合作,就能數(shù)出一堆來,從Altera到Actel,再到Xilinx。甚至英特爾也將自己的Atom處理器和Altera的Arria II GX FPGA集成在一起推出代號Stellarton的所謂可配置處理器。
Altera的軟件及工具營銷部的高級總監(jiān)Chris Balough表示,關(guān)于FPGA和CPU的關(guān)系,整合這些器件的趨勢十多年前就出現(xiàn)了,而且這個(gè)趨勢將日趨加速。
而Xilinx亞太區(qū)及大中華區(qū)市場及應(yīng)用總監(jiān)張宇清則斷言:融合MCU和DSP以及FPGA的SoC可稱為理想的SoC。
但是,隨著融合技術(shù)的廣泛應(yīng)用,融合平臺(tái)存在的許多問題也漸漸浮出水面,張鐵虎認(rèn)為有以下問題有待解決:(1)功耗有待降低。DSP和MCU的融合平臺(tái)擁有更高性能的同時(shí),也會(huì)比單一的DSP或MCU產(chǎn)生更高的功耗。便攜式設(shè)備對于功耗是非常敏感的,也就意味著首當(dāng)其沖的是如何進(jìn)一步降低功耗。(2)應(yīng)用環(huán)境的完善與更新,即為用戶提供更加簡易、高效的開發(fā)和調(diào)試環(huán)境。(3)復(fù)雜程度的降低。嵌入式系統(tǒng)日益復(fù)雜化,因此,盡可能簡化系統(tǒng)設(shè)計(jì),提高開發(fā)效率,縮短開發(fā)周期,變得越來越重要。(4)成本控制。任何一個(gè)系統(tǒng)的發(fā)展都有著對成本控制的嚴(yán)格要求,如何在提高性能的同時(shí)又能有效控制成本,提高性價(jià)比,是所有開發(fā)廠商的根本利益之所在。
不可逆轉(zhuǎn)的SoC集成
由于集成電路集成度不斷提高,將完整計(jì)算機(jī)所有不同的功能塊一次直接集成于一顆芯片上的SoC片上系統(tǒng)就成為整個(gè)半導(dǎo)體行業(yè)發(fā)展的一個(gè)趨勢,也是嵌入式微處理器本身的一個(gè)發(fā)展方向。處理器集成各類功能模塊和外圍接口直接組成完整的計(jì)算系統(tǒng)可以顯著降低系統(tǒng)成本和功耗,提高系統(tǒng)可靠性。這在嵌入式市場已經(jīng)成為絕對的主流,因?yàn)榍度胧较到y(tǒng)功能相對固定,對可靠性、成本、功耗要求更高。
飛思卡爾Charlie Wu認(rèn)為DSC(數(shù)字信號控制器)會(huì)大量應(yīng)用在新能源領(lǐng)域,如數(shù)字電源,太陽能發(fā)電;混合動(dòng)力汽車的電池充電管理等。
NXP的金宇杰則認(rèn)為:今后MCU的發(fā)展方向就是不斷集成各種模擬接口以降低系統(tǒng)整體成本,甚至連CAN這樣原來非常昂貴的接口,以后會(huì)因?yàn)榧傻叫酒瑑?nèi)而可以進(jìn)入工業(yè)界。
但是今年在桌面處理器市場也出現(xiàn)了這種趨勢。比如最近AMD發(fā)布的APU就是把CPU、GPU、內(nèi)存控制器等融合在一塊芯片上,由于集成度增高,系統(tǒng)的整體功耗大幅度減少,從而得以進(jìn)入上網(wǎng)本、一體機(jī)、HTPC甚至嵌入式市場。
專有 vs 開放
由于ARM在移動(dòng)處理器市場的極端成功,它開放的IP授權(quán)模式和封閉的專有處理器模式成為整個(gè)業(yè)界討論的一個(gè)話題。由于這幾年Cortex M系列內(nèi)核的成功推廣,各主要MCU廠商都推出了ARM核心的MCU產(chǎn)品,幾乎業(yè)內(nèi)所有的人都認(rèn)為ARM通用內(nèi)核MCU將會(huì)占據(jù)市場的主導(dǎo)地位。的確M0核在成本、功耗方面已經(jīng)非常接近8位MCU,而在代碼量方面可以比原來的8051處理器降低30%~40%,可以大幅降低片上Flash的需求。再加上ARM內(nèi)核的通用性,對于軟件開發(fā)人員來說實(shí)在方便。
ARM授權(quán)模式比英特爾的x86處理器市場更加開放更加有活力。而且處理器IP授權(quán)廠商不止ARM一家,還有MIPS科技,這家授權(quán)廠商的開放性更高,愿意給客戶提供指令集架構(gòu)的授權(quán)。在DSP領(lǐng)域,也有類似角色,CEVA是最大的DSP內(nèi)核授權(quán)商,2009年占據(jù)了78%的市場份額。
當(dāng)然專有的處理器也有通用處理器無法企及的優(yōu)勢,愛特梅爾公司亞太區(qū)戰(zhàn)略營銷總監(jiān)曹介龍解釋說,通用MCU架構(gòu)在不同的應(yīng)用領(lǐng)域擁有很好的“橫向”市場覆蓋度,而專有MCU架構(gòu)則在某些應(yīng)用中擁有更好的“垂直”滲透力,例如電容式觸摸屏、智能電池管理、無線傳感器網(wǎng)絡(luò)等應(yīng)用。因而,對于優(yōu)秀的MCU供應(yīng)商來說,最重要的是能夠同時(shí)支持和提供采用通用MCU架構(gòu)和專有MCU架構(gòu)的優(yōu)良的MCU解決方案。
Microchip微控制器技術(shù)和開發(fā)部門產(chǎn)品市場總監(jiān)Fanie Duvenhage認(rèn)為專有系統(tǒng)的存在不單單是技術(shù)的原因,更多還是各個(gè)廠商戰(zhàn)略的考慮,不想完全被ARM牽著鼻子走,除非市場的壓力實(shí)在太大,否則各個(gè)廠商不會(huì)輕易放棄自己的專有構(gòu)架。另外4位和8位MCU市場也很難被32位的ARM處理器完全取代。
因此,我們有相信與服務(wù)器市場類似的情況將再次上演,專有的處理器依靠系統(tǒng)廠商的支持仍舊保持一定份額,但是市場主流將是開放的架構(gòu)。
X86 vs ARM
本來英特爾和ARM在各自的領(lǐng)域呼風(fēng)喚雨,攻城略地??墒钱?dāng)移動(dòng)互聯(lián)網(wǎng)和云計(jì)算時(shí)代的到來,井水不犯河水的日子到頭了,他們的產(chǎn)品策略正不斷地向?qū)Ψ街髟椎氖袌鰸B透。
根據(jù)InStat Research 的調(diào)查結(jié)果,網(wǎng)絡(luò)連接設(shè)備的處理器市場的年均復(fù)合增長率將于2013 年達(dá)到 22.3%,2013年7億5000萬個(gè)處理器中的一半將被搭載在智能手機(jī)上。智能手機(jī)銷量預(yù)期將由2008年的2億部上升到2013年的5億部。不僅僅是預(yù)期銷量令人咂舌,盡管整個(gè)手機(jī)市場正在萎縮,但智能手機(jī)的實(shí)際銷量卻在大幅增長。
據(jù) ARM 最近的描述,其收益的64%都來自于移動(dòng)市場。英特爾也希望能分上一杯羹,它可不想缺席這個(gè)急速增長中的市場。巨人英特爾和ARM這個(gè)小巧靈活的大不列顛公司之間的戰(zhàn)線正在悄然拉開。當(dāng)然ARM自己不是處理器生產(chǎn)商,它只是整個(gè)處理器生態(tài)系統(tǒng)的一部分,直接跟英特爾交鋒的是高通、nVIDIA等處理器廠商。
英特爾針對嵌入式市場推出的Atom處理器是一款簡化了結(jié)構(gòu),去掉分支預(yù)測電路,只支持順序執(zhí)行的低功耗處理器。相比桌面處理器它的功耗已經(jīng)相當(dāng)小,可是相比ARM處理器,仍舊是電老虎,因?yàn)閤86處理器相比純RISC處理器總是會(huì)多出一些解碼譯碼電路,這是維持自己代碼兼容性的必然代價(jià),也許是無法跨越的構(gòu)架鴻溝。英特爾想通過自己獨(dú)步天下的制造工藝來獲得功耗優(yōu)勢,理論上可行,但實(shí)際的產(chǎn)品Medfield仍舊沒有正式公布,所以業(yè)內(nèi)人士普遍不看好它在移動(dòng)市場的前景。
ARM去年9月已經(jīng)公布了Cortex A15MP內(nèi)核,雖然不是先前預(yù)測的64位處理器,但是支持?jǐn)U展尋址能力,可以突破4GB的內(nèi)存限制,還支持硬件虛擬化,顯然已經(jīng)可以進(jìn)入桌面甚至服務(wù)器市場。再加上微軟已經(jīng)宣布會(huì)開發(fā)ARM版本的Windows8,它的前景反而更加被業(yè)內(nèi)看好。畢竟能耗效率是整個(gè)行業(yè)越來越關(guān)心的指標(biāo),ARM處理器在這方面有著天生的優(yōu)勢。
由于這兩家的實(shí)際產(chǎn)品都還沒有發(fā)布,實(shí)際的性能和功耗都還是未知數(shù)。雖然業(yè)內(nèi)普遍更加看好ARM所代表的整個(gè)陣營,但是英特爾畢竟是處理器的巨人,在這方面的技術(shù)積累無人可敵,說不定會(huì)有出乎大家意料的產(chǎn)品誕生,進(jìn)而改變整個(gè)行業(yè)的力量對比。
(好展會(huì)網(wǎng) )
其他行業(yè)資訊
- 淡季需求有限 玻璃價(jià)格小幅回升
- 大連港集裝箱吞吐量要將達(dá)到788萬標(biāo)箱,實(shí)現(xiàn)23%的增長
- 寧非展覽推廣冬季戶外運(yùn)動(dòng) 助威萬龍杯國際冰雪賽
- 再制造產(chǎn)業(yè)推進(jìn)經(jīng)濟(jì)轉(zhuǎn)型發(fā)展
- 黃花梨木家具 獨(dú)特薔薇花梨味
- 獨(dú)山子石化公司首建國內(nèi)廢物生化處理裝置
- 文化產(chǎn)業(yè)沾染“不良?xì)庀ⅰ? 無準(zhǔn)備的“遭遇戰(zhàn)”防不勝防
- 三大“中茶”攜手深圳茶博會(huì) 梧州中茶被選為大會(huì)指定六堡茶
- 瞄準(zhǔn)“下鄉(xiāng)”與“社區(qū)” 醫(yī)療器械市場有望翻番
- 緊抓行業(yè)應(yīng)用趨--- 三星大屏推更多產(chǎn)品