《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 嵌入式技術(shù) > 高端訪談 > 十問Chris Rowen:聽微處理器大師講SoC設(shè)計(jì)的前世今生

十問Chris Rowen:聽微處理器大師講SoC設(shè)計(jì)的前世今生

2010-06-12
作者:Tensilica公司

  中國(guó)北京2010年6月11日訊–即便放眼整個(gè)IC行業(yè),像Chris Rowen博士這般愛談技術(shù),同時(shí)又可以講得如此深入淺出的,,著實(shí)少見,。他可以一邊舉起手中的iPhone做各種演示,也可以拿起隨手拾見的小紙條寫寫畫畫來加強(qiáng)語(yǔ)氣。他咬字無(wú)比清晰準(zhǔn)確(尤其在諸如Interestingly或者particularly這類副詞的時(shí)候會(huì)讀得緩慢甚而產(chǎn)生了某種韻律感),似乎是在運(yùn)用一種類似于詩(shī)人誦詩(shī),抑或冒險(xiǎn)家在眾人面前娓娓道來諸多奇跡的情緒和語(yǔ)氣,,來描述那些SoC設(shè)計(jì)的理念。很神奇,。
 
  而更加奇妙的是,,他幾乎經(jīng)歷過微處理器">微處理器的所有起起伏伏,前世今生,。他是RISC架構(gòu)的奠基人之一,,分別參與了Intel和MIPS公司的大躍進(jìn)時(shí)代,如今,,又帶著一種全新SoC架構(gòu)的理念,,在或多或少地改變著我們的數(shù)字時(shí)代。所以,,與其說是采訪,,還不如說是在聽一個(gè)傳奇(而且這個(gè)傳奇也不過是翩翩中年哦!)講故事,。
 
  Power Density,、Parallel、Multi-Core,、FPGA,、RISC、SoC,,這些詞于談笑間輾轉(zhuǎn)騰挪,,有一瞬間,,我差點(diǎn)覺得對(duì)面坐著的是 Wes Anderson,那個(gè)拍出過《了不起的狐貍爸爸》(Fantastic Mr. Fox)的我最中意的好萊塢導(dǎo)演,。不避世也不趨世,。獨(dú)辟蹊徑,,信手拈來,。關(guān)鍵都還挺帥的。
 
1,、我看過您2004年寫的“復(fù)雜SoC設(shè)計(jì)”,,非常喜歡的第8章(Chris Rowen :“SOC設(shè)計(jì)的未來”哈哈)。恩您還記得,。因?yàn)槟愕乃蓄A(yù)言都應(yīng)驗(yàn)了,,這非常有趣。所以我的問題是,,您如何看待再6年之后的SoC設(shè)計(jì),,或者說和SoC 設(shè)計(jì)有關(guān)的那些技術(shù)趨勢(shì)? (Chris Rowen :哇,,這個(gè)問題還不賴?。?br />   Chris Rowen :我認(rèn)為這個(gè)市場(chǎng)的大方向還是相當(dāng)清楚的??纯词袌?chǎng)層面的基本趨勢(shì),,再看看技術(shù)層面的基本趨勢(shì),你就可以看到他們?cè)谀睦镏睾?。就技術(shù)而言,,你會(huì)發(fā)現(xiàn)摩爾定律(Moore’s Law)作為經(jīng)濟(jì)驅(qū)動(dòng)力的事實(shí)。但是摩爾定律真正有趣的部分在于,,第一,,是“集成度(Density)持續(xù)提高”。每隔2年半或者3年,,硅密度就要提高一倍,,這意味著近一倍成本的降低,讓射頻產(chǎn)品中的數(shù)字模塊集成度越來越高,。這也意味著,,各種系統(tǒng)都在規(guī)模(Scale)上變得越來越小。所以無(wú)論是電腦亦或消費(fèi)電子設(shè)備,,每一個(gè)系統(tǒng)的目的都是集成于同一塊芯片,。這就變得有趣起來。因?yàn)樵谶^去,,你可以生產(chǎn)通用(Generic)存儲(chǔ)器,,通用處理器,,通用射頻,諸如此類,,然后一股腦兒放在一塊兒,,建一個(gè)非常牛逼的專用(Specific)系統(tǒng)。但是在今天,,事情都顛過來了,。你更希望把一坨不同的功能集合到一塊芯片上。當(dāng)然在這個(gè)意義上,,你還是得搞出一塊專用芯片,。但是挑戰(zhàn)變大了,因?yàn)樾酒旧硇枰訉W⒂谀骋粋€(gè)特殊應(yīng)用,,而應(yīng)用處理器,、內(nèi)部總線等等其他玩意兒,也要變得更小更強(qiáng)更快,!
 
  另一件吊詭的事就是,,摩爾定律并沒有在晶體管層面帶來太多的功率改進(jìn)。在過去,,當(dāng)東西變小了,,功率自然就降低了,所以工程師也壓根不需要操心什么芯片架構(gòu)(Architecture),。而現(xiàn)在,,如果工程師想要優(yōu)化功耗,首先就要優(yōu)化架構(gòu),。他得考慮我怎么著才能更有效地完成這個(gè)計(jì)算,?譬如用更少的晶體管門或者運(yùn)算周期,甚至在這個(gè)任務(wù)不運(yùn)行的時(shí)候關(guān)閉掉相應(yīng)子系統(tǒng),??傊@活兒變智能(Intelligent)了,。
 
  所以舉個(gè)例子啊,,比如你想做個(gè)手機(jī),就必須要注意區(qū)分不同的使用場(chǎng)景,,譬如聽音樂,、看YouTube視頻、發(fā)短信,、上網(wǎng),,或者煲電話,這些都是完全不同的情景,。你得關(guān)掉所有沒用的子系統(tǒng),。更細(xì)心,,更積極。因此對(duì)于芯片設(shè)計(jì)師(Chip Architect)或者系統(tǒng)設(shè)計(jì)師來說,,這是最好的時(shí)代,。因?yàn)橛羞@么多的事兒可做。但對(duì)于一個(gè)晶體管工人(Transistor Guy)而言,,這可真是最壞的時(shí)代?。∫磺卸家呀?jīng)上升,,已經(jīng)上升到系統(tǒng)或者應(yīng)用的級(jí)別,。這就是技術(shù)領(lǐng)域正在發(fā)生的大事件,。
 
2,、未來幾年市場(chǎng)方面的變化呢?
  Chris Rowen :說到市場(chǎng),。我認(rèn)為最大的趨勢(shì)是一切都已經(jīng)移動(dòng)起來,,因?yàn)槿藗兊纳罘绞揭呀?jīng)徹底改變了。當(dāng)你可以隨身攜帶那么多的設(shè)備,,就會(huì)希望能夠持續(xù)地連接到互聯(lián)網(wǎng) 上,。這種影響不僅表現(xiàn)在設(shè)備上,還表現(xiàn)在無(wú)線基礎(chǔ)設(shè)施,,以及云計(jì)算上,。而且經(jīng)濟(jì)層面的機(jī)會(huì),將會(huì)隨之變得非常,,非常深遠(yuǎn),。因?yàn)槟銜?huì)看到,譬如在這種設(shè)備 (Chris拿起手里的iPhone開始演示)的層面,,無(wú)線連接的帶寬起碼還要提高30倍,。為了獲得足夠豐富的娛樂體驗(yàn),我們或許需要幾十甚至幾百兆比特 的帶寬,。在世界每一個(gè)地區(qū),,高端用戶越來越多。中國(guó)就是一個(gè)鮮活的例子,。不光如此,。在印度、南美,、非洲,、加勒比海地區(qū),人人都希望持續(xù)不斷地連接到互聯(lián)網(wǎng),。
 
  所以,,你必須很好地設(shè)定人們?nèi)找嬖鲩L(zhǎng)的期望值?,F(xiàn)在有10倍的寬帶人口增長(zhǎng)每個(gè)人都有30倍的寬帶需求,因此就有了300倍的寬帶要求,。而系統(tǒng)的每 個(gè)層面都需要滿足這種需求,。對(duì)于無(wú)線基礎(chǔ)設(shè)施制造商來說,他們的機(jī)會(huì)是巨大的,。譬如華為,。但是制造商是沒可能贏得300倍收入的。有可能獲得更多的收入,, 但不是三百倍以上,。因此,他們必須在得到大幅增加帶寬的同時(shí),,大幅降低資金成本(Capital Cost)和經(jīng)營(yíng)成本(Operate Cost),。
 
3、那么接下來在SoC設(shè)計(jì)上會(huì)有什么事情發(fā)生,?
  Chris Rowen :你可以看下無(wú)線基站作為例子,。傳統(tǒng)意義而言,它們是昂貴的,。你可以找些通用芯片,、通用DSP、通用FPGA,??墒墙裉欤瑸榱藵M足對(duì)帶寬的要求,,您需要更 多的高度定制的SOC,,芯片平臺(tái)和軟件的需求也上升很快。所以這將使集成度更高,,每塊芯片上集成更多的DSP,,而每塊DSP上嵌入更多的軟件程序,甚至是 軟件內(nèi)容的爆炸性發(fā)展,。
 
  有趣的是,,每部分網(wǎng)絡(luò)基礎(chǔ)設(shè)施(Network Infrastructure)的功耗都是巨大的。那么即便為綠色節(jié)能考慮,,減少為更加緊密集成的系統(tǒng)都是異常重要的,。基站將明顯變小,,這意味著整個(gè)基站 都可變成塔頂?shù)囊粋€(gè)小盒子,,而不是……裝在塔頂可是簡(jiǎn)單很多。
 
  當(dāng)然在系統(tǒng)層面,,你一旦降低成本以后降低功耗也就水到渠成,。所以這兩者之間是一個(gè)非常良性的關(guān)系,。關(guān)鍵是硅晶圓的集成。這也是Tensilica會(huì) 如此迅速成長(zhǎng)成為世界領(lǐng)先的DSP內(nèi)核供應(yīng)商之一的原因,。
 
  甚至可以看到這種變化體現(xiàn)到了云計(jì)算上,。因?yàn)楝F(xiàn)在你需要300倍的帶寬,也就相應(yīng)地對(duì)視頻服務(wù),、視頻壓縮,、互聯(lián)網(wǎng)數(shù)據(jù)庫(kù)搜索、社會(huì)網(wǎng)絡(luò),,如此等等,, 都提出了更高的需求。而所有這些事情,,真的都是很復(fù)雜的應(yīng)用程序呢,。
 
  不過有趣的是,他們都是些并行的應(yīng)用程序,。這是個(gè)好消息,。因?yàn)樵谟?jì)算機(jī)業(yè)已經(jīng)發(fā)生的一件事情便是,,單個(gè)微處理器的速度已經(jīng)很難再提高了,。Intel 在1990年,戲劇性地發(fā)現(xiàn)了單處理器性能呈指數(shù)增長(zhǎng)的改善,。但是他們也旋即發(fā)現(xiàn)當(dāng)處理器頻率達(dá)到約3.5到4GHz的時(shí)候,,功率密度(Power Density)遇到了瓶頸。于是,,他們開始嘗試多核技術(shù),。
 
  還好人民群眾想做的事,基本都是天然就可以并行處理的,。所以,,你在做互聯(lián)網(wǎng)數(shù)據(jù)庫(kù)檢索(Internet Database Search)的時(shí)候,確實(shí)可以設(shè)置多內(nèi)核,、多芯片,,甚至多系統(tǒng)。因?yàn)槟愕牟樵冋?qǐng)求通常將被發(fā)往多個(gè)地點(diǎn),。所以在互聯(lián)網(wǎng)云計(jì)算的領(lǐng)域,,運(yùn)用多核的機(jī)會(huì)無(wú)比 廣闊。
 
  而且確實(shí)存在是一個(gè)問題,,就是你如何在有效的MIPS指令內(nèi)獲得足夠低的功耗,。或者說,,如何在設(shè)計(jì)電池壽命最長(zhǎng)的移動(dòng)設(shè)備,,和最可擴(kuò)展的服務(wù)器之間 取得關(guān)聯(lián),?因?yàn)樗卸己凸挠嘘P(guān),而非峰值的性能,。
 
4,、那么Tensilica是如何來克服在功耗上的挑戰(zhàn)的?和競(jìng)爭(zhēng)對(duì)手比起來又有何區(qū)別,?
  Chris Rowen :舉個(gè)例子,。Tensilica贊同為特定的任務(wù)去優(yōu)化處理器。優(yōu)化流水線(Pipeline),,優(yōu)化接口,,優(yōu)化設(shè)計(jì)層面,然后把多個(gè)內(nèi)核放在一起,,以建 立一個(gè)多核系統(tǒng),。這種優(yōu)化的能力將產(chǎn)生巨大的影響。我會(huì)在今天下午的會(huì)上談到這個(gè)稱作Turbo解碼器的專用(Specialized)處理器,。 Turbo是一種特殊的算法,,可以從嘈雜的噪聲中提取有用信息,在一個(gè)工作循環(huán)(cycle)內(nèi),,這個(gè)解碼器可以執(zhí)行大約3萬(wàn)次,,哦對(duì)的沒錯(cuò)3萬(wàn)次 RISK指令。是的,,通用的壓縮(Compression)處理器只能執(zhí)行一次指令,,而這個(gè)專用處理器可以執(zhí)行3萬(wàn)次。當(dāng)然這是一個(gè)極端的例子,,只是想表 明當(dāng)你知道你的問題在哪里,,你就可以做出很多令人難以置信的事情。并行,,并因此難以置信的高效率,。
 
  同樣的原則可以適用于各個(gè)層面,適用于各種其他門類的專用DSP,、無(wú)線接收器,,適用于基帶和音頻的通用DSP,也適用于客戶意欲進(jìn)行視頻處理或其他 圖形壓縮,、安全操作,、網(wǎng)絡(luò)協(xié)議處理,以及廣泛應(yīng)用于射頻的深嵌入式控制(Deeply Embedded Control),。
 
  Tensilica特別集中精力于那些能夠?qū)iT優(yōu)化的能力,,以及真正方便使用多核的能力。而因此,我們從那些傳統(tǒng)的CPU老家伙們中區(qū)別了出來,。譬 如Intel,、ARM、MIPS,,或者其他什么人,。他們都面臨一個(gè)相同的物理問題,摩爾定律在給了他們更多的晶體管之后,,卻沒有給他們更好的功率控制,,對(duì) 不對(duì)?
 
  他們很少去考慮并行的問題,。而與之相反,,我們?cè)趹?yīng)用層面非常努力地工作,以期尋找到解決方案,。在云計(jì)算那段,,我們確實(shí)可以將任務(wù)分割成很多子任務(wù), 但是當(dāng)我在這里玩游戲(Chris又一次拿起手里iPhone開始演示),,我真的被限制了,。你看,一個(gè)手指只能玩一樣?xùn)|西哈,。因此在應(yīng)用處理器的層面,,你 真的無(wú)法得到啥好處。MIPS,、ARM,,甚至還有Intel,都面對(duì)著這樣一個(gè)無(wú)法在當(dāng)前硅科技下有效完成多任務(wù)的問題,。而那是我們擅長(zhǎng)的。
 
  我們看到這個(gè)市場(chǎng)在迅速增長(zhǎng),,去年的出貨量增長(zhǎng)了大約70%,。然后我們會(huì)試圖進(jìn)入所有的DPP(Data-Plane Processor)領(lǐng)域,包括DSP,、音頻視頻,、安全,以及深嵌入式控制,,這其實(shí)和應(yīng)用處理器的范疇離得很遠(yuǎn),。所以啊,我們常常會(huì)發(fā)現(xiàn)自己和MIPS,、 ARM或Intel出現(xiàn)在同一塊芯片上,。你知道吧,其實(shí)我們就是工廠的工人啊(Chris突然哈哈大笑),!因?yàn)橛羞@么多不同的處理器,,在Date- Plane里又有這么多不同的任務(wù),那些小而高效的處理器會(huì)有很多機(jī)會(huì),,很多接口(Socket),。
 
  這種對(duì)于應(yīng)用處理器或者接口的互補(bǔ)性,甚至于可以讓應(yīng)用處理器在執(zhí)行類似于信號(hào)處理這種實(shí)時(shí)任務(wù)的時(shí)候,,也完全關(guān)閉,。或者比如多媒體應(yīng)用,,應(yīng)用處理 器當(dāng)然可以去做,,但是如果我們優(yōu)化專用音頻DSP的話,將獲得4到5倍的效率,。尺寸更小,,單位時(shí)間內(nèi)的吞吐量卻更大。而且可以用如此多的音視頻處理器夠你 選擇,。所以幾乎任何時(shí)刻,,系統(tǒng)設(shè)計(jì)師或者SoC設(shè)計(jì)師都可以通過區(qū)別應(yīng)用場(chǎng)景的方式,來決定卸載(Off Load)哪個(gè)處理器,。
 
  這也是為什么我認(rèn)為我們可以在音頻方面取得這么大的成功,。當(dāng)你正在設(shè)計(jì)一個(gè)手機(jī),或者閱讀顯示器,,或者機(jī)頂盒,,或者數(shù)字電視,或者數(shù)碼相機(jī),,你會(huì) 說,,啊,這里有一種場(chǎng)景需要我做大量音頻的工作,。于是,,把那種卸載很自然地就被設(shè)計(jì)到到基本構(gòu)架里去了。
 
  而且,,我們可以為應(yīng)用層面的處理器自動(dòng)生成軟硬件,,尤其是基于音頻和基帶的非常全面的軟件庫(kù)(Software Libraries)。因此,,不管是老手還是菜鳥,,在我們的店鋪里都能找到他們所有需要的軟硬件解決方案,以幫助他們最快地進(jìn)入市場(chǎng),。集成音頻,、集成基 帶,或者其他各種功能。
 
5,、那么Tensilica有什么具體的應(yīng)用嗎,?
  Chris Rowen :今天下午,我將討論一下移動(dòng)電話,。這是一個(gè)巨大的市場(chǎng),,一個(gè)可以滿足之前所說帶寬需求的市場(chǎng)。特別是從當(dāng)前正從3G向4G升級(jí),,大家都聚焦在LTE身 上,。不僅因?yàn)長(zhǎng)TE看上去很像是最后標(biāo)準(zhǔn)的勝者,也因?yàn)樗浅O馱iMax,。我們已經(jīng)能夠提供參考設(shè)計(jì),,幫助客戶建立他們自己定義的多核LTE手機(jī),在市 場(chǎng)中搶得先機(jī),。這只是一個(gè)我們進(jìn)入領(lǐng)域的實(shí)例,。
 
  我們也在做一個(gè)很類似的數(shù)字電視解調(diào)器。因?yàn)橛腥讼M葹橐苿?dòng)應(yīng)用又為起居室設(shè)計(jì)一種通用的數(shù)字電視接收器,。這里有個(gè)很大的問題,,就是全世界在視頻 領(lǐng)域有好多不同的標(biāo)準(zhǔn)和概念,而每個(gè)人都真心希望擁有一塊可以解決一切的視頻芯片,。我們準(zhǔn)備來設(shè)計(jì)一塊,。其實(shí)應(yīng)用一樣的原理,就是找些DSP和專用核,,優(yōu) 化最密集的任務(wù),,并充分利用我們最重要的能力——生成處理器的功率效率非常小,以及和世上最穩(wěn)定的通用DSP一樣易于編程的軟件工具,。昨天晚上客戶還和我 們說,,DSP如此招人待見的最主要原因就是可編程。譬如TI的那些DSP,。我們同樣在努力使編譯器更強(qiáng)大,,使程序模型簡(jiǎn)單,使程序員更不操心,。我們還微處 理器的流水線設(shè)計(jì)上增強(qiáng)了視覺效果。這種架構(gòu)下要還能生成不正確的代碼,,也怪難的,。
 
  因此,我們擁有一個(gè)非常高效的處理器,。但是效率(Efficiency)這個(gè)詞值得商榷,。傳統(tǒng)意義上而言,效率就是指最少的門數(shù)、最小的功耗,,巴拉 巴拉,。但效率也是將產(chǎn)品推向市場(chǎng)的時(shí)間。需要多少工程師才能部署好這個(gè)系統(tǒng),?每行代碼的成本是多少,?每個(gè)工程師小時(shí)(Engineer Hour)所能帶來的收入?除了硅片層面的效率以外,,這些同樣是測(cè)量效率的重要參數(shù),。我認(rèn)為我們?cè)谶@兩面都推動(dòng)得很好。剛才討論的那種架構(gòu),,也特別適合在 大量出貨的領(lǐng)域,。移動(dòng)設(shè)備、客廳設(shè)備,、數(shù)碼相機(jī),,這些都是我們做得非常好的地方。這幾個(gè)領(lǐng)域四大廠商中的三位,,十大廠商中的六個(gè)都是我們的客戶,。
 
  我們主要是在DPP方面擁有很強(qiáng)的知識(shí)積累,但同樣的影響也已經(jīng)開始在云計(jì)算上面出現(xiàn),。當(dāng)然,,現(xiàn)在云計(jì)算的變化還比較慢,部分原因是它并非對(duì)功耗如 此敏感,,但我認(rèn)為整體上還是會(huì)有影響的,。
 
6、您會(huì)在很多其他領(lǐng)域譬如數(shù)字電視和有線通信,,使用這種結(jié)構(gòu),?
  Chris Rowen :當(dāng)然。那些可以為不同應(yīng)用優(yōu)化處理器的架構(gòu)是很重要的,。而且我們也發(fā)現(xiàn),,即使在一個(gè)新的水平,很多需求也是 相似的,。因此同樣的Hi-Fi工具,,同樣的音頻DSP,即可部署在世界最好的智能手機(jī)上,,也同樣可以部署在最好的數(shù)字電視,、藍(lán)光(Blue Ray)影碟機(jī)上。因?yàn)樗欠浅P《斓?。這方面的要求是相同的,。
 
  同樣,,如果你看下Altas LTE的內(nèi)部架構(gòu),其主要構(gòu)造模塊BBE16或許是世界上最快的DSP核,。而它同樣也在數(shù)字電視解調(diào)子系統(tǒng)中使用,。同樣再一次因?yàn)樗目焖佟⒁拙幊?,以?節(jié)約功耗,。所以,我們可以看到在手機(jī)和客廳之間,,在這兩個(gè)媒體處理器和基帶處理器之間,,都有著共同的需求。
 
7,、我看到您說,,芯片的整合將集中在射頻、存儲(chǔ)和數(shù)字電路,。那么您覺得它們?nèi)哌€有可能合并成一個(gè)嗎,?
  Chris Rowen :嗯。如果你從半導(dǎo)體工藝(Semiconductor Process)技術(shù)的角度來看,,我認(rèn)為在晶體管和器件優(yōu)化的層面將會(huì)有些事情發(fā)生,。因此在某些情況下,你可以作出權(quán)衡,。特別是,,我們正與很多客戶一起工 作,以簡(jiǎn)化射頻電路,。通過盡量多的數(shù)字處理器,,你可以部分程度地脫離射頻和數(shù)字間的邊界。由于相比射頻而言,,數(shù)字會(huì)有更加陡峭的生產(chǎn)成本曲線(Cost Production Curve),,我們也就有更大的動(dòng)力去做。因此,,我們會(huì)越來越依賴于數(shù)字方面的有效解決方案,。
 
  同樣的事情發(fā)生在存儲(chǔ)器。人們偶爾也會(huì)使它們結(jié)合在一起,,但不是一個(gè)簡(jiǎn)單的組合,,內(nèi)存的加工設(shè)備(Fabrication Facility)與一般的優(yōu)化有所不同。所以我相信,,多芯片封裝(Multi-Chip Packaging)將越來越重要,。尤其當(dāng)你將芯片組(Die)一塊又一塊摞起來的時(shí)候。所以,,你可以在數(shù)字芯片組上面摞存儲(chǔ)芯片組,,然后上面再摞射頻芯 片組。這有可能在成本上是最劃算的,。然后也可能有一種折衷的工藝技術(shù),,把它們所有三個(gè)都放在一塊硅片上。這取決于你的應(yīng)用程序,,比如需要一些存儲(chǔ)單元,,又 或者需要一些射頻的單元。
 
  但最終,,我想我們還會(huì)堅(jiān)持三套不同的加工工藝,,然后依靠封裝技術(shù)來整合在一起。不過這并不意味著,,只要你能想辦法把它們?nèi)齻€(gè)捏一塊兒,,你就得到一個(gè) 系統(tǒng)(System)了。因?yàn)檫€有物理屬性的要求,,比如要多加塊電池什么的,。但總的來說你要知道,物理尺寸是會(huì)越來越小了,。
 
  但你要知道還有個(gè)巨大的挑戰(zhàn),,就是人們的手指不能變小,眼睛也不能變小,。 (EEtrend:尤其是男生,,哈哈!)對(duì),,所以所謂得到“小尺寸”的設(shè)備,,我們還是有實(shí)際限制的。我們?cè)谠骷用娴男?,其?shí)是對(duì)應(yīng)于我們自己可以接受 多小的屏幕和按鈕,。所以說到最后,這事兒還是更和成本相關(guān),。
 
8,、在書里您還預(yù)測(cè)了FPGA的未來。而幾天之前,,Xilinx宣布嵌入ARM 的Cortex A9核,。您覺得這是否是一種新趨勢(shì)?是否與Tensilica的 DPU形成競(jìng)爭(zhēng)呢,?

  Chris Rowen :其實(shí)……并沒啥,。我的意思是這種往處理器里一股腦嵌入FPGA的活兒,大概已經(jīng)折騰了快10年了,。 Altera宣布他們與ARM互相嵌的時(shí)候,,讓我想想啊,,也是8年前了吧? (Larry:沒錯(cuò)?。?br />  
  所以,,這就跟任何一個(gè)系統(tǒng)想要找塊芯片,或者三塊芯片一塊兒呆著,,沒啥區(qū)別,。當(dāng)然,偶爾你也會(huì)碰巧搞出一塊啥都囊括了的數(shù)字芯片,。話說回 來,,F(xiàn)PGA兄弟們有一個(gè)根本性的挑戰(zhàn),那就是FPGA的通用性非常高,,可以做的事兒也賊多,。但禍福相倚,要是讓它專注做一件事的話,,也就不是那么有效率 了,。所以,如果你想真正有效地利用處理器,,我估計(jì)你情愿在處理器里隨便嵌一個(gè)稍微穩(wěn)定點(diǎn)的東西,,而不是FPGA。
 
  我認(rèn)為這是非常自然的一步,。Xlinx以前也搭過Power PC,,對(duì)吧?這其實(shí)是一碼事,。它壓根沒有改變?nèi)魏卧械募軜?gòu),,也沒有在CPU和FPGA的功能之間取得任何邏輯上的合并(Merge)。部分是因?yàn)樗麄儧] 有任何合并的工具軟件模式,。
 
  當(dāng)然,,F(xiàn)PGA是很容易配置的,而且價(jià)格也便宜,。因此,,他們占據(jù)了一部分的市場(chǎng),尤其是那些量低而開發(fā)成本又低的,。因此,,我們?cè)谑忻嫔峡吹酱罅康?FPGA設(shè)計(jì)。但是基于FPGA的設(shè)計(jì)總量是很小的,。它其實(shí)是一個(gè)利基(Niche)市場(chǎng),。極端地說,即便有很多工程師在使用它,,但幾乎所有都是低產(chǎn)量 的,。
 
  所以我的意思是,,F(xiàn)PGA很重要,但不是Tensilica公司關(guān)注的,。我們專注于高產(chǎn)量,,并且?guī)椭切┰噲D在設(shè)計(jì)上節(jié)約幾納米硅片的兄弟 們。(EEtrend:完全兩個(gè)不同的群體咯,?)是啊,他們離得是遠(yuǎn)了點(diǎn)兒,。當(dāng)然他們偶爾也會(huì)重疊,。譬如基站。以前有很多基站是采用Altera的儲(chǔ)存方 案的,。挺重的。慢慢地我們看到越來越多因?yàn)槿萘俊⒊杀竞凸牡囊?,從FPGA轉(zhuǎn)向了更加高集成度的芯片解決方案,。
 
9、我在IEEE的設(shè)計(jì)與測(cè)試(Design & Test)上看到一篇您的談話,。您說,,如果我們想要進(jìn)入嵌入式系統(tǒng)設(shè)計(jì)的大規(guī)模并行領(lǐng)域,可配置的多核處理器SoC就有一些問題必須得到解決,。幾年前,,您 還提到過,Intel最大的問題是怎樣為通用計(jì)算應(yīng)用配置多核處理器,。您現(xiàn)在還覺得多核處理器遭遇困境嗎,?
  Chris Rowen :這個(gè)……其實(shí)是分開的兩碼事。對(duì)于多核應(yīng)用層面而言,,確實(shí)存在著重大考驗(yàn),。就是如何找到足夠多的線程 (Thread)來運(yùn)行。但它不是Intel單獨(dú)遇到的問題,。這是一個(gè)涉及到應(yīng)用程序是如何被調(diào)用,,以及在當(dāng)下如此小型的設(shè)備上如何架構(gòu)的問題。即便打開 我自己的筆記本電腦,,當(dāng)我想看看到底有多少個(gè)線程準(zhǔn)備在跑,,它基本上都是很少的。通常情況下,,操作系統(tǒng),、用戶界面和應(yīng)用程序開發(fā)等等所調(diào)用的方式,都完全 沒有最大化利用線程的數(shù)量,。
 
  所以,,我認(rèn)為你在基本的架構(gòu)層面可以做的,,就是提供更多的線程運(yùn)行,并且充分地利用到并行,。當(dāng)然在應(yīng)用層面也會(huì)有很多層級(jí)限制,。你知道現(xiàn)在很方便就 去搞個(gè)四核八核十六核的,但是在PC這一端,,相對(duì)于服務(wù)器,,只有相對(duì)較少的條件可以讓我們找到這些線程。于是一大現(xiàn)象便是操作系統(tǒng)和應(yīng)用程序的逐步重組 (Restructuring),。
 
  另一個(gè)同樣重要的現(xiàn)象是,,確定哪些任務(wù)可以被放進(jìn)數(shù)據(jù)層(Data Plane)。讓我們來想想哪些東西通常是可以被放進(jìn)數(shù)據(jù)處理器的,,譬如在無(wú)線信道這類的通訊子系統(tǒng),,譬如存儲(chǔ)系統(tǒng),比如你怎么分發(fā)數(shù)據(jù),,或者你知道的,, 安全冗余,也可能是針對(duì)壓縮流(Packing Stream)的特殊網(wǎng)絡(luò)處理器,,它可以是視頻也可以是音頻,。這些東西其實(shí)是更本質(zhì)(Inherently)的并行處理。
 
  所以吧,,我覺得這里有兩種并行重組,。其一是所謂的,去各地兒找更多的線程應(yīng)用,。另一種是為了維持整體系統(tǒng)中卸載(Off Loading)并行部分的最大值,,并讓之進(jìn)入數(shù)據(jù)層。實(shí)際上我認(rèn)為,,在數(shù)據(jù)層提取并行是更容易操作的,。因此,在數(shù)據(jù)層有效使用多核的數(shù)量,,遠(yuǎn)大于單單在 應(yīng)用層面使用的多核,。這也就是為啥我們認(rèn)為自己正走在康莊大道上。關(guān)注于數(shù)據(jù)層,,可以使我們?cè)诙嗪朔矫娴某砷L(zhǎng)速度大大超過那些只盯著應(yīng)用層面的兄弟,。
 
10、所以在手機(jī)上就不是個(gè)問題咯,?
  Chris Rowen :恩可以這么說,。這變得相當(dāng)容易,讓我們舉一個(gè)LTE基帶(Baseband)的例子吧。我們的Atlas平 臺(tái)可以弄出七或八核,,取決于你想怎么用,。DoCoMo和他的合作伙伴,NEC,、富士通以及松下,,已經(jīng)宣布并且詳細(xì)描述了他們LTE基帶架構(gòu)。第一代是8到 10核,。另一個(gè)叫做Blue Wonder Communication的合作伙伴也推出了他們的8至10核的LTE基帶,。因此,現(xiàn)在就有三種不同的LTE基帶,,而這三種都使用了約8個(gè)核,。在這個(gè)層 面上是可以有大量的并行解決方案的。
 
  再看看下一代的LTE,,大概有六點(diǎn)性能方面的因素需要考慮。其中一些是單核怎樣可以更快,,但更大部分和多核有關(guān),。所以我們很容易找到那些有效應(yīng)用而 20核甚至更多核于單一功能譬如基帶的案例。和那些圍觀應(yīng)用處理器的哥們比起來,,他們?nèi)绻杏X好,,就整兩個(gè)核玩玩;如果還很爽,,那就再整四個(gè),。我覺得在數(shù) 據(jù)層和應(yīng)用層上,多核是有完全不同的機(jī)會(huì)的,。(E:太清楚了?。?br />  
11、時(shí)間不早了,,最后一個(gè)問題吧,。您當(dāng)年在斯坦福參與奠基了RISC 架構(gòu),后來也曾是MIPS的共同創(chuàng)始人,。那么,,請(qǐng)問您如何看待RISC架構(gòu)的未來?依舊是ARM和MIPS之間的戰(zhàn)爭(zhēng),,抑或會(huì)發(fā)生一些新的大事件,?
  Chris Rowen :這個(gè)……在科學(xué)上,理想架構(gòu)已經(jīng)完全改變了,。這場(chǎng)關(guān)于CISC和RISC架構(gòu)的爭(zhēng)論,,其實(shí)就是通用 (General Purpose)架構(gòu)甲跟通用架構(gòu)乙之間的競(jìng)爭(zhēng)罷了。RISC贏得了一職半銜,是因?yàn)樵谀硞€(gè)特定時(shí)期內(nèi)它手下有好幾十項(xiàng)半導(dǎo)體技術(shù),。但在這場(chǎng)戰(zhàn)爭(zhēng)中,,摩爾 定律一下給出了這么多的晶體管,以至于你隨便搞個(gè)簡(jiǎn)單的解碼或者流水線,,都能奢侈地愛用多少就用多少,。沒人管。所以一個(gè)RISC解碼器可能要一萬(wàn)門,,而 CISC解碼器需要五萬(wàn)門,。其實(shí)也差不多了多少。
 
  不過我覺得除了通用架構(gòu)之間互掐以外,,還有一場(chǎng)更加深遠(yuǎn)的革命,。我們現(xiàn)在來比較通用架構(gòu)和一大家子的特殊用途(Special Purpose)架構(gòu),怎么樣,?幾乎任何時(shí)候你都可以說,,如果一個(gè)產(chǎn)品是圍繞某種特定的需求來設(shè)計(jì),那么特殊用途架構(gòu)鐵定勝出,。 RISC扁了CISC一段時(shí)間,,因?yàn)樗男矢叱?倍以上。那么為具體應(yīng)用特殊定制的架構(gòu),,就比所有通用架構(gòu)都高效5至10倍以上了,。
 
  因此,這個(gè)世界不能再簡(jiǎn)單分成我的通用架構(gòu),,和你的通用架構(gòu),。當(dāng)然對(duì)于那些非常分散(Defused)并且普適(Generic)的應(yīng)用程序,就好 比在筆記本上用的那些,,我們還是需要通用架構(gòu)的,。因?yàn)橐粫?huì)兒你要看視頻,一會(huì)兒又要運(yùn)行Word或(E:打游戲),,對(duì),,或者Excel工作表。這是非常多 樣的,。所以你需要一個(gè)德智體全面發(fā)展的處理器,。不能太特別。
 
  但總之,,你不得不面對(duì)一個(gè)世界,,那里有各種各樣不同的任務(wù),而每樣任務(wù)都是獨(dú)特的,。而且更為重要的是,,當(dāng)你因?yàn)槟柖啥谛酒霞傻钠舷到y(tǒng)越 多,,你越會(huì)發(fā)覺有足夠多的處理器適用于各種特定的應(yīng)用子系統(tǒng)。
 
  因此對(duì)于我來說,,計(jì)算的未來不是產(chǎn)生新的通用架構(gòu),,而是特殊用途架構(gòu)的集合。譬如一個(gè)音頻子系統(tǒng),、視頻子系統(tǒng),,一個(gè)基帶子系統(tǒng)、存儲(chǔ)子系統(tǒng),,哦對(duì),, 還有應(yīng)用處理器子系統(tǒng)。其中只有一個(gè)需要通用的結(jié)構(gòu)(Construction),,其他里面都將是特殊的架構(gòu),。在科學(xué)上,摩爾定律帶來多核,,多核又將帶來 特殊架構(gòu)的解決方案,。異型多核(Heterogenic Multi-Core)就是一種新架構(gòu)。而且我覺得會(huì)成為主流,。Intel,、ARM、MIPS這些公司當(dāng)然還會(huì)有很大的市場(chǎng),,但只限于應(yīng)用處理器領(lǐng)域。其 實(shí)在科學(xué)上,,通用目的(General Purpose)最終就會(huì)變成某一個(gè)特殊目的(Specific Purpose),。(E:這真的很有趣。謝謝您?。?br />  
  Chris Rowen :歡迎,。你們的問題都蠻好玩的。
 
關(guān)于Tensilica公司
  Tensilica是業(yè)界領(lǐng)先的且經(jīng)驗(yàn)證的可配置處理器IP供應(yīng)商,。數(shù)據(jù)處理器結(jié)合了CPU和DSP的功能,,針對(duì)不同應(yīng)用可以提高10到100倍的性能,Tensilica的自動(dòng)化處理器設(shè)計(jì)工具能夠針對(duì)應(yīng)用快速定制內(nèi)核,,以滿足其特殊的數(shù)據(jù)處理性能需求,。Tensilica可配置處理器為OEM制造商及世界前十大半導(dǎo)體廠商中的五家廣泛使用,這些產(chǎn)品包括移動(dòng)電話,、消費(fèi)類電子設(shè)備(包括數(shù)字電視,,藍(lán)光DVD,寬帶機(jī)頂盒,,便攜式媒體播放器),、計(jì)算機(jī)、存儲(chǔ)、網(wǎng)絡(luò)和通訊芯片,。更多關(guān)于Tensilica獲得專利的可配置處理器產(chǎn)品信息,,請(qǐng)?jiān)L問公司網(wǎng)站:www.tensilica.com .
 

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載,。