《電子技術應用》
您所在的位置:首頁 > 模擬設計 > 業(yè)界動態(tài) > 比拼浮點運算速度 超算排行榜是這樣“算”出來的

比拼浮點運算速度 超算排行榜是這樣“算”出來的

2019-06-21
關鍵詞: 超算 全球

  6月17日,新一期全球超算500強榜單出爐,入選500強的所有超算浮點運算速度都突破每秒千萬億次,中國超算也在前四占有兩席位置。

  普通計算機用指令運算速度衡量計算性能,而超算通常用浮點運算速度來衡量其性能。那么,什么是浮點運算速度,超算榜單為什么會選擇浮點運算速度來進行比較?500強特別是前十的超算,科學家們都在想哪些辦法讓浮點運算速度越來越快?節(jié)能環(huán)保是對超算的另一衡量指標,超算要節(jié)能環(huán)保,最新的研究思路和實現(xiàn)策略又有哪些?6月19日,科技日報記者帶著這些問題,走訪了業(yè)內(nèi)相關專家。

  浮點運算速度 衡量超算性能的基準程式之一

  “超級計算機被稱為‘國家重器’,屬于國家戰(zhàn)略高技術領域,是世界各國競相角逐的科技最高點。目前,高性能計算機領域市場競爭日趨激烈,美國、歐洲、日本和中國都在加速超級計算機的研發(fā)。”國家超級計算無錫中心主任楊廣文說。

  “浮點運算速度是指計算機系統(tǒng)每秒可以處理的浮點操作,通常用FLOPS來表示。”江南大學物聯(lián)網(wǎng)工程學院副院長柴志雷副教授說,超算榜單選擇浮點運算速度作為對比參考,是因為超級計算機主要用于科學計算領域,而這些領域的計算主要采用浮點數(shù)。

  江蘇理工學院計算機工程學院副院長范洪輝副教授告訴記者,浮點是指小數(shù)點位置不固定的數(shù),它們執(zhí)行的算術運算會消耗大量計算資源并可能產(chǎn)生誤差,所以單位時間內(nèi)浮點運算的次數(shù),是衡量超算性能的基準程式之一。

  常州信息職業(yè)技術學院軟件與大數(shù)據(jù)學院錢銀中博士表示,計算機只能存儲和處理整數(shù),通過整數(shù)乘以某個基數(shù)的整數(shù)次冪,是計算機表示實數(shù)尤其是小數(shù)的方法。

  “浮點運算在運算數(shù)大小變化范圍很大的場合可以實現(xiàn)很高的計算精度,是科學研究中的典型運算。大多數(shù)處理器中,都有專門處理浮點運算的浮點運算單元(FPU),F(xiàn)LOPS就是浮點運算單元的執(zhí)行速度。”錢銀中說。

  中國高性能計算重點研發(fā)專項總體組組長、中山大學數(shù)據(jù)科學計算機學院院長錢德沛表示,選用浮點運算速度作為超算運算能力的評價標準,是因為科學工程計算軟件中包含了大量的浮點數(shù)運算,浮點運算速度快的計算機通常也能夠更快運行相關的科學工程計算軟件。

  把復雜的工作細分 超算界沒有最快只有更快

  超級計算機具有很強的計算和處理數(shù)據(jù)的能力,主要特點表現(xiàn)為高速度和大容量,配有多種外部和外圍設備及高性能軟件系統(tǒng)。現(xiàn)有的超級計算機運算速度,大都可以達到每秒一萬億次以上。

  常州信息職業(yè)技術學院電子工程學院牛杰博士介紹,超級計算機的創(chuàng)新設計在于把復雜的工作細分并分配給不同的處理器。根據(jù)阿姆達爾定律,超級計算機的設計都集中在減少軟件序列化、用硬件在瓶頸上加速。

  目前,世界排名前十的超算,基本都是通過優(yōu)化CPU(中央處理器)與GPU(圖形處理器)之間的連接網(wǎng)絡結構來提升GPU和協(xié)處理器性能,增加內(nèi)存容量、擴充存儲容量、增大網(wǎng)絡帶寬、借助運算加速卡等方式提升算力,最終在高性能計算系統(tǒng)、網(wǎng)絡架構、系統(tǒng)軟件、應用支撐等關鍵技術上取得突破。

  柴志雷認為,提升超級計算機系統(tǒng)的浮點處理能力,不是單純讓浮點運算本身更快,而是從整個系統(tǒng)的角度,提升芯片工藝,優(yōu)化系統(tǒng)架構、節(jié)點計算性能、存儲訪問性能、節(jié)點間通信等,從而使得系統(tǒng)的整體能力得到提升。目前,還經(jīng)常采用在系統(tǒng)中增加加速器等方法,來獲得更高計算效率。

  錢銀中介紹,實現(xiàn)超算的技術有大規(guī)模并行計算法,這種方法使多個處理器一起工作,每個處理器處理一個大問題中的不同任務。這種方法有兩種實現(xiàn)途徑:一種是網(wǎng)格計算法,多個計算機連接成分散的分布式結構,分屬不同的控制區(qū)域,當需要計算機時從中擇機選擇;另一種是把處理器組織為關系緊密的集群。現(xiàn)代超算使用無限帶寬系統(tǒng)、三維環(huán)面互連等技術,在大規(guī)模并行系統(tǒng)中提高集群的速度和靈活性。

  國家超級計算無錫中心先進制造部部長任虎介紹,目前,提高浮點運算速度的方法主要有:提高芯片計算核心的時鐘頻率,增加芯片中計算核心的數(shù)量,通過多流水線、乘加融合(FMA)等技術增加單位時間內(nèi)處理浮點運算的能力。

  例如,曙光星云采用了自主研發(fā)的超并行處理體系結構、神威藍光超算采用了大規(guī)模并行處理體系結構、天河一號采用了多陣列可配置協(xié)同并行體系結構、天河二號采用了自創(chuàng)的新型異構多態(tài)體系結構。此外,互聯(lián)網(wǎng)絡、存儲、系統(tǒng)軟件、應用軟件、電源和冷卻等系統(tǒng)都對超算的性能有著重要的影響,所以超算的世界里沒有最快,只有更快。

  Green500 超算界針對能效的排行榜

  “節(jié)能環(huán)保是衡量超算的另一指標。超算中心是高性能計算機的規(guī)模應用,功率密度高,且長期運行在高負荷率條件下,耗能極高。通過優(yōu)化軟硬件配置確實能降低一部分功耗,但最根本源頭是要研發(fā)計算性能優(yōu)異且超低功耗的高性能處理器。目前,如何實現(xiàn)低能耗的超算是全球科學家研究的熱點問題。” 范洪輝告訴記者。

  牛杰介紹,超算界還有一種被稱為“Green500”的排行,就是以計算機每瓦功耗可以提供的計算速率為指標,針對超級計算機能效的排行榜。

  從歷年的評測結果來看,刀片服務器一般比集群式服務器更節(jié)能,被廣泛使用在超算系統(tǒng)中。Green500排名靠前的前三大系統(tǒng)都采用了PEZY加速器,而前十大的其余系統(tǒng)則使用NVIDIA GPU作為加速器。其中,PEZY系統(tǒng)采用的是液體冷卻方式,也就是說,整個系統(tǒng)浸沒在液體中,這比透過板載空氣或水更具有節(jié)能效率。

  超算深騰7000可以實時定位計算機的熱源分布和結構特點,采用取消全部風扇、在每套機柜內(nèi)安裝噴淋蒸發(fā)冷卻循環(huán)系統(tǒng)的方法,完成了產(chǎn)品的實施。該項目與傳統(tǒng)的風冷、水冷技術相比,具有冷卻效率高、溫度分布均勻、低噪音、低功耗、可靠性高等優(yōu)點。

  相對風冷,中國的“神威藍光”超算中心,利用復雜的水冷系統(tǒng),實現(xiàn)CPU、內(nèi)存、元器件的冷卻并帶走熱量,幾乎不損耗水且無噪音,先進環(huán)保,就像三明治夾心,水冷板被緊緊地夾在兩塊CPU板中間,無縫同步散熱。

  如何讓超算實現(xiàn)低能耗?柴志雷認為,低功耗計算也是超級計算機研制的重要方面,從芯片制造、架構設計、軟件設計多個層次都需要做大量的工作。比如在架構設計上,可以通過增加異構加速單元,提升系統(tǒng)的能效比。

  范洪輝提出,重點應降低每個部件的耗能,尤其是CPU的能耗。同時要改善存儲器件的設計,減少數(shù)據(jù)行進的距離;讓高性能存儲器向三維擴展而不是朝二維延伸;超算要與閃存結合,來改變電壓或頻率等節(jié)省功率;其次,可以采用包括能模擬大腦內(nèi)神經(jīng)元操作的神經(jīng)形態(tài)電路或量子計算模式,創(chuàng)造出新型的計算機,比如生物計算機和量子計算機。

  令人欣慰的是,我國正在通過多方面發(fā)力,讓超級計算機更節(jié)能環(huán)保。例如,曾獲中國專利獎優(yōu)秀獎的“基于物聯(lián)網(wǎng)技術的數(shù)據(jù)中心動力環(huán)境監(jiān)測系統(tǒng)”,采用超低功耗的無線數(shù)據(jù)采集技術、三維建模及虛擬仿真技術、智能分析技術等,有效消除了機房內(nèi)局部熱點,解決了功耗特別大的難題,實現(xiàn)超算中心安全穩(wěn)定和節(jié)能的目標。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權者。如涉及作品內(nèi)容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:[email protected]