在全球超級計算領域的激烈競爭中,中國的“神威·太湖之光”曾憑借其卓越性能,連續(xù)四次榮登世界超算TOP500榜首,成為國家科技實力的重要象征。它不僅是一臺運算機器,更是中國在核心芯片與系統(tǒng)軟件自主研發(fā)道路上的里程碑。本文將深入探秘其背后的軟硬件研發(fā)故事與技術突破。
一、硬件基石:從“申威”處理器到自主互聯(lián)架構
“神威·太湖之光”的核心驅動力,是其搭載的40,960顆中國自主研發(fā)的“申威26010”眾核處理器。這款處理器采用獨特的片上融合眾核架構,單個處理器集成了260個計算核心,實現(xiàn)了極高的計算密度和能效比。其設計摒棄了單純依賴商用IP核的路徑,從指令集架構到微結構實現(xiàn)均堅持自主創(chuàng)新,確保了在核心技術上的自主可控。
在系統(tǒng)互聯(lián)方面,研發(fā)團隊構建了高帶寬、低延遲的自主網絡——“神威網絡”。它采用層次化、可擴展的拓撲結構,有效支撐了千萬核心規(guī)模下的高效并行計算,解決了超大規(guī)模系統(tǒng)通信的瓶頸問題。整機系統(tǒng)通過創(chuàng)新的水冷技術進行冷卻,在實現(xiàn)每秒12.5億億次峰值計算性能的保持了優(yōu)異的能效表現(xiàn)。
二、軟件靈魂:適配自主硬件的系統(tǒng)生態(tài)構建
硬件的高性能必須通過軟件才能釋放。為此,研發(fā)團隊打造了一整套與之深度適配的軟件棧。
首先是“神威睿智”操作系統(tǒng)。這是一個基于Linux深度定制的高性能計算操作系統(tǒng),針對申威處理器架構進行了大量優(yōu)化,并強化了大規(guī)模作業(yè)調度、系統(tǒng)容錯與安全管理能力。
在編譯與編程環(huán)境方面,團隊研發(fā)了支持自主指令集的編譯器、數(shù)學函數(shù)庫及并行調試工具。尤為重要的是,他們開發(fā)了適應眾核架構的并行編程模型和框架,幫助科研人員將應用高效地映射到海量計算核心上,降低了國產平臺的使用門檻。
三、應用驅動:軟硬件協(xié)同釋放算力潛能
“神威·太湖之光”的成功,最終體現(xiàn)在其對重大科學和工程問題的解決能力上。其軟硬件研發(fā)始終以應用需求為導向。在氣候模擬、航空航天、生物醫(yī)藥、新材料設計等領域,國家超算無錫中心與各領域科學家緊密合作,對關鍵應用進行深度優(yōu)化與并行化改造,誕生了多項獲得“戈登·貝爾獎”提名的突破性應用。例如,其曾成功完成高達千萬核心規(guī)模的全球大氣動力學模擬,驗證了系統(tǒng)極致的可擴展性與穩(wěn)定性。這種“應用-系統(tǒng)-芯片”的協(xié)同創(chuàng)新與迭代模式,構成了其成功的閉環(huán)。
四、啟示與展望:自主之路的傳承與演進
“神威·太湖之光”的研發(fā)歷程證明,在超算這樣的戰(zhàn)略領域,堅持全技術鏈的自主創(chuàng)新是可行且必要的。它不僅提供了強大的算力,更錘煉了一支涵蓋芯片、體系結構、系統(tǒng)軟件、應用優(yōu)化的完整研發(fā)隊伍,積累了寶貴的技術體系與工程經驗。
如今,新一代的E級(百億億次)超算競賽已經開啟。從“神威·太湖之光”中孕育的技術積累與人才團隊,正繼續(xù)向著更先進的自主處理器架構、更智能的算力調度與編程模型、更廣闊的人工智能與科學計算融合應用邁進。它的故事,是中國超算從“跟跑”“并跑”到在某些方面實現(xiàn)“領跑”的生動縮影,其承載的自主創(chuàng)新精神,將持續(xù)照亮中國高端計算基礎設施的未來發(fā)展之路。