高(gāo)性能計算集群解決方案

需求分析

某單位高(gāo)性能計算群集的(de)需求覆蓋了前處理(lǐ)、并行(xíng)仿真和(hé)後處理(lǐ)全部業務流程,其中: 

Ø 高(gāo)性能計算應用需求

l CAE、CFD仿真應用,如(rú)Fluent、CFX、TracePro等,命令行(xíng)和(hé)圖形界面兩種模式; 

l 仿真前後處理(lǐ)應用如(rú)Ensight、ICEMCFD等; 

l 網格剖分一(yī)般為(wèi)千萬級,最大為(wèi)上億,遠程交互操作必須保證流暢;

l 必須同時支持Linux和(hé)Windows XP版本的(de)仿真前後處理(lǐ)應用。 

Ø 前後處理(lǐ)一(yī)體化需求

l 用戶可(kě)以從工作室的(de)桌面PC上通過遠程可(kě)視(shì)化的(de)方式使用機(jī)房裏的(de)圖形工作站,進行(xíng)仿真前後處理(lǐ); 

l 從桌面PC可(kě)以調用高(gāo)性能集群資源軟件接口,提交作業到高(gāo)性能集群中,進行(xíng)批處理(lǐ)和(hé)交互式CAE、CFD仿真計算; 

l 桌面PC作為(wèi)仿真計算和(hé)前後處理(lǐ)門戶,用戶在同一(yī)個桌面PC上就可(kě)以完成CAE、CFD的(de)全流程工作; 

l 仿真計算和(hé)前後處理(lǐ)在桌面PC的(de)操作流程無縫整合,實現仿真和(hé)前後處理(lǐ)一(yī)體化; 

l 一(yī)個桌面PC可(kě)以同時使用機(jī)房裏的(de)多個Linux和(hé)Windows XP機(jī)器進行(xíng)仿真計算和(hé)前後處理(lǐ)工作,并能夠靈活切換當前工作桌面; 

l 可(kě)根據不同應用的(de)資源需求和(hé)當前工作站的(de)負載情況,挑選最合适的(de)圖形工作站進行(xíng)仿真前後處理(lǐ),實現工作站集群的(de)負載均衡;

l 用戶可(kě)以快捷地(dì)把PC桌面發布到三維投影系統,投射到三維投影幕牆上; 

l 用戶可(kě)以把當前工作桌面共享給其他幾個用戶的(de)桌面PC,并提供操作權限,從而實現多個小團隊的(de)交互式協同工作; 

l 用戶進行(xíng)網格剖分的(de)結果可(kě)以直接提交到高(gāo)性能仿真集群中進行(xíng)并行(xíng)計算,在服務器端形成前處理(lǐ)-CAE/CFD仿真計算-後處理(lǐ)整個工作流程的(de)閉環; 

l 為(wèi)保證數據安全,所有(yǒu)設計模型和(hé)仿真數據和(hé)文件都保存在機(jī)房的(de)共享存儲上,不能任意下載;

l 管理(lǐ)員可(kě)以通過桌面PC完成工作站集群的(de)管理(lǐ)工作。 

l 資源外部共享需求

l 能夠提供接口,将部分集群計算資源和(hé)許可(kě)證資源共享給外部環境使用。

Ø 3D投影需求 

l 作為(wèi)投影系統,要求具有(yǒu)大屏幕無縫拼接顯示、高(gāo)分辨率、高(gāo)亮(liàng)度、高(gāo)信号帶寬、高(gāo)可(kě)靠性、人性化使用、低(dī)噪聲、低(dī)維護複雜度和(hé)低(dī)維護成本等指标和(hé)功能。通過主動3D投影機(jī)搭載3D融合器在屏幕上呈現色彩亮(liàng)度一(yī)緻的(de)整幅圖像,形成逼真的(de)立體視(shì)覺和(hé)觸手可(kě)及的(de)體驗; 

l 使用畫面分割器實現1屏、4屏、16屏3D投影的(de)模式切換; 

l 通過融合器實現多通道(dào)無縫拼接情況下的(de)多窗口顯示,顯示的(de)窗口可(kě)以全屏任意變化位置、大小和(hé)其它重要參數;

l 大屏幕系統的(de)安裝和(hé)設置應美觀大方,與系統周圍環境、裝修和(hé)設備布置協調;滿足在仿真室內(nèi)沒有(yǒu)視(shì)角盲區并且顯示效果良好;

l 系統能顯示多種信息信号,包括二維平面仿真圖形信号和(hé)三維立體仿真圖形信号;在整個大屏設計時充分考慮操作的(de)靈活性,使得信息可(kě)以根據需要靈活切換、靈活地(dì)以任意大小在任意位置顯示,既可(kě)以根據預先設定的(de)規則自(zì)動設置,也可(kě)以在某些情況下手動操作顯示特定的(de)信息;功能豐富、操作靈活簡便、運行(xíng)穩定;

l 整套3D投影系統具有(yǒu)可(kě)靠性、先進性、易維護性、實用性和(hé)可(kě)擴展性。 

Ø 仿真計算需求

l 管理(lǐ)和(hé)調度100個節點左右的(de)高(gāo)性能計算集群 

l 支持大規模CFD、CAE等仿真 

l 支持多種調度策略和(hé)管理(lǐ)手段

l 支持實時資源監控和(hé)多維度報表分析

針對用戶高(gāo)性能計算和(hé)前後處理(lǐ)的(de)應用需求,我們建議采用XXX整合圖形服務器和(hé)高(gāo)性能計算資源,形成一(yī)個前後處理(lǐ)和(hé)仿真計算一(yī)體化平台。該平台主要提供以下服務:

l 前後處理(lǐ)遠程可(kě)視(shì)化:從桌面PC通過遠程可(kě)視(shì)化使用機(jī)房的(de)圖形服務器,進行(xíng)CFD/CAE有(yǒu)限元網格前後處理(lǐ);

l 批處理(lǐ)仿真計算:包括CFD(流體類仿真),CAE(結構強度、剛度、穩定性、動力響應、熱傳導、彈塑性等力學(xué)性能類仿真),電磁類仿真;

l 協同設計仿真優化:流體、結構、電磁等多目标、多學(xué)科(kē)的(de)協同仿真叠代優化;

l 基于圖形卡的(de)彈性計算:充分利用圖形服務器上圖形卡的(de)顯示功能與計算能力,同時提供仿真前後處理(lǐ)階段的(de)顯示功能與仿真階段的(de)計算能力。

該平台以服務器為(wèi)中心,将為(wèi)設計人員提供統一(yī)、高(gāo)效、安全、可(kě)靠的(de)大型前後處理(lǐ)平台和(hé)高(gāo)性能仿真計算平台;并在用戶使用和(hé)操作上實現一(yī)體化,用戶和(hé)系統管理(lǐ)員隻需要通過桌面PC機(jī),登錄同一(yī)個門戶,完成所有(yǒu)的(de)仿真前後處理(lǐ)、仿真計算和(hé)系統管理(lǐ)維護工作。同時,可(kě)以整合圖形服務器上的(de)CPU資源和(hé)GPU納入到計算過程中,提高(gāo)計算仿真計算能力,在實現軟、硬件資源最大程度的(de)共享的(de)同時,提供更高(gāo)的(de)安全性和(hé)便利性,最大程度地(dì)提高(gāo)IT投資回報,提高(gāo)設計人員和(hé)系統管理(lǐ)員的(de)工作效率。


解決方案

圖片1.png 

1、本次高(gāo)性能集群共分為(wèi)兩大區域,即為(wèi):機(jī)房區域與工作區區域。

2、高(gāo)性能集群共分為(wèi)4大計算資源池,即為(wèi):刀片計算資源池、胖節點資源池、GPU計算資源池、協同設計資源池。

3、高(gāo)性能集群其他節點有(yǒu):管理(lǐ)節點、許可(kě)節點、報表節點、門戶節點、登錄節點、I/O節點、存儲節點等。

4、I/O節點與存儲節點采用并行(xíng)文件系統。

5、高(gāo)性能集群網絡分為(wèi)infiniband網絡(計算)和(hé)千兆以太網絡(管理(lǐ))。

6、高(gāo)性能集群軟件為(wèi)景行(xíng),協同調度各個節點。

7、投影設備采用BARCO等。