服務器

波尔多对马赛:HPC CHINA 2019:面向E級計算時代的HPC/AI協同設計

廣告
廣告

微信掃一掃,分享到朋友圈

HPC CHINA 2019:面向E級計算時代的HPC/AI協同設計
0 0

藍天飄白云,牧場奶茶香。蒙古大營雄風在,琴聲傳遠方。騎馬又滑沙,豪飲河套王。敖包相會歌一曲,笑發少年狂。

中國一年一度高性能計算領域的盛會——全國高性能計算學術年會(HPC CHINA 2019)在內蒙古呼和浩特盛大開幕!

本屆大會由中國計算機學會主辦,中國計算機學會高性能計算專業委員會、內蒙古和林格爾新區管理委員會、清華大學和內蒙古大學共同承辦,北京并行科技股份有限公司協辦。以“計算 見智 贏未來”為主題,聚焦E級計算機研制挑戰、HPC重大應用等主題展開,匯聚業界前沿學術與應用動態。

此次大會,行業各界頂級人才齊聚一堂,共同探討HPC系統在大數據、人工智能、E級計算、航空航天等領域的應用趨勢和融合發展。參會人數超過2500名,參展科研院所及企業50余家,特邀報告及主題演講總共21場,論壇會議將近50場。

如今,HPC和AI系統正在由以CPU為核心向以數據為核心轉變,CPU/GPU計算、網絡計算和存儲計算的協同設計將會是通往E級高性能HPC和AI計算中心的必經之路。網絡和存儲正在變成分布式的CPU和分布式的內存,成為分布式計算單元的一部分。這個轉型解決了舊的HPC和AI系統存在的瓶頸問題,為實現更高性能及更大規模的系統提供了新的思路和方案。

在本屆大會上,由國際高性能咨詢委員會組織的“面向E級計算時代的HPC/AI協同設計”的專場論壇邀請到了國內外的頂級公司來分享他們在由CPU為核心向以數據為核心轉變過程中的心得和體會,以及他們如何利用他們的創新技術來應對轉型過程中的各種挑戰。

首先是國際高性能計算和人工智能咨詢委員會主席Gilad Shainer為我們帶來了開場致辭。他介紹了目前國際高性能計算的發展情況,并表示HPC和AI采用相似的技術以及基礎架構,在高校、研究型實驗室和商業機構中發揮著重要作用。HPC和AI技術能夠幫助它們開發面向未來的產品和服務,進而改善人們的生活。

國際高性能計算和人工智能咨詢委員會主席Gilad Shainer

接下來由中國科學院計算機技術研究所研究員、國家超級計算濟南中心主任張云泉為我們分享了中國高性能計算力分析,表示高性能計算已經進入了大數據、超算、云計算和人工智能融合創新的算力經濟時代。

張老師帶來了四大觀察:觀察一:虛擬化云計算向高性能容器云計算的演進;觀察二:大數據與并行計算、機器學習的融合創新;觀察三:大數據與機器學習和并行計算的融合創新;觀察四:高性能計算與人工智能的融合創新。

  中國科學院計算機技術研究所研究員、國家超級計算濟南中心主任張云泉

我們得出超級計算的新應用:算力經濟。隨著超級計算技術的普及和成本大幅降低,其應用領域也從具有國家戰略意義的核武器研制、信息安全和高冷的科學計算領域向更廣泛的國民經濟主戰場快速擴張,近幾年其速度和應用出人預料。

在本場論壇中,來自AMD、Mellanox、焱融云、華為、清華同方等眾多著名公司的代表紛紛登臺,暢所欲言中國的HPC發展。

來自AMD中國區商用事業部服務器產品架構師唐峰進行了題為《通往最強超算的“羅馬大道”》的報告。

  AMD中國區商用事業部服務器產品架構師唐峰

據介紹,美國舊金山時間8月7日,AMD正式發布了第二代AMD EPYC(霄龍)系列處理器,第二代AMD EPYC處理器最高搭載64顆采用前沿的7nm制造工藝的“Zen 2”核心,帶來了創紀錄的性能表現,在多種工作負載下最高能將總體擁有成本(TCO)降低50%.

對于高性能計算領域,第二代AMD EPYC處理器提供了一個組合,包括:創紀錄的浮點性能,同類產品最高的DRAM內存和I/O帶寬,以實現超強的HPC負載;高達2倍的計算流體力學性能,以及最高可提升72%的結構分析性能。

在安全性方面,第二代AMD EPYC處理器提供了“硬核”芯片級嵌入式安全子系統,以及安全內存加密和安全加密虛擬化等高級安全功能,幫助客戶?;に親鈧匾淖什褪?。

來自Mellanox技術市場總監馮高鋒進行了題為《面向高性能E級機的關鍵-網絡計算技術》的報告。在以數據為中心的時代,我們的計算架構也需要變革,由此而誕生了各種新的計算技術,如網絡計算(In-Network Computing)、存儲計算等。

  Mellanox技術市場總監馮高鋒

網絡計算,是相對于CPU計算而言的。顧名思義,就是利用網絡來代替CPU處理某些計算工作,讓CPU的計算效率變得更高。通過網絡計算不僅可以解決通信瓶頸的問題,還可以將CPU和GPU的資源釋放出來,讓應用獲得更多的計算資源,從整體應用的性能上得以提升。

作為端到端的網絡設備提供商,Mellanox不光提供InfiniBand和以太網互連解決方案,還將網絡計算融入到自身的產品和方案中,實現無縫集成,通過將各種通信相關的計算從CPU卸載到網絡中來,提升計算效率,幫助企業應對數據挑戰。

HPC是Mellanox的傳統領域,但是現在HPC和AI呈現了融合趨勢,人工智能也被Mellanox鎖定為今后的重點領域。中國有很多合作伙伴正在使用Mellanox的InfiniBand和以太網高速網絡解決方案在實現深度學習或人工智能等技術。

接下來是來自焱融云產品總監黎俊鴻帶來了題為《基于YRCloudFile的AI基礎架構》的分享。焱融云是一家以軟件定義存儲技術為核心競爭力的高新技術企業,針對各行業業務特性,打造個性化行業解決方案,提供一站式的產品與服務。

  焱融云產品總監黎俊鴻

基于自研的分布式軟件定義存儲產品,焱融云為用戶提供了高效穩定的存儲服務,?;び沒蹲?。YRCloudFile是一款軟件定義的高性能分布式文件系統,YRCloudFile元數據集群可擴展,支持百億級海量文件,YRCloudFile的智能分層功能,可對接第三方對象存儲,將冷數據自動遷移至對象存儲層中,上層應用仍使用文件訪問接口,應用對數據分層無感知,智能分層實現了對數據生命周期的高效管理。

在傳統高性能計算( HPC )、生命科學、天氣分析預測、地質及石油勘探等需要對數據進行大規模分析和計算的場景中,YRCloudFile也可以發揮其高性能及海量小文件支持的特性和優勢。YRCloudFile提供全面的POSIX接口支持,可替換傳統的文件存儲,解決其性能瓶頸等問題,加快業務處理速度,極大降低總體成本。

來自華為2012LAB交換技術實驗室的何春志帶來了題為《RDMA在計算網絡中的應用》的分享。

  華為2012LAB交換技術實驗室的何春志

什么是RDMA技術?RDMA(Remote Direct Memory Access,遠程直接內存訪問)技術直接顛覆了傳統的TCP/IP的通信方式,可以直接從網絡的傳輸層將所有的通信相關的計算交由網卡設備來做,不需要CPU參與任何通信計算,甚至在整個通信過程中都不需要和CPU有任何溝通。

目前RDMA技術已經被廣泛使用到了各種不同的應用當中,如機器學習的各種框架、大數據分析應用、數據庫應用、存儲應用、HPC應用。

據介紹,RoCE是RDMA over Converged Ethernet的簡稱,是一種允許通過以太網使用遠程直接內存訪問(RDMA)的網絡協議。RDMA可繞過CPU和其他計算組件直接將網絡數據傳輸到內存中,不需要進行拷貝,從而提高效率?;詒曜家蘊腎P/UDP消息傳遞的一個主要架構問題是業務承載需要對報文進行排隊。

華為依靠獨創的AI芯片和智能無損交換算法,解決了當前以太網易丟包,吞吐率低的難題,引領數據中心網絡邁入AI時代,匹配AI業務的快速普及,助力客戶加速實現智能化轉型。

下一位演講者是同方超算產品高級總監周衛巖,他帶來了主題為《以數據為中心 同方服務器和高性能計算的核心》的分享。

  同方超算產品高級總監周衛巖

毋庸置疑,我們現在處于一個數據大爆炸的時代,數據無處不在,數據成為企業創新的重要來源。數據影響我們的行為,但是數據價值的實現并不是一蹴而就的,這需要在計算力的支撐下,通過一定的算法來實現。我們正在從CPU為中心到以數據為中心的改變。

據周衛巖介紹,在這樣的背景下,我們推出了超強G858系列服務器。同方超強G858采用新的服務器設計概念和技術,支持Intel Xeon Skylake-SP處理器,在處理器性能,總線帶寬,內存帶寬等方面均有質的飛躍,在PCIE數量,硬盤數量,網絡擴展等方面提供超強規格,適用于高性能計算(HPC)和大規模并行計算環境??曬惴河τ糜諶肆呈侗?,視頻分析,氣象研究與分析,大數據分析等應用場景。

本場分論壇的最后一位壓軸嘉賓是來自中國石油集團東方地球物理公司研究院的賴能和,他分享的主題是《PB級數據驅動高性能計算架構的轉變》。

  中國石油集團東方地球物理公司研究院的賴能和

高性能計算已經成為當下能源行業的主要IT應用模式,但隨著應用水平的不斷提升和軟件優化的逐步展開,在應用領域也面臨著許多挑戰。

賴能和表示,高性能計算和油氣勘探是密切不可分的。計算機40年的發展推動了油氣勘探發展的四大階段,從光電、全數字、全三維,到今天的高精度勘探,物探技術相互促進,油氣勘探實際上就是給地球的近地表做CT,計算量很大。

目前,高性能計算在勘探上的難點主要是四個方面,分別是計算能力提升、海量數據存儲、高性能并行架構優化和算法優化。過去,由于計算力不足,很多算法無法實現,隨著計算力的提升,高性能計算和人工智能已經融合到了一起。

賴能和舉例表示,在油氣勘探行業有一種算法是初至波,初至波拾取非常費人工,曾經有一個30T的數據,30多個人同時干也得需要60多天,全是重復勞動。有了人工智能+高性能計算以后,用機器拾取每一秒鐘就可以完成一千個點,速度得到了大幅提升,通過訓練以后能夠很好的提升生產效率。

寫在最后,15年來,全國高性能計算學術年會的足跡遍及大江南北,讓高性能計算薪火相傳。此次年會在呼和浩特市舉辦,將有力地促進內蒙古和林格爾新區步入大數據、人工智能等產業發展的快車道,形成大數據、高性能計算發展的良好生態環境,在支撐內蒙古自治區經濟和社會轉型發展中發揮關鍵性引領作用。

我還沒有學會寫個人說明!

電商訂單履約系統:你每天都在購物,卻對它一無所知

上一篇

媒體開放日,探秘百分點認知智能戰略!

下一篇

你也可能喜歡

HPC CHINA 2019:面向E級計算時代的HPC/AI協同設計

長按儲存圖像,分享給朋友

ITPUB 每周精要將以郵件的形式發放至您的郵箱


微信掃一掃

微信掃一掃