OpenStack柏林峰會,這些關於HPC、GPU、AI的演講不容錯過
11月,OpenStack峰會將在柏林召開,其中200多個由用例組成的會議涵蓋:人工智慧和機器學習、高效能運算、邊緣計算、網路功能虛擬化、容器基礎設施以及公有/私有和多雲戰略。
在這裡,重點介紹一些關於HPC、GPU和AI的會議。
The AI Thunderdome:Using OpenStack to accelerate AI training with Sahara,Spark and SwiftRed Hat的Sean Pryor說,OpenStack非常適合大資料問題。他將談論如何使用Swift和Ceph,資料儲存比以往更容易。大資料領域中最重要的問題之一是使用AI來理解不斷增加的資料量。OpenStack使這成為一個可解決的問題:儲存在Swift中的資料可以由Sahara叢集訪問,該叢集可以使用GPU例項來加速並行AI引數調優。
NASA Goddard Private Cloud: Genesis and lessons learned2016年秋季,美國宇航局戈達德的NASA氣候模擬中心(NCCS)和資訊科技與通訊局(ITCD)開始合作,使用從NCCS的傳統HPC叢集Discover回收的硬體為整個Goddard社群提供內部私有云。2018年10月,GPC正在按計劃生產就緒(執行Queens),但是在Mitaka的原型環境中有超過30個專案(並且還在增加!)。
來自美國宇航局的Mike Moore將描述所遇到的挑戰以及在此過程中設計的創新解決方案,包括:遙測/計費、資料保護/災難恢復、安全性、“雲化”工作負載、容器以及指導HPC使用者轉向雲端計算。
Monitoring-as-a-Service in HPC Cloud當應用程式遷移到雲時,第一步是在軟體定義的基礎設施上重新建立相同的平臺。這並不符合雲的真正潛力。一旦雲使用者意識到可用的強大API和服務,OpenStack基礎設施就可以提供更多功能。
在本次演講中,StackHPC Ltd.的Stig Telfer和Verne Global的Darryl Weaver將介紹如何將HPC雲遷移提升到新的水平。他們將展示Monasca服務的整合,以便監控和記錄以效能為中心的部署。他們將展示如何為所有使用者解鎖最佳效能遙測,以及如何為使用者和管理員提供理解和優化其應用的新機會。
Cyborg:Accelerate your cloud
英特爾的Sundar Nadathur稱,Cyborg和Nova開發者已經建立了一個架構,可以解除安裝到各種加速器。該架構包括FPGA,它對程式設計和位元流管理有獨特的需求。這個演講將介紹一般的解除安裝到器件的用例、FPGA的程式設計模型以及Placement中器件(包括FPGA)的表示。Nadathur將密切關注需要加速器的例項的排程。他將詳細介紹os-acc的架構——這是用於Nova與Cyborg互動的庫。最後將介紹Cyborg開發的現狀。
原文連結:
http://superuser.openstack.org/articles/inside-hpc-gpu-ai-must-see-sessions-at-the-berlin-summit/
內容覆蓋主流開源領域
投稿郵箱