OpenStack柏林峰會，這些關於HPC、GPU、AI的演講不容錯過

阿新 • • 發佈：2018-12-18

11月，OpenStack峰會將在柏林召開，其中200多個由用例組成的會議涵蓋：人工智慧和機器學習、高效能運算、邊緣計算、網路功能虛擬化、容器基礎設施以及公有/私有和多雲戰略。

在這裡，重點介紹一些關於HPC、GPU和AI的會議。

The AI Thunderdome：Using OpenStack to accelerate AI training with Sahara，Spark and SwiftRed Hat的Sean Pryor說，OpenStack非常適合大資料問題。他將談論如何使用Swift和Ceph，資料儲存比以往更容易。大資料領域中最重要的問題之一是使用AI來理解不斷增加的資料量。OpenStack使這成為一個可解決的問題：儲存在Swift中的資料可以由Sahara叢集訪問，該叢集可以使用GPU例項來加速並行AI引數調優。

這種能力允許使用者只需一小部分手動工作就可以完成大型AI的訓練——這不就是雲的全部內容嗎？

NASA Goddard Private Cloud: Genesis and lessons learned2016年秋季，美國宇航局戈達德的NASA氣候模擬中心（NCCS）和資訊科技與通訊局（ITCD）開始合作，使用從NCCS的傳統HPC叢集Discover回收的硬體為整個Goddard社群提供內部私有云。2018年10月，GPC正在按計劃生產就緒（執行Queens），但是在Mitaka的原型環境中有超過30個專案（並且還在增加！）。

來自美國宇航局的Mike Moore將描述所遇到的挑戰以及在此過程中設計的創新解決方案，包括：遙測/計費、資料保護/災難恢復、安全性、“雲化”工作負載、容器以及指導HPC使用者轉向雲端計算。

Monitoring-as-a-Service in HPC Cloud當應用程式遷移到雲時，第一步是在軟體定義的基礎設施上重新建立相同的平臺。這並不符合雲的真正潛力。一旦雲使用者意識到可用的強大API和服務，OpenStack基礎設施就可以提供更多功能。

在本次演講中，StackHPC Ltd.的Stig Telfer和Verne Global的Darryl Weaver將介紹如何將HPC雲遷移提升到新的水平。他們將展示Monasca服務的整合，以便監控和記錄以效能為中心的部署。他們將展示如何為所有使用者解鎖最佳效能遙測，以及如何為使用者和管理員提供理解和優化其應用的新機會。

Cyborg：Accelerate your cloud

隨著資料中心工作負載逐漸變得越來越計算密集型，對加速器的需求也越來越大。有各種各樣的加速器，包括GPU、FPGA、ASIC和工作負載特定的加速器，如TPU。OpenStack中的Cyborg專案旨在簡化這些不同加速器型別的採用和生命週期管理。

英特爾的Sundar Nadathur稱，Cyborg和Nova開發者已經建立了一個架構，可以解除安裝到各種加速器。該架構包括FPGA，它對程式設計和位元流管理有獨特的需求。這個演講將介紹一般的解除安裝到器件的用例、FPGA的程式設計模型以及Placement中器件（包括FPGA）的表示。Nadathur將密切關注需要加速器的例項的排程。他將詳細介紹os-acc的架構——這是用於Nova與Cyborg互動的庫。最後將介紹Cyborg開發的現狀。

原文連結：

http://superuser.openstack.org/articles/inside-hpc-gpu-ai-must-see-sessions-at-the-berlin-summit/

內容覆蓋主流開源領域