1. 程式人生 > 資訊 >算力新高峰,華為雲 C7 旗艦伺服器實測

算力新高峰,華為雲 C7 旗艦伺服器實測

最近,華為雲全新一代旗艦雲伺服器 C7 正式轉商,該款雲伺服器得益於華為雲擎天架構能力加持,同時搭載全新的第三代英特爾 ® 至強 ® 可拓展處理器(代號:Ice Lake)。整體計算效能相比於上一代產品算力有 50% 的提升,如今,算力在數字經濟時代作為一項基本的資源,算力的提升對整個業務能力的提升帶來了巨大的影響。

對於企業來講,業務上雲已經是普遍的共識,雲伺服器相比傳統的伺服器有著配置簡單、擴充套件靈活、穩定性好、價效比高、安全可靠、高效管理等優點,可以滿足企業快速發展的業務需求,也可以根據業務實際需求進行鍼對性的選配。

目前不少的網際網路或硬體大廠都在進行著自家雲伺服器的銷售,本質上也是從自己業務的需求中慢慢形成的穩定可靠的解決方案,這些雲伺服器產品涵蓋了企業日常運營所遇到各種場景需求。

華為雲全新的 C7 雲伺服器隸屬於華為雲通用計算增強型雲伺服器,也是華為雲的旗艦產品,代表卓越的效能和超高的穩定性,目前已經正式開放商用,接下來我們來看一下華為雲通用計算增強型雲伺服器 C7 的各項表現如何。

一、 平臺介紹

目前,華為雲通用計算增強型 C7 系列(以下簡稱“華為雲 C7”)通用計算增強型伺服器已經正式商用,選配過程整體非常簡單,根據自己的業務規模進行選擇。

華為雲 C7 搭載第三代英特爾 ® 至強 ® 可擴充套件處理器,其基準頻率為 3.0GHz,睿頻頻率為 3.5GHz。提供 1:2 和 1:4 兩種核心記憶體比的伺服器配置選擇,其中,處理器可選 2 到 128 核,記憶體可選 4 到 512GB。共有共計 22 種型號可供選擇,最大收發包能力達到單向 1200 萬 PPS,最大內網頻寬可以達到 40Gbps。

相比於此前的華為雲 C6 或是華為雲 C3 產品,這次華為雲 C7 所支援的最大處理器核心數和記憶體數都得到很大的提升,此前基於第二代英特爾至強可擴充套件處理器的華為雲 C6 最大核心數為 64 核,最大記憶體為 256GB。

記憶體上,華為雲 C7 在原先 6 通道、2933MHz 基礎上提升到 8 通道、3200MHz,程式訪問記憶體的效率大大提升。

通過平臺硬體引數我們看到,華為雲 C7 更加適合重負載、對計算和網路要求非常高的應用場景,比如大型的電商平臺、線上遊戲、短視訊、保險金融等業務場景,這些場景往往存在突發性的大流量、高頻率、重負載操作,這對雲伺服器的響應速度非常高,並且,更加靈活彈性的雲服務擴容與快速部署就顯得尤為重,顯然華為雲 C7 更加適合應對這樣的場景。下來,我們通過具體的測試場景,來看一下華為雲 C7 的表現。

二、 處理器與記憶體表現

首先我們來看一下處理器與記憶體的表現,華為雲 C7 使用了第三代英特爾 ® 至強 ® 可擴充套件處理器,這裡選擇了 32 核 64GB 版本進行測試。這裡我們通過 Geekbench 3 對華為雲 C7 處理器進行測試。

這裡我們看到,華為雲 C7 使用的處理器採用 16 核 32 執行緒設計,對應 48MB 三級快取。

此次測試均在 CentOS 8.2 系統環境下進行,我們通過 Geekbench 3 跑分來看一下其處理器表現。測試資料如下:

我們看到,華為雲 C7(32U64G)單核整型得分為 5011 分,單核浮點型得分為 4397 分,多核整型得分 91386 分,多核浮點型得分 91063 分。得益於強大的睿頻能力,華為雲 C7 表現非常強勁,單核效能有著非常大的提升。

接下里我們通過 stream 記憶體測試工具對華為雲 C7 進行記憶體表現的專門測試,stream 記憶體測試工具支援記憶體的 Copy、Scale、Add、Triad 四種操作。這四種操作分別對應著記憶體的不同資料操作模式,Copy 它先訪問一個記憶體單元讀出其中的值,再將值寫入到另一個記憶體單元。Scale 操作先從記憶體單元讀出其中的值,作一個乘法運算,再將結果寫入到另一個記憶體單元。Add 操作先從記憶體單元讀出兩個值,做加法運算,再將結果寫入到另一個記憶體單元。Triad 的表示將 Copy、Scale、Add 三種操作組合起來進行測試。

通過連續的 10 次測試對華為雲 C7 的記憶體表現進行測試,測試編譯程式碼如下:

gcc-O3-fopenmp-DSTREAM_ARRAY_SIZE=64000000-DNTIMES=10stream.c-ostream

測試資料如下:

通過測試結果我們看到,華為雲 C7 有著非常強悍的記憶體比效能表現,其 Copy 操作效能接近 138GB/s,Scale 操作效能在 95GB/s 上下,Add 和 Triad 操作系能在 1100GB/s 上下,由於華為雲 C7 支援 3200MHz 八通道高頻率記憶體,因此實際記憶體的操作速度相比於此前產品有著非常大的提升,這對於大量資料的快速處理尤為重要。接下里,我們來看一下華為雲 C7 產品的內網表現。

三、 內網表現

通過虛擬化技術,雲伺服器提供商可以靈活的進行網路頻寬分配、IP 地址與子網劃分、安全組部署等操作,企業也可以選擇彈性頻寬和彈性 IP 搭建業務,大規模叢集式的伺服器對內部網路頻寬和收發包能力要求更高,畢竟這類大規模伺服器叢集往往要共同應對突如其來的重負載需求,彼此之間的資料傳遞速度就顯得非常重要。這裡使用 netperf、iperf 分別對華為雲 C7 內網的頻寬、收發包能力進行測試,通過內網同規格配置的 4 臺陪練機作為客戶端進行打流等操作。

除了更低的時延水平,大規模伺服器部署還需要更大的內網頻寬和收發包能力,這裡我們使用兩臺同規格的陪練機同時對測試機的 32 個埠進行打流,首先,我們通過 netperf 來看一下華為雲 C7 內網頻寬接收能力。根據華為雲官網的資料,華為雲 C7 最高配置的內網頻寬可以達到 42Gbps,選配的 32 核 64GB 規格最大內網頻寬為 30Gbps。

測試機執行口令如下:

netperf-pport&#7001-7032埠為測試埠

陪練機執行口令如下:

netperf-Hserverip-pport-tTCP_STREAM-l120---m1440&#serverip為測試機內網IP,port為對應測試介面

然後我們通過 sar 口令檢視打流資料的平均值,測試結果如下:

通過測試我們看到,華為雲 C7 測試情況下內網平均頻寬基本跑滿了 30Gbps 的內網頻寬,強大的內網頻寬可以在單位時間內進行更大的資料交換。以此實現更大的資料處理能力。接下來,我們通過 iperf 工具對華為雲 C7 內網收發包能力進行測試,內網收發包是衡量雲伺服器內網效能的一項重要的指標,這一指標指的是內網每秒傳送包數量,這裡我們依舊使用四臺陪練機進行打流,測試機執行口令如下:

iperf3-s-pport>/dev/null2>&1&#5001-5032埠為測試埠

陪練機執行口令如下:

iperf3-c-b0M-u-t120-l16-pport>/dev/null2>&1&#serverip為測試機內網IP,port為對應測試介面

測試結果如下:

通過測試我們看到,華為雲 C7 單向 PPS 接收約為 550 萬 PPS,屬於非常不錯的水平,強大的內網收發包能力,可以高效的應對重負載應用的資料傳輸需求。接下里,我們通過真實的場景需求來對華為雲 C7 的能力進行測試。

四、 場景測試

一款好的伺服器不光要關注效能指標,同時真實場景的表現對於伺服器優劣的權衡尤為重要,作為華為雲 ECS 的旗艦產品,這裡通過 ffmpeg 轉碼、memcached 物件快取工具、redis 字典服務工具、HTTP 壓力測試工具 wrk 對華為雲 C7 進行場景化的測試。

ffmpeg

ffmpeg 作為一款開源的音視訊編解碼工具,受到不少使用者追捧,它強的的視訊採集、格式轉換、視訊抓圖、加水印能力也深受不少人的喜愛。如今,隨著雲伺服器的普及,不少專業視訊製作人也選擇將視訊檔案推到雲伺服器上,利用雲伺服器強大的算力進行編碼壓制。

這裡使用華為雲 C7(32U64G)對 2GB 的視訊檔案進行重新編碼,結果如下:

通過測試資料我們可以看到,華為雲 C7(32U64G)將 2GB 視訊檔案進行轉碼時用了 4 分 49 秒,總共 62052 幀的視訊處理速度達到了 214 幀/秒。通過華為雲 C7 強大的算力,視訊轉碼時間也得到大幅度的壓縮。

redis

redis 是現階段不少開發者選擇的非關係型資料庫,它遵守 BSD 協議,完全開源。相比於其他 key-value 快取產品,其支援資料持久化,除了 key-value 型別資料,它還提供 list、set、zset、hash 等資料結構儲存。另外,極高速的讀寫能力,給 redis 帶來了非常大的資料交換能力,它的核心包含三部分,分別是記憶體儲存、磁碟儲存和 log 檔案,通過記憶體載入資料取用極大的提高了讀取速度,並且節約伺服器開銷。

Redis 自帶效能測試工具,這裡使用 redis-benchmark 工具,通過兩臺配置相同的華為雲 C7(32U64G)進行測試。這裡通過 1000000 次的資料處理對 redis 的 SET、GET、SADD、MSET 操作來檢測效能表現,客戶機測試口令如下:

./redis-benchmark-hredis-serverip-p6379-n1000000-c100-tset,get,sadd,mset-d1#redis-serverip為測試機的實際內網IP

測試資料如下:

▲ SET 測試結果

▲ GET 測試結果

▲ SADD 測試結果

▲ MSET 測試結果

通過測試資料我們看到,華為雲 C7 強大的記憶體表現以及算力為 redis 服務帶來了強大的效能支撐,每秒資料處理能力達到 15.5 萬次。

其中,SET 超過 99% 的操作在 0.7 毫秒內完成,GET、SADD、MSET 超過 99% 的操作在 1 毫秒內完成,巨大的資料處理能力讓我們看到華為雲 C7 強大的算力支援和高速的記憶體保障。

Memcached

Memcached 是一款分散式快取記憶體系統,相比於 redis,memcached 將資料全部存在記憶體中,斷電會丟失,因此無法做到持久化支援,另外 memcached 支援的資料型別也會更少一些。

當然,memcached 還支援快取其他媒體檔案,比如圖片、視訊等。對於一些小檔案、低頻寬場景下的傳輸,顯然 memcached 更加合適,為了更加有效的利用記憶體資源,memcached 會採用分散式記憶體物件快取技術進行記憶體上的擴充套件,以此得到更多的記憶體資源。

Memcached 自帶了了 memaslap 壓力測試工具用於測試伺服器與伺服器之間的快取記憶體效能,這裡我們通過 3 臺同規格的華為雲 C7(32U64G)進行伺服器之間快取記憶體效能測試,其中 1 臺為測試機,另外兩臺為客戶機。測試機開啟 11210 到 11226 總共 16 個埠進行測試,兩臺客戶機分別向 8 個埠進行壓力測試。

測試機口令:

memcached-uroot-d-pport#port為埠號

客戶機口令:

memaslap-sserverip:port-t60s-T16-c800-X100B#serverip為測試機內網ip,port為埠號

客戶機 1 測試結果:

客戶機 2 測試結果:

我們看到,在 60 秒的測試時間內,兩臺客戶機總運算元超過 2.3 億條,測試機每秒的運算元最高可以超過 380 萬 TPS,這凸顯出分散式記憶體物件快取強大的處理能力。

wrk+nginx

nginx 是一款強大的 HTTP 和反向代理 web 伺服器,同時也支援電子郵件代理服務、負載均衡等功能,是現階段非常受歡迎的開源伺服器產品。其記憶體佔用少、併發能力強的特點,得到不少國內網際網路巨頭青睞。

HTTP 伺服器也是我們最容易接觸到的一種伺服器型別,畢竟我們的不少的網際網路瀏覽需求都是要通過 HTTP 伺服器的,比如雙 11 的商品的搶購,12306 春運購票等場景,能否抗住段時間大規模的流量帶來的壓力,也是衡量 HTTP 伺服器的一個重要標準。wrk 是一款簡單的 HTTP 壓力測試工具,它能利用很少的執行緒就實現非常大的併發量。

選擇兩臺華為雲 C7(32U64G)伺服器進行 nginx 和 wrk 的部署,其中部署 nginx 的為測試機,部署 wrk 的為客戶機。一般來講,wrk 壓測執行緒不宜過多,核心數的 2-4 倍即可,這裡選擇了 20000 條連線,64 執行緒進行測試,測試時間為 120 秒。

測試機命令:

./wrk-t64-c20000-d120sserver-address#server-address為HTTP伺服器地址

測試結果如下:

通過測試結果我們看到,華為雲 C7(32U64G)在 nginx 長連結情況下,2 分鐘內處理了 1.5 億次請求,平均每個執行緒時延為 23. 06 毫秒,整體上,單臺伺服器平均每秒處理近 130 萬條請求。

通過 ffmpeg、redis、memcached、wrk+nginx 四項場景化的測試我們看到,華為雲 C7 在處理器、記憶體、網路效能以及儲存上的突出效能表現,這很大程度來源於全新的硬體升級,通過理論測試和實際應用場景的體驗,我們能很明顯的感受到華為雲 C7 伺服器在理論與實際上的一致性。

總結

在雲端計算領域,華為一直以來都在進行大量的技術儲備,以此不斷提升華為所有云服務產品的硬體可靠性,擎天架構為華為雲帶來了巨量的算力提升,通過擎天架構能力加持,華為雲通用計算增強型雲伺服器 C7 整機算力提升 50%,另外八通道 3200MHz 記憶體的支援,也讓華為雲 C7 在資料傳輸上的表現更近一步。強大的內網吞吐能力和頻寬表現,更輕鬆應對大規模的業務叢集部署。

對於企業而言,華為雲 C7 雲伺服器產品更加適合中重負載的使用場景,特別突發性的大規模高併發場景,這些業務包括短視訊、電商網站、大型遊戲、金融保險等行業需求。華為雲的諸多基礎服務已經全面滲透華為雲旗下的諸多產品服務,華為雲在全球範圍內 CDN 覆蓋 2500 個節點,通過 AI-Cache 的智慧快取可進一步提升命中率,全網安全傳輸防盜鏈可用性更是達到 99.9%。在雲資料庫產品上,華為雲 GaussDB(for MySQL)則提供極高的可靠性,TPCH 測試效能是開源版本的 34 倍並提供秒級告警監控,支援跨 AZ 部署,保證資料零丟失。

如今,隨著工業網際網路的興起,越來越多的工業和行業全面進入數字化、智慧化、網路化的變革之中,華為雲在數字工廠的建設中,可進一步實現生產透明可視,為中小製造企業賦能。AI 能力上,華為提供盤古大模型,將以往作坊式的 AI 開發轉變為工業化 AI 開發,大大縮短 AI 開發週期。另外華為鴻蒙生態的發展配合華為雲這一基礎設施,可以全面覆蓋 C 端和 B 端全場景。

目前華為雲 C7 產品已經開放購買,現在加入或許能為未來的業務需求帶來更好、更穩定的應用體驗。