阿里云發(fā)布云數(shù)據(jù)中心處理器CIPU

6月13日,阿里云宣布推出云基礎(chǔ)設(shè)施處理器CIPU(Cloud Infrastructure Processing Unit ),這是為新型云數(shù)據(jù)中心設(shè)計的專用處理器,將替代CPU成為云時代IDC的處理核心。

6月13日,阿里云宣布推出云基礎(chǔ)設(shè)施處理器CIPU(Cloud Infrastructure Processing Unit ),這是為新型云數(shù)據(jù)中心設(shè)計的專用處理器,將替代CPU成為云時代IDC的處理核心。它可對計算資源進(jìn)行云化加速,并可部署飛天操作系統(tǒng)對云資源進(jìn)行管控。阿里云智能總裁張建鋒表示,云計算進(jìn)入了一個關(guān)鍵突破期,今年要Back to Basic,堅持在技術(shù)的長征路上,不斷取得突破。

阿里云發(fā)布云數(shù)據(jù)中心處理器CIPU

云基礎(chǔ)設(shè)施處理器CIPU(Cloud infrastructure Processing Units ),是阿里云為新型云數(shù)據(jù)中心設(shè)計的專用處理器,用于加速和管控計算資源,將替代CPU成為云時代IDC的處理核心。在這個全新體系架構(gòu)下,CIPU向下對數(shù)據(jù)中心的計算、存儲、網(wǎng)絡(luò)資源快速云化并進(jìn)行硬件加速,向上接入飛天云操作系統(tǒng),管控阿里云全球上百萬臺服務(wù)器。

1、CIPU的三大特性:

l 網(wǎng)絡(luò):對高帶寬物理網(wǎng)絡(luò)進(jìn)行硬件加速,通過建設(shè)大規(guī)模的eRDMA分布式高性能網(wǎng)絡(luò),實現(xiàn)RDMA技術(shù)的普惠化;

l 存儲:對存算分離架構(gòu)的塊存儲接入進(jìn)行硬件加速,提供超高性能的云盤;

l 計算:快速接入不同類型資源的神龍計算平臺,帶來算力的“0”損耗,以及硬件級安全的加固隔離。

2、為什么要有CIPU?

過去十多年,云計算技術(shù)發(fā)展經(jīng)歷了兩個階段:

l 第一階段是分布式技術(shù),推動互聯(lián)網(wǎng)企業(yè)從大機向分布式系統(tǒng)整個遷移;

l 第二階段誕生了資源池化技術(shù),通過計算存儲分離的架構(gòu),對資源統(tǒng)一的調(diào)度編排,提高云計算的可靠性和可用性。

這兩個階段都是以CPU為中心的計算體系架構(gòu),解決了部分計算的需求。但云上客戶的需求發(fā)生了巨大的變化,就像內(nèi)燃機發(fā)明之后,人類對載具速度的想象力從馬車時代進(jìn)入了汽車時代。

隨著數(shù)據(jù)密集型計算越來越多,傳統(tǒng)以CPU為中心的計算體系架構(gòu)無法適應(yīng)這一趨勢:

第一,以CPU為中心的架構(gòu)導(dǎo)致了計算和網(wǎng)絡(luò)傳輸?shù)臅r延大;

第二,大數(shù)據(jù)應(yīng)用增多,導(dǎo)致數(shù)據(jù)中心內(nèi)部數(shù)據(jù)遷移量增多,以CPU為中心的架構(gòu)無法提供高帶寬;

第三,管理的基礎(chǔ)設(shè)施規(guī)模越來越大,阿里云在全球27個國家和地區(qū)、84個可用區(qū)管理著超過上百萬臺服務(wù)器,基于CPU為中心的架構(gòu)無法解決超大規(guī)模的復(fù)雜管理問題。

為了解決以上問題,需要對數(shù)據(jù)中心內(nèi)部的云計算體系架構(gòu)進(jìn)行改革創(chuàng)新,從以CPU為中心的體系架構(gòu)進(jìn)入以飛天操作系統(tǒng)+CIPU為中心的體系架構(gòu)。

3、CIPU帶來哪些改變?

基于CIPU和飛天操作系統(tǒng)的新一代云計算架構(gòu)體系,無論是在分布式應(yīng)用還是人工智能的場景測試中,都展現(xiàn)了優(yōu)越的性能。

存儲方面,通過全硬件虛擬化和轉(zhuǎn)發(fā)加速,存儲時延最低可至30us(PLX),IOPS高達(dá)300萬,存儲帶寬可達(dá)200 Gbps,全面超越市面上所有云產(chǎn)品,云端能提供比本地更安全可靠且高性能的存儲能力。

網(wǎng)絡(luò)方面,基礎(chǔ)帶寬從100G升級至200G,VPC的PPS轉(zhuǎn)發(fā)性能從2000萬提升至4000萬,網(wǎng)絡(luò)時延從22us降低至16us,RDMA協(xié)議下更可低至5.5us。應(yīng)用上云之后,比自建物理機的集群吞吐量提升了30%,業(yè)務(wù)高峰期延遲下降了90%。

計算方面,單容器虛擬化消耗減少50%,虛擬化容器啟動速度快350%。主流通用計算場景下,Nginx性能提升了89%,Redis性能提升了68%、MySQL提升了60%。大數(shù)據(jù)和AI 場景下,AI深度學(xué)習(xí)場景訓(xùn)練性能提升30%,Spark計算性能提升30%。同時,神龍計算平臺可以提前預(yù)測80%的硬件故障,并進(jìn)行無感熱遷移規(guī)避,從而實現(xiàn)了業(yè)界領(lǐng)先的高可用SLA。

阿里云發(fā)布云數(shù)據(jù)中心處理器CIPU

原創(chuàng)文章,作者:蘋果派,如若轉(zhuǎn)載,請注明出處:http://leeannwhittemore.com/article/555473.html

蘋果派的頭像蘋果派管理團(tuán)隊

相關(guān)推薦