從前車馬很慢,書信很遠,數(shù)據(jù)傳輸?shù)乃俣雀锹綗o奈。
許多人可能都有備份硬盤的經(jīng)歷,或者你也曾向移動硬盤中拷貝大量的電影或者文件資料。對于傳統(tǒng)機械硬盤來說,受限于物理運行速度,磁盤的轉速與磁頭的讀寫遠不及如今的電子元器件,大多數(shù)硬盤的速度也不過就是每秒100多MB。
也就是說,傳輸一個普通的高清電影大概需要5-8分鐘,而對于4K甚至8K電影動輒上百GB的體積來說,傳輸效率更是難以想象的。以8K動畫大作《魯魯修R2》為例,該片第一集文件大小達到了驚人的4.5TB,換算下來的傳輸時間要超過8個小時。
很顯然,這種速度是互聯(lián)網(wǎng)快節(jié)奏難以承受的,而機械硬盤容量“加量不加速”的問題也讓人看到了閃存的優(yōu)勢。所以從人類邁入高清時代開始,閃存作為更快的傳輸介質就進入了人們的視野,并通過多年來的不懈努力成為了當下包括手機、平板電腦、服務器、存儲等多種設備中的重要存儲介質。即便是在看中容量的企業(yè)級領域,全閃存陣列也是許多企業(yè)數(shù)字化轉型的必要選擇。
但是與之前機械硬盤面臨的問題類似,閃存也同樣遇到了“加量不加速”的問題,只是目前這種局面還并未達到極限。不過業(yè)內(nèi)許多有識之士和領軍企業(yè)都在進行高性能、高壽命的存儲產(chǎn)品研發(fā),2018年英特爾發(fā)布的、基于3D XPoint技術的傲騰存儲就為整個行業(yè)帶來了全新的希望。
其實從誕生之初,英特爾傲騰存儲就引來了行業(yè)的關注,特別是最初強調的“速度是目前NAND閃存的1000倍,耐用性也是目前閃存的1000倍,密度是NAND的10倍”等等描述更是引起了大眾的濃厚興趣。事實上,英特爾之所以有如此的自信,也恰恰是由于傲騰產(chǎn)品所采用的創(chuàng)新性3D XPoint架構,提供了強大的數(shù)據(jù)處理能力。
如今,傲騰系列產(chǎn)品不僅僅在個人消費領域風生水起,在企業(yè)級也憑借著出色的性能成為了“高性能”的代名詞。無論是傲騰存儲還是傲騰可擴展內(nèi)存,都已經(jīng)在頭部互聯(lián)網(wǎng)、大型制造業(yè)集團等多個領域當中實現(xiàn)部署,并且取得了出色的成績。
為什么這些行業(yè)頂尖企業(yè)都會選擇傲騰存儲呢?除了性能之外,還在于傲騰存儲能夠為用戶優(yōu)化“ACT三大場景”,并針對場景提供差異化的服務能力。所謂的ACT在這里代表了A(Accelerating,加速)、C(Caching,緩存)、T(Tiering,促進應用分層)三個層面,而傲騰技術就是在這三個層面實現(xiàn)了激活。
加速加速再加速,傲騰存儲的立足之本
首先說說A場景——加速。正如我們前面談到的,傲騰存儲的興起就是替代了原有NAND存儲的加速功能,提供了“1000倍”的理論性能提升。甚至我們可以說,傲騰是目前存儲領域讀寫最快的產(chǎn)品,而這種特性也讓它能夠被應用于包括Redis、Oracle Database或者MySQL在內(nèi)的多種數(shù)據(jù)庫中,加速數(shù)據(jù)庫的讀寫操作。
英特爾公司非易失存儲解決方案事業(yè)部應用工程部的翁昀先生分享了一則來自于客戶的真實案例。DC P4610是英特爾面向數(shù)據(jù)中心市場推出的固態(tài)盤,也是采用TLC芯片的產(chǎn)品,但是在日常使用中,客戶覺得P4610雖然性能表現(xiàn)不錯,但是與期望的性能仍有差距,所以在P4610的基礎上,客戶將存儲升級到了DC P4800X,后者則是基于傲騰技術打造的“性能怪獸”。
這種升級帶來的提升是立竿見影的,翁昀也對兩者的性能進行了簡單的對比——就IOPS吞吐量表現(xiàn)來說,在70%讀取30%寫入的情況下,傲騰P4800X的性能是P4610的3倍,在壽命上是P4610的5倍,在延遲上只有P4610的五分之一。更夸張的是在QoS動態(tài)分配中,傲騰P4800X的表現(xiàn)是P4610的12倍,也讓人驚呼于傲騰的性能優(yōu)勢。
另一個加速的案例則來自于Ceph環(huán)境中,這也是當下云平臺中經(jīng)常出現(xiàn)的場景。與我們剛才提到的案例類似,在同樣IOPS的要求和讀寫設定之下( 70%讀30%寫),傲騰相對于傳統(tǒng)NAND存儲依然具備強大的優(yōu)勢。這種優(yōu)勢體現(xiàn)在單位體積、延遲和整體擁有成本三個方面——
就占用空間和面積來說,傳統(tǒng)的全閃存陣列要達到15萬IOPS吞吐量需要大約19個節(jié)點才能實現(xiàn),但是在使用了傲騰方案之后只要7個節(jié)點就能達到相同的效果,由此節(jié)省的機房空間和租賃成本是一筆不小的數(shù)目;
在延遲方面,雖然全閃存陣列的延遲已經(jīng)非??捎^,但是同樣的性能下SATA全閃存延遲的讀取延遲需要達到讀4.3毫秒 ,寫入延遲達到8.1亳秒;而相同條件下,采用傲騰加速以后的讀取延遲只有1.2毫秒,寫入延遲也不過2.3亳秒 ,大概只有之前的四分之一;
此消彼長帶來的就是總體擁有成本的降低。以三年周期的使用成本計算,傳統(tǒng)全閃存陣列大概要花掉近60萬美元,但是傲騰平臺只要23萬美元,降低了一大半。如果考慮到傲騰平臺所帶來的性能優(yōu)勢,從性價比的角度來說優(yōu)勢可以翻番。
其實這也只是傲騰P4800X的小試牛刀??截愡^數(shù)據(jù)的朋友們知道,我們在數(shù)據(jù)讀寫的時候不怕大塊的視頻數(shù)據(jù),而是最擔心于細小的文件,因為這些零碎文件會大大增加盤體的讀寫壓力,也讓傳輸速度大幅度下降。但是傲騰P4800X卻并沒有出現(xiàn)這樣的情況,對于任何容量的數(shù)據(jù)塊,傲騰P4800X都能保持超高的速寫速度,同時盡可能低的延遲也讓它具備更快的響應速度。
緩存優(yōu)化,提升的不僅僅是性能
看完了A部分加速的內(nèi)容,我們再來看看C部分——緩存。要知道,傲騰系列產(chǎn)品的能力是非常全面的,其中的傲騰可持久內(nèi)存就是以緩存能力為代表,這也進一步證明了傲騰存儲在緩存上的性能,甚至相對于加速的數(shù)據(jù)庫來說,緩存的讀寫要求更高。
在許多人的印象中,緩存能力都考察的是讀取能力,即如何實現(xiàn)數(shù)據(jù)的對外輸出。但事實上,由于Cache中的數(shù)據(jù)需要經(jīng)常刷新,因此在數(shù)據(jù)緩存的過程中往往是邊寫邊讀,這也進一步考驗了存儲的性能和穩(wěn)定性。為此,英特爾上海實驗室也在vSAN環(huán)境下進行了P4610和P4800X的再度對比,成績非常喜人。
測試基于虛擬機中的VDBench軟件進行。從最終結果我們可以看到,無論是順序寫、 順序讀還是在隨機讀寫上,傲騰P4800X相對于P4610都有不小的提升,其中順序寫性能提升了50%,、隨機寫4K性能提升接近60%,而所有的混合讀寫操作性能提升都超過了100%。除此之外,在延遲層面的隨機讀寫時間也有一半以上的下降,傲騰P4800X的優(yōu)勢非常明顯。
“從P4610到P4800X,雖然看似單位容量價格出現(xiàn)了提升,但因為傲騰P4800X需要的容量更小,所以采購壓力變化并不大。不僅如此,P4800X還能夠帶來更好的壽命保障,這對于用戶來說恐怕是除了單純性能指標之外也要關注的內(nèi)容”,E企研究院首席研究員張廣彬老師如是說。
數(shù)據(jù)分層,讓冷熱數(shù)據(jù)智能存放
ACT的最后一個層面是T,即數(shù)據(jù)分層。其實從大數(shù)據(jù)時代開始,我們就將數(shù)據(jù)定義為冷數(shù)據(jù)、溫數(shù)據(jù)和熱數(shù)據(jù)三個層級,而除了最底層、最不常用的冷數(shù)據(jù)之外,溫數(shù)據(jù)和熱數(shù)據(jù)的傳輸都是我們需要關注的問題。那么,如何實現(xiàn)數(shù)據(jù)分層的自由轉換?是否有一種智能化的方案實現(xiàn)了數(shù)據(jù)控制呢?
傲騰存儲給出了答案。作為大數(shù)據(jù)框架之一,Hadoop自誕生之日起到現(xiàn)在一直在發(fā)揮作用,不少大數(shù)據(jù)分析平臺都是基于Hadoop框架所搭建。據(jù)翁昀介紹,在某英特爾客戶案例中,原本采用的就是傳統(tǒng)SATA SSD+RAID控制器的方式來實現(xiàn)數(shù)據(jù)分層。
但是英特爾給出了不同的解決方案——一方面,英特爾為客戶提供了存儲熱數(shù)據(jù)的傲騰SSD,另一方面又將YARN Temp文件單獨提取出來,通過RAID控制器將冷數(shù)據(jù)依然保存在原有的SATA SSD上。
這樣首先降低了數(shù)據(jù)讀寫延遲,而更重要的是解決了原有SATA SSD上0.7 DWPD的限制問題,使得整個Hadoop集群的性能獲得大幅度提升 。如今,該解決方案已經(jīng)在國內(nèi)某頭部互聯(lián)網(wǎng)企業(yè)中實現(xiàn)部署,僅僅通過簡單的分層方式,借助于傲騰存儲就實現(xiàn)了智能化的數(shù)據(jù)存放管理。
我們常說數(shù)據(jù)是數(shù)字化時代的“石油”,而如何把握這一重要的資源目前在整個業(yè)界還沒有最終的結論,許多存儲企業(yè)都在各顯其能的提供差異化的解決方案。對于英特爾來說,它所提供的傲騰存儲產(chǎn)品能夠幫助企業(yè)實現(xiàn)從加速、緩存優(yōu)化到數(shù)據(jù)分層的全方位覆蓋,通過ACT三大層面的特性表現(xiàn),讓數(shù)據(jù)實現(xiàn)快速、安全、智能化的數(shù)據(jù)管理,也幫助客戶更好的邁入數(shù)字化時代。
英特爾傲騰存儲,讓你成為數(shù)據(jù)賽道上的“博爾特”。