為什么企業(yè)依舊青睞HDD?
據(jù)行業(yè)分析機構(gòu) Trendfocus發(fā)布的數(shù)據(jù),2024年第一季度,全球機械硬盤(HDD)出貨量達2970萬塊,環(huán)比增長3%,出貨總?cè)萘窟_262EB,環(huán)比增長22%。面向企業(yè)存儲的HDD出貨量和出貨容量雙雙增長,其中出貨容量增幅高于出貨量的增幅,這表明HDD依然是企業(yè)容量需求型場景的主流選擇。
企業(yè)數(shù)據(jù)存儲大致可分為性能需求型和容量需求型兩大類場景,前者的典型代表是計算類應用,通常以512B、4K等小數(shù)據(jù)塊的隨機讀寫為主,關(guān)注點聚焦在IOPS性能;而容量需求型存儲則重點考量64K、128K及以上數(shù)據(jù)塊的順序讀寫性能(即帶寬,MB/s),典型應用場景包括關(guān)鍵業(yè)務數(shù)據(jù)備份、文件共享、日志存儲等,使用HDD為AI應用存儲海量訓練數(shù)據(jù)也是企業(yè)的主流選擇。
雖然SSD的順序讀寫性能高于HDD,但對于企業(yè)用戶來說,實際的使用需要結(jié)合各種綜合因素,除性能外,還有穩(wěn)定性、可靠性、投入成本等多種因素。所以企業(yè)依然青睞使用HDD來滿足海量數(shù)據(jù)增長引發(fā)的存儲容量需求。而HDD是如何滿足企業(yè)應用所需的呢?
本文將基于東芝的MG10-D系列空氣封裝硬盤,從實際測試出發(fā),分析HDD在企業(yè)存儲市場的優(yōu)勢特點。
1
基準測試:
可預測的性能,簡化企業(yè)存儲復雜度
MG10-D系列是東芝最新發(fā)布的傳統(tǒng)磁記錄格式 (CMR) 空氣硬盤產(chǎn)品家族,有SATA和SAS兩種接口,容量從1TB到10TB。據(jù)東芝官網(wǎng)信息,MG10-D系列硬盤的性能和電源能效均有明顯提升,同時還提供即時清理擦除(SIE)和自加密驅(qū)動器(SED)等數(shù)據(jù)安全功能。本次測試用的HDD為3.5英寸外形規(guī)格的SATA接口硬盤,容量8TB。
圖1:用于本次測試的東芝MG10-D系列磁盤,容量8TB
圖2:硬盤背面
圖3:硬盤接口為SATA 3.0規(guī)格,最大速率6Gb/s
圖4:主軸電機,帶動內(nèi)部盤片高速旋轉(zhuǎn)(7200轉(zhuǎn)/分鐘),并“托”起磁頭實現(xiàn)數(shù)據(jù)存取
圖5:主軸電機上方的通氣孔,用以保持內(nèi)外部氣壓平衡,旁邊有英文提示“請勿遮擋”
基準性能測試的目的是用于評估HDD自身所能發(fā)揮出的性能,即 “裸盤性能”。根據(jù)海量文件存儲、數(shù)據(jù)備份、云歸檔等場景的數(shù)據(jù)存取特點,測試選擇用64K、128K及以上尺寸的數(shù)據(jù)塊,通過常用的硬盤基準性能測試工具Iometer下發(fā)順序讀寫負載來評估HDD的帶寬表現(xiàn)。圖6為東芝MG10-D系列8TB硬盤在128K數(shù)據(jù)塊下的順序讀寫性能。
圖6:東芝MG10-D系列8TB硬盤的128K順序讀寫性能
本節(jié)測試使用單一線程對東芝MG10-D系列8TB硬盤下發(fā)讀寫負載,從測試結(jié)果可以看出,在單線程、1隊列深度時,硬盤達到最大讀寫帶寬,均在290MB/s左右,此時的平均響應時間僅為0.46ms。
此測試結(jié)果表明了以下多層含義:
1、 順序讀寫性能均衡,不管是順序讀(綠色柱狀)還是順序?qū)?橙色柱狀),在不同隊列深度下的吞吐率都近乎相似,保持在290MB/s左右;
2、 在隊列深度為1時,硬盤已達到最大的讀寫帶寬290MB/s,應用體驗穩(wěn)定流暢。
3、 在達到最大帶寬后,隨著負載(隊列深度)的增加,吞吐率保持平穩(wěn),響應時間隨負載的增加而增長,這表明即使在密集負載情況下,東芝MG10-D 8TB硬盤依然能夠發(fā)揮出最大帶寬性能,且保持平穩(wěn),具有很好的性能可預測性,以便企業(yè)存儲系統(tǒng)能更好地匹配業(yè)務需求。
值得注意的是,東芝官網(wǎng)公布的MG10-D系列HDD的順序讀寫帶寬為268MiB/s,為二進制。而本測試中的290MB/s使用十進制,換算成二進制大約為278MiB/s。
圖7:不同數(shù)據(jù)塊大小的順序讀寫性能(吞吐率與響應時間)
上圖7是東芝MG10-D系列8TB硬盤在使用64K、128K、256K、512K、1024K等不同大小數(shù)據(jù)塊下的順序讀寫帶寬和響應時間表現(xiàn)。其性能表現(xiàn)趨勢與上一測試結(jié)果近乎相似,在1隊列深度時可達到最大吞吐率,且隨著負載的繼續(xù)增加,吞吐率保持不變,響應時間隨數(shù)據(jù)塊大小而變化。
圖8:東芝MG10-D系列8TB硬盤穩(wěn)定性測試結(jié)果
上圖8為128K數(shù)據(jù)塊在持續(xù)讀寫下的響應時間散布,在1分鐘持續(xù)的讀寫負載下發(fā)中,響應時間大多散布在0.4~0.5ms之間,只有極少數(shù)分散在0.5ms之外,但均未超過0.6ms,這從另一方面顯示了東芝MG10-D系列硬盤的性能穩(wěn)定性與可預測性。
從基準測試的結(jié)果數(shù)據(jù)來看,東芝MG10-D系列8TB硬盤僅需單線程單隊列的情況下就能達到最大吞吐率,即使在密集讀寫負載情況下也能保持穩(wěn)定的最大帶寬性能,所具備的性能可預測性,有助于企業(yè)用戶簡化存儲系統(tǒng)的優(yōu)化與管理工作。
基準性能測試反映的是東芝8TB硬盤本身所能發(fā)揮的最大性能,并不代表其在實際應用中的性能表現(xiàn)。接下來進行的文件性能測試將展示東芝8TB硬盤的實際應用性能表現(xiàn)。
2
如何讓海量小文件存儲更有效率?
文件存儲是企業(yè)最常見的應用場景,典型如日志存儲、文件共享、云數(shù)據(jù)備份與歸檔等,隨著大數(shù)據(jù)分析技術(shù)的發(fā)展,海量文件存儲也逐漸成為企業(yè)的典型應用場景,尤其是近幾年掀起的又一輪AI狂潮,為AI模型訓練所需的海量數(shù)據(jù)提供存儲能力也是HDD的重要應用場景。
我們使用VDbench創(chuàng)建模擬企業(yè)實際數(shù)據(jù)環(huán)境,來測試東芝10-D系列8TB硬盤,評估在處理海量小文件場景下,硬盤的每秒文件讀寫數(shù),每秒吞吐率,以及響應時間等多項表現(xiàn)。將東芝MG10-D系列8TB硬盤用作企業(yè)文件系統(tǒng),并創(chuàng)建兩層目錄,每層10個目錄,在第二層的所有目錄中都創(chuàng)建2000個半/非結(jié)構(gòu)化文件,總計20萬個文件(即2000x10x10)。在不同的測試環(huán)節(jié),VDbench會重新生成不同大小的20萬個文件(如64K、128K、256K、512K、1024K),用以評估東芝MG10-D系列8TB硬盤在不同文件大小情況下的每秒文件讀寫數(shù)量和帶寬吞吐。
圖9展示的是64K、128K、256K及以上不同尺寸大小文件的順序讀取與寫入性能:
圖9:海量小文件的順序讀取/寫入性能測試結(jié)果
從上圖展示的測試結(jié)果來看,在64K和128K小文件測試中,MG10-D每秒可成功打開并傳輸?shù)奈募?000個以上,隨著文件尺寸的增大,每秒文件傳輸數(shù)開始下降,帶寬則快速提升,在256K時達到最大帶寬171MB/s;之后隨著文件尺寸的增加,每秒文件傳輸數(shù)逐漸下降,帶寬隨之對應下降。
在文件順序?qū)懭霚y試中(實際是重寫),64K文件每秒可寫入近950個,隨著文件尺寸的增大,每秒寫入數(shù)量逐步降低,寫入帶寬則隨之提高。在1MB文件時達到最大帶寬111MB/s。
在企業(yè)數(shù)據(jù)中心內(nèi),更多應用場景的數(shù)據(jù)傳輸特點是文件隨機讀寫,圖10展示的是不同尺寸大小文件的隨機讀取與寫入性能測試結(jié)果:
圖10:海量小文件隨機讀取/寫入性能測試結(jié)果
圖10測試結(jié)果顯示,在20萬小文件隨機讀取性能測試中,東芝MG10-D系列8TB硬盤在128K尺寸大小文件時,每秒成功打開并傳輸?shù)奈募?shù)量最多,達到137個,對于HDD而言,這是一個極出色的性能成績。隨后,隨著文件尺寸的增大,每秒打開數(shù)量降低,但帶寬隨之提高,在1MB尺寸文件時獲得最大帶寬38MB/s。
同理,在隨機寫入測試中,東芝MG10-D系列8TB硬盤在64K尺寸文件獲得最大文件寫入數(shù)量——每秒寫入519個文件,隨著測試文件尺寸的增大,每秒寫入數(shù)量下降,但寫入帶寬逐漸上升,到1MB尺寸文件時獲得最大帶寬——97MB/s。
為何在文件性能測試中,隨機寫入性能遠超隨機讀取性能?這是因為在測試中啟用了硬盤寫入緩存(Write Cache)。通常情況下,為了防止突然掉電導致緩存數(shù)據(jù)丟失,硬盤中的寫入緩存大多處于關(guān)閉狀態(tài)。而在本次測試中之所以打開寫入緩存,這是因為東芝MG10-D系列硬盤中集成了持久寫入緩存技術(shù),即使突然掉電,該技術(shù)也能保證硬盤緩存中的數(shù)據(jù)安全。并且,該系列硬盤緩存都為512MB,更大容量意味著可以緩存更多數(shù)據(jù),也意味著更好的性能。
以上兩個測試結(jié)果顯示,東芝MG10-D系列8TB硬盤對文件隨機讀取的加速效果低于隨機寫入,這是因為測試數(shù)據(jù)全部都是重新寫入的新數(shù)據(jù),沒有調(diào)用到讀緩存。而在文件隨機寫入測試中,下發(fā)的負載首先寫入硬盤的寫緩存(并經(jīng)過排序),然后以類似順序?qū)懭氲姆绞綄懭胗脖P,從測試結(jié)果來看,其加速效果非常明顯,在64K文件大小時,每秒隨機寫入的文件數(shù)量約為順序?qū)懭氲?5%,隨著文件尺寸的增大,加速效果越發(fā)明顯,在1MB文件大小時,隨機寫入帶寬接近順序?qū)懭霂挼?0%(87%)。
在海量小文件存儲系統(tǒng)中,存儲的文件數(shù)量也會對文件讀寫性能帶來影響(其他配置不變的情況下),此測試將評估128K尺寸文件大小下,不同文件數(shù)量對讀寫性能帶來的影響,圖11為測試結(jié)果:
圖11:不同文件數(shù)量對存儲性能的影響
在文件隨機讀取測試中,隨著文件系統(tǒng)中文件數(shù)量的增加,每秒成功打開并傳輸?shù)奈募?shù)量會隨之下降,在超過10萬個文件后,讀取性能趨于平緩,響應時間也維持穩(wěn)定。而在文件隨機寫入測試中,由于寫入緩存的加速,雖然文件系統(tǒng)內(nèi)文件數(shù)量顯著增加,但每秒成功寫入的文件數(shù)量依然平穩(wěn),響應時間也沒有很大起伏,得益于緩存顯著提升了企業(yè)文件系統(tǒng)的性能,尤其是寫入性能。
上述結(jié)果均基于單機環(huán)境下對單塊東芝MG10-D系列8TB硬盤進行測試獲得,在企業(yè)實際環(huán)境中,存儲系統(tǒng)通常有著數(shù)量多得多的硬盤。比如分布式存儲,即使最小3節(jié)點也有多達36塊硬盤,如果按上述測試數(shù)據(jù)推算,其能支持每秒最多3.6萬個文件的并發(fā)訪問。即使部署在傳統(tǒng)雙控陣列(12塊硬盤)中,也能支持每秒最多近1.2萬個文件的并發(fā)訪問。更何況還有存儲系統(tǒng)的內(nèi)存/緩存加持,實現(xiàn)的系統(tǒng)綜合實際性可高于上述數(shù)值。
本測試綜合考慮HDD的性能后選擇使用的是單機環(huán)境(i5-13600,14Core@2.7GHz,32G內(nèi)存)進行測試,在測試中排除了系統(tǒng)內(nèi)存、網(wǎng)絡等因素的影響。在企業(yè)實際環(huán)境,如文件共享應用中,文件系統(tǒng)(NAS)緩存將會對文件讀寫性能帶來利好,但不同的存儲網(wǎng)絡(GbE vs FC、10GbE vs 25GbE等)則會對測試結(jié)果帶來較大影響,同時,客戶端并發(fā)數(shù)量、讀寫負載混合比例等都會不同程度上影響文件系統(tǒng)性能。
3
除了性能,硬盤還有其他優(yōu)點
東芝MG10-D系列硬盤是東芝專為企業(yè)存儲而研發(fā)改進的傳統(tǒng)磁記錄格式(CMR)硬盤家族,除了上述測試中所反映出的性能穩(wěn)定性、可預測性外,為滿足企業(yè)存儲需求,東芝MG10-D系列硬盤還有著很多特點及可選擇的附加功能,比如:
即時清理擦除(SIE)和自加密功能(SED)。很多企業(yè),尤其是有著大規(guī)模數(shù)據(jù)中心的企業(yè),因故障更換硬盤、報廢硬盤后,如何處理被淘汰硬盤通常是一個難題,其上可能存放著企業(yè)敏感數(shù)據(jù)。而利用這兩項安全功能,能幫助企業(yè)更好地處理數(shù)據(jù)安全風險。東芝MG10-D全容量系列硬盤均支持這兩項功能。
持久寫入緩存技術(shù)。可在保證最優(yōu)寫入性能(Write Cache啟用)的基礎上防范由于突然掉電導致緩存數(shù)據(jù)丟失的風險,幫助企業(yè)在保證數(shù)據(jù)安全的同時更好地應對突發(fā)業(yè)務波峰。
存儲選擇更靈活。東芝MG10-D系列硬盤不僅提供用于構(gòu)建分布式存儲的SATA接口硬盤,還提供滿足企業(yè)存儲陣列需求的SAS接口硬盤;企業(yè)還可根據(jù)業(yè)務所需靈活選擇512e/4Kn或512n等不同扇區(qū)格式的硬盤,可無縫融入企業(yè)各種業(yè)務場景;1TB起步、最高10TB的容量規(guī)格也讓企業(yè)擁有更靈活的選擇。
圖12:東芝MG10-D系列提供不同規(guī)格型號的硬盤,供企業(yè)按需求靈活選擇
除上述特點以外,東芝MG10-D系列硬盤每年額定工作負載總傳輸率可達550TB;同時還具有很好的電源能效,在活躍待機模式下的功耗降至5.74W,相比上一代產(chǎn)品能耗節(jié)省方面也有很大提升。對于聚集了數(shù)萬臺服務器的企業(yè)數(shù)據(jù)中心,每一瓦的能耗節(jié)省都能為用戶帶來更好的成本管控制。
在很多企業(yè)數(shù)據(jù)中心的主流應用場景,HDD以其可預測的性能、更具性價比的投入、經(jīng)驗證的可靠性、更靈活的容量與接口選擇,以及優(yōu)異的兼容性等特點,能夠更好地支撐企業(yè)業(yè)務的正常穩(wěn)定運行。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據(jù)。
關(guān)鍵詞:
相關(guān)閱讀
-
為什么企業(yè)依舊青睞HDD?
據(jù)行業(yè)分析機構(gòu) Trendfocus發(fā)布的數(shù)據(jù),2024年第一季度,全球機械硬 -
人保車險-車險中交強險與商業(yè)險分別起到...
在中國,車險分為交強險和商業(yè)險兩種。這兩種車險分別承擔著不同的... -
國際公共采購大會分會暨中埃精準合作對...
2024年12月1日,國際公共采購大會分會暨中國埃及經(jīng)貿(mào)交流會于北京商 -
劍南春:堅守品質(zhì)拓展品牌 詮釋高品質(zhì)...
質(zhì)量是企業(yè)賴以生存的基石、永恒探索的主題、基業(yè)長青的根本。在入 -
臺鈴2025旗艦新品“封神”盛大發(fā)布 執(zhí)...
12月2日,臺鈴在無錫國際會議中心隆重舉行了2025旗艦新品發(fā)布會,全 -
擺脫鍵鼠束縛 海蘭GT40電腦一體機以...
在這個追求高效與便捷的時代,傳統(tǒng)鍵鼠操作已難以滿足我們對智能生