版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
硬盤基本構(gòu)成及工作原理原理一、硬盤的組成
硬盤大家一定不會陌生,我們可以把它比喻成是我們電腦儲存數(shù)據(jù)和信息的大倉庫。一般說來,無論哪種硬盤,都是由盤片、磁頭、盤片主軸、控制電機、磁頭控制器、數(shù)據(jù)轉(zhuǎn)換器、接口、緩存等幾個部份組成。所有的盤片都固定在一個旋轉(zhuǎn)軸上,這個軸即盤片主軸。而所有盤片之間是絕對平行的,在每個盤片的存儲面上都有一個磁頭,磁頭與盤片之間的距離比頭發(fā)絲的直徑還小。所有的磁頭連在一個磁頭控制器上,由磁頭控制器負責(zé)各個磁頭的運動。磁頭可沿盤片的半徑方向動作,而盤片以每分鐘數(shù)千轉(zhuǎn)到上萬轉(zhuǎn)的速度在高速旋轉(zhuǎn),這樣磁頭就能對盤片上的指定位置進行數(shù)據(jù)的讀寫操作.
硬盤結(jié)構(gòu)簡單來說,硬盤的整個架構(gòu)可以這樣描述:在裝有SpindleMotor的基座上安裝好HSA、Disk、Magnet、Ramp、Latch等組件,再用TopCover密封起來。這時我們看到的就被叫做磁頭碟片組合(HDA:HeadDiskAssembly)。而如果再在HDA上安裝好PCBA的話,HDD就做好了。(在HDA和PCB板之間會夾有一張防靜電泡沫)
磁頭折片組合(HSA)HSA(HeadStackAssembly):磁頭折片組合,包括HGA、懸臂、傳動軸、VCM等組件。HGA(HeadGimbalAssembly):磁頭組件,包括磁頭和支撐磁頭的支架。PREAMP:前置控制電路芯片主要負責(zé)控制磁頭感應(yīng)信號、主軸電機調(diào)速、磁頭驅(qū)動和伺服定位等,由于磁頭讀取的信號微弱,將放大電路密封在腔體內(nèi)可減少外來信號的干擾,提高操作指令的準確性。該電路主要有兩個作用:第一,負責(zé)將二進制碼轉(zhuǎn)換成模擬信號。當數(shù)據(jù)信息需要寫入時,由中心處理系統(tǒng)傳向磁頭的是代表數(shù)據(jù)的二進制碼,這個電路是這些二進制碼的必經(jīng)之路,其責(zé)任是將經(jīng)過這里的二進制碼轉(zhuǎn)換為能夠改變電流大小的模擬信號,并傳向磁頭;第二,負責(zé)將模擬信號轉(zhuǎn)換成二進制碼并放大信號。當讀取數(shù)據(jù)時磁頭從盤片獲得的是由磁場而產(chǎn)生的電流,電流在向中心處理系統(tǒng)傳輸時,也必須經(jīng)過前置放大電路,此時這個電路的工作是將代表模擬信號的電流轉(zhuǎn)變?yōu)橹行奶幚硐到y(tǒng)能夠識別的二進制碼,并將微弱的信號放大。磁盤片盤片是硬盤存儲數(shù)據(jù)的載體,現(xiàn)在硬盤盤片一般是在基板上通過噴射Co)Cr(鈷鉻)系合金薄膜成形而制取的(初期的碟片是在基板上涂上磁性涂料,表面呈茶色。后來大概在1986年推出了通過電鍍磁性膜和噴射處理成型的薄膜碟片,記錄磁性層的磁特性得到了明顯的提高?,F(xiàn)在所使用的都是這種表面散發(fā)著銀光,足以當作鏡子的碟片)?;宀牧?,目前大多2.5英寸HDD使用的是玻璃,3.5英寸使用的是鋁合金。雖然玻璃單就表面平整性而言,遠比鋁合金要好。但為何不在3.5英寸上大規(guī)模使用玻璃基板呢?其實廠家主要是為了成本考慮,就目前而言玻璃基板的成本比鋁基板的成本要高。而在2.5英寸的硬盤上,盤片較小較薄,需要較強的剛性,這種情況下如果鋁合金做的較薄的話,就無法滿足要求。而且盤片體積較小,相對而言成本上升不大,所以硬盤廠家在生產(chǎn)2.5英寸硬盤時,一般選用玻璃基板。盤片的結(jié)構(gòu)比較復(fù)雜。一張硬盤盤片的單面由多個不同的層復(fù)合而成,最上層是有機高分子氟材料組成的潤滑層,保證磁頭更加平穩(wěn)地運行;接下來是由堅硬的碳材料構(gòu)成的保護層,保護數(shù)據(jù)層不受物理損壞。再下面的磁記錄層、鉻-鎳介質(zhì)層,然后才是盤片基體材料對于盤片而言,整個硬盤發(fā)展過程中對記錄密度起到飛躍式提升的最主要的技術(shù)是:垂直記錄技術(shù),目前基本上已轉(zhuǎn)變?yōu)榇怪庇涗浖夹g(shù)。盤片的結(jié)構(gòu)垂直記錄技術(shù)垂直記錄技術(shù)在概念上很簡單,就是將負責(zé)記錄的磁單元排列方式改為垂直排列方式,此時磁單元的極性方向垂直于磁盤平面。與原來的縱向排列方式相比,垂直排列的磁單元所占的盤片表面積小得多,這樣就可以進一步提高存儲密度。除此之外,當磁單元被寫入后翻轉(zhuǎn)180o,與相鄰的磁單元變成S-N鄰接方式,可以起到對數(shù)據(jù)的穩(wěn)定作用,這種互相穩(wěn)定的作用和反鐵磁性耦合介質(zhì)有異曲同工之妙。
為了滿足垂直記錄的要求,磁記錄層的厚度要相應(yīng)加厚,并且在磁記錄層下面還要相應(yīng)增加一層軟磁底層,這樣可以提供更強的磁場,使得寫入更加方便。相對應(yīng)地,采用垂直記錄模式的磁盤磁頭結(jié)構(gòu)也有較大變化:其信號極(SignalPole)很窄,磁通量密度較高,足以使通過它下面的磁單元發(fā)生磁路反轉(zhuǎn);返回極(ReturnPole)很寬,磁通量密度較低,因此它下面的磁單元是相當安全的。垂直磁化記錄從微觀上看,磁記錄單元的排列方式有了變化,從原來的“首尾相接”的水平排列,變?yōu)榱恕凹绮⒓纭钡拇怪迸帕?。磁頭的構(gòu)造也有了改進,并且增加了軟磁底層。這一改變直接解決了“超順磁效應(yīng)”,并且可以將硬盤的單碟容量提高到500GB左右。垂直記錄的另一個好處是:相鄰的磁單元磁路方向平行,磁極的兩端都挨在一起,雖然不像前述的夾層結(jié)構(gòu)那樣上下兩層間形成反向耦合,但與縱向記錄相鄰的磁單元只在磁極一端相接的情況比起來,互相穩(wěn)定的效果還是較為明顯的主軸組件硬盤的主軸組件主要是軸承和馬達,我們可以籠統(tǒng)地認為軸承決定一款硬盤的噪音表現(xiàn),而馬達決定性能。軸承的發(fā)展分為三個階段:1、滾珠軸承。2、油浸軸承。3、液態(tài)軸承(FDB,F(xiàn)luidDynamicBearingMotors)。目前液態(tài)軸承已經(jīng)成為絕對的主流市場。在整個軸承的發(fā)展階段貫穿著一個非常重要的概念:None-repeatablerunout,不可重復(fù)偏離,簡稱NRRO。它是描述電機運轉(zhuǎn)時軸承偏離主軸中心的隨機偏移量的參數(shù)。為什么要突出這個概念呢?就目前廣泛使用的液態(tài)軸承馬達而言,它使用的是黏膜液油軸承,以油膜代替滾珠。這樣可以避免金屬面的直接磨擦,將噪聲及溫度被減至最低;同時油膜可有效吸收震動,使抗震能力得到提高;此外還能減少磨損,提高硬盤壽命。而且為了保持HDA內(nèi)部的清潔度,配置了分離軸承部分的磁性流體Seal和LabyrinthSeal。磁性流體Seal是在軸的周圍裝上磁鐵,并在空隙部分注入分散了的鐵粉等Oil進行隔離。LabyrinthSeal是從構(gòu)造上制造空氣回流,從而形成回路抵抗。兩者都有防止因馬達運轉(zhuǎn)而產(chǎn)生的潤滑油飛散的效果。Seagate硬盤的液態(tài)軸承馬達的立體圖急停裝置(StopperGum)急停裝置(StopperGum)Ramp磁頭在非操作狀態(tài)下,離開盤片??康牡胤剑ㄖ淮嬖谟诓捎肦ampLoad方式的硬盤,采用CSS方式的硬盤沒有這個小東西)。Filter
分為保持HDA內(nèi)部清潔度的循環(huán)過濾器和維持氣壓差的呼吸過濾器。循環(huán)過濾器:安裝于產(chǎn)生HDA內(nèi)壓力差的部位,用來收集HDA內(nèi)產(chǎn)生的塵埃,防止因磁頭和磁片間卷入灰塵而致劃傷.呼吸過濾器:安裝于基臺和TopCover的呼吸孔上,以防止外部塵埃和水分的進入,也能吸附少量的有害化學(xué)氣體.循環(huán)過濾器呼吸過濾器控制電路PCBA上的硬盤控制電路總得來說可以分為如下幾個部分:主控制芯片、數(shù)據(jù)傳輸芯片、高速數(shù)據(jù)緩存芯片等,其中主控制芯片負責(zé)硬盤數(shù)據(jù)讀寫指令等工作。數(shù)據(jù)傳輸芯片則是將硬盤磁頭前置控制電路讀取出數(shù)據(jù)經(jīng)過校正及變換后,經(jīng)過數(shù)據(jù)接口傳輸?shù)街鳈C系統(tǒng),至于高速數(shù)據(jù)緩存芯片是為了協(xié)調(diào)硬盤與主機在數(shù)據(jù)處理速度上的差異而設(shè)的。緩存對磁盤性能所帶來的作用是毋庸置疑的,在讀取零碎文件數(shù)據(jù)時,大緩存能產(chǎn)生較大的優(yōu)勢。主控制芯片數(shù)據(jù)傳輸芯片馬達控制芯片高速數(shù)據(jù)緩存芯片BlockDiagramSysClockDiag/UARTASIC(KahuSOC)IntegratedHostandChannelHostConnectorLED&JumpersDRAMBuffer4Mx32DDRFlashMotor-IC(McKinleyES)SIFSpindleMotorVCMMotorHDATempRVFFSensePreampAnalogRDAnalogWRPreampSIFHeadsVoltageRegulatorsSerialTracePortInternaltoDrivePCBA硬盤的工作原理硬盤的工作原理硬盤存儲數(shù)據(jù)是根據(jù)電、磁轉(zhuǎn)換的原理來實現(xiàn)的。硬盤驅(qū)動器加電后,磁盤片由主軸電機驅(qū)動進行高速旋轉(zhuǎn),設(shè)置在盤片表面的磁頭則在電路控制下徑向移動到指定位置然后將數(shù)據(jù)存儲或讀出來。當系統(tǒng)向硬盤寫入數(shù)據(jù)時,磁頭中寫數(shù)據(jù)電流產(chǎn)生磁場使盤片表面磁性物質(zhì)狀態(tài)發(fā)生改變,并在寫電流磁場消失后仍能保持,當系統(tǒng)從硬盤中讀取數(shù)據(jù)時,磁頭經(jīng)過盤片指定區(qū)域,盤片表面磁場使磁頭產(chǎn)生感應(yīng)電流或線圈阻抗產(chǎn)生變化,經(jīng)過相關(guān)電路處理后還原成數(shù)據(jù)二、盤面、磁道、柱面和扇區(qū)的介紹(1)
硬盤的讀寫是和扇區(qū)有著緊密關(guān)系的。在說扇區(qū)和讀寫原理之前先說一下和扇區(qū)相關(guān)的”盤面”、“磁道”、和“柱面”。
1.盤面
硬盤的盤片一般用鋁合金材料做基片,高速硬盤也可能用玻璃做基片。硬盤的每一個盤片都有兩個盤面(Side),即上、下盤面,一般每個盤面都會利用,都可以存儲數(shù)據(jù),成為有效盤片,也有極個別的硬盤盤面數(shù)為單數(shù)。每一個這樣的有效盤面都有一個盤面號,按順序從上至下從“0”開始依次編號。在硬盤系統(tǒng)中,盤面號又叫磁頭號。2.磁道
磁盤在格式化時被劃分成許多同心圓,這些同心圓軌跡叫做磁道(Track)。磁道從外向內(nèi)從0開始順序編號。老硬盤的每一個盤面有300~1024個磁道,新式大容量硬盤每面的磁道數(shù)更多。信息以脈沖串的形式記錄在這些軌跡中,這些同心圓不是連續(xù)記錄數(shù)據(jù),而是被劃分成一段段的圓弧,這些圓弧的角速度一樣。由于徑向長度不一樣,所以,線速度也不一樣,外圈的線速度較內(nèi)圈的線速度大,即同樣的轉(zhuǎn)速下,外圈在同樣時間段里,劃過的圓弧長度要比內(nèi)圈劃過的圓弧長度大。每段圓弧叫做一個扇區(qū),扇區(qū)從“1”開始編號,每個扇區(qū)中的數(shù)據(jù)作為一個單元同時讀出或?qū)懭?。一個標準的3.5寸硬盤盤面通常有幾百到幾千條磁道。磁道是“看”不見的,只是盤面上以特殊形式磁化了的一些磁化區(qū),在磁盤格式化時就已規(guī)劃完畢。
二、盤面、磁道、柱面和扇區(qū)的介紹(2)3.柱面
所有盤面上的同一磁道構(gòu)成一個圓柱,通常稱做柱面(Cylinder),每個圓柱上的磁頭由上而下從“0”開始編號。數(shù)據(jù)的讀/寫按柱面進行,即磁
頭讀/寫數(shù)據(jù)時首先在同一柱面內(nèi)從“0”磁頭開始進行操作,依次向下在同一柱面的不同盤面即磁頭上進行操作,只在同一柱面所有的磁頭全部讀/寫完畢后磁頭
才轉(zhuǎn)移到下一柱面,因為選取磁頭只需通過電子切換即可,而選取柱面則必須通過機械切換。電子切換相當快,比在機械上磁頭向鄰近磁道移動快得多,所以,數(shù)據(jù)
的讀/寫按柱面進行,而不按盤面進行。也就是說,一個磁道寫滿數(shù)據(jù)后,就在同一柱面的下一個盤面來寫,一個柱面寫滿后,才移到下一個扇區(qū)開始寫數(shù)據(jù)。讀數(shù)
據(jù)也按照這種方式進行,這樣就提高了硬盤的讀/寫效率。一塊硬盤驅(qū)動器的圓柱數(shù)(或每個盤面的磁道數(shù))既取決于每條磁道的寬窄(同樣,也與磁頭的大小有關(guān)),也取決于定位機構(gòu)所決定的磁道間步距的大小。
4.扇區(qū)
操作系統(tǒng)以扇區(qū)(Sector)形式將信息存儲在硬盤上,每個扇區(qū)包括512個字節(jié)的數(shù)據(jù)和一些其他信息。一個扇區(qū)有兩個主要部分:存儲數(shù)據(jù)地點的標識符和存儲數(shù)據(jù)的數(shù)據(jù)段。扇區(qū)的第一個主要部分是標識符。標識符,就是扇區(qū)頭標,包括組成扇區(qū)三維地址的三個數(shù)字:扇區(qū)所在的磁頭(或盤面)、磁道(或柱面號)以及扇區(qū)在磁
道上的位置即扇區(qū)號。頭標中還包括一個字段,其中有顯示扇區(qū)是否能可靠存儲數(shù)據(jù),或者是否已發(fā)現(xiàn)某個故障因而不宜使用的標記。有些硬盤控制器在扇區(qū)頭標中
還記錄有指示字,可在原扇區(qū)出錯時指引磁盤轉(zhuǎn)到替換扇區(qū)或磁道。最后,扇區(qū)頭標以循環(huán)冗余校驗(CRC)值作為結(jié)束,以供控制器檢驗扇區(qū)頭標的讀出情況,確保準確無誤。
扇區(qū)的第二個主要部分是存儲數(shù)據(jù)的數(shù)據(jù)段,可分為數(shù)據(jù)和保護數(shù)據(jù)的糾錯碼(ECC)。在初始準備期間,計算機用512個虛擬信息字節(jié)(實際數(shù)據(jù)的存放地)和與這些虛擬信息字節(jié)相應(yīng)的ECC數(shù)字填入這個部分。
圖示硬盤主要性能參數(shù)常用參數(shù)及術(shù)語每分鐘轉(zhuǎn)速(RPM,RevolutionsPerMinute):這一指標代表了硬盤主軸馬達(帶動磁盤)的轉(zhuǎn)速,比如7200RPM就代表該硬盤中的主軸轉(zhuǎn)速為每分鐘7200轉(zhuǎn)。平均尋道時間(AverageSeekTime):如果沒有特殊說明一般指讀取時的尋道時間單位為ms(毫秒)。這一指標的含義是指硬盤接到讀/寫指令后到磁頭移到指定的磁道(應(yīng)該是柱面,但對于具體磁頭來說就是磁道)上方所需要的平均時間。除了平均尋道時間外,還有道間尋道時間(TracktoTrack或CylinderSwitchTime)與全程尋道時間(FullTrack或FullStroke),前者是指磁頭從當前磁道上方移至相鄰磁道上方所需的時間,后者是指磁頭從最外(或最內(nèi))圈磁道上方移至最內(nèi)(或最外)圈磁道上方所需的時間,基本上比平均尋道時間多一倍。出于實際的工作情況,我們一般只關(guān)心平均尋道時間。平均潛伏期(AverageLatency):相對于Avergae
Seek
Time所強調(diào)的磁頭動作,Latency
Time的重心則放在盤片動作部分。這一指標是指當磁頭移動到指定磁道后,要等多長時間指定的讀/寫扇區(qū)會移動到磁頭下方(磁頭不動,盤片旋轉(zhuǎn))。盤片轉(zhuǎn)得越快,潛伏期越短。平均潛伏期是指磁盤轉(zhuǎn)動半圈所用的時間。顯然,同一轉(zhuǎn)速的硬盤的平均潛伏期是固定的。7200RPM時約為4.167ms,5400RPM時約為5.556ms。平均訪問時間(AverageAccessTime):又稱平均存取時間,一般在廠商公布的規(guī)格中不會提供,這一般是測試成績中的一項,其含義是指從讀/寫指令發(fā)出到第一筆數(shù)據(jù)讀/寫時所用的平均時間,包括了平均尋道時間、平均潛伏期與相關(guān)的內(nèi)務(wù)操作時間(如指令處理),由于內(nèi)務(wù)操作時間一般很短(一般在0.2ms左右),可忽略不計,所以平均訪問時間可近似等于平均尋道時間+平均潛伏期,因而又稱平均尋址時間。常用參數(shù)及術(shù)語Head
Switch
Time:磁頭交換時間。一般而言,一張盤片都會有兩個磁頭負責(zé)讀寫工作(正、反面各一個)。因為一個硬盤所包含的盤片往往不只一張,所以磁頭也會更多。由于這些磁頭都安裝在同一個磁頭支撐臂(Head
Arm)上,因此當某個磁頭要存取某個扇區(qū)上的資料時,其他的磁頭也會同時跟著移動。而所謂的Head
Switch
Time,即指硬盤將存取工作轉(zhuǎn)移切換給某個磁頭所消耗的時間。實際上,這個時間非常的短,幾乎可以忽略不計,因此在多數(shù)硬盤參數(shù)中不會提及。數(shù)據(jù)傳輸率(DTR,DataTransferRate):單位為MB/s(兆字節(jié)每秒,又稱MBPS)或Mbits/s(兆位每秒,又稱Mbps)。計算機通過硬盤的數(shù)據(jù)接口從硬盤的緩存中將數(shù)據(jù)讀出交給相應(yīng)的控制器的速度與硬盤將數(shù)據(jù)從盤片上讀取出交給硬盤上的緩沖存儲器的速度相比,前者要比后者快得多,前者是外部數(shù)據(jù)傳輸率(ExternalTransferRate),而后者是內(nèi)部數(shù)據(jù)傳輸率(InternalTransferRate),兩者之間用一塊緩沖存儲器作為橋梁來緩解速度的差距。通常也把外部數(shù)據(jù)傳輸率稱為突發(fā)數(shù)據(jù)傳輸率(BurstdataTransferRate),指的是電腦通過數(shù)據(jù)總線從硬盤內(nèi)部緩存區(qū)中所讀取數(shù)據(jù)的最高速率突發(fā)數(shù)據(jù)傳輸率(Burstdatatransferrate)。內(nèi)部數(shù)據(jù)傳輸率也被稱作硬盤的持續(xù)傳輸率(SustainedTransferRate),指磁頭至硬盤緩存間的數(shù)據(jù)傳輸率,一般取決于硬盤的盤片轉(zhuǎn)速和盤片數(shù)據(jù)線密度(指同一磁道上的數(shù)據(jù)間隔度)。也叫持續(xù)數(shù)據(jù)傳輸率(sustainedtransferrate)。目前硬盤的的性能瓶頸主要是內(nèi)部數(shù)據(jù)傳輸率,一般取決于硬盤的轉(zhuǎn)速和盤片線性密度。一般來講,硬盤的轉(zhuǎn)速相同時,單碟容量大的內(nèi)部傳輸率高;在單碟容量相同時,轉(zhuǎn)速高的硬盤的內(nèi)部傳輸率高。只有內(nèi)部傳輸率向外部傳輸率接近靠攏,有效地提高硬盤的內(nèi)部傳輸率才能對性能有最直接、最明顯的提升。常用參數(shù)及術(shù)語緩沖區(qū)容量(BufferSize):很多人也稱之為緩存(Cache)容量,單位為MB。在一些廠商資料中還被寫作CacheBuffer。緩沖區(qū)的基本要作用是平衡內(nèi)部與外部的DTR。為了減少主機的等待時間,硬盤會將讀取的資料先存入緩沖區(qū),等全部讀完或緩沖區(qū)填滿后再以接口速率快速向主機發(fā)送。這主要體現(xiàn)在三個方面:預(yù)取(Prefetch),實驗表明在典型情況下,至少50%的讀取操作是連續(xù)讀取。預(yù)取功能簡單地說就是硬盤“私自”擴大讀取范圍,在緩沖區(qū)向主機發(fā)送指定扇區(qū)數(shù)據(jù)(即磁頭已經(jīng)讀完指定扇區(qū))之后,磁頭接著讀取相鄰的若干個扇區(qū)數(shù)據(jù)并送入緩沖區(qū),如果后面的讀操作正好指向已預(yù)取的相鄰扇區(qū),即從緩沖區(qū)中讀取而不用磁頭再尋址,提高了訪問速度。寫緩存(WriteCache),當硬盤接到寫入數(shù)據(jù)的指令之后,并不會馬上將數(shù)據(jù)寫入到盤片上,而是先暫時存儲在緩存里,然后發(fā)送一個“數(shù)據(jù)已寫入”的信號給系統(tǒng),這時系統(tǒng)就會認為數(shù)據(jù)已經(jīng)寫入,并繼續(xù)執(zhí)行下面的工作,而硬盤則在空閑(不進行讀取或?qū)懭氲臅r候)時再將緩存中的數(shù)據(jù)寫入到盤片上。雖然對于寫入數(shù)據(jù)的性能有一定提升,但也不可避免地帶來了安全隱患——如果數(shù)據(jù)還在緩存里的時候突然掉電,那么這些數(shù)據(jù)就會丟失。對于這個問題,硬盤廠商們自然也有解決辦法:掉電時,磁頭會借助慣性將緩存中的數(shù)據(jù)寫入零磁道以外的暫存區(qū)域,等到下次啟動時再將這些數(shù)據(jù)寫入目的地;為了進一步提高效能,現(xiàn)在的廠商基本都應(yīng)用了分段式緩存技術(shù)(MultipleSegmentCache),將緩沖區(qū)劃分成多個小塊,存儲不同的寫入數(shù)據(jù),而不必為小數(shù)據(jù)浪費整個緩沖區(qū)空間,同時還可以等所有段寫滿后統(tǒng)一寫入,性能更好。讀緩存(ReadCache),將讀取過的數(shù)據(jù)暫時保存在緩沖區(qū)中,如果主機再次需要時可直接從緩沖區(qū)提供,加快速度。讀緩存同樣也可以利用分段技術(shù),存儲多個互不相干的數(shù)據(jù)塊,緩存多個已讀數(shù)據(jù),進一步提高緩存命中率。
8.單碟容量(storageperdisk):由于硬盤都是由一個或幾個盤片組成的,所以單碟容量就是指包括正反兩面在內(nèi)的每個盤片的總?cè)萘俊蔚萘康奶岣咭馕吨a(chǎn)廠商研發(fā)技術(shù)的提高,這所帶來的好處不僅是使硬盤容量得以增加,而且還會帶來硬盤性能的相應(yīng)提升。因為單碟容量的提高就是盤片磁道密度每英寸的磁道數(shù))的提高,磁道密度的提高不但意味著提高了盤片的磁道數(shù)量,而且在磁道上的扇區(qū)數(shù)量也得到了提高,所以盤片轉(zhuǎn)動一周,就會有更多的扇區(qū)經(jīng)過磁頭而被讀出來,這也是相同轉(zhuǎn)速的硬盤單碟容量越大內(nèi)部數(shù)據(jù)傳輸率就越快的一個重要原因。此外單碟容量的提高使線性密度(每英寸磁道上的位數(shù))也得以提高,有利于硬盤尋道時間的縮短。9.連續(xù)無故障時間(MTBF):指硬盤從開始運行到出現(xiàn)故障的最長時間,單位為小時。一般硬盤的MTBF都在80000到140000小時之間。事實上從實際應(yīng)用的表現(xiàn)上看,硬盤的失效曲線與其它元器件不同,這個連續(xù)無故障時間的參考意義并不大。相關(guān)內(nèi)容可參考后續(xù)的失效模式宣傳文檔。磁頭起停方式CSS方式傳統(tǒng)上硬盤采用接觸起停(ContactStart-Stop,CSS)方式,磁頭在硬盤關(guān)閉時“休息”在盤片表面上。硬盤加電啟動時,承載磁頭的滑橇(slider)在盤片表面滑行,直到盤片旋轉(zhuǎn)的速度快到兩者之間產(chǎn)生足以將滑橇托起來的氣墊為止。關(guān)閉硬盤時可以看作是啟動的逆過程。盤片上供磁頭“起飛”和“降落”的特定區(qū)域被稱為磁頭起停區(qū),它位于緊靠主軸馬達的盤片最內(nèi)側(cè)部分。為了防止滑橇黏連在光滑的盤片表面上影響其轉(zhuǎn)動起來,磁頭起停區(qū)表面刻有預(yù)制的紋理,不用于存儲數(shù)據(jù)在硬盤處于非操作狀態(tài)下時,磁頭??吭诒P片內(nèi)圈(專門劃分出來的非數(shù)據(jù)區(qū),如圖3-10中紅箭頭所示的區(qū)域)。只有當盤片轉(zhuǎn)速達到一定程度之后,磁頭才會浮起進入數(shù)據(jù)區(qū)。同樣,當硬盤斷電后,磁頭先回到起停區(qū)后后,盤片才會慢慢停止轉(zhuǎn)動。需要說明一下的是,起停區(qū)的表面并非光滑如鏡的,而是存在細小的波紋,就像丘陵一樣。這是為了使盤片在高速運轉(zhuǎn)過程中,磁頭能夠更好的獲取空氣浮力。否則,如果因電壓不穩(wěn),磁頭異常??吭跀?shù)據(jù)區(qū)。那么下次上電時,磁頭將無法飛起。換句話說,硬盤將無法繼續(xù)使用。磁頭起停方式Rampload方式:RampLoad的原理是在盤片外面設(shè)置一個支架,上面有逐漸升高的斜坡,硬盤關(guān)閉之前磁頭被從盤片上方移出并沿斜坡抬起(磁頭臂)卡在特定的位置,等到下次加電啟動旋轉(zhuǎn)到足夠的速度后再釋放回盤片上方.硬盤突然掉電時磁頭能夠自動會到支架上。比較這兩種技術(shù)我們可以知道RampLoad斜坡加載技術(shù)有如下優(yōu)點:降低了磁頭與盤片發(fā)生接觸的幾率:硬盤關(guān)閉時磁頭在盤片外,不會有接觸(加強抗振)。硬盤運轉(zhuǎn)起來后,如果處于空閑(Idle)狀態(tài),磁頭也可以回到支架上,而不是一直在盤片上空飛行(降低功耗和噪音)。改善了硬盤的抗震能力,原本用于磁頭起停區(qū)的空間也可以用來存儲數(shù)據(jù)(提高容量),還有助于增加硬盤的起/停次數(shù)(由此導(dǎo)致的磨損大為減少)。我們可以得出結(jié)論,RampLoad比CSS方式更為先進并能降低成本。從實際應(yīng)用上來說,WD和日立早已全面采用RampLoad方式。而希捷自從解決專利受限的問題后,08年10月份以后生產(chǎn)的硬盤也告別了CSS方式。三、硬盤的工作原理
硬盤在邏輯上被劃分為磁道、柱面以及扇區(qū).
硬盤的每個盤片的每個面都有一個讀寫磁頭,磁盤盤面區(qū)域的劃分如下:
磁頭靠近主軸接觸的表面,即線速度最小的地方,是一個特殊的區(qū)域,它不存放任何數(shù)據(jù),稱為啟停區(qū)或著陸區(qū)(LandingZone),啟停區(qū)外就是數(shù)據(jù)區(qū)。在最外圈,離主軸最遠的地方是“0”磁道,硬盤數(shù)據(jù)的存放就是從最外圈開始的。那么,磁頭是如何找到“0”磁道的位置的呢?在硬盤中還有一個叫“0”磁道檢測器的構(gòu)件,它是用來完成硬盤的初始定位?!?”磁道是如此的重要,以致很多硬盤僅僅因為“0”磁道損壞就報廢,這是非??上У?。
硬盤不工作時,磁頭停留在啟停區(qū),當需要從硬盤讀寫數(shù)據(jù)時,磁盤開始旋轉(zhuǎn)。旋轉(zhuǎn)速度達到額定的高速時,磁頭就會因盤片旋轉(zhuǎn)產(chǎn)生的氣流而抬起,這時磁頭才向盤片存放數(shù)據(jù)的區(qū)域移動。盤片旋轉(zhuǎn)產(chǎn)生的氣流相當強,足以使磁頭托起,并與盤面保持一個微小的距離。這個距離越小,磁頭讀寫數(shù)據(jù)的靈敏度就越高,當然對硬盤各部件的要求也越高。早期設(shè)計的磁盤驅(qū)動器使磁頭保持在盤面上方幾微米處飛行。稍后一些設(shè)計使磁頭在盤面上的飛行高度降到約0.1μm~0.5μm,現(xiàn)在的水平已經(jīng)達到5-10nm,這只是人類頭發(fā)直徑的千分之一。氣流既能使磁頭脫離開盤面,又能使它保持在離盤面足夠近的地方,非常緊密地跟隨著磁盤表面呈起伏運動,使磁頭飛行處于嚴格受控狀態(tài)。磁頭必須飛行在盤面上方,而不是接觸盤面,這種位置可避免擦傷磁性涂層,而更重要的是不讓磁性涂層損傷磁頭。但是,磁頭也不能離盤面太遠,否則,就不能使盤面達到足夠強的磁化,難以讀出盤上的磁化翻轉(zhuǎn)(磁極轉(zhuǎn)換形式,是磁盤上實際記錄數(shù)據(jù)的方式)。硬盤驅(qū)動器磁頭的飛行懸浮高度低、速度快,一旦有小的塵埃進入硬盤密封腔內(nèi),或者一旦磁頭與盤體發(fā)生碰撞,就可能造成數(shù)據(jù)丟失,形成壞塊,甚至造成磁頭和盤體的損壞。所以,硬盤系統(tǒng)的密封一定要可靠,在非專業(yè)條件下絕對不能開啟硬盤密封腔,否則,灰塵進入后會加速硬盤的損壞。另外,硬盤驅(qū)動器磁頭的尋道伺服電機多采用音圈式旋轉(zhuǎn)或直線運動步進電機,在伺服跟蹤的調(diào)節(jié)下精確地跟蹤盤片的磁道,所以,硬盤工作時不要有沖擊碰撞,搬動時要小心輕放。
。二、硬盤的讀寫原理系統(tǒng)將文件存儲到磁盤上時,按柱面、磁頭、扇區(qū)的方式進行,即最先是第1磁道的第一磁頭下(也就是第1盤面的第一磁道)的所有扇區(qū),然后,是同一柱面的下一磁頭,……,一個柱面存儲滿后就推進到下一個柱面,直到把文件內(nèi)容全部寫入磁盤。系統(tǒng)也以相同的順序讀出數(shù)據(jù)。讀出數(shù)據(jù)時通過告訴磁盤控制器要讀出扇區(qū)所在的柱面號、磁頭號和扇區(qū)號(物理地址的三個組成部分)進行。磁盤控制器則
接使磁頭部件步進到相應(yīng)的柱面,選通相應(yīng)的磁頭,等待要求的扇區(qū)移動到磁頭下。在扇區(qū)到來時,磁盤控制器讀出每個扇區(qū)的頭標,把這些頭標中的地址信息與期待檢出的磁頭和柱面號做比較(即尋道),然后,尋找要求的扇區(qū)號。待磁盤控制器找到該扇區(qū)頭標時,根據(jù)其任務(wù)是寫扇區(qū)還是讀扇區(qū),來決定是轉(zhuǎn)換寫電路,還是讀出數(shù)據(jù)和尾部記錄。找到扇區(qū)后,磁盤控制器必須在繼續(xù)尋找下一個扇區(qū)之前對該扇區(qū)的信息進行后處理。如果是讀數(shù)據(jù),控制器計算此數(shù)據(jù)的ECC碼,然后,把ECC碼與已記錄的ECC碼相比較。如果是寫數(shù)據(jù),控制器計算出此數(shù)據(jù)的ECC碼,與數(shù)據(jù)一起存儲。在控制器對此扇區(qū)中的數(shù)據(jù)進行必要處理期間,磁盤繼續(xù)旋轉(zhuǎn)。
硬盤失效控制因素非法關(guān)機
意外停電/斷電非法關(guān)機輸入輸出電源不穩(wěn)定
etc其他避免靠近強磁場
etc溫濕度溫度濕度
etc灰塵手推車包裝桌面ESD測試儀
etc振動服務(wù)器/陣列轉(zhuǎn)移沖床影響硬盤轉(zhuǎn)移etc靜電
禁止觸摸硬盤的電路板
ESD入門檢測工作臺接地引起硬盤mishandling的因素一、非法關(guān)機硬盤在工作時是不能突然斷電和非法關(guān)機的,這點大家要切記,這也是使硬盤最容易產(chǎn)生壞道的重要原因之一。原因很簡單:當硬盤在工作中時,盤片處于高速運轉(zhuǎn)狀態(tài),磁頭停留在盤片的不同位置讀取磁盤中存放的數(shù)據(jù)。如果中途突然斷電,磁頭便會迅速做歸位動作,則可能導(dǎo)致磁頭與盤片磨擦而損壞硬盤盤片。因此在工作中,千萬要避免突然斷電導(dǎo)致非法關(guān)機,另外其它的非法關(guān)機操作也要盡量的避免。再者windows自帶重新啟動功能也盡量少用,因為這一功能會使硬盤在瞬間突然斷電加電,也極容易引起硬盤的各種故障,如果需要重新啟動,則正確的方法是在電腦關(guān)閉10秒鐘以后再按開機按鈕打開電腦。
二、灰塵
如果在灰塵嚴重的環(huán)境下長期工作,硬盤很容易吸引空氣中的灰塵顆粒,使其長期積累在硬盤的內(nèi)部電路元器件上,會影響電子元器件的熱量散發(fā),使得電路元器件的溫度上升,產(chǎn)生漏電或燒壞元件?;覊m也可能吸收水分,腐蝕硬盤內(nèi)部的電子線路,造成一些莫名其妙的問題,所以灰塵體積雖小,但對硬盤的危害是絕對不可低估。因此必須保持環(huán)境衛(wèi)生,減少空氣中的潮濕度和含塵量。
灰塵對硬盤的損害是非常大的,可以說灰塵是硬盤的頭號殺手。大家知道硬盤的磁頭與盤片接觸是十分緊密的,不允許有半點的灰塵,如果灰塵落入硬盤盤片上后,那么就意味著硬盤離損壞為期不晚。一定要切記的是:普通的用戶千不要自行拆開硬盤蓋,否則空氣中的灰塵極其容量進入硬盤內(nèi),有些時候你是無法用肉眼看得到的,灰塵但在不經(jīng)意是落入到盤片上,在磁頭進行讀、寫操作時劃傷盤片或磁頭。三、振動
硬盤的制造過程十分的復(fù)雜,工藝十分精密,雖然各大硬盤廠商都在硬盤中加入了防震抗摔功能,但碰撞和震動依然是困繞硬盤的幾大殺手之一。過度的碰撞和長期工作在震動的環(huán)境下極易造成硬盤盤片與磁頭結(jié)合不嚴密,甚至有磁頭斷裂的現(xiàn)象,特別是在硬盤工作中,后果將會更加的嚴重。因此,一定要將硬盤緊密的固定的機箱內(nèi)部,上緊每一顆螺絲。另外工作過程不要直接移動硬盤和移動機箱,需要將服務(wù)器/硬盤陣列移動位置時切記要輕拿輕放,防止硬盤碰撞造成損壞。四、靜電靜電對電腦硬盤的損害大家也許再熟悉不過了,對于硬盤而言,其背部的電路版同樣會受到靜電的傷害。因些,不能用手隨便地觸摸硬盤背面的電路板。這是因為在氣候干燥時,人體通常帶有靜電,在這種情況下用手觸摸硬盤背面的電路板,則人體靜電就可能傷害到硬盤上的電子元器件,導(dǎo)致硬盤無法正常運行。在用手拿硬盤時應(yīng)該抓住硬盤兩側(cè),并避免與其背面的電路板直接接觸。有些類型的硬盤會在其外部包上一層護膜,它除具備防震功能外,更把電路板保護其中,這樣我們就可以不用太過擔(dān)心什么靜電了。五、溫濕度
溫度對硬盤的壽命也是有很大影響的。硬盤工作時會產(chǎn)生一定熱量,使用中存在散熱問題。溫度以20~30℃為宜,過高或過低都會使晶體振蕩器的時鐘主頻發(fā)改變。溫度還會造成硬盤電路元器件失靈,磁介質(zhì)也會因熱脹效應(yīng)而造成記錄錯誤。溫度過低,空氣中的水分會被凝結(jié)在集成電路元器件上,造成短路。濕度過高時,電子元器件表面可能會吸附一層水膜,氧化、腐蝕電子線路以致接觸不良,甚至短路,還會使磁介質(zhì)的磁力發(fā)生變化,造成數(shù)據(jù)的讀寫錯誤;濕度過低,容易積累大量的因機器轉(zhuǎn)動而產(chǎn)生的靜電荷,從而燒壞電路,吸附灰塵而損壞磁頭、劃傷磁盤片。機房內(nèi)的濕度以40~60%為宜。注意使空氣保持干燥或經(jīng)常給系統(tǒng)加電,靠自身發(fā)熱將機內(nèi)水汽蒸發(fā)掉。市場溫度條件建議以20~30℃為宜,濕度40~60%為宜。如果在低溫環(huán)境(低于20C)下打開硬盤包裝,要允許硬盤有時間將溫度穩(wěn)定下來,避免因冷凝作用而損壞硬盤。六、其他因素
盡量不要使硬盤靠近強磁場,如音箱、喇叭、電機、電臺、手機等,以免硬盤所記錄的數(shù)據(jù)因磁化而損壞.還有一些其他意外的隱患也要考慮進去。例如我兩次在外協(xié)廠都看到老鼠亂竄的問題。我們也得引起重視,防止老鼠咬到線路。
建議繼續(xù)深化和加強5S工作稽查。加強員工操作培訓(xùn)。硬盤故障分析工具和手段探討10/13/2009硬盤出現(xiàn)故障的原因硬盤出現(xiàn)故障的原因是多方面,有的與我們的非法操作相關(guān),有的是硬盤本身的FW問題和元器件問題,也有的可能和我們的測試環(huán)境和硬盤環(huán)境匹配問題(軟件和硬件)。而一旦硬盤出現(xiàn)了故障,因為受局限于廠家對自己分析工具和相關(guān)自有硬盤技術(shù)的保護,我們不可能自己做出一個完整的分析報告,如果要找出硬盤的故障的根本原因,最終還得參考廠家的分析報告。在我們自己公司里,唯一能參考的值就是SMART屬性表。下面我大概解釋下SMART的信息內(nèi)容。廠家工具對硬盤的判議標準關(guān)于廠家工具對硬盤的判議標準,簡單來說是以一個硬盤是不是能正常讀寫為標準,當然具體的會參考一些硬盤讀寫參數(shù)值和性能來判定。舉個例子,廠家的SMART信息除了可以看到我們SMART的屬性值外,還可以看到G-list,P-list,還有CELog(危險事件項)而在我們公司,現(xiàn)在判定硬盤好壞的標準,主要是集中在對SMART信息的分析上。S.M.A.R.T屬性表S.M.A.R.T.包含很多個屬性,每個屬性值只有兩種含義,超過閾值(threshold)和沒有超過閾值。一旦有屬性值超過了閾值,表明“硬盤已有了暇疵”。每個硬盤的S.M.A.R.T.信息中,都注明了這些屬性的閾值,不同廠家的閾值是不同的。不同的屬性值對于閾值的對比關(guān)系也有兩種情況,應(yīng)大于閾值,應(yīng)小于閾值和與閾值無關(guān)。不同的屬性也有不同的價值,下面用醒目顏色表明的是那些比較重要的屬性。S.M.A.R.T屬性值中各關(guān)鍵項的含義(一)01(01)讀取錯誤率ReadErrorRate(應(yīng)小于閾值)
硬件讀取錯誤率,在從磁盤表面讀取數(shù)據(jù)發(fā)生錯誤時記錄。任何大于0的數(shù)據(jù)表明在磁盤表面或者讀寫柱頭(read/write)時發(fā)生過問題。05(05)重新映射扇區(qū)計數(shù)ReallocatedSectorsCount(應(yīng)小于閾值)
重新映射扇區(qū)的計數(shù)值。硬盤發(fā)現(xiàn)一個讀、寫或校驗錯誤時,會將這個扇區(qū)重新映射(Reallocated)并將數(shù)據(jù)轉(zhuǎn)移到一個特殊的保留的空閑區(qū)域,這些區(qū)域就稱為重新映射扇區(qū)。也就是說,現(xiàn)代的硬盤是無法通過表明檢測來發(fā)現(xiàn)“壞塊”(BadBlocks)的,所有的壞塊都被隱藏到了重新映射的扇區(qū)里面了,當然這樣讀寫速度會變慢。09(09)通電時間計數(shù)Power-OnHoursCount,POH(越小越好,通常無閾值)
通電狀態(tài)下的小時計數(shù)。這個值表示了硬盤通電狀態(tài)下總計的小時計數(shù),不過不同廠家這個值的單位有所不同,也有以分鐘、秒鐘為單位的。10(0A)馬達重試計數(shù)SpinRetryCount(應(yīng)小于閾值)
馬達嘗試啟動的重試計數(shù)。這個屬性存儲了馬達為了達到標準轉(zhuǎn)速而進行的啟動嘗試的總計數(shù),即第一次啟動并不能成功達到標準轉(zhuǎn)速。這個屬性值的增加是一個標志,說明硬盤的機械系統(tǒng)可能出現(xiàn)了問題。12(0C)通電周期計數(shù)PowerCycleCount(越小越好,通常無閾值)
這個屬性表明了整個硬盤通電/去電周期的次數(shù),即開關(guān)次數(shù)。
S.M.A.R.T屬性值中各關(guān)鍵項的含義(二)194(C2)Temperature(越小越好,通常無閾值)
當前內(nèi)部溫度。196(C4)重新映射事件計數(shù)ReallocationEventCount(應(yīng)小于閾值)
重新映射操作的計數(shù)值。這個屬性值表明了將重新映射扇區(qū)的數(shù)據(jù)轉(zhuǎn)移到空閑區(qū)域的嘗試總次數(shù)。成功的轉(zhuǎn)移和不成功的轉(zhuǎn)移都會被計數(shù)。197(C5)當前待映射扇區(qū)計數(shù)CurrentPendingSectorCount(應(yīng)小于閾值)
“不穩(wěn)定的”扇區(qū)數(shù)量,即等待被映射的扇區(qū)數(shù)量。如果不穩(wěn)定的扇區(qū)隨后被讀寫成功,這個值會降低,扇區(qū)也不會重新映射。扇區(qū)會在寫入失敗時發(fā)生重新映射。這個值有時候會有問題,因為帶緩存寫入不會重新映射扇區(qū),只有直接讀寫才會真正寫入磁盤。198(C6)無法校正扇區(qū)計數(shù)UncorrectableSectorCount(應(yīng)小于閾值)
讀寫扇區(qū)時發(fā)生的無法校正的錯誤總計數(shù)。這個值上升表明硬盤缺損或者機械系統(tǒng)有問題。199(C7)直接內(nèi)存訪問校驗錯誤計數(shù)UltraDMACRCErrorCount(應(yīng)小于閾值)
通過接口循環(huán)冗余校驗(InterfaceCyclicRedundancyCheck,ICRC)發(fā)現(xiàn)的通過接口電纜進行數(shù)據(jù)傳輸?shù)腻e誤。200(C8)寫入錯誤率WriteErrorRate(應(yīng)小于閾值)
寫入一個扇區(qū)時發(fā)生錯誤的總數(shù)。SMARTSamplesSMART各值代表的含義1.屬性當前值(Attributevalue)屬性值是指硬盤出廠時預(yù)設(shè)的最大正常值,一般范圍為1~253。通常,最大的屬性值等于100(適用于IBM、富士通)或253(適用于三星)。當然,也有例外的時候,比如由西部數(shù)據(jù)公司生產(chǎn)的部分型號硬盤,就用了兩個不同的屬性值,最初生產(chǎn)時屬性值設(shè)為200,但后來生產(chǎn)的有些硬盤屬性值又改為100。2.最大出錯值(Worst)最大出錯值是硬盤運行中曾出現(xiàn)過的最大的非正常值。它是對硬盤累計運行的計算值,根據(jù)運行周期,該數(shù)值會不斷地刷新,并且會非常接近閾值。S.M.A.R.T分析和判定硬盤的狀態(tài)是否正常,就是根據(jù)這個數(shù)值和閾值的比較結(jié)果而定。新硬盤開始時有最大的屬性值,但隨著日常使用或出現(xiàn)錯誤,該值會不斷減小。因此,較大的屬性值意味著硬盤質(zhì)量較好而且可靠性較高,而較小的屬性值則意味著故障發(fā)生的可能性增大。3.實際值(Date)是硬盤各檢測項目運行中的實際數(shù)值,很多項目是累計值。例如:Start/StopCount(啟停次數(shù)),累計的實際值是436,即該硬盤從開始到現(xiàn)在累計加電啟停436次。4.屬性狀態(tài)(Status)這是S.M.A.R.T針對前面的各項屬性值進行比較分析后,提供的硬盤各屬性目前的狀態(tài),也是我們直觀判斷硬盤“健康”狀態(tài)的重要信息。根據(jù)S.M.A.R.T的規(guī)定,這種狀態(tài)一般有正常、警告和報告故障或錯誤等3種狀態(tài)。
5.閾值(Threshold)又稱門限值。是由硬盤廠商指定的可靠的屬性值,通過特定公式計算而得。如果有一個屬性值低于相應(yīng)的閾值,就意味著硬盤將變得不可靠,保存在硬盤里的數(shù)據(jù)也很容易丟失。可靠屬性值的組成和大小對不同硬盤來說是有差異的。這里需要注意的是,ATA標準中只規(guī)定了一些S.M.A.R.T參數(shù),它沒有規(guī)定具體的數(shù)值,“Threshold”的數(shù)值是廠商根據(jù)自己產(chǎn)品特性而確定的
其他硬盤分析工具和手段探討廠家工具?
硬件:沒有SAS連接卡,沒法進行失效分析。軟件:沒有日立SAS測試工具。自己開發(fā)工具?網(wǎng)上一些免費的分析工具?SN05產(chǎn)品的潛在隱患和經(jīng)驗教訓(xùn)2009/10/9SN05產(chǎn)品的潛在隱患和經(jīng)驗SN05硬盤與桌面電腦硬盤的區(qū)別是SN05增加了一個RVFF電路,其他所用的元器件完全一樣。RVFF電路(旋轉(zhuǎn)震動前向補償技術(shù)RotationalVibrationFeedForward),是為了減少了多個硬盤同時運作時出現(xiàn)的相互干擾問題,提高了RAID和其他多硬盤系統(tǒng)的性能及可靠性。所以SN05硬盤嚴格來說,還不是真正的企業(yè)級硬盤,這也是為什么它的性能與企業(yè)級硬盤有差距的一個原因。SN05是希捷的第一款在F3平臺上設(shè)計的Nearline產(chǎn)品的硬盤,它的firmware與Servecode設(shè)計上還不是很穩(wěn)定。在華賽和其他友商已發(fā)現(xiàn)有慢盤現(xiàn)象,廠商確定是由于固件問題引起的。經(jīng)過對現(xiàn)有SN05產(chǎn)品失效分析,發(fā)現(xiàn)主要的失效是集中在監(jiān)控產(chǎn)品上,而監(jiān)控產(chǎn)品讀寫壓力大。數(shù)據(jù)吞吐量大,在華賽硬盤進廠都會對它們進行帶寬測試和壓力測試。使硬盤在進廠時能及時發(fā)現(xiàn)問題。建議我們今后也增加這兩項測試。SN05硬盤還是采用CSS技術(shù),而西數(shù)產(chǎn)品用的是L/UL技術(shù)。而CSS技術(shù)對抵御外來震動和沖擊是非常不利的。希捷后續(xù)的SATA硬盤也全會采用L/UL技術(shù)。H3C硬盤PharaohmetSFgoalatlaunch5monthstomeetSFgoal通過希捷F3平臺設(shè)計的前兩款產(chǎn)品SN05(Moose)與Pharaoh的DPPM對比??梢钥闯龅诙頕3產(chǎn)品Pharaoh性能有了明顯的提高。H3C硬盤
Page47
?SeagateConfidentialMooseNLFailurePareto(FactoryeORTvsCustomerField)TheCustomerFieldFailureParetoshowedthattheHeadRelated,MediaRelated,CELFirmwareRelated,CNDandCustomerCausedfailurearethetopfailuremodesreturnedfromthefield.CND,NPF,Handing&CustomerInducedfailureshavecontributedto24.6%oftheCustomerFieldreturnspareto.TheeORTFailureParetoshowedthattheHeadRelated,ParticleRelatedandMediaRelatedfailuresarethetopfailuremodescapturedbytheeORTtestbed.CustomerFieldFailureParetoFactoryeORTFailureParetoMooseNLeORTtopfailureparetoiscorrelatingwellwiththeCustomerFieldifexcludingtheCELfirmwarebugissue.上面是希捷ORT數(shù)據(jù)與客戶失效數(shù)據(jù)對比結(jié)果,可以看出,在ORT和客戶兩邊,兩個最大的問題都是磁頭和碟片的問題。在客戶那邊,不復(fù)現(xiàn)(CND),沒發(fā)現(xiàn)(NPF)和非法操作引起的問題占了25%左右。HS最近SN05廠驗遭遇的問題(僅供內(nèi)部參考)09445批次后硬盤總的測試不良率還是在2%左右。
經(jīng)過質(zhì)量部門統(tǒng)計,質(zhì)量數(shù)據(jù)仍然高的驚人。
壞道失效率
4/572
0.7%
帶寬測試失效
6/572
1.0%
壓力測試失效
2/572
0.3%在帶寬測試中,軟件設(shè)定是將帶寬測試的閾值設(shè)定為80M(即81920K),認為是這一個合理的值。因為從正常硬盤測試的情況看,開始20G數(shù)據(jù)的帶寬通常都是105M-115M之間??紤]到盤的個體差異,乘以80%,帶寬應(yīng)該高于105*0.8=84M。因此最后設(shè)定的80M是一個比較保守的值上面例子是華賽針對09財年第44周希捷SN05產(chǎn)品所做的測試結(jié)果,這是在希捷給出改善措施之后的一個測量結(jié)果??梢钥闯鱿=萁o的改善措施沒有效,從這我們可以了解在華賽硬盤入廠所做的一些測試項目,和他們帶寬測試的閾值的設(shè)立背景。HS判定失效的一個依據(jù)華賽任務(wù)令:HPZ00970045
9QJ3ZCJY開始就是70多M,前10條記錄帶寬就變到30多M
9QJ41W77開始都是100多M,比較穩(wěn)定,后面10條記錄有一條記錄突然降到50多M
9QJ43MFA一直在100M左右中間,突然有一條記錄降到50多M
9QJ432RD中間出現(xiàn)兩條70多M的記錄
9QJ3YGWY中間一條記錄突然降到9M,然后18M,恢復(fù)平穩(wěn)
9QJ41QXA有70多M,40多M的記錄
9QJ43MKB中間有一條記錄81664.00,低于80M
華賽任務(wù)令:HPZ00970453
9QJ41SQ6中間有一條記錄帶寬是80128,低于80M
9QJ41TGB幾條70多M的記錄,中間有40多M的記錄
9QJ3YA4M有一條79M左右的記錄上面是華賽判定硬盤帶寬測試失效的其中一個依據(jù)。50
HS–MooseNLIntegration–HighPerformanceFailureBackgroundHuawei-ChinaencounteredDPPMspikeagainforMooseNLperformancerelatedissue(1%):OverallDPPMis2.5%.Failingsystem:OceanStorS3000storageserver.FailureDOMsarefrom0945,whichispostTargetOptimizationcode&Test598(10%)whichwasimplementedonApril27’th(WW0944).FurtherInvestigationrevealedthatHuaWeichangedtheIOPStestingfromruntime"(average)I/Oto(realtime)I/OwherereadtestatOD20G,setthresholdofbandwidthat"80M/sec“wherefailuresseen.NewIOPStest(RealTime)isnotusedonolderserverS5000&usedonlyonnewserverS3000.Competitordrive(WD)doesn’tfailsforIOPSwiththesamesettingsasusedforSTX.RootCauseFindings2xTargetOptiIssue,newFW(Dell-MA0CmrgdandHP-5A16)canfix100%.4x(3xHighprimarydefects@extremeOD,1xNMD)CorrectiveActionsUniqueTabwillensurenewFWandspecialscreeningforHuaWei.(PreviousperformancefailurespikewasclosedwithTargetOptimizationcode+Test598(+10%)–April27’th).ClosurePathUniquetabw/newFWcodereleased.ProcesscheckoutdueSep7,Thistoensure33%ofthefailuremodesarecapturedwithinSeagateprocessbasedonFAdonetodateSpecialscreentocapturetheseIOPSfailuresinprocess(monitorI/Operformancesynchronously,flushdata1timeper2s,UDEcount,higherchancetocreateallocation).WW1010>OpenImpact6KunitsareaffectedduetothisissueinJulyStartDate:14thJuly2009以上是希捷廠對華賽SN05問題的一個總結(jié)。TheSN05improvementactionforHSRegardingHuaweicustomerintegrationfailure,Factoryhasprovidedcorrectiveactionbyspecialbuildwithadditionalscreeningasmentionedbelow.
TheshipholdisrequiredfordistinguishthespecialcontrolshipmenttoHuaweibecauseHuaweiisnowusingthesameStdOEMtab-504.
AdditionalscreeningforHuaweiStdOEMtab504.
1)AddT598:ReadPerformancetest,extendedscreenonfirst20Gandnotallowretry
Thiswillhelp3/6MediadefectbaseonpreviousFAwith~50%FE
2)AdditionalscreeningatFIN2test(or'R-MQM')-TopupfromStdOEMMQM
ThisisadditionalformakesurebetterqualityforHuawei
Theadditionalscreeningstepare
Aggressivewrite/readatIDZone(or
“IDBeatUptest”)
Aggressivewrite/readatODZone
(or
“ODBeatUptest”)
ButterflyWrite(Highacceleratedseekwrite)
LongDST–Driveselftestwithfullsurfaceverify
3)AddT508/597testat60iops.
AddDriveperformancetestwithspecificpattern,allowlessthan60iops
ThiswillhelponslowperformancebasedonpreviousFA.
4)LimitthenumberofunrecoverabledefectsatFIN2test.
希捷給華賽的改善措施:1。增加讀性能測試區(qū)域,從原來OD區(qū)域的讀取12G增加到現(xiàn)在的20G,中間不允許有任何讀重試。這會減少50%關(guān)于盤片瑕疵的失效問題。2。用EMC篩選的方法對華賽硬盤進行篩選,(加強對ID/OD的順序讀寫,做ButterflyWrite和longDST測試)3,收緊傳輸率測試的規(guī)格。解決慢盤問題。4。限制不可恢復(fù)錯誤率的數(shù)目。H3C硬盤Xyratex/NetApp–-RVOpAmpNoiseissueBackgroundXyratexIntegrationMalaysiareportedtotal18xofMooseNLDellEqualLogic(-056)and2xNetApp(-038)failedwatchdogtimerduringreadwritecompareatFunctionaltest(WTOF).TotalDPPMimpactspecifictothisWTOFissueis7,530DPPM(20f/2,565usages)fromXyratexCalandarweek30-32.AllfailuresareMooseNL1TBRootCauseFindingsKoratFAconcludedall15xfailures(13xDellEqualLogicand2xNetApp)areslowperformanceissue.AllfailuresarefromWinbondDRAMwithDieRevE,90nmpart(W9425G6EH-5)withFairchildFAN4274op-amp.InitialFAbelievethisslowperformanceiscontributedbyWinbondRevE.(24/08/09)FArootcauseisconfirmedtobethenoisecouplingintotheRVOpAmpcircuitrywascausingfalseshockdetects.ThislimitedtothecircuitboardUJAJ-6PCBA,ie750GBand1TBonly.IssueonlyoccurswithWinbondDRAMRev.E/FairchildOpAmpcombinationCorrectiveActionsSSO#672wasinitiatedtocontainthisissuetillissueisfullyunderstood.(Wasana-20/08/09)NewXyratex/DellEqualLogic/NetAppMooseNL750GB/1TBFW1008loadingonwardsstopsupplyingWinbondRev.E/FairchildcombinationeveniftheyarescreenedandfoundtobeworkingClosurePathHubinventories/shippedoutquantityaffectedtoquantifyriskassessment.(Kulthida-26/08/09)Xyratex/NetAppCTSprovidedaformalnotificationtocustomer.(Tony-25/08/09,Lynn-27/08/09)XyratexrequestedaStopShipofJITHubinventories.Allaffecteddriveswillbepulledbacktofactoryfordisposition.(Gordon-26/08/09)CTSmonitoringintegrationperformanceImpactXyratex/DellEqualLogicrequiredHubinventoriespurgetotal1,454drives,pendingpullbackNetAppnoHubinventoriespurgerequiredduetolowquantityaffectedremaininginHub,25drivesCustomerescalationStartDate:24082009這個問題應(yīng)該對華三SN05產(chǎn)品沒有影響,因為這個PCBA芯片是在09年六月底開始引進的。而那時華三已經(jīng)停止采購SN05硬盤了。硬盤采購和選型的參考硬盤不同OEM等級標準客戶的規(guī)格要求不同的客戶有不同的測試參數(shù)要求。通常希捷會滿足大客戶一些比較苛刻的硬盤性能參數(shù)要求。希捷SN05下代替代產(chǎn)品的設(shè)計區(qū)別
4diskdesignusesacompletelydifferentmotordesignwhichhasoilcirculation,notsusceptibletoairingestionUsedinseveralgenerationsMCproductswithgoodperformanceOilcirculationdesignwhichisselfpurgingandnotsusceptibletoairingestiondiamondcoatingonbearingsurfacesforincreasedwearresistance
2diskdesignissupplierdependentandusesoilcirculationinonedesignandimprovedbearingmaterialsandprocessesinanother2DMotorSupplierIBearingdesignincludesarecirculationpathlikethedualconicalmotorsAdjustableoilflowdependingonbearingtolerances,eliminatingthepotentialforsub-ambientpressureandairingestionJournalbearingsformedbydifferentprocessesandimprovedmaterials(chemicalmillingisnotused)2DMotorSupplierIISPbearingsimilartoMoosebutwithimprovedmaterialsandprocessesJournalsmotorareformedusingarollingoperationandnotsusceptibletothetaperproblemfromchemicalmillingelectrodewear
?SeagateConfidentialPage55SeagatenewModel-MuskieEnhancementsReducedexposedaluminuminsideHDAforparticlereductionIncreasedservosamplingrate(31.7to50kHz)andPRseeksforofftrackerrorsLULdesignforincreasedHeadMediainterfacerobustness4thgenerationperpendicularmediawithimprovedparticlerobustnessBlendedlubricantforimprovedLULperformanceConicaltopcoverattachedmotoron4D56CSS與L/UL技術(shù)對比傳統(tǒng)上硬盤采用接觸起停(ContactStart-Stop,CSS)方式,磁頭在硬盤關(guān)閉時“休息”在盤片表面上。硬盤加電啟動時,承載磁頭的滑橇(slider)在盤片表面滑行,直到盤片旋轉(zhuǎn)的速度快到兩者之間產(chǎn)生足以將滑橇托起來的氣墊為止。關(guān)閉硬盤時可以看作是啟動的逆過程。盤片上供磁頭“起飛”和“降落”的特定區(qū)域被稱為磁頭起停區(qū),它位于緊靠主軸馬達的盤片最內(nèi)側(cè)部分。為了防止滑橇黏連在光滑的盤片表面上影響其轉(zhuǎn)動起來,磁頭起停區(qū)表面刻有預(yù)制的紋理,不用于存儲數(shù)據(jù)。CSS方式最大的缺點是磁頭始終在盤片上方(所謂“上”是相對的,也有可能是下方),這對抵御外來震動是非常不利的:硬盤處于關(guān)閉狀態(tài)時,震動可能導(dǎo)致slider脫離盤片表面而后又拍擊下來,碰撞輕則會產(chǎn)生危及正常運行的碎屑,重則導(dǎo)致磁頭損毀;硬盤運轉(zhuǎn)起來后,震動不僅會增大磁頭因碰撞而損毀的可能性,還加上了劃傷盤片的威脅CSS區(qū)不存儲任何數(shù)據(jù),也沒有盤片上的數(shù)據(jù)區(qū)那樣光滑。在運輸或關(guān)機等狀態(tài)下磁頭停泊在這里,通電之后主軸馬達帶動盤片旋轉(zhuǎn),達到一定轉(zhuǎn)速后磁頭在空氣升力的作用下脫離盤片表面浮起,此時音圈馬達動作使線圈尾部突起脫離磁頭限位桿上的磁鐵,磁頭就可以自由地在盤片上空飛翔了;而當電源被切斷之后,馬達線圈尾部又會轉(zhuǎn)向磁鐵并被其吸附,磁頭則在逐漸減速的CSS區(qū)上著陸。這種接觸啟/停方式無疑是有磨損的,通常廠家標稱的壽命是數(shù)萬次啟/停循環(huán)。Load/UnLoad磁頭加載/卸載技術(shù):取消了盤片最內(nèi)圈的CSS區(qū),之前由于CSS區(qū)的存在,磁盤的內(nèi)圈被浪費了,通過HeadLoad/Unload機制,可以去掉著陸區(qū)的設(shè)計,提高硬盤的單碟容量,并可以更好地保護非加電狀態(tài)下的硬盤磁頭。在盤片外設(shè)立
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 灌渠施工方案
- 2024年專項安全管理制度
- 2024年中國生物柴油行業(yè)概覽(精簡版) -頭豹
- 畢業(yè)答辯報告-心臟疾病研究模板
- 2025年電動車銷售與租賃服務(wù)合同范本2篇
- 2025年個人貨運車輛運輸合同環(huán)保要求及執(zhí)行標準4篇
- 計算機及應(yīng)用課程設(shè)計
- 談數(shù)學(xué)課程設(shè)計
- 鉆銑夾具課程設(shè)計
- 2024年學(xué)校安全的工作匯報
- DB33T 2570-2023 營商環(huán)境無感監(jiān)測規(guī)范 指標體系
- 上海市2024年中考英語試題及答案
- 房屋市政工程生產(chǎn)安全重大事故隱患判定標準(2024版)宣傳海報
- 垃圾車駕駛員聘用合同
- 2025年道路運輸企業(yè)客運駕駛員安全教育培訓(xùn)計劃
- 南京工業(yè)大學(xué)浦江學(xué)院《線性代數(shù)(理工)》2022-2023學(xué)年第一學(xué)期期末試卷
- 2024版機床維護保養(yǎng)服務(wù)合同3篇
- 《論拒不執(zhí)行判決、裁定罪“執(zhí)行能力”之認定》
- 工程融資分紅合同范例
- 2024國家安全員資格考試題庫加解析答案
- 通信工程建設(shè)標準強制性條文匯編(2023版)-定額質(zhì)監(jiān)中心
評論
0/150
提交評論