版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
精品文檔交流精品文檔交流Windows性能計(jì)數(shù)器-- 磁盤性能分析 DiskPhysicalDisk :單次IO大小Avg.DiskBytes/ReadAvg.DiskBytes/WriteIO響應(yīng)時(shí)間Avg.Disksec/Read 磁盤每次讀取需要的時(shí)間,一般不超過一般不要超過11~15ms。Avg.Disksec/Write 一般小于每秒讀/寫的IO數(shù))理論情況下,磁盤的隨機(jī)讀計(jì)數(shù)為 、 順序讀計(jì)數(shù)為 實(shí)際測試值與理論值對比,從而判斷磁盤是否為瓶頸DiskReads/secDiskWrites/secDiskTransfers/secIO吞吐率(磁盤每秒讀 /寫字節(jié)數(shù))DiskBytes/secDiskReadBytes/secDiskWriteBytes/sec磁盤隊(duì)列長度Avg.DiskQueueLength :磁盤平均隊(duì)列長度不應(yīng)超過 2,即:隊(duì)列長度/磁盤數(shù)磁盤有兩個(gè)重要的參數(shù): Seektime、Rotational latency 。正常的I/O計(jì)數(shù)為:①1000/(Seektime+Rotationallatency)*0.75,在此范圍內(nèi)屬正常。當(dāng)達(dá)到%的I/O計(jì)數(shù)以上時(shí)則基本認(rèn)為已經(jīng)存在I/O瓶頸。理論、順序讀計(jì)數(shù)為。對于數(shù)據(jù)文件而言是隨機(jī)讀寫,日志文件是順序讀寫。因此,數(shù)據(jù)文件建議存放于RAID5件存放于RAID10或RAID1中。附:00IOPS00IOPS0:0IOPS下面假設(shè)在有 4塊硬盤的RAID5中觀察到的 PhysicalDisk 性能對象的部值:Avg.DiskQueueLength12 隊(duì)列長度Avg.DiskSec/Read.035 讀數(shù)據(jù)所用時(shí)間 msAvg.DiskSec/Write.045 寫數(shù)據(jù)所用時(shí)間 DiskReads/sec320 每秒讀數(shù)據(jù)量DiskWrites/sec100 每秒寫數(shù)據(jù)量Avg.DiskQueueLength ,12/4=3,每塊磁盤的平均隊(duì)列建議不超過 2Avg.DiskSec/Read 一般不要超過 。Avg.DiskSec/Write 一般建議小于 。從上面的結(jié)果,我們看到磁盤本身的 I/O 能力是滿足我們的要求的, 原因是因有大量的請求才導(dǎo)致隊(duì)列等待, 這很可能是因?yàn)槟愕?語句導(dǎo)致大量的表掃描所致。在進(jìn)行優(yōu)化后,如果還是不能達(dá)到要求, 下面的公式可以幫助你計(jì)算使用幾塊硬盤可以滿足這樣的并發(fā)要求 :Raid0--I/Osperdisk=(reads+writes)/numberofdisksRaid1--I/Osperdisk=[reads+(2*writes)]/2Raid5--I/Osperdisk=[reads+(4*writes)]/numberofdisksRaid10--I/Osperdisk=[reads+(2*writes)]/numberofdisks我們得到的結(jié)果是: (320+400)/4=180,這時(shí)你可以根據(jù)公式①來得到磁盤的正常I/O值。假設(shè)現(xiàn)在正常 I/O計(jì)數(shù)為為了達(dá)到這個(gè)結(jié)果: 720/125=5.76。就是說要用 6塊磁盤才能達(dá)到這樣的要求。但是上面的 DiskReads/sec 和DiskWrites/sec 是個(gè)很難正確估算的值。因此只能在系統(tǒng)比較忙時(shí),大概估算一個(gè)平均值, 作為計(jì)算公式的依據(jù)。 另一個(gè)是很難從客戶那里得到 Seektime、Rotationallatency 參數(shù)的值,這也只能用理論值125進(jìn)行計(jì)算。前言作為一個(gè)數(shù)據(jù)庫管理員,關(guān)注系統(tǒng)的性能是日常最重要的工作之一, 而在所關(guān)的各方面的性能只能 IO性能卻是最令人頭痛的一塊,面對著各種生澀的參數(shù)和令人眼花繚亂的新奇的術(shù)語, 再加上存儲(chǔ)廠商的忽悠,總是讓我們有種云里霧里的感覺本系列文章試圖從基本概念開始對磁盤存儲(chǔ)相關(guān)的各種概念進(jìn)行綜合歸納,讓大家能夠?qū)?IO性能相關(guān)的基本概念, IO性能的監(jiān)控和調(diào)整有個(gè)比較全面的了解。在這一部分里我們先舍棄各種結(jié)構(gòu)復(fù)雜的存儲(chǔ)系統(tǒng), 直接研究一個(gè)單獨(dú)的磁盤性能問題,藉此了解各個(gè)衡量 IO系統(tǒng)系能的各個(gè)指標(biāo)以及之間的關(guān)系。幾個(gè)基本的概念在研究磁盤性能之前我們必須先了解磁盤的結(jié)構(gòu), 以及工作原理。不過在這里不再重復(fù)說明了,關(guān)系硬盤結(jié)構(gòu)和工作原理的信息可以參考維基百科上面的相關(guān)詞條——Harddiskdrive (英文)和硬盤驅(qū)動(dòng)器(中文)。讀寫 IO(Read/WriteIO) 操作磁盤是用來給我們存取數(shù)據(jù)用的,因此當(dāng)說到 IO操作的時(shí)候,就會(huì)存在兩種相對應(yīng)的操作,存數(shù)據(jù)時(shí)候?qū)?yīng)的是寫 IO操作,取數(shù)據(jù)的時(shí)候?qū)?yīng)的是讀 IO作。單個(gè) IO操作當(dāng)控制磁盤的控制器接到操作系統(tǒng)的讀 IO操作指令的時(shí)候,控制器就會(huì)給磁盤發(fā)出一個(gè)讀數(shù)據(jù)的指令,并同時(shí)將要讀取的數(shù)據(jù)塊的地址傳遞給磁盤, 然后磁盤會(huì)將讀取到的數(shù)據(jù)傳給控制器,并由控制器返回給操作系統(tǒng),完成一個(gè)寫 IO操作;同樣的,一個(gè)寫IO的操作也類似,控制器接到寫的 IO操作的指令和要寫入的數(shù)據(jù),并將其傳遞給磁盤,磁盤在數(shù)據(jù)寫入完成之后將操作結(jié)果傳遞回控制器,再由控制器返回給操作系統(tǒng), 完成一個(gè)寫IO的操作。單個(gè)IO操作指的就是完成一個(gè)寫 IO或者是讀IO的操作。隨機(jī)訪問(RandomAccess)與連續(xù)訪問 Access)隨機(jī)訪問指的是本次 IO所給出的扇區(qū)地址和上次 IO給出扇區(qū)地址相差比較大這樣的話磁頭在兩次 IO操作之間需要作比較大的移動(dòng)動(dòng)作才能重新開始讀 /寫數(shù)據(jù)。相反的,如果當(dāng)次 IO給出的扇區(qū)地址與上次 IO結(jié)束的扇區(qū)地址一致或者是接近的話,那磁頭就能很快的開始這次 IO操作這樣的多個(gè) IO操作稱為連訪問。因此盡管相鄰的兩次 IO操作在同一時(shí)刻發(fā)出,但如果它們的請求的扇區(qū)地址相差很大的話也只能稱為隨機(jī)訪問,而非連續(xù)訪問。順序 IO模式(QueueMode)/并發(fā) IO模式(BurstMode)磁盤控制器可能會(huì)一次對磁盤組發(fā)出一連串的 IO命令,如果磁盤組一次只能執(zhí)行一個(gè)IO命令時(shí)稱為順序 IO;當(dāng)磁盤組能同時(shí)執(zhí)行多個(gè) IO命令時(shí),稱為并IO。并發(fā)IO只能發(fā)生在由多個(gè)磁盤組成的磁盤組上,單塊磁盤只能一次處理一個(gè)IO命令。單個(gè) IO的大小(IOChunkSize)熟悉數(shù)據(jù)庫的人都會(huì)有這么一個(gè)概念,那就是數(shù)據(jù)庫存儲(chǔ)有個(gè)基本的塊大小(BlockSize) ,不管是SQLServer還是Oracle,默認(rèn)的塊大小都是 就是數(shù)據(jù)庫每次讀寫都是以 8k為單位的那么對于數(shù)據(jù)庫應(yīng)用發(fā)出的固定 8k大小的單次讀寫到了寫磁盤這個(gè)層面會(huì)是怎么樣的呢,就是對于讀寫磁盤來說單個(gè) IO操作操作數(shù)據(jù)的大小是多少呢, 是不是也是一個(gè)固定的值?答案是不確定。 首先操作系統(tǒng)為了提高 IO的性能而引入了文件系統(tǒng)緩存 (FileSystemCache) ,系統(tǒng)會(huì)根據(jù)請求數(shù)據(jù)的情況將多個(gè)來自 IO的請求先放在緩存里面,然后再一次性的提交給磁盤,也就是說對于數(shù)據(jù)庫發(fā)出的多個(gè) 8K數(shù)據(jù)塊的讀操作有可能放在一個(gè)磁盤讀 IO里就處理了。還有對于有些存儲(chǔ)系統(tǒng)也是提供了緩存 的接收到操作系統(tǒng)的 IO請求之后也是會(huì)將多個(gè)操作系統(tǒng)的 IO請求合并成一個(gè)來處理不管是操作系統(tǒng)層面的緩存還是磁盤控制器層面的緩存, 目的都只有一個(gè)提高數(shù)據(jù)讀寫的效率。因此每次單獨(dú)的 IO操作大小都是不一樣的,它主要取決于系統(tǒng)對于數(shù)據(jù)讀寫效率的判斷。當(dāng)一次IO操作大小比較小的時(shí)候我們成為小的IO操作,比如說8K這樣的;當(dāng)一次IO操作的數(shù)據(jù)量比較的的時(shí)候稱為大IO操作,比如說甚至更大。在我們說到塊大?。?BlockSize)的時(shí)候通常我們會(huì)接觸到多個(gè)類似的概念,像我們上面提到的那個(gè)在數(shù)據(jù)庫里面的數(shù)據(jù)最小的管理單位, Oralce稱之為塊(Block) ,大小一般為 SQLServer稱之為頁(Page),一般大小也為 8k。在文件系統(tǒng)里面我們也能碰到一個(gè)文件系統(tǒng)的塊, 在現(xiàn)在很多的 Linux 系統(tǒng)中都是通過 /usr/bin/time -v 可以看到),它的作用其實(shí)跟數(shù)據(jù)庫里面的塊 /是一樣的,都是為了方便數(shù)據(jù)的管理。但是說到單次 IO的大小,跟這些塊的大小都是沒有直接關(guān)系的,在英文里單次 IO大小通常被稱為是 IOChunkSize,不會(huì)說成是 IOBlockSize 的。IOPS(IOperSecond)系統(tǒng)每秒所執(zhí)行 IO操作的次數(shù),是一個(gè)重要的用來衡量系統(tǒng) IO能的一個(gè)參數(shù)。對于單個(gè)磁盤組成的 IO系統(tǒng)來說,計(jì)算它的 不是一件很難的事情,只要我們知道了系統(tǒng)完成一次 IO所需要的時(shí)間的話我們就能推算出系統(tǒng)IOPS來?,F(xiàn)在我們就來推算一下磁盤的 假設(shè)磁盤的轉(zhuǎn)速(Rotational Speed)為平均尋道時(shí)間為 最大傳輸速率為 (這里將讀寫速度視為一樣,實(shí)際會(huì)差別比較大)。對于磁盤來說一個(gè)完整的 IO操作是這樣進(jìn)行的:當(dāng)控制器對磁盤發(fā)出一個(gè) IO操作命令的時(shí)候,磁盤的驅(qū)動(dòng)臂 (ActuatorArm) 帶讀寫磁頭(Head)離開著陸區(qū)(LandingZone,位于內(nèi)圈沒有數(shù)據(jù)的區(qū)域 ),移動(dòng)到要操作的初始數(shù)據(jù)塊所在的磁道(Track) 的正上方,這個(gè)過程被稱為尋址(Seeking)對應(yīng)消耗的時(shí)間被稱為尋址時(shí)間(SeekTime)但是找到對應(yīng)磁道還不能馬上讀取數(shù)據(jù), 這時(shí)候磁頭要等到磁盤盤片(Platter) 旋轉(zhuǎn)到初始數(shù)據(jù)塊所在的扇區(qū) (Sector) 落在讀寫磁頭正上方的之后才能開始讀取數(shù)據(jù),在這個(gè)等待盤片旋轉(zhuǎn)到可操作扇區(qū)的過程中消耗的時(shí)間稱為旋轉(zhuǎn)延時(shí)(RotationalDelay) ;接下來就隨著盤片的旋轉(zhuǎn),磁頭不斷的讀/寫相應(yīng)的數(shù)據(jù)塊,直到完成這次 IO所需要操作的全部數(shù)據(jù),這個(gè)過程稱為據(jù)傳送(DataTransfer) 對應(yīng)的時(shí)間稱為傳送時(shí)間 (TransferTime) 完成這三個(gè)步驟之后一次IO操作也就完成了。在我們看硬盤廠商的宣傳單的時(shí)候我們經(jīng)常能看到 3個(gè)參數(shù)分別是平均尋址間盤片旋轉(zhuǎn)速度以及最大傳送速度, 這三個(gè)參數(shù)就可以提供給我們計(jì)算上述三個(gè)步驟的時(shí)間。第一個(gè)尋址時(shí)間考慮到被讀寫的數(shù)據(jù)可能在磁盤的任意一個(gè)磁道, 既有可能磁盤的最內(nèi)圈(尋址時(shí)間最短),也可能在磁盤的最外圈(尋址時(shí)間最長),所以在計(jì)算中我們只考慮平均尋址時(shí)間, 也就是磁盤參數(shù)中標(biāo)明的那個(gè)平均尋址時(shí)間,這里就采用當(dāng)前最多的 10krmp硬盤的。第二個(gè)旋轉(zhuǎn)延時(shí)和尋址一樣,當(dāng)磁頭定位到磁道之后有可能正好在要讀寫扇區(qū)之上,這時(shí)候是不需要額外額延時(shí)就可以立刻讀寫到數(shù)據(jù), 但是最壞的情況確要磁盤旋轉(zhuǎn)整整一圈之后磁頭才能讀取到數(shù)據(jù), 所以這里我們也考慮的是平均旋轉(zhuǎn)延時(shí),對于 10krpm的磁盤就是(60s/15k)*(1/2)=2ms 。第三個(gè)傳送時(shí)間磁盤參數(shù)提供我們的最大的傳輸速度, 當(dāng)然要達(dá)到這種速度很有難度的,但是這個(gè)速度卻是磁盤純讀寫磁盤的速度,因此只要給定了單次IO的大小,我們就知道磁盤需要花費(fèi)多少時(shí)間在數(shù)據(jù)傳送上,這個(gè)時(shí)間就是IOChunkSize/MaxTransferRate 。現(xiàn)在我們就可以得出這樣的計(jì)算 單次IO時(shí)間的公式:IO Time = Seek Time + 60 sec/Rotational Speed/2 + IO Size/Transfer Rate于是我們可以這樣計(jì)算出 IOPSIOPS = 1/IO Time = 1/(Seek Time + 60 sec/Rotational Speed/2+ IOChunk Size/Transfer Rate)對于給定不同的 IO大小我們可以得出下面的一系列的數(shù)據(jù)4K (1/7.1 ms = 140 IOPS)5ms + (60sec/15000RPM/2) + 4K/40MB = 5 + 2 + 0.1 =7.18k (1/7.2 ms = 139 IOPS)5ms + (60sec/15000RPM/2) + 8K/40MB = 5 + 2 + 0.2 =7.216K (1/7.4 ms = 135 IOPS)+16K/40MB=5+2+16K/40MB=5+2+0.4=+32K/40MB=5+2+0.8=+64K/40MB=5+2+1.6=7.432K (1/7.8 ms = 128 IOPS)5ms + (60sec/15000RPM/2)7.864K (1/8.6 ms = 116 IOPS)5ms + (60sec/15000RPM/2)8.6從上面的數(shù)據(jù)可以看出, 當(dāng)單次IO越小的時(shí)候,單次 IO所耗費(fèi)的時(shí)間也越少相應(yīng)的IOPS也就越大。上面我們的數(shù)據(jù)都是在一個(gè)比較理想的假設(shè)下得出來的, 這里的理想的情況就是磁盤要花費(fèi)平均大小的尋址時(shí)間和平均的旋轉(zhuǎn)延時(shí), 這個(gè)假設(shè)其實(shí)是比較符合我們實(shí)際情況中的隨機(jī)讀寫,在隨機(jī)讀寫中,每次 IO操作的尋址時(shí)間和旋轉(zhuǎn)延時(shí)都不能忽略不計(jì),有了這兩個(gè)時(shí)間的存在也就限制了 IOPS的大小?,F(xiàn)在我們考慮一種相對極端的順序讀寫操作, 比如說在讀取一個(gè)很大的存儲(chǔ)連續(xù)分布在磁盤的文件,因?yàn)槲募拇鎯?chǔ)的分布是連續(xù)的,磁頭在完成一個(gè)讀 IO操作之后,不需要從新的尋址,也不需要旋轉(zhuǎn)延時(shí),在這種情況下我們能到一個(gè)很大的 值,如下4K(1/0.1ms=10000 IOPS)0ms+0ms+ 4K/40MB =0.18k(1/0.2ms=5000 IOPS)0ms+0ms+ 8K/40MB =0.216K(1/0.4ms =2500 IOPS)0ms+ 0ms+ 16K/40MB=0.432K(1/0.8ms =1250 IOPS)0ms+ 0ms+ 32K/40MB=0.864K(1/1.6ms =625 IOPS)0ms+ 0ms+ 64K/40MB=1.6相比第一組數(shù)據(jù)來說差距是非常的大的,因此當(dāng)我們要用 IOPS來衡量一個(gè) IO系統(tǒng)的系能的時(shí)候我們一定要說清楚是在什么情況的 也就是要說明讀寫的方式以及單次 IO的大小,當(dāng)然在實(shí)際當(dāng)中,特別是在的系統(tǒng)的,隨機(jī)小IO的讀寫是最有說服力的。傳輸速度(TransferRate)/ 吞吐率(Throughput)現(xiàn)在我們要說的傳輸速度(另一個(gè)常見的說法是吞吐率) 不是磁盤上所表明的大傳輸速度或者說理想傳輸速度, 而是磁盤在實(shí)際使用的時(shí)候從磁盤系統(tǒng)總線上流過的數(shù)據(jù)量。有了 IOPS數(shù)據(jù)之后我們是很容易就能計(jì)算出對應(yīng)的傳輸速度來的Transfer Rate = IOPS * IO Chunk Size8K:139* 8K=1112K/40M=2.71%16K:135* 16K=2160K/40M=5.27%32K:116* 32K8K:139* 8K=1112K/40M=2.71%16K:135* 16K=2160K/40M=5.27%32K:116* 32K=3712K/40M=9.06%可以看出實(shí)際上的傳輸速度是很小的,對總線的利用率也是非常的小。這里一定要明確一個(gè)概念,那就是盡管上面我們使用 IOPS來計(jì)算傳輸速度,但是實(shí)際上傳輸速度和 IOPS是沒有直接關(guān)系,在沒有緩存的情況下它們共同的決定因素都是對磁盤系統(tǒng)的訪問方式以及單個(gè) IO的大小。對磁盤進(jìn)行隨機(jī)訪問時(shí)候我們可以利用 IOPS來衡量一個(gè)磁盤系統(tǒng)的性能,此時(shí)的傳輸速度不會(huì)太大;但是當(dāng)對磁盤進(jìn)行連續(xù)訪問時(shí),此時(shí)的 IOPS已經(jīng)沒有了參考的價(jià)值,這個(gè)時(shí)候限制實(shí)際傳輸速度卻是磁盤的最大傳輸速度。因此在實(shí)際的應(yīng)用當(dāng)中,只會(huì)用IOPS 來衡量小IO的隨機(jī)讀寫的性能,而當(dāng)要衡量大 IO連續(xù)讀寫的性能的時(shí)就要采用傳輸速度而不能是 IOPS了。IO響應(yīng)時(shí)間(IOResponseTime)最后來關(guān)注一下能直接描述 IO性能的IO響應(yīng)時(shí)間。IO響應(yīng)時(shí)間也被稱為 IO時(shí)(IOLatency) ,IO響應(yīng)時(shí)間就是從操作系統(tǒng)內(nèi)核發(fā)出的一個(gè)讀或者寫的 IO命令到操作系統(tǒng)內(nèi)核接收到 IO回應(yīng)的時(shí)間,注意不要和單個(gè) IO時(shí)間混淆了,單個(gè)IO時(shí)間僅僅指的是 IO操作在磁盤內(nèi)部處理的時(shí)間,而 IO響應(yīng)時(shí)間還要包括 IO操作在IO等待隊(duì)列中所花費(fèi)的等待時(shí)間。計(jì)算IO操作在等待隊(duì)列里面消耗的時(shí)間有一個(gè)衍生于利托氏定理(Little’sLaw)的排隊(duì)模型M/M/1模型可以遵循,由于排隊(duì)模型算法比較復(fù)雜,到現(xiàn)在還沒有搞太明白(如果有誰對M/M/1模型比較精通的話歡迎給予指導(dǎo)這里就羅列一下最后的結(jié)果,還是那上面計(jì)算的IOPS數(shù)據(jù)來說:8K IO Chunk Size (135 IOPS, 7.2 135 => 240.0 ms105 => 29.5 ms75 => 15.7 ms45 => 10.6 ms64KIOChunkSize(116IOPS,8.6ms)135 => 沒響應(yīng)了??105 => 88.6 ms75 => 24.6 ms45 => 14.6 ms從上面的數(shù)據(jù)可以看出,隨著系統(tǒng)實(shí)際 IOPS越接近理論的最大值, IO的響應(yīng)間會(huì)成非線性的增長,越是接近最大值,響應(yīng)時(shí)間就變得越大, 而且會(huì)比預(yù)期超出很多。一般來說在實(shí)際的應(yīng)用中有一個(gè) 的指導(dǎo)值,也就是說在 IO讀寫的隊(duì)列中,當(dāng)隊(duì)列大小小于最大 IOPS的的時(shí)候,IO的響應(yīng)時(shí)間增加會(huì)很小,相對來說讓人比較能接受的,一旦超過 響應(yīng)時(shí)間就會(huì)戲劇性的暴增,所以當(dāng)一個(gè)系統(tǒng)的 IO壓力超出最大可承受壓力的 的時(shí)候就是必須要考慮調(diào)整或升級(jí)了。另外補(bǔ)充說一下這個(gè)的指導(dǎo)值也適用于過的,一旦超過精品文檔交流精品文檔交流從上一篇文章的計(jì)算中我們可以看到一個(gè) 15k轉(zhuǎn)速的磁盤在隨機(jī)讀寫訪問的情況下IOPS竟然只有140左右,但在實(shí)際應(yīng)用中我們卻能看到很多標(biāo)有 甚至更高的存儲(chǔ)系統(tǒng),有這么大 IOPS的存儲(chǔ)系統(tǒng)怎么來的呢?這就要?dú)w結(jié)于各種存儲(chǔ)技術(shù)的使用了,在這些存儲(chǔ)技術(shù)中使用最廣的就是高速緩存 (Cache)和磁盤冗余陣列(RAID)了,本文就將探討緩存和磁盤陣列提高存儲(chǔ) IO性能的方法。高速緩存(Cache)在當(dāng)下的各種存儲(chǔ)產(chǎn)品中,按照速度從快到慢應(yīng)該就是內(nèi)存 閃存磁盤磁帶了然而速度越快也就意味著價(jià)格越高, 閃存雖然說是發(fā)展勢頭很好, 但目前來說卻還是因?yàn)閮r(jià)格問題無法普及, 因此現(xiàn)在還是一個(gè)磁盤作霸王的時(shí)代。 與和內(nèi)存速度相比,磁盤的速度無疑是計(jì)算機(jī)系統(tǒng)中最大的瓶頸了, 所以在必須使用磁盤而又想提高性能的情況下,人們想出了在磁盤中嵌入一塊高速的內(nèi)存 用來保存經(jīng)常訪問的數(shù)據(jù)從而提高讀寫效率的方法來折中的解決, 這塊嵌入的內(nèi)存就被稱為高速緩存。說到緩存,這東西應(yīng)用現(xiàn)在已經(jīng)是無處不在, 從處于上層的應(yīng)用,到操作系統(tǒng)層再到磁盤控制器,還有內(nèi)部,單個(gè)磁盤的內(nèi)部也都存在緩存, 所有這些緩存存在的目的都是相同的,就是提高系統(tǒng)執(zhí)行的效率。當(dāng)然在這里我們只關(guān)心跟IO性能相關(guān)的緩存,與 IO性能直接相關(guān)的幾個(gè)緩存分別是 文件系統(tǒng)緩存(FileSystemCache) 、磁盤控制器緩存(DiskControllerCache) 和磁盤緩存(DiskCache,也稱為DiskBuffer) ,不過當(dāng)在計(jì)算一個(gè)磁盤系統(tǒng)性能的時(shí)候文件系統(tǒng)緩存也是不會(huì)考慮在內(nèi)的, 因此我們重點(diǎn)考察的就是磁盤控制器緩存和磁緩存。不管是控制器緩存還是磁盤緩存,他們所起的作用主要是分為三部分: 緩存數(shù)據(jù)預(yù)讀(Read-ahead)和回寫(Write-back) 。緩存數(shù)據(jù)首先是系統(tǒng)讀取過的數(shù)據(jù)會(huì)被緩存在高速緩存中, 這樣下次再次需要讀取相同的數(shù)據(jù)的時(shí)候就不用在訪問磁盤, 直接從緩存中取數(shù)據(jù)就可以了。 當(dāng)然使用過的據(jù)也不可能在緩存中永久保留的,緩存的數(shù)據(jù)一般那是采取 算法來進(jìn)行管理目的是將長時(shí)間不用的數(shù)據(jù)清除出緩存, 那些經(jīng)常被訪問的卻能一直保留在緩存中,直到緩存被清空。預(yù)讀預(yù)讀是指采用預(yù)讀算法在沒有系統(tǒng)的IO請求的時(shí)候事先將數(shù)據(jù)從磁盤中讀入到緩存中,然后在系統(tǒng)發(fā)出讀IO請求的時(shí)候,就會(huì)實(shí)現(xiàn)去檢查看看緩存里面是否存在要讀取的數(shù)據(jù),如果存在(即命中)的話就直接將結(jié)果返回,這時(shí)候的磁盤精品文檔交流精品文檔交流不再需要尋址、旋轉(zhuǎn)等待、讀取數(shù)據(jù)這一序列的操作了, 這樣是能節(jié)省很多時(shí)的;如果沒有命中則再發(fā)出真正的讀取磁盤的命令去取所需要的數(shù)據(jù)。緩存的命中率跟緩存的大小有很大的關(guān)系, 理論上是緩存越大的話,所能緩存的數(shù)據(jù)也就越多,這樣命中率也自然越高, 當(dāng)然緩存不可能太大, 畢竟成本在那兒呢如果一個(gè)容量很大的存儲(chǔ)系統(tǒng)配備了一個(gè)很小的讀緩存的話, 這時(shí)候問題會(huì)比較大的,因?yàn)樾【彺娴臄?shù)據(jù)量非常小, 相比整個(gè)存儲(chǔ)系統(tǒng)來說比例非常低, 樣隨機(jī)讀?。〝?shù)據(jù)庫系統(tǒng)的大多數(shù)情況) 的時(shí)候命中率也自然就很低, 這樣的緩存不但不能提高效率(因?yàn)榻^大部分讀 IO都還要讀取磁盤),反而會(huì)因?yàn)槊看稳テヅ渚彺娑速M(fèi)時(shí)間。執(zhí)行讀IO操作是讀取數(shù)據(jù)存在于緩存中的數(shù)量與全部要讀取數(shù)據(jù)的比值稱為緩存命中率(ReadCacheHitRadio) ,假設(shè)一個(gè)存儲(chǔ)系統(tǒng)在不使用緩存的情況下機(jī)小IO讀取能達(dá)到 而它的緩存能提供 的緩存命中率的話,那么際上它的IOPS可以達(dá)到150/(1-10%)=166。回寫首先說一下,用于回寫功能的那部分緩存被稱為寫緩存 (WriteCache)在一套緩存打開的存儲(chǔ)中,操作系統(tǒng)所發(fā)出的一系列寫 IO命令并不會(huì)被挨個(gè)的執(zhí)行,這些寫IO的命令會(huì)先寫入緩存中,然后再一次性的將緩存中的修改推到磁盤中,這就相當(dāng)于將那些相同的多個(gè) IO合并成一個(gè),多個(gè)連續(xù)操作的小 IO合并成一大的還有就是將多個(gè)隨機(jī)的寫 IO變成一組連續(xù)的寫 這樣就能減少磁盤尋址等操作所消耗的時(shí)間,大大的提高磁盤寫入的效率。讀緩存雖然對效率提高是很明顯的, 但是它所帶來的問題也比較嚴(yán)重, 因?yàn)榫彺婧推胀▋?nèi)存一樣,掉點(diǎn)以后數(shù)據(jù)會(huì)全部丟失,當(dāng)操作系統(tǒng)發(fā)出的寫 IO命令寫入到緩存中后即被認(rèn)為是寫入成功, 而實(shí)際上數(shù)據(jù)是沒有被真正寫入磁盤的, 此時(shí)如果掉電,緩存中的數(shù)據(jù)就會(huì)永遠(yuǎn)的丟失了, 這個(gè)對應(yīng)用來說是災(zāi)難性的, 目解決這個(gè)問題最好的方法就是給緩存配備電池了, 保證存儲(chǔ)掉電之后緩存數(shù)據(jù)能如數(shù)保存下來。和讀一樣,寫緩存也存在一個(gè)寫緩存命中率(WriteCacheHitRadio)緩存命中情況不一樣的是,盡管緩存命中,也不能將實(shí)際的IO操作免掉,只是被合并了而已??刂破骶彺婧痛疟P緩存除了上面的作用之外還承當(dāng)著其他的作用,比如磁盤緩存有保存IO命令隊(duì)列的功能,單個(gè)的磁盤一次只能處理一個(gè)IO命令,但卻能接收多個(gè)IO命令,這些進(jìn)入到磁盤而未被處理的命令就保存在緩存中的IO隊(duì)列中。RAID(RedundantArrayOfInexpensiveDisks)如果你是一位數(shù)據(jù)庫管理員或者經(jīng)常接觸服務(wù)器,那對 RAID應(yīng)該很熟悉了,作為最廉價(jià)的存儲(chǔ)解決方案, RAID早已在服務(wù)器存儲(chǔ)中得到了普及。在 RAID的各個(gè)級(jí)別中,應(yīng)當(dāng)以和(不過已經(jīng)基本走到頭了,6正在崛起中,看看這里了解下原因)應(yīng)用最廣了。下面將就 這幾種級(jí)別的 RAID展開說一下磁盤陣列對于磁盤性能的影響,當(dāng)然在閱讀下面的內(nèi)容之前你必須對各個(gè)級(jí)別的 RAID的結(jié)構(gòu)和工作原理要熟悉才行,這樣才不至于滿頭霧水,推薦查看 wikipedia 上面的如下條目: StandardRAIDlevels ,NestedRAIDlevels 。RAID0RAID0將數(shù)據(jù)條帶化(striping) 將連續(xù)的數(shù)據(jù)分散在多個(gè)磁盤上進(jìn)行存取, 系發(fā)出的IO命令(不管讀 IO和寫IO都一樣)就可以在磁盤上被并行的執(zhí)行,每個(gè)磁盤單獨(dú)執(zhí)行自己的那一部分請求,這樣的并行的 IO操作能大大的增強(qiáng)整個(gè)存儲(chǔ)系統(tǒng)的性能。假設(shè)一個(gè) RAID0陣列有n(n>=2)個(gè)磁盤組成,每個(gè)磁盤的隨機(jī)讀寫的IO能力都達(dá)到 140的話,那么整個(gè)磁盤陣列的 IO能力將是 140*n。同如果在陣列總線的傳輸能力允許的話 RAID0的吞吐率也將是單個(gè)磁盤的 n倍。RAID1RAID1在容量上相當(dāng)于是將兩個(gè)磁盤合并成一個(gè)磁盤來使用了,互為鏡像的兩個(gè)磁盤里面保存的數(shù)據(jù)是完全一樣的,因此在并行讀取的時(shí)候速度將是n個(gè)磁盤速寫入速度只有n/2。RAID5我們那一個(gè)有 n(n>=3)個(gè)磁盤的 陣列來看,首先看看 RAID5陣列的讀 RAID5是支持并行 IO的,而磁盤上的數(shù)據(jù)呈條帶狀的分布在所有的磁盤上,因此讀IO的速度相當(dāng)于所有磁盤速度的總和。 不過這是在沒有磁盤損壞的情況下,當(dāng)有一個(gè)磁盤故障的時(shí)候讀取速度也是會(huì)下降的, 因?yàn)橹虚g需要花時(shí)間來計(jì)算失磁盤上面的數(shù)據(jù)。讀取數(shù)據(jù)的情況相對就要復(fù)雜的多了,先來看下 RAID5奇偶校驗(yàn)數(shù)據(jù)寫入的過程,我們把寫入的數(shù)據(jù)稱為 當(dāng)磁盤拿到一個(gè)寫 IO的命令的時(shí)候,它首先會(huì)讀取一次要寫入的地址的數(shù)據(jù)塊中修改之前的數(shù)據(jù) 然后再讀取到當(dāng)前條帶中的校驗(yàn)信息 接下來就根據(jù) 這三組數(shù)據(jù)計(jì)算出數(shù)據(jù)寫入之后的條帶的奇偶校驗(yàn)信息 最后發(fā)出兩個(gè)寫 IO的命令,一個(gè)寫入 另一個(gè)寫奇偶校驗(yàn)信息 ??梢钥闯鲫嚵性趯?shí)際操作的時(shí)候需要讀、讀、寫、寫一共 4個(gè) IO才能完成一次寫 IO操作,也就是實(shí)際上的寫入速度只有所有磁盤速度總和的1/4從這點(diǎn)可以看出 RAID5是非常不適合用在要大批量寫入數(shù)據(jù)的系統(tǒng)的。RAID6RAID6和很類似,差別就在于 RAID6多了一個(gè)用于校驗(yàn)的磁盤。就讀 IO速度上來說這兩個(gè)是完全一樣的,都是所有磁盤 IO速度的總和。在寫IO上也很是類似,不同的是 將一個(gè)命令分成了三次讀、三次寫一共 次IO命令才能完成,也就是 RAID6實(shí)際寫入磁盤的速度是全部磁盤速度之和的1/6??梢钥闯鰪膶?IO看RAID6比RAID5差別是很大的。RAID10RAID0 讀寫速度都很好,卻沒有冗余保護(hù); 和RAID6都有同樣的毛病就是寫入的時(shí)候慢,讀取的時(shí)候快。那么 RAID1呢?嗯,這里要說的就是 其實(shí)不管是 RAID10還是其實(shí)都是組合大于 2塊磁盤時(shí)候的 當(dāng)先鏡像后條帶時(shí)候就稱為 先條帶后鏡像的時(shí)候稱為 。從性能上看RAID01和RAID10都是一樣的,都是 RAID1嘛,但是RAID10在重建故障磁盤的時(shí)候性能比 RAID01 要快。因?yàn)?其實(shí)就是所以它的性能與RAID1也就是一樣的了,這里不需要再做過多的討論。四個(gè)性能指標(biāo)的變化IO響應(yīng)時(shí)間(IOResponseTime)在任何時(shí)候 IO響應(yīng)時(shí)間值得都是單個(gè) IO的響應(yīng)時(shí)間,因此,不管磁盤是否組成了磁盤陣列,它的IO響應(yīng)時(shí)間應(yīng)該都是一樣的。 從前面的計(jì)算中我們可以看到如果IO響應(yīng)時(shí)間在 10ms左右的話是很正常的,但是當(dāng) IO響應(yīng)時(shí)間比這個(gè)值超出太多的時(shí)候,你就要開始注意了,很可能就意味著此時(shí)你的磁盤系統(tǒng)已經(jīng)成為了一個(gè)瓶頸。IOPS綜合上面兩個(gè)部分的討論我們來估算一下陣列下的磁盤總體 在這里我們先假設(shè)組成陣列的單個(gè)磁盤的隨機(jī)讀寫的 IOP為讀寫緩存命中率都為 組成陣列的磁盤個(gè)數(shù)為 。因?yàn)椴还苁悄欠N陣列,磁盤的讀取性能都是所有磁盤之和, 所以可以得出下面讀取精品文檔交流精品文檔交流read IOPS = disk_IOPS/(1-read_cache_hit_ratio)*disk_num 0%)*4 = 622而寫入性能就完全不一樣了,根據(jù)上面的討論我們可以得出下面結(jié)論:RAID0:1IOrequest=>need1actualIOondiskRAID1:1IOrequest=>need2actualIOondiskRAID5:1IOrequest=>need4actualIOondiskRAID6:1IOrequest=>need6actualIOondisk由此我們也可以計(jì)算出寫入 IOPS估算公式:RAID0 write IOPS ure_IO_num =140/(1-10%)*4/1 = 622RAID1 write IOPS =disk_IOPS/(1-write_cache_hit_ratio)*disk_num/acture_IO_num =140/(1-10%)*4/2 = 311RAID5 write IOPS ure_IO_num =140/(1-10%)*4/4 = 155RAID6 write IOPS ure_IO_num =140/(1-10%)*4/6 = 103實(shí)際上從通過上面的計(jì)算方法我們還可以估算當(dāng)給定一個(gè)要求的 IOPS的情況下估計(jì)下使用各個(gè)陣列級(jí)別所需要的磁盤的數(shù)量。 當(dāng)然我們上面的計(jì)算方法只是一個(gè)估算,我們忽略很多其他的因素, 得出的只是一個(gè)大概的數(shù)值, 不過在際的應(yīng)用還是有一定的參考作用的。本篇最后附送一個(gè)計(jì)算磁盤系統(tǒng) IOPS的網(wǎng)站――’sk&kcalculator 這個(gè)網(wǎng)站提供的計(jì)算公式還考慮了諸如陣列條帶大小以及主機(jī)方面的因素,很有參考價(jià)值,至于怎么選擇合適的條帶大小,請參考【延伸閱讀】部分。傳輸速度(TransferRate)/ 吞吐率(Throughput)實(shí)際上估算除了隨機(jī)讀寫的 IOPS也就知道了隨機(jī)讀寫的吞吐率。對于順序讀寫的呢,還是跟前一篇所講的一樣,主要受限于磁盤的限制,不能再拿 IOPS來量了。random_throughtput = random_IOPS * IO_chunk_size能部室由企管部統(tǒng)一考核)。不符合衛(wèi)生標(biāo)準(zhǔn)的,超市內(nèi)每處扣0.5分,超市外每處扣1分。衛(wèi)生管理制度1 總則1.1 為了加強(qiáng)公司的環(huán)境衛(wèi)生管理,創(chuàng)造一個(gè)整潔、文明、溫馨的購物、辦公環(huán)境,根據(jù)《公共場所衛(wèi)生管理?xiàng)l例》的要求,特制定本制度。1.2 集團(tuán)公司的衛(wèi)生管理部門設(shè)在企管部,并負(fù)責(zé)將集團(tuán)公司的衛(wèi)生區(qū)域詳細(xì)劃分到各部室,各分公司所轄區(qū)域衛(wèi)生由分公司客服部負(fù)責(zé)劃分,確保無遺漏。2 衛(wèi)生標(biāo)準(zhǔn)2.1 室內(nèi)衛(wèi)生標(biāo)準(zhǔn)2.1.1 地面、墻面:無灰塵、無紙屑、無痰跡、無泡泡糖等粘合物、無積水,墻角無灰吊、無蜘蛛網(wǎng)。2.1.2 門、窗、玻璃、鏡子、柱子、電梯、樓梯、燈具等,做到明亮、無灰塵、無污跡、無粘合物,特別是玻璃,要求兩面明亮。2.1.3 柜臺(tái)、貨架:清潔干凈,貨架、柜臺(tái)底層及周圍無亂堆亂放現(xiàn)象、無灰塵、無粘合物,貨架頂部、背部和底部干凈,不存放雜物和私人物品。2.1.4 購物車(筐)、直接接觸食品的售貨工具(包括刀、叉等):做到內(nèi)外潔凈,無污垢和粘合物等。購物車(筐)要求每天營業(yè)前簡單清理,周五全面清理消毒;售貨工具要求每天消毒,并做好記錄。2.1.5 商品及包裝:商品及外包裝清潔無灰塵(外包裝破損的或破舊的不得陳列)。2.1.6 收款臺(tái)、服務(wù)臺(tái)、辦公櫥、存包柜:保持清潔、無灰塵,臺(tái)面和側(cè)面無灰塵、無灰吊和蜘蛛網(wǎng)。桌面上不得亂貼、亂畫、亂堆放物品,用具擺放有序且干凈,除當(dāng)班的購物小票收款聯(lián)外,其它單據(jù)不得存放在桌面上。2.1.7 垃圾桶:桶內(nèi)外干凈,要求營業(yè)時(shí)間隨時(shí)清理,不得溢出,每天下班前徹底清理,不得留有垃圾過夜。2.1.8 窗簾:定期進(jìn)行清理,要求干凈、無污漬。2.1.9 吊飾:屋頂?shù)牡躏椧鬅o灰塵、無蜘蛛網(wǎng),短期內(nèi)不適用的吊飾及時(shí)清理徹底。2.1.10 內(nèi)、外倉庫:半年徹底清理一次,無垃圾、無積塵、無蜘蛛網(wǎng)等。2.1.11 室內(nèi)其他附屬物及工作用具均以整潔為準(zhǔn),要求無灰塵、無粘合物等污垢。2.2 室外衛(wèi)生標(biāo)準(zhǔn)Windows性能計(jì)數(shù)器-- 磁盤性能分析 DiskPhysicalDisk :單次IO大小Avg.DiskBytes/ReadAvg.DiskBytes/WriteIO響應(yīng)時(shí)間Avg.Disksec/Read 磁盤每次讀取需要的時(shí)間,一般不超過一般不要超過11~15ms。Avg.Disksec/Write 一般小于每秒讀/寫的IO數(shù))理論情況下,磁盤的隨機(jī)讀計(jì)數(shù)為 、 順序讀計(jì)數(shù)為 實(shí)際測試值與理論值對比,從而判斷磁盤是否為瓶頸DiskReads/secDiskWrites/secDiskTransfers/secIO吞吐率(磁盤每秒讀 /寫字節(jié)數(shù))DiskBytes/secDiskReadBytes/secDiskWriteBytes/sec磁盤隊(duì)列長度Avg.DiskQueueLength :磁盤平均隊(duì)列長度不應(yīng)超過 2,即:隊(duì)列長度/磁盤數(shù)磁盤有兩個(gè)重要的參數(shù): Seektime、Rotational latency 。正常的I/O計(jì)數(shù)為:①1000/(Seektime+Rotationallatency)*0.75,在此范圍內(nèi)屬正常。當(dāng)達(dá)到%的I/O計(jì)數(shù)以上時(shí)則基本認(rèn)為已經(jīng)存在I/O瓶頸。理論、順序讀計(jì)數(shù)為。對于數(shù)據(jù)文件而言是隨機(jī)讀寫,日志文件是順序讀寫。因此,數(shù)據(jù)文件建議存放于RAID5件存放于RAID10或RAID1中。附:00IOPS00IOPS0:0IOPS下面假設(shè)在有 4塊硬盤的RAID5中觀察到的 PhysicalDisk 性能對象的部值:Avg.DiskQueueLength12 隊(duì)列長度Avg.DiskSec/Read.035 讀數(shù)據(jù)所用時(shí)間 msAvg.DiskSec/Write.045 寫數(shù)據(jù)所用時(shí)間 DiskReads/sec320 每秒讀數(shù)據(jù)量DiskWrites/sec100 每秒寫數(shù)據(jù)量Avg.DiskQueueLength ,12/4=3,每塊磁盤的平均隊(duì)列建議不超過 2Avg.DiskSec/Read 一般不要超過 。Avg.DiskSec/Write 一般建議小于 。從上面的結(jié)果,我們看到磁盤本身的 I/O 能力是滿足我們的要求的, 原因是因有大量的請求才導(dǎo)致隊(duì)列等待, 這很可能是因?yàn)槟愕?語句導(dǎo)致大量的表掃描所致。在進(jìn)行優(yōu)化后,如果還是不能達(dá)到要求, 下面的公式可以幫助你計(jì)算使用幾塊硬盤可以滿足這樣的并發(fā)要求 :Raid0--I/Osperdisk=(reads+writes)/numberofdisksRaid1--I/Osperdisk=[reads+(2*writes)]/2Raid5--I/Osperdisk=[reads+(4*writes)]/numberofdisksRaid10--I/Osperdisk=[reads+(2*writes)]/numberofdisks我們得到的結(jié)果是: (320+400)/4=180,這時(shí)你可以根據(jù)公式①來得到磁盤的正常I/O值。假設(shè)現(xiàn)在正常 I/O計(jì)數(shù)為為了達(dá)到這個(gè)結(jié)果: 720/125=5.76。就是說要用 6塊磁盤才能達(dá)到這樣的要求。但是上面的 DiskReads/sec 和DiskWrites/sec 是個(gè)很難正確估算的值。因此只能在系統(tǒng)比較忙時(shí),大概估算一個(gè)平均值, 作為計(jì)算公式的依據(jù)。 另一個(gè)是很難從客戶那里得到 Seektime、Rotationallatency 參數(shù)的值,這也只能用理論值125進(jìn)行計(jì)算。前言作為一個(gè)數(shù)據(jù)庫管理員,關(guān)注系統(tǒng)的性能是日常最重要的工作之一, 而在所關(guān)的各方面的性能只能 IO性能卻是最令人頭痛的一塊,面對著各種生澀的參數(shù)和令人眼花繚亂的新奇的術(shù)語, 再加上存儲(chǔ)廠商的忽悠,總是讓我們有種云里霧里的感覺本系列文章試圖從基本概念開始對磁盤存儲(chǔ)相關(guān)的各種概念進(jìn)行綜合歸納,讓大家能夠?qū)?IO性能相關(guān)的基本概念, IO性能的監(jiān)控和調(diào)整有個(gè)比較全面的了解。在這一部分里我們先舍棄各種結(jié)構(gòu)復(fù)雜的存儲(chǔ)系統(tǒng), 直接研究一個(gè)單獨(dú)的磁盤性能問題,藉此了解各個(gè)衡量 IO系統(tǒng)系能的各個(gè)指標(biāo)以及之間的關(guān)系。幾個(gè)基本的概念在研究磁盤性能之前我們必須先了解磁盤的結(jié)構(gòu), 以及工作原理。不過在這里不再重復(fù)說明了,關(guān)系硬盤結(jié)構(gòu)和工作原理的信息可以參考維基百科上面的相關(guān)詞條——Harddiskdrive (英文)和硬盤驅(qū)動(dòng)器(中文)。讀寫 IO(Read/WriteIO) 操作磁盤是用來給我們存取數(shù)據(jù)用的,因此當(dāng)說到 IO操作的時(shí)候,就會(huì)存在兩種相對應(yīng)的操作,存數(shù)據(jù)時(shí)候?qū)?yīng)的是寫 IO操作,取數(shù)據(jù)的時(shí)候?qū)?yīng)的是讀 IO作。單個(gè) IO操作當(dāng)控制磁盤的控制器接到操作系統(tǒng)的讀 IO操作指令的時(shí)候,控制器就會(huì)給磁盤發(fā)出一個(gè)讀數(shù)據(jù)的指令,并同時(shí)將要讀取的數(shù)據(jù)塊的地址傳遞給磁盤, 然后磁盤會(huì)將讀取到的數(shù)據(jù)傳給控制器,并由控制器返回給操作系統(tǒng),完成一個(gè)寫 IO操作;同樣的,一個(gè)寫IO的操作也類似,控制器接到寫的 IO操作的指令和要寫入的數(shù)據(jù),并將其傳遞給磁盤,磁盤在數(shù)據(jù)寫入完成之后將操作結(jié)果傳遞回控制器,再由控制器返回給操作系統(tǒng), 完成一個(gè)寫IO的操作。單個(gè)IO操作指的就是完成一個(gè)寫 IO或者是讀IO的操作。隨機(jī)訪問(RandomAccess)與連續(xù)訪問 Access)隨機(jī)訪問指的是本次 IO所給出的扇區(qū)地址和上次 IO給出扇區(qū)地址相差比較大這樣的話磁頭在兩次 IO操作之間需要作比較大的移動(dòng)動(dòng)作才能重新開始讀 /寫數(shù)據(jù)。相反的,如果當(dāng)次 IO給出的扇區(qū)地址與上次 IO結(jié)束的扇區(qū)地址一致或者是接近的話,那磁頭就能很快的開始這次 IO操作這樣的多個(gè) IO操作稱為連訪問。因此盡管相鄰的兩次 IO操作在同一時(shí)刻發(fā)出,但如果它們的請求的扇區(qū)地址相差很大的話也只能稱為隨機(jī)訪問,而非連續(xù)訪問。順序 IO模式(QueueMode)/并發(fā) IO模式(BurstMode)磁盤控制器可能會(huì)一次對磁盤組發(fā)出一連串的 IO命令,如果磁盤組一次只能執(zhí)行一個(gè)IO命令時(shí)稱為順序 IO;當(dāng)磁盤組能同時(shí)執(zhí)行多個(gè) IO命令時(shí),稱為并IO。并發(fā)IO只能發(fā)生在由多個(gè)磁盤組成的磁盤組上,單塊磁盤只能一次處理一個(gè)IO命令。單個(gè) IO的大小(IOChunkSize)熟悉數(shù)據(jù)庫的人都會(huì)有這么一個(gè)概念,那就是數(shù)據(jù)庫存儲(chǔ)有個(gè)基本的塊大小(BlockSize) ,不管是SQLServer還是Oracle,默認(rèn)的塊大小都是 就是數(shù)據(jù)庫每次讀寫都是以 8k為單位的那么對于數(shù)據(jù)庫應(yīng)用發(fā)出的固定 8k大小的單次讀寫到了寫磁盤這個(gè)層面會(huì)是怎么樣的呢,就是對于讀寫磁盤來說單個(gè) IO操作操作數(shù)據(jù)的大小是多少呢, 是不是也是一個(gè)固定的值?答案是不確定。 首先操作系統(tǒng)為了提高 IO的性能而引入了文件系統(tǒng)緩存 (FileSystemCache) ,系統(tǒng)會(huì)根據(jù)請求數(shù)據(jù)的情況將多個(gè)來自 IO的請求先放在緩存里面,然后再一次性的提交給磁盤,也就是說對于數(shù)據(jù)庫發(fā)出的多個(gè) 8K數(shù)據(jù)塊的讀操作有可能放在一個(gè)磁盤讀 IO里就處理了。還有對于有些存儲(chǔ)系統(tǒng)也是提供了緩存 的接收到操作系統(tǒng)的 IO請求之后也是會(huì)將多個(gè)操作系統(tǒng)的 IO請求合并成一個(gè)來處理不管是操作系統(tǒng)層面的緩存還是磁盤控制器層面的緩存, 目的都只有一個(gè)提高數(shù)據(jù)讀寫的效率。因此每次單獨(dú)的 IO操作大小都是不一樣的,它主要取決于系統(tǒng)對于數(shù)據(jù)讀寫效率的判斷。當(dāng)一次IO操作大小比較小的時(shí)候我們成為小的IO操作,比如說8K這樣的;當(dāng)一次IO操作的數(shù)據(jù)量比較的的時(shí)候稱為大IO操作,比如說甚至更大。在我們說到塊大?。?BlockSize)的時(shí)候通常我們會(huì)接觸到多個(gè)類似的概念,像我們上面提到的那個(gè)在數(shù)據(jù)庫里面的數(shù)據(jù)最小的管理單位, Oralce稱之為塊(Block) ,大小一般為 SQLServer稱之為頁(Page),一般大小也為 8k。在文件系統(tǒng)里面我們也能碰到一個(gè)文件系統(tǒng)的塊, 在現(xiàn)在很多的 Linux 系統(tǒng)中都是通過 /usr/bin/time -v 可以看到),它的作用其實(shí)跟數(shù)據(jù)庫里面的塊 /是一樣的,都是為了方便數(shù)據(jù)的管理。但是說到單次 IO的大小,跟這些塊的大小都是沒有直接關(guān)系的,在英文里單次 IO大小通常被稱為是 IOChunkSize,不會(huì)說成是 IOBlockSize 的。IOPS(IOperSecond)系統(tǒng)每秒所執(zhí)行 IO操作的次數(shù),是一個(gè)重要的用來衡量系統(tǒng) IO能的一個(gè)參數(shù)。對于單個(gè)磁盤組成的 IO系統(tǒng)來說,計(jì)算它的 不是一件很難的事情,只要我們知道了系統(tǒng)完成一次 IO所需要的時(shí)間的話我們就能推算出系統(tǒng)IOPS來?,F(xiàn)在我們就來推算一下磁盤的 假設(shè)磁盤的轉(zhuǎn)速(Rotational Speed)為平均尋道時(shí)間為 最大傳輸速率為 (這里將讀寫速度視為一樣,實(shí)際會(huì)差別比較大)。對于磁盤來說一個(gè)完整的 IO操作是這樣進(jìn)行的:當(dāng)控制器對磁盤發(fā)出一個(gè) IO操作命令的時(shí)候,磁盤的驅(qū)動(dòng)臂 (ActuatorArm) 帶讀寫磁頭(Head)離開著陸區(qū)(LandingZone,位于內(nèi)圈沒有數(shù)據(jù)的區(qū)域 ),移動(dòng)到要操作的初始數(shù)據(jù)塊所在的磁道(Track) 的正上方,這個(gè)過程被稱為尋址(Seeking)對應(yīng)消耗的時(shí)間被稱為尋址時(shí)間(SeekTime)但是找到對應(yīng)磁道還不能馬上讀取數(shù)據(jù), 這時(shí)候磁頭要等到磁盤盤片(Platter) 旋轉(zhuǎn)到初始數(shù)據(jù)塊所在的扇區(qū) (Sector) 落在讀寫磁頭正上方的之后才能開始讀取數(shù)據(jù),在這個(gè)等待盤片旋轉(zhuǎn)到可操作扇區(qū)的過程中消耗的時(shí)間稱為旋轉(zhuǎn)延時(shí)(RotationalDelay) ;接下來就隨著盤片的旋轉(zhuǎn),磁頭不斷的讀/寫相應(yīng)的數(shù)據(jù)塊,直到完成這次 IO所需要操作的全部數(shù)據(jù),這個(gè)過程稱為據(jù)傳送(DataTransfer) 對應(yīng)的時(shí)間稱為傳送時(shí)間 (TransferTime) 完成這三個(gè)步驟之后一次IO操作也就完成了。在我們看硬盤廠商的宣傳單的時(shí)候我們經(jīng)常能看到 3個(gè)參數(shù)分別是平均尋址間盤片旋轉(zhuǎn)速度以及最大傳送速度, 這三個(gè)參數(shù)就可以提供給我們計(jì)算上述三個(gè)步驟的時(shí)間。第一個(gè)尋址時(shí)間考慮到被讀寫的數(shù)據(jù)可能在磁盤的任意一個(gè)磁道, 既有可能磁盤的最內(nèi)圈(尋址時(shí)間最短),也可能在磁盤的最外圈(尋址時(shí)間最長),所以在計(jì)算中我們只考慮平均尋址時(shí)間, 也就是磁盤參數(shù)中標(biāo)明的那個(gè)平均尋址時(shí)間,這里就采用當(dāng)前最多的 10krmp硬盤的。第二個(gè)旋轉(zhuǎn)延時(shí)和尋址一樣,當(dāng)磁頭定位到磁道之后有可能正好在要讀寫扇區(qū)之上,這時(shí)候是不需要額外額延時(shí)就可以立刻讀寫到數(shù)據(jù), 但是最壞的情況確要磁盤旋轉(zhuǎn)整整一圈之后磁頭才能讀取到數(shù)據(jù), 所以這里我們也考慮的是平均旋轉(zhuǎn)延時(shí),對于 10krpm的磁盤就是(60s/15k)*(1/2)=2ms 。第三個(gè)傳送時(shí)間磁盤參數(shù)提供我們的最大的傳輸速度, 當(dāng)然要達(dá)到這種速度很有難度的,但是這個(gè)速度卻是磁盤純讀寫磁盤的速度,因此只要給定了單次IO的大小,我們就知道磁盤需要花費(fèi)多少時(shí)間在數(shù)據(jù)傳送上,這個(gè)時(shí)間就是IOChunkSize/MaxTransferRate ?,F(xiàn)在我們就可以得出這樣的計(jì)算 單次IO時(shí)間的公式:IO Time = Seek Time + 60 sec/Rotational Speed/2 + IO Size/Transfer Rate于是我們可以這樣計(jì)算出 IOPSIOPS = 1/IO Time = 1/(Seek Time + 60 sec/Rotational Speed/2+ IOChunk Size/Transfer Rate)對于給定不同的 IO大小我們可以得出下面的一系列的數(shù)據(jù)4K (1/7.1 ms = 140 IOPS)5ms + (60sec/15000RPM/2) + 4K/40MB = 5 + 2 + 0.1 =7.18k (1/7.2 ms = 139 IOPS)5ms + (60sec/15000RPM/2) + 8K/40MB = 5 + 2 + 0.2 =7.216K (1/7.4 ms = 135 IOPS)+16K/40MB=5+2+16K/40MB=5+2+0.4=+32K/40MB=5+2+0.8=+64K/40MB=5+2+1.6=7.432K (1/7.8 ms = 128 IOPS)5ms + (60sec/15000RPM/2)7.864K (1/8.6 ms = 116 IOPS)5ms + (60sec/15000RPM/2)8.6從上面的數(shù)據(jù)可以看出, 當(dāng)單次IO越小的時(shí)候,單次 IO所耗費(fèi)的時(shí)間也越少相應(yīng)的IOPS也就越大。上面我們的數(shù)據(jù)都是在一個(gè)比較理想的假設(shè)下得出來的, 這里的理想的情況就是磁盤要花費(fèi)平均大小的尋址時(shí)間和平均的旋轉(zhuǎn)延時(shí), 這個(gè)假設(shè)其實(shí)是比較符合我們實(shí)際情況中的隨機(jī)讀寫,在隨機(jī)讀寫中,每次 IO操作的尋址時(shí)間和旋轉(zhuǎn)延時(shí)都不能忽略不計(jì),有了這兩個(gè)時(shí)間的存在也就限制了 IOPS的大小?,F(xiàn)在我們考慮一種相對極端的順序讀寫操作, 比如說在讀取一個(gè)很大的存儲(chǔ)連續(xù)分布在磁盤的文件,因?yàn)槲募拇鎯?chǔ)的分布是連續(xù)的,磁頭在完成一個(gè)讀 IO操作之后,不需要從新的尋址,也不需要旋轉(zhuǎn)延時(shí),在這種情況下我們能到一個(gè)很大的 值,如下4K(1/0.1ms=10000 IOPS)0ms+0ms+ 4K/40MB =0.18k(1/0.2ms=5000 IOPS)0ms+0ms+ 8K/40MB =0.216K(1/0.4ms =2500 IOPS)0ms+ 0ms+ 16K/40MB=0.432K(1/0.8ms =1250 IOPS)0ms+ 0ms+ 32K/40MB=0.864K(1/1.6ms =625 IOPS)0ms+ 0ms+ 64K/40MB=1.6相比第一組數(shù)據(jù)來說差距是非常的大的,因此當(dāng)我們要用 IOPS來衡量一個(gè) IO系統(tǒng)的系能的時(shí)候我們一定要說清楚是在什么情況的 也就是要說明讀寫的方式以及單次 IO的大小,當(dāng)然在實(shí)際當(dāng)中,特別是在的系統(tǒng)的,隨機(jī)小IO的讀寫是最有說服力的。傳輸速度(TransferRate)/ 吞吐率(Throughput)現(xiàn)在我們要說的傳輸速度(另一個(gè)常見的說法是吞吐率) 不是磁盤上所表明的大傳輸速度或者說理想傳輸速度, 而是磁盤在實(shí)際使用的時(shí)候從磁盤系統(tǒng)總線上流過的數(shù)據(jù)量。有了 IOPS數(shù)據(jù)之后我們是很容易就能計(jì)算出對應(yīng)的傳輸速度來的Transfer Rate = IOPS * IO Chunk Size8K:139* 8K=1112K/40M=2.71%16K:135* 16K=2160K/40M=5.27%32K:116* 32K8K:139* 8K=1112K/40M=2.71%16K:135* 16K=2160K/40M=5.27%32K:116* 32K=3712K/40M=9.06%可以看出實(shí)際上的傳輸速度是很小的,對總線的利用率也是非常的小。這里一定要明確一個(gè)概念,那就是盡管上面我們使用 IOPS來計(jì)算傳輸速度,但是實(shí)際上傳輸速度和 IOPS是沒有直接關(guān)系,在沒有緩存的情況下它們共同的決定因素都是對磁盤系統(tǒng)的訪問方式以及單個(gè) IO的大小。對磁盤進(jìn)行隨機(jī)訪問時(shí)候我們可以利用 IOPS來衡量一個(gè)磁盤系統(tǒng)的性能,此時(shí)的傳輸速度不會(huì)太大;但是當(dāng)對磁盤進(jìn)行連續(xù)訪問時(shí),此時(shí)的 IOPS已經(jīng)沒有了參考的價(jià)值,這個(gè)時(shí)候限制實(shí)際傳輸速度卻是磁盤的最大傳輸速度。因此在實(shí)際的應(yīng)用當(dāng)中,只會(huì)用IOPS 來衡量小IO的隨機(jī)讀寫的性能,而當(dāng)要衡量大 IO連續(xù)讀寫的性能的時(shí)就要采用傳輸速度而不能是 IOPS了。IO響應(yīng)時(shí)間(IOResponseTime)最后來關(guān)注一下能直接描述 IO性能的IO響應(yīng)時(shí)間。IO響應(yīng)時(shí)間也被稱為 IO時(shí)(IOLatency) ,IO響應(yīng)時(shí)間就是從操作系統(tǒng)內(nèi)核發(fā)出的一個(gè)讀或者寫的 IO命令到操作系統(tǒng)內(nèi)核接收到 IO回應(yīng)的時(shí)間,注意不要和單個(gè) IO時(shí)間混淆了,單個(gè)IO時(shí)間僅僅指的是 IO操作在磁盤內(nèi)部處理的時(shí)間,而 IO響應(yīng)時(shí)間還要包括 IO操作在IO等待隊(duì)列中所花費(fèi)的等待時(shí)間。計(jì)算IO操作在等待隊(duì)列里面消耗的時(shí)間有一個(gè)衍生于利托氏定理(Little’sLaw)的排隊(duì)模型M/M/1模型可以遵循,由于排隊(duì)模型算法比較復(fù)雜,到現(xiàn)在還沒有搞太明白(如果有誰對M/M/1模型比較精通的話歡迎給予指導(dǎo)這里就羅列一下最后的結(jié)果,還是那上面計(jì)算的IOPS數(shù)據(jù)來說:8K IO Chunk Size (135 IOPS, 7.2 135 => 240.0 ms105 => 29.5 ms75 => 15.7 ms45 => 10.6 ms64KIOChunkSize(116IOPS,8.6ms)135 => 沒響應(yīng)了??105 => 88.6 ms75 => 24.6 ms45 => 14.6 ms從上面的數(shù)據(jù)可以看出,隨著系統(tǒng)實(shí)際 IOPS越接近理論的最大值, IO的響應(yīng)間會(huì)成非線性的增長,越是接近最大值,響應(yīng)時(shí)間就變得越大, 而且會(huì)比預(yù)期超出很多。一般來說在實(shí)際的應(yīng)用中有一個(gè) 的指導(dǎo)值,也就是說在 IO讀寫的隊(duì)列中,當(dāng)隊(duì)列大小小于最大 IOPS的的時(shí)候,IO的響應(yīng)時(shí)間增加會(huì)很小,相對來說讓人比較能接受的,一旦超過 響應(yīng)時(shí)間就會(huì)戲劇性的暴增,所以當(dāng)一個(gè)系統(tǒng)的 IO壓力超出最大可承受壓力的 的時(shí)候就是必須要考慮調(diào)整或升級(jí)了。另外補(bǔ)充說一下這個(gè)的指導(dǎo)值也適用于過的,一旦超過精品文檔交流精品文檔交流從上一篇文章的計(jì)算中我們可以看到一個(gè) 15k轉(zhuǎn)速的磁盤在隨機(jī)讀寫訪問的情況下IOPS竟然只有140左右,但在實(shí)際應(yīng)用中我們卻能看到很多標(biāo)有 甚至更高的存儲(chǔ)系統(tǒng),有這么大 IOPS的存儲(chǔ)系統(tǒng)怎么來的呢?這就要?dú)w結(jié)于各種存儲(chǔ)技術(shù)的使用了,在這些存儲(chǔ)技術(shù)中使用最廣的就是高速緩存 (Cache)和磁盤冗余陣列(RAID)了,本文就將探討緩存和磁盤陣列提高存儲(chǔ) IO性能的方法。高速緩存(Cache)在當(dāng)下的各種存儲(chǔ)產(chǎn)品中,按照速度從快到慢應(yīng)該就是內(nèi)存 閃存磁盤磁帶了然而速度越快也就意味著價(jià)格越高, 閃存雖然說是發(fā)展勢頭很好, 但目前來說卻還是因?yàn)閮r(jià)格問題無法普及, 因此現(xiàn)在還是一個(gè)磁盤作霸王的時(shí)代。 與和內(nèi)存速度相比,磁盤的速度無疑是計(jì)算機(jī)系統(tǒng)中最大的瓶頸了, 所以在必須使用磁盤而又想提高性能的情況下,人們想出了在磁盤中嵌入一塊高速的內(nèi)存 用來保存經(jīng)常訪問的數(shù)據(jù)從而提高讀寫效率的方法來折中的解決, 這塊嵌入的內(nèi)存就被稱為高速緩存。說到緩存,這東西應(yīng)用現(xiàn)在已經(jīng)是無處不在, 從處于上層的應(yīng)用,到操作系統(tǒng)層再到磁盤控制器,還有內(nèi)部,單個(gè)磁盤的內(nèi)部也都存在緩存, 所有這些緩存存在的目的都是相同的,就是提高系統(tǒng)執(zhí)行的效率。當(dāng)然在這里我們只關(guān)心跟IO性能相關(guān)的緩存,與 IO性能直接相關(guān)的幾個(gè)緩存分別是 文件系統(tǒng)緩存(FileSystemCache) 、磁盤控制器緩存(DiskControllerCache) 和磁盤緩存(DiskCache,也稱為DiskBuffer) ,不過當(dāng)在計(jì)算一個(gè)磁盤系統(tǒng)性能的時(shí)候文件系統(tǒng)緩存也是不會(huì)考慮在內(nèi)的, 因此我們重點(diǎn)考察的就是磁盤控制器緩存和磁緩存。不管是控制器緩存還是磁盤緩存,他們所起的作用主要是分為三部分: 緩存數(shù)據(jù)預(yù)讀(Read-ahead)和回寫(Write-back) 。緩存數(shù)據(jù)首先是系統(tǒng)讀取過的數(shù)據(jù)會(huì)被緩存在高速緩存中, 這樣下次再次需要讀取相同的數(shù)據(jù)的時(shí)候就不用在訪問磁盤, 直接從緩存中取數(shù)據(jù)就可以了。 當(dāng)然使用過的據(jù)也不可能在緩存中永久保留的,緩存的數(shù)據(jù)一般那是采取 算法來進(jìn)行管理目的是將長時(shí)間不用的數(shù)據(jù)清除出緩存, 那些經(jīng)常被訪問的卻能一直保留在緩存中,直到緩存被清空。預(yù)讀預(yù)讀是指采用預(yù)讀算法在沒有系統(tǒng)的IO請求的時(shí)候事先將數(shù)據(jù)從磁盤中讀入到緩存中,然后在系統(tǒng)發(fā)出讀IO請求的時(shí)候,就會(huì)實(shí)現(xiàn)去檢查看看緩存里面是否存在要讀取的數(shù)據(jù),如果存在(即命中)的話就直接將結(jié)果返回,這時(shí)候的磁盤精品文檔交流精品文檔交流不再需要尋址、旋轉(zhuǎn)等待、讀取數(shù)據(jù)這一序列的操作了, 這樣是能節(jié)省很多時(shí)的;如果沒有命中則再發(fā)出真正的讀取磁盤的命令去取所需要的數(shù)據(jù)。緩存的命中率跟緩存的大小有很大的關(guān)系, 理論上是緩存越大的話,所能緩存的數(shù)據(jù)也就越多,這樣命中率也自然越高, 當(dāng)然緩存不可能太大, 畢竟成本在那兒呢如果一個(gè)容量很大的存儲(chǔ)系統(tǒng)配備了一個(gè)很小的讀緩存的話, 這時(shí)候問題會(huì)比較大的,因?yàn)樾【彺娴臄?shù)據(jù)量非常小, 相比整個(gè)存儲(chǔ)系統(tǒng)來說比例非常低, 樣隨機(jī)讀?。〝?shù)據(jù)庫系統(tǒng)的大多數(shù)情況) 的時(shí)候命中率也自然就很低, 這樣的緩存不但不能提高效率(因?yàn)榻^大部分讀 IO都還要讀取磁盤),反而會(huì)因?yàn)槊看稳テヅ渚彺娑速M(fèi)時(shí)間。執(zhí)行讀IO操作是讀取數(shù)據(jù)存在于緩存中的數(shù)量與全部要讀取數(shù)據(jù)的比值稱為緩存命中率(ReadCacheHitRadio) ,假設(shè)一個(gè)存儲(chǔ)系統(tǒng)在不使用緩存的情況下機(jī)小IO讀取能達(dá)到 而它的緩存能提供 的緩存命中率的話,那么際上它的IOPS可以達(dá)到150/(1-10%)=166?;貙懯紫日f一下,用于回寫功能的那部分緩存被稱為寫緩存 (WriteCache)在一套緩存打開的存儲(chǔ)中,操作系統(tǒng)所發(fā)出的一系列寫 IO命令并不會(huì)被挨個(gè)的執(zhí)行,這些寫IO的命令會(huì)先寫入緩存中,然后再一次性的將緩存中的修改推到磁盤中,這就相當(dāng)于將那些相同的多個(gè) IO合并成一個(gè),多個(gè)連續(xù)操作的小 IO合并成一大的還有就是將多個(gè)隨機(jī)的寫 IO變成一組連續(xù)的寫 這樣就能減少磁盤尋址等操作所消耗的時(shí)間,大大的提高磁盤寫入的效率。讀緩存雖然對效率提高是很明顯的, 但是它所帶來的問題也比較嚴(yán)重, 因?yàn)榫彺婧推胀▋?nèi)存一樣,掉點(diǎn)以后數(shù)據(jù)會(huì)全部丟失,當(dāng)操作系統(tǒng)發(fā)出的寫 IO命令寫入到緩存中后即被認(rèn)為是寫入成功, 而實(shí)際上數(shù)據(jù)是沒有被真正寫入磁盤的, 此時(shí)如果掉電,緩存中的數(shù)據(jù)就會(huì)永遠(yuǎn)的丟失了, 這個(gè)對應(yīng)用來說是災(zāi)難性的, 目解決這個(gè)問題最好的方法就是給緩存配備電池了, 保證存儲(chǔ)掉電之后緩存數(shù)據(jù)能如數(shù)保存下來。和讀一樣,寫緩存也存在一個(gè)寫緩存命中率(WriteCacheHitRadio)緩存命中情況不一樣的是,盡管緩存命中,也不能將實(shí)際的IO操作免掉,只是被合并了而已??刂破骶彺婧痛疟P緩存除了上面的作用之外還承當(dāng)著其他的作用,比如磁盤緩存有保存IO命令隊(duì)列的功能,單個(gè)的磁盤一次只能處理一個(gè)IO命令,但卻能接收多個(gè)IO命令,這些進(jìn)入到磁盤而未被處理的命令就保存在緩存中的IO隊(duì)列中。RAID(RedundantArrayOfInexpensiveDisks)如果你是一位數(shù)據(jù)庫管理員或者經(jīng)常接觸服務(wù)器,那對 RAID應(yīng)該很熟悉了,作為最廉價(jià)的存儲(chǔ)解決方案, RAID早已在服務(wù)器存儲(chǔ)中得到了普及。在 RAID的各個(gè)級(jí)別中,應(yīng)當(dāng)以和(不過已經(jīng)基本走到頭了,6正在崛起中,看看這里了解下原因)應(yīng)用最廣了。下面將就 這幾種級(jí)別的 RAID展開說一下磁盤陣列對于磁盤性能的影響,當(dāng)然在閱讀下面的內(nèi)容之前你必須對各個(gè)級(jí)別的 RAID的結(jié)構(gòu)和工作原理要熟悉才行,這樣才不至于滿頭霧水,推薦查看 wikipedia 上面的如下條目: StandardRAIDlevels ,NestedRAIDlevels 。RAID0RAID0將數(shù)據(jù)條帶化(striping) 將連續(xù)的數(shù)據(jù)分散在多個(gè)磁盤上進(jìn)行存取, 系發(fā)出的IO命令(不管讀 IO和寫IO都一樣)就可以在磁盤上被并行的執(zhí)行,每個(gè)磁盤單獨(dú)執(zhí)行自己的那一部分請求,這樣的并行的 IO操作能大大的增強(qiáng)整個(gè)存儲(chǔ)系統(tǒng)的性能。假設(shè)一個(gè) RAID0陣列有n(n>=2)個(gè)磁盤組成,每個(gè)磁盤的隨機(jī)讀寫的IO能力都達(dá)到 140的話,那么整個(gè)磁盤陣列的 IO能力將是 140*n。同如果在陣列總線的傳輸能力允許的話 RAID0的吞吐率也將是單個(gè)磁盤的 n倍。RAID1RAID1在容量上相當(dāng)于是將兩個(gè)磁盤合并成一個(gè)磁盤來使用了,互為鏡像的兩個(gè)磁盤里面保存的數(shù)據(jù)是完全一樣的,因此在并行讀取的時(shí)候速度將是n個(gè)磁盤速寫入速度只有n/2。RAID5我們那一個(gè)有 n(n>=3)個(gè)磁盤的 陣列來看,首先看看 RAID5陣列的讀 RAID5是支持并行 IO的,而磁盤上的數(shù)據(jù)呈條帶狀的分布在所有的磁盤上,因此讀IO的速度相當(dāng)于所有磁盤速度的總和。 不過這是在沒有磁盤損壞的情況下,當(dāng)有一個(gè)磁盤故障的時(shí)候讀取速度也是會(huì)下降的, 因?yàn)橹虚g需要花時(shí)間來計(jì)算失磁盤上面的數(shù)據(jù)。讀取數(shù)據(jù)的情況相對就要復(fù)雜的多了,先來看下 RAID5奇偶校驗(yàn)數(shù)據(jù)寫入的過程,我們把寫入的數(shù)據(jù)稱為 當(dāng)磁盤拿到一個(gè)寫 IO的命令的時(shí)候,它首先會(huì)讀取一次要寫入的地址的數(shù)據(jù)塊中修改之前的數(shù)據(jù) 然后再讀取到當(dāng)前條帶中的校驗(yàn)信息 接下來就根據(jù) 這三組數(shù)據(jù)計(jì)算出數(shù)據(jù)寫入之后的條帶的奇偶校驗(yàn)信息 最后發(fā)出兩個(gè)寫 IO的命令,一個(gè)寫入 另一個(gè)寫奇偶校驗(yàn)信息 ??梢钥闯鲫嚵性趯?shí)際操作的時(shí)候需要讀、讀、寫、寫一共 4個(gè) IO才能完成一次寫 IO操作,也就是實(shí)際上的寫入速度只有所有磁盤速度總和的1/4從這點(diǎn)可以看出 RAID5是非常不適合用在要大批量寫入數(shù)據(jù)的系統(tǒng)的。RAID6RAID6和很類似,差別就在于 RAID6多了一個(gè)用于校驗(yàn)的磁盤。就讀 IO速度上來說這兩個(gè)是完全一樣的,都是所有磁盤 IO速度的總和。在寫IO上也很是類似,不同的是 將一個(gè)命令分成了三次讀、三次寫一共 次IO命令才能完成,也就是 RAID6實(shí)際寫入磁盤的速度是全部磁盤速度之和的1/6??梢钥闯鰪膶?IO看RAID6比RAID5差別是很大的。RAID10RAID0 讀寫速度都很好,卻沒有冗余保護(hù); 和RAID6都有同樣的毛病就是寫入的時(shí)候慢,讀取的時(shí)候快。那么 RAID1呢?嗯,這里要說的就是 其實(shí)不管是 RAID10還是其實(shí)都是組合大于 2塊磁盤時(shí)候的 當(dāng)先鏡像后條帶時(shí)候就稱為 先條帶后鏡像的時(shí)候稱為 。從性能上看RAID01和RAID10都是一樣的,都是 RAID1嘛,但是RAID10在重建故障磁盤的時(shí)候性能比 RAID01 要快。因?yàn)?其實(shí)就是所以它的性能與RAID1也就是一樣的了,這里不需要再做過多的討論。四個(gè)性能指標(biāo)的變化IO響應(yīng)時(shí)間(IOResponseTime)在任何時(shí)候 IO響應(yīng)時(shí)間值得都是單個(gè) IO的響應(yīng)時(shí)間,因此,不管磁盤是否組成了磁盤陣列,它的IO響應(yīng)時(shí)間應(yīng)該都是一樣的。 從前面的計(jì)算中我們可以看到如果IO響應(yīng)時(shí)間在 10ms左右的話是很正常的,但是當(dāng) IO響應(yīng)時(shí)間比這個(gè)值超出太多的時(shí)候,你就要開始注意了,很可能就意味著此時(shí)你的磁盤系統(tǒng)已經(jīng)成為了一個(gè)瓶頸。IOPS綜合上面兩個(gè)部分的討論我們來估算一下陣列下的磁盤總體 在這里我們先假設(shè)組成陣列的單個(gè)磁盤的隨機(jī)讀寫的 IOP為讀寫緩存命中率都為 組成陣列的磁盤個(gè)數(shù)為 。因?yàn)椴还苁悄欠N陣列,磁盤的讀取性能都是所有磁盤之和, 所以可以得出下面讀取精品文檔交流精品文檔交流read IOPS = disk_IOPS/(1-read_cache_hit_ratio)*disk_num 0%)*4 = 622而寫入性能就完全不一樣了,根據(jù)上面的討論我們可以得出下面結(jié)論:RAID0:1IOrequest=>need1actualIOondiskRAID1:1IOrequest=>need2actualIOondiskRAID5:1IOrequest=>need4actualIOondiskRAID6:1IOrequest=>need6actualIOondisk由此我們也可以計(jì)算出寫入 IOPS估算公式:RAID0 write IOPS ure_IO_num =140/(1-10%)*4/1 = 622RAID1 write IOPS =disk_IOPS/(1-write_cache_hit_ratio)*disk_num/acture_IO_num =140/(1-10%)*4/2 = 311RAID5 write IOPS ure_IO_num =140/(1-10%)*4/4 = 155RAID6 write IOPS ure_IO_num =140/(1-10%)*4/6 = 103實(shí)際上從通過上面的計(jì)算方法我們還可以估算當(dāng)給定一個(gè)要求的 IOPS的情況下估計(jì)下使用各個(gè)陣列級(jí)別所需要的磁盤的數(shù)量。 當(dāng)然我們上面的計(jì)算方法只是一個(gè)估算,我們忽略很多其他的因素, 得出的只是一個(gè)大概的數(shù)值, 不過在際的應(yīng)用還是有一定的參考作用的。本篇最后附送一個(gè)計(jì)算磁盤系統(tǒng) IOPS的網(wǎng)站――’sk&kcalculator 這個(gè)網(wǎng)站提供的計(jì)算公式還考慮了諸如陣列條帶大小以及主機(jī)方面的因素,很有參考價(jià)值,至于怎么選擇合適的條帶大小,請參考【延伸閱讀】部分。傳輸速度(TransferRate)/ 吞吐率(Throughput)實(shí)際上估算除了隨機(jī)讀寫的 IOPS也就知道了隨機(jī)讀寫的吞吐率。對于順序讀寫的呢,還是跟前一篇所講的一樣,主要受限于磁盤的限制,不能再拿 IOPS來量了。random_throughtput = random_IOPS * IO_chunk_size能部室由企管部統(tǒng)一考核)。不符合衛(wèi)生標(biāo)準(zhǔn)的,超市內(nèi)每處扣0.5分,超市外每處扣1分。衛(wèi)生管理制度1 總則1.1 為了加強(qiáng)公司的環(huán)境衛(wèi)生管理,創(chuàng)造一個(gè)整潔、文明、溫馨的購物、辦公環(huán)境,根據(jù)《公共場所衛(wèi)生管理?xiàng)l例》的要求,特制定本制度。1.2 集團(tuán)公司的衛(wèi)生管理部門設(shè)在企管部,并負(fù)責(zé)將集團(tuán)公司的衛(wèi)生區(qū)域詳細(xì)劃分到各部室,各分公司所轄區(qū)域衛(wèi)生由分公司客服部負(fù)責(zé)劃分,確保無遺漏。2 衛(wèi)生標(biāo)準(zhǔn)2.1 室內(nèi)衛(wèi)生標(biāo)準(zhǔn)2.1.1 地面、墻面:無灰塵、無紙屑、無痰跡、無泡泡糖等粘合物、無積水,墻角無灰吊、無蜘蛛網(wǎng)。2.1.2 門、窗、玻璃、鏡子、柱子、電梯、樓梯、燈具等,做到明亮、無灰塵、無污跡、無粘合物,特別是玻璃,要求兩面明亮。2.1.3 柜臺(tái)、貨架:清潔干凈,貨架、柜臺(tái)底層及周圍無亂堆亂放現(xiàn)象、無灰塵、無粘合物,貨架頂部、背部和底部干凈,不存放雜物和私人物品。2.1.4 購物車(筐)、直接接觸食品的售貨工具(包括刀、叉等):做到內(nèi)外潔凈,無污垢和粘合物等。購物車(筐)要求每天營業(yè)前簡單清理,周五全面清理消毒;售貨工具要求每天消毒,并做好記錄。2.1.5 商品及包裝:商品及外包裝清潔無灰塵(外包裝破損的或破舊的不得陳列)。2.1.6 收款臺(tái)、服務(wù)臺(tái)、辦公櫥、存包柜:保持清潔、無灰塵,臺(tái)面和側(cè)面無灰塵、無灰吊和蜘蛛網(wǎng)。桌面上不得亂貼、亂畫、亂堆放物品,用具擺放有序且干凈,除當(dāng)班的購物小票收款聯(lián)外,其它單據(jù)不得存放在桌面上。2.1.7 垃圾桶:桶內(nèi)外干凈,要求營業(yè)時(shí)間隨時(shí)清理,不得溢出,每天下班前徹底清理,不得留有垃圾過夜。2.1.8 窗簾:定期進(jìn)行清理,要求干凈、無污漬。2.1.9 吊飾:屋頂?shù)牡躏椧鬅o灰塵、無蜘蛛網(wǎng),短期內(nèi)不適用的吊飾及時(shí)清理徹底。2.1.10 內(nèi)、外倉庫:半年徹底清理一次,無垃圾、無積塵、無蜘蛛網(wǎng)等。2.1.11 室內(nèi)其他附屬物及工作用具均以整潔為準(zhǔn),要求無灰塵、無粘合物等污垢。Windows性能計(jì)數(shù)器-- 磁盤性能分析 DiskPhysicalDisk :單次IO大小Avg.DiskBytes/ReadAvg.DiskBytes/WriteIO響應(yīng)時(shí)間Avg.Disksec/Read 磁盤每次讀取需要的時(shí)間,一般不超過一般不要超過11~15ms。Avg.Disksec/Write 一般小于每秒讀/寫的IO數(shù))理論情況下,磁盤的隨機(jī)讀計(jì)數(shù)為 、 順序讀計(jì)數(shù)為 實(shí)際測試值與理論值對比,從而判斷磁盤是否為瓶頸DiskReads/secDiskWrites/secDiskTransfers/secIO吞吐率(磁盤每秒讀 /寫字節(jié)數(shù))DiskBytes/secDiskReadBytes/secDiskWriteBytes/sec磁盤隊(duì)列長度Avg.DiskQueueLength :磁盤平均隊(duì)列長度不應(yīng)超過 2,即:隊(duì)列長度/磁盤數(shù)磁盤有兩個(gè)重要的參數(shù): Seektime、Rotational latency 。正常的I/O計(jì)數(shù)為:①1000/(Seektime+Rotationallatency)*0.75,在此范圍內(nèi)屬正常。當(dāng)達(dá)到%的I/O計(jì)數(shù)以上時(shí)則基本認(rèn)為已經(jīng)存在I/O瓶頸。理論、順序讀計(jì)數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 沙石代賣合同范例
- 創(chuàng)意規(guī)劃設(shè)計(jì)合同范例
- 中介資金監(jiān)管合同范例
- 公司銷售提成合同范例
- 二手房買房擔(dān)保合同范例
- 老板與廚師合同范例
- 冷鮮肉供貨合同范例
- 本人合同范例
- 船舶運(yùn)輸委托經(jīng)營合同范例
- 豬肉凍品采購合同范例
- 國開汽車學(xué)院《項(xiàng)目管理》形考作業(yè)1-4答案
- 2021-2022學(xué)年第二學(xué)期《大學(xué)生職業(yè)發(fā)展與就業(yè)指導(dǎo)2》學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 歌唱語音智慧樹知到期末考試答案章節(jié)答案2024年齊魯師范學(xué)院
- 工業(yè)管道材料選用規(guī)定
- 神經(jīng)遞質(zhì)與受體
- 中醫(yī)腫瘤臨床路徑
- 土方碾壓試驗(yàn)施工方案1
- 2_電壓降計(jì)算表(10kV及以下線路)
- 主要原材料價(jià)格趨勢分析圖
- 10kV無功補(bǔ)償裝置安裝施工技術(shù)措施要點(diǎn)
- 公共衛(wèi)生導(dǎo)論復(fù)習(xí)資料
評(píng)論
0/150
提交評(píng)論