IO系統(tǒng)性能之一衡量性能的幾個(gè)指標(biāo)_第1頁(yè)
IO系統(tǒng)性能之一衡量性能的幾個(gè)指標(biāo)_第2頁(yè)
IO系統(tǒng)性能之一衡量性能的幾個(gè)指標(biāo)_第3頁(yè)
IO系統(tǒng)性能之一衡量性能的幾個(gè)指標(biāo)_第4頁(yè)
IO系統(tǒng)性能之一衡量性能的幾個(gè)指標(biāo)_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、IO系統(tǒng)性能之一:衡量性能的幾個(gè)指標(biāo)2011年03月24日05:00 it168網(wǎng)站原創(chuàng)作者:DBABeta馬齒范編輯:李雋 我要評(píng)論(0) 【IT168應(yīng)用】作為一個(gè)數(shù)據(jù)庫(kù)管理員,關(guān)注系統(tǒng)的性能是日常最重要的工作之一,而在所關(guān)注的各方面的性能只能IO性能卻是最令人頭痛的一塊,面對(duì)著各種生澀的參數(shù)和令人眼花繚亂的新奇的術(shù)語(yǔ),再加上存儲(chǔ)廠商的忽悠,總是讓我們有種云里霧里的感覺(jué)。本系列文章試圖從基本概念開(kāi)始對(duì)磁盤(pán)存儲(chǔ)相關(guān)的各種概念進(jìn)行綜合歸納,讓大家能夠?qū)O性能相關(guān)的基本概念,IO性能的監(jiān)控和調(diào)整有個(gè)比較全面的了解。在這一部分里我們先舍棄各種結(jié)構(gòu)復(fù)雜的存儲(chǔ)系統(tǒng),直接研究一個(gè)單獨(dú)的磁盤(pán)的性能問(wèn)題,

2、藉此了解各個(gè)衡量 IO系統(tǒng)系能的各個(gè)指標(biāo)以及之間的關(guān)系。需要注意的是,本文探討 的僅限于磁盤(pán)IO性能,網(wǎng)絡(luò)IO性能不考慮在內(nèi)。幾個(gè)基本的概念在研究磁盤(pán)性能之前我們必須先了解磁盤(pán)的結(jié)構(gòu),以及工作原理。不過(guò)在這里就不再重復(fù)說(shuō)明了,關(guān)系硬盤(pán)結(jié)構(gòu)和工作原理的信息可以參考維基百科上面的相關(guān)詞條一一Hard diskdrive(英文)和硬盤(pán)驅(qū)動(dòng)器(中文)。讀寫(xiě) IO(Read/Write IO)操作磁盤(pán)是用來(lái)給我們存取數(shù)據(jù)用的,因此當(dāng)說(shuō)到IO操作的時(shí)候,就會(huì)存在兩種相對(duì)應(yīng)的操作,存數(shù)據(jù)時(shí)彳對(duì)應(yīng)的是寫(xiě)IO操作,取數(shù)據(jù)的時(shí)彳對(duì)應(yīng)的是是讀IO操作。單個(gè)IO操作當(dāng)控制磁盤(pán)的控制器接到操作系統(tǒng)的讀IO操作指令的時(shí)候

3、,控制器就會(huì)給磁盤(pán)發(fā)出一個(gè)讀數(shù)據(jù)的指令,并同時(shí)將要讀取的數(shù)據(jù)塊的地址傳遞給磁盤(pán),然后磁盤(pán)會(huì)將讀取到的數(shù)據(jù)傳給控制器,并由控制器返回給操作系統(tǒng),完成一個(gè)寫(xiě)IO的操作;同樣的,一個(gè)寫(xiě)IO的操作也類(lèi)似,控制器接到寫(xiě)的IO操作的指令和要寫(xiě)入的數(shù)據(jù),并將其傳遞給磁盤(pán),磁盤(pán)在數(shù)據(jù)寫(xiě)入完成之后將操作結(jié)果傳遞回控制器,再由控制器返回給操作系統(tǒng),完成一個(gè)寫(xiě)IO的操作。單個(gè)IO操作指的就是完成一個(gè)寫(xiě)IO或者是讀IO的操作。隨機(jī)訪問(wèn)(Random Access再連續(xù)訪問(wèn)(Sequential Access)隨機(jī)訪問(wèn)指的是本次IO所給出的扇區(qū)地址和上次IO給出扇區(qū)地址相差比較大,這樣的話磁頭在兩次IO操作之間需要作比

4、較大的移動(dòng)動(dòng)作才能重新開(kāi)始讀/寫(xiě)數(shù)據(jù)。相反的,如果當(dāng)次IO給出的扇區(qū)地址與上次IO結(jié)束的扇區(qū)地址一致或者是接近的話,那磁頭就能很快的開(kāi)始這次IO操作,這樣的多個(gè)IO操作稱(chēng)為連續(xù)訪問(wèn)。因此盡管相鄰的兩次IO操作在同一時(shí)刻發(fā)出,但如果它們的請(qǐng)求的扇區(qū)地址相差很大的話也只能稱(chēng)為隨機(jī)訪問(wèn),而非連續(xù)訪問(wèn)。順序 IO 模式(Queue Mode)/ 并發(fā) IO 模式(Burst Mode)磁盤(pán)控制器可能會(huì)一次對(duì)磁盤(pán)組發(fā)出一連串的IO命令,如果磁盤(pán)組一次只能執(zhí)行一個(gè)IO命令時(shí)稱(chēng)為順序IO;當(dāng)磁盤(pán)組能同時(shí)執(zhí)行多個(gè) IO命令時(shí),稱(chēng)為并發(fā)IO。并發(fā)IO只能發(fā)生 在由多個(gè)磁盤(pán)組成的磁盤(pán)組上,單塊磁盤(pán)只能一次處理一個(gè)

5、IO命令。單個(gè)IO的大小(IO Chunk Size)熟悉數(shù)據(jù)庫(kù)的人都會(huì)有這么一個(gè)概念,那就是數(shù)據(jù)庫(kù)存儲(chǔ)有個(gè)基本的塊大小(Block Size),不管是SQL Server是Oracle,默認(rèn)的塊大小都是 8KB,就是數(shù)據(jù)庫(kù)每次讀寫(xiě)都是以8k為單位的。那么對(duì)于數(shù)據(jù)庫(kù)應(yīng)用發(fā)出的固定8k大小的單次讀寫(xiě)到了寫(xiě)磁盤(pán)這個(gè)層面會(huì)是怎么樣的呢,就是對(duì)于讀寫(xiě)磁盤(pán)來(lái)說(shuō)單個(gè)IO操作操作數(shù)據(jù)的大小是多少呢,是不是也是一個(gè)固定的值?答案是不確定。首先操作系統(tǒng)為了提高IO的性能而引入了文件系統(tǒng)緩存(File SystemCache),系統(tǒng)會(huì)根據(jù)請(qǐng)求數(shù)據(jù)的情況將多個(gè)來(lái)自IO的請(qǐng)求先放在緩存里面,然后再一次性的提交給磁盤(pán),

6、也就是說(shuō)對(duì)于數(shù)據(jù)庫(kù)發(fā)出的多個(gè)8K數(shù)據(jù)塊的讀操作有可能放在一個(gè)磁盤(pán)讀IO里就處理了。還有對(duì)于有些存儲(chǔ)系統(tǒng)也是提供了緩存(Cache)的,接收到操作系統(tǒng)的IO請(qǐng)求之后也是會(huì)將多個(gè)操作系統(tǒng)的IO請(qǐng)求合并成一個(gè)來(lái)處理。不管是操作系統(tǒng)層面的緩存還是磁盤(pán)控制器層面的緩存,目的都只有一個(gè),提高數(shù)據(jù)讀寫(xiě)的效率。因此每次單獨(dú)的IO操作大小都是不一樣的,它主要取決于系統(tǒng)對(duì)于數(shù)據(jù)讀寫(xiě)效率的判斷。當(dāng)一次IO操作大小比較小的時(shí)彳g我們成為小的IO操作,比如說(shuō)1K, 4K, 8K這樣的;當(dāng)一次IO操作的數(shù)據(jù)量比較的的時(shí)候稱(chēng)為大IO操作,比如說(shuō)32K, 64K甚至更大。在我們說(shuō)到塊大小(Block Size腫時(shí)候通常我們會(huì)

7、接觸到多個(gè)類(lèi)似的概念,像我們上面提 到的那個(gè)在數(shù)據(jù)庫(kù)里面的數(shù)據(jù)最小的管理單位,Oralce稱(chēng)之為塊(Block),大小一般為8K, SQLServer稱(chēng)之為頁(yè)(Page), 一般大小也為 8k。在文件系統(tǒng)里面我們也能碰到一個(gè)文件系統(tǒng)的塊,在現(xiàn)在很多的Linux系統(tǒng)中都是4K(通過(guò)/usr/bin/time -v可以看到),它的作用其實(shí)跟數(shù)據(jù)庫(kù)里面的塊/頁(yè)是一樣的,都是為了方便數(shù)據(jù)的管理。但是說(shuō)到單次IO的大小,跟這些塊的大小都是沒(méi)有直接關(guān)系的,在英文里單次IO大小通常被稱(chēng)為是 IO Chunk Size不會(huì)說(shuō)成是IO Block Size的。IOPS(IO per Second)IOPS, I

8、O系統(tǒng)每秒所執(zhí)行IO操作的次數(shù),是一個(gè)重要的用來(lái)衡量系統(tǒng)IO能力的一個(gè)參數(shù)。對(duì)于單個(gè)磁盤(pán)組成的IO系統(tǒng)來(lái)說(shuō),計(jì)算它的IOPS不是一件很難的事情,只要我們知道了系統(tǒng)完成一次IO所需要的時(shí)間的話我們就能推算出系統(tǒng)IOPS來(lái)?,F(xiàn)在我們就來(lái)推算一下磁盤(pán)的IOPS,假設(shè)磁盤(pán)的轉(zhuǎn)速(Rotational Speed)為15K RPM,平均尋道時(shí)間為5ms,最大傳輸速率為40MB/S(這里將讀寫(xiě)速度視為一樣,實(shí)際會(huì)差別比較大)。對(duì)于磁盤(pán)來(lái)說(shuō)一個(gè)完整的IO操作是這樣進(jìn)行的:當(dāng)控制器對(duì)磁盤(pán)發(fā)出一個(gè)IO操作命令的時(shí)候,磁盤(pán)的驅(qū)動(dòng)臂 (Actuator Arm)帶讀寫(xiě)磁頭(Head)離開(kāi)著陸區(qū)(Landing Zo

9、ne,位于內(nèi)圈 沒(méi)有數(shù)據(jù)的區(qū)域),移動(dòng)到要操作的初始數(shù)據(jù)塊所在的磁道(Track)的正上方,這個(gè)過(guò)程被稱(chēng)為尋址(Seeking),對(duì)應(yīng)消耗的時(shí)間被稱(chēng)為尋址時(shí)間(Seek Time);但是找到對(duì)應(yīng)磁道還不能馬上讀取數(shù)據(jù),這時(shí)候磁頭要等到磁盤(pán)盤(pán)片(Platter)旋轉(zhuǎn)到初始數(shù)據(jù)塊所在的扇區(qū)(Sector)落在讀寫(xiě)磁頭正上方的之后才能開(kāi)始讀取數(shù)據(jù),在這個(gè)等待盤(pán)片旋轉(zhuǎn)到可操作扇區(qū)的過(guò)程中消耗的時(shí)間稱(chēng)為旋轉(zhuǎn)延時(shí)(Rotational Delay);接下來(lái)就隨著盤(pán)片的旋轉(zhuǎn),磁頭不斷的讀/寫(xiě)相應(yīng)的數(shù)據(jù)塊,直到完成這次IO所需要操作的全部數(shù)據(jù),這個(gè)過(guò)程稱(chēng)為數(shù)據(jù)傳送(Data Transfer),對(duì)應(yīng)的時(shí)間稱(chēng)為

10、傳送時(shí)間(Transfer Time)。完成這三個(gè)步驟之后一次IO操作也就完成了。在我們看硬盤(pán)廠商的宣傳單白時(shí)候我們經(jīng)常能看到3個(gè)參數(shù),分別是平均尋址時(shí)間、盤(pán)片旋轉(zhuǎn)速度以及最大傳送速度,這三個(gè)參數(shù)就可以提供給我們計(jì)算上述三個(gè)步驟的時(shí)間。第一個(gè)尋址時(shí)間,考慮到被讀寫(xiě)的數(shù)據(jù)可能在磁盤(pán)的任意一個(gè)磁道,既有可能在磁盤(pán)的最內(nèi)圈(尋址時(shí)間最短),也可能在磁盤(pán)的最外圈(尋址時(shí)間最長(zhǎng)),所以在計(jì)算中我們只考慮平均尋址時(shí)間,也就是磁盤(pán)參數(shù)中標(biāo)明的那個(gè)平均尋址時(shí)間,這里就采用當(dāng)前最多的10krmp硬盤(pán)的5ms。第二個(gè)旋轉(zhuǎn)延時(shí),和尋址一樣,當(dāng)磁頭定位到磁道之后有可能正好在要讀寫(xiě)扇區(qū)之上, 這時(shí)候是不需要額外額延時(shí)就

11、可以立刻讀寫(xiě)到數(shù)據(jù),但是最壞的情況確實(shí)要磁盤(pán)旋轉(zhuǎn)整整一圈之后磁頭才能讀取到數(shù)據(jù),所以這里我們也考慮的是平均旋轉(zhuǎn)延時(shí),對(duì)于10krpm的磁盤(pán)就是(60s/15k)*(1/2) = 2ms。第三個(gè)傳送時(shí)間,磁盤(pán)參數(shù)提供我們的最大的傳輸速度,當(dāng)然要達(dá)到這種速度是很有難度的,但是這個(gè)速度卻是磁盤(pán)純讀寫(xiě)磁盤(pán)的速度,因此只要給定了單次IO的大小,我們就知道磁盤(pán)需要花費(fèi)多少時(shí)間在數(shù)據(jù)傳送上,這個(gè)時(shí)間就是IO Chunk Size / Max Transfer Rate。IOPS計(jì)算公式現(xiàn)在我們就可以得出這樣的計(jì)算單次IO時(shí)間的公式:IO Time = Seek Time + 60 sec/Rotationa

12、l Speed/2 + IO Chunk Size/Transfer Rate 于是我們可以這樣計(jì)算出IOPSIOPS = 1/IO Time = 1/(Seek Time + 60 sec/Rotational Speed/2 + IO Chunk Size/Transfer Rate) 對(duì)于給定不同的IO大小我們可以得出下面的一系列的數(shù)據(jù)4K (1/7.1 ms = 140 IOPS)5ms + (60sec/15000RPM/2) + 4K/40MB = 5 + 2 + 0.1 = 7.18k (1/7.2 ms = 139 IOPS)5ms + (60sec/15000RPM/2) +

13、 8K/40MB = 5 + 2 + 0.2 = 7.216K (1/7.4 ms = 135 IOPS)5ms + (60sec/15000RPM/2) + 16K/40MB = 5 + 2 + 0.4 = 7.432K (1/7.8 ms = 128 IOPS)5ms + (60sec/15000RPM/2) + 32K/40MB = 5 + 2 + 0.8 = 7.864K (1/8.6 ms = 116 IOPS)5ms + (60sec/15000RPM/2) + 64K/40MB = 5 + 2 + 1.6 = 8.6從上面的數(shù)據(jù)可以看出,當(dāng)單次IO越小的時(shí)候,單次IO所耗費(fèi)的時(shí)間

14、也越少,相應(yīng)的IOPS也就越大。上面我們的數(shù)據(jù)都是在一個(gè)比較理想的假設(shè)下得出來(lái)的,這里的理想的情況就是磁盤(pán)要花費(fèi)平均大小的尋址時(shí)間和平均的旋轉(zhuǎn)延時(shí),這個(gè)假設(shè)其實(shí)是比較符合我們實(shí)際情況中的隨機(jī)讀寫(xiě),在隨機(jī)讀寫(xiě)中,每次IO操作的尋址時(shí)間和旋轉(zhuǎn)延時(shí)都不能忽略不計(jì),有了這兩個(gè)時(shí)間的存在也就限制了IOPS的大小?,F(xiàn)在我們考慮一種相對(duì)極端的順序讀寫(xiě)操作,比如說(shuō)在讀取一個(gè)很大的存儲(chǔ)連續(xù)分布在磁盤(pán)的的文件,因?yàn)槲募拇鎯?chǔ)的分布是連續(xù)的,磁頭在完成一個(gè)讀IO操作之后,不需要從新的尋址,也不需要旋轉(zhuǎn)延時(shí),在這種情況下我們能到 一個(gè)很大的IOPS值,如下4K (1/0.1 ms = 10000 IOPS)0ms +

15、 0ms + 4K/40MB = 0.18k (1/0.2 ms = 5000 IOPS)0ms + 0ms + 8K/40MB = 0.216K (1/0.4 ms = 2500 IOPS)0ms + 0ms + 16K/40MB = 0.432K (1/0.8 ms = 1250 IOPS)0ms + 0ms + 32K/40MB = 0.864K (1/1.6 ms = 625 IOPS)0ms + 0ms + 64K/40MB = 1.6相比第一組數(shù)據(jù)來(lái)說(shuō)差距是非常的大的,因此當(dāng)我們要用IOPS來(lái)衡量一個(gè)IO系統(tǒng)的系能的時(shí)候我們一定要說(shuō)清楚是在什么情況的IOPS,也就是要說(shuō)明讀寫(xiě)的方式

16、以及單次 IO的大小,當(dāng)然在實(shí)際當(dāng)中,特別是在 OLTP的系統(tǒng)的,隨機(jī)的小IO的讀寫(xiě)是最有說(shuō)服力的。傳輸速度(Transfer Rate)/吞吐率(Throughput)現(xiàn)在我們要說(shuō)的傳輸速度(另一個(gè)常見(jiàn)的說(shuō)法是吞吐率)不是磁盤(pán)上所表明的最大傳輸 速度或者說(shuō)理想傳輸速度,而是磁盤(pán)在實(shí)際使用的時(shí)候從磁盤(pán)系統(tǒng)總線上流過(guò)的數(shù)據(jù)量。有了 IOPS數(shù)據(jù)之后我們是很容易就能計(jì)算出對(duì)應(yīng)的傳輸速度來(lái)的Transfer Rate = IOPS * IO Chunk Size還是那上面的第一組IOPS的數(shù)據(jù)我們可以得出相應(yīng)的傳輸速度如下4K: 140 * 4K = 560K / 40M = 1.36%8K: 13

17、9 * 8K = 1112K / 40M = 2.71%16K: 135 * 16K = 2160K / 40M = 5.27%32K: 116 * 32K = 3712K / 40M = 9.06%可以看出實(shí)際上的傳輸速度是很小的,對(duì)總線的利用率也是非常的小。這里一定要明確一個(gè)概念,那就是盡管上面我們使用IOPS來(lái)計(jì)算傳輸速度,但是實(shí)際上傳輸速度和IOPS是沒(méi)有直接關(guān)系,在沒(méi)有緩存的情況下它們共同的決定因素都是對(duì)磁盤(pán) 系統(tǒng)的訪問(wèn)方式以及單個(gè)IO的大小。對(duì)磁盤(pán)進(jìn)行隨機(jī)訪問(wèn)時(shí)候我們可以利用IOPS來(lái)衡量一個(gè)磁盤(pán)系統(tǒng)的性能,此時(shí)的傳輸速度不會(huì)太大;但是當(dāng)對(duì)磁盤(pán)進(jìn)行連續(xù)訪問(wèn)時(shí),此時(shí)的 IOPS已經(jīng)沒(méi)

18、有了參考的價(jià)值,這個(gè)時(shí)候限制實(shí)際傳輸速度卻是磁盤(pán)的最大傳輸速度。因此在實(shí)際的應(yīng)用當(dāng)中,只會(huì)用IOPS來(lái)衡量小IO的隨機(jī)讀寫(xiě)的性能,而當(dāng)要衡量大 IO連續(xù)讀寫(xiě)的性 能的時(shí)候就要采用傳輸速度而不能是IOPS 了。IO 響應(yīng)時(shí)間(IO Response Time)最后來(lái)關(guān)注一下能直接描述IO性能的IO響應(yīng)時(shí)間。IO響應(yīng)時(shí)間也被稱(chēng)為IO延時(shí)(IOLatency), IO響應(yīng)時(shí)間就是從操作系統(tǒng)內(nèi)核發(fā)出的一個(gè)讀或者寫(xiě)的IO命令到操作系統(tǒng)內(nèi)核接收到IO回應(yīng)的時(shí)間,注意不要和單個(gè)IO時(shí)間混淆了,單個(gè)IO時(shí)間僅僅指的是IO操作在磁盤(pán)內(nèi)部處理的時(shí)間,而IO響應(yīng)時(shí)間還要包括IO操作在IO等待隊(duì)列中所花費(fèi)的等待時(shí)間。計(jì)算IO操作在

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論