IO系統(tǒng)衡量性能的幾個指標
作為一個數(shù)據(jù)庫管理員,關注系統(tǒng)的性能是日常最重要的工作之一,而在所關注的各方面的性能只能IO性能卻是最令人頭痛的一塊,面對著各種生澀的參數(shù)和令人眼花繚亂的新奇的術語,再加上存儲廠商的忽悠,總是讓我們有種云里霧里的感覺。本系列文章試圖從基本概念開始對磁盤存儲相關的各種概念進行綜合歸納,讓大家能夠?qū)?a class="contentlabel" href="http://butianyuan.cn/news/listbylabel/label/IO">IO性能相關的基本概念,IO性能的監(jiān)控和調(diào)整有個比較全面的了解。
本文引用地址:http://butianyuan.cn/article/150906.htm在這一部分里我們先舍棄各種結(jié)構復雜的存儲系統(tǒng),直接研究一個單獨的磁盤的性能問題,藉此了解各個衡量IO系統(tǒng)系能的各個指標以及之間的關系。需要注意的是,本文探討的僅限于磁盤IO性能,網(wǎng)絡IO性能不考慮在內(nèi)。
幾個基本的概念
在研究磁盤性能之前我們必須先了解磁盤的結(jié)構,以及工作原理。不過在這里就不再重復說明了,關系硬盤結(jié)構和工作原理的信息可以參考維基百科上面的相關詞條——Hard disk drive(英文)和硬盤驅(qū)動器(中文)。
讀寫IO(Read/Write IO)操作
磁盤是用來給我們存取數(shù)據(jù)用的,因此當說到IO操作的時候,就會存在兩種相對應的操作,存數(shù)據(jù)時候?qū)氖菍慖O操作,取數(shù)據(jù)的時候?qū)氖鞘亲xIO操作。
單個IO操作
當控制磁盤的控制器接到操作系統(tǒng)的讀IO操作指令的時候,控制器就會給磁盤發(fā)出一個讀數(shù)據(jù)的指令,并同時將要讀取的數(shù)據(jù)塊的地址傳遞給磁盤,然后磁盤會將讀取到的數(shù)據(jù)傳給控制器,并由控制器返回給操作系統(tǒng),完成一個寫IO的操作;同樣的,一個寫IO的操作也類似,控制器接到寫的IO操作的指令和要寫入的數(shù)據(jù),并將其傳遞給磁盤,磁盤在數(shù)據(jù)寫入完成之后將操作結(jié)果傳遞回控制器,再由控制器返回給操作系統(tǒng),完成一個寫IO的操作。單個IO操作指的就是完成一個寫IO或者是讀IO的操作。
隨機訪問(Random Access)與連續(xù)訪問(Sequential Access)
隨機訪問指的是本次IO所給出的扇區(qū)地址和上次IO給出扇區(qū)地址相差比較大,這樣的話磁頭在兩次IO操作之間需要作比較大的移動動作才能重新開始讀/寫數(shù)據(jù)。相反的,如果當次IO給出的扇區(qū)地址與上次IO結(jié)束的扇區(qū)地址一致或者是接近的話,那磁頭就能很快的開始這次IO操作,這樣的多個IO操作稱為連續(xù)訪問。因此盡管相鄰的兩次IO操作在同一時刻發(fā)出,但如果它們的請求的扇區(qū)地址相差很大的話也只能稱為隨機訪問,而非連續(xù)訪問。
順序IO模式(Queue Mode)/并發(fā)IO模式(Burst Mode)
磁盤控制器可能會一次對磁盤組發(fā)出一連串的IO命令,如果磁盤組一次只能執(zhí)行一個IO命令時稱為順序IO;當磁盤組能同時執(zhí)行多個IO命令時,稱為并發(fā)IO。并發(fā)IO只能發(fā)生在由多個磁盤組成的磁盤組上,單塊磁盤只能一次處理一個IO命令。
第2頁:單個IO的大小(IO Chunk Size)
單個IO的大小(IO Chunk Size)
熟悉數(shù)據(jù)庫的人都會有這么一個概念,那就是數(shù)據(jù)庫存儲有個基本的塊大小(Block Size),不管是SQL Server還是Oracle,默認的塊大小都是8KB,就是數(shù)據(jù)庫每次讀寫都是以8k為單位的。那么對于數(shù)據(jù)庫應用發(fā)出的固定8k大小的單次讀寫到了寫磁盤這個層面會是怎么樣的呢,就是對于讀寫磁盤來說單個IO操作操作數(shù)據(jù)的大小是多少呢,是不是也是一個固定的值?
答案是不確定。首先操作系統(tǒng)為了提高 IO的性能而引入了文件系統(tǒng)緩存(File System Cache),系統(tǒng)會根據(jù)請求數(shù)據(jù)的情況將多個來自IO的請求先放在緩存里面,然后再一次性的提交給磁盤,也就是說對于數(shù)據(jù)庫發(fā)出的多個8K數(shù)據(jù)塊的讀操作有可能放在一個磁盤讀IO里就處理了。
還有對于有些存儲系統(tǒng)也是提供了緩存(Cache)的,接收到操作系統(tǒng)的IO請求之后也是會將多個操作系統(tǒng)的 IO請求合并成一個來處理。不管是操作系統(tǒng)層面的緩存還是磁盤控制器層面的緩存,目的都只有一個,提高數(shù)據(jù)讀寫的效率。因此每次單獨的IO操作大小都是不一樣的,它主要取決于系統(tǒng)對于數(shù)據(jù)讀寫效率的判斷。
當一次IO操作大小比較小的時候我們成為小的IO操作,比如說1K,4K,8K這樣的;當一次IO操作的數(shù)據(jù)量比較的的時候稱為大IO操作,比如說32K,64K甚至更大。
在我們說到塊大小(Block Size)的時候通常我們會接觸到多個類似的概念,像我們上面提到的那個在數(shù)據(jù)庫里面的數(shù)據(jù)最小的管理單位,Oralce稱之為塊(Block),大小一般為8K,SQL Server稱之為頁(Page),一般大小也為8k。
在文件系統(tǒng)里面我們也能碰到一個文件系統(tǒng)的塊,在現(xiàn)在很多的Linux系統(tǒng)中都是4K(通過 /usr/bin/time -v可以看到),它的作用其實跟數(shù)據(jù)庫里面的塊/頁是一樣的,都是為了方便數(shù)據(jù)的管理。但是說到單次IO的大小,跟這些塊的大小都是沒有直接關系的,在英文里單次IO大小通常被稱為是IO Chunk Size,不會說成是IO Block Size的。
第3頁:IOPS(IO per Second)
IOPS(IO per Second)
IOPS,IO系統(tǒng)每秒所執(zhí)行IO操作的次數(shù),是一個重要的用來衡量系統(tǒng)IO能力的一個參數(shù)。對于單個磁盤組成的IO系統(tǒng)來說,計算它的IOPS不是一件很難的事情,只要我們知道了系統(tǒng)完成一次IO所需要的時間的話我們就能推算出系統(tǒng)IOPS來。
現(xiàn)在我們就來推算一下磁盤的IOPS,假設磁盤的轉(zhuǎn)速(Rotational Speed)為15K RPM,平均尋道時間為5ms,最大傳輸速率為40MB/s(這里將讀寫速度視為一樣,實際會差別比較大)。
對于磁盤來說一個完整的IO操作是這樣進行的:當控制器對磁盤發(fā)出一個IO操作命令的時候,磁盤的驅(qū)動臂(Actuator Arm)帶讀寫磁頭(Head)離開著陸區(qū)(Landing Zone,位于內(nèi)圈沒有數(shù)據(jù)的區(qū)域),移動到要操作的初始數(shù)據(jù)塊所在的磁道(Track)的正上方,這個過程被稱為尋址(Seeking),對應消耗的時間被稱為尋址時間(Seek Time);但是找到對應磁道還不能馬上讀取數(shù)據(jù),這時候磁頭要等到磁盤盤片(Platter)旋轉(zhuǎn)到初始數(shù)據(jù)塊所在的扇區(qū)(Sector)落在讀寫磁頭正上方的之后才能開始讀取數(shù)據(jù),在這個等待盤片旋轉(zhuǎn)到可操作扇區(qū)的過程中消耗的時間稱為旋轉(zhuǎn)延時(Rotational Delay);接下來就隨著盤片的旋轉(zhuǎn),磁頭不斷的讀/寫相應的數(shù)據(jù)塊,直到完成這次IO所需要操作的全部數(shù)據(jù),這個過程稱為數(shù)據(jù)傳送(Data Transfer),對應的時間稱為傳送時間(Transfer Time)。完成這三個步驟之后一次IO操作也就完成了。
在我們看硬盤廠商的宣傳單的時候我們經(jīng)常能看到3個參數(shù),分別是平均尋址時間、盤片旋轉(zhuǎn)速度以及最大傳送速度,這三個參數(shù)就可以提供給我們計算上述三個步驟的時間。
第一個尋址時間,考慮到被讀寫的數(shù)據(jù)可能在磁盤的任意一個磁道,既有可能在磁盤的最內(nèi)圈(尋址時間最短),也可能在磁盤的最外圈(尋址時間最長),所以在計算中我們只考慮平均尋址時間,也就是磁盤參數(shù)中標明的那個平均尋址時間,這里就采用當前最多的10krmp硬盤的5ms。
第二個旋轉(zhuǎn)延時,和尋址一樣,當磁頭定位到磁道之后有可能正好在要讀寫扇區(qū)之上,這時候是不需要額外額延時就可以立刻讀寫到數(shù)據(jù),但是最壞的情況確實要磁盤旋轉(zhuǎn)整整一圈之后磁頭才能讀取到數(shù)據(jù),所以這里我們也考慮的是平均旋轉(zhuǎn)延時,對于10krpm的磁盤就是(60s/15k)*(1/2) = 2ms。
第三個傳送時間,磁盤參數(shù)提供我們的最大的傳輸速度,當然要達到這種速度是很有難度的,但是這個速度卻是磁盤純讀寫磁盤的速度,因此只要給定了單次 IO的大小,我們就知道磁盤需要花費多少時間在數(shù)據(jù)傳送上,這個時間就是IO Chunk Size / Max Transfer Rate。
第4頁:IOPS計算公式
評論