




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、高級數(shù)據(jù)庫技術(shù)期末論文基于SQL查詢的MySQL數(shù)據(jù)庫性能優(yōu)化研究姓名:XX學(xué)號:2014XXXXX學(xué)院:計(jì)算機(jī)學(xué)院摘要:查詢是數(shù)據(jù)庫系統(tǒng)中最基本也是最常用的一種操作,是否具有較快的執(zhí)行速度,已成為數(shù)據(jù)庫用戶和設(shè)計(jì)者極其關(guān)心的問題。在研究開源數(shù)據(jù)庫管理系統(tǒng) MySQL 查詢優(yōu)化技術(shù)的基礎(chǔ)上,主要結(jié)合傳統(tǒng)SQL操作優(yōu)化、深度分析 MySQL源代碼、現(xiàn)代數(shù)據(jù)庫發(fā)展幾方面進(jìn)行諸如參數(shù)調(diào)優(yōu),MySQL關(guān)聯(lián)查詢,重寫相關(guān)規(guī)則等內(nèi)容展開優(yōu)化分析研究。關(guān)鍵詞: 查詢優(yōu)化,查詢重用,查詢重寫,計(jì)劃優(yōu)化一、傳統(tǒng)SQL查詢優(yōu)化操作1.選取最適用的字段屬性MySQL可以很好的支持大數(shù)據(jù)量的存取,但是一般說來,數(shù)據(jù)庫
2、中的表越小,在它上面執(zhí)行的查詢也就會越快。因此,在創(chuàng)建表的時(shí)候,為了獲得更好的性能,我們可以將表中字段的寬度設(shè)得盡可能小。例如,在定義郵政編碼這個(gè)字段時(shí),如果將其設(shè)置為CHAR(255),顯然給數(shù)據(jù)庫增加了不必要的空間,甚至使用VARCHAR這種類型也是多余的,因?yàn)镃HAR(6)就可以很好的完成任務(wù)了。同樣的,如果可以的話,我們應(yīng)該使用MEDIUMINT而不是BIGIN來定義整型字段。另外一個(gè)提高效率的方法是在可能的情況下,應(yīng)該盡量把字段設(shè)置為NOT NULL,這樣在將來執(zhí)行查詢的時(shí)候,數(shù)據(jù)庫不用去比較NULL值。對于某些文本字段,例如“省份”或者“性別”,我們可以將它們定義為ENUM類型。因
3、為在MySQL中,ENUM類型被當(dāng)作數(shù)值型數(shù)據(jù)來處理,而數(shù)值型數(shù)據(jù)被處理起來的速度要比文本類型快得多。這樣,我們又可以提高數(shù)據(jù)庫的性能。2.使用連接(JOIN)來代替子查詢(Sub-Queries)MySQL從4.1開始支持SQL的子查詢。這個(gè)技術(shù)可以使用SELECT語句來創(chuàng)建一個(gè)單列的查詢結(jié)果,然后把這個(gè)結(jié)果作為過濾條件用在另一個(gè)查詢中。例如,我們要將客戶基本信息表中沒有任何訂單的客戶刪除掉,就可以利用子查詢先從銷售信息表中將所有發(fā)出訂單的客戶ID取出來,然后將結(jié)果傳遞給主查詢,如下所示:DELETE FROM customerinfoWHERE CustomerID NOT in (SEL
4、ECT CustomerID FROM salesinfo )使用子查詢可以一次性的完成很多邏輯上需要多個(gè)步驟才能完成的SQL操作,同時(shí)也可以避免事務(wù)或者表鎖死,并且寫起來也很容易。但是,有些情況下,子查詢可以被更有效率的連接(JOIN). 替代。例如,假設(shè)我們要將所有沒有訂單記錄的用戶取出來,可以用下面這個(gè)查詢完成:SELECT * FROM customerinfoWHERE CustomerID NOT in (SELECT CustomerID FROM salesinfo )如果使用連接(JOIN). 來完成這個(gè)查詢工作,速度將會快很多。尤其是當(dāng)salesinfo表中對Custome
5、rID建有索引的話,性能將會更好,查詢?nèi)缦拢篠ELECT * FROM customerinfoLEFT JOIN salesinfo ON customerinfo.CustomerID=salesinfo.CustomerIDWHERE salesinfo.CustomerID IS NULL 連接(JOIN). 之所以更有效率一些,是因?yàn)?MySQL不需要在內(nèi)存中創(chuàng)建臨時(shí)表來完成這個(gè)邏輯上的需要兩個(gè)步驟的查詢工作。3.使用聯(lián)合(UNION)來代替手動創(chuàng)建的臨時(shí)表MySQL 從 4.0 的版本開始支持 UNION 查詢,它可以把需要使用臨時(shí)表的兩條或更多的 SELECT 查詢合并在一個(gè)查詢
6、中。在客戶端的查詢會話結(jié)束的時(shí)候,臨時(shí)表會被自動刪除,從而保證數(shù)據(jù)庫整齊、高效。使用 UNION 來創(chuàng)建查詢的時(shí)候,我們只需要用 UNION作為關(guān)鍵字把多個(gè) SELECT 語句連接起來就可以了,要注意的是所有 SELECT 語句中的字段數(shù)目要相同。通過以下例子演示一個(gè)使用 UNION的查詢。SELECT Name, Phone FROM clientUNIONSELECT Name, BirthDate FROM authorUNIONSELECT Name, Supplier FROM product4.事務(wù)盡管我們可以使用子查詢(Sub-Queries)、連接(JOIN)和聯(lián)合(UNION
7、)來創(chuàng)建各種各樣的查詢,但不是所有的數(shù)據(jù)庫操作都可以只用一條或少數(shù)幾條SQL語句就可以完成的。更多的時(shí)候是需要用到一系列的語句來完成某種工作。但是在這種情況下,當(dāng)這個(gè)語句塊中的某一條語句運(yùn)行出錯(cuò)的時(shí)候,整個(gè)語句塊的操作就會變得不確定起來。設(shè)想一下,要把某個(gè)數(shù)據(jù)同時(shí)插入兩個(gè)相關(guān)聯(lián)的表中,可能會出現(xiàn)這樣的情況:第一個(gè)表中成功更新后,數(shù)據(jù)庫突然出現(xiàn)意外狀況,造成第二個(gè)表中的操作沒有完成,這樣,就會造成數(shù)據(jù)的不完整,甚至?xí)茐臄?shù)據(jù)庫中的數(shù)據(jù)。要避免這種情況,就應(yīng)該使用事務(wù),它的作用是:要么語句塊中每條語句都操作成功,要么都失敗。換句話說,就是可以保持?jǐn)?shù)據(jù)庫中數(shù)據(jù)的一致性和完整性。事物以BEGIN 關(guān)鍵
8、字開始,COMMIT關(guān)鍵字結(jié)束。在這之間的一條SQL操作失敗,那么,ROLLBACK命令就可以把數(shù)據(jù)庫恢復(fù)到BEGIN開始之前的狀態(tài)。BEGIN;INSERT INTO salesinfo SET CustomerID=14;UPDATE inventory SET Quantity=11 WHERE item=book; COMMIT;事務(wù)的另一個(gè)重要作用是當(dāng)多個(gè)用戶同時(shí)使用相同的數(shù)據(jù)源時(shí),它可以利用鎖定數(shù)據(jù)庫的方法來為用戶提供一種安全的訪問方式,這樣可以保證用戶的操作不被其它的用戶所干擾。5.鎖定表盡管事務(wù)是維護(hù)數(shù)據(jù)庫完整性的一個(gè)非常好的方法,但卻因?yàn)樗莫?dú)占性,有時(shí)會影響數(shù)據(jù)庫的性能,尤
9、其是在很大的應(yīng)用系統(tǒng)中。由于在事務(wù)執(zhí)行的過程中,數(shù)據(jù)庫將會被鎖定,因此其它的用戶請求只能暫時(shí)等待直到該事務(wù)結(jié)束。如果一個(gè)數(shù)據(jù)庫系統(tǒng)只有少數(shù)幾個(gè)用戶來使用,事務(wù)造成的影響不會成為一個(gè)太大的問題;但假設(shè)有成千上萬的用戶同時(shí)訪問一個(gè)數(shù)據(jù)庫系統(tǒng),例如訪問一個(gè)電子商務(wù)網(wǎng)站,就會產(chǎn)生比較嚴(yán)重的響應(yīng)延遲。其實(shí),有些情況下我們可以通過鎖定表的方法來獲得更好的性能。下面的例子就用鎖定表的方法來完成前面一個(gè)例子中事務(wù)的功能。LOCK TABLE inventory WRITESELECT Quantity FROM inventoryWHERE Item = book;.UPDATE inventory SET
10、Quantity = 11WHERE Item=book;UNLOCK TABLES這里,我們用一個(gè) SELECT 語句取出初始數(shù)據(jù),通過一些計(jì)算,用 UPDATE 語句將新值更新到表中。包含有 WRITE 關(guān)鍵字的 LOCK TABLE 語句可以保證在 UNLOCK TABLES 命令被執(zhí)行之前,不會有其它的訪問來對 inventory 進(jìn)行插入、更新或者刪除的操作。6.使用外鍵鎖定表的方法可以維護(hù)數(shù)據(jù)的完整性,但是它卻不能保證數(shù)據(jù)的關(guān)聯(lián)性。這個(gè)時(shí)候我們就可以使用外鍵。例如,外鍵可以保證每一條銷售記錄都指向某一個(gè)存在的客戶。在這里,外鍵可以把customerinfo 表中的CustomerI
11、D映射到salesinfo表中CustomerID,任何一條沒有合法CustomerID的記錄都不會被更新或插入到salesinfo中。CREATE TABLE customerinfo (CustomerID INT NOT NULL , PRIMARY KEY ( CustomerID ) TYPE = INNODB;CREATE TABLE salesinfo (SalesID INT NOT NULL, CustomerID INT NOT NULL, PRIMARY KEY(CustomerID, SalesID), FOREIGN KEY (CustomerID) REFERENC
12、ES customerinfo (CustomerID) ON DELETECASCADE) TYPE = INNODB;注意例子中的參數(shù)“ON DELETE CASCADE”。該參數(shù)保證當(dāng) customerinfo 表中的一條客戶記錄被刪除的時(shí)候,salesinfo 表中所有與該客戶相關(guān)的記錄也會被自動刪除。如果要在 MySQL 中使用外鍵,一定要記住在創(chuàng)建表的時(shí)候?qū)⒈淼念愋投x為事務(wù)安全表 InnoDB類型。該類型不是 MySQL 表的默認(rèn)類型。定義的方法是在 CREATE TABLE 語句中加上 TYPE=INNODB。如例中所示。7.使用索引索引是提高數(shù)據(jù)庫性能的常用方法,它可以令數(shù)據(jù)
13、庫服務(wù)器以比沒有索引快得多的速度檢索特定的行,尤其是在查詢語句當(dāng)中包含有MAX(), MIN()和ORDERBY這些命令的時(shí)候,性能提高更為明顯。那該對哪些字段建立索引呢?一般說來,索引應(yīng)建立在那些將用于JOIN, WHERE判斷和ORDER BY排序的字段上。盡量不要對數(shù)據(jù)庫中某個(gè)含有大量重復(fù)的值的字段建立索引。對于一個(gè)ENUM類型的字段來說,出現(xiàn)大量重復(fù)值是很有可能的情況,例如customerinfo中的“province”. 字段,在這樣的字段上建立索引將不會有什么幫助;相反,還有可能降低數(shù)據(jù)庫的性能。我們在創(chuàng)建表的時(shí)候可以同時(shí)創(chuàng)建合適的索引,也可以使用ALTER TABLE或CREAT
14、E INDEX在以后創(chuàng)建索引。此外,MySQL從版本3.23.23開始支持全文索引和搜索。全文索引在MySQL 中是一個(gè)FULLTEXT類型索引,但僅能用于MyISAM 類型的表。對于一個(gè)大的數(shù)據(jù)庫,將數(shù)據(jù)裝載到一個(gè)沒有FULLTEXT索引的表中,然后再使用ALTER TABLE或CREATE INDEX創(chuàng)建索引,將是非??斓?。但如果將數(shù)據(jù)裝載到一個(gè)已經(jīng)有FULLTEXT索引的表中,執(zhí)行過程將會非常慢。8.優(yōu)化的查詢語句絕大多數(shù)情況下,使用索引可以提高查詢的速度,但如果SQL語句使用不恰當(dāng)?shù)脑?,索引將無法發(fā)揮它應(yīng)有的作用。下面是應(yīng)該注意的幾個(gè)方面。首先,最好是在相同類型的字段間進(jìn)行比較的操作。
15、在MySQL 3.23版之前,這甚至是一個(gè)必須的條件。例如不能將一個(gè)建有索引的INT字段和BIGINT字段進(jìn)行比較;但是作為特殊的情況,在CHAR類型的字段和VARCHAR類型字段的字段大小相同的時(shí)候,可以將它們進(jìn)行比較。其次,在建有索引的字段上盡量不要使用函數(shù)進(jìn)行操作。例如,在一個(gè)DATE類型的字段上使用YEAE()函數(shù)時(shí),將會使索引不能發(fā)揮應(yīng)有的作用。所以,下面的兩個(gè)查詢雖然返回的結(jié)果一樣,但后者要比前者快得多。SELECT * FROM order WHERE YEAR(OrderDate)2001;SELECT * FROM order WHERE OrderDate2001-01-0
16、1;同樣的情形也會發(fā)生在對數(shù)值型字段進(jìn)行計(jì)算的時(shí)候:SELECT * FROM inventory WHERE Amount/724; SELECT * FROM inventory WHERE Amount=MySQLand nameMySQM最后,應(yīng)該注意避免在查詢中讓MySQL進(jìn)行自動類型轉(zhuǎn)換,因?yàn)檗D(zhuǎn)換過程也會使索引變得不起作用。二、現(xiàn)代數(shù)據(jù)庫技術(shù)應(yīng)用查詢優(yōu)化的分析研究1.擴(kuò)寬查詢優(yōu)化的研究對象傳統(tǒng)的聯(lián)機(jī)事務(wù)處理(On-line Transaction Processing,OLTP)應(yīng)用中,大量使用基于選擇(SELECT),投影(PROJECT),連接(JOIN)三種基本操作相結(jié)合的查
17、詢,我們稱作 SPJ 查詢。因此,過去的研究重點(diǎn)大部分都集中于 SPJ 查詢的優(yōu)化上。但伴隨著在線分析處理(On-line Analytical Processing,OLAP)和決策支持系統(tǒng)(DecisionSupport System,DSS)等廣泛應(yīng)用,越來越多的非 SPJ 查詢出現(xiàn)在這些應(yīng)用之中。例如在決策支持系統(tǒng)中使用的查詢,很大一部分都是帶有 GROUP BY 子句的查詢,因此高效合理地處理帶有 GROUP BY 聚組函數(shù)的查詢具有特別的意義。而傳統(tǒng)的基于SPJ 的查詢在處理此類問題時(shí)沒有考慮到聚組等非 SPJ 查詢的特征,往往不太有效,當(dāng)和一個(gè)由非 SPJ 查詢構(gòu)成的視圖連接時(shí),
18、處理起來就更加低效?,F(xiàn)在的研究表明,可以對非 SPJ 查詢進(jìn)行轉(zhuǎn)換,將非 SPJ 操作提前或推遲處理(稱為 GROUP BY 節(jié)點(diǎn)的 PUSH DOWN, PULL UP 技術(shù)),由于非 SPJ 操作可以大幅度的減少中間結(jié)果的大小,提高運(yùn)行效率。2. 配置參數(shù)調(diào)優(yōu)MySQL 的配置參數(shù)在安裝到系統(tǒng)后使用的都是默認(rèn)值。有些默認(rèn)值不能充分利用系統(tǒng)的資源,如 join_buffer_size(執(zhí)行笛卡爾積連接操作時(shí)分配給表的緩沖區(qū)),在執(zhí)行沒有索引的大表連接應(yīng)用時(shí),該變量的默認(rèn)值 128kB 就顯得太小了。還有一些參數(shù)的默認(rèn)值設(shè)置不合理,如參數(shù) query_cache_size(存放查詢執(zhí)行結(jié)果的緩
19、沖區(qū))缺省的默認(rèn)值為 0,表示禁用查詢重用的功能,即不緩存查詢執(zhí)行結(jié)果。服務(wù)器再次接收到相同的查詢時(shí),就不能利用查詢重用的優(yōu)點(diǎn)來提高查詢的速度。因此根據(jù)實(shí)際數(shù)據(jù)庫系統(tǒng)運(yùn)行的負(fù)載情況,進(jìn)行相應(yīng)的數(shù)據(jù)庫配置參數(shù)調(diào)優(yōu),可以有效的減少磁盤 I/O 操作,對于優(yōu)化查詢執(zhí)行的速度有重大的意義。數(shù)據(jù)緩沖區(qū)數(shù)據(jù)緩沖區(qū)是 MySQL 在將數(shù)據(jù)塊(包含數(shù)據(jù)表,索引和數(shù)據(jù)字典等)寫入磁盤之前以及從磁盤塊讀取數(shù)據(jù)之后,數(shù)據(jù)塊所存儲的地方。這是 MySQL 至關(guān)重要的內(nèi)存區(qū)域之一,若將其設(shè)置的太小,會導(dǎo)致緩沖塊命中率低,磁盤 I/O 操作特別頻繁;若設(shè)置的太大,又會造成與操作系統(tǒng)本身的內(nèi)存爭用,導(dǎo)致系統(tǒng)效率低下,因此合
20、理的設(shè)置其大小非常重要。下面是幾個(gè)在數(shù)據(jù)緩沖區(qū)中影響查詢性能的參數(shù):key_buffer_size索引緩沖區(qū),它的空間為所有數(shù)據(jù)庫共享,最大值可以設(shè)置為4GB,實(shí)際值最好設(shè)置為空閑內(nèi)存的25%左右。該變量的缺省默認(rèn)值為8MB。join_buffer_size全連接緩沖區(qū)。在執(zhí)行笛卡爾積全連接操作時(shí),系統(tǒng)為每個(gè)參與連接的表分配的緩沖區(qū)大小。若應(yīng)用涉及到大量的多表連接操作,且沒有適合的索引可用,要進(jìn)行笛卡爾積操作時(shí),應(yīng)該增大該緩沖區(qū)的大小。該變量的缺省默認(rèn)值為128KB。read_buffer_size全表掃描緩沖區(qū)。若要對數(shù)據(jù)庫表進(jìn)行全表掃描操作,數(shù)據(jù)庫系統(tǒng)此時(shí)就為每張表分配該緩沖區(qū)。該參數(shù)的默認(rèn)值為60KB。sort_buffer_size排序緩沖區(qū)。系統(tǒng)為ORDER BY和GROUP BY操作分配的緩沖區(qū)大小。該參數(shù)的默認(rèn)值為256KB。日志緩沖區(qū)日志緩沖區(qū)是MySQL專門開辟的一段內(nèi)存用來存放日志文件的。當(dāng)日志寫滿了后,它會要求I/O操作將日志內(nèi)容寫回磁盤中,因此為了減少不必要的磁盤I/O操作,適當(dāng)?shù)恼{(diào)整日志緩沖區(qū)的大小是非常有意義的。下面我們介紹幾個(gè)在日志緩沖區(qū)中與查詢性能
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 業(yè)務(wù)員兼職 合同范本
- 醫(yī)院代理銷售合同范本
- 書面勞務(wù)合同范本
- 臺球廳保潔合同范本
- 供熱ppp項(xiàng)目合同范例
- 合伙塑料加工合同范例
- 南通財(cái)務(wù)靈活用工合同范例
- 合同范本字體多大
- 醫(yī)藥合同范本
- 兼職項(xiàng)目合同范本
- 2024 河北公務(wù)員考試(筆試、省直、A類、C類)4套真題及答案
- 小學(xué)生雙擁活動國防教育
- 消防風(fēng)道風(fēng)管施工方案
- 和利時(shí)DCS系統(tǒng)課件
- 2.2 生態(tài)脆弱區(qū)的綜合治理 課件 【知識精研】高二地理人教版(2019)選擇性必修2
- 餐廳服務(wù)人員話術(shù)培訓(xùn)
- 遠(yuǎn)程醫(yī)療創(chuàng)業(yè)計(jì)劃書
- 初中生心理健康教育講座課件
- 廣東省廣州市白云區(qū)2023-2024學(xué)年八年級上學(xué)期期末英語試題(答案)
- 2024-2025年第一學(xué)期小學(xué)德育工作總結(jié):點(diǎn)亮德育燈塔引領(lǐng)小學(xué)生全面成長的逐夢之旅
- 2024解析:第二章聲現(xiàn)象-基礎(chǔ)練(解析版)
評論
0/150
提交評論