我熟練應(yīng)用ctrl c和ctrl v 開(kāi)發(fā)curd代碼好多年了。
mysql查詢?yōu)槭裁磿?huì)慢,關(guān)于這個(gè)問(wèn)題,在實(shí)際開(kāi)發(fā)經(jīng)常會(huì)遇到,而面試中,也是個(gè)高頻題。
遇到這種問(wèn)題,我們一般也會(huì)想到是因?yàn)?a target="_blank">索引。
那除開(kāi)索引之外,還有哪些因素會(huì)導(dǎo)致數(shù)據(jù)庫(kù)查詢變慢呢?
有哪些操作,可以提升mysql的查詢能力呢?
今天這篇文章,我們就來(lái)聊聊會(huì)導(dǎo)致數(shù)據(jù)庫(kù)查詢變慢的場(chǎng)景有哪些,并給出原因和解決方案。
數(shù)據(jù)庫(kù)查詢流程
我們先來(lái)看下,一條查詢語(yǔ)句下來(lái),會(huì)經(jīng)歷哪些流程。
比如我們有一張數(shù)據(jù)庫(kù)表
CREATETABLE`user`(
`id`int(10)unsignedNOTNULLAUTO_INCREMENTCOMMENT'主鍵',
`name`varchar(100)NOTNULLDEFAULT''COMMENT'名字',
`age`int(11)NOTNULLDEFAULT'0'COMMENT'年齡',
`gender`int(8)NOTNULLDEFAULT'0'COMMENT'性別',
PRIMARYKEY(`id`),
KEY`idx_age`(`age`),
KEY`idx_gender`(`gender`)
)ENGINE=InnoDBDEFAULTCHARSET=utf8;
我們平常寫的應(yīng)用代碼(go或C++之類的),這時(shí)候就叫客戶端了。
客戶端底層會(huì)帶著賬號(hào)密碼,嘗試向mysql建立一條TCP長(zhǎng)鏈接。
mysql的連接管理模塊會(huì)對(duì)這條連接進(jìn)行管理。
建立連接后,客戶端執(zhí)行一條查詢sql語(yǔ)句。比如:
select*fromuserwheregender=1andage=100;
客戶端會(huì)將sql語(yǔ)句通過(guò)網(wǎng)絡(luò)連接給mysql。
mysql收到sql語(yǔ)句后,會(huì)在分析器中先判斷下SQL語(yǔ)句有沒(méi)有語(yǔ)法錯(cuò)誤,比如select,如果少打一個(gè)l
,寫成slect
,則會(huì)報(bào)錯(cuò)You have an error in your SQL syntax;
。這個(gè)報(bào)錯(cuò)對(duì)于我這樣的手殘黨來(lái)說(shuō)可以說(shuō)是很熟悉了。
接下來(lái)是優(yōu)化器,在這里會(huì)根據(jù)一定的規(guī)則選擇該用什么索引。
之后,才是通過(guò)執(zhí)行器去調(diào)用存儲(chǔ)引擎的接口函數(shù)。
存儲(chǔ)引擎類似于一個(gè)個(gè)組件,它們才是mysql真正獲取一行行數(shù)據(jù)并返回?cái)?shù)據(jù)的地方,存儲(chǔ)引擎是可以替換更改的,既可以用不支持事務(wù)的MyISAM,也可以替換成支持事務(wù)的Innodb。這個(gè)可以在建表的時(shí)候指定。比如
CREATETABLE`user`(
...
)ENGINE=InnoDB;
現(xiàn)在最常用的是InnoDB。
我們就重點(diǎn)說(shuō)這個(gè)。
InnoDB中,因?yàn)橹苯硬僮鞔疟P會(huì)比較慢,所以加了一層內(nèi)存提提速,叫buffer pool,這里面,放了很多內(nèi)存頁(yè),每一頁(yè)16KB,有些內(nèi)存頁(yè)放的是數(shù)據(jù)庫(kù)表里看到的那種一行行的數(shù)據(jù),有些則是放的索引信息。
查詢SQL到了InnoDB中。會(huì)根據(jù)前面優(yōu)化器里計(jì)算得到的索引,去查詢相應(yīng)的索引頁(yè),如果不在buffer pool里則從磁盤里加載索引頁(yè)。再通過(guò)索引頁(yè)加速查詢,得到數(shù)據(jù)頁(yè)的具體位置。如果這些數(shù)據(jù)頁(yè)不在buffer pool中,則從磁盤里加載進(jìn)來(lái)。
這樣我們就得到了我們想要的一行行數(shù)據(jù)。
最后將得到的數(shù)據(jù)結(jié)果返回給客戶端。
慢查詢分析
如果上面的流程比較慢的話,我們可以通過(guò)開(kāi)啟profiling
看到流程慢在哪。
mysql>setprofiling=ON;
QueryOK,0rowsaffected,1warning(0.00sec)
mysql>showvariableslike'profiling';
+---------------+-------+
|Variable_name|Value|
+---------------+-------+
|profiling|ON|
+---------------+-------+
1rowinset(0.00sec)
然后正常執(zhí)行sql語(yǔ)句。
這些SQL語(yǔ)句的執(zhí)行時(shí)間都會(huì)被記錄下來(lái),此時(shí)你想查看有哪些語(yǔ)句被記錄下來(lái)了,可以執(zhí)行 show profiles;
mysql>showprofiles;
+----------+------------+---------------------------------------------------+
|Query_ID|Duration|Query|
+----------+------------+---------------------------------------------------+
|1|0.06811025|select*fromuserwhereage>=60|
|2|0.00151375|select*fromuserwheregender=2andage=80|
|3|0.00230425|select*fromuserwheregender=2andage=60|
|4|0.00070400|select*fromuserwheregender=2andage=100|
|5|0.07797650|select*fromuserwhereage!=60|
+----------+------------+---------------------------------------------------+
5rowsinset,1warning(0.00sec)
關(guān)注下上面的query_id
,比如select * from user where age>=60
對(duì)應(yīng)的query_id是1,如果你想查看這條SQL語(yǔ)句的具體耗時(shí),那么可以執(zhí)行以下的命令。
mysql>showprofileforquery1;
+----------------------+----------+
|Status|Duration|
+----------------------+----------+
|starting|0.000074|
|checkingpermissions|0.000010|
|Openingtables|0.000034|
|init|0.000032|
|Systemlock|0.000027|
|optimizing|0.000020|
|statistics|0.000058|
|preparing|0.000018|
|executing|0.000013|
|Sendingdata|0.067701|
|end|0.000021|
|queryend|0.000015|
|closingtables|0.000014|
|freeingitems|0.000047|
|cleaningup|0.000027|
+----------------------+----------+
15rowsinset,1warning(0.00sec)
通過(guò)上面的各個(gè)項(xiàng),大家就可以看到具體耗時(shí)在哪。比如從上面可以看出Sending data的耗時(shí)最大,這個(gè)是指執(zhí)行器開(kāi)始查詢數(shù)據(jù)并將數(shù)據(jù)發(fā)送給客戶端的耗時(shí),因?yàn)槲业倪@張表符合條件的數(shù)據(jù)有好幾萬(wàn)條,所以這塊耗時(shí)最大,也符合預(yù)期。
一般情況下,我們開(kāi)發(fā)過(guò)程中,耗時(shí)大部分時(shí)候都在Sending data
階段,而這一階段里如果慢的話,最容易想到的還是索引相關(guān)的原因。索引相關(guān)原因
索引相關(guān)的問(wèn)題,一般能用explain命令幫助分析。通過(guò)它能看到用了哪些索引,大概會(huì)掃描多少行之類的信息。
mysql會(huì)在優(yōu)化器階段里看下選擇哪個(gè)索引,查詢速度會(huì)更快。
一般主要考慮幾個(gè)因素,比如:
-
選擇這個(gè)索引大概要掃描多少行(rows)
-
為了把這些行取出來(lái),需要讀多少個(gè)16kb的頁(yè)
-
走普通索引需要回表,主鍵索引則不需要,回表成本大不大?
回到show profile中提到的sql語(yǔ)句,我們使用explain select * from user where age>=60
分析一下。
上面的這條語(yǔ)句,使用的type
為ALL,意味著是全表掃描,possible_keys
是指可能用得到的索引,這里可能使用到的索引是為age建的普通索引,但實(shí)際上數(shù)據(jù)庫(kù)使用的索引是在key
那一列,是NULL
。也就是說(shuō)這句sql不走索引,全表掃描。
這個(gè)是因?yàn)閿?shù)據(jù)表里,符合條件的數(shù)據(jù)行數(shù)(rows
)太多,如果使用age索引,那么需要將它們從age索引中讀出來(lái),并且age索引是普通索引,還需要回表找到對(duì)應(yīng)的主鍵才能找到對(duì)應(yīng)的數(shù)據(jù)頁(yè)。算下來(lái)還不如直接走主鍵劃算。于是最終選擇了全表掃描。
當(dāng)然上面只是舉了個(gè)例子,實(shí)際上,mysql執(zhí)行sql時(shí),不用索引或者用的索引不符合我們預(yù)期這件事經(jīng)常發(fā)生,索引失效的場(chǎng)景有很多,比如用了不等號(hào),隱式轉(zhuǎn)換等,這個(gè)相信大家背八股文的時(shí)候也背過(guò)不少了,我也不再贅述。
聊兩個(gè)生產(chǎn)中容易遇到的問(wèn)題吧。
索引不符合預(yù)期
實(shí)際開(kāi)發(fā)中有些情況比較特殊,比如有些數(shù)據(jù)庫(kù)表一開(kāi)始數(shù)據(jù)量小,索引少,執(zhí)行sql時(shí),確實(shí)使用了符合你預(yù)期的索引。但隨時(shí)時(shí)間邊長(zhǎng),開(kāi)發(fā)的人變多了,數(shù)據(jù)量也變大了,甚至還可能會(huì)加入一些其他重復(fù)多余的索引,就有可能出現(xiàn)用著用著,用到了不符合你預(yù)期的其他索引了。從而導(dǎo)致查詢突然變慢。
這種問(wèn)題,也好解決,可以通過(guò)force index
指定索引。比如
通過(guò)explain
可以看出,加了force index之后,sql就選用了idx_age這個(gè)索引了。
走了索引還是很慢
有些sql,用explain
命令看,明明是走索引的,但還是很慢。一般是兩種情況:
第一種是索引區(qū)分度太低,比如網(wǎng)頁(yè)全路徑的url鏈接,這拿來(lái)做索引,一眼看過(guò)去全都是同一個(gè)域名,如果前綴索引的長(zhǎng)度建得不夠長(zhǎng),那這走索引跟走全表掃描似的,正確姿勢(shì)是盡量讓索引的區(qū)分度更高,比如域名去掉,只拿后面URI部分去做索引。
第二種是索引中匹配到的數(shù)據(jù)太大,這時(shí)候需要關(guān)注的是explain里的rows字段了。
它是用于預(yù)估這個(gè)查詢語(yǔ)句需要查的行數(shù)的,它不一定完全準(zhǔn)確,但可以體現(xiàn)個(gè)大概量級(jí)。
當(dāng)它很大時(shí),一般常見(jiàn)的是下面幾種情況。
-
如果這個(gè)字段具有唯一的屬性,比如電話號(hào)碼等,一般是不應(yīng)該有大量重復(fù)的,那可能是你代碼邏輯出現(xiàn)了大量重復(fù)插入的操作,你需要檢查下代碼邏輯,或者需要加個(gè)唯一索引限制下。
-
如果這個(gè)字段下的數(shù)據(jù)就是會(huì)很大,是否需要全部拿?如果不需要,加個(gè)
limit
限制下。如果確實(shí)要拿全部,那也不能一次性全拿,今天你數(shù)據(jù)量小,可能一次取一兩萬(wàn)都沒(méi)啥壓力,萬(wàn)一哪天漲到了十萬(wàn)級(jí)別,那一次性取就有點(diǎn)吃不消了。你可能需要分批次取,具體操作是先用order by id
排序一下,拿到一批數(shù)據(jù)后取最大id
作為下次取數(shù)據(jù)的起始位置。
連接數(shù)過(guò)小
索引相關(guān)的原因我們聊完了,我們來(lái)聊聊,除了索引之外,還有哪些因素會(huì)限制我們的查詢速度的。
我們可以看到,mysql的server層里有個(gè)連接管理,它的作用是管理客戶端和mysql之間的長(zhǎng)連接。
正常情況下,客戶端與server層如果只有一條連接,那么在執(zhí)行sql查詢之后,只能阻塞等待結(jié)果返回,如果有大量查詢同時(shí)并發(fā)請(qǐng)求,那么后面的請(qǐng)求都需要等待前面的請(qǐng)求執(zhí)行完成后,才能開(kāi)始執(zhí)行。
因此很多時(shí)候我們的應(yīng)用程序,比如go或java這些,會(huì)打印出sql執(zhí)行了幾分鐘的日志,但實(shí)際上你把這條語(yǔ)句單獨(dú)拎出來(lái)執(zhí)行,卻又是毫秒級(jí)別的。這都是因?yàn)檫@些sql語(yǔ)句在等待前面的sql執(zhí)行完成。
怎么解決呢?
如果我們能多建幾條連接,那么請(qǐng)求就可以并發(fā)執(zhí)行,后面的連接就不用等那么久了。
而連接數(shù)過(guò)小的問(wèn)題,受數(shù)據(jù)庫(kù)和客戶端兩側(cè)同時(shí)限制。
數(shù)據(jù)庫(kù)連接數(shù)過(guò)小
Mysql的最大連接數(shù)默認(rèn)是100
, 最大可以達(dá)到16384
。
可以通過(guò)設(shè)置mysql的max_connections
參數(shù),更改數(shù)據(jù)庫(kù)的最大連接數(shù)。
mysql>setglobalmax_connections=500;
QueryOK,0rowsaffected(0.00sec)
mysql>showvariableslike'max_connections';
+-----------------+-------+
|Variable_name|Value|
+-----------------+-------+
|max_connections|500|
+-----------------+-------+
1rowinset(0.00sec)
上面的操作,就把最大連接數(shù)改成了500。
應(yīng)用側(cè)連接數(shù)過(guò)小
數(shù)據(jù)庫(kù)連接大小是調(diào)整過(guò)了,但貌似問(wèn)題還是沒(méi)有變化?還是有很多sql執(zhí)行達(dá)到了幾分鐘,甚至超時(shí)?
那有可能是因?yàn)槟銘?yīng)用側(cè)(go,java寫的應(yīng)用,也就是mysql的客戶端)的連接數(shù)也過(guò)小。
應(yīng)用側(cè)與mysql底層的連接,是基于TCP協(xié)議的長(zhǎng)鏈接,而TCP協(xié)議,需要經(jīng)過(guò)三次握手和四次揮手來(lái)實(shí)現(xiàn)建連和釋放。如果我每次執(zhí)行sql都重新建立一個(gè)新的連接的話,那就要不斷握手和揮手,這很耗時(shí)。所以一般會(huì)建立一個(gè)長(zhǎng)連接池,連接用完之后,塞到連接池里,下次要執(zhí)行sql的時(shí)候,再?gòu)睦锩鎿埔粭l連接出來(lái)用,非常環(huán)保。
我們一般寫代碼的時(shí)候,都會(huì)通過(guò)第三方的orm庫(kù)來(lái)對(duì)數(shù)據(jù)庫(kù)進(jìn)行操作,而成熟的orm庫(kù),百分之一千萬(wàn)都會(huì)有個(gè)連接池。
而這個(gè)連接池,一般會(huì)有個(gè)大小。這個(gè)大小就控制了你的連接數(shù)最大值,如果說(shuō)你的連接池太小,都還沒(méi)有數(shù)據(jù)庫(kù)的大,那調(diào)了數(shù)據(jù)庫(kù)的最大連接數(shù)也沒(méi)啥作用。
一般情況下,可以翻下你使用的orm庫(kù)的文檔,看下怎么設(shè)置這個(gè)連接池的大小,就幾行代碼的事情,改改就好。比如go語(yǔ)言里的gorm
里是這么設(shè)置的
funcInit(){
db,err:=gorm.Open(mysql.Open(conn),config)
sqlDB,err:=db.DB()
//SetMaxIdleConns設(shè)置空閑連接池中連接的最大數(shù)量
sqlDB.SetMaxIdleConns(200)
//SetMaxOpenConns設(shè)置打開(kāi)數(shù)據(jù)庫(kù)連接的最大數(shù)量
sqlDB.SetMaxOpenConns(1000)
}
buffer pool太小
連接數(shù)是上去了,速度也提升了。
曾經(jīng)遇到過(guò)面試官會(huì)追問(wèn),有沒(méi)有其他辦法可以讓速度更快呢?
那必須要眉頭緊鎖,假裝思考,然后說(shuō):有的。
我們?cè)谇懊娴臄?shù)據(jù)庫(kù)查詢流程里,提到了進(jìn)了innodb之后,會(huì)有一層內(nèi)存buffer pool,用于將磁盤數(shù)據(jù)頁(yè)加載到內(nèi)存頁(yè)中,只要查詢到buffer pool里有,就可以直接返回,否則就要走磁盤IO,那就慢了。
也就是說(shuō),如果我的buffer pool 越大,那我們能放的數(shù)據(jù)頁(yè)就越多,相應(yīng)的,sql查詢時(shí)就更可能命中buffer pool,那查詢速度自然就更快了。
可以通過(guò)下面的命令查詢到buffer pool的大小,單位是Byte
。
mysql>showglobalvariableslike'innodb_buffer_pool_size';
+-------------------------+-----------+
|Variable_name|Value|
+-------------------------+-----------+
|innodb_buffer_pool_size|134217728|
+-------------------------+-----------+
1rowinset(0.01sec)
也就是128Mb
。
如果想要調(diào)大一點(diǎn)。可以執(zhí)行
mysql>setglobalinnodb_buffer_pool_size=536870912;
QueryOK,0rowsaffected(0.01sec)
mysql>showglobalvariableslike'innodb_buffer_pool_size';
+-------------------------+-----------+
|Variable_name|Value|
+-------------------------+-----------+
|innodb_buffer_pool_size|536870912|
+-------------------------+-----------+
1rowinset(0.01sec)
這樣就把buffer pool增大到512Mb了。
但是吧,如果buffer pool大小正常,只是別的原因導(dǎo)致的查詢變慢,那改buffer pool毫無(wú)意義。
但問(wèn)題又來(lái)了。
怎么知道buffer pool是不是太小了?
這個(gè)我們可以看buffer pool的緩存命中率。
通過(guò) show status like 'Innodb_buffer_pool_%';
可以看到跟buffer pool有關(guān)的一些信息。
Innodb_buffer_pool_read_requests
表示讀請(qǐng)求的次數(shù)。
Innodb_buffer_pool_reads
表示從物理磁盤中讀取數(shù)據(jù)的請(qǐng)求次數(shù)。
所以buffer pool的命中率就可以這樣得到:
bufferpool命中率=1-(Innodb_buffer_pool_reads/Innodb_buffer_pool_read_requests)*100%
比如我上面截圖里的就是,1 - (405/2278354) = 99.98%。可以說(shuō)命中率非常高了。
一般情況下buffer pool命中率都在99%
以上,如果低于這個(gè)值,才需要考慮加大innodb buffer pool的大小。
當(dāng)然,還可以把這個(gè)命中率做到監(jiān)控里,這樣半夜sql變慢了,早上上班還能定位到原因,就很舒服。
還有哪些騷操作?
前面提到的是在存儲(chǔ)引擎層里加入了buffer pool用于緩存內(nèi)存頁(yè),這樣可以加速查詢。
那同樣的道理,server層也可以加個(gè)緩存,直接將第一次查詢的結(jié)果緩存下來(lái),這樣下次查詢就能立刻返回,聽(tīng)著挺美的。
按道理,如果命中緩存的話,確實(shí)是能為查詢加速的。但這個(gè)功能限制很大,其中最大的問(wèn)題是只要數(shù)據(jù)庫(kù)表被更新過(guò),表里面的所有緩存都會(huì)失效,數(shù)據(jù)表頻繁的更新,就會(huì)帶來(lái)頻繁的緩存失效。所以這個(gè)功能只適合用于那些不怎么更新的數(shù)據(jù)表。
另外,這個(gè)功能在8.0版本
之后,就被干掉了。所以這功能用來(lái)聊聊天可以,沒(méi)必要真的在生產(chǎn)中使用啊。
總結(jié)
-
數(shù)據(jù)查詢過(guò)慢一般是索引問(wèn)題,可能是因?yàn)檫x錯(cuò)索引,也可能是因?yàn)椴樵兊男袛?shù)太多。
-
客戶端和數(shù)據(jù)庫(kù)連接數(shù)過(guò)小,會(huì)限制sql的查詢并發(fā)數(shù),增大連接數(shù)可以提升速度。
-
innodb里會(huì)有一層內(nèi)存buffer pool用于提升查詢速度,命中率一般>99%,如果低于這個(gè)值,可以考慮增大buffer pool的大小,這樣也可以提升速度。
-
查詢緩存(query cache)確實(shí)能為查詢提速,但一般不建議打開(kāi),因?yàn)橄拗票容^大,并且8.0以后的Mysql里已經(jīng)將這個(gè)功能干掉了。
原文標(biāo)題:?Mysql 數(shù)據(jù)庫(kù)查詢好慢,除了索引,還能因?yàn)槭裁矗?/p>
文章出處:【微信公眾號(hào):數(shù)據(jù)分析與開(kāi)發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
審核編輯:湯梓紅
-
數(shù)據(jù)庫(kù)
+關(guān)注
關(guān)注
7文章
3822瀏覽量
64506 -
代碼
+關(guān)注
關(guān)注
30文章
4799瀏覽量
68728 -
MySQL
+關(guān)注
關(guān)注
1文章
817瀏覽量
26622
原文標(biāo)題:?Mysql 數(shù)據(jù)庫(kù)查詢好慢,除了索引,還能因?yàn)槭裁矗?/p>
文章出處:【微信號(hào):DBDevs,微信公眾號(hào):數(shù)據(jù)分析與開(kāi)發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論