色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深度解讀MySQL中的WAL策略和CheckPoint技術

數據分析與開發 ? 來源:飛天小牛肉 ? 作者:飛天小牛肉 ? 2021-09-08 12:16 ? 次閱讀

前段時間我在準備暑期實習嘛,這是當時面攜程的時候二面的一道問題,我一臉懵逼,趕緊道歉,不好意思不知道沒了解過,面試官又解釋說 redo log,我尋思著 redo log 我知道啊,WAL 是啥?

給面試官整無語了(滑稽),為我當時的無知道歉。后來回去百度了一下才知道,最近又在丁奇大佬的《MySQL 實戰 45 講》 中看到了 WAL,遂來寫篇文章總結下。

InnoDB 體系架構在說 WAL 之前,有必要簡單介紹下 InnoDB 存儲引擎的體系架構,方便我們理解下文,并且 redo log 也是 InnoDB 存儲引擎所特有的。

如下圖,InnoDB 存儲引擎由內存池和一些后臺線程組成:

44c894ce-0fe7-11ec-8fb8-12bb97331649.png

內存池

先來解釋下內存池。

首先,我們需要知道,InnoDB 存儲引擎是基于磁盤存儲的,并將其中的記錄按照頁的方式進行管理。因此可將其視為基于磁盤的數據庫系統(Disk-base Database),在這樣的系統中,眾所周知,由于 CPU 速度與磁盤速度之間的不匹配,通常會使用緩沖池技術來提高數據庫的整體性能。

所以這里的內存池也被稱為緩沖池(簡單理解為緩存就好了)。

具體來說,緩沖池其實就是一塊內存區域,在 CPU 與磁盤之間加入內存訪問,通過內存的速度來彌補磁盤速度較慢對數據庫性能的影響。

擁有了緩沖池后,“讀取頁” 操作的具體步驟就是這樣的:

首先將從磁盤讀到的頁存放在緩沖池中

下一次再讀相同的頁時,首先判斷該頁是否在緩沖池中。若在緩沖池中,稱該頁在緩沖池中被命中,直接讀取該頁。否則,讀取磁盤上的頁。

“修改頁” 操作的具體步驟就是這樣的:

首先修改在緩沖池中的頁;然后再以一定的頻率刷新到磁盤上。

所謂 ”臟頁“ 就發生在修改這個操作中,如果緩沖池中的頁已經被修改了,但是還沒有刷新到磁盤上,那么我們就稱緩沖池中的這頁是 ”臟頁“,即緩沖池中的頁的版本要比磁盤的新。

至此,綜上所述,我們可以得出這樣的結論:緩沖池的大小直接影響著數據庫的整體性能。

后臺線程

后臺線程其實最大的作用就是用來完成 “將從磁盤讀到的頁存放在緩沖池中” 以及 “將緩沖池中的數據以一定的頻率刷新到磁盤上” 這倆個操作的,當然了,還有其他的作用。以下是《MySQL 技術內幕:InnoDB 存儲引擎 - 第 2 版》對于后臺線程的描述:

后臺線程的主要作用就是刷新內存池中的數據,保證內存池中緩存的是最近的數據;此外將已修改的數據文件刷新到磁盤文件,同時保證在數據庫發生異常的情況下 InnoDB 能恢復到正常運行狀態。

另外,InnoDB 存儲引擎是多線程的模型,也就是說它擁有多個不同的后臺線程,負責處理不同的任務。這里簡單列舉下幾種不同的后臺線程:

Master Thread:主要負責將緩沖池中的數據異步刷新到磁盤,保證數據的一致性

IO Thread:在 InnoDB 存儲引擎中大量使用了 AIO(Async IO)來處理寫 IO 請求,這樣可以極大提高數據庫的性能。IO Thread 的工作主要是負責這些 IO 請求的回調(call back)處理

Purge Thread:回收已經使用并分配的 undo 頁

Page Cleaner Thread:將之前版本中臟頁的刷新操作都放入到單獨的線程中來完成。其目的是為了減輕原 Master Thread 的工作及對于用戶查詢線程的阻塞,進一步提高 InnoDB 存儲引擎的性能

redo log 與 WAL 策略上文我們提到,當緩沖池中的某頁數據被修改后,該頁就被標記為 ”臟頁“,臟頁的數據會被定期刷新到磁盤上。

倘若每次一個頁發生變化,就將新頁的版本刷新到磁盤,那么這個開銷是非常大的。并且,如果熱點數據都集中在某幾個頁中,那么數據庫的性能將變得非常差。另外,如果在從緩沖池將頁的新版本刷新到磁盤時發生了宕機,那么這個數據就不能恢復了。

所以,為了避免發生數據丟失的問題,當前事務數據庫系統(并非 MySQL 所獨有)普遍都采用了 WAL(Write Ahead Log,預寫日志)策略:即當事務提交時,先寫重做日志(redo log),再修改頁(先修改緩沖池,再刷新到磁盤);當由于發生宕機而導致數據丟失時,通過 redo log 來完成數據的恢復。這也是事務 ACID 中 D(Durability 持久性)的要求。

有了 redo log,InnoDB 就可以保證即使數據庫發生異常重啟,之前提交的記錄都不會丟失,這個能力稱為 crash-safe。

舉個簡單的例子,假設你非常熱心且 rich 的,借出去了很多錢,但是你非常 old school,不會使用電子設備并且記性不太好,所以你用一個小本本記下了所有欠你錢的人的名字和具體金額。這樣,別人還你錢的時候,你就翻出你的小本本,一頁頁地找到他的名字然后把這次還的錢扣除掉。

但是呢,其實你平常是非常忙碌的,沒辦法隨時隨地翻小本本做記錄,因此你就想出了一個主意:每當有人還你錢的時候,你就在一張白紙上記下來,然后挑個時間對照小本本把白紙上的賬目都給清了。

這就是 WAL。白紙就是 redo log,小本本就是磁盤。

當然了,redo log 可不是白紙這么簡單,一張用完了換一張就行了,這里有必要詳細解釋下。

每個 InnoDB 存儲引擎至少有 1 個重做日志文件組( redo log group),每個文件組下至少有 2 個重做日志文件(redo log file),默認的話是一個 redo log group,其中包含 2 個 redo log file:ib_logfile0 和 ib_logfile1 。

一般來說,為了得到更高的可靠性,用戶可以設置多個鏡像日志組(mirrored log groups),將不同的文件組放在不同的磁盤上,以此提高 redo log 的高可用性。在日志組中每個 redo log file 的大小一致,并以循環寫入的方式運行。

所謂循環寫入,也就是為啥我們說 redo log 不像白紙那樣用完一張換一張就行,舉個例子,如下圖,一個 redo log group,包含 3 個 redo log file:

InnoDB 存儲引擎會先寫 redo log file 0,當 file 0 被寫滿的時候,會切換至 redo log file 1,當 file 1 也被寫滿時,會切換到 redo log file 2 中,而當 file 2 也被寫滿時,會再切換到 file 0 中。

可以看出,redo log file 的大小設置對于 InnoDB 存儲引擎的性能有著非常大的影響:

redo log file 不能設置得太大,如果設置得很大,在恢復時可能需要很長的時間

redo log file 又不能設置得太小了,否則可能導致一個事務的日志需要多次切換重做日志文件

CheckPoint 技術有了 redo log 就可以高枕無憂了嗎?顯然不是這么簡單,我們仍然面臨這樣 3 個問題:

1)緩沖池不是無限大的,也就是說不能沒完沒了的存儲我們的數據等待一起刷新到磁盤

2)redo log 是循環使用而不是無限大的(也許可以,但是成本太高,同時不便于運維),那么當所有的 redo log file 都寫滿了怎么辦?

3)當數據庫運行了幾個月甚至幾年時,這時如果發生宕機,重新應用 redo log 的時間會非常久,此時恢復的代價將會非常大。

因此 Checkpoint 技術的目的就是解決上述問題:

緩沖池不夠用時,將臟頁刷新到磁盤

redo log 不可用時,將臟頁刷新到磁盤

縮短數據庫的恢復時間

所謂 CheckPoint 技術簡單來說其實就是在 redo log file 中找到一個位置,將這個位置前的頁都刷新到磁盤中去,這個位置就稱為 CheckPoint(檢查點)。

針對上面這三點我們依次來解釋下:

1)縮短數據庫的恢復時間:當數據庫發生宕機時,數據庫不需要重做所有的日志,因為 Checkpoint 之前的頁都已經刷新回磁盤。故數據庫只需對 Checkpoint 后的 redo log 進行恢復就行了。這顯然大大縮短了恢復的時間。

2)緩沖池不夠用時,將臟頁刷新到磁盤:所謂緩沖池不夠用的意思就是緩沖池的空間無法存放新讀取到的頁,這個時候 InnoDB 引擎會怎么辦呢?LRU 算法。InnoDB 存儲引擎對傳統的 LRU 算法做了一些優化,用其來管理緩沖池這塊空間。

總的思路還是傳統 LRU 那套,具體的優化細節這里就不再贅述了:即最頻繁使用的頁在 LRU 列表(LRU List)的前端,最少使用的頁在 LRU 列表的尾端;當緩沖池的空間無法存放新讀取到的頁時,將首先釋放 LRU 列表中尾端的頁。這個被釋放出來(溢出)的頁,如果是臟頁,那么就需要強制執行 CheckPoint,將臟頁刷新到磁盤中去。

3)redo log 不可用時,將臟頁刷新到磁盤:

所謂 redo log 不可用就是所有的 redo log file 都寫滿了。但事實上,其實 redo log 中的數據并不是時時刻刻都是有用的,那些已經不再需要的部分就稱為 ”可以被重用的部分“,即當數據庫發生宕機時,數據庫恢復操作不需要這部分的 redo log,因此這部分就可以被覆蓋重用(或者說被擦除)。

舉個例子來具體解釋下:一組 4 個文件,每個文件的大小是 1GB,那么總共就有 4GB 的 redo log file 空間。write pos 是當前 redo log 記錄的位置,隨著不斷地寫入磁盤,write pos 也不斷地往后移,就像我們上文說的,寫到 file 3 末尾后就回到 file 0 開頭。CheckPoint 是當前要擦除的位置(將 Checkpoint 之前的頁刷新回磁盤),也是往后推移并且循環的:

write pos 和 CheckPoint 之間的就是 redo log file 上還空著的部分,可以用來記錄新的操作。如果 write pos 追上 CheckPoint,就表示 redo log file 滿了,這時候不能再執行新的更新,得停下來先覆蓋(擦掉)一些 redo log,把 CheckPoint 推進一下。

綜上所述,Checkpoint 所做的事情無外乎是將緩沖池中的臟頁刷新到磁盤。不同之處在于每次刷新多少頁到磁盤,每次從哪里取臟頁,以及什么時間觸發 Checkpoint。在 InnoDB 存儲引擎內部,有兩種 Checkpoint,分別為:

Sharp Checkpoint:發生在數據庫關閉時將所有的臟頁都刷新回磁盤,這是默認的工作方式,參數 innodb_fast_shutdown=1

Fuzzy Checkpoin:InnoDB 存儲引擎內部使用這種模式,只刷新一部分臟頁,而不是刷新所有的臟頁回磁盤。關于 Fuzzy CheckPoint 具體的情況這里就不再贅述了。

有了 bin log 為什么還需要 redo log?前文我們講過,MySQL 架構可以分成倆層,一層是 Server 層,它主要做的是 MySQL 功能層面的事情;另一層就是存儲引擎,負責存儲與提取相關的具體事宜。

redo log 是 InnoDB 引擎特有的日志,而 Server 層也有自己的日志,包括錯誤日志(error log)、二進制日志(binlog)、慢查詢日志(slow query log)、查詢日志(log)。

其他三個日志顧明思意都挺好理解的,需要解釋的就是 binlog(二進制日志,binary log),它記錄了對 MySQL 數據庫執行更改的所有操作,但是不包括 SELECT 和 SHOW 這類操作,因為這類操作對數據本身并沒有修改。也就是說,binlog 是邏輯日志,記錄的是這個語句的原始邏輯,比如 “給 ID=1 這一行的 a 字段加 1”。

可以看出來,binlog 日志只能用于歸檔,因此 binlog 也被稱為歸檔日志,顯然如果 MySQL 只依靠 binlog 等這四種日志是沒有 crash-safe 能力的,所以為了彌補這種先天的不足,得益于 MySQL 可插拔的存儲引擎架構,InnoDB 開發了另外一套日志系統 — 也就是 redo log 來實現 crash-safe 能力。

這就是為什么有了 bin log 為什么還需要 redo log 的答案。

回顧下 redo log 存儲的東西,可以發現 redo log 是物理日志,記錄的是 “在某個數據頁上做了什么修改”。

另外,還有一點不同的是:binlog 是追加寫入的,就是說 binlog 文件寫到一定大小后會切換到下一個,并不會覆蓋以前的日志;而 redo log 是循環寫入的。

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 緩沖器
    +關注

    關注

    6

    文章

    1922

    瀏覽量

    45512
  • 存儲
    +關注

    關注

    13

    文章

    4320

    瀏覽量

    85902
  • 磁盤
    +關注

    關注

    1

    文章

    379

    瀏覽量

    25211
  • AIO
    AIO
    +關注

    關注

    1

    文章

    61

    瀏覽量

    9990

原文標題:攜程二面:講講 MySQL 中的 WAL 策略和 CheckPoint 技術

文章出處:【微信號:DBDevs,微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    MySQL還能跟上PostgreSQL的步伐嗎

    Percona 的老板 Peter Zaitsev最近發表一篇博客,討論了MySQL是否還能跟上PostgreSQL的腳步。Percona 作為MySQL 生態扛旗者,Percona 開發了知名
    的頭像 發表于 11-18 10:16 ?223次閱讀
    <b class='flag-5'>MySQL</b>還能跟上PostgreSQL的步伐嗎

    4G模組加解密藝術:通用函數的深度解讀

    今天是對加解密通用函數的深度解讀,我將詳細講解,建議收藏,不可錯過。
    的頭像 發表于 11-12 09:58 ?258次閱讀
    4G模組加解密藝術:通用函數的<b class='flag-5'>深度</b><b class='flag-5'>解讀</b>

    MySQL編碼機制原理

    MyQL 編解碼機制介紹 問題解答 讀者問題簡介 為敘述方便,以下的「我」指代讀者 我們知道在 Java 是通過 ?JDBC 來訪問數據庫的,以訪問 MySQL 為例,需要配置以下 url 才能訪問
    的頭像 發表于 11-09 11:01 ?251次閱讀

    MySQL知識點匯總

    大家好,這部分被稱為DQL部分,是每個學習MySQL必須要學會的部分,下面就讓我來介紹MySQL的其他部分。
    的頭像 發表于 08-05 15:27 ?408次閱讀
    <b class='flag-5'>MySQL</b>知識點匯總

    深度解讀 VCXO VG7050CDN:可變晶體振蕩器的卓越之選

    深度解讀 VCXO VG7050CDN:可變晶體振蕩器的卓越之選
    的頭像 發表于 07-24 10:58 ?367次閱讀

    解讀MIPI A-PHY與車載Serdes芯片技術與測試

    上一期,《汽車芯片標準體系建設指南》技術解讀與功率芯片測量概覽,我們給大家介紹了工信部印發的《汽車芯片標準體系建設指南》涉及到的重點芯片與測試領域解讀,本期繼續給大家做延展,我們
    的頭像 發表于 07-24 10:14 ?2902次閱讀
    <b class='flag-5'>解讀</b>MIPI A-PHY與車載Serdes芯片<b class='flag-5'>技術</b>與測試

    華納云:如何修改MySQL的默認端口

    MySQL是世界上最流行的開源關系型數據庫管理系統之一。在某些情況下,由于安全性、網絡策略或端口沖突的原因,數據庫管理員可能需要更改MySQL服務的默認監聽端口。本文將指導您如何在不同的操作系統上
    的頭像 發表于 07-22 14:56 ?322次閱讀
    華納云:如何修改<b class='flag-5'>MySQL</b>的默認端口

    深度神經網絡(DNN)架構解析與優化策略

    深度神經網絡(Deep Neural Network, DNN)作為機器學習領域中的一種重要技術,以其強大的特征學習能力和非線性建模能力,在多個領域取得了顯著成果。DNN的核心在于其多層結構,通過
    的頭像 發表于 07-09 11:00 ?1918次閱讀

    深度學習在自動駕駛的關鍵技術

    隨著人工智能技術的飛速發展,自動駕駛技術作為其中的重要分支,正逐漸走向成熟。在自動駕駛系統深度學習技術發揮著至關重要的作用。它通過模擬人
    的頭像 發表于 07-01 11:40 ?781次閱讀

    MySQL的整體邏輯架構

    支持多種存儲引擎是眾所周知的MySQL特性,也是MySQL架構的關鍵優勢之一。如果能夠理解MySQL Server與存儲引擎之間是怎樣通過API交互的,將大大有利于理解MySQL的核心
    的頭像 發表于 04-30 11:14 ?460次閱讀
    <b class='flag-5'>MySQL</b>的整體邏輯架構

    深度解讀廣汽全固態電池技術

    4月12日,在“科技視界”廣汽科技日活動上,廣汽集團發布了被稱為“全球動力電池領域競爭的技術高地”的全固態動力電池技術,廣汽埃安電池研發部負責人李進對此項技術進行了解讀
    的頭像 發表于 04-15 09:15 ?552次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>解讀</b>廣汽全固態電池<b class='flag-5'>技術</b>

    EMC技術:基礎概念到應用的解讀?|深圳比創達電子.

    EMC技術:基礎概念到應用的解讀?|深圳比創達電子電磁兼容性(Electromagnetic Compatibility,簡稱EMC)作為一項重要的技術領域,在現代電子設備扮演著至關
    發表于 03-11 11:59

    EMC技術:基礎概念到應用的解讀

    EMC技術:基礎概念到應用的解讀?|深圳比創達電子
    的頭像 發表于 03-11 11:55 ?595次閱讀
    EMC<b class='flag-5'>技術</b>:基礎概念到應用的<b class='flag-5'>解讀</b>?

    labview 創建mysql 表時 設置時間 怎么在mysql是格式是date 而不是datetime?

    選擇 時間日期 但是在mysql是date而不是datetime類型 ,除了sql語句創建表 ,怎么能實現創建表數據為datetime類型
    發表于 02-04 09:46

    MySQL密碼忘記了怎么辦?MySQL密碼快速重置方法步驟命令示例!

    MySQL密碼忘記了怎么辦?MySQL密碼快速重置方法步驟命令示例! MySQL是一種常用的關系型數據庫管理系統,如果你忘記了MySQL的密碼,不必擔心,可以通過一些簡單的步驟來快速重
    的頭像 發表于 01-12 16:06 ?765次閱讀
    主站蜘蛛池模板: 国产精品亚洲国产三区| 国产精品久久久久久亚洲毛片| 小莹的性荡生活45章| 神马电影院午 夜理论| 天天啪免费视频在线看| 无人在线观看免费高清视频播放| 婷婷六月激情综合一区| 亚洲欧美综合视频| 伊人影院综合| 3D动漫网站HOXXXxes| 2022国产精品不卡a| 高干紧射H后入| 国产午夜精品不卡观看| 狠狠啪 日日啪| 看看妇女的B免费看| 欧美男同gay粗大又长| 亚洲一区免费香蕉在线| 中文字幕欧美一区| chinese东北老年tv视频| 处初女处夜情视频在线播放| 国产精品97久久AV麻豆| 国产真实夫妇交换视频| 久久性色AV亚洲电影无码| 秘密教学93话恩爱久等了免费| 欧美性色xo影院69| 午夜特级毛片| 一本之道高清在线观看免费| 4480yy午夜私人影院| 国产精品igao视频网网址| 麻豆免费高清完整版| 色悠久久久久综合欧美99| 亚洲精品无码久久久久A片| 最近中文字幕在线中文视频| 成人国产AV精品久久久久| 国产亚洲精品线观看不卡| 欧美高清vivoesosexo10| 无码欧美喷潮福利XXXX| 99国产热视频在线观看| 国产乱对白精彩在线播放| 欧美伊人久久大香线蕉综合69| 妖精视频免费看|