1、mysql記錄存儲:mysql的數(shù)據(jù)是怎么組織的
創(chuàng)新互聯(lián)公司是一家專業(yè)提供恩施土家企業(yè)網(wǎng)站建設,專注與成都做網(wǎng)站、網(wǎng)站建設、外貿(mào)營銷網(wǎng)站建設、html5、小程序制作等業(yè)務。10年已為恩施土家眾多企業(yè)、政府機構(gòu)等服務。創(chuàng)新互聯(lián)專業(yè)網(wǎng)站建設公司優(yōu)惠進行中。
2、頁內(nèi)記錄的維護(順序保證/插入策略/頁內(nèi)查詢)
3、MySQL內(nèi)存管理(頁面管理、頁面淘汰、LRU):全表掃描對內(nèi)存有什么影響? 如何避免熱數(shù)據(jù)被淘汰? 沒有空閑頁怎么辦?
4、InnoDB 加鎖的過程是如何實現(xiàn)的?常見鎖問題有那些?
5、MVCC是什么?如何實現(xiàn)多版本控制?如何解決寫沖突?
6、回滾日志Undo log如何實現(xiàn)多版本控制與保證事務的原子性?
7、undo log如何清理,為何InnoDB select count(*)? 這么慢?
8、重做日志Redo log如何實現(xiàn)事務持久性?
9、InnoDB行級鎖、間隙鎖、表級鎖如何實現(xiàn)的?
10、InnoDB加鎖過程如何實現(xiàn)的?
11、海量數(shù)據(jù)下 主鍵如何設計?
12、聚集索引、二級索引與聯(lián)合索引具備哪些特點?
13、在進行索引優(yōu)化時應該注意哪些問題/
14、MySQL如何進行庫表的優(yōu)雅設計?
15、如何實現(xiàn)數(shù)據(jù)備份之延時庫部署
16、MySQL如何高效實現(xiàn)數(shù)據(jù)冗余部署
17、MySQL高可用方案有哪些
篇幅所限本文只寫了MySQL25題,像其他的Redis,SSM框架,算法,計網(wǎng)等技術(shù)棧的面試題后面會持續(xù)更新,個人整理的1000余道面試八股文會放在文末給大家白嫖,最近有面試需要刷題的同學可以直接翻到文末領(lǐng)取。
如果表使用自增主鍵,那么每次插入新的記錄,記錄就會順序添加到當前索引節(jié)點的后續(xù)位置,當一頁寫滿,就會自動開辟一個新的頁。如果使用非自增主鍵(如果身份證號或?qū)W號等),由于每次插入主鍵的值近似于隨機,因此每次新紀錄都要被插到現(xiàn)有索引頁得中間某個位置, 頻繁的移動、分頁操作造成了大量的碎片,得到了不夠緊湊的索引結(jié)構(gòu),后續(xù)不得不通過OPTIMIZE TABLE(optimize table)來重建表并優(yōu)化填充頁面。
Server層按順序執(zhí)行sql的步驟為:
簡單概括:
可以分為服務層和存儲引擎層兩部分,其中:
服務層包括連接器、查詢緩存、分析器、優(yōu)化器、執(zhí)行器等 ,涵蓋MySQL的大多數(shù)核心服務功能,以及所有的內(nèi)置函數(shù)(如日期、時間、數(shù)學和加密函數(shù)等),所有跨存儲引擎的功能都在這一層實現(xiàn),比如存儲過程、觸發(fā)器、視圖等。
存儲引擎層負責數(shù)據(jù)的存儲和提取 。其架構(gòu)模式是插件式的,支持InnoDB、MyISAM、Memory等多個存儲引擎?,F(xiàn)在最常用的存儲引擎是InnoDB,它從MySQL 5.5.5版本開始成為了默認的存儲引擎。
Drop、Delete、Truncate都表示刪除,但是三者有一些差別:
Delete 用來刪除表的全部或者一部分數(shù)據(jù)行,執(zhí)行Delete之后,用戶需要提交(commmit)或者回滾(rollback)來執(zhí)行刪除或者撤銷刪除,會觸發(fā)這個表上所有的delete觸發(fā)器。
Truncate 刪除表中的所有數(shù)據(jù),這個操作不能回滾,也不會觸發(fā)這個表上的觸發(fā)器,TRUNCATE比Delete更快,占用的空間更小。
Drop 命令從數(shù)據(jù)庫中刪除表,所有的數(shù)據(jù)行,索引和權(quán)限也會被刪除,所有的DML觸發(fā)器也不會被觸發(fā),這個命令也不能回滾。
因此,在不再需要一張表的時候,用Drop;在想刪除部分數(shù)據(jù)行時候,用Delete;在保留表而刪除所有數(shù)據(jù)的時候用Truncate。
隔離級別臟讀不可重復讀幻影讀 READ-UNCOMMITTED 未提交讀 READ-COMMITTED 提交讀 REPEATABLE-READ 重復讀 SERIALIZABLE 可串行化讀
MySQL InnoDB 存儲引擎的默認支持的隔離級別是 REPEATABLE-READ (可重讀)
這里需要注意的是 :與 SQL 標準不同的地方在于InnoDB 存儲引擎在 REPEATABLE-READ(可重讀)事務隔離級別 下使用的是 Next-Key Lock 鎖 算法,因此可以避免幻讀的產(chǎn)生,這與其他數(shù)據(jù)庫系統(tǒng)(如 SQL Server)是不同的。所以 說InnoDB 存儲引擎的默認支持的隔離級別是 REPEATABLE-READ(可重讀) 已經(jīng)可以完全保證事務的隔離性要 求,即達到了 SQL標準的SERIALIZABLE(可串行化)隔離級別。
因為隔離級別越低,事務請求的鎖越少,所以大部分數(shù)據(jù)庫系統(tǒng)的隔離級別都是READ-COMMITTED(讀取提交內(nèi) 容):,但是你要知道的是InnoDB 存儲引擎默認使用 REPEATABLE-READ(可重讀)并不會有任何性能損失 。
InnoDB 存儲引擎在分布式事務 的情況下一般會用到SERIALIZABLE(可串行化)隔離級別。
主要原因:B+樹只要遍歷葉子節(jié)點就可以實現(xiàn)整棵樹的遍歷,而且在數(shù)據(jù)庫中基于范圍的查詢是非常頻繁的,而B樹只能中序遍歷所有節(jié)點,效率太低。
文件與數(shù)據(jù)庫都是需要較大的存儲,也就是說,它們都不可能全部存儲在內(nèi)存中,故需要存儲到磁盤上。而所謂索引,則為了數(shù)據(jù)的快速定位與查找,那么索引的結(jié)構(gòu)組織要盡量減少查找過程中磁盤I/O的存取次數(shù),因此B+樹相比B樹更為合適。數(shù)據(jù)庫系統(tǒng)巧妙利用了局部性原理與磁盤預讀原理,將一個節(jié)點的大小設為等于一個頁,這樣每個節(jié)點只需要一次I/O就可以完全載入,而紅黑樹這種結(jié)構(gòu),高度明顯要深的多,并且由于邏輯上很近的節(jié)點(父子)物理上可能很遠,無法利用局部性。
最重要的是,B+樹還有一個最大的好處:方便掃庫。
B樹必須用中序遍歷的方法按序掃庫,而B+樹直接從葉子結(jié)點挨個掃一遍就完了,B+樹支持range-query非常方便,而B樹不支持,這是數(shù)據(jù)庫選用B+樹的最主要原因。
B+樹查找效率更加穩(wěn)定,B樹有可能在中間節(jié)點找到數(shù)據(jù),穩(wěn)定性不夠。
B+tree的磁盤讀寫代價更低:B+tree的內(nèi)部結(jié)點并沒有指向關(guān)鍵字具體信息的指針(紅色部分),因此其內(nèi)部結(jié)點相對B 樹更小。如果把所有同一內(nèi)部結(jié)點的關(guān)鍵字存放在同一塊盤中,那么盤塊所能容納的關(guān)鍵字數(shù)量也越多。一次性讀入內(nèi)存中的需要查找的關(guān)鍵字也就越多,相對來說IO讀寫次數(shù)也就降低了;
B+tree的查詢效率更加穩(wěn)定:由于內(nèi)部結(jié)點并不是最終指向文件內(nèi)容的結(jié)點,而只是葉子結(jié)點中關(guān)鍵字的索引,所以,任何關(guān)鍵字的查找必須走一條從根結(jié)點到葉子結(jié)點的路。所有關(guān)鍵字查詢的路徑長度相同,導致每一個數(shù)據(jù)的查詢效率相當;
視圖是一種虛擬的表,通常是有一個表或者多個表的行或列的子集,具有和物理表相同的功能 游標是對查詢出來的結(jié)果集作為一個單元來有效的處理。一般不使用游標,但是需要逐條處理數(shù)據(jù)的時候,游標顯得十分重要。
而在 MySQL 中,恢復機制是通過回滾日志(undo log)實現(xiàn)的,所有事務進行的修改都會先記錄到這個回滾日志中,然后在對數(shù)據(jù)庫中的對應行進行寫入。當事務已經(jīng)被提交之后,就無法再次回滾了。
回滾日志作用:1)能夠在發(fā)生錯誤或者用戶執(zhí)行 ROLLBACK 時提供回滾相關(guān)的信息 2) 在整個系統(tǒng)發(fā)生崩潰、數(shù)據(jù)庫進程直接被殺死后,當用戶再次啟動數(shù)據(jù)庫進程時,還能夠立刻通過查詢回滾日志將之前未完成的事務進行回滾,這也就需要回滾日志必須先于數(shù)據(jù)持久化到磁盤上,是我們需要先寫日志后寫數(shù)據(jù)庫的主要原因。
InnoDB
MyISAM
總結(jié)
數(shù)據(jù)庫并發(fā)會帶來臟讀、幻讀、丟棄更改、不可重復讀這四個常見問題,其中:
臟讀 :在第一個修改事務和讀取事務進行的時候,讀取事務讀到的數(shù)據(jù)為100,這是修改之后的數(shù)據(jù),但是之后該事務滿足一致性等特性而做了回滾操作,那么讀取事務得到的結(jié)果就是臟數(shù)據(jù)了。
幻讀 :一般是T1在某個范圍內(nèi)進行修改操作(增加或者刪除),而T2讀取該范圍導致讀到的數(shù)據(jù)是修改之間的了,強調(diào)范圍。
丟棄修改 :兩個寫事務T1 T2同時對A=0進行遞增操作,結(jié)果T2覆蓋T1,導致最終結(jié)果是1 而不是2,事務被覆蓋
不可重復讀 :T2 讀取一個數(shù)據(jù),然后T1 對該數(shù)據(jù)做了修改。如果 T2 再次讀取這個數(shù)據(jù),此時讀取的結(jié)果和第一次讀取的結(jié)果不同。
第一個事務首先讀取var變量為50,接著準備更新為100的時,并未提交,第二個事務已經(jīng)讀取var為100,此時第一個事務做了回滾。最終第二個事務讀取的var和數(shù)據(jù)庫的var不一樣。
T1 讀取某個范圍的數(shù)據(jù),T2 在這個范圍內(nèi)插入新的數(shù)據(jù),T1 再次讀取這個范圍的數(shù)據(jù),此時讀取的結(jié)果和和第一次讀取的結(jié)果不同。
T1 和 T2 兩個事務都對一個數(shù)據(jù)進行修改,T1 先修改,T2 隨后修改,T2 的修改覆蓋了 T1 的修改。例如:事務1讀取某表中的數(shù)據(jù)A=50,事務2也讀取A=50,事務1修改A=A+50,事務2也修改A=A+50,最終結(jié)果A=100,事務1的修改被丟失。
T2 讀取一個數(shù)據(jù),T1 對該數(shù)據(jù)做了修改。如果 T2 再次讀取這個數(shù)據(jù),此時讀取的結(jié)果和第一次讀取的結(jié)果不同。
悲觀鎖,先獲取鎖,再進行業(yè)務操作,一般就是利用類似 SELECT … FOR UPDATE 這樣的語句,對數(shù)據(jù)加鎖,避免其他事務意外修改數(shù)據(jù)。當數(shù)據(jù)庫執(zhí)行SELECT … FOR UPDATE時會獲取被select中的數(shù)據(jù)行的行鎖,select for update獲取的行鎖會在當前事務結(jié)束時自動釋放,因此必須在事務中使用。
樂觀鎖,先進行業(yè)務操作,只在最后實際更新數(shù)據(jù)時進行檢查數(shù)據(jù)是否被更新過。Java 并發(fā)包中的 AtomicFieldUpdater 類似,也是利用 CAS 機制,并不會對數(shù)據(jù)加鎖,而是通過對比數(shù)據(jù)的時間戳或者版本號,來實現(xiàn)樂觀鎖需要的版本判斷。
分庫與分表的目的在于,減小數(shù)據(jù)庫的單庫單表負擔,提高查詢性能,縮短查詢時間。
通過分表 ,可以減少數(shù)據(jù)庫的單表負擔,將壓力分散到不同的表上,同時因為不同的表上的數(shù)據(jù)量少了,起到提高查詢性能,縮短查詢時間的作用,此外,可以很大的緩解表鎖的問題。分表策略可以歸納為垂直拆分和水平拆分:
水平分表 :取模分表就屬于隨機分表,而時間維度分表則屬于連續(xù)分表。如何設計好垂直拆分,我的建議:將不常用的字段單獨拆分到另外一張擴展表. 將大文本的字段單獨拆分到另外一張擴展表, 將不經(jīng)常修改的字段放在同一張表中,將經(jīng)常改變的字段放在另一張表中。對于海量用戶場景,可以考慮取模分表,數(shù)據(jù)相對比較均勻,不容易出現(xiàn)熱點和并發(fā)訪問的瓶頸。
庫內(nèi)分表 ,僅僅是解決了單表數(shù)據(jù)過大的問題,但并沒有把單表的數(shù)據(jù)分散到不同的物理機上,因此并不能減輕 MySQL 服務器的壓力,仍然存在同一個物理機上的資源競爭和瓶頸,包括 CPU、內(nèi)存、磁盤 IO、網(wǎng)絡帶寬等。
分庫與分表帶來的分布式困境與應對之策 數(shù)據(jù)遷移與擴容問題----一般做法是通過程序先讀出數(shù)據(jù),然后按照指定的分表策略再將數(shù)據(jù)寫入到各個分表中。分頁與排序問題----需要在不同的分表中將數(shù)據(jù)進行排序并返回,并將不同分表返回的結(jié)果集進行匯總和再次排序,最后再返回給用戶。
不可重復讀的重點是修改,幻讀的重點在于新增或者刪除。
視圖是虛擬的表,與包含數(shù)據(jù)的表不一樣,視圖只包含使用時動態(tài)檢索數(shù)據(jù)的查詢;不包含任何列或數(shù)據(jù)。使用視圖可以簡化復雜的 sql 操作,隱藏具體的細節(jié),保護數(shù)據(jù);視圖創(chuàng)建后,可以使用與表相同的方式利用它們。
視圖不能被索引,也不能有關(guān)聯(lián)的觸發(fā)器或默認值,如果視圖本身內(nèi)有order by 則對視圖再次order by將被覆蓋。
創(chuàng)建視圖:create view xxx as xxxx
對于某些視圖比如未使用聯(lián)結(jié)子查詢分組聚集函數(shù)Distinct Union等,是可以對其更新的,對視圖的更新將對基表進行更新;但是視圖主要用于簡化檢索,保護數(shù)據(jù),并不用于更新,而且大部分視圖都不可以更新。
B+tree的磁盤讀寫代價更低,B+tree的查詢效率更加穩(wěn)定 數(shù)據(jù)庫索引采用B+樹而不是B樹的主要原因:B+樹只要遍歷葉子節(jié)點就可以實現(xiàn)整棵樹的遍歷,而且在數(shù)據(jù)庫中基于范圍的查詢是非常頻繁的,而B樹只能中序遍歷所有節(jié)點,效率太低。
B+樹的特點
在最頻繁使用的、用以縮小查詢范圍的字段,需要排序的字段上建立索引。不宜:1)對于查詢中很少涉及的列或者重復值比較多的列 2)對于一些特殊的數(shù)據(jù)類型,不宜建立索引,比如文本字段(text)等。
如果一個索引包含(或者說覆蓋)所有需要查詢的字段的值,我們就稱 之為“覆蓋索引”。
我們知道在InnoDB存儲引 擎中,如果不是主鍵索引,葉子節(jié)點存儲的是主鍵+列值。最終還是要“回表”,也就是要通過主鍵再查找一次,這樣就 會比較慢。覆蓋索引就是把要查詢出的列和索引是對應的,不做回表操作!
舉例 :
學號姓名性別年齡系別專業(yè) 20020612李輝男20計算機軟件開發(fā) 20060613張明男18計算機軟件開發(fā) 20060614王小玉女19物理力學 20060615李淑華女17生物動物學 20060616趙靜男21化學食品化學 20060617趙靜女20生物植物學
主鍵為候選鍵的子集,候選鍵為超鍵的子集,而外鍵的確定是相對于主鍵的。
阿牛去一家中意的公司面試,本以為憑借以往豐富的經(jīng)驗,肯定手到擒來,結(jié)果第一個問題,我就“出門右拐”了。
問題就是:MySQL是怎么保證事務一致性的?
回到家阿牛翻閱資料,終于搞懂了,在這里分享給大家。
定義
在搞清楚問題答案之前,先搞清楚以下幾個名詞以及大致的用處
redo log:
通常是物理日志,記錄的是數(shù)據(jù)頁的物理修改,而不是某一行或某幾行修改成怎樣怎樣,它用來恢復提交后的物理數(shù)據(jù)頁(恢復數(shù)據(jù)頁,且只能恢復到最后一次提交的位置)、Innodb特有的,他在存儲引擎層。循環(huán)寫的,空間固定會用完。作用是crash-safe能力
binlog:
是邏輯日志,記錄的是這個語句的原始邏輯,比如“給 ID=2 這一行的 c 字段加 1 ” 是 MySQL 的 Server 層實現(xiàn)的,所有引擎都可以使用。是可以追加寫入的,“追加寫”是指 binlog 文件寫到一定大小后會切換到下一個,并不會覆蓋以前的日志。作用是數(shù)據(jù)歸檔
undo log:
有兩個作用:提供回滾和多個行版本控制(MVCC)。
在數(shù)據(jù)修改的時候,不僅記錄了redo,還記錄了相對應的undo,如果因為某些原因?qū)е率聞帐』蚧貪L了,可以借助該undo進行回滾。
SQL執(zhí)行的過程
了解了以上名詞之后,讓我們看一下“一條更新SQL語句執(zhí)行的過程是什么?”
如圖1有幾個關(guān)鍵步驟:
1、先查找記錄所在的Innodb頁在不在內(nèi)存里;如果不在內(nèi)存里則將記錄所在的頁加載在內(nèi)存里;根據(jù)SQL語句在內(nèi)存中將記錄更新
2、將更新前的記錄寫入undolog
3、根據(jù)記錄的更新值將變更寫入redolog(buffer)中,并將狀態(tài)變更為prepare
4、將變更記錄到邏輯日志
5、redolog日志中的狀態(tài)修改為commit,返回結(jié)束
至此:一條更新語句的過程結(jié)束
上面的步驟中有些同學可能會有一些疑問:為什么更新一條記錄要把一整頁數(shù)據(jù)加載到內(nèi)存里答:因為Innodb引擎中,最小的存儲單位是頁為什么一定要加載到內(nèi)存里?答:因為所有的計算操作都是在內(nèi)存里,操作完成后最終才寫回磁盤為什么要寫入redolog,直接寫入磁盤,然后寫入binlog就好了啊?答:這將在下面會提到,請往后看
為了加深理解,準備了下面2張圖輔助理解
以圖3為例,讓我們看看在每個步驟出現(xiàn)異常的時候,到底怎么保證事物一致性的吧!1、步驟123,所有的操作最多還只是內(nèi)存里,如果出現(xiàn)宕機、斷電等異常,? 記錄不會有任何變動,事物是一致的2、步驟4剛執(zhí)行完,斷電了,因為redolog還處在prepare狀態(tài),???這時候事物也是一致的3、步驟5記錄binlog的過程中斷電了,這時候要保證主從一致性,? 事物也是不生效的,最終也是一致的4、步驟6、7如果中間任何一個時刻斷電了,這時候情況就不一樣了,事物是生效的,因為redolog、binlog的數(shù)據(jù)都是完整的,服務器重啟后可以按照xid來去查看binlog、redolog中是否都存在,? 都存在該事物就是生效的。上面就是怎么保證事務一致性的根本原因
為什么要使用redolog?
回答這個問題之前,我們先看看redolog用圖形表示的
圖4是redolog的形象一點的表現(xiàn),并不是說redolog 長這個樣子,只是為了更形象;一般情況下redolog一組4個文件,每個文件1個G,其中write pos是指redolog當前寫到什么位置了,check point是指上次刷臟結(jié)束的位置,當write log和check point重合時,所有的進程停止,開始新一輪的刷臟操作。刷完后redolog清空開始下一輪的寫入,往返重復。
可能這樣表示有點抽象,讓我們看下圖5
從上圖中可以看的更形象一點,在sql執(zhí)行的時候,會有磁盤IO將數(shù)據(jù)頁加載到內(nèi)存,然后在內(nèi)存中將數(shù)據(jù)修改,修改后的數(shù)據(jù)頁在內(nèi)存中叫做臟頁(叫臟頁因為和磁盤中的數(shù)據(jù)不一致啊),又因為在內(nèi)存中容易丟失,所以將數(shù)據(jù)頁的變更記錄如redolog中,隨著記錄插入、更新等操作的增多,redolog空間慢慢的滿了,這時候就開始刷臟操作了,page cleaner thread線程會將所有的臟頁數(shù)據(jù)刷新到磁盤,使得變更最終被持久化到磁盤。
講到這里一定還會有人不太理解,刷臟之前斷電了咋辦?
這就是redolog的另一個重要的作用,crash-safe能力,實現(xiàn)的邏輯是這樣的,斷電后內(nèi)存的數(shù)據(jù)都沒了,重啟后讀取redolog文件,因為redolog文件記錄的是在Innodb頁x的m處做了y的修改,所以根據(jù)redolog將涉及到的Innodb頁重新加載到內(nèi)存,根據(jù)redolog的記錄將內(nèi)存中的數(shù)據(jù)重新修改,這樣就能恢復斷電前的數(shù)據(jù)了。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?完
下期預告:還是MySQL,敬請期待
本文首發(fā)自: 程序員阿牛
新聞名稱:mysql面試怎么樣,mysql高階技術(shù)面試必問
網(wǎng)頁路徑:http://m.rwnh.cn/article44/phpiee.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供關(guān)鍵詞優(yōu)化、搜索引擎優(yōu)化、微信小程序、品牌網(wǎng)站制作、網(wǎng)站維護、網(wǎng)站設計公司
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)