色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

面試官考點之索引是什么?

數據分析與開發 ? 來源:數據分析與開發 ? 作者:數據分析與開發 ? 2021-03-05 10:37 ? 次閱讀

前言

有位朋友去阿里面試,他說面試官給了幾條查詢SQL,問:需要執行幾次樹搜索操作?我朋友當時是有點懵的,后來冷靜思考,才發現就是考索引的幾個基礎知識點~~ 本文我們分九個索引知識點,一起來探討一下

一、面試官考點之索引是什么?

索引是一種能提高數據庫查詢效率的數據結構。它可以比作一本字典的目錄,可以幫你快速找到對應的記錄。

索引一般存儲在磁盤的文件中,它是占用物理空間的。

正所謂水能載舟,也能覆舟。適當的索引能提高查詢效率,過多的索引會影響數據庫表的插入和更新功能。

二、索引有哪些類型類型

數據結構維度

B+樹索引:所有數據存儲在葉子節點,復雜度為O(logn),適合范圍查詢。

哈希索引: 適合等值查詢,檢索效率高,一次到位。

全文索引:MyISAM和InnoDB中都支持使用全文索引,一般在文本類型char,text,varchar類型上創建。

R-Tree索引: 用來對GIS數據類型創建SPATIAL索引

物理存儲維度

聚集索引:聚集索引就是以主鍵創建的索引,在葉子節點存儲的是表中的數據。

非聚集索引:非聚集索引就是以非主鍵創建的索引,在葉子節點存儲的是主鍵和索引列。

邏輯維度

主鍵索引:一種特殊的唯一索引,不允許有空值。

普通索引:MySQL中基本索引類型,允許空值和重復值。

聯合索引:多個字段創建的索引,使用時遵循最左前綴原則。

唯一索引:索引列中的值必須是唯一的,但是允許為空值。

空間索引:MySQL5.7之后支持空間索引,在空間索引這方面遵循OpenGIS幾何數據模型規則。

三、面試官考點之為什么選擇B+樹作為索引結構

可以從幾個維度去看這個問題,查詢是否夠快,效率是否穩定,存儲數據多少,以及查找磁盤次數等等。為什么不是哈希結構?為什么不是二叉樹,為什么不是平衡二叉樹,為什么不是B樹,而偏偏是B+樹呢?

我們寫業務SQL查詢時,大多數情況下,都是范圍查詢的,如一下SQL

select*fromemployeewhereagebetween18and28;

為什么不使用哈希結構?

我們知道哈希結構,類似k-v結構,也就是,key和value是一對一關系。它用于等值查詢還可以,但是范圍查詢它是無能為力的哦。

為什么不使用二叉樹呢?

先回憶下二叉樹相關知識啦~ 所謂二叉樹,特點如下:

每個結點最多兩個子樹,分別稱為左子樹和右子樹。

左子節點的值小于當前節點的值,當前節點值小于右子節點值

頂端的節點稱為跟節點,沒有子節點的節點值稱為葉子節點。

我們腦海中,很容易就浮現出這種二叉樹結構圖:

但是呢,有些特殊二叉樹,它可能這樣的哦:

如果二叉樹特殊化為一個鏈表,相當于全表掃描。那么還要索引干嘛呀?因此,一般二叉樹不適合作為索引結構。

為什么不使用平衡二叉樹呢?

平衡二叉樹特點:它也是一顆二叉查找樹,任何節點的兩個子樹高度最大差為1。所以就不會出現特殊化一個鏈表的情況啦。

但是呢:

平衡二叉樹插入或者更新是,需要左旋右旋維持平衡,維護代價大

如果數量多的話,樹的高度會很高。因為數據是存在磁盤的,以它作為索引結構,每次從磁盤讀取一個節點,操作IO的次數就多啦。

為什么不使用B樹呢?

數據量大的話,平衡二叉樹的高度會很高,會增加IO嘛。那為什么不選擇同樣數據量,高度更矮的B樹呢?

B樹相對于平衡二叉樹,就可以存儲更多的數據,高度更低。但是最后為甚選擇B+樹呢?因為B+樹是B樹的升級版:

B+樹非葉子節點上是不存儲數據的,僅存儲鍵值,而B樹節點中不僅存儲鍵值,也會存儲數據。innodb中頁的默認大小是16KB,如果不存儲數據,那么就會存儲更多的鍵值,相應的樹的階數(節點的子節點樹)就會更大,樹就會更矮更胖,如此一來我們查找數據進行磁盤的IO次數有會再次減少,數據查詢的效率也會更快。

B+樹索引的所有數據均存儲在葉子節點,而且數據是按照順序排列的,鏈表連著的。那么B+樹使得范圍查找,排序查找,分組查找以及去重查找變得異常簡單。

四、面試官考點之一次B+樹索引搜索過程

面試官:假設有以下表結構,并且有這幾條數據

CREATETABLE`employee`( `id`int(11)NOTNULL, `name`varchar(255)DEFAULTNULL, `age`int(11)DEFAULTNULL, `date`datetimeDEFAULTNULL, `sex`int(1)DEFAULTNULL, PRIMARYKEY(`id`), KEY`idx_age`(`age`)USINGBTREE )ENGINE=InnoDBDEFAULTCHARSET=utf8; insertintoemployeevalues(100,'小倫',43,'2021-01-20','0'); insertintoemployeevalues(200,'俊杰',48,'2021-01-21','0'); insertintoemployeevalues(300,'紫琪',36,'2020-01-21','1'); insertintoemployeevalues(400,'立紅',32,'2020-01-21','0'); insertintoemployeevalues(500,'易迅',37,'2020-01-21','1'); insertintoemployeevalues(600,'小軍',49,'2021-01-21','0'); insertintoemployeevalues(700,'小燕',28,'2021-01-21','1');

面試官:如果執行以下的查詢SQL,需要執行幾次的樹搜索操作?可以畫下對應的索引結構圖~

select*fromTemployeewhereage=32;

解析:其實這個,面試官就是考察候選人是否熟悉B+樹索引結構圖。可以像醬紫回答~

先畫出idx_age索引的索引結構圖,大概如下:

77259210-7b71-11eb-8b86-12bb97331649.png

再畫出id主鍵索引,我們先畫出聚族索引結構圖,如下:

775005d6-7b71-11eb-8b86-12bb97331649.png

因此,這條 SQL 查詢語句執行大概流程就是醬紫:

搜索idx_age索引樹,將磁盤塊1加載到內存,由于32<37,搜索左路分支,到磁盤尋址磁盤塊2。

將磁盤塊2加載到內存中,在內存繼續遍歷,找到age=32的記錄,取得id = 400.

拿到id=400后,回到id主鍵索引樹。

搜索id主鍵索引樹,將磁盤塊1加載內存,在內存遍歷,找到了400,但是B+樹索引非葉子節點是不保存數據的。索引會繼續搜索400的右分支,到磁盤尋址磁盤塊3.

將磁盤塊3加載內存,在內存遍歷,找到id=400的記錄,拿到R4這一行的數據,好的,大功告成。

因此,這個SQL查詢,執行了幾次樹的搜索操作,是不是一步了然了呀。特別的,在idx_age二級索引樹找到主鍵id后,回到id主鍵索引搜索的過程,就稱為回表。

什么是回表?拿到主鍵再回到主鍵索引查詢的過程,就叫做回表

五、面試官考點之覆蓋索引

面試官:如果不用select *, 而是使用select id,age,以上的題目執行了幾次樹搜索操作呢?

解析:這個問題,主要考察候選人的覆蓋索引知識點。回到idx_age索引樹,你可以發現查詢選項id和age都在葉子節點上了。因此,可以直接提供查詢結果啦,根本就不需要再回表了~

覆蓋索引:在查詢的數據列里面,不需要回表去查,直接從索引列就能取到想要的結果。換句話說,你SQL用到的索引列數據,覆蓋了查詢結果的列,就算上覆蓋索引了。

所以,相對于上個問題,就是省去了回表的樹搜索操作。

六、面試官考點之索引失效

面試官:如果我現在給name字段加上普通索引,然后用個like模糊搜索,那會執行多少次查詢呢?SQL如下:

select*fromemployeewherenamelike'%杰倫%';

解析:這里考察的知識點就是,like是否會導致不走索引,看先該SQL的explain執行計劃吧。其實like 模糊搜索,會導致不走索引的,如下:

因此,這條SQL最后就全表掃描啦~日常開發中,這幾種騷操作都可能會導致索引失效,如下:

查詢條件包含or,可能導致索引失效

如何字段類型是字符串,where時一定用引號括起來,否則索引失效

like通配符可能導致索引失效。

聯合索引,查詢時的條件列不是聯合索引中的第一個列,索引失效。

在索引列上使用mysql的內置函數,索引失效。

對索引列運算(如,+、-、*、/),索引失效。

索引字段上使用(!= 或者 < >,not in)時,可能會導致索引失效。

索引字段上使用is null, is not null,可能導致索引失效。

左連接查詢或者右連接查詢查詢關聯的字段編碼格式不一樣,可能導致索引失效。

mysql估計使用全表掃描要比使用索引快,則不使用索引。

七、面試官考點聯合索引之最左前綴原則

面試官:如果我現在給name,age字段加上聯合索引索引,以下SQL執行多少次樹搜索呢?先畫下索引樹?

select*fromemployeewherenamelike'小%'orderbyagedesc;

解析:這里考察聯合索引的最左前綴原則以及like是否中索引的知識點。組合索引樹示意圖大概如下:

聯合索引項是先按姓名name從小到大排序,如果名字name相同,則按年齡age從小到大排序。面試官要求查所有名字第一個字是“小”的人,SQL的like '小%'是可以用上idx_name_age聯合索引的。

該查詢會沿著idx_name_age索引樹,找到第一個字是小的索引值,因此依次找到小軍、小倫、小燕、,分別拿到Id=600、100、700,然后回三次表,去找對應的記錄。這里面的最左前綴小,就是字符串索引的最左M個字符。實際上,

這個最左前綴可以是聯合索引的最左N個字段。比如組合索引(a,b,c)可以相當于建了(a),(a,b),(a,b,c)三個索引,大大提高了索引復用能力。

最左前綴也可以是字符串索引的最左M個字符。

八、面試官考點之索引下推

面試官:我們還是居于組合索引 idx_name_age,以下這個SQL執行幾次樹搜索呢?

select*fromemployeewherenamelike'小%'andage=28andsex='0';

解析:這里考察索引下推的知識點,如果是Mysql5.6之前,在idx_name_age索引樹,找出所有名字第一個字是“小”的人,拿到它們的主鍵id,然后回表找出數據行,再去對比年齡和性別等其他字段。如圖:

有些朋友可能覺得奇怪,(name,age)不是聯合索引嘛?為什么選出包含“小”字后,不再順便看下年齡age再回表呢,不是更高效嘛?所以呀,MySQL 5.6 就引入了索引下推優化,可以在索引遍歷過程中,對索引中包含的字段先做判斷,直接過濾掉不滿足條件的記錄,減少回表次數。

因此,MySQL5.6版本之后,選出包含“小”字后,順表過濾age=28,,所以就只需一次回表。

九、 面試官考點之大表添加索引

面試官:如果一張表數據量級是千萬級別以上的,那么,給這張表添加索引,你需要怎么做呢?

解析:我們需要知道一點,給表添加索引的時候,是會對表加鎖的。如果不謹慎操作,有可能出現生產事故的。可以參考以下方法:

1.先創建一張跟原表A數據結構相同的新表B。

2.在新表B添加需要加上的新索引。

3.把原表A數據導到新表B

4.rename新表B為原表的表名A,原表A換別的表名;

總結與練習

本文主要講解了索引的9大關鍵知識點,希望對大家有幫助。接下來呢,給大家出一道,有關于我最近業務開發遇到的加索引SQL,看下大家是怎么回答的,題目如下:

select*fromAwheretype='1'andstatus='s'orderbycreate_timedesc;

假設type有9種類型,區分度性還算可以,status的區分度不高(有3種類型),那么你是如何加索引呢?

是給type加單索引

還是(type,status,create_time)聯合索引

還是(type,create_time)聯合索引呢?

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • SQL
    SQL
    +關注

    關注

    1

    文章

    762

    瀏覽量

    44117
  • 二叉樹
    +關注

    關注

    0

    文章

    74

    瀏覽量

    12324
  • 索引
    +關注

    關注

    0

    文章

    59

    瀏覽量

    10468

原文標題:阿里一面,給了幾條SQL,問需要執行幾次樹搜索操作?

文章出處:【微信號:DBDevs,微信公眾號:數據分析與開發】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    面試題】人工智能工程師高頻面試題匯總:機器學習深化篇(題目+答案)

    隨著人工智能技術的突飛猛進,AI工程師成為了眾多求職者夢寐以求的職業。想要拿下這份工作,面試的時候得展示出你不僅技術過硬,還得能解決問題。所以,提前準備一些面試常問的問題,比如機器學習的那些算法
    的頭像 發表于 12-16 13:42 ?1475次閱讀
    【<b class='flag-5'>面試</b>題】人工智能工程師高頻<b class='flag-5'>面試</b>題匯總:機器學習深化篇(題目+答案)

    面試題】人工智能工程師高頻面試題匯總:Transformer篇(題目+答案)

    隨著人工智能技術的突飛猛進,AI工程師成為了眾多求職者夢寐以求的職業。想要拿下這份工作,面試的時候得展示出你不僅技術過硬,還得能解決問題。所以,提前準備一些面試常問的問題,比如機器學習的那些算法
    的頭像 發表于 12-13 15:06 ?449次閱讀
    【<b class='flag-5'>面試</b>題】人工智能工程師高頻<b class='flag-5'>面試</b>題匯總:Transformer篇(題目+答案)

    人工智能工程師高頻面試題匯總——機器學習篇

    隨著人工智能技術的突飛猛進,AI工程師成為了眾多求職者夢寐以求的職業。想要拿下這份工作,面試的時候得展示出你不僅技術過硬,還得能解決問題。所以,提前準備一些面試常問的問題,比如機器學習的那些算法
    的頭像 發表于 12-04 17:00 ?819次閱讀
    人工智能工程師高頻<b class='flag-5'>面試</b>題匯總——機器學習篇

    面試嵌入式都會問那些問題呢?

    作為一名電子工程專業的畢業生,我對嵌入式系統開發一直充滿熱情。當我決定踏入這個行業,尋找屬于自己的職業道路時,面試成為了我必須面對的挑戰。在這里,我想分享一些我在嵌入式系統面試中遇到的問題以及我的應對經驗。
    的頭像 發表于 11-27 09:13 ?301次閱讀
    <b class='flag-5'>面試</b>嵌入式都會問那些問題呢?

    程序員去面試只需一個技能征服所有面試官

    個車輛工程專業的研究生去面試面試官最后問他會不會嵌入式。雖然應聘的崗位不是嵌入式工程師,但看來老板還是希望他能懂點這方面的知識。這個小插曲就說明了一個重要的就業
    的頭像 發表于 11-05 19:35 ?194次閱讀
    程序員去<b class='flag-5'>面試</b>只需一個技能征服所有<b class='flag-5'>面試官</b>!

    MATLAB中的矩陣索引

    對矩陣進行索引是從矩陣中選擇或修改部分元素的一種方式。MATLAB 有幾種索引樣式,它們不僅功能強大、靈活,而且可讀性強、表現力強。矩陣是 MATLAB 用來組織和分析數據的一個核心組件,索引是以可理解的方式有效操作矩陣的關鍵。
    的頭像 發表于 09-05 09:28 ?447次閱讀
    MATLAB中的矩陣<b class='flag-5'>索引</b>

    一文了解MySQL索引機制

    接觸MySQL數據庫的小伙伴一定避不開索引索引的出現是為了提高數據查詢的效率,就像書的目錄一樣。 某一個SQL查詢比較慢,你第一時間想到的就是“給某個字段加個索引吧”,那么索引是什么
    的頭像 發表于 07-25 14:05 ?283次閱讀
    一文了解MySQL<b class='flag-5'>索引</b>機制

    面試嵌入式工作,會被問什么問題?

    面試嵌入式工作時,面試官可能會從多個方面考察應聘者的知識、技能和經驗。以下是一些常見的嵌入式工作面試問題,這些問題涵蓋了基礎知識、專業技能、項目經驗和個人能力等方面
    的頭像 發表于 07-17 09:26 ?2006次閱讀
    <b class='flag-5'>面試</b>嵌入式工作,會被問什么問題?

    ClickHouse內幕(3)基于索引的查詢優化

    ClickHouse索引采用唯一聚簇索引的方式,即Part內數據按照order by keys有序,在整個查詢計劃中,如果算子能夠有效利用輸入數據的有序性,對算子的執行性能將有巨大的提升。本文討論
    的頭像 發表于 06-11 10:46 ?1009次閱讀
    ClickHouse內幕(3)基于<b class='flag-5'>索引</b>的查詢優化

    面試官:Kafka會丟消息嗎?

    許多開發人員普遍認為,Kafka 的設計本身就能保證不會丟失消息。然而,Kafka 架構和配置的細微差別會導致消息的丟失。我們需要了解它如何以及何時可能丟失消息,并防止此類情況的發生。
    的頭像 發表于 04-29 17:32 ?1013次閱讀
    <b class='flag-5'>面試官</b>:Kafka會丟消息嗎?

    Redis官方搜索引擎來了,性能炸裂!

    RediSearch 是一個 Redis 模塊,為 Redis 提供查詢、二級索引和全文搜索功能。
    的頭像 發表于 02-21 10:01 ?2321次閱讀
    Redis官方搜<b class='flag-5'>索引</b>擎來了,性能炸裂!

    鴻蒙OS開發 融合搜索概述

    HarmonyOS 融合搜索為開發者提供搜索引擎級的全文搜索能力,可支持應用內搜索和系統全局搜索,為用戶提供更加準確、高效的搜索體驗。 基本概念 全文索引 記錄字或詞的位置和次數等屬性,建立的倒排
    的頭像 發表于 01-29 16:24 ?561次閱讀
    鴻蒙OS開發<b class='flag-5'>之</b>  融合搜索概述

    谷歌搜索引擎優化的各個方面和步驟

    谷歌搜索引擎是最受歡迎和廣泛使用的搜索引擎之一,為了使你的網站在谷歌上更好地排名并提高曝光度,你可以采取一些谷歌搜索引擎優化的步驟。 使用關鍵字研究工具,如Google AdWords關鍵字規劃工具
    的頭像 發表于 01-25 10:29 ?871次閱讀

    導致MySQL索引失效的情況以及相應的解決方法

    導致MySQL索引失效的情況以及相應的解決方法? MySQL索引的目的是提高查詢效率,但有些情況下索引可能會失效,導致查詢變慢或效果不如預期。下面將詳細介紹導致MySQL索引失效的情況
    的頭像 發表于 12-28 10:01 ?752次閱讀

    Mysql索引是什么東西?索引有哪些特性?索引是如何工作的?

    作為開發人員,碰到了執行時間較長的 sql 時,基本上大家都會說” 加個索引吧”。但是索引是什么東西,索引有哪些特性,下面和大家簡單討論一下。
    的頭像 發表于 12-24 16:20 ?1304次閱讀
    Mysql<b class='flag-5'>索引</b>是什么東西?<b class='flag-5'>索引</b>有哪些特性?<b class='flag-5'>索引</b>是如何工作的?
    主站蜘蛛池模板: 久久久久久久久免费视频 | 日韩精品在线观看免费| 国产精品XXXXX免费A片| 越南女 黑人 痛苦 大叫| 日日碰狠狠躁久久躁77777| 久久偷拍vs国产在线播放| 国产精品久久久精品日日| 99热这里精品| 亚洲欧洲日韩国产一区二区三区| 热思思| 老板吻我下身好爽到高潮| 国产精品午夜福利在线观看| 99久久久精品免费观看国产| 幺妹视频福利视频| 袖珍人与大黑人性视频| 日本美国群交P片内射捆绑| 久久热在线视频精品店| 国产综合在线视频| 广播电台在线收听| FREE乌克兰嫩交HD| 18videosex性欧美黑色| 亚洲一区国产| 亚洲第一页在线播放| 色在线视频亚洲欧美| 欧美性狂猛AAAAAA| 男人的天堂黄色| 美女夫妻内射潮视频| 久久久无码精品亚洲日韩按摩 | 任你躁精品一区二区三区| 麻豆成人久久精品二区三区网站| 黄子佼81岁父亲现状曝光| 国产精品久久久久久久久无码| 北条麻妃快播| www伊人网| NANANA在线观看高清影院| 97综合久久| 97超级碰久久久久香蕉人人| 97超碰97资源在线观看| 99精品视频在线观看免费播放| 最新国自产拍 高清完整版| 在线视频av大全色久久|