摘要:在后端開發的工作中如何輕松高效地設計大量數據庫索引呢通過下面這四步,分鐘后你就再也不會為數據庫的索引設計而發愁了。順暢地閱讀這篇文章需要了解數據庫索引的組織方式,如果你還不熟悉的話,可以通過另一篇文章來快速了解一下數據庫索引融會貫通。
在后端開發的工作中如何輕松、高效地設計大量數據庫索引呢?通過下面這四步,20分鐘后你就再也不會為數據庫的索引設計而發愁了。
順暢地閱讀這篇文章需要了解數據庫索引的組織方式,如果你還不熟悉的話,可以通過另一篇文章來快速了解一下——數據庫索引融會貫通。
這篇文章是一系列數據庫索引文章中的第三篇,這個系列包括了下面四篇文章:
數據庫索引是什么?新華字典來幫你 —— 理解
數據庫索引融會貫通 —— 深入
20分鐘數據庫索引設計實戰 —— 實戰
數據庫索引為什么用B+樹實現? —— 擴展
這一系列涵蓋了數據庫索引從理論到實踐的一系列知識,一站式解決了從理解到融會貫通的全過程,相信每一篇文章都可以給你帶來更深入的體驗。
1. 整理查詢條件我們設計索引的目的主要是為了加快查詢,所以,設計索引的第一步是整理需要用到的查詢條件,也就是我們會在where子句、join連接條件中使用的字段。一般來說會整理程序中除了insert語句之外的所有SQL語句,按不同的表分別整理出每張表上的查詢條件。也可以根據對業務的理解添加一些暫時還沒有使用到的查詢條件。
對索引的設計一般會逐表進行,所以按數據表收集查詢條件可以方便后面步驟的執行。
2. 分析字段的可選擇性整理出所有查詢條件之后,我們需要分析出每個字段的可選擇性,那么什么是可選擇性呢?
字段的可選擇性指的就是字段的值的區分度,例如一張表中保存了用戶的手機號、性別、姓名、年齡這幾個字段,且一個手機號只能注冊一個用戶。在這種情況下,像手機號這種唯一的字段就是可選擇性最高的一種情況;而年齡雖然有幾十種可能,但是區分度就沒有手機號那么大了;性別這樣的字段則只有幾種可能,所以可選擇性最差。所以俺可選擇性從高到低排列就是:手機號 > 年齡 > 性別。
但是不同字段的值分布是不同的,有一些值的數量是大致均勻的,例如性別為男和女的值數量可能就差別不大,但是像年齡超過100歲這樣的記錄就非常少了。所以對于年齡這個字段,20-30這樣的值就是可選擇性很小的,因為每一個年齡都有非常多的記錄;但是像100這樣的值,那它的可選擇性就非常高了。
如果我們在表中添加了一個字段表示用戶是否是管理員,那么在查詢網站的管理員信息列表時,這個字段的可選擇性就非常高。但是如果我們要查詢的是非管理員信息列表時,這個字段的可選擇性就非常低了。
從經驗上來說,我們會把可選擇性高的字段放到前面,可選擇性低的字段放在后面,如果可選擇性非常低,一般不會把這樣的字段放到索引里。
3. 合并查詢條件雖然索引可以加快查詢的效率,但是索引越多就會導致插入和更新數據的成本變高,因為索引是分開存儲的,所有數據的插入和更新操作都要對相關的索引進行修改。所以設計索引時還需要控制索引的數量,不能盲目地增加索引。
一般我們會根據最左匹配原則來合并查詢條件,盡可能讓不同的查詢條件使用同一個索引。例如有兩個查詢條件where a = 1 and b = 1和where b = 1,那么我們就可以創建一個索引idx_eg(b, a)來同時服務兩個查詢條件。
同時,因為范圍條件會終止使用索引中后續的字段,所以對于使用范圍條件查詢的字段我們也會盡可能放在索引的后面。
4. 考慮是否需要使用全覆蓋索引最后,我們會考慮是否需要使用全覆蓋索引,因為全覆蓋索引沒有回表的開銷,效率會更高。所以一般我們會在回表成本特別高的情況下考慮是否使用全覆蓋索引,例如根據索引字段篩選后的結果需要返回其他字段或者使用其他字段做進一步篩選的情況。
例如,我們有一張用戶表,其中有年齡、姓名、手機號三個字段。我們需要查詢在指定年齡的所有用戶的姓名,已有索引idx_age_name(年齡, 姓名),目前我們使用下面這樣的查詢語句進行查詢:
SELECT * FROM 用戶表 WHERE 年齡 = ?;
一般情況下,將一個索引優化為全覆蓋索引有兩種方式:
增加索引中的字段,讓索引字段覆蓋SQL語句中使用的所有字段
在這個例子中,我們可以創建一個同時包含所有字段的索引idx_all(年齡, 姓名, 手機號),以此提高查詢的效率。
減少SQL語句中使用的字段,使SQL需要的字段都包含在現有索引中
在這個例子中,其實更好的方法是將SELECT子句修改為SELECT 姓名,因為我們的需求只是查詢用戶的姓名,并不需要手機號字段,去掉SELECT子句多余的字段不僅能夠滿足我們的需求,而且也不用對索引做修改。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/17911.html
摘要:學過服務器端開發的朋友一定知道,程序沒有數據庫索引也可以運行。什么是數據庫索引用一句話來描述數據庫索引就是一種加快海量數據查詢的關鍵技術。那這和我們的數據庫索引有啥關系呢別著急,我們翻開第一頁看看。 學過服務器端開發的朋友一定知道,程序沒有數據庫索引也可以運行。但是所有學習數據庫的資料、教程,一定會有大量的篇幅在介紹數據庫索引,各種后端開發工作的面試也一定繞不開索引,甚至可以說數據庫索...
閱讀 1062·2021-11-24 10:27
閱讀 3336·2021-11-18 10:02
閱讀 2396·2021-11-16 11:45
閱讀 3161·2021-11-15 18:10
閱讀 821·2021-09-22 15:23
閱讀 1528·2019-08-30 15:53
閱讀 3020·2019-08-30 13:20
閱讀 1666·2019-08-30 12:53