摘要:業務延遲和錯誤量對比接入數據庫后業務邏輯層服務接口耗時穩定無抖動,且沒有發生丟棄的情況上圖錯誤大多由數據訪問層服務隊列堆積發生請求丟棄造成。
作者:孫玄,轉轉公司首席架構師;陳東,轉轉公司資深工程師;冀浩東,轉轉公司資深 DBA。公司及業務架構介紹
轉轉二手交易網 —— 把家里不用的東西賣了變成錢,一個幫你賺錢的網站。由騰訊與 58 集團共同投資。為海量用戶提供一個有擔保、便捷的二手交易平臺。轉轉是 2015 年 11 月 12 日正式推出的 APP,遵循“用戶第一”的核心價值觀,以“讓資源重新配置,讓人與人更信任”為企業愿景,提倡真實個人交易。
轉轉二手交易涵蓋手機、3C 數碼、母嬰用品等三十余個品類。在系統設計上,轉轉整體架構采用微服務架構,首先按照業務領域模型垂直拆分成用戶、商品、交易、搜索、推薦微服務。對每一個功能單元(商品等),繼續進行水平拆分,分為商品網關層、商品業務邏輯層、商品數據訪問層、商品 DB / Cache,如下圖所示:?
項目背景1. 面臨的問題
轉轉后端業務現階段主要使用 MySQL 數據庫存儲數據,還有少部分業務使用 MongoDB。雖然目前情況下使用這兩種存儲基本可以滿足我們的需求,但隨著業務的增長,公司的數據規模逐漸變大,為了應對大數據量下業務服務訪問的性能問題,MySQL 數據庫常用的分庫、分表方案會隨著 MySQL Sharding(分片)的增多,業務訪問數據庫邏輯會越來越復雜。而且對于某些有多維度查詢需求的表,我們總需要引入額外的存儲或犧牲性能來滿足我們的查詢需求,這樣會使業務邏輯越來越重,不利于產品的快速迭代。
從數據庫運維角度講,大數據量的情況下,MySQL 數據庫在每次 DDL 都會對運維人員造成很大的工作量,當節點故障后,由于數據量較大,恢復時間較長。但這種 M - S 架構只能通過主從切換并且需要額外的高可用組件來保障高可用,同時在切換過程由于需要確定主庫狀態、新主庫選舉、新路由下發等原因,還是會存在短暫的業務訪問中斷的情況。?
綜上所述,我們面臨的主要問題可歸納為:
數據量大,如何快速水平擴展存儲;
大數據量下,如何快速 DDL;
分庫分表造成業務邏輯非常復雜;
常規 MySQL 主從故障轉移會導致業務訪問短暫不可用。
2. 為什么選擇 TiDB
針對上章提到的問題,轉轉基礎架構部和 DBA 團隊考慮轉轉業務數據增速,定位簡化業務團隊數據庫使用方案,更好的助力業務發展,決定啟動新型存儲服務(NewSQL)的選型調研工作。?
TiDB 數據庫,結合了關系庫與 KV 存儲的優點,對于使用方,完全可以當做 MySQL 來用,而且不用考慮數據量大了后的分庫分表以及為了支持分庫分表后的多維度查詢而建立的 Mapping 表,可以把精力全部放在業務需求上。所以我們把 TiDB 作為選型的首選對象展開了測試和試用。
TiDB 測試1. 功能測試
TiDB 支持絕大多數 MySQL 語法,業務可以將基于 MySQL 的開發,無縫遷移至 TiDB。不過目前 TiDB 不支持部分 MySQL 特性,如:存儲過程、自定義函數、觸發器等。
2. TiDB 壓力測試
通過測試工具模擬不同的場景的請求,對 TiDB 數據庫進行壓力測試,通過壓力測試結果的對比,可以提供 RD 使用 TiDB 的合適業務場景以及 TiDB 的使用建議。
此次壓力測試,總共使用 6 臺物理服務器,其中 3 臺 CPU 密集型服務器,用于啟動 TiDB - Server、PD 服務;另外 3 臺為 IO / CPU 密集型的PCIE 服務器,用于啟動 TiKV 服務。
使用 sysbench - 1.0.11 測試數據大小為 200G 的 TiDB 集群,在不同場景下 TiDB 的響應時間(95th per):
3. 結果整理
順序掃描的效率是比較高的,連續的行大概率會存儲在同一臺機器的鄰近位置,每次批量的讀取和寫入的效率會高;
控制并發運行的線程數,會減少請求響應時間,提高數據庫的處理性能。
4. 場景建議
適合線上業務混合讀寫場景;
適合順序寫的場景,比如:數據歸檔、操作日志、攤銷流水。
5. TiDB 預上線
將 TiDB 掛載到線上 MySQL,作為 MySQL 從庫同步線上數據,然后業務將部分線上讀流量切換到 TiDB,可以對 TiDB 集群是否滿足業務訪問做好預判。
業務接入1. 遷移過程
我們第一個接入 TiDB 的業務線是轉轉消息服務。消息作為轉轉最重要的基礎服務之一,是保證平臺上買賣雙方有效溝通、促進交易達成的重要組件,其數據量和訪問量都非常大。起初我們使用的是 MySQL 數據庫,對其所有的業務都做了庫的垂直拆分以及表的水平拆分。目前線上有幾十 TB 的數據,記錄數據達到了幾百億。雖對 MySQL 做了分庫分表,但實例已經開始又有偶發的性能問題,需要馬上對數據進行二次拆分,而二次拆分的執行成本也比較高,這也是我們首先遷移消息數據庫的原因之一。
消息服務有幾個核心業務表:聯系人列表、消息表、系統消息表等等。聯系人列表作為整個消息系統的樞紐,承載著巨大的訪問壓力。業務場景相對其他表最復雜的,也是這個表的實例出現了性能問題,所以我們決定先遷移聯系人列表。
整個遷移過程分三步:測試(判斷 TiDB 是否滿足業務場景,性能是否 OK)、同步數據、切流量。
(1)測試:首先我們模擬線上的數據和請求對“聯系人列表”做了大量功能和性能的驗證,而且還將線上的數據和流量引到線下,對數據庫做了真實流量的驗證,測試結果證明 TiDB 完全滿足消息業務的需求。引流工作,我們是通過轉轉自研的消息隊列,將線上數據庫的流量引一份到測試環境。測試環境消費消息隊列的數據,轉換成數據庫訪問請求發送到 TiDB 測試集群。通過分析線上和測試環境兩個數據訪問模塊的日志可以初步判斷 TiDB 數據庫是否可以正常處理業務請求。當然僅僅這樣是不夠的,DBA 同學還需要校驗 TiDB 數據的正確性(是否與線上 MySQL 庫一致)。驗證思路是抽樣驗證 MySQL 庫表記錄和 TiDB 的記錄 Checksum 值是否一致。
(2)同步數據:DBA 同學部署 TiDB 集群作為 MySQL 實例的從庫,將 MySQL 實例中的聯系人列表(單實例分了 1024 個表)的數據同步到 TiDB 的一張大表中。
(3)切流量:切流量分為三步,每兩步之間都有一周左右的觀察期。
第一步將讀流量灰度切到 TiDB 上;
第二步斷開 TiDB 與 MySQL 的主從同步,業務開雙寫(同時寫 MySQL 和 TiDB,保證兩庫數據一致)確保業務流量可以隨時回滾到 MySQL;
第三步停止 MySQL 寫入,到此業務流量完全切換到 TiDB 數據庫上。
遷移過程中最重要的點就是確保兩個數據庫數據一致,這樣讀寫流量隨時可以切回 MySQL,業務邏輯不受任何影響。數據庫雙寫的方案與上文提到的引流測試類似,使用消息隊列引一份寫入流量,TiDB 訪問模塊消費消息隊列數據,寫庫。但僅僅這樣是不能保證兩個庫數據一致的,因為這個方案無法保證兩個寫庫操作的原子性。所以我們需要一個更嚴謹的方案,轉轉的消息隊列還提供了事務消息的支持,可以保證本地操作和發送消息的原子性。利用這一特性再加上異步補償策略(離線掃描日志,如果有失敗的寫入請求,修正數據)保證每個消息都被成功消費且兩個庫每次寫入結果都是一致的,從而保證了 MySQL 與 TiDB 兩個庫的數據一致。
2. 遇到問題
按照上述的方案,我們已經將消息所有的業務都切到 TiDB 數據庫上。遷移過程中也不都是順風順水,也遇到了問題,過程中也得到了 TiDB 官方團隊的大力支持。這里主要介紹兩個問題:
(1)TiDB 作為分布式存儲,其鎖機制和 MySQL 有很大不同。我們有一個并發量很大,可能同時更新一條記錄的場景,我們用了 MySQL 的唯一索引保證了某個 Key 值的唯一性,但如果業務請求使用默認值就會大量命中唯一索引,會造成 N 多請求都去更新統一同一條記錄。在 MySQL 場景下,沒有性能問題,所以業務上也沒做優化。但當我們用這個場景測試 TiDB 時,發現 TiDB 處理不太好,由于其使用的樂觀鎖,數據庫輸出大量的重試的日志。業務出現幾十秒的請求延遲,造成隊列中大量請求被拋棄。PingCAP 的同學建議調整 retry_limit 但也沒有完全生效(該 BUG 已經在 2.0 RC 5 已經修復),最后業務進行優化(過濾使用默認值的請求)后問題得到解決。
(2)第二個問題是運維方面的,DBA 同學按照使用 MySQL 的運維經驗,對一個上近 T 的表做了 Truncate操作,操作后,起初數據庫表現正常,但幾分鐘后,開始出現超時,TiKV 負載變高。最后請教 PingCAP 同學分析,定位是操作觸發了頻繁回收 Region 的 BUG(該 BUG TiDB 2.0 版本已經修復)。
線上效果對比*1. 隊列等待情況對比
使用 TiDB 數據庫,業務模塊隊列請求數基本保持 1 個,MySQL 會有較大抖動。
2. 請求延遲情況對比
使用 TiDB 數據庫,整體響應延時非常穩定,不受業務流量高峰影響,但 MySQL 波動很大。 另外在擴展性方面,我們可以通過無縫擴展 TiDB 和 TiKV 實例提升系統的吞吐量,這個特性 MySQL 是不具備的。
3. 業務延遲和錯誤量對比
接入 TiDB 數據庫后業務邏輯層服務接口耗時穩定無抖動,且沒有發生丟棄的情況(上圖錯誤大多由數據訪問層服務隊列堆積發生請求丟棄造成)。
TiDB 線上規模及后續規劃目前轉轉線上已經接入消息、風控兩套 OLTP 以及一套風控 OLAP 集群。?
集群架構如下:目前轉轉線上 TiDB 集群的總容量幾百 TB,線上 TiDB 表現很穩定,我們會繼續接入更多的業務(留言,評論、搜索、商品、交易等等)。
1. 后續規劃
多個正在開發的新業務在開發和測試環境中使用 TiDB,線上會直接使用 TiDB;
轉轉核心的留言、評論、搜索、商品、交易訂單庫計劃遷移到 TiDB,已經開始梳理業務,準備展開測試;
計劃在后續 TiDB 的使用中,TiKV 服務器池化,按需分配 TiKV 節點。
2. TiDB 使用成果
利用 TiDB 水平擴展特性,避免分庫分表帶來的問題,使得業務快速迭代;
TiDB 兼容 MySQL 語法和協議,按照目前線上 MySQL 使用規范,可以無縫的遷移過去,無需 RD 做調整,符合預期;
在數據量較大的情況下,TiDB 響應較快,優于 MySQL;
集群出現故障對用戶無感知;
TiDB 自帶了完善的監控系統,使得運維成本大大降低。
延展閱讀:TiDB 助力客如云餐飲 SaaS 服務
TiDB 在威銳達 WindRDS 遠程診斷及運維中心的應用
TiDB 在餓了么歸檔環境的應用
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/17753.html
摘要:而批處理,可以復用一條簡單,實現批量數據的寫入或更新,為系統帶來更低更穩定的耗時。批處理的簡要流程說明如下經業務中實踐,使用批處理方式的寫入或更新,比常規或性能更穩定,耗時也更低。 作者:陳維,轉轉優品技術部 RD。 開篇 世界級的開源分布式數據庫 TiDB 自 2016 年 12 月正式發布第一個版本以來,業內諸多公司逐步引入使用,并取得廣泛認可。 對于互聯網公司,數據存儲的重要性不...
閱讀 2104·2021-11-23 09:51
閱讀 3706·2021-10-20 13:49
閱讀 1710·2021-09-06 15:13
閱讀 1821·2021-09-06 15:02
閱讀 3169·2021-09-02 15:11
閱讀 895·2019-08-29 15:37
閱讀 1739·2019-08-29 13:24
閱讀 2279·2019-08-29 11:28