摘要:李飛飛花名飛刀,阿里巴巴集團副總裁,高級研究員,達摩院首席數據庫科學家,阿里云智能事業群數據庫產品事業部負責人,杰出科學家。是阿里云的云原生數據庫,目前已有非常深厚的技術積累。 阿里妹導讀:云計算大潮來襲,傳統數據庫市場正面臨重新洗...
摘要:類型說明根據中的說明,數據類型是用來存儲數據的。它們幾乎接受完全相同的值集合作為輸入。該結構是非強制的,但是有一個可預測的結構會使集合的查詢更容易。如中,表示在和這兩個位置出現過,在中這些位置實際上就是元組的行號,包括數據塊以及。 js...
摘要:我們通常會說我們要做一個分布式數據庫,自動彈性伸縮,能解決分庫分表的問題,你會用嗎用戶說那肯定啊,現在的分庫分表太痛苦了。在軟件開發領域有一條非常經典的哲學。作為一個分布式數據庫,每一層的穩定性都非常重要。 本文根據我司 CEO 劉奇在第 ...
摘要:奇技指南現有的開源時序數據庫只支持單機運行,在面臨大量數據寫入時,會出現查詢慢,機器負載高,單機容量的限制。為了解決這一問題,基礎架構團隊在單機的基礎上,開發了集群版簡述是一個分布式時間序列數據庫,用于處理海量數據寫入與查詢。 奇技指...
摘要:索引的原理與應用索引類型,存儲結構與鎖在數據結構與算法索引一節中,我們討論了這樣的文件索引以及全文索引的基礎算法,本文則會針對文件索引在關系型數據庫中的實際應用進行探討。這個索引的是數據表的主鍵,因此表數據文件本身就是主索引。 showIm...
摘要:作者張學程本文為源碼閱讀系列文章的第六篇,在上篇文章中我們介紹了處理單元的實現,對在增量復制過程中的讀取過濾路由轉換以及執行等邏輯進行了分析。值得注意的是,由于我們近期正在對處理單元進行重構,因此源碼中會同時包含重構前后的相關代碼實現...
摘要:業務需求統計每小時的數數據采集數據清洗用來描述將數據從來源端經過抽取轉換加載至目的端的過程字段過濾字段補全用戶信息商品信息字段格式化數據分析將數據導出介紹由開源的用于解決海量結構化日志的數據統計的項目本質將轉化為程序的其實時上的目錄和...
摘要:微服務架構催生分布式數據庫王濤認為,談論數據庫一定脫離不了應用。巨杉數據庫,適合微服務的分布式數據庫正如同巨杉對于分布式數據庫的技術定位和目標,巨杉數據庫本身就是以分布式存儲底座與上層的數據庫實例兩層來進行構建的。 過去幾年來,微服...
摘要:作者屈鵬本篇源碼解析將為大家介紹的另一周邊組件。這個函數會往完成隊列中注冊若干個,相當于用往一個中注冊一些事件的關注。在函數返回之后,服務端的初始化及啟動過程便結束了。 作者:屈鵬 本篇 TiKV 源碼解析將為大家介紹 TiKV 的另一周邊組件—...
摘要:基于部署數據庫初始化數據庫進入鏡像配置用戶密碼導入數據進入容器檢查導入結果創建數據庫初始化進入容器 基于docker部署數據庫 sudo docker pull influxdbsudo docker pull mongo sudo docker run -p 27017:27017 -v xxx:/xxx--name xxxx -d mongo:la...
摘要:行轉列,列轉行行列轉換在做報表分析時還是經常會遇到的,今天就說一下如何實現行列轉換吧。列轉行假設我們有下表語文數學英語通過即可得到如下結果我們也可以使用下面方法得到同樣結果語文語文數學數學英語英語 SQL 行轉列,列轉行 行列轉換在做報表...
摘要:最近遇到一個在級別下的死鎖問題,感覺有點意思,研究了一下,做個記錄。比如等都會給涉及到的行加上行鎖,防止其他事務的操作間隙鎖在隔離級別下,為了防止幻讀現象,除了給記錄本身,還需要為記錄兩邊的間隙加上間隙鎖。至此,死鎖過程分析完畢還沒完...
摘要:在執行耗時命令如范圍掃描類的超大下的等瞬時大量過期驅逐等情況下,會造成的下降,阻塞其他請求。 本文主要從實現角度分析了redis lazy free特性的使用方法和注意事項 有幫助的話就點個贊,關注專欄數據庫,不跑路吧~~不定期更新數據庫的小知識和實...
摘要:是基于開源的兼容協議的強一致性的數據庫開源項目。這種架構類似于公司的第一代的系統,系統本身也是一個強一致性的高可用的分布式系統。由于篇幅所限,本文中關于強一致性線性一致性的很多技術細節的闡述未能詳盡,擬另行成文討論。 作者介紹:陳東明...
摘要:今天,,云原生計算基金會技術監督委員會宣布已經投票決議通過,正式將從沙箱項目晉級至孵化項目。晉級為孵化項目之后,將與其他項目一道,成為與其技術利益一致的中立的基金會的一部分,享有基金會為其提供的治理市場和社區推廣等權益。 今天,CNCF(...
摘要:引導優化器按照哈希掃描的方式從表中讀取數據。告訴優化器強制選擇位圖索引。這個提示會使優化器合并表上的多個位圖索引,而不是選擇其中最好的索引這是提示的用途。還可以使用指定單個索引對于指定位圖索引,該提示優先于提示。 一、提示(Hint)概述...
摘要:組件用于收集的,并準實時同步給下游,如等。為方便用戶和開發者更加深入理解和使用組件,以及基于組件做二次開發用于更多的業務場景,我們決定今天正式開源組件。近期我們將發布源碼閱讀指南,敬請期待。 TiDB Binlog 組件用于收集 TiDB 的 binlog,...
摘要:作者本文為源碼閱讀系列文章的第五篇。上篇文章介紹了和兩個數據同步處理單元的設計實現,對核心實現數據導入并發模型數據導入暫?;蛑袛嗟幕謴瓦M行了分析。根據庫表路由規則對庫表名進行轉換,用于合庫合表。遇到或者積累的數量超過配置的數量立即執行...
摘要:阿里妹導讀近日,螞蟻金服副胡喜應邀做了螞蟻金服十五年技術架構演進之路的演講,分享螞蟻金服對金融科技未來的判斷,并首次對外公開螞蟻金服技術人才培訓體系以及項目。 showImg("https://segmentfault.com/img/remote/1460000019158592"); 阿里妹導...
摘要:用動態規劃決定連接的執行順序,當參與連接的表數量不多于時啟用。在邏輯優化階段消除聚合函數時特殊處理,防止產生錯誤的執行結果。該特性通過對進行執行計劃綁定,以確保執行穩定性。執行引擎支持對和算子進行內存追蹤控制。 2019 年 5 月 10 日,Ti...
摘要:提升系統性能算子,進一步提升執行性能。采用存儲結構減少內存分配及拷貝,的共享提升命中率等手段大幅提升性能。新增系統配置項合法性檢查,優化系統監控項等,提升產品易用性。在此對各位貢獻者表示由衷的感謝。 作者:段兵 2019 年 5 月 10 日,TiD...
摘要:正是存在問題,促使我們考慮引入數據庫審核平臺。的確,與很多互聯網公司相比,數據庫數十套的估摸并不是太大但與互聯網類公司不同,類似宜信這類金融類公司對數據庫的依賴性更大,大量的應用是重數據庫類的,且其使用復雜程度也遠比互聯網類的復雜。 ...
ChatGPT和Sora等AI大模型應用,將AI大模型和算力需求的熱度不斷帶上新的臺階。哪里可以獲得...
大模型的訓練用4090是不合適的,但推理(inference/serving)用4090不能說合適,...
圖示為GPU性能排行榜,我們可以看到所有GPU的原始相關性能圖表。同時根據訓練、推理能力由高到低做了...