數據湖分析(USQL)是一種可擴展性強,成本低廉的無服務器的SQL分析計算引擎,用戶可輕松完成面向海量數據的數據建模工作,極大降低用戶使用大數據的門檻,從而使用戶使用所熟悉的SQL專注于業務數據,無需數據庫管理員和運維人員,大幅度減少對大數據開發工程師的依賴。
USQL是一款Serverless的數據分析產品,擁有一鍵啟動、開箱即用的特性,幫助您擺脫運行后端應用程序所需的服務器搭建、設置和管理工作。
您只需根據數據分析量費,不使用不收費,為您節約成本和人力支出。相較原有數倉ETL分析及自建Hadoop集群分析,USQL可將計算成本降低99%,將分析效率提升21.6倍。
USQL采用存儲、計算相分離的模式,支持在您讀取數據時靈活定義、修改數據結構,解決了傳統數據倉庫寫入時定義數據結構帶來的局限性。
您無需掌握Hadoop、Spark等大數據技術,只需學會使用SQL就可完成數據查詢、提取工作。
特性 | USQL | 傳統方式 |
---|---|---|
簡化操作流程 | 數據源 → UFILE → USQL → 應用數據 | 數據源 → 數據庫 → ETL → 數倉 → 存儲 → 應用數據 |
數據格式豐富 | 讀取時定義數據結構,支持關聯分析JSON、ORC、CSV、PARQUET、GZIP、TAR格式存儲的結構化數據 | 寫入時定義數據結構,無法進行不同格式的結構化數據關聯分析 |
高性能高效率 | USQL采用全內存計算,支持GB-PB量級數據分析,10GB級數據分析秒級完成 | 導入數據耗時久,分析數據受性能限制,GB級數據分析需數分鐘至數小時 |
一鍵啟動,開箱即用 | 開箱即用,操作簡單,零管理成本,零啟動時間 | 需要自建搭建集群,配置基礎服務 |
計算存儲分離 | 采用Shared Disk架構,純內存計算SQL引擎,不帶任何存儲功能 | 計算存儲不完全分離,需要緩存數據 |
數據遷移成本低 | 靈活兼容數據存儲方式,只需將現有數據放入ufile中,就可使用DDL&SQL查詢 | 數據遷移工作量大,需要提前定義數據結構,進行數據清洗, |
使用USQL產品,對原有數據文件改動較小,用戶不用關注大數據分布式處理的過程,業務遷移方便。 對比我們現有的大數據處理方案,節省80%的服務器成本,提升50%數據分析速度,同時也縮短了新業務的開發周期,值得推薦。
案例詳情