{eval=Array;=+count(Array);}
分布式處理,分布式系統(其實也包含分布式存儲系統)一直把RAS、MTBF、MTTR等作為可靠性衡量指標,但是專業指標是CAP指標,可用性作為其中重要因素之一。CAP理論闡述了在分布式系統的設計中,沒有一種設計可以同時滿足一致性,可用性和分區容錯性。所以一個好的分布式系統,必須在架構上充分考慮上述指標。
分布式系統設計中,BASE理論作為CAP理論的折中或延伸,在分布式系統中被大量使用。分布式系統的可靠性競爭力的建設,似乎更多要依托上層軟件能力體現(主要原因可能也是基于便宜的X86通用服務器,硬件最求的就是便宜),如數據多副本、EC糾刪碼(跨節點存放數據,多節點故障容忍等),數據Scrub校驗、ECC,存儲池故障域隔離、數據快速修復等等。方案層面的可靠性也尤為重要,數據異地復制容災,數據Multiple Available Zone、Region等,這些是分布式系統擴展,可靠性,和可用性的基礎。
在系統特性或差異化競爭中,也要緊跟技術趨勢,提高產品競爭力,所以必須考慮VNMe,SCM,SPDK,DPDK技術支持,同時讓自己的分布式存儲具備數據上云的災備能力,讓客戶數據按照冷熱策略流動,具備彈性擴展的能力。
如果一個分布式存儲系統都具備這樣的能力,可以說在整個存儲市場中引領行業趨勢,并能滿足99%左右的場景和客戶需求。
分布式存儲這兩年的研究趨勢主要是效率、可擴展性和性能這三方面。效率的興起得利于云存儲的大行其道,云存儲的投入一般比較大,所以成本的控制就很重要了,不論是Amazon、七牛還是其他廠商,都希望存儲的成本盡可能低,因此虛擬化存儲、Erasure Code和Deduplication還有一些研究人員投入精力;可擴展性這個方向投入的人就比較多了,這點從FAST/OSDI/SOSP等會議就能看得出來,主要是規模的擴展和移動平臺的擴展,大數據時代,數據人人有,存儲需求變大,原來的解決方案在這種規模下比較吃力,因此有了Haystack這樣的系統,移動平臺就更有花樣了,這點從蘋果iOS/Android存儲文件系統的迭代也可窺一斑;性能是個永恒的話題,總有需求不嫌性能高,曾經聽過某金融機構希望存儲能像內存一樣快,當然這也是可能的,于是Flash存儲相變存儲也就流行起來了,這也是各大會議一大主題。還有一個研究方向是功耗,個人覺得這個相對次要一些,有些偽命題的色彩。分布式處理大的方向主要還是規模和效率,支持更大的數據和更快的計算速度,內存計算現在就非常火,也比較有前途。
2
回答3
回答1
回答2
回答5
回答3
回答10
回答8
回答3
回答2
回答