ElasticSearch - 文檔存儲

XGBCCC 發(fā)布于2019-08-16 11:02 / 2770人閱讀

摘要：節(jié)點使用文檔的確定文檔屬于。將文檔返回給，然后將文檔返回給客戶端。如果文檔已經(jīng)被另一個進程修改沖突，它會重試步驟，超過次后放棄。當一個子請求操作成功時，并行轉發(fā)新文檔或刪除到，然后執(zhí)行下一個子請求。

shard

確定shard的公式：

shard = hash(routing) % number_of_primary_shards

routing 默認是文檔的 _id ，也可以設置成一個自定義的值。

因此要在創(chuàng)建索引的時候就確定好主分片的數(shù)量，并且永遠不會改變這個數(shù)量，因為如果數(shù)量變化了，那么所有之前路由的值都會無效。

每個節(jié)點都知道集群中任一文檔位置，所以可以直接將請求發(fā)到任意節(jié)點。當然，為了擴展負載，更好的做法是輪詢發(fā)送集群中所有的節(jié)點。

shard、replica同步 新建、索引或者刪除請求

步驟：

戶端向 Node 1 發(fā)送新建、索引或者刪除請求。

節(jié)點使用文檔的 _id 確定文檔屬于shard 0 。請求會被轉發(fā)到 Node 3（因為shard 0 被分配在 Node 3 上）。

Node 3 在shard 0上面執(zhí)行請求。如果成功了，它將請求并行轉發(fā)到 Node 1 和 Node 2 的replica R0上。一旦所有的R0都報告成功, Node 3 將向Node 1報告成功，Node 1向客戶端報告成功。

查詢請求

步驟：

客戶端向 Node 1 發(fā)送查詢請求。

node 1使用文檔的 _id 來確定文檔屬于shard 0 。replica 0 存在于Node 1、Node 2上。這種情況下，每次請求都會輪詢路由Node 1、Node 2，這里假設路由到Node 2。

Node 2將文檔返回給Node 1 ，然后Node 1將文檔返回給客戶端。

注意：
在文檔被檢索時，已經(jīng)被索引的文檔可能已經(jīng)存在于shard上但是還沒有復制到replica。即強一致性無法保證，但最終一致性可以保證。

更新請求

POST /{index}/{type}/{id}/_update

步驟略。
注意：
Node 3 從P0檢索文檔，修改 _source 字段中的 JSON ，并且嘗試重新索引主分片的文檔。如果文檔已經(jīng)被另一個進程修改（_version沖突），它會重試步驟 3 ，超過 retry_on_conflict 次后放棄。
如果 Node 3 成功地更新文檔，它將新版本的文檔并行轉發(fā)（新建、索引或者刪除請求的步驟里轉發(fā)的是請求而不是文檔）到 Node 1 和 Node 2 上的R0，重新建立索引。一旦所有R0都返回成功，Node 3 向Node 1返回成功，Node 1向客戶端返回成功。

為什么要轉發(fā)文檔而不是請求？
因為轉發(fā)請求是異步的，不能保證到達replica的順序，若轉發(fā)更新請求，則可能以錯誤的順序應用更改，導致得到損壞的文檔。而轉發(fā)文檔，則replica可以直接根據(jù)_version來獲取最大版本號的文檔。

批量請求（_mget 、_bulk）

bulk步驟：

客戶端向 Node 1 發(fā)送 bulk 請求。

Node 1 為每個命中的shard創(chuàng)建一個批量請求，并將這些請求并行轉發(fā)到每個包含該shard的節(jié)點。

shard按順序（請求報文體中的子請求順序）執(zhí)行每個操作。當一個子請求操作成功時，shard并行轉發(fā)新文檔（或刪除）到replica，然后執(zhí)行下一個子請求。一旦所有的子請求的replica向shard報告完成（無論執(zhí)行是否成功），該shard將向node 1報告，node 1將這些響應收集整理并返回給客戶端。

可選的請求參數(shù)

consistency

解決分布式腦裂問題，參數(shù)的值可以設為 one （只要該index的shard狀態(tài) ok 就允許執(zhí)行_寫_操作）,all（必須要該index的shard和多個replica的狀態(tài)沒問題才允許執(zhí)行_寫_操作）, 或 quorum （默認值）。

# quorum 即大于一半的分片，注意，number_of_replicas是primary shard對應的replica數(shù)量，不是全部replica數(shù)量
int( (primary + number_of_replicas) / 2 ) + 1

注意：新索引默認有 1 個replica，這意味著為了滿足consistency至少需要兩個活動的node。這就會阻止我們在單一node上做任何事情。為了避免這個問題，ES要求只有當 number_of_replicas 大于1的時候，consistency策略才會執(zhí)行。

timeout
如果沒有足夠的replica，Elasticsearch會等待，直到滿足consistency策略。默認最多等待1分鐘。你可以使用 timeout 參數(shù) 使它更早終止： 100 是100毫秒，30s 是30秒。

一個Lucene索引在Elasticsearch稱作shard。一個Elasticsearch索引是shard的集合。

ElasticSearch 存儲文檔文檔存儲服務存儲doc文檔云存儲存儲文檔哪個云

文章版權歸作者所有，未經(jīng)允許請勿轉載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉載請注明本文地址：http://specialneedsforspecialkids.com/yun/70946.html

Elasticsearch學習上手（二）

摘要：序列化被大多數(shù)編程語言所支持，并且已經(jīng)成為領域的標準格式。通過索引對文檔的進行創(chuàng)建查詢修改和刪除等操作。請求的結構調整為不再使用請求使用這個存儲這個文檔，而是使用請求存儲文檔在這個命名空間下。在安裝elasticsearch之后，我們就要開始進行操作實踐，那么在實踐之前，我們首先了解下elasticsearch的幾個概念面向文檔相對關系型數(shù)據(jù)庫，是采用行和列的形式進行存儲數(shù)據(jù)，e...

stdying 2019-08-15 10:48 評論0 收藏0

發(fā)表評論

登陸后可評論

0條評論

XGBCCC

男|高級講師

我要關注我要私信

TA的文章

如何安裝tensorflow庫

閱讀 1966·2023-04-25 16:19
35歲以后依然被公司搶著要？4面字節(jié)跳動，完虐面試官年薪70w，圖形化app開發(fā)工具

閱讀 3091·2021-11-24 09:39
Alpha階段測試報告

閱讀 829·2021-11-16 11:44
浮動

閱讀 1688·2019-08-29 12:52
圖解尾調用優(yōu)化

閱讀 1138·2019-08-26 13:33
react項目配置babel7

閱讀 1073·2019-08-26 10:26
深入了解瀏覽器存儲--從cookie到WebStorage、IndexedDB

閱讀 2200·2019-08-23 16:42
React入門系列 - 1 開發(fā)環(huán)境搭建

閱讀 2567·2019-08-23 14:37

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

ElasticSearch - 文檔存儲

相關文章

Elasticsearch學習上手（二）

發(fā)表評論

0條評論

XGBCCC

男|高級講師

TA的文章

如何安裝tensorflow庫

35歲以后依然被公司搶著要？4面字節(jié)跳動，完虐面試官年薪70w，圖形化app開發(fā)工具

Alpha階段測試報告

浮動

圖解尾調用優(yōu)化

react項目配置babel7

深入了解瀏覽器存儲--從cookie到WebStorage、IndexedDB

React入門系列 - 1 開發(fā)環(huán)境搭建

最新活動