摘要:當時自己在本地測試搭建集群后,給分配了另外一個任務就是去了解中的自帶分詞英文分詞中文分詞的相同與差異以及自己建立分詞需要注意的點。還有就是官網的文檔了,非常非常詳細,還有,版本的是有中文的官方文檔,可以湊合著看。
前提
人工智能、大數據快速發展的今天,對于 TB 甚至 PB 級大數據的快速檢索已然成為剛需,大型企業早已淹沒在系統生成的浩瀚數據流當中。大數據技術業已集中在如何存儲和處理這些海量的數據上。Elasticsearch 作為開源領域的后起之秀,從2010年至今得到飛躍式的發展。 Elasticsearch 以其開源、分布式、RESTFul API 三大優勢,已經成為當下風口中“會飛的豬”。
在我的電腦本地寫了幾篇 ElasticSearch 的源碼解析了,回過頭來想想應該也寫一篇為何我會去看它的源碼?
為什么呢?下面我講講自己從接觸搜索到現在看源碼的過程!
關注我轉載請務必注明原創地址為:http://www.54tianzhisheng.cn/2018/08/24/why-see-es-code/
第一次接觸搜索搜索,我們首先想到的是搜索引擎:Google、百度,這個就算是接觸的最早的了。
我自己項目里面接觸搜索是大二暑假那時練習的一個項目,里面用了 Solr,然后當時自己也稍微了解了下,并用在了項目里面。
第二次接觸搜索從第一次項目里面用到了搜索,后面自己對這方面就比較感興趣。再一次接觸搜索是實習的時候進公司。第一件事情就是被老大叫的去學習搭建 Elasticsearch 集群,于是乎,電腦就裝了三個虛擬機,Elasticsearch 就一個個的裝了起來了。也記錄了博客下來:Elasticsearch 系列文章(二):全文搜索引擎 Elasticsearch 集群搭建入門教程,當時搭建的時候 ES 的版本才剛從 2.x 升級到 5.x 呢,截止本文時間 2018.08.04,現在 ES 版本已經是到 7.0 了,這版本升級是真的的快,這也說明了 ES 的活躍度很高,背后的開發工程師維護也快,側面突出要去看它源碼的重要性。
當時自己在本地測試搭建集群后,給分配了另外一個任務就是去了解 ES 中的自帶分詞、英文分詞、中文分詞的相同與差異、以及自己建立分詞需要注意的點。于是乎:當時在公司 wiki 貢獻了這篇文章:Elasticsearch 系列文章(一):Elasticsearch 默認分詞器和中分分詞器之間的比較及使用方法。這篇文章幾乎已經把市面上所有的分詞都寫進去了,包括他們的相同點、不同點、如何使用、如何自定義分詞器。
然后還有就是我同組的一個同學,她的任務就是 2.x 升級到 5.x 中 mapping 的大改變有哪些?后面我也看了她總結的文檔,很詳細!
在這次接觸了 ES 后,因為我自己本地已經有環境了,所以自己測試了一些功能,給 ES 安裝插件(IK、x-pack、支持 sql 的、),后面自己也去測試 ES 的索引、文檔、REST API。
第三次接觸搜索由于是自己對其感興趣,所以后面就去找了些相關的視頻,比如:中華石衫的《Elasticsearch 頂尖高手系列-高手進階篇》幾個系列視頻教程個人感覺還是不錯的,看完這幾個系列估計入門肯定是沒有問題的。版權原因,不提供下載鏈接。
另外就是《Elasticsearch 權威指南》翻譯的版本,翻譯還沒有全,可以去看看,講得很詳細的,市面上應該還沒有哪本書講的有這么清楚,如果英文不錯的可以直接啃英文吧。
還有就是官網的文檔了,非常非常詳細,還有 demo,2.x 版本的是有中文的官方文檔,可以湊合著看。
學習新東西,要學會先看官方文檔,何況 Elasticsearch 的官方文檔這么詳細呢!
第四次接觸搜索后面實習的時候,又分配了公司中間件監控的兩個模塊:Elasticsearch 和 HBase 組件的監控。于是乎,再次有機會接觸 Elasticsearch 了,這次主要還是利用 Elasticsearch 自帶的 REST API :_cluster/health 、_cluster/stats、_nodes、_nodes/stats 去獲取到集群的健康信息、節點信息(內存、CPU、網絡、JVM等信息)。為了做這個項目自己當時也去找了網上很多類似的文章參考常用的監控指標和他們是怎么做監控的。我當時的任務主要還是采集信息,然后存到公司大項目的 influxdb 中,最后用 grafana 展示出來,后面我組的運維大佬給我看了監控大盤,界面挺酷炫的,哈哈哈,牛逼!
當時寫的兩篇博客:
1、Elasticsearch 系列文章(三):ElasticSearch 集群監控
2、Elasticsearch 系列文章(四):ElasticSearch 單個節點監控
取之網絡,還之網絡,希望給后面做類似任務的小伙伴給點參考意見!
再就是自己搭建 ELK(ElasticSearch, Logstash, Kibana)日志分析平臺,然后玩了下!
搭建環境博客:Elasticsearch 系列文章(五):ELK 實時日志分析平臺環境搭建
第五次接觸搜索后面就沒怎么接觸 ElasticSearch 了,一直忙著其他的東西。
實習辭職后,畢業出來找工作的那段日子,自己又花了一星期稍微過了一遍 《Elasticsearch 權威指南》 這本書,話說還幫我面試挺過不少關呢,哈哈哈!因為我項目里寫了 Elasticsearch 的監控,如果你對 Elasticsearch 其他的不熟悉,面試官稍微問些其他關于這方面的,那就不知道就有點尷尬
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/76908.html
摘要:前提之前在源碼閱讀環境搭建文章中寫過我遇到的一個問題遲遲沒有解決,也一直困擾著我。然后后面自己分享文章在掘金也發現有人和我有同樣的問題。下面講講另一種可以讓你繼續看源碼的方法。配置新建一個遠程的配置如下圖接下來點擊就好了。 前提 之前在源碼閱讀環境搭建文章中寫過我遇到的一個問題遲遲沒有解決,也一直困擾著我。問題如下,在啟動的時候解決掉其他異常和報錯后,最后剩下這個錯誤一直解決不了: [...
摘要:總結這篇文章主要先把大概啟動流程串通,因為篇幅較多所以拆開成兩篇,先不扣細節了,后面流程啟動文章寫完后我們再單一的扣細節。 關注我 showImg(https://segmentfault.com/img/remote/1460000012730965?w=258&h=258); 轉載請務必注明原創地址為:http://www.54tianzhisheng.cn/2018/08/11/...
閱讀 2595·2021-11-17 09:33
閱讀 3936·2021-10-19 11:46
閱讀 910·2021-10-14 09:42
閱讀 2252·2021-09-22 15:41
閱讀 4204·2021-09-22 15:20
閱讀 4628·2021-09-07 10:22
閱讀 2302·2021-09-04 16:40
閱讀 811·2019-08-30 15:52