摘要:是什么呀是一個和不太一樣的數(shù)據(jù)庫。懷疑是同時聯(lián)了四個集合的數(shù)據(jù)造成的。這本書的定位是和的應(yīng)用,所以有意弱化了數(shù)據(jù)庫的搭建維護和底層優(yōu)化。所以本書可能不適合數(shù)據(jù)庫工程師。
這篇文章沒有代碼,請放心閱讀。
程序員最寶貴的東西是生命,生命屬于程序員只有一次。一個程序員的一生應(yīng)該這樣度過:當(dāng)她回首往事的時候,她不會因為搭建環(huán)境浪費時間而悔恨,也不會因為集群無法運行而羞恥。這樣,在她開發(fā)的時候,她能夠說:“我的整個生命和全部精力,都已經(jīng)獻(xiàn)給了開發(fā)中最重要的事情——設(shè)計程序,實現(xiàn)程序和調(diào)Bug。” ——P醬。
P醬是公司新來的實習(xí)生妹子。聽說是一個文科生。文科生應(yīng)該會去文案組或者策劃組吧。什么?來數(shù)據(jù)組?讓我來帶?
于是我和P醬生活工作在了一起。
“我叫P醬,在XX大學(xué)讀研二,愛好是拍照和被拍,大家可以在B站找到我跳舞的視頻,比如av170001。我的另外一個愛好是寫代碼……”
當(dāng)一個文科妹子說自己喜歡寫代碼的時候,整個辦公室熱鬧了起來。
“P醬,聽說你喜歡寫代碼,那你寫過什么東西嗎?”新人介紹會議結(jié)束以后,我問P醬。
“一般都是各種分析程序,我們的專業(yè)要做很多調(diào)查報告,他們都是用Excel來計算的。我喜歡用Python來把這些統(tǒng)計過程自動化。后來也寫過自動寫詩的程序、鬼畜視頻生成器等等。”
“真不敢相信你是文科生。這么說你的興趣是數(shù)據(jù)分析方向咯?”
“其實我對師父你做的爬蟲很有興趣。但是聽說會經(jīng)常和網(wǎng)站發(fā)生對抗?女孩子還是不要打打殺殺的好~”
于是我讓P醬負(fù)責(zé)對爬蟲的原始數(shù)據(jù)進(jìn)行清洗、整理并做簡單的分析。
一種船新的數(shù)據(jù)儲存方式“P醬,爬蟲抓到的原始數(shù)據(jù)是存放在MongoDB里面的,你的Python還不錯吧,你試一試用Python來讀寫MongoDB看看。”
“MongoDB是什么呀?”
“是一個和MySQL不太一樣的數(shù)據(jù)庫。”
“MySQL我知道,MongoDB和MySQL有什么不一樣呢?”
“我舉個例子,當(dāng)你要插入數(shù)據(jù)的時候,你需要做的,就是‘插入’。咳咳,你不要臉紅,我是指你不需要寫SQL語句、不需要建表、不需要提前定義字段。僅僅只需要一行代碼就能夠?qū)崿F(xiàn)了。我這里給你寫了一篇文檔,講到了MongoDB的增刪改查,你試一試。數(shù)據(jù)庫已經(jīng)給你搭建好了,你直接連上去用吧”
半天以后。
“師父,我已經(jīng)會使用MongoDB啦。”
“你讀爬蟲的原始數(shù)據(jù),主要涉及到的就是查詢操作,為了鞏固插入、修改和刪除的操作,再給你一個小任務(wù)吧。試一試寫一個人員管理系統(tǒng)吧。”
既然有關(guān)系,就整整齊齊放在一起看吧“P醬,你看起來很高興的樣子啊。”
“因為我覺得MongoDB比起MySQL太簡單了啊~”
“你確定?那我看看你怎么對整行數(shù)據(jù)去重的?”
“師父,我知道distinct關(guān)鍵字可以對一個字段去重。但是整行數(shù)據(jù)我是讀出來用Python來去重的。”
“這個時候你就要用到MongoDB的聚合查詢了。文檔已經(jīng)給你寫好了,拿去看吧。”
“還有還有,這里你把店鋪信息和菜單信息放在了兩個集合里面,我怎么樣才能把他們聯(lián)表查詢出來呢?”
“聯(lián)表查詢是MySQL里面的操作,在MongoDB里面,沒有表,只有集合,所以叫做聯(lián)集合查詢更恰當(dāng)一些。這也是要用到聚合查詢,也在這個文檔里面了。”
再給你一個玩具吧。“P醬,之前讓你做的爬蟲數(shù)據(jù)監(jiān)控系統(tǒng)怎么樣了?”
“功能已經(jīng)做好了,但是有一個地方查詢起來特別慢。我已經(jīng)加過索引了,但還是很慢。懷疑是同時聯(lián)了四個集合的數(shù)據(jù)造成的。”
“這邊的數(shù)據(jù)實際上每小時才更新一次,你沒有必要每次刷新頁面都去查詢MongoDB的。我覺得是時候讓你用一下Redis做緩存了。”
“Redis就是那個內(nèi)存數(shù)據(jù)庫嗎?我知道我知道。”
“給你寫了一份文檔,包含Redis里面的各種數(shù)據(jù)類型和使用方式。你試一試把Redis和MongoDB結(jié)合起來看看能不能提高速度。”
你怎么擅自加功能啊!“P醬,你怎么在爬蟲監(jiān)控系統(tǒng)的網(wǎng)頁上加了一個廣播窗口?”
“呀,被師父發(fā)現(xiàn)了。因為我想到同一個爬蟲可能會被幾個人監(jiān)控,所以就用Redis的發(fā)布訂閱功能做出來了這個廣播的功能。一旦爬蟲狀態(tài)發(fā)生改變,所有人都能收到推送。”
“既然你這么閑,那不如加上賬號登錄功能,把權(quán)限驗證也做上去?不同的人只能看到自己負(fù)責(zé)的爬蟲。順便你可以試一試用Redis實現(xiàn)……”
“實現(xiàn)布隆過濾器和Session管理是嗎?”
“你怎么知道我要說什么?”
“因為我早上看到你在文檔上面更新了布隆過濾器和Session管理相關(guān)的內(nèi)容啊~”
紅色的鎖?“師父師父,你知道什么是RedLock嗎?”
“你學(xué)得這么快?都知道RedLock了?RedLock是Redis官方給出的分布式鎖的算法。已經(jīng)有很多編程語言實現(xiàn)它了。”
“原來RedLock只是一個算法啊……”
為什么我學(xué)的這么快呢?“師父師父,我覺得很奇怪啊,為什么MongoDB和Redis我學(xué)得這么快呢?難道是因為他們本來就簡單?還是因為我太聰明了?”
“為什么你不說是因為你師父教的好呢?“
“因為這是事實啊~不用我說出來~”
“咳咳,實際上是因為兩個原因。一是你一直通過項目驅(qū)動來學(xué)習(xí),先有需求,然后再去學(xué)習(xí)實現(xiàn)這個需求所要涉及到的技能。所以你知道你學(xué)的東西能用來干什么,自然就能學(xué)得快……”
“那第二個原因是什么呢?”
“第二個原因,我先問你一個問題,你會搭建Redis集群嗎?會搭建MongoDB集群嗎?知道什么叫做哨兵嗎?你知道如何優(yōu)化MongoDB的啟動參數(shù)嗎?”
“這…………好像都不知道額…………”
“因為你的角色是數(shù)據(jù)工程師,不是數(shù)據(jù)庫工程師,所以數(shù)據(jù)庫搭建、底層優(yōu)化這些內(nèi)容我都給你跳過了。”
“這些聽起來都很重要啊,師父你會教我嗎?”
“你想經(jīng)常值夜班嗎?想半夜3點被人打電話叫起來修數(shù)據(jù)庫嗎?認(rèn)清自己的定位啊,數(shù)據(jù)庫工程師的技能當(dāng)然很重要,但你是要成為數(shù)據(jù)工程師的人,技能樹應(yīng)該點在合適的方向。”
后記后來,P醬成了別人的女朋友。
幸好我還有左手和右手,于是我把我給P醬總結(jié)的文檔編撰成了《左手MongoDB,右手Redis——從入門到商業(yè)實戰(zhàn)》這本書。本書現(xiàn)在已經(jīng)在京東、亞馬遜、淘寶上架。
這本書的定位是MongoDB和Redis的應(yīng)用,所以有意弱化了數(shù)據(jù)庫的搭建、維護和底層優(yōu)化。所以本書可能不適合數(shù)據(jù)庫工程師。
希望本書能夠給那些一直想掌握MongoDB、Redis,但是又不知道從何處下手的讀者,提供一個學(xué)習(xí)的方向。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/19474.html
摘要:是什么呀是一個和不太一樣的數(shù)據(jù)庫。懷疑是同時聯(lián)了四個集合的數(shù)據(jù)造成的。這本書的定位是和的應(yīng)用,所以有意弱化了數(shù)據(jù)庫的搭建維護和底層優(yōu)化。所以本書可能不適合數(shù)據(jù)庫工程師。 這篇文章沒有代碼,請放心閱讀。 程序員最寶貴的東西是生命,生命屬于程序員只有一次。一個程序員的一生應(yīng)該這樣度過:當(dāng)她回首往事的時候,她不會因為搭建環(huán)境浪費時間而悔恨,也不會因為集群無法運行而羞恥。這樣,在她開發(fā)的時候,...
摘要:例如現(xiàn)在的入門學(xué)習(xí)手記系列。收到粉絲留言和打賞的喜悅。安裝上一篇入門學(xué)習(xí)手記一,主要是介紹了的核心概念,是整個學(xué)習(xí)過程的基礎(chǔ)知識。新生成的類似如下入門學(xué)習(xí)手記因為生成的內(nèi)容過多,我直接省略掉了。 showImg(https://segmentfault.com/img/bVbk5Nd?w=1150&h=599); 本人微信公眾號:前端修煉之路,歡迎關(guān)注。 最近開始想要維護一個個人的公眾...
摘要:前言開發(fā)爬蟲是一件有趣的事情。的可配置爬蟲是基于的,因此天生是支持并發(fā)的。遵守協(xié)議這個默認(rèn)是開啟的。的可配置爬蟲降低了爬蟲的開發(fā)時間,增加了爬蟲開發(fā)效率,完善了工程化水平,將爬蟲工程師從日常的繁瑣配置工作中解放出來。 前言 開發(fā)爬蟲是一件有趣的事情。寫一個程序,對感興趣的目標(biāo)網(wǎng)站發(fā)起HTTP請求,獲取HTML,解析HTML,提取數(shù)據(jù),將數(shù)據(jù)保存到數(shù)據(jù)庫或者存為CSV、JSON等格式,再...
摘要:前言開發(fā)爬蟲是一件有趣的事情。的可配置爬蟲是基于的,因此天生是支持并發(fā)的。的可配置爬蟲降低了爬蟲的開發(fā)時間,增加了爬蟲開發(fā)效率,完善了工程化水平,將爬蟲工程師從日常的繁瑣配置工作中解放出來。前言 開發(fā)爬蟲是一件有趣的事情。寫一個程序,對感興趣的目標(biāo)網(wǎng)站發(fā)起HTTP請求,獲取HTML,解析HTML,提取數(shù)據(jù),將數(shù)據(jù)保存到數(shù)據(jù)庫或者存為CSV、JSON等格式,再用自己熟悉的語言例如Python對...
閱讀 854·2023-04-26 00:11
閱讀 2655·2021-11-04 16:13
閱讀 2101·2021-09-09 09:33
閱讀 1471·2021-08-20 09:35
閱讀 3816·2021-08-09 13:42
閱讀 3604·2019-08-30 15:55
閱讀 1037·2019-08-30 15:55
閱讀 2218·2019-08-30 13:55