摘要:大數據分析,魯班為祖師該節選自全棧數據之門第四章數據分析,見微知著的引言部分如果你要問大數據分析最早起源于哪里,答案自然是有著千年悠久歷史的中國了。因此,大數據分析技術不僅起源于中國,而且其祖師正是木工藝人的祖師魯班。
1.《全棧數據之門》現貨上架
經過一段時間的等待,目前已經可以在各大電商平臺『現貨』購買本書。
本文后面也有京東、當當、天貓的購買鏈接!
本書以數據分析領域最熱的Python語言為主要線索,介紹數據分析庫Numpy、Pandas與機器學習庫Scikit-Learn,使用了可視化環境Orange3來理解算法的一些細節。
對于機器學習,既有常用算法KNN與Kmeans的應用,決策樹與隨機森林的實戰,還涉及常用特征工程與深度學習中的自動編程器。
在大數據Hadoop與Hive環境的基礎之上,使用Spark的ML/MLLib庫來集成了前面的各部分內容,讓分布式機器學習更容易。大量的工具與技能實戰,從而將各部分融合成為一個全棧的數據科學內容。
該節選自《全棧數據之門》第四章『數據分析,見微知著』的引言部分!
如果你要問大數據分析最早起源于哪里,答案自然是有著5千年悠久歷史的中國了。若君不信,且看下面的說明。
大數據
有一顆樹,非常非常大,一個人搬不動,于是魯班發明了鋸子,將樹鋸成很多小節,然后找很多人來幫忙搬,這樣不僅速度快,而且效率高。此所謂“大樹鋸”是也。這樣一傳十,十傳百,傳到其它國家,大家訛傳訛,就變成了“大數據”。
分布式存儲
為了保證高可用性,魯班教了大家一個好方法。將同樣的木料,分3份保存,自己家放一份,鄰居家放一份,鄰村里面再放一份。如果自己家被燒了,還可以使用鄰居家的那份。如果整個村子被水湮(或者像現在電視劇里演的一樣,在古代可能會一不小心被滅村),還有鄰居村子的那份可以使用。
數據分析
將樹鋸斷后,分成一小節一小節的,統計每節的長度,面積等等。分析木料是否有被蟲咬過,以及如何防止其它樹也被類似的蟲咬。分析樹每年的增長幅度,以及每天需要投入多少水資源來促進樹的快速增長。
數據挖掘
魯班通過分析樹干上面的紋理,發現了樹的年輪規律,這樣可以快速了解樹生長了多少年。這個方法被魯班建立成了一個模型,用于預測其它樹每年的生長速度。另外,還將樹根“挖掘”出來,分析為什么這個地方能產生這么大的樹,和土地是否有關系,土壤的成分是什么,能否將這種土壤移植到其它地方等等??傊?,是真正的進行了數據的“挖掘”。
因此,大數據分析技術不僅起源于中國,而且其祖師正是木工藝人的祖師--魯班。
一本正經的胡說八道了這么多,相信你對數據分析有了一個初步的了解吧。
欲了解更多的內容,請關注下面購買地址。
京東:
https://item.jd.com/12054675....
當當:
http://product.dangdang.com/2...
天貓:
https://detail.tmall.com/item...
博文視點:
http://www.broadview.com.cn/b...
豆瓣:
https://book.douban.com/subje...
百度百科:
http://baike.baidu.com/item/全棧數據之門/20490226
請輸入代碼
本文題圖取自《全棧數據之門》的封底,使用的是Orange3制作的數據挖掘流程『演示』圖。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/38589.html
摘要:全棧數據之門前言自強不息,厚德載物,自由之光,你是我的眼基礎,從零開始之門文件操作權限管理軟件安裝實戰經驗與,文本處理文本工具的使用家族的使用綜合案例數據工程,必備分析文件探索內容探索交差并補其他常用的命令批量操作結語快捷鍵,之門提高效率光 showImg(https://segmentfault.com/img/bVK0aK?w=350&h=350); 全棧數據之門 前言 自強不息,...
閱讀 3210·2021-11-17 09:33
閱讀 3295·2021-11-15 11:37
閱讀 2957·2021-10-19 11:47
閱讀 3207·2019-08-29 15:32
閱讀 1009·2019-08-29 15:27
閱讀 1534·2019-08-29 13:15
閱讀 938·2019-08-29 12:47
閱讀 2032·2019-08-29 11:30