{eval=Array;=+count(Array);}
隨著大數據技術開始逐漸落地應用,未來不僅IT互聯網領域的從業者需要掌握大數據技術,傳統行業從業者也需要掌握一定的大數據技術,尤其是管理類崗位,掌握大數據技術對于提升自身的資源整合能力,以及擴展自身的能力邊界,都有比較積極的意義。
從我近些年帶大數據方向研究生的情況來看,早期選擇大數據方向的同學,往往都來自于數學、統計學和計算機大類專業的同學,近兩年管理學專業的同學也開始選擇大數據方向了,這是一個明顯的變化。
大數據是一個典型的交叉學科領域,而且大數據的技術體系非常龐大,這導致學習大數據的切入點也非常多,所以不同知識基礎和專業背景的同學,可以根據自身的發展規劃來制定入門規劃。
大數據技術與場景的結合非常緊密,不同的生產場景往往需要采用不同的大數據技術,所以一定不能脫離應用場景來學習大數據技術,這會導致很多問題。
對于在讀的大學生來說,可以結合自身的專業特點來選擇學習路徑,如果未來要從事大數據開發崗位,那么可以從編程語言開始學起,然后學習數據庫、大數據平臺等知識,接著通過實習崗位,或者參加老師的實驗室,來構建實踐場景。
對于要從事數據分析類崗位的同學來說,可以從統計學知識開始學起,然后學習機器學習,這也是目前進行大數據分析的兩種主要分析方式。當然了,數據分析同樣不能離開生產場景來學習,不同的行業背景對于數據價值化的方式也有不同的要求。
對于職場人來說,最好能夠結合自己的行業背景來學習大數據技術,對于很多從事管理類崗位的職場人來說,學習大數據可以從報表(Excel)開始學起,然后進一步學習BI相關知識。
學習大數據分析,一定離不開統計學、機器學習相關知識,即使工具再強大,包括一些低代碼平臺的運用,往往也需要掌握一定的編程知識。
總之,學習大數據技術一定要重視最新技術的發展,同時要重視給自己開辟出更多的交流和實踐渠道。
1深入理解Java面向對象思想
2掌握開發中常用基礎API
3熟練使用集合框架、IO流、異常
4能夠基于JDK8開發
5熟練使用MySQL,掌握SQL語法
1Linux系統的安裝和操作
2熟練掌握Shell腳本語法
3Idea、Maven等開發工具的使用
4Hadoop組成、安裝、架構和源碼深度解析,以及API的熟練使用
5Hive的安裝部署、內部架構、熟練使用其開發需求以及企業級調優
6Zookeeper的內部原理、選舉機制以及大數據生態體系下的應用
7Flume的架構原理、組件自定義、監控搭建,熟練使用Flume開發
實戰需求
8Azkaban的安裝部署,熟練使用進行工作流的調度執行
9Kafka的安裝部署以及框架原理,重點掌握Kafka的分區分配策略、
一致性保證等,熟練掌握低級API、高級API的使用
10統籌Hadoop生態下的Hadoop、Flume 、Zookeeper、Kafka、Sqoop
等諸多框架,搭建數據采集系統,熟練掌握框架結構和企業級調優手段
1Scala語言的基礎入門、數據結構講解、面向對象、函數式編程、模式匹
配、高級類型、隱式轉換等重點內容的掌握使用
2Spark的入門安裝部署、Spark Core部分的基本API使用熟練、編程進
階、自定義累加器和廣播變量的使用和原理掌握、SparkSQL的編程掌握
和如何自定義函數、SparkSreaming的應用解析、Spark的內核源碼詳解
(包括部署、啟動、任務劃分調度、內存管理等)、Spark的企業級調優
策略。
3HBase的部署使用、原理架構講解與企業級優化
4最新的大型離線數倉項目,對電商常見及疑難指標的熟練掌握,完全自主
搭建整個數倉架構
5Redis的入門、基本配置講解、jedis的熟練掌握
6熟練掌握實時分析項目的架構及需求處理思路
1熟練掌握Flink的基本架構以及流式數據處理思想,熟練使用Flink多種
Soure、Sink處理數據,熟練使用基本API、Window API 、狀態函數、
Flink SQL、Flink CEP復雜事件處理等
2使用Flink搭建實時數倉項目,熟練使用Flink框架分析計算各種指標
3開發工具Git&Git Hub的熟練使用
4ElasticSearch的入門安裝部署及使用
1熟練掌握在線教育從0到1搭建大數據處理系統,了解大數據從業人員的
真實工作流程
2以在線教育為背景,搭建實時數倉處理系統,獨立完成項目搭建和需求實現
3采用ucloud云平臺全套大數據產品重構電商項目,熟悉離線數倉、實時指標的
ucloud云解決方案。
4可選掌握推薦和機器學習項目,熟悉并使用系統過濾算法以及基于內容的
推薦算法等
5可選掌握用戶畫像項目,使用數字化標簽描述用戶個性特征、勾畫目標用戶
每天有效學習時長要有6個小時這樣,1-2小時的筆記時間,敲代碼的時長2-3小時。
編程一定要代碼量上去!!!
因為很多都是一學就會,一敲就廢。
俗話說,鍵盤敲爛月薪過萬;鍵盤落灰狗屎一堆。
建議按著學習路線去學習,基本這種都是針對企業的招聘來安排的課程。
你要針對性的去學習,不要一口吃個大胖子,學習是個循循漸進地過程。
B站全網最全大數據學習路線:
https://www.bilibili.com/read/cv5213600?spm_id_from=333.788.b_636f6d6d656e74.7
如何從零開始、系統地學習大數據?最重要的是哪種方向選擇,大數據相關的方向還是有很多的,方向不一樣學習的東西就不一樣。簡單舉例以大數據開發和大數據分析來說明。
大數據開發方向
如果選擇大數據開發方向,那最重要的就是軟件的開發。而這基本就是程序員所需要系統學習的知識。作為程序員那最起碼應該掌握一門開發語言,一般從這里著手最能夠引起興趣。比如選擇Java、C#.Net、Php、Python等等其中一門從最基礎開始學,邊學邊實踐,慢慢能寫出一些程序后就能體會到里面的樂趣。當然還有學習大數據開發相關的環境,比如Hadoop、數據庫等知識。
但要長期從事軟件開發做好項目,最好還是要系統性的學習,基本就可以參照大學軟件工程的學習計劃進行系統學習。比如主要專業課程:程序設計語言、數據結構、操作系統、編譯技術、軟件工程概論、統一建模語言、軟件體系結構、軟件需求、軟件項目管理、數據庫與實現計算、計算機安全等等。當然一般在職的人可能沒有這么多時間來學習這些比較理論性的,可以選擇必要的幾門學習,個人認為這幾科目:數據結構、軟件工程、軟件項目管理等是比較實用的,當然有時間的話盡量多選學有好處。
大數據分析
選擇大數據分析方向,則理論性知識需要更扎實,當然也得要掌握一些工具。對于數據分析來說,很重要的就是數學知識、統計學、概率知識等等。如果要系統性的學習,可以參照數據科學與大數據技術專業課程,比如:C(Java、Python)程序設計、數據結構、大數據算法、人工智能、應用統計、大數據機器學習、數據建模、大數據分析與處理、大數據管理等等。
當然有些大數據分析師培訓機構的課程也可以參考,這些是比較注重實用性,而系統性不太足。比如掌握的實用知識較多:除了前端知識、還有Python、Echarts、D3、Power BI、SmartBI、SAP、Tableau、R語言分析、建模分析等等,學習后就可以上手做。
大數據相關的知識非常繁多且雜,要系統學習的話最好就是找一個方向進行。
圖片來自于網絡,如有侵權請聯系作者刪除,更多分享請上部關注【東風高揚】。
感謝邀請,如果說從零開始系統的學習大數據,那我們必然是先學基礎的東西。
其實,我個人建議,樓主如果想學習的話,完全可以去報一個系統的班,在班里有老師帶著你,一來是節省時間,二來可以學習到等多的東西。
你也可以看看我寫的文章,我將從下面的順序依次簡單的介紹大數據。
模塊(1):Java編程基礎
Java基本語法、面向對象、IO、集合、多線程、Socket編程、基礎綜合實戰等;
模塊(2):數據庫MySQL數據庫、JDBC、存儲過程和SQL查詢增強等;
模塊(3):JAVA基礎編程實戰
數據分析綜合實戰案例
模塊(1):Mybatis
Mybatis快速入門、Mybatis的架構介紹、Mybatis實現增刪改查、SqlMapConfig的使用、動態sql、關聯映射
模塊(2):SpringMVC
SpringMVC快速入門、參數綁定、RequestMapping注解、ResponseBody注解、靜態資源映射、攔截器
模塊(3):Spring
Spring快速入門、Spring的IOC、Spring注解、Spring的AOP、整合Mybaties和SpringMVC
模塊(4):SpringBoot
SpringBoot快速入門、SpringBoot核心、SpringBoot的Web開發
模塊(5):數據可視化Echarts
Echarts的基本使用、創建餅狀圖、柱狀圖、折線圖、整合SpringBoot
模塊(1):Linux操作系統
Linux系統簡介、Linux系統服務器集群安裝部署、Linux常用命令操作、Linux系統管理、
Linux Shell編程等;
模塊(2):大數據HADOOP技術棧
Hadoop生態體系簡介、HDFS、MapReduce、Yarn、
Hive、Sqoop、Flume、Azkaban、HBase、
模塊(1):大數據Spark生態系統
Scala函數式編程
Spark生態體系、SparkCore、SparkSQL、Kafka、SparkStreaming、SparkMLlib、GraphX
模塊(2):NoSQL數據庫
MongoDB、Redis
模塊(3):大數據ElasticSearch生態系統
Lucene和ElasticSearch等;
這就是我對這個問題的看法,有幫助到大家的話,關注支持一下下~~
感謝堅持關注的朋友~
世界很大,幸好有你~
歡迎在評論區留下你的問題或困惑,我將每天與你分享我的觀點和心得。
聚焦最新科技咨訊,探尋未來智能領域,我是Mario女陶。
最好的學習是在公司去實踐,然而沒基礎是進不去公司的,所以進公司之前可以拿一段時間去系統學習,我是自學后進入公司的,半年前,我還是一名.net程序員,每天做不完的業務系統,不會java,不會linux,不懂分布式......后來從朋友那里獲得全套學習視頻,其實就是他們花錢去培訓的視頻,然后一有空就看視頻學習,自己裝一個linux虛擬機,跟著視頻搭環境,寫代碼,開始的時候,我覺得里面的思想、架構真的很厲害,所以學得很勤,而后面要學的組件越來越多,不免會感到枯燥,甚至是痛苦,但這個時候千萬不要放棄。我的視頻是三十多天的課程,而后面很多課程是跳過去的,因為要上班,所以斷斷續續學習了半年才看完,而真正學習的時間大概兩個月,每天花三個小時左右,期間我朋友經常問我準備什么時候去找大數據開發工作,我都說我沒準備好,其實是沒有信心,我看完大部分視頻后,覺得那些組件已經會使用并且知道其基本原理,然后又看了很多面試題,覺得差不多了,開始投簡歷,面試的時候你不能說你是剛自學的,也不能說你沒這方面的經驗,面了幾家公司,感覺什么問題都答上了一些,但是什么都答得不好,當時的想法是,面試也是學習,一個月面試不上就兩個月,而幸運的是,第一家公司給了我offer,當時真的很驚喜,這么久的努力終于有了回報,到公司上班后,自己私底下還有繼續學習,理論加實踐,我感覺我每一天都在進步!希望我的經歷對你有用。
感謝邀請。
目前大數據使用越來越普遍。從某種意義上來說,IT開發已經從過去單純的用戶提供信息向以大數據為支撐的為用戶提供各種個性化智能服務系統轉變。
如何從零開始、系統學習,話題比較寬泛,如果真的系統學習后再去工作那么可能公司的招聘要求會更高,建議可以邊工作邊學習。
學習大數據都需要掌握哪些知識呢?
1、Python語言數據抓取,這個沒有什么可說的,沒有數據抓取,沒有數據源,后邊的都無從談起;
2、Hadoop,storm,nosql數據抓取后需要對數據進行統計,進行計算,進行存儲,這幾個要掌握的,同時各種關系型數據也還是要了解的。
3、數據抓過來了,也處理了,做為對業務的支撐要把數據提供給系統來使用,各種消息隊列中間件也需要了解一些。
4、大數據的處理更多的是服務端的,一般都是使用linux操作系統,操作系統的命令要掌握,大數據需要系統資源,一些的運維知識也需要掌握。
總之,除了常提的Hadoop,storm等常說的大數據軟件外,其它相關的知識也很重要,就算不精通也需要掌握常用的知識。
學習大數據可以有以下幾個步驟:
1、選擇一個具體方向
大數據已經初步形成了一個產業鏈,在數據采集、數據存儲、數據安全、數據分析、數據呈現、數據應用等有大量的崗位,不同的崗位需要具備不同的知識結構,所以首先要選擇一個適合自己的方向。
2、學習編程等基礎知識
大數據的基礎知識是數學、統計學和計算機,可以從編程語言開始學起,Python、Java、Scala、R、Go等語言在大數據領域都有一定的應用場景,可以選擇一門學習。大數據開發方向建議選擇Java、Scala,數據分析方向建議學習Python、R。
3、學習大數據平臺知識
入門學習Hadoop或者Spark,Hadoop平臺經過多年的發展已經形成了較為完成的應用生態,相關的成熟案例也比較多,產品插件也越來越豐富。
一句話,首先要搞清楚大數據產業鏈的情況,接下來要明確大數據技術棧也就是相關技術體系,最后定下學習目標和應用方向,結合自己的興趣或工作需求,找一個點猛扎進去,掌握這個點的相關技術。
大數據時代各種技術日新月異,想要保持競爭力就必須得不斷地學習。寫這些文章的目的是希望能幫到一些人了解學習大數據相關知識 。加米谷大數據,大數據人才培養機構,喜歡看的同學可以關注下,每天花一點時間學習,長期積累總是會有收獲的。
大數據的內容非常的散亂 基本你只能先學一些架構的基本知識和建模的基礎 然后進入一家大數據公司 這樣別人帶著你做才能真正成長 完全想自己修煉好再去公司不太現實 畢竟大數據的架構成本很高 而且只有進入公司你才能真正接觸到海量的數據
0
回答0
回答0
回答0
回答0
回答0
回答0
回答9
回答0
回答0
回答