這要看你學到什么程度了,初級的大數據工程師,大數據開發工程師,大數據維護工程師啊,再往后發展大數據研發工程師,大數據架構師,數據分析師,大數據高級工程師,大數據分析師專家,大數據挖掘師,大數據算法師等;不管的研發,還是數據分析,還是運維,都要看以后的工作需要和發展,還有自我提升等,不同的方向分工又不太相同,大數據作為一門基礎科學,無論在數據開發及分析、物聯網和人工智能算法訓練領域,都有著核心技術和職位訴求。
如果后期想從事大數據相關崗位,還是建議要系統性的學習大數據的課程內容。一般大數據學習主要分為以下幾個階段:
第一階段:大數據基礎
Java基礎——Java語法基礎。掌握JAVA的開發環境搭建以及基礎知識等.能夠熟練使用邏輯語法進行代碼編寫
數據結構——數組、鏈表、棧、隊列、排序、二分查找、散列表、哈希表、二叉樹,紅黑樹、遞歸樹,堆和棧。繼續提升大家的計算機素養,掌握算法初步。
MySQL基礎——mysql安裝、基本SQL語句、SQL優化。掌握數據庫的基本應用。
Javaweb——tomacat、servlet、JSP 、MVC。掌握web開發的相關內容,理解數據來源
高級java——面向對象、網絡編程、反射、多線程。理解分布式程序運行原理,為以后閱讀大數據框架打下基礎。
linux基礎——虛擬機安裝、常用linux命令、shell腳本。學會使用linux操作系統,為部署大數據集群做準備。
第二階段:大數據框架
Hadoop——分布式存儲、分布式計算、公共通用接口。掌握部署大數據集群,熟練編寫map-reduce程序。
Zookeeper——Zookeeper協調機制、選舉機制。搭建高可用集群。
Hive——數據倉庫搭建、數據導入和分析。初步掌握數據倉庫的概念,為后續企業級數倉做準備。
Hbase——Hbase集群搭建、大數據數據庫工作原理、列式存儲、高吞吐量應用開發。掌握大數據數據庫Hbase的應用,科學的行鍵設計,熱點數據處理。
Kafka——理解消息隊列、Kafka集群部署、高并發高可用數據采集框架搭建。掌握高可以高并發數據隊列系統設計、能處理峰值問題。
Scala——Scala語法基礎、常用算子、異步通信。掌握優秀的數據處理語言Scala
Spark——Spark集群搭建、離線數據處理、實時數據處理、機器學習、圖計算。掌握一棧式解決方案Spark,它是大數據的核心模塊。
常用輔助框架——Sqoop、Flume、Presto、impala、Phoenix、oozie、ElasticSearch、kylin、MongoDB、Redi、Druid。掌握常用工具和與大數據緊密相關的框架,提高工作效率,拓展框架功能。
第三階段:機器學習
python基礎——python基礎語法、面向對象、Numpy。掌握python基礎語法和機器學習相關的基礎框架。
數學基礎——線性代數、微積分、概率、凸優化。本部分內容理解即可,對優化模型很重要。
常用算法——回歸、KNN、決策樹、聚類、集成學習、SVM、多分類、貝葉斯、EM、隱馬模型、深度學習。掌握常用計算器學習算法的原理,能夠根據數據特性選擇合適的模型,訓練泛化能力強的模型。
第四階段:項目實操
如果擔心自學效果不好,可以了解下云和數據大數據人工智能實訓班,講師全程實戰式教學,而且學生不僅可以學到大數據相關的內容,也可以掌握人工智能相關的內容,為以后提供更有利的支持,占據更強的優勢。
云和數據作為教育部第一批產學合作協同育人項目單位,第46屆世界技能大賽(云計算方向)省、市兩級集訓基地、鄭州高技能人才培養示范基地、鄭州電子商務人才教育示范基地,攜手華為、騰訊、百度、Amazon、Unity、Oracle、Microsoft等公司深度賦能院校人才培養,與省內外130多所高校開展了混合所有制二級學院、產教融合基地、專業共建、師資培訓、實習實訓、學徒制、協同育人、頂崗實習等多維度、多層次的校企合作。人才培養技術方向涵蓋云計算、大數據、人工智能、虛擬現實、軟件工程、用戶體驗設計、網絡安全、電子商務八大方向。年培養高端IT技術人才超10000人,累計為企業輸送高端泛IT技術人才超5萬人,其中60%來自于口碑推薦,一次就業率98%,20%就業薪資超1W,平均薪資8.5K。