人工智能早已婦孺皆知,其熱度仍然居高不下,其發展前景亦是被很多大佬看好,于是很多小伙伴們都想進人工智能領域,投入 AI的懷抱,但苦于不知如何下手、如何學習AI。其中,人工智能的核心就是機器學習(MachineLearning),它是使計算機具有智能的根本途徑,其應用遍及人工智能的各個領域。
今天云和數據的小編就來分享一些來自 EliteDataScience 上專門講給機器學習入門自學者的心得體會,告訴你在機器學習之路上的幾個重要步驟:
1.什么是機器學習?
在悶頭學習機器學習之前,最好先把什么是機器學習搞清楚,了解機器學習的基本概念。
簡單來說,機器學習就是教電腦怎樣從數據中學習,然后做出決策或預測。對于真正的機器學習來說,電腦必須在沒有明確編程的情況下能夠學習識別模型。
機器學習屬于計算機科學與統計學的交叉學科,在多個領域會以不同的面目出現,比如你應該聽過這些名詞:數據科學、大數據、人工智能、預測型分析、計算機統計、數據挖掘······
雖然機器學習和這些領域有很多重疊的地方,但也不能將它們混淆。例如,機器學習是數據科學中的一種工具,也能用于處理大數據。
機器學習自身也分為多個類型,比如監督式學習、非監督式學習、增強學習等等。例如:
郵件運營商將垃圾廣告信息分類至垃圾箱,應用的是機器學習中的監督式學習;電商公司通過分析消費數據將消費者進行分類,應用的是機器學習中的非監督式學習;而無人駕駛汽車中的電腦和攝像頭與道路及其它車輛交互、學習如何導航,就是用到了增強學習。
2.需要預備哪些知識?
如果沒有基本的知識儲備,機器學習的確看起來很嚇人。要學習機器學習,你不必是專業的數學人才,或者程序員大牛,但你確實需要掌握這些方面的核心技能。
好消息是,一旦完成預備知識,剩下的部分就相當容易啦。實際上,機器學習基本就是將統計學和計算機科學中的概念應用在數據上。
這一步的基本任務就是保證自己在編程和統計學知識上別掉隊,機器學習的預備知識主要有以下三個方面
1)如果不懂編程,是沒法使用機器學習的。應用于數據科學中的Python語言是一個很好的選擇
2)了解統計學知識,特別是貝葉斯概率,對于許多機器學習算法來說都是基本的要求。
3)研究機器學習算法需要一定的線性代數和多元微積分知識作為基礎。
3. 原理知識重要嗎?
盡可能多地吸收機器學習的原理和知識,這一步和第一步有些相似,但不同的是,第一步是對機器學習有個初步了解,而這一步是要掌握相關原理知識。
可能有些朋友會想:我又不想做基礎研究,干嘛要掌握這些原理,只要會用機器學習工具包不就行了嗎?
有這個疑問也很正常,但是對于任何想將機器學習應用在工作中的人來說,學習機器學習的基礎知識非常重要。比如你在應用機器學習中可能會遇到這些問題:
數據收集是個非常耗時耗力的過程。你需要考慮:我需要收集什么類型的數據?我需要多少數據?等此類的問題。
數據假設和預處理。不同的算法需要對輸入數據進行不同的假設。我該怎樣預處理我的數據?我的模型對缺失的數據可靠嗎?
解釋模型結果。說機器學習就是“黑箱”的觀點明顯是錯誤的。沒錯,不是所有的模型結果能直接判讀,但你需要能夠判斷模型的狀況,進而完善它們。我怎么確定模型是過度擬合還是不充分擬合?模型還有多少改進空間?
優化和調試模型。很少有人剛開始就得到一個最佳模型,你需要了解不同參數之間的細微差別和正則化方法。如果我的模型過度擬合,該怎么修正?我應該將幾個模型組合在一起嗎?
要想在機器學習研究中解答這些問題,掌握機器學習的知識原理必不可少。
4.實踐出真知
掌握了機器學習的基礎理念知識,接著就該實際操作了。
實際操作主要是通過具體的、深思熟慮的實踐操作增強你的技能。本步目標有三個:
練習機器學習的整個流程:收集數據,預處理和清理數據,搭建模型,訓練和調試模型,評估模型。
在真正的數據集上實踐操作:對于什么樣的數據適合用什么類型的模型,自己應逐漸建立這方面的判斷能力。
深度探究:例如在上一步,你學習了很多機器學習算法知識,在這一步就要將不同類型的算法應用在數據集中,看看哪個效果最好。
完成這一步后,就可以進行更大規模的項目了。
5.項目中持續成長
終于到了最后一步,也是很有意思的一步。目前為止,我們已經完成了:知識儲備、掌握基本原理、針對性練習等階段,現在我們準備探究更大的項目:
這一步的目標就是練習將機器學習技術應用于完整的端到端分析。
如果你按照這個步驟一步步扎實學習的話,相信你一定在AI方面學有所成,好了,已上就是云和數據的小編分享的內容,希望對您有所幫助!