在《一文了解人工智能(AI)》文章中我們介紹了AI可以解決哪些復(fù)雜的問題。這些問題無法通過固定的規(guī)則進(jìn)行解決,需要機器根據(jù)以往的事例進(jìn)行比較評估,作出最終的判斷。機器需要模仿人類對事物進(jìn)行學(xué)習(xí)。
人類的學(xué)習(xí)過程可以拆分為以下幾個階段:感知、記憶、對比和歸納、總結(jié)和實踐。
感知:通過自己的感官(視覺、聽覺、觸覺、味覺和嗅覺)獲取外界的信息,觀察和體驗周圍的環(huán)境和發(fā)生的事情。除了親身感受之外,為了更高效的獲取信息,人們通過聽故事、閱讀圖書和觀看視頻來了解曾經(jīng)發(fā)生過的事情。
記憶:當(dāng)我們獲取到新信息后,我們會將以后需要使用的信息記在大腦之中,并拋棄認(rèn)為不需要的信息。
對比和歸納:人們了解新信息的最好辦法是與自己記憶中的信息進(jìn)行比較。通過對比信息的相似性和差異性,理解新信息并對不同的信息進(jìn)行分類。
總結(jié):人們將一個個獨立的信息整合到一起,推導(dǎo)出信息之間的聯(lián)系及規(guī)律。構(gòu)建起信息的網(wǎng)絡(luò),幫助理解事情的原因和結(jié)果。
實踐:學(xué)習(xí)的意義是將獲得的知識應(yīng)用到現(xiàn)實生活中。在解決問題的過程中驗證知識的適用性和正確性。在驗證的過程中,又進(jìn)入新的一輪感知過程。
在這五個步驟中,記憶是計算機最擅長的事情,自然及人文類的數(shù)據(jù)感知是一個需要消耗大量人力的過程,可以通過儀器檢測的數(shù)據(jù)指標(biāo)則可以自動化的進(jìn)行數(shù)據(jù)收集。第三步的對比和歸納以及第四步的總結(jié)是算法實現(xiàn)的部分。機器學(xué)習(xí)程序與普通程序最大的不同在于實踐的部分。普通的軟件程序輸出結(jié)果后,便完成了整個流程。但是機器學(xué)習(xí)程序可以對每次的結(jié)果進(jìn)行評分,然后算法可以根據(jù)評分調(diào)整運算的結(jié)果。
由于機器需要運行的結(jié)果反饋來進(jìn)行學(xué)習(xí),所以機器學(xué)習(xí)算法的開發(fā)過程包含了算法編寫和學(xué)習(xí)兩個階段。機器學(xué)習(xí)階段也被稱為訓(xùn)練階段,在此階段使用已知的數(shù)據(jù)進(jìn)行學(xué)習(xí)和驗證。對每次訓(xùn)練的結(jié)果進(jìn)行評估,然后對算法進(jìn)行調(diào)整。這種學(xué)習(xí)的過程分為兩種:監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。
監(jiān)督學(xué)習(xí)適合待解決的問題有明確預(yù)期,希望機器可以對未來出現(xiàn)的同類問題進(jìn)行預(yù)測。監(jiān)督學(xué)習(xí)的訓(xùn)練數(shù)據(jù)必須成對出現(xiàn),包含程序輸入的特征信息和程序輸出的結(jié)果信息。監(jiān)督學(xué)習(xí)訓(xùn)練時,訓(xùn)練集被隨機分成兩份:一份用于對程序進(jìn)行訓(xùn)練,另一份用于驗證算法的處理結(jié)果是否符合預(yù)期。
無監(jiān)督學(xué)習(xí)用于探索數(shù)據(jù)之間的關(guān)系和規(guī)律,獲得的是某個問題的結(jié)果。無監(jiān)督學(xué)習(xí)的訓(xùn)練數(shù)據(jù)只有程序輸入的特征信息,訓(xùn)練時使用整份數(shù)據(jù)進(jìn)行學(xué)習(xí)。無監(jiān)督學(xué)習(xí)獲得的訓(xùn)練的結(jié)果無法用訓(xùn)練集進(jìn)行驗證,需要單獨進(jìn)行評估后,再對算法進(jìn)行調(diào)整。
機器學(xué)習(xí)的過程模仿了人類學(xué)習(xí)的流程。在了解機器學(xué)習(xí)的過程中,我們僅是在學(xué)習(xí)一個IT類的知識,我們也可以反思自身的學(xué)習(xí)過程如何進(jìn)行優(yōu)化。