得先聲明,大數據分析是統計背景的人較適合發展的領域,至於資訊科學跟資訊工程的人,當然也適合發展,但機器學習本身並不需要背景知識(domain knowledge),因著如此,進行科學計算者只需要專注於目標函數的最適化達成,藉著各種設定好的限制式,追求條件限制下的最適化,只是如果沒有商學院或管理學院的學科磨練,幫忙設計機器學習者可能並不了解特定產業中需要解決的特定議題,此時機器學習最終將變成是一個四不像,毫無實用性與真實價值可言;簡單的說,沒有背景知識者所發展出來的機器學習是無法為實際商業決策提供任何貢獻的。在決策科學中,經常會討論到專家系統運用,只是專家系統需要的內涵是甚麼?絕對不是機器學習,不論您想要機器學習甚麼,都是需要替機器設定目標,如果希望機器學習結果能構建出一個專家系統,或是藉由專家來幫忙調整機器學習的目標,這些都需要人來幫忙定義與界定,若只是讓機器針對各類設定好的計算原則加以計算,那機器學習的目標就只是幫忙人們很快找到真相,因為人一時之間能處理的資料量有限,人有情緒跟盲點,人經常需要很多時間的試誤才知道真理是甚麼,但是機器不會,在設定的演算規則與邏輯下,機器只要有很快速的CPU或是GPU,就能進行各類計算,就能幫忙人們克服很多過往需要大量時間才能達到的目標!機器不會累但人會,統計學習或是機器學習在此的目標就是一個能高速計算並很快探求事實真相且將問題降低維度來簡易化的問題過程與建構一個探查真相的模式!是的,這裡談的是弱AI!統計學習與機器學習在此就是替人們很快速地進行相關計算,幫忙人們進行特定決策的簡易人工智慧,此時如果您設計的機器學習演算法無法與任何特定相關商業議題有關連,其實機器學習出來結果就真的是GIGO( Garbage In, Garbage Out)!
- 9月 13 週三 201723:29
大數據,機器學習,統計學習與無母數回歸分析
- 9月 11 週五 201520:11
監督式(supervised)與非監督式(unsupervised)的統計學習(statistical learning)
Ian Hacking曾說過
The quiet statisticians have changed the world; not by discovering new facts or technical developments, but by changing the ways that we reason, experiment and form our opinion.....
監督式(Supervised)的統計學習,談的是在已知的一些資料輸入(input data in terms of specific characteristics)項目後,能透過模型與對應關係的建構,得到可以預期或是有預測能力的特定資料輸出(predictive output),這樣的學習過程被稱之為監督式的統計學習,因為我們能夠透過模型與變數間相對關係的界定去了解變化的情況;簡單的說,就是透過這樣的資訊解析過程,了解其中資訊的變化,並進行相關資訊的萃取與解讀。
The quiet statisticians have changed the world; not by discovering new facts or technical developments, but by changing the ways that we reason, experiment and form our opinion.....
監督式(Supervised)的統計學習,談的是在已知的一些資料輸入(input data in terms of specific characteristics)項目後,能透過模型與對應關係的建構,得到可以預期或是有預測能力的特定資料輸出(predictive output),這樣的學習過程被稱之為監督式的統計學習,因為我們能夠透過模型與變數間相對關係的界定去了解變化的情況;簡單的說,就是透過這樣的資訊解析過程,了解其中資訊的變化,並進行相關資訊的萃取與解讀。
1
