Ian Hacking曾說過
The quiet statisticians have changed the world; not by discovering new facts or technical developments, but by changing the ways that we reason, experiment and form our opinion.....
監督式(Supervised)的統計學習,談的是在已知的一些資料輸入(input data in terms of specific characteristics)項目後,能透過模型與對應關係的建構,得到可以預期或是有預測能力的特定資料輸出(predictive output),這樣的學習過程被稱之為監督式的統計學習,因為我們能夠透過模型與變數間相對關係的界定去了解變化的情況;簡單的說,就是透過這樣的資訊解析過程,了解其中資訊的變化,並進行相關資訊的萃取與解讀。
非監督式(Unsupervised)的統計學習,討論的則是在給定相關資料輸入(data input)之後,我們透過適當的資料處理與聚合,讓資料替自己說話,透過輸入資料的形式(可能是連續變數的衡量,也可能是類別資料的型態),來呈現出資料之間彼此相關的程度,但是對於資料輸出的情況是無法預測,也不可能在事前因為對過往模型的熟悉而有相關的預測能力者,資料最後輸出的型態完全取決於目前手邊資料自身的特性與型態,而我們只是透過特定的邏輯與方法,來呈現資料自身原來的樣貌,這樣的學習過程被稱之為非監督式的統計學習。
一般說來,類神經網絡(Neural networking)分析的資訊解讀是屬於監督式的學習,而CART(Classification and Regression Tree)的資訊解讀是屬於監督式的學習,但是集群分析(Cluster Analysis)是屬於非監督式的學習。
留言列表