淺談機器學習原理-Linear Model
Linear Regession
需要預測數值,輸出為實數的數值,我們就稱為它是regession的任務。
- 範例:Netflix百萬獎金比賽,有100萬筆的rating資料與480K的使用者給17.7k的電影來評分,預測使用者評分電影的星星*數量。
(1)定義問題是否需要使用ML: 預測使用者評分電影的星星*數量,算是一個複雜的問題。且知道評分結果為1~5星,可以知道這是一個regression的任務
(2)收集資料: Netflix有100萬筆的rating資料與
(3)定義模型:假設它是regession問題,我們可以知道hypothesis: h(x) = 的方程式。我們可以與分類Perceptron的公式來比較。
Linear Regession :用來找到最接近實際目標值,也就是最小誤差error的值
(4)測量誤差: squared error : ,我們算出誤差值後,如何得到最小的誤差min(Error(x))
理想化的誤差值
我們可以假設誤差接近於0值為球體的位置,是在曲線的最下方也就是偏微分等於0的位置,我們要找的讓W偏微分等於零。
Statistics vs Machine Learning
Statistics: 統計比較著重在數學的推論
Machine Learning: 機器學習比較著重在資料計算,統計工具對機器學習領域是很有幫助
Logistic Regression 邏輯回歸
需要預測機率,輸出為小數點,我們就稱為它Logistic Regression任務。資料輸出為+1,-1的值,可以預測為機率發生,可以由公式可以知道x在發生+1的機率是多少。範例: 疾病預測、鐵達尼的死完的機率
(1)定義模型:我們一樣使用的方程式,算出多少機率會發生為S=1,我們通常會hypothesis是一個指數的方程式,當S越大表示發生的機率為1,越小就為0。
(2)測量誤差: 這個跟線性的概念一樣,需要找到與現實差距最小的誤差值,實務上會使用gradient descent驗算法來找到w的這個目標值。
總結:
-
Linear Classificatoin: 分類問題0或1,這類問題比較特殊案例。
-
Linear Regression : 線性回歸就是找到w=0的情況就是最佳解
-
Logistic Regression : 邏輯回歸是找到w最小為機率大
任何情況可以優先考慮Linear Models來解。
參考資料
台大資訊 人工智慧導論影片
https://www.youtube.com/watch?v=BLldaAhrIrA&list=PLOAQYZPRn2V658cD6AjiBmKohfMIevWO7&index=6
留言
張貼留言