淺談機器學習原理-Linear Model

Linear Regession

需要預測數值，輸出為實數的數值，我們就稱為它是regession的任務。

(1)定義問題是否需要使用ML: 預測使用者評分電影的星星*數量，算是一個複雜的問題。且知道評分結果為1~5星，可以知道這是一個regression的任務

(2)收集資料: Netflix有100萬筆的rating資料與

(3)定義模型:假設它是regession問題，我們可以知道hypothesis: h(x) = $w^T *x$ 的方程式。我們可以與分類Perceptron的公式來比較。

Linear Regession :用來找到最接近實際目標值，也就是最小誤差error的值

(4)測量誤差: squared error : $(預測值-真實的值)^2$ ，我們算出誤差值後，如何得到最小的誤差min(Error(x))

我們可以假設誤差接近於0值為球體的位置，是在曲線的最下方也就是偏微分等於0的位置，我們要找的讓W偏微分等於零。

Statistics: 統計比較著重在數學的推論

Machine Learning: 機器學習比較著重在資料計算，統計工具對機器學習領域是很有幫助

需要預測機率，輸出為小數點，我們就稱為它Logistic Regression任務。資料輸出為+1,-1的值，可以預測為機率發生，可以由公式可以知道x在發生+1的機率是多少。範例: 疾病預測、鐵達尼的死完的機率

機率值是介於0~1之間

(1)定義模型:我們一樣使用 $w*x$ 的方程式，算出多少機率會發生為S=1，我們通常會hypothesis是一個指數的方程式，當S越大表示發生的機率為1，越小就為0。

(2)測量誤差: 這個跟線性的概念一樣，需要找到與現實差距最小的誤差值，實務上會使用gradient descent驗算法來找到w的這個目標值。

任何情況可以優先考慮Linear Models來解。

台大資訊人工智慧導論影片

無聊看看