跳到主要內容

淺談機器學習原理-概念

機器學習

淺談機器學習原理筆記--

機器學習

  • Learing : 人類學習是透過各種觀察(observatoins)去學到能力 , 輸入:觀察、輸出:能力
  • Machine Learning : 機器是透過各種資料的方式來學習到能力 ,輸入:資料、輸出:功能

範例: 使用股票資料來預測投資的方向。

總結: 我們希望機器可以像人一樣,透過學習就可以獲得技能,機器學習就像在解決一個任務(Y)透過資料(X)和找到一個方程式(F)來求出接近任務的解。Y = F(X) ,常用的範例:語音辨識、天氣預測、股票預測、圖片辨識、機器玩遊戲。簡單說機器學習利用資料與合適的模型來解決一個複雜的問題,通常這個問題無法使用簡單程式來解決。

Artifical Intelligence(AI) Machine Learning(ML)
說明 希望模擬人的智慧行為 透過資料學習來改善整體效能
範例 資料、演算法 資料、演算法
集合關係 AI AI的子集合

機器學習先決條件 :

  1. 解析問題的複雜度,是否真的需要建立模型來解決
  2. 必須有資料並需要處理
  3. 從資料中建立模型(Hypothesis)
  4. 選擇測量誤差的方法,模型得到的解與現實結果的誤差
  5. 建立模型到正式環境(沒有學習過的資料),也可以達到正確解

範例: KDD 2010 出題系統可以根據過去的練習,去調整出題的難度=> binary classifiation


機器學習過程

  • 問題公式 上圖表視輸入、輸出、資料和Hypothesis(模型)、f 現實世界答案

Step 0 : 定義問題是否需要使用ML

(1) 先理解這個問題是否需要透過ML來處理,如果可以使用if-else或是簡單邏輯判斷來解決,表示問題簡單,不需要使用ML來解決。ML通常解決比較複雜的問題,像股票預測是否可以使用ML來預測未來趨勢。 (2) 是否有資料跟結果有關聯

Step 1 : 收集資料

收集資料並且都須要有正確答案,範例: KDD 2010 出題系統可以根據過去的練習,去調整出題的難易度=> binary classifiation。

Step 2 : 定義模型

假設用線性方程式來舉例

透過資料特徵 x = (x1, x2 , ... xc),計算x乘上權重後相加,超過threshold就為1,否之為0。

我們可以假設模式為下面公式,幫我們WX>threshold,可以得到sign(0)=1,反之為-1

使用Perceptron的一次線性方程式來處理現實問題,也可以用來處理AND、OR、NOT的邏輯問題,但是無法處理XOR的問題。

Step 3 : 測量誤差

希望理想解為error趨近於0 => g(x)-f(x)=0,但實際上會有個誤差error,我們在In-sample(已經訓練過的資料)將每個g(x)-f(x)集合相加在求出平均,就是實際上誤差。Out-of-sample就是可以在實際環境上可以得到正確的解答。

ML 框架


參考資料

https://www.youtube.com/watch?v=_j9MVVcvyZI&list=PLJV_el3uVTsPM2mM-OQzJXziCGJa8nJL8&index=2
https://www.youtube.com/watch?v=redFUcvGcYU&list=PLOAQYZPRn2V658cD6AjiBmKohfMIevWO7&index=2
https://www.csie.ntu.edu.tw/~cjlin/libsvm/
https://kdd.org/kdd-cup/view/kdd-cup-2010-student-performance-evaluation/Data

留言

這個網誌中的熱門文章

JavaBean 和POJO

前言 今天介紹JavaBean和POJO的不同,這兩個名詞在JAVA文章常常被拿來使用以及討論。在JDK1.1時候釋出才有的一個標準架構,很多時候常常被搞混,所以我們特別開闢一章來加以討論。POJO規範在企業級應用已經廣大的被使用的規範。 解釋 POJO : 全名為Plain-old-Java-object,只需要繼承Object就可以,沒有特定規定,只要建立的類別有setter/getter方法都可以稱為POJO JavaBean: JavaBean通常用來封裝多個物件成為單獨物件使用,規範比較嚴格,規則如下 規則 說明 1 需要實作序列(Serializable/Externalizable) 2 不能有參數的建構子( no-arg constructor) 3 需要有公用setter/getter 4 屬性必須要私人(private) 5 屬於特定POJO規則 比較 所有的JavaBean都為POJO,但是所有的POJO不一定為JavaBean 都可以當作重複元件 都必須序列化 特性都為可用性、易用性和持久化使用 - 應用 由圖我們可以知道POJO在應用程式中,主要用來存取資料庫資料達到持久化的目的,並提供給商業邏輯流程處理使用。這種POJO的架構提供程式人員開發時的可以很有規則將資料封裝並加以使用。 範例1. JavaBean(以員工為實例) JavaBean建立員工物件,可以發現Employee物件建構子沒有任何參數,屬性為私有化並setter/getter的命名方式。 //實作序列化 public class Employee implements java.io.Serializable{ private int id; private String name; //無參數建構子 public Employee(){} //以下實作setter/getter public void setId(int id){this.id=id;} public int getId(){return id;} public void setName(String ...

Python AI-手寫辨識

Python AI-手寫辨識 類神經網路-手寫辨識 手寫辨識 (1) 問題定義 將輸入手寫數字圖片,經由類神經網路訓練後,可以辨識手寫圖片得到一個正確的答案,例如讓電腦辨識上面圖片手寫數字0-9,都可以認得.在了解問題後,需要先知道輸入的資料格式,例如圖片為NxN的矩陣向量. 輸入:輸入的資料格式有很多種,例如數字圖片為矩陣向量 模型:NN 輸出:輸出的方式,神經網路輸出不一定跟輸入同值,手寫數字輸入為1,輸出有可能是1.1或是1.5等等,所以輸出必須經過轉換成真實世界的數字. (2)定義函式 輸出會有兩個問題: A.輸出利用one-hot encoding來表示,就是N個狀態會對應N的結果,例如:輸出結果為1,表示[0,1,0,0,0,0,0,0,0,0] B.輸出結果不能超過1,我們通常會利用 Softmax函数 來進行輸出的處理. (3) 準備訓練/測試資料 在這邊需要從輸入去定義那些要當作訓練與測試資料,我們手寫資料使用MNIST 資料庫來訓練使用,MNIST共有70,000筆手寫資料,60,000筆為訓練資料,10,000為測試資料. (4)建構類神經網路模型 開始建構我們的神經網路模型,首先決定好28x28的像素(這邊不用擔心如何將圖片轉成矩陣),模型使用SGD的方式進行學習,輸出是一個10為的陣列來表示. 輸入:手寫數字圖片(28x28=784) 模型:SGD 輸出:數字(one hard encoding) (5)學習 首先介紹SGD(Stochastic Gradient Descent) 的學習方式,因為蕾神經網路需要訓練很多次才會提高準確度,SGD最大的好處就是當每次重新學習的會將訓練資料打散,來防止機器學習將答案死背下來. (6)實作開發 下面程式碼有完整的說明,這邊就不多說明了,當開始執行程式時就會進行資料訓練. 由訓練結果最後acc=0.9447,表示準確率可以到達94%,我們再由實際測試可以看出該圖為7的圖示,由神經網路判斷為7,跟我們人類判斷相同,我們可以知道由訓練的結果可看得到不錯的準確度. 執行神經網路遇到不少問題,請參考下面連結,是筆者所整理的問題集,請多多指教 https://programdoubledragon.bl...

Python AI-問題集

Python AI-問題集 問題集 Jupyter Notebook執行ipywidgets會出現kernel死掉的錯誤發生(The kernel appears to have died) 解決方法 (1) 根據log檔來判斷問題: 例如:log訊息出現OMP: Error #15: Initializing libiomp5.dylib, but found libiomp5.dylib already initialized. (2) 根據問題關鍵字找出問題所在: 利用google查詢所遭遇到的問題,例如我把上面的問題上google查詢可以找到這篇的解法 https://blog.csdn.net/bingjianIT/article/details/86182096 (3)實作解法: 我實作下面解法後,就可以順利執行手寫辨識的程式. //在Python宣告時加入 import os os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE" 參考 https://blog.csdn.net/bingjianIT/article/details/86182096