跳到主要內容

Python AI-神經網路

Python AI-神經網路

神經網路

標準NN

(1) 定義:

  • Fully Connected Neural Networks(NN)
  • 1980年開始流行
  • 輸入層 隱藏層 輸出層
  • 深度學習就是超過3層以上的隱藏層,每一層需要多少神經元
  • 每個神經元的動作是相同的
  • 多個輸入對應多個權重、 一個輸出

(2) 類神經網路圖示
我們可以將類神經網路是由很多神經元所組成,架構上可分為三層,第一層為輸入層(input layer)這一層是用來接收外面的資料,有可能是圖片、聲音、數字等等;第二層為隱藏層(hidden layer)用來訓練資料找到最佳函式表達(最佳解),此層可以多層的神經元組成;第三層輸出層(output layer) 將最佳解做輸出,此層只會有一個輸出.

神經元如何動作:每個神經元的動作是相同的,例如:H1接收到X1和X2的輸入值,反饋輸出不管輸入有幾條連結H1,他輸出值都會相同.
enter image description here

(3)公式解說
每個輸入的神經元都會有權重值(w1、w2…),這些權重值用來決定輸入值的比重,如果輸入值會影響輸出比較重,我們可以給他比較重的權重值.

公式1: 在所有輸入x權重的加總+b(調整值)可以得出一個輸出,如果這個輸出無法滿足答案,請看公式2
公式2: 通常輸出加上激活函數是才是最後的輸出答案

enter image description here

(3)激活函數(Active Function)
類神經網路需要激活函數的目的在公式1可以看到乘績之和所得到的結果,只是得到線性關係解.通常問題的本質大多為非線性,利用激活函數將輸出得到一個非線性的表達式,藉此達到問題的近似解.

*常見的激活函數

  • Sigmoid :模仿人類的類神經,輸入的刺激很小時,輸出就是0,反之輸出很大時,輸出也不會超過1
  • ReLU: 當輸入小於0,輸出就是0;輸入大於0,輸出等於輸入

enter image description here
參考:Mr. Opengate## 深度學習:使用激勵函數的目的、如何選擇激勵函數 Deep Learning : the role of the activation function

(4)神經網路訓練
神經網路可以透過訓練資料的方式來找到問題的解,所以我們可以定義一組訓練資料集{(X1,Y1)、(X2,Y2)、(X3,Y3)…},透過神經網路輸出可以發現有誤差值產生,利用平方的方式來可以獲取準確誤差值(因為用加總有可能會得到0),將誤差值再次輸入調整原函式,希望可以漸漸得到loss function差異越小,表示接近真實的函式表達

Loss Function:用來測量利用神經網路得到的函式與正確的函式差異值,如果loss function越小表示接近正確函式.
enter image description here

(5)神經網路訓練過程
神經網路的公式,會透過資料學習所去調整函式,我們可以知道新的權重Wx是由舊的所去取得,

enter image description here
參考:Backpropagation Step by Step
*W表示更新後的權重
W表示舊的權重
a 學習速率
error/w斜率

參考

  1. backpropagation
  2. https://mropengate.blogspot.com/2017/02/deep-learning-role-of-activation.html
  3. http://moocs.nccu.edu.tw/media/23054

留言

這個網誌中的熱門文章

JavaBean 和POJO

前言 今天介紹JavaBean和POJO的不同,這兩個名詞在JAVA文章常常被拿來使用以及討論。在JDK1.1時候釋出才有的一個標準架構,很多時候常常被搞混,所以我們特別開闢一章來加以討論。POJO規範在企業級應用已經廣大的被使用的規範。 解釋 POJO : 全名為Plain-old-Java-object,只需要繼承Object就可以,沒有特定規定,只要建立的類別有setter/getter方法都可以稱為POJO JavaBean: JavaBean通常用來封裝多個物件成為單獨物件使用,規範比較嚴格,規則如下 規則 說明 1 需要實作序列(Serializable/Externalizable) 2 不能有參數的建構子( no-arg constructor) 3 需要有公用setter/getter 4 屬性必須要私人(private) 5 屬於特定POJO規則 比較 所有的JavaBean都為POJO,但是所有的POJO不一定為JavaBean 都可以當作重複元件 都必須序列化 特性都為可用性、易用性和持久化使用 - 應用 由圖我們可以知道POJO在應用程式中,主要用來存取資料庫資料達到持久化的目的,並提供給商業邏輯流程處理使用。這種POJO的架構提供程式人員開發時的可以很有規則將資料封裝並加以使用。 範例1. JavaBean(以員工為實例) JavaBean建立員工物件,可以發現Employee物件建構子沒有任何參數,屬性為私有化並setter/getter的命名方式。 //實作序列化 public class Employee implements java.io.Serializable{ private int id; private String name; //無參數建構子 public Employee(){} //以下實作setter/getter public void setId(int id){this.id=id;} public int getId(){return id;} public void setName(String ...

Python AI-問題集

Python AI-問題集 問題集 Jupyter Notebook執行ipywidgets會出現kernel死掉的錯誤發生(The kernel appears to have died) 解決方法 (1) 根據log檔來判斷問題: 例如:log訊息出現OMP: Error #15: Initializing libiomp5.dylib, but found libiomp5.dylib already initialized. (2) 根據問題關鍵字找出問題所在: 利用google查詢所遭遇到的問題,例如我把上面的問題上google查詢可以找到這篇的解法 https://blog.csdn.net/bingjianIT/article/details/86182096 (3)實作解法: 我實作下面解法後,就可以順利執行手寫辨識的程式. //在Python宣告時加入 import os os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE" 參考 https://blog.csdn.net/bingjianIT/article/details/86182096

淺談機器學習原理-Nonlinear Transform

Nonlinear Transform 淺談機器學習原理-Nonlinear Transform Nonlinear Transform *通用能力 gerneralization : 就是將訓練好的模型,放到正式環境可以正常的運作,通常Linear Model的gerneralization會比較好,因為線性模型解決的問題比較單純。缺點是應用侷限比較大。 參考Chih-Chung Chang老師的範例:縣性與非線性分類範例 https://www.csie.ntu.edu.tw/~cjlin/libsvm/ 非線性問題 當如果今天假設要圈出裡面小圈圈的資料,我們就無法使用線性的模型,我們可以用非線性解像圈圈的方程式 s i g n ( − x 1 2 − x 2 2 + r ) sign(-x1^2-x2^2+r) s i g n ( − x 1 2 − x 2 2 + r ) 來解決,在演算法我們利用reduce來將不會的問題透過已知的問題來解決,所以在這個問題 我們將圈圈的方程式(非線性模型)reduce成線性模型來解決。 Reduce 方法論 我們調整圓形的方程式改為 z 0 z_0 z 0 ​ , z 1 z_1 z 1 ​ , z 2 z_2 z 2 ​ 來轉換線性方程式, { ( x n , y n ) } \{{(x_n,y_n)}\} { ( x n ​ , y n ​ ) } => { ( z n , y n ) } \{{(z_n,y_n)}\} { ( z n ​ , y n ​ ) } 在這空間資料中只要能找線,就可將不同的分類區分,圖中可以線性可以線去做分類。 透過向量方式來轉換成線性方程式 我們找到一個方式將非線性資料X透過向量轉換為Z後,希望透過線性方程式方式來學習,得到正解。 當我們Nonlinear transform轉換成線性方程式,當有新的資料進來我們無法使用invertiable(逆向工程)的方式去轉回非線...