深度學習基礎概念筆記

作者：時間：2018-07-25 來源：網絡

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

學習 tensorflow，caffe 等深度學習框架前，需要先了解一些基礎概念。本文以筆記的形式記錄了一個零基礎的小白需要先了解的一些基礎概念。

本文引用地址：http://butianyuan.cn/article/201807/383751.htm

人工智能，機器學習和深度學習的關系

人工智能(Artificial Intelligence)——為機器賦予人的智能

強人工智能(General AI)：無所不能的機器，它有著我們所有的感知(甚至比人更多)，我們所有的理性，可以像我們一樣思考

弱人工智能(Narrow AI)：弱人工智能是能夠與人一樣，甚至比人更好地執(zhí)行特定任務的技術。例如，Pinterest 上的圖像分類;或者 Facebook 的人臉識別。

強人工智能是愿景，弱人工智能是目前能實現(xiàn)的。

機器學習—— 一種實現(xiàn)人工智能的方法

機器學習最基本的做法，是使用算法來解析數據、從中學習，然后對真實世界中的事件做出決策和預測。

深度學習——一種實現(xiàn)機器學習的技術

機器學習可以通過神經網絡來實現(xiàn)?？梢詫⑸疃葘W習簡單理解為，就是使用深度架構(比如深度神經網絡)的機器學習方法。目前深度架構大部分時候就是指深度神經網絡。

神經網絡組成

一個神經網絡由許多神經元組成，每個圓圈是一個神經元，每條線表示神經元之間的連接。x 表示的輸入數據，y 表示的是輸出數據，w 表示每層連接的權重。w 也就是我們構造完神經網絡之后需要確定的。

最左邊的叫做輸入層，這層負責接受輸入數據。

最右邊的叫做輸出層，我們可以從這層獲取神經網絡輸出數據

輸入層和輸出層之間叫做隱藏層。隱藏層層數不定，簡單的神經網絡可能是 2-3 層，復雜的也可能成百上千層，隱藏層較多的就叫做深度神經網絡。

深層網絡比淺層網絡的表達能力更強，能夠處理更多的數據。但是深度網絡的訓練更加復雜。需要大量的數據，很多的技巧才能訓練好一個深層網絡。

問題：假設計算速度足夠快，是不是深度網絡越深越好?

不是。深度網絡越深，對架構和算法的要求就越高。在超過架構和算法的瓶頸后，再增加深度也是徒勞。

神經元(感知器)

神經網絡由一個個的神經元構成，而一個神經元也由三部分組成。

輸入權值每個輸入會對應一個權值 w，同時還會有一個偏置值 b。也就是圖中的 w0。訓練神經網絡的過程，其實就是確定權值 w 的過程。

激活函數經過權值運算之后還會經歷激活函數再輸出。比如我們可以用階躍函數 f 來表示激活函數。

輸出最終的輸出，感知器的輸出可以用這個公式來表示

神經元可以擬合任意的線性函數，如最簡單擬合 and 函數。

and 函數真值表如上圖所示。取 w1 = 0.5;w2 = 0.5 b = -0.8。激活函數取上面示例的階躍函數 f 表示?？梢则炞C此時神經元能表示 and 函數。

如輸入第一行，x1 = 0，x2 = 0 時，可以得到

y 為 0，這就是真值表的第一行。

在數學意義上，可以這樣理解 and 函數的神經元。它表示了一個線性分類問題，它就像是一條直線把分類 0(false，紅叉)和分類 1(true，綠點)分開

而實際上，神經元在數學上可以理解為一個數據分割問題。神經元是將神經網絡轉換成數學問題的關鍵。比如需要訓練神經網絡做一個分類器，那么在數學上可以將輸入的參數(x1，x2...，xn)理解為 m 維坐標系(設 x 是 m 元向量)上的 n 個點，而每個神經元則可以理解為一個個擬合函數。取 m 為 2，放在最簡單的二維坐標系里面進行理解。

此時輸入參數對應的是下圖中的黑點，每個神經元就是黑線(由于激勵函數的存在，不一定像下圖一樣是線性的，它可以是任意的形狀)。神經網絡由一個個神經元組成，這些神經元表示的擬合函數相互交錯就形成了各種各樣的區(qū)域。在下圖中可以直觀的看到，此時分類問題就是一個數學的問題，輸入參數落在 A 區(qū)域，那么就認為他是分類 1，落在 B 區(qū)域，則認為他是分類 2。依次類推，我們便建立了神經網絡分類器在數學上的表現(xiàn)含義。

激活函數

事實上，一個神經元不能擬合異或運算。在下圖中可以直觀的看到，你無法直接用一條直線將分類 0 和分類 1 分隔開。

此時可以借助激活函數來做分割。激活函數選擇閥值函數，也就是當輸入大于某個值時輸出 1(激活),小于等于那個值則輸出 0(沒有激活)。

擬合異或函數的神經網絡如圖所示：

圖中神經網絡分成三層。在第二層中，如果輸入大于 1.5 則輸出 1，否則 0;第三層，如果輸入大于 0.5，則輸出 1，否則 0.

第一層到第二層(閥值 1.5)：

第二層到第三層(閥值 0.5)：

可以看到最終結果與異或結果吻合。

其實，這里放在數學上理解體現(xiàn)的是一個升維思想。放在二維坐標中無法分割的點，可以放在三維坐標中分割。上面的神經網絡可以理解為只有最后一層，三個參數的神經元。激活函數是用來構造第三個參數的方式。這樣等同于將三個點放在三維坐標系中做數據分割。相當于在二維中無法解決中的問題升維到三維中解決。

深度學習過程

構造神經網絡

確定學習目標

學習

如何進行深度學習，過程基本都可以分為這三步來做。用一個簡單的例子來說明。如圖，假設我們需要通過深度學習來識別手寫圖片對應的數字。

1.構造神經網絡。這里可以采用最簡單的全連接神經網絡，也可以采用卷積神經網絡。同時確定神經元的激勵函數，神經網絡的層數等?；A概念篇不做過多介紹

2.確定學習目標。這里簡單假設我們所有輸入的都是手寫的數字圖片。那么這里就有 10 個輸出，分別對應 0~9 的數字的比例。我們用 [y0,y1,...y9]表示，每個 y 值代表這張圖可能對應該數字的概率(y0 表示這張圖是數字 0 的概率)。對于上圖中第一個輸入圖片，在訓練過程中，我們知道第一張圖片輸出應該是數字 5。于是我們期望輸出是 [0,0,0,0,0,1,0,0,0,0]。但是實際上，我們的模型不是完美的，肯定會有誤差，我們得到的結果可能是 [0,0,0.1,0,0,0.88,0,0,0,0.02]。那么就會有個訓練得到的結果和期望結果的誤差。

這時候我們的學習目標也就是希望這個誤差能夠最小。誤差用 L 來表示，學習目標就是找到權值 w，使得 L 最小。當然，這里涉及到我們需要用一個公式來表達這個誤差 L，這個公式選取也很有學問，不同的公式最終在學習過程時收斂速度是不一樣的，通過訓練模型得到的權值 w 也是不一樣的。這里先不多介紹。

3.學習。假設我們神經模型確定下來的權值 w 與 L 的關系如圖所示(這里我們考慮最簡單的二維坐標下的情況，原理是相通的，推廣到多元坐標也是適用的)。由于數學模型的復雜，這里找最小值 L 的過程其實是找局部最小值的過程。

新聞中心

深度學習基礎概念筆記

評論

相關推薦

技術專區(qū)