中科院自動(dòng)化所研究登上Science子刊：自組織反向傳播提升網(wǎng)絡(luò)學(xué)習(xí)效率

發(fā)布人：機(jī)器之心時(shí)間：2021-10-22 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

在圖像識(shí)別任務(wù)中，引入 SBP 能讓識(shí)別準(zhǔn)確度稍稍提高，計(jì)算成本還能降低 57%。

在人工智能領(lǐng)域，目前人工神經(jīng)網(wǎng)絡(luò)中被廣泛使用的反向傳播算法（Backpropagation，BP）采用全局優(yōu)化策略，這種端到端的學(xué)習(xí)方法性能卓越，但學(xué)習(xí)過程能量消耗大，且缺乏靈活性。中科院腦智卓越中心徐波、蒲慕明聯(lián)合研究團(tuán)隊(duì)近期借助生物網(wǎng)絡(luò)中發(fā)現(xiàn)的介觀尺度自組織反向傳播機(jī)制（Self-backpropagation，SBP），在更具效率和靈活性的類腦局部學(xué)習(xí)方法方面取得了重要進(jìn)展。

該研究的論文《Self-backpropagation of synaptic modifications elevates the efficiency of spiking and artificial neural networks》已于 2021 年 10 月 20 日（美東時(shí)間）在線發(fā)表于《科學(xué)》子刊《Science Advances》上。

論文地址：https://www.science.org/doi/10.1126/sciadv.abh0146

借助 SBP 降低計(jì)算能耗

SBP 的發(fā)現(xiàn)最早可以追溯到 1997 年。蒲慕明團(tuán)隊(duì)在 Nature 雜志上撰文發(fā)現(xiàn)海馬體內(nèi)的神經(jīng)元可以將長(zhǎng)時(shí)程抑制（Long-term depression，LTD）可塑性自組織地傳播到三個(gè)方向，分別是突觸前側(cè)向傳播（Presynaptic lateral spread）、突觸后側(cè)向傳播（Postsynaptic lateral spread）、反向傳播（Backpropagation）[1]，這個(gè)發(fā)現(xiàn)就是自組織反向傳播神經(jīng)可塑性機(jī)制（SBP）。

后續(xù)研究證實(shí)，SBP 現(xiàn)象具有普遍性，不僅覆蓋更多的神經(jīng)區(qū)域如視網(wǎng)膜 - 頂蓋系統(tǒng) [2]，還覆蓋更多的可塑性類型 [3]，如長(zhǎng)時(shí)程增強(qiáng)（Long-term potentiation，LTP）。該機(jī)制的發(fā)生歸結(jié)于生物神經(jīng)元內(nèi)分子調(diào)制信號(hào)的天然逆向傳遞，被認(rèn)為是可能導(dǎo)致生物神經(jīng)網(wǎng)絡(luò)高效反饋學(xué)習(xí)的關(guān)鍵 [4]。

中科院研究團(tuán)隊(duì)受到該機(jī)制的啟發(fā)，對(duì) SBP 的反向傳播方向（第三個(gè)方向）單獨(dú)構(gòu)建數(shù)學(xué)模型（圖 1A），重點(diǎn)描述了神經(jīng)元輸出突觸的可塑性可以反向傳播到輸入突觸中（圖 1B），可塑性的發(fā)生可以通過時(shí)序依賴突觸可塑性（Spike timing-dependent plasticity，STDP），也可以通過人工局部梯度調(diào)節(jié)。在標(biāo)準(zhǔn)三層脈沖神經(jīng)網(wǎng)絡(luò)（Spiking neural network，SNN）的學(xué)習(xí)過程中，SBP 機(jī)制可以自組織地完成前一層網(wǎng)絡(luò)權(quán)重的學(xué)習(xí)，且可以結(jié)合短時(shí)突觸可塑性（Short-term plasticity，STP）、膜電位平衡（Homeo-static membrane potential）等，形成更強(qiáng)大的 SNN 組合學(xué)習(xí)方法（圖 1C）。

圖 1：SBP 在 SNN 中的應(yīng)用。（A），SBP 可塑性機(jī)制。（B），SBP 在 SNN 中的局部反向傳播。（C），SBP 和其它可塑性機(jī)制在 SNN 中的組合優(yōu)化。

在一類人工神經(jīng)網(wǎng)絡(luò)（Artificial neural network，ANN）如受限玻爾茲曼機(jī)網(wǎng)絡(luò)（Restricted Boltzmann machine，RBM）的學(xué)習(xí)中（圖 2A），SBP 機(jī)制也可以替換迭代過程中部分 BP 機(jī)制，實(shí)現(xiàn)交替的協(xié)作優(yōu)化（圖 2B-E）。針對(duì) SNN 和 RBM 的不同，團(tuán)隊(duì)又分別設(shè)置了兩種不同的能量函數(shù)約束，來保證訓(xùn)練過程中網(wǎng)絡(luò)參數(shù)學(xué)習(xí)的平穩(wěn)性。

圖 2：SBP 在 RBM 中的應(yīng)用。（A），SBP 和 BP 在 RBM 中的組合優(yōu)化。（B），SBP 和 BP 的交替協(xié)作流程。（C），RBM 中的標(biāo)準(zhǔn) Sleep Phase。（D），含有 SBP 的 Wake Phase。（E），含有 BP 的 Wake Phase。

此外，研究團(tuán)隊(duì)針對(duì)性地提出了一種統(tǒng)計(jì)訓(xùn)練過程中能量消耗的新方法（圖 3）。在圖片分類（MNIST）、語音識(shí)別（NETtalk）、動(dòng)態(tài)手勢(shì)識(shí)別（DvsGesture）等多類標(biāo)準(zhǔn)數(shù)據(jù)集上，SBP 機(jī)制通過組合其它可塑性機(jī)制，實(shí)現(xiàn)了更低能耗和更高精度的 SNN 局部學(xué)習(xí)（圖 4）。在 ANN-RBM 的學(xué)習(xí)中，SBP 機(jī)制也可以大量的替換 BP 機(jī)制實(shí)現(xiàn)全局和局部交叉學(xué)習(xí)，在降低計(jì)算能耗同時(shí)卻不損失精度（圖 5）。如圖 5C 所示，使用 SBP 進(jìn)行訓(xùn)練的計(jì)算成本比僅使用 BP 進(jìn)行訓(xùn)練時(shí)降低了約 57.1%。

圖 3：訓(xùn)練能量消耗的計(jì)算方法。（A），平均迭代次數(shù)。（B），每次迭代中的算法復(fù)雜度。

圖 4：在 MNIST、NETtalk、DvsGesture 三個(gè)數(shù)據(jù)集上的性能對(duì)比。（A,C,E），SBP 分別取得了基于梯度和基于可塑性方法的 SNN 最優(yōu)性能。（B,D,F），SBP 分別取得了基于梯度和基于可塑性方法的 SNN 最低能耗。

圖 5：SBP 有助于 RBM 提升精度和降低能耗。（A-C），在 MNIST 數(shù)據(jù)集中，SBP 可以少量降低 RBM 的訓(xùn)練誤差（A），可以同時(shí)平衡精度和能耗得到最優(yōu)的 Wake Phase 次數(shù)（B），且可以顯著降低訓(xùn)練能耗（C）。（D-I），在 NETtalk 和 DvsGesture 數(shù)據(jù)集中，SBP 得到了和在 MNIST 中類似的結(jié)論。

研究人員認(rèn)為，SBP 是一類介觀尺度的特殊生物可塑性機(jī)制，該機(jī)制同時(shí)在 SNN 和 ANN 中獲得了廣泛的組合優(yōu)化優(yōu)勢(shì)，對(duì)進(jìn)一步深入探索類腦局部計(jì)算具有很大的啟示性。生物智能計(jì)算的本質(zhì)，很可能就是靈活融合多類微觀、介觀等可塑性機(jī)制的自組織局部學(xué)習(xí)，結(jié)合遺傳演化賦予的遠(yuǎn)程投射網(wǎng)絡(luò)結(jié)構(gòu)，實(shí)現(xiàn)高效的全局優(yōu)化學(xué)習(xí)效果。該工作可以進(jìn)一步引導(dǎo)生物和人工網(wǎng)絡(luò)的深度融合，最終實(shí)現(xiàn)能效比高、可解釋性強(qiáng)、靈活度高的新一代人工智能模型。

中國(guó)科學(xué)院自動(dòng)化研究所類腦智能研究中心張鐵林副研究員為該研究第一作者，徐波研究員為通訊作者，程翔（博士生）、賈順程（博士生）、蒲慕明研究員和曾毅研究員為共同作者。相關(guān)研究工作得到了國(guó)家自然科學(xué)基金委、先導(dǎo) B 等項(xiàng)目的資助。

參考文獻(xiàn)：

[1] Fitzsimonds, R. M., Song, H. J. & Poo, M. M. Propagation of activity-dependent synaptic depression in simple neural networks. Nature 388, 439-448, (1997).

[2] Du, J. L. & Poo, M. M. Rapid BDNF-induced retrograde synaptic modification in a developing retinotectal system. Nature 429, 878-883, (2004).

[3] Du, J. L., Wei, H. P., Wang, Z. R., Wong, S. T. & Poo, M. M. Long-range retrograde spread of LTP and LTD from optic tectum to retina. Proceedings of the National Academy of Sciences of the United States of America 106, 18890-18896, (2009).

[4] Bi, G. & Poo, M. Synaptic modification by correlated activity: Hebb's postulate revisited. Annual Review of Neuroscience, 24, 139-166, (2001).

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

博客專欄

中科院自動(dòng)化所研究登上Science子刊：自組織反向傳播提升網(wǎng)絡(luò)學(xué)習(xí)效率

相關(guān)推薦

技術(shù)專區(qū)