無需大量神經(jīng)元，用神經(jīng)形態(tài)機器人玩桌上足球，兼具速度與準確率

發(fā)布人：機器之心時間：2022-03-08 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

與深度學(xué)習(xí)不同，類腦電路需要真實世界的測試。

人類似乎著迷于讓機器玩游戲，早在 1770 年就有發(fā)明家發(fā)明了國際象棋游戲機，名為「土耳其機器人」，他們聲稱這臺機器可以擊敗任何一名游戲玩家（其實這是一個人工智能騙局）；1997 年 IBM 的超級計算機深藍在比賽中擊敗卡斯巴羅夫，成為第一個在標準比賽時限內(nèi)擊敗國際象棋世界冠軍的電腦系統(tǒng)；之后由 DeepMind 哈薩比斯領(lǐng)銜的團隊開發(fā)了 AlphaGo，這是第一個擊敗人類職業(yè)圍棋選手、第一個戰(zhàn)勝圍棋世界冠軍的智能體。
為什么眾多研究者對生物體的信息傳輸和感知方式感興趣？坦率地講，這是因為生物體優(yōu)于當(dāng)今的計算技術(shù)，今天的計算技術(shù)似乎正在迅速達到極限。商品傳感器產(chǎn)生的數(shù)據(jù)太多，計算機無法理解，這些計算機在試圖理解它們時消耗了太多的能量。然而在生物界，不起眼的蚊子，它的大腦僅由大約 200000 個神經(jīng)元組成，但它的飛行控制和避障能力卻遠遠優(yōu)于人類構(gòu)造的任何東西；在能耗方面，蜜蜂的大腦有 100 萬個神經(jīng)元，功耗卻只有 0.1mW；人類大腦只需消耗約 20 W 的能量就能夠滿足日常工作，行動等。但對于機器來說，以 GPT-3 為例，單次訓(xùn)練的能耗就相當(dāng)于 126 個丹麥家庭一年的能源消耗。這就是生物智能，與傳統(tǒng)人工智能之間一個很大的差別。
截止目前，哪怕是最先進的超級計算機，其復(fù)雜程度也無法與大腦媲美。計算機是線性的，主要依靠高速中樞，在中央處理器和存儲芯片之間實現(xiàn)數(shù)據(jù)的傳輸。相比之下，大腦則處于全方位的互聯(lián)狀態(tài)，其密度和多樣性均是現(xiàn)代計算機的數(shù)十億倍。近年來，計算機微型化使得傳統(tǒng)計算性能得到大幅提升，但存儲器與中央處理器之間數(shù)據(jù)的傳輸會消耗大量能源，產(chǎn)生多余熱量，這一瓶頸限制了計算機的進一步改進。
近年來，受大腦神經(jīng)系統(tǒng)的啟發(fā)，神經(jīng)形態(tài)計算成為人工智能領(lǐng)域的一個重要研究方向，近日，來自澳大利亞西悉尼大學(xué)國際神經(jīng)形態(tài)系統(tǒng)中心（ICNS）的研究者構(gòu)造了一個神經(jīng)形態(tài)機器人來玩桌上足球。
用神經(jīng)形態(tài)傳感器追蹤運動的小球
首先 ICNS 構(gòu)建了一個可以玩彈球機（pinball）的小型機器人 demo，該機器人可以將三個小球保持在桌子上，演示效果與人類玩家大致相同。令人驚訝的是，與常見的深度學(xué)習(xí)系統(tǒng)中有數(shù)十萬或數(shù)百萬個人工神經(jīng)元不同，這種微小的神經(jīng)形態(tài)僅使用兩個人工神經(jīng)元就可以解釋和作用于基于事件的成像器的輸入。

在彈球游戲上取得了不錯的效果之后，該團隊認為需要一項更復(fù)雜和要求更高的任務(wù)來進一步推動神經(jīng)形態(tài)研究，因此將目光轉(zhuǎn)向了桌上足球。
桌上足球所有動作都發(fā)生在二維空間中，只需要八個電機來控制桌子上的小人物即可，但這實現(xiàn)起來比想象的要困難得多。多年來，人們曾多次嘗試構(gòu)建機器人桌上足球，都取得了不同程度的成功，但都沒有使用神經(jīng)形態(tài)傳感器。
一般來講，使用神經(jīng)形態(tài)傳感器跟蹤球很容易，然而，桌上足球是一種更具動態(tài)性的游戲，尤其是當(dāng)涉及人類玩家時，每個人都有不同的策略，他們的動作并不總是合乎邏輯或者必要的。
有些研究者嘗試使用非神經(jīng)形態(tài)解決方案（例如深度學(xué)習(xí)）來玩桌上足球，然而深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的處理方式（通常在 GPU 上）不太適合此類任務(wù)，因為 GPU 不是一次只處理一幀，而是處理批量圖像。在桌上足球中，玩家不關(guān)心球過去在哪里，甚至都不關(guān)心球現(xiàn)在在哪里；他們真正關(guān)心的是球接下來會在哪里。
其次，研究者發(fā)現(xiàn)深度學(xué)習(xí)方法對問題的微小變化極為敏感，攝像頭的輕微晃動、球員向不同方向拉動時球臺的輕微傾斜，甚至照明條件的變化都會導(dǎo)致深度學(xué)習(xí)球跟蹤器的性能崩潰。
ICNS 的研究著眼于更簡單、更快的神經(jīng)形態(tài)網(wǎng)絡(luò)，這些算法處理來自相機的每個事件（在神經(jīng)形態(tài)計算中也稱為脈沖），并使用它們來更新球位置估計。
該神經(jīng)形態(tài)網(wǎng)絡(luò)沒有使用大量的神經(jīng)元層，而是使用 16 個小型模式識別網(wǎng)絡(luò)，每個網(wǎng)絡(luò) 18 x 18 像素，因此在游戲中的任何時候都只需考慮 364 個像素，這使得該網(wǎng)絡(luò)非?？焖偾液軠蚀_。速度是至關(guān)重要的，因為事件驅(qū)動算法需要跟上相機產(chǎn)生的時間敏感數(shù)據(jù)，每個事件只需要一些小而簡單的計算。雖然這個系統(tǒng)不會對經(jīng)驗豐富的球員構(gòu)成太大的威脅，但該網(wǎng)絡(luò)跟蹤已經(jīng)可以阻擋對方的球，而進球得分仍是一項正在進行的工作。

原則上，深度學(xué)習(xí)可以執(zhí)行類似的操作，但它需要查看整個圖像，并對網(wǎng)絡(luò)的每一層執(zhí)行更多數(shù)量級的計算。這不僅比該系統(tǒng)使用的數(shù)據(jù)多得多，而且還有效地將事件驅(qū)動（event-driven）的輸出轉(zhuǎn)換回幀。

目前，ICNS 的算法基于記錄的事件數(shù)據(jù)離線訓(xùn)練，使用了一種遺傳最優(yōu)解算法，既可以學(xué)習(xí)球的外觀，也可以很好地估計它接下來的位置。該算法學(xué)習(xí)如何從數(shù)據(jù)本身中識別球，而不是通過任何編碼。此外，算法還從球的實際移動方式中學(xué)習(xí)，而不是基于對球的移動預(yù)期，這一點很關(guān)鍵。
下一步，ICNS 將把基于離線訓(xùn)練的學(xué)習(xí)遷移到實時在線學(xué)習(xí)，讓網(wǎng)絡(luò)在游戲進行中不斷學(xué)習(xí)和適應(yīng)。這或許有助于系統(tǒng)對其訓(xùn)練所在的特定桌子的靈敏度。
這種事件驅(qū)動算法是使用脈沖神經(jīng)形態(tài)硬件（neuromorphic hardware）工作的算法的中間步驟。目前已有一些受大腦啟發(fā)的處理器，包括英特爾的類腦芯片 Loihi、世界首家神經(jīng)形態(tài)處理器商業(yè)生產(chǎn)商 BrainChip 的 Akida，它們將信息編碼為脈沖序列，并與基于事件的傳感器自然契合。一旦有了穩(wěn)定的脈沖算法，神經(jīng)形態(tài)計算就將取得更多進展。
最后，ICNS 團隊表示，在設(shè)計機器人玩桌上足球時，他們專注于降低成本并開源整個項目。
原文鏈接：https://spectrum.ieee.org/robotic-foosball-table

*博客內(nèi)容為網(wǎng)友個人發(fā)布，僅代表博主個人觀點，如有侵權(quán)請聯(lián)系工作人員刪除。

博客專欄

無需大量神經(jīng)元，用神經(jīng)形態(tài)機器人玩桌上足球，兼具速度與準確率

相關(guān)推薦

技術(shù)專區(qū)

博客專欄

無需大量神經(jīng)元，用神經(jīng)形態(tài)機器人玩桌上足球，兼具速度與準確率

相關(guān)推薦

技術(shù)專區(qū)

無需大量神經(jīng)元，用神經(jīng)形態(tài)機器人玩桌上足球，兼具速度與準確率