無需大量神經(jīng)元,用神經(jīng)形態(tài)機器人玩桌上足球,兼具速度與準確率
與深度學(xué)習(xí)不同,類腦電路需要真實世界的測試。
人類似乎著迷于讓機器玩游戲,早在 1770 年就有發(fā)明家發(fā)明了國際象棋游戲機,名為「土耳其機器人」,他們聲稱這臺機器可以擊敗任何一名游戲玩家(其實這是一個人工智能騙局);1997 年 IBM 的超級計算機深藍在比賽中擊敗卡斯巴羅夫,成為第一個在標準比賽時限內(nèi)擊敗國際象棋世界冠軍的電腦系統(tǒng);之后由 DeepMind 哈薩比斯領(lǐng)銜的團隊開發(fā)了 AlphaGo,這是第一個擊敗人類職業(yè)圍棋選手、第一個戰(zhàn)勝圍棋世界冠軍的智能體。
為什么眾多研究者對生物體的信息傳輸和感知方式感興趣?坦率地講,這是因為生物體優(yōu)于當(dāng)今的計算技術(shù),今天的計算技術(shù)似乎正在迅速達到極限。商品傳感器產(chǎn)生的數(shù)據(jù)太多,計算機無法理解,這些計算機在試圖理解它們時消耗了太多的能量。然而在生物界,不起眼的蚊子,它的大腦僅由大約 200000 個神經(jīng)元組成,但它的飛行控制和避障能力卻遠遠優(yōu)于人類構(gòu)造的任何東西;在能耗方面,蜜蜂的大腦有 100 萬個神經(jīng)元,功耗卻只有 0.1mW;人類大腦只需消耗約 20 W 的能量就能夠滿足日常工作,行動等。但對于機器來說,以 GPT-3 為例,單次訓(xùn)練的能耗就相當(dāng)于 126 個丹麥家庭一年的能源消耗。這就是生物智能,與傳統(tǒng)人工智能之間一個很大的差別。
截止目前,哪怕是最先進的超級計算機,其復(fù)雜程度也無法與大腦媲美。計算機是線性的,主要依靠高速中樞,在中央處理器和存儲芯片之間實現(xiàn)數(shù)據(jù)的傳輸。相比之下,大腦則處于全方位的互聯(lián)狀態(tài),其密度和多樣性均是現(xiàn)代計算機的數(shù)十億倍。近年來,計算機微型化使得傳統(tǒng)計算性能得到大幅提升,但存儲器與中央處理器之間數(shù)據(jù)的傳輸會消耗大量能源,產(chǎn)生多余熱量,這一瓶頸限制了計算機的進一步改進。
近年來,受大腦神經(jīng)系統(tǒng)的啟發(fā),神經(jīng)形態(tài)計算成為人工智能領(lǐng)域的一個重要研究方向,近日,來自澳大利亞西悉尼大學(xué)國際神經(jīng)形態(tài)系統(tǒng)中心(ICNS)的研究者構(gòu)造了一個神經(jīng)形態(tài)機器人來玩桌上足球。
用神經(jīng)形態(tài)傳感器追蹤運動的小球
首先 ICNS 構(gòu)建了一個可以玩彈球機(pinball)的小型機器人 demo,該機器人可以將三個小球保持在桌子上,演示效果與人類玩家大致相同。令人驚訝的是,與常見的深度學(xué)習(xí)系統(tǒng)中有數(shù)十萬或數(shù)百萬個人工神經(jīng)元不同,這種微小的神經(jīng)形態(tài)僅使用兩個人工神經(jīng)元就可以解釋和作用于基于事件的成像器的輸入。
在彈球游戲上取得了不錯的效果之后,該團隊認為需要一項更復(fù)雜和要求更高的任務(wù)來進一步推動神經(jīng)形態(tài)研究,因此將目光轉(zhuǎn)向了桌上足球。
桌上足球所有動作都發(fā)生在二維空間中,只需要八個電機來控制桌子上的小人物即可,但這實現(xiàn)起來比想象的要困難得多。多年來,人們曾多次嘗試構(gòu)建機器人桌上足球,都取得了不同程度的成功,但都沒有使用神經(jīng)形態(tài)傳感器。
一般來講,使用神經(jīng)形態(tài)傳感器跟蹤球很容易,然而,桌上足球是一種更具動態(tài)性的游戲,尤其是當(dāng)涉及人類玩家時,每個人都有不同的策略,他們的動作并不總是合乎邏輯或者必要的。
有些研究者嘗試使用非神經(jīng)形態(tài)解決方案(例如深度學(xué)習(xí))來玩桌上足球,然而深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的處理方式(通常在 GPU 上)不太適合此類任務(wù),因為 GPU 不是一次只處理一幀,而是處理批量圖像。在桌上足球中,玩家不關(guān)心球過去在哪里,甚至都不關(guān)心球現(xiàn)在在哪里;他們真正關(guān)心的是球接下來會在哪里。
其次,研究者發(fā)現(xiàn)深度學(xué)習(xí)方法對問題的微小變化極為敏感,攝像頭的輕微晃動、球員向不同方向拉動時球臺的輕微傾斜,甚至照明條件的變化都會導(dǎo)致深度學(xué)習(xí)球跟蹤器的性能崩潰。
ICNS 的研究著眼于更簡單、更快的神經(jīng)形態(tài)網(wǎng)絡(luò),這些算法處理來自相機的每個事件(在神經(jīng)形態(tài)計算中也稱為脈沖),并使用它們來更新球位置估計。
該神經(jīng)形態(tài)網(wǎng)絡(luò)沒有使用大量的神經(jīng)元層,而是使用 16 個小型模式識別網(wǎng)絡(luò),每個網(wǎng)絡(luò) 18 x 18 像素,因此在游戲中的任何時候都只需考慮 364 個像素,這使得該網(wǎng)絡(luò)非??焖偾液軠蚀_。速度是至關(guān)重要的,因為事件驅(qū)動算法需要跟上相機產(chǎn)生的時間敏感數(shù)據(jù),每個事件只需要一些小而簡單的計算。雖然這個系統(tǒng)不會對經(jīng)驗豐富的球員構(gòu)成太大的威脅,但該網(wǎng)絡(luò)跟蹤已經(jīng)可以阻擋對方的球,而進球得分仍是一項正在進行的工作。
原則上,深度學(xué)習(xí)可以執(zhí)行類似的操作,但它需要查看整個圖像,并對網(wǎng)絡(luò)的每一層執(zhí)行更多數(shù)量級的計算。這不僅比該系統(tǒng)使用的數(shù)據(jù)多得多,而且還有效地將事件驅(qū)動(event-driven)的輸出轉(zhuǎn)換回幀。
目前,ICNS 的算法基于記錄的事件數(shù)據(jù)離線訓(xùn)練,使用了一種遺傳最優(yōu)解算法,既可以學(xué)習(xí)球的外觀,也可以很好地估計它接下來的位置。該算法學(xué)習(xí)如何從數(shù)據(jù)本身中識別球,而不是通過任何編碼。此外,算法還從球的實際移動方式中學(xué)習(xí),而不是基于對球的移動預(yù)期,這一點很關(guān)鍵。
下一步,ICNS 將把基于離線訓(xùn)練的學(xué)習(xí)遷移到實時在線學(xué)習(xí),讓網(wǎng)絡(luò)在游戲進行中不斷學(xué)習(xí)和適應(yīng)。這或許有助于系統(tǒng)對其訓(xùn)練所在的特定桌子的靈敏度。
這種事件驅(qū)動算法是使用脈沖神經(jīng)形態(tài)硬件(neuromorphic hardware)工作的算法的中間步驟。目前已有一些受大腦啟發(fā)的處理器,包括英特爾的類腦芯片 Loihi、世界首家神經(jīng)形態(tài)處理器商業(yè)生產(chǎn)商 BrainChip 的 Akida,它們將信息編碼為脈沖序列,并與基于事件的傳感器自然契合。一旦有了穩(wěn)定的脈沖算法,神經(jīng)形態(tài)計算就將取得更多進展。
最后,ICNS 團隊表示,在設(shè)計機器人玩桌上足球時,他們專注于降低成本并開源整個項目。
原文鏈接:https://spectrum.ieee.org/robotic-foosball-table
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。