IBM深度學習演算法新突破 大幅縮短培訓時間
IBM Research宣布深度學習演算法出現(xiàn)新的突破,IBM新的分布式深度學習(DDL)軟件讓每個添加的處理器之間實現(xiàn)線性加速比(linear speedup),該開發(fā)旨在為添加到IBM DDL演算法的每個服務器實現(xiàn)類似的加速效能。
本文引用地址:http://www.butianyuan.cn/article/201708/363171.htm據(jù)EETimes報導,IBM加速認知基礎設施部門主管Hillman Hunter認為,研究目標是將深度學習培訓的等待時間從幾天或幾小時,縮短到幾分鐘或幾秒鐘。
Hunter發(fā)文描述這項開發(fā)成果,是最受歡迎的深度學習框架擴展到服務器中的多個GPU,而不是使用GPU的多個服務器。Hunter進一步指出,IBM團隊編寫的軟件,可自動化和優(yōu)化跨數(shù)百個GPU加速器上,十幾個服務器所需要的龐大而復雜的并行運算任務。
IBM聲稱使用開源碼Caffe深度學習框架,將最多256個NVIDIA Tesla P100 GPU添加到單個服務器上,縮放效能為95%,可應用在圖像識別學習,以及類似的學習任務。IBM在50分鐘的培訓時間內實現(xiàn)幾乎線性的縮放效率。Facebook之前在同一資料庫上花60分鐘的培訓時間,效能為89%。
在ImageNet-22k資料庫上的7個小時的培訓中,IBM同樣聲稱對750萬幅影像的驗證精確度為33.8%,而微軟(Microsoft)之前針對同一資料庫花10天培訓,準確率為29.8%。IBM的處理器是PowerAI平臺,具備64節(jié)點Power8集群,加上256個NVIDIA GPU,提供超過2 petaFLOPS。
IBM正在向所有PowerAI平臺用戶免費提供DDL套件,還為第三方開發(fā)人員提供各種應用程式介面(API),讓開發(fā)人員選擇與應用程式(App)最相關的基本演算法。
評論