Wayve利用強(qiáng)化學(xué)習(xí)技術(shù)及“獎(jiǎng)懲制度” 實(shí)現(xiàn)雷諾Twizy的自動(dòng)駕駛導(dǎo)航
據(jù)外媒報(bào)道,人工智能初創(chuàng)企業(yè)Wayve認(rèn)為,應(yīng)該尋找更好的方式來(lái)為自動(dòng)駕駛汽車提供駕駛培訓(xùn),而非致力于配置更為成熟的硬件及詳細(xì)的3D地圖。該公司于近日發(fā)布了一個(gè)視頻,展示了改款雷諾Twizy車型(雙座版電動(dòng)車)是如何自學(xué)自動(dòng)駕駛導(dǎo)航的。該車輛利用強(qiáng)化學(xué)習(xí)(機(jī)器學(xué)習(xí)技術(shù)的一種),該系統(tǒng)在作出理想的操作后,會(huì)獲得“獎(jiǎng)賞”,而作出不理想的操作后,將會(huì)受到“懲罰”。
本文引用地址:http://butianyuan.cn/article/201807/383134.htm目前,大部分在研發(fā)的自動(dòng)駕駛系統(tǒng)均依賴3D明細(xì)地圖來(lái)提供導(dǎo)航,全球各大公司競(jìng)相創(chuàng)建新地圖,利用成熟的傳感器及攝像頭技術(shù),繪制詳細(xì)的城市街道及高速地圖。換言之,自動(dòng)駕駛系統(tǒng)需要其攝像頭及傳感器復(fù)雜體系的支持,從而實(shí)現(xiàn)導(dǎo)航操作。
不幸的是,3D地圖是一項(xiàng)勞動(dòng)密集型的工作,需要頻繁更新地圖中的建筑物。從事3D地圖業(yè)務(wù)的各公司計(jì)劃優(yōu)先關(guān)注并繪制交通量高的道路,再繪制郊區(qū)地圖。
Wayve的技術(shù)或?qū)⑻蕴?D地圖。在視頻中,雷諾Twizy車型只搭載了一款前置攝像頭(大多數(shù)的自動(dòng)駕駛車輛均配置了多款攝像頭。以特斯拉的Autopilot為例,其車型搭載了8個(gè)攝像頭)。相較之下,雷諾Twizy車型采用一個(gè)攝像頭向圖像處理單元(graphics processing unit,GPU)提供實(shí)時(shí)信息,該款GPU可運(yùn)行Wayve公司的強(qiáng)化學(xué)習(xí)算法,可控制車輛的加速、制動(dòng)及轉(zhuǎn)向。
在車輛學(xué)習(xí)過(guò)程中,后備駕駛員坐在駕駛座內(nèi),每當(dāng)車輛偏離道路時(shí),會(huì)“懲罰”一次系統(tǒng)。當(dāng)人為干預(yù)操作的間隔期越久,系統(tǒng)所獲得的“獎(jiǎng)勵(lì)”就越多。
在近20分鐘時(shí)間里,車輛能夠指出應(yīng)如何解決多彎道路況的行駛問(wèn)題。
若Wayve持續(xù)研發(fā)其強(qiáng)化學(xué)習(xí)算法,未來(lái)自動(dòng)駕駛車輛似乎不再依賴3D地圖,這意味著所有人都將因自動(dòng)駕駛車輛而獲益,享受出行樂(lè)趣。
評(píng)論