新聞中心

EEPW首頁 > 業(yè)界動態(tài) > 科大訊飛胡郁:人工智能的發(fā)展未來與創(chuàng)業(yè)

科大訊飛胡郁:人工智能的發(fā)展未來與創(chuàng)業(yè)

作者: 時間:2017-02-15 來源:OFweek 安防網(wǎng) 收藏

  的前世今生

本文引用地址:http://butianyuan.cn/article/201702/343991.htm

  這一話題,最早可以回溯到1946 年世界上第一臺電子計算機(jī) ENIAC 的誕生。ENIAC 產(chǎn)生以后,很多計算機(jī)科學(xué)家對于計算機(jī)將來能夠代替人類做什么事情有很多聯(lián)想,其中最著名的一個人是圖靈,他在 1950 年左右在領(lǐng)域進(jìn)行了很多的探討,并且提出了著名的“圖靈測試”。而“人工智能”一詞真正被提出來,是在 1956 年Dartmouth 的會議上,由四位圖靈獎得主、信息論創(chuàng)始人和一位諾貝爾獎得主一起將“人工智能”定義出來,包括明斯基、西蒙、麥卡塞等人,這次會議也被公認(rèn)為人工智能研究的出生典禮。

  人工智能與機(jī)器人的關(guān)系在今天看來,“機(jī)器人”一詞出現(xiàn)更早,1920 年就第一次出現(xiàn)了 Robot 這個詞,原本是蒸汽機(jī)械時代出現(xiàn)的東西,主要基于機(jī)械原理,跟計算機(jī)數(shù)字化、數(shù)學(xué)沒有什么關(guān)系;但在表現(xiàn)形式上有所不同:比如想要開家里二樓的燈,如果通過人工智能,只需要對著系統(tǒng)說一句,系統(tǒng)就會從后臺對語音指令進(jìn)行分析并開燈;如果是機(jī)器人,則需要爬到二樓去把燈打開。正本清源,人工智能 (Artificial Intelligence) 是指,能夠和人一樣進(jìn)行感知、認(rèn)知、決策、執(zhí)行的人工程序或系統(tǒng)。然而,人工智能發(fā)展的 60 年不是一帆風(fēng)順的,起起伏伏共經(jīng)歷了三次浪潮。

  (1)1970 年第一次黃金期。自從Dartmouth 會議以后,人們陸續(xù)發(fā)明了第一款感知神經(jīng)網(wǎng)絡(luò)軟件和聊天軟件,那時大家都驚呼“人工智能來了,再過十年機(jī)器要超越人類了”。不過,很快到了 70 年代后期,人們發(fā)現(xiàn)過去的理論和模型,只能解決一些非常簡單的問題,很快人工智能進(jìn)入了第一次的冬天。

  (2)1990 年第二次黃金期。隨著1982 年 Hopfield 神經(jīng)網(wǎng)絡(luò)和 BP 訓(xùn)練算法的提出,大家發(fā)現(xiàn)人工智能的春天又來了。 80 年代又興起一波人工智能的熱潮,包括語音識別、語音翻譯以及日本提出的第五代計算機(jī)。不過,到了 90 年代后期,人們發(fā)現(xiàn)這種東西離我們的實際生活還很遙遠(yuǎn)。比如 IBM 在 90 年代時提出了一款語音聽寫的軟件叫 IBM Viavoice,在演示當(dāng)中效果不錯,但是真正用時卻很難使用。因此,在 2000 年左右第二次人工智能的浪潮又淹沒了。

  (3)現(xiàn)在到了人工智能真正爆發(fā)的前夜。隨著 2006 年 Hinton 提出的深度學(xué)習(xí)技術(shù),以及在圖像、語音識別和其他領(lǐng)域內(nèi)取得的一些成功,大家認(rèn)為經(jīng)過了兩次起伏,人工智能開始進(jìn)入了真正爆發(fā)的前夜??傊?,就國內(nèi)外人工智能公司這么多年的發(fā)展來看,使命是內(nèi)在的,階段性目標(biāo)是變化的。

  人工智能何時能到來?

  在我看來,人工智能時代的到來離不開人機(jī)交互模式的變革??梢钥吹?,自 60 年代至今,IT 產(chǎn)業(yè)已經(jīng)歷硬件、軟件、互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)與人工智能這五大浪潮,當(dāng)前已進(jìn)入物聯(lián)網(wǎng)產(chǎn)業(yè)萬物互聯(lián)的時代。在無屏、移動、遠(yuǎn)場狀態(tài)下,以語音為主,鍵盤、觸摸等為輔的人機(jī)交互時代正在到來。目前主要面臨兩種交互:一種是只需要語音即可,比如藍(lán)牙音箱、手環(huán)等,語音之外,不需要看到任何信息;另一種是語音+圖像,比如電視上的語音交互、手機(jī)等。在這種情況下,觸摸交互的學(xué)術(shù)名詞應(yīng)該叫做強(qiáng)視覺呈現(xiàn)的觸摸交互;而語音作為人機(jī)交互最自然的方式,將有效促進(jìn)人工智能與各行業(yè)的結(jié)合,讓人工智能更容易進(jìn)入大家的生活。除了語音交互,也在研究人臉識別技術(shù),其特色是可以將人臉識別與聲紋識別結(jié)合在一起,將聲音與圖片混合,來做活性檢測。

  由此,人工智能也將進(jìn)入“智能 +”的時代,人工智能與各個行業(yè)的深入結(jié)合蘊含著巨大的機(jī)會。除了交互,人工智能還可以用在教育、醫(yī)療、智慧城市、出行、司法、安全、金融等眾多領(lǐng)域;同時,它在各個行業(yè)里可以做一個最簡單的事情:就是替代人工。在未來的 10 年,人工智能會像技術(shù)的服務(wù)一樣,進(jìn)入到我們的生活當(dāng)中,每個人都將離不開。

  那么人工智能如何得以實現(xiàn)?在這里,我將人工智能的演進(jìn)發(fā)展分成三個階段:計算智能(能存會算)、感知智能(能聽會說,能看會認(rèn))和認(rèn)知智能(能理解會思考)。計算智能就是計算機(jī)與人類比存儲、比記憶,在此方面已經(jīng)遠(yuǎn)遠(yuǎn)超過人類了。不過,在感知層面,計算機(jī)在語音、圖像識別等方面與人類還有較大差距,讓計算機(jī)真正能理解、會思考、進(jìn)行自我學(xué)習(xí),還是很欠缺的。只有實現(xiàn)認(rèn)知智能的突破,AI 才能部分取代腦力勞動。

  人工智能與創(chuàng)業(yè)

  2016 年,人工智能產(chǎn)業(yè)得到了長足的發(fā)展,收獲了不少成功的案例。這里,我認(rèn)為至少有三個因素促進(jìn)了人工智能在產(chǎn)業(yè)界的成功:深度神經(jīng)網(wǎng)絡(luò)、大數(shù)據(jù)以及漣漪效應(yīng)。

  (1)深度神經(jīng)網(wǎng)絡(luò)。其模型和算法相對于傳統(tǒng)的方法,有著本質(zhì)的不同;雖然它與我們?nèi)祟惖纳窠?jīng)網(wǎng)絡(luò)相比,還有很多不足,但是確實在架構(gòu)和描述方面有其強(qiáng)大之處。

  (2)大數(shù)據(jù)。隨著移動互聯(lián)網(wǎng)的迅猛發(fā)展,數(shù)據(jù)每天都是以指數(shù)級增加:通過手機(jī)、微信等工具和軟件,人們可以隨時隨地把視覺、聽覺上的這些數(shù)據(jù)輕松地傳到網(wǎng)上,匯聚起來形成大數(shù)據(jù)。

  (3)漣漪效應(yīng)。隨著移動互聯(lián)網(wǎng)的發(fā)展,各種軟件、各種設(shè)備接觸用戶的門檻極大地降低了。例如,當(dāng)一款新的 APP 找到第一批用戶時,他們的使用行為和個人數(shù)據(jù)就被后臺記錄下來,開發(fā)者再對這種行為和記錄進(jìn)行迭代改進(jìn);當(dāng)再把 APP投向第二批用戶時,軟件的性能已經(jīng)比第一代產(chǎn)品有了較大提升,這就是漣漪效應(yīng)。

  可以說,漣漪效應(yīng)推動了語音辨識與圖片識別的發(fā)展,特別是語音識別的實用化,更是得益于“漣漪效應(yīng)”。在 2010 年推出語音識別產(chǎn)品時,識別率只有 60% 左右,剛開始大家都覺得很難用,但是有一批嘗鮮的用戶。隨著技術(shù)的迭代、更新,以及數(shù)據(jù)持續(xù)的迭代,如今訊飛語音識別率已經(jīng)提高到 95% 以上,達(dá)到了完全實用的狀態(tài)。圖像識別技術(shù)也同樣如此,ImageNet 圖像識別任務(wù)在 2012 年時錯誤率高達(dá) 26.2%,但是到 2015 年底已經(jīng)降到了 3.57%?;旧峡梢哉f,圖像識別技術(shù)的發(fā)展使得我們只要通過一個攝像頭,就能將家中的各種物體很輕易地分辨出來。

  因此,可以得出兩點結(jié)論:深度神經(jīng)網(wǎng)絡(luò)與大數(shù)據(jù)的結(jié)合已成為當(dāng)前主流路徑;而基于互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)的“研究—工程—產(chǎn)品—用戶”的閉環(huán)優(yōu)化加速了產(chǎn)品迭代優(yōu)化的進(jìn)程。

  當(dāng)然,對于人工智能領(lǐng)域的創(chuàng)業(yè)者來說,產(chǎn)品創(chuàng)新、系統(tǒng)創(chuàng)新以及商業(yè)模式的創(chuàng)新也都是非常重要的。從技術(shù)層面看,產(chǎn)品創(chuàng)新與系統(tǒng)創(chuàng)新是相對立存在的,產(chǎn)品創(chuàng)新可以是一些微創(chuàng)新,而系統(tǒng)創(chuàng)新所需的資金和時間耗費都很大,從沒有到開始立項,到最后商用需要 15~20 年,基本上創(chuàng)業(yè)者一輩子只能做出一個。從公司競爭角度看,現(xiàn)在的人工智能公司競爭不是單獨兩個公司,而是生態(tài)系統(tǒng)的競爭。比如創(chuàng)業(yè)公司很難獨立把人工智能做好,于是各大公司都要做人工智能平臺,包括的語音開放平臺,現(xiàn)在已有 23 萬開發(fā)者,每天服務(wù) 30~35 億次,連接的數(shù)目達(dá) 90 多億。

  同時,在這個過程中,商業(yè)模式的創(chuàng)新非常重要,即好的技術(shù)創(chuàng)新一定要配合好的商業(yè)模式創(chuàng)新。高科技企業(yè)的早期市場和主流市場之間存在著一條巨大的“鴻溝”,能否順利跨越鴻溝并進(jìn)入主流市場,成功贏得實用主義者的支持,就決定了一項高科技產(chǎn)品的成敗。破壞性創(chuàng)新之父——克里斯坦森提出:“大公司卓越有效的管理對于延續(xù)性創(chuàng)新的成功具有決定性的作用,而破壞式創(chuàng)新能夠讓創(chuàng)業(yè)公司和小公司擁有顛覆現(xiàn)有產(chǎn)業(yè)鏈的能力!”

  最后,我想給創(chuàng)業(yè)者提點個人建議:去玩兒的事業(yè)一定是你真心喜歡的事情,如果你去玩兒還不選你喜歡的事情,我想你一定是神經(jīng)病;去玩兒的事業(yè),一定要跟你喜歡的人一起去做,玩耍的過程比結(jié)果更重要。謀事在人成事在天,能成為馬云和馬化騰是歷史的必然,但成為這兩個具體的人一定有很多未然的因素;改變你能改變的,接受你不能改變的。所以,我覺得人工智能創(chuàng)業(yè)不管是做系統(tǒng)創(chuàng)新,還是做產(chǎn)品創(chuàng)新、微創(chuàng)新,我們要以這樣的心態(tài),真正去享受到我們生活中的每一個小細(xì)節(jié),同時要有使命感與宏偉藍(lán)圖!



關(guān)鍵詞: 科大訊飛 人工智能

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉