博客專欄

EEPW首頁 > 博客 > 讓機器“看”得更清楚!計算機視覺正在成為AI的“時代寵兒”

讓機器“看”得更清楚!計算機視覺正在成為AI的“時代寵兒”

發(fā)布人:深科技 時間:2021-08-27 來源:工程師 發(fā)布文章

當今時代,處于第三波浪潮的 AI 正迎來加速發(fā)展時期,AI 技術不斷突破,應用大規(guī)模爆發(fā),大量布局 AI 的科技巨頭和創(chuàng)業(yè)公司逐漸涌上潮頭。

計算機視覺作為 AI 市場的最大分支,無論是在技術成熟度、商業(yè)化進程,還是在市場增長速度、投融資熱度等方面,自始至終都是人工智能領域最熱門的行業(yè)之一。


計算機視覺的應用領域幾乎涵蓋了我們所知的所有行業(yè),如自動駕駛、金融風控、安防、新零售、智能手機、智能機器人......

據(jù) IDC 預測,中國人工智能市場將在 2024 年形成千億市場規(guī)模,而計算機視覺占比將超過一半,未來廣闊前景引人遐想。

計算機視覺邁入發(fā)展快車道


人工智能大家已經(jīng)耳熟能詳,但計算機視覺在排除行業(yè)從事者之外,卻很少有人能解釋的清楚。

那么究竟何謂計算機視覺呢?

簡單來說,人類通過眼睛感知和理解周邊的世界,而計算機視覺則是一門研究如何使機器“看”的科學。更進一步的說,就是用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,并進一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。


20 世紀 60 年代,貝爾實驗室研發(fā)的一種將光子轉化為電脈沖的器件,很快成為了高質(zhì)量數(shù)字圖像采集任務的新寵,逐漸應用于工業(yè)相機傳感器,標志著計算機視覺走上應用舞臺;70 年代中期,MIT人工智能實驗室正式開設計算機視覺課程;1982 年,《視覺》一書的問世,標志著計算機視覺成為了一門獨立學科。

進入 21 世紀以來,計算機視覺領域蓬勃發(fā)展,各種理論與方法大量涌現(xiàn),并在多個核心問題上取得了令人矚目的成果。尤其是近年來,國內(nèi)外巨頭紛紛布局計算機視覺領域,開設計算機視覺研究實驗室,并以計算機視覺新系統(tǒng)和技術賦能原有的業(yè)務,開拓全新戰(zhàn)場。

企業(yè)差異化路徑漸顯
隨著 AI 時代的到來,計算機視覺賽道的商業(yè)化進程不斷加速,計算機視覺已經(jīng)成為傳統(tǒng)產(chǎn)業(yè)不可或缺的重要環(huán)節(jié)。

計算機視覺龍頭企業(yè)也逐漸呈現(xiàn)出不同方向的差異化經(jīng)營戰(zhàn)略,有的發(fā)力云端平臺、有的聚焦于前端軟硬件一體方案、有的專注醫(yī)療影像分析、有的深入金融領域。

以 “AI 四小龍” 為例,商湯科技、依圖科技、曠視科技、云從科技在各自道路上的差異化戰(zhàn)略開始顯現(xiàn),百花齊放的行業(yè)盛世雛形正逐漸形成。

商湯科技創(chuàng)立于 2014 年,專注于計算機視覺與深度學習底層法的研究開發(fā),以原創(chuàng)技術為核心賦能產(chǎn)業(yè),應用覆蓋行業(yè)范圍最為廣泛。當前商湯科技正在集中于計算機視覺的后端市場,聚焦于云端、平臺的搭建,將自身定位于基礎平臺型公司。

例如在安防領域,商湯正在全力打造城市級視覺中心平臺,希望通過自身強大的 AI 算法協(xié)助城市級別的海量數(shù)據(jù)處理。

此外商湯還聯(lián)合湖北省博物館打造“虛擬曾侯乙編鐘”,通過 AR 技術讓觀眾敲響兩千年前的古代樂器;與故宮文化合作,在“金榜題名”互動式展覽中將孔子等比例還原,讓現(xiàn)代人也能與孔圣人行禮,實現(xiàn)“跨時空互動”。

曠視科技成立于 2011 年,深耕金融安全、城市安防、手機 AR、商業(yè)物聯(lián),工業(yè)機器人五大核心行業(yè),致力于為企業(yè)級用戶提供全球領先的人工智能產(chǎn)品和行業(yè)解決方案。

曠視科技的發(fā)展戰(zhàn)略與商湯截然相反,作為一個以人工智能算法起家的“輕”企業(yè),曠視正在從計算機視覺算法后端向前端覆蓋。為擺脫依靠軟件平臺變現(xiàn)難的問題,曠視科技的研發(fā)工作向產(chǎn)業(yè)鏈上游的硬件端延伸,推出了人工智能攝像頭、邊緣計算設備等。

依圖科技成立于 2012 年,致力于將計算機視覺人工智能創(chuàng)新性研究與行業(yè)應用相結合,具備較為先進的算法和極強的工程應用能力。依圖科技強調(diào)優(yōu)質(zhì)算法基礎上產(chǎn)品化、工程化能力的重要性,并將安防和醫(yī)學影像分析作為其發(fā)展的重要戰(zhàn)略。
依圖科技與北京協(xié)和醫(yī)院、華西醫(yī)院、浙江省人民醫(yī)院、復旦大學附屬腫瘤醫(yī)院等多家頂級三甲醫(yī)院合作,推出了 care.ai 醫(yī)療智能全棧式產(chǎn)品解決方案,為醫(yī)院提供跨科室的多場景應用系統(tǒng)和數(shù)據(jù)分析平臺。

云從科技于 2015 年成立,孵化于中科院重慶研究所,源于云從科技深厚的國家隊背景,云從科技與國內(nèi)大型****合作密切。

云從自主研發(fā)的金融行業(yè)解決方案已覆蓋金融各個領域,包括****、互聯(lián)網(wǎng)金融、證券、基金、保險、汽車金融等。目前,云從科技在金融領域的布局,短期內(nèi)以搶占****線下網(wǎng)點智慧化改造市場為主,長期則是切入金融機構核心風控業(yè)務。

除了 “AI四小龍”,還有一些計算機視覺企業(yè)同樣憑借先進技術走上了差異化的發(fā)展道路,在AI市場獨樹一幟的同時確定了自身的領先地位。

以影譜科技為例,作為 AI 影像生產(chǎn)行業(yè)領航者,影譜科技對于計算機視覺應用的另一大爆發(fā)點——智能影像有著極為深刻的認知。

作為 AI 視覺生成技術的最佳代表,影譜科技定義了 AI 影像生產(chǎn)引擎 AGC,推出全新的智能影像檢索、生成、渲染及創(chuàng)建工具集、云服務,升級的數(shù)字人解決方案,及高質(zhì)量光照與物理模擬系統(tǒng)等,以 AI 生成技術賦能傳媒、文教、體育等多個產(chǎn)業(yè);同時,推出 AI+DT 深度融合的AI數(shù)字孿生引擎 ADT,用于提供商品數(shù)字模型和商業(yè)空間感知解決方案,全面構建影像級、全模態(tài)、全場景、可交互的 AI 數(shù)字商業(yè)生態(tài)。

正是在影譜科技的獨家技術支持下,央視網(wǎng)體育首位虛擬 AI 主播正式推出上線,首次亮相即創(chuàng)造流量高峰。近日,影譜科技還與高端生活電器企業(yè)海爾智護達成戰(zhàn)略合作,將基于影譜 AI 數(shù)字孿生平臺共建家庭數(shù)智生態(tài)體系,把人工智能及數(shù)字化能力充分應用到智能制造、消費體驗、數(shù)字化管理等環(huán)節(jié)中,為智能家電和消費者搭建“數(shù)字橋梁”。

總的來說,差異化的戰(zhàn)略不僅有利于計算機視覺企業(yè)的成長,也將充分激發(fā)全行業(yè)發(fā)展?jié)摿?,打造出一個“百家爭鳴”的良性市場競爭格局
視覺技術 “多點開花”
計算機視覺涉及多個技術分支,包括人臉識別、物體識別、場景識別、影像識別、手勢識別、視頻結構化、OCR(光學字符識別)等。其中人臉識別可以說是布局最為廣泛且最為外界熟知的技術,幾乎所有企業(yè)均有布局。

人臉識別是一種身份鑒定的識別技術,非接觸性和非強制性特征使其在各類場景中廣泛應用,比如金融領域的身份驗證、零售環(huán)節(jié)的面部識別支付、商業(yè)服務領域的自動識別客戶等方面。其中,“AI 四小龍” 的人臉識別準確率甚至已超過 99%。


不過計算機視覺的發(fā)展并不局限于單點技術的爆發(fā)。事實上,商湯科技、曠視科技、影譜科技等企業(yè)在多項技術上其實均有布局。

比如商湯科技布局了智能影像、醫(yī)學圖像、智能汽車等技術,近日還推出了集算力、算法、平臺于一身的 SenseCore 商湯 AI 大裝置??赏ㄟ^自動化生產(chǎn),自適應應用的方式,全面解析物理世界所涉及的各種錯綜復雜的數(shù)據(jù)應用。簡單地說,有了 AI 大裝置這種基礎設施,在城市中的商圈、園區(qū)、街道等各種場景,都可以實現(xiàn)虛擬與現(xiàn)實的智能化連接

曠視科技打造了 Brain++ AI 生產(chǎn)力平臺,核心技術除人臉識別,還包括計算機攝影學、智能視覺傳感器、機器人導航和定位等,“物體識別”“文本識別”“圖像分類”“物體檢測”等功能均可快速實現(xiàn),從而支持曠視科技向垂直領域快速擴張;

影譜科技通過構建影像商業(yè)化引擎 ACM、影像工業(yè)化引擎 AGC、數(shù)字孿生引擎 ADT 三重引擎,深度覆蓋智慧文娛、智慧媒體、智慧科教、數(shù)字商業(yè)等核心場景,提供一站式智能影像解決方案,助力關鍵產(chǎn)業(yè)數(shù)智化升級。

從數(shù)據(jù)收集、到算法模型,再到算力提升,雖然計算機視覺技術在不斷進步,但與此同時,多個行業(yè)痛點問題也隨之浮現(xiàn)。

首先是計算機視覺迫切需要填補海量數(shù)據(jù)計算需求所面臨的算力缺口,這意味著企業(yè)需要高額的成本用于算力訓練;其次計算機視覺的應用場景仍有拓展余地,而不應總將注意力聚焦在無人駕駛、數(shù)字娛樂、安防監(jiān)控、醫(yī)療等少數(shù)領域;最后,一旦市場進入平穩(wěn)發(fā)展的飽和期,企業(yè)或?qū)⒚媾R市場的篩選和淘汰。

不過“禍兮福之所倚,福兮禍之所伏”,這些問題的出現(xiàn)也代表著計算機視覺尚有廣闊的市場空間可供挖掘。隨著計算機視覺技術日漸成熟,企業(yè)商業(yè)化落地能力不斷提高,計算機視覺市場規(guī)模或?qū)⒂瓉硗黄菩园l(fā)展。

未來,伴隨著計算機從理論到應用的速度加快,高質(zhì)量的各種視覺數(shù)據(jù)不斷沉淀,相信無論是在農(nóng)業(yè)還是工業(yè)領域,無論是視頻直播還是游戲,一定還會有更多好玩炫酷的計算機視覺應用逐一亮相。

-End-


*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。



關鍵詞: 計算機視覺

相關推薦

技術專區(qū)

關閉