新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 進(jìn)階指南 > OpenVINO?工具包公共模型概述

OpenVINO?工具包公共模型概述

作者: 時(shí)間:2021-06-17 來源:英特爾 收藏

  ?工具包提供了一組,您可以將其用于學(xué)習(xí)和演示目的,或者用于開發(fā)深度學(xué)習(xí)軟件。

本文引用地址:http://www.butianyuan.cn/article/202106/426375.htm

  最新版本可在Github上的回購(gòu)中找到。

  您可以下載模型并使用?模型下載器和其他自動(dòng)化工具將它們轉(zhuǎn)換為推理引擎格式(*.xml+*.bin)。

分類

1623913733175158.png

分割

  語(yǔ)義分割是目標(biāo)檢測(cè)問題的延伸。

  語(yǔ)義分割模型不返回邊界框,而是返回輸入圖像的“繪制”版本,其中每個(gè)像素的“顏色”表示某個(gè)類別。

  這些網(wǎng)絡(luò)比各自的目標(biāo)檢測(cè)網(wǎng)絡(luò)大得多,但它們提供了更好的(像素級(jí))目標(biāo)定位,并且它們可以檢測(cè)到形狀復(fù)雜的區(qū)域。

語(yǔ)義分割

1623915693621405.jpg

實(shí)例分割

  實(shí)例分割是目標(biāo)檢測(cè)和語(yǔ)義分割問題的延伸。與預(yù)測(cè)每個(gè)對(duì)象實(shí)例周圍的邊界框不同,實(shí)例分割模型為所有實(shí)例輸出像素級(jí)掩碼。

1623915725857867.jpg

3D語(yǔ)義分割

1623915768793650.jpg

目標(biāo)檢測(cè)

  幾個(gè)檢測(cè)模型可以用來檢測(cè)一組最流行的對(duì)象——例如,人臉、人、車輛。大多數(shù)網(wǎng)絡(luò)都基于固態(tài)硬盤,并提供合理的精度/性能權(quán)衡。

1623915800298729.jpg

1623915800564775.jpg

1623915800974137.jpg

面部識(shí)別

1623915883238989.jpg

人體姿態(tài)估計(jì)

  人體姿態(tài)估計(jì)任務(wù)是為輸入圖像或視頻中的每個(gè)人預(yù)測(cè)一個(gè)姿態(tài):身體骨架,它由關(guān)鍵點(diǎn)和它們之間的聯(lián)系組成。關(guān)鍵點(diǎn)是身體關(guān)節(jié),即耳朵、眼睛、鼻子、肩膀、膝蓋等。這種方法有兩大類:自上而下和自下而上。首先在給定的幀中檢測(cè)人,裁剪或重新縮放檢測(cè),然后為每個(gè)檢測(cè)運(yùn)行姿態(tài)估計(jì)網(wǎng)絡(luò)。這些方法非常準(zhǔn)確。第二個(gè)查找給定幀中的所有關(guān)鍵點(diǎn),然后按個(gè)人實(shí)例對(duì)它們進(jìn)行分組,這樣比以前更快,因?yàn)榫W(wǎng)絡(luò)只運(yùn)行一次。

1623915905924790.jpg

單目深度估計(jì)

  單目深度估計(jì)的任務(wù)是基于單一輸入圖像預(yù)測(cè)深度(或逆深度)地圖。由于這個(gè)任務(wù)在一般情況下包含一些模糊性,所以得到的深度圖通常只定義一個(gè)未知的比例因子。

表8.JPG

圖像修復(fù)

  圖像修復(fù)的任務(wù)是估計(jì)合適的像素信息來填充圖像中的空洞。

1623915956897181.jpg

風(fēng)格轉(zhuǎn)移

  風(fēng)格轉(zhuǎn)移任務(wù)是將一個(gè)圖像的風(fēng)格轉(zhuǎn)移到另一個(gè)圖像。

表10.JPG

動(dòng)作識(shí)別

  動(dòng)作識(shí)別的任務(wù)是預(yù)測(cè)正在短視頻剪輯上執(zhí)行的動(dòng)作(通過堆疊來自輸入視頻的采樣幀形成的張量)。

1623915978520968.jpg

彩色化

  彩色化任務(wù)是從灰度圖像中預(yù)測(cè)場(chǎng)景的顏色。

1623916000926760.jpg

聲音分類

  聲音分類的任務(wù)是預(yù)測(cè)音頻片段中有哪些聲音。

1623916028742272.jpg

語(yǔ)音識(shí)別

  語(yǔ)音識(shí)別的任務(wù)是識(shí)別口語(yǔ)并將其翻譯成文本。

1623916045579807.jpg

圖像翻譯

  圖像翻譯的任務(wù)是基于樣本生成輸出。

1623916062232202.jpg

位置識(shí)別

  地點(diǎn)識(shí)別的任務(wù)是快速準(zhǔn)確地識(shí)別給定查詢照片的位置。

1623916077957722.jpg

使(模糊的圖像)變清晰

  圖像去模糊的任務(wù)。

1623916094423429.jpg




關(guān)鍵詞: OpenVINO 公共模型

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉