博客專欄

EEPW首頁 > 博客 > 不得不贊!一個國內(可能)最好的海量CV數(shù)據集獲取網站

不得不贊!一個國內(可能)最好的海量CV數(shù)據集獲取網站

發(fā)布人:計算機視覺工坊 時間:2020-09-23 來源:工程師 發(fā)布文章

在CV等計算機領域中,好的數(shù)據,對模型訓練至關重要。自己做數(shù)據,即昂貴又費時費力;但是,使用現(xiàn)成的數(shù)據集,即不好找又不好下載及使用。直到最近,CV君找到一個數(shù)據集獲取神器 Graviti Open Dataset。

    01    Graviti Open Dataset它是什么?

簡單點說,Graviti 是一個提供公開數(shù)據集的平臺,你可以很方便的搜索你想要的數(shù)據,可在線預覽樣例數(shù)據、標注、標簽,對于國外的數(shù)據不需要“梯子”、可高速免費下載。

下面將對其進行一個詳細介紹。

Graviti的公開數(shù)據集:

www.graviti.cn/open-datasets

?數(shù)據種類多

Graviti 收錄了 400 多個高質量 CV 類數(shù)據集,覆蓋無人駕駛、智慧零售、機器人等多種 AI 應用領域。舉兩個例子:

無人駕駛類

·  CityScapes (Semantic Understanding of Urban Street Scenes):https://www.graviti.cn/open-datasets/dataset-detail/CityScapes

1600824927133403.jpg


·   BDD100K (A Diverse Driving Dataset for Heterogeneous Multitask Learning):

https://www.graviti.cn/open-datasets/dataset-detail/BDD100K

1600824998536972.jpg

文字識別類

·  MNIST (Handwritten digits):

https://www.graviti.cn/open-datasets/dataset-detail/MNIST

1600825028671674.jpg

·  SVHN (The Street View House Numbers):

https://www.graviti.cn/open-datasets/dataset-detail/SVHN

1600825066405910.jpg

不僅種類多,還方便搜索,可以按應用行業(yè) , 標注類型進行篩選!查找簡單操作。

舉個例子,查找一個自動駕駛類的數(shù)據集,直接在搜索框輸入‘auto’。

1600825090788677.jpg

數(shù)據集詳情頁,除了詳細的介紹以外,數(shù)據概要(包含數(shù)據格式、數(shù)據量、大?。?、發(fā)布方、標注方也是一應俱全,一目了然。

?數(shù)據可視化

除了整合數(shù)據集信息以外,在線可視化也是亮點!無需下載直接可以瀏覽樣例數(shù)據,標注、標簽同樣可以輕松在線查看。

1600825137544100.png

甚至,提供了數(shù)據分布:

1600825166784492.png

?免費高速下載

除了以上兩個優(yōu)點之外,下載速度應該是許多小伙伴最關注的,特別是在下載一些國外大型數(shù)據集的時候,簡直是國內小伙伴的夢魘,在 Graviti 獲取數(shù)據集可以不用找梯子!不用再受網速限制!

只需進入數(shù)據集詳情頁,點擊即可獲取數(shù)據集,期間不用花費任何費用!

1600825206377136.jpg

親測效果

1600825226946938.jpg

    02    總結

Graviti 數(shù)據種類多、在線可視化、下載速度快、免費易獲?。?/p>

另外,除了托管公開標準的數(shù)據集,CV君發(fā)現(xiàn)該網站正在開發(fā)針對用戶的個性化的數(shù)據管理服務,包括數(shù)據免費托管,數(shù)據版本管理,在線可視化!還可以輕松地完成數(shù)據的拆分與合并!這對于開發(fā)自己數(shù)據集的同學無疑是個非常值得期待的功能。

*博客內容為網友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。



關鍵詞:

技術專區(qū)

關閉