不得不贊!一個國內(可能)最好的海量CV數(shù)據集獲取網站
在CV等計算機領域中,好的數(shù)據,對模型訓練至關重要。自己做數(shù)據,即昂貴又費時費力;但是,使用現(xiàn)成的數(shù)據集,即不好找又不好下載及使用。直到最近,CV君找到一個數(shù)據集獲取神器 Graviti Open Dataset。
01 Graviti Open Dataset它是什么?
簡單點說,Graviti 是一個提供公開數(shù)據集的平臺,你可以很方便的搜索你想要的數(shù)據,可在線預覽樣例數(shù)據、標注、標簽,對于國外的數(shù)據不需要“梯子”、可高速免費下載。
下面將對其進行一個詳細介紹。
Graviti的公開數(shù)據集:
www.graviti.cn/open-datasets
?數(shù)據種類多
Graviti 收錄了 400 多個高質量 CV 類數(shù)據集,覆蓋無人駕駛、智慧零售、機器人等多種 AI 應用領域。舉兩個例子:
無人駕駛類
· CityScapes (Semantic Understanding of Urban Street Scenes):https://www.graviti.cn/open-datasets/dataset-detail/CityScapes
· BDD100K (A Diverse Driving Dataset for Heterogeneous Multitask Learning):
https://www.graviti.cn/open-datasets/dataset-detail/BDD100K
文字識別類
· MNIST (Handwritten digits):
https://www.graviti.cn/open-datasets/dataset-detail/MNIST
· SVHN (The Street View House Numbers):
https://www.graviti.cn/open-datasets/dataset-detail/SVHN
不僅種類多,還方便搜索,可以按應用行業(yè) , 標注類型進行篩選!查找簡單操作。
舉個例子,查找一個自動駕駛類的數(shù)據集,直接在搜索框輸入‘auto’。
數(shù)據集詳情頁,除了詳細的介紹以外,數(shù)據概要(包含數(shù)據格式、數(shù)據量、大?。?、發(fā)布方、標注方也是一應俱全,一目了然。
?數(shù)據可視化
除了整合數(shù)據集信息以外,在線可視化也是亮點!無需下載直接可以瀏覽樣例數(shù)據,標注、標簽同樣可以輕松在線查看。
甚至,提供了數(shù)據分布:
?免費高速下載
除了以上兩個優(yōu)點之外,下載速度應該是許多小伙伴最關注的,特別是在下載一些國外大型數(shù)據集的時候,簡直是國內小伙伴的夢魘,在 Graviti 獲取數(shù)據集可以不用找梯子!不用再受網速限制!
只需進入數(shù)據集詳情頁,點擊即可獲取數(shù)據集,期間不用花費任何費用!
親測效果
02 總結
Graviti 數(shù)據種類多、在線可視化、下載速度快、免費易獲?。?/p>
另外,除了托管公開標準的數(shù)據集,CV君發(fā)現(xiàn)該網站正在開發(fā)針對用戶的個性化的數(shù)據管理服務,包括數(shù)據免費托管,數(shù)據版本管理,在線可視化!還可以輕松地完成數(shù)據的拆分與合并!這對于開發(fā)自己數(shù)據集的同學無疑是個非常值得期待的功能。
*博客內容為網友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。