摘要:你一定不想錯過這個全球較大的公開數據集。令人興奮的是,斯坦福普林斯頓等的研究人員聯手給大量的空間打了些標簽,并將標記數據以數據集的形式公開出來。這是目前世界上較大的公開數據集,其中的標注意義重大。
你一定不想錯過這個全球較大的公開3D數據集。
本文作者為Matt Bell,是3D掃描解決方案提供商Matterport的聯合創始人、首席戰略官。在本文中,Bell親述Matterport公開的這個數據集細節,我們隨他去看看。
一路走來,Matterport見證了3D數據集在深度學習多領域的巨大力量。我們在這個領域研究了很久,希望將一部分數據分享給研究者使用。令人興奮的是,斯坦福、普林斯頓、TUM等的研究人員聯手給大量的空間打了些標簽,并將標記數據以Matterport 3D數據集的形式公開出來。
這是目前世界上較大的3D公開數據集,其中的標注意義重大。
像ImageNet、COCO這種比較大的2D數據集創建于2010年左右,是高精2D圖像分類系統工具。我們希望Matterport這種3D+2D的數據集也能提升AI系統的認知力、理解力,帶動3D研究的發展。
Matterport的行業影響力巨大,從增強現實、機器人技術、3D重構到更好地理解3D圖像,我們一直在推進。
數據集“魔盒”
數據集中包含了10800張尺寸相同的全景圖(RGB+深度圖像),這些圖片是從90個建筑場景的194400張RGB色彩模式的深度圖像中挑選出來的,圖像均用Matterport的Pro 3D相機拍攝。
這些場景的3D模型已經用實例級對象分割做了標記,你可以在 https://matterport.com/gallery 網站中交互式探索不同的Matterport 3D重建模型。
幾種不同的解鎖姿勢
很高興地告訴大家,這個數據集非常實用。下面我將介紹Matterport研究的幾個方向。
目前,我們內部用這個數據集做過這樣一個系統,將用戶拍攝的照片分割成房間,并將其分類。這個系統的表現不錯,甚至在沒有門或隔斷隔開情況下,也能分辨出不同的房間類型(例如廚房和餐廳)。
此外,我們也在學習用深度學習方法填充3D傳感器夠不到的區域。這方便了用戶快速拍攝廣闊的開放空間,如倉庫、購物中心、商業地產、工廠和新類型的房間等。
不妨看一個簡單的示例。在這個例子中,我們的算法通過顏色和局部深度,預測深度值和深度傳感器的表面方向(法向量)。由于這些區域太遠,無法被深度傳感器探測到。
其實,我們還能用它在用戶拍攝的空間中劃分出不同對象。與現在3D模型不同的是,這些完全分割的模型能較精確識別空間中的物體。這樣就解鎖了很多使用姿勢,包括自動生成含有空間內容和特征的詳細列表,并自動看到不同家具在空間中的樣子。
我們還有個小目標,比如讓任何空間能夠被索引、搜索、排序和理解,讓用戶找到想要的東西。
比如,你想找到個地方度假,你希望那里有三間大臥室,配備著現代化廚房,客廳內還有內置的壁爐,在陽臺上能看到下面的池塘風景,還有一扇落地窗?我們可以做到。
比如,你想盤點辦公室里所有家具,想比較建筑工地上的管道和CAD模型是否一致?也so easy。
論文中還展示了一系列其他用例,包括通過深度學習的特性提高特征匹配、二維圖像的表面法向量估計,以及識別基于體素模型的架構特征和對象等。
我們的下一步
正如上面所說,你可以使用這些數據、代碼和論文,我們很愿意聽聽大家是如何使用它們的,也很期待與研究機構合作開展一些項目。
如果你對3D和更大的數據集感興趣,也歡迎加入我們,感謝參與項目的所有人。
最后,附數據集地址:
https://niessner.github.io/Matterport/
Code地址:
https://github.com/niessner/Matterport
論文下載地址:
https://arxiv.org/pdf/1709.06158.pdf
歡迎來到3D世界!
歡迎加入本站公開興趣群商業智能與數據分析群
興趣范圍包括各種讓數據產生價值的辦法,實際應用案例分享與討論,分析工具,ETL工具,數據倉庫,數據挖掘工具,報表系統等全方位知識
QQ群:81035754
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/4621.html
摘要:兩種相機的區別目前提供了幾種不同的相機,最常用的,也是下面插件中使用的兩種相機是透視相機正交投影相機。上面的圖很清楚的解釋了兩種相機的區別右側是正交投影相機他不具有透視效果,即物體的大小不受遠近距離的影響,對應的是投影中的正交投影。導讀 本文從繪圖基礎開始講起,詳細介紹了如何使用Three.js開發一個功能齊全的全景插件。 我們先來看一下插件的效果: showImg(https://user...
摘要:導讀本文從繪圖基礎開始講起,詳細介紹了如何使用開發一個功能齊全的全景插件。兩種相機的區別目前提供了幾種不同的相機,最常用的,也是下面插件中使用的兩種相機是透視相機正交投影相機。 導讀 本文從繪圖基礎開始講起,詳細介紹了如何使用Three.js開發一個功能齊全的全景插件。 我們先來看一下插件的效果: showImg(https://segmentfault.com/img/remote/...
摘要:導讀本文從繪圖基礎開始講起,詳細介紹了如何使用開發一個功能齊全的全景插件。兩種相機的區別目前提供了幾種不同的相機,最常用的,也是下面插件中使用的兩種相機是透視相機正交投影相機。 導讀 本文從繪圖基礎開始講起,詳細介紹了如何使用Three.js開發一個功能齊全的全景插件。 我們先來看一下插件的效果: showImg(https://segmentfault.com/img/remote/...
摘要:淘寶造物節的活動頁就是全景的一個很贊的頁面,它將全景圖分割成等份,相鄰的元素構成的夾角,相鄰兩側面相對于棱柱中心所構成的夾角。 本文轉自凹凸實驗室:https://aotu.io/notes/2016/08... showImg(https://segmentfault.com/img/remote/1460000011381045); 前言 3D 全景并不是什么新鮮事物了,但以前...
閱讀 2346·2021-11-15 11:37
閱讀 2624·2021-09-23 11:21
閱讀 2951·2021-09-07 10:11
閱讀 3163·2019-08-30 15:53
閱讀 2825·2019-08-29 15:13
閱讀 1606·2019-08-26 13:57
閱讀 1097·2019-08-26 12:23
閱讀 2437·2019-08-26 11:51