摘要:整個系統采用了目前較先進的衣物檢測和跟蹤技術。然后對這些候選框進行跟蹤,得到明星同款在視頻中的的運動軌跡。
《從視頻到電商:視頻衣物較精確檢索》圍繞視頻電商業務場景,提出了一個在線視頻衣物較精確檢索系統。該系統能夠滿足用戶在觀看影視劇時想要同時購買明星同款的需求。
整個系統采用了目前較先進的衣物檢測和跟蹤技術。針對明星同款檢索中存在的多角度、多場景、遮擋等問題,提出可變化的深度樹形結構(ReconfigurableDeep Tree structure)利用多幀之間的相似匹配解決單一幀檢索存在的遮擋、模糊等問題。該結構可以認為是對現有attention模型的一種擴展,可以用來解決多模型融合問題。
論文技術在天貓魔盒視頻中應用
業務場景及研究問題:視頻電商中的衣物較精確匹配
早在2014年,阿里與優酷土豆發布視頻電商戰略,稱未來可以實現邊看邊買,使得視頻電商的概念,繼微博電商,朋友圈電商之后浮出水面。電商平臺擁有少量商品,而視頻網站具有巨大的流量,二者結合是發展的必然結果。電商平臺可以借助視頻網站的流量來實現導流和平臺下沉,而視頻網站則需要通過廣告點擊和商品成交來實現流量變現,因此二者的結合可謂一拍即合。
視頻電商的商業主旨是打造以視頻為入口的購物服務,視頻中出現所有物體都可能是商品,提供包括邊看邊買、明星同款、廣告投放等服務,它集娛樂、休閑、購物于一體,給用戶構造出一種“身臨其境”情境營銷,或者是明星同款的沖動式消費。視頻電商目前已經不是停留在概念層次了,視頻網站向電商的導流轉化也一直在不斷的嘗試中。
?
影視劇中的服飾存在較大的差異性和異構性,同一個目標往往展現出較大的差異。服飾購物圖像通常具有雜亂、多樣的背景,而且常在戶外拍攝。多樣化的背景可能是建筑物,街道、風景、汽車等多種情況。由于自然場景下受到光線、角度、大小、分辨率、幾何學和光度學的變化等影響,使得服飾呈現出現的外形極為復雜,即使是同一件服飾也會出現變化較大的效果。
同時在線網站為更好地展示服飾的效果,通常聘請時尚模特穿著所售商品,模特/人物姿勢變化也是導致服飾變化的一個重要因素。由于以上這些因素,使得視頻明星同款搜索成為了一個極具挑戰性的技術問題。
網絡結構及技術細節
AsymNet網絡結構:整個Asymnet深度神經網絡結構如圖1所示。當用戶通過機頂盒(天貓魔盒)觀看視頻時,該網絡將從電商網站(淘寶、天貓)檢索到與之匹配的衣服,并推薦給用戶。
為忽略復雜背景對檢索結果的影響,更準確的進行服裝定位,我們首先應用服飾檢測技術,提取得到服飾區域一組候選框。然后對這些候選框進行跟蹤,得到明星同款在視頻中的的運動軌跡。對于衣物候選區域和運動軌跡我們分別利用用圖像特征網絡(IFN)和視頻特征網絡(VFN)進行特征學習。
考慮到服裝的運動軌跡,衣物較精確檢索問題被定義為不對稱(多對單)匹配問題,我們提出可變化的深度樹形結(Reconfigurable Deep Tree Structure),利用多幀之間的相似匹配解決單一幀檢索存在的遮擋、模糊等問題。后續本文將詳細介紹模型的各個部分。
圖 1 Asymnet深度神經網絡結構
圖像特征網絡(IFN):傳統CNN網絡要求輸入圖像為固定的227x227(因為CNN網絡中的卷積層需要有一個確定的預定義的維度)。在視頻電商業務場景中,因為衣物檢測候選框為任意大小,尺度變化很大,傳統CNN網絡無法進行有效的特征學習。
針對這一問題,我們利用空間金字塔池化結構(SPP)體系結構,如圖2所示。它通過空間池聚合最后一個卷積層的特征,從而使池區域的大小與輸入的大小無關。
圖 2 Asymnet圖像特征網絡(IFN)
視頻特征網絡 (VFN):為了更好的考慮視頻的空間序列模式,進一步提高衣物檢索的性能。基于 LSTM,我們提出了視頻特征網絡 (VFN),如圖3所示。其中實驗驗證明兩層堆疊式 LSTM 結構能夠在視頻特征學習中得到較佳性能。
圖 3 Asymnet視頻特征網絡(VFN)
相似性網絡:明星同款匹配不同于近似衣物檢索,較精確匹配要求完全一致。在完全一致的要求下,傳統的通過相似性計算來進行檢索的方法,不能滿足明星同款較精確匹配要求。已有的方法通常將較精確匹配問題轉換為一個二分類問題,但這種方式適應性差,只能利用單一時刻的視頻幀。
為了能夠利用整個衣物運動軌跡,我們提出了如下的可變化的深度樹形結構(ReconfigurableDeep Tree structure)將匹配問題轉換為邏輯回歸問題。匹配網絡擬采用基于混合專家系統的邏輯回歸網絡。該結構可以認為是對現有attention模型的一種擴展,可以用來解決多模型融合問題。
圖 4 Asymnet相似性網絡
整個模型的目標函數是綜合考慮每一幀的匹配結果,得到基于整個衣物運動序列和電商衣物的相似性,整個系統可以建模為對如下目標公式進行求解:
試驗結果:我們利用業務數據和的衣物檢索方法進行了對比,試驗結果如下表所示。相對于alexnet,Asymnet在前20的檢索較精確率指標上,其性能幾乎提高了進一倍。
相對于其他2種網絡CS和RC,我們發現RC的性能略優于CS,因為RC具有較強的識別能力差異較小(采用多任務學習)。甚至在對于某些類別(無明顯差別)RC在較精確率上甚至略好于AsymNet,但是總的來說AsymNet比目前現有的方法擁有更好的性能。因為Asymnet可以處理現有的視頻的時空動態變化,并結合自動視頻幀的自動調節爐排判別信息的融合策略。
歡迎加入本站公開興趣群商業智能與數據分析群
興趣范圍包括各種讓數據產生價值的辦法,實際應用案例分享與討論,分析工具,ETL工具,數據倉庫,數據挖掘工具,報表系統等全方位知識
QQ群:81035754
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/4599.html
摘要:當前,很多學者和研究機構都嘗試基于深度學習進行服裝檢索技術的探究與創新。下文將回顧三篇基于深度學習來解決跨域服裝檢索問題的文章。總的來說,以上深度學習方法的探索與創新都將為商品檢索技術趨 摘要商品檢索是一門綜合了物體檢測、 圖像分類以及特征學習的技術。 近期, 很多研究者成功地將深度學習方法應用到這個領域。 本文對這些方法進行了總結, 然后概括地提出了商品特征學習框架以及垂類數據挖掘方式, ...
摘要:馬蜂窩旅游歷經幾十個版本的開發迭代,在啟動流程上積累了一定的技術債務。我們定義啟動廣告曝光率啟動廣告曝光啟動廣告加載。 增長、活躍、留存是移動 App 的常見核心指標,直接反映一款 App 甚至一個互聯網公司運行的健康程度和發展動能。啟動流程的體驗決定了用戶的第一印象,在一定程度上影響了用戶活躍度和留存率。因此,確保啟動流程的良好體驗至關重要。 「馬蜂窩旅游」App 是馬蜂窩為用戶提供...
摘要:戴嘉樂去年月參與了的眾籌,從而了解到技術,獨立開發了兩款基于的開源應用,一個是與有關的系統,另一個是相關的地理位置檢索系統。現在支持的數據結構,支持比特幣以太坊的區塊數據。 戴嘉樂是前百度高級研發工程師,ipfser.org&巴比特專欄作者。戴嘉樂去年8月參與了FileCoin的眾籌,從而了解到IPFS技術,獨立開發了兩款基于IPFS的開源應用,一個是與IPFS有關的wiki系統,另一...
閱讀 2942·2023-04-26 01:32
閱讀 1541·2021-09-13 10:37
閱讀 2278·2019-08-30 15:56
閱讀 1669·2019-08-30 14:00
閱讀 3042·2019-08-30 12:44
閱讀 1961·2019-08-26 12:20
閱讀 1056·2019-08-23 16:29
閱讀 3227·2019-08-23 14:44