采用深度學習算法為Spotify做基于內容的音樂推薦

gougoujiang 發布于2019-04-25 17:58 / 3019人閱讀

摘要：以下為譯文年夏天，我在網絡音樂平臺紐約實習，致力于使用卷積神經網絡做基于內容的音樂推薦。深度學習預測聽眾喜好基于音頻信號的音樂推薦。深度學習預測聽眾喜好去年十二月，我和同事在上發表了一篇關于這個主題的論文，題目是基于內容的深度音樂推薦。

本文是比利時根特大學（Ghent University）的Reservoir Lab實驗室博士研究生Sander Dieleman所撰寫的博客文章，他的研究方向是音樂音頻信號分類和推薦的層次表征學習，專攻深度學習和特征學習。以下為譯文：

2014年夏天，我在網絡音樂平臺Spotify （紐約）實習，致力于使用卷積神經網絡（convolutional neural networks）做基于內容的音樂推薦。本文將介紹我使用的方法，并展示一些初步的結果。

概述

這篇文章很長，所以先對各節的內容做一個概述：

協同過濾（Collaborative filtering）一個簡單的介紹，包括它的優缺點。

基于內容的推薦（Content-based recommendation）在不能得到使用數據時，該怎么辦。?

深度學習預測聽眾喜好（Predicting listening preferences with deep learning）基于音頻信號的音樂推薦。

效率提升（Scaling up）有關我在Spotify訓練卷積神經網絡的一些細節。

分析（Analysis）：它在學習什么? ?卷積神經網絡音樂學習一瞥，包含多個音頻示例。

可以應用在哪里（What will this be used for）？我的工作成果的一些應用潛力。

今后的工作（Future work）

結論（Conclusion）

協同過濾

網絡音樂平臺Spotify傳統上主要依靠協同過濾驅動音樂推薦。協同過濾的原理是根據歷史使用數據確定用戶的喜好。例如，如果兩個用戶收聽大致相同類型的歌曲，他們的喜好大概就是類似的。反過來，如果兩支歌曲由同一組用戶所收聽，這些歌曲聽起來很可能是相似的。這種信息可以被用來做推薦。

純粹的協同過濾方法，除了相關的消費模式信息以外，不涉及被推薦物品本身的任何信息：也就是它是內容無關的(content-agnostic)。這個特點使得這種方法可以有非常廣泛的應用：例如，同樣的一個模型就可以用于推薦書籍、電影或者音樂。

不幸的是，這個特點也導致了它較大的不足。由于依據使用數據，流行物品就會比非流行物品更容易得到推薦，因為前者有更多的使用數據。而這通常是剛好與我們所希望的相反。由于同樣的原因，這樣的推薦常常是很無聊的，而且是可預知的。

特定到音樂還有另一個問題，就是相似使用模式的內容異質性（heterogeneity of content with similar usage patterns）。例如，聽眾可能一次聽過了整張專輯，而專輯中可能包含引曲、終曲、插曲、翻唱曲和混音曲等。它們也許不都是該藝術家典型的作品，因此不是一些好的推薦?？墒菂f同過濾算法不能解決這個問題。

而它較大的問題，可能還在于不能推薦新的和非流行的歌曲：如果沒有可供分析的使用數據，協同過濾方法就會失效。這就是所謂的冷啟動問題。我們希望新音樂能夠在發行后的第一時間獲得推薦，而且我們也希望能向聽眾介紹那些他們從來沒有聽過的很棒的樂隊。為了實現這些目標，我們就需要有不同的方法。

基于內容的推薦

Spotify根據幾個月之前從智能音樂平臺 The Echo Nest 得到的反饋信息，最近已經開始考慮在推薦管道中結合其它信息源，以減少這些問題?？梢詭椭魳吠扑]的信息有很多種：比如標簽，藝術家和專輯信息，歌詞，從互聯網上挖掘到的文稿（評論、訪談...），以及音頻信號本身。

在這些信息源中，音頻信號可能是最難有效利用的。一方面由于音樂音頻信號之間的語義差別（semantic gap）很大，另一方面影響聽眾喜好的因素又多種多樣。有的信息可以比較容易地從音頻信號中提取出來，比如音樂的類型和演奏的樂器；而其他的就比較有挑戰性了，比如音樂的情緒，和發行的年份（或者時期）；還有一些實際上是不可能從音頻中得到的：就像藝術家所在的地理位置和抒情的主題。

盡管存在這些挑戰，但是很明顯地，歌曲的實際聲音極大地影響到聽眾是否愿意收聽。于是通過分析音頻信號，預測誰可能欣賞這支歌曲，看起來像個不錯的主意。

深度學習預測聽眾喜好

去年十二月，我和同事A?ron van den Oord 在NIPS上發表了一篇關于這個主題的論文，題目是‘ Deep content-based music recommendation’（基于內容的深度音樂推薦）。我們試圖這樣解決問題：通過訓練回歸模型（regression model），預測從協同過濾模型輸出歌曲的隱藏表征（latent representations），實現依靠音頻信號預測收聽喜好。這個方法可以使我們在即使沒有使用數據的情況下，也能夠在協同過濾空間中預測歌曲表征。（正如可以從論文的題目中推測出來的那樣，涉及的回歸模型是一個深度神經網絡）。

這種方法的基本思想是假定許多協同過濾模型都是把聽眾和歌曲投射到一個共享的低維度隱空間（latent space）中。在這個空間中歌曲的位置包含了影響聽眾喜好的各種編碼信息。假如有兩首歌曲在空間上臨近，它們很可能是相似的。如果一首歌曲距離一個聽眾很近，這首歌對他可能就是一個好推薦（如果他還沒有聽過這首歌）。如果可以通過音頻信號預測一首歌曲在這個空間中的位置，那就能夠把它推薦給合適的聽眾，而并不需要歷史使用數據。

論文中我們做了可視化效果，即通過投射隱空間中模型的預測結果到使用 t-SNE 算法降低的二維空間。從如下的結果圖中可以看出，相似的歌曲群集到了一起。說唱樂主要出現在左上角，而電聲藝術家聚集在圖的底部。

t-SNE算法的隱空間可視化（中部）。幾個特寫圖展現了歌曲投射在特定區域的藝術家。摘自Deep content-based music recommendation, A?ron van den Oord, Sander Dieleman and Benjamin Schrauwen, NIPS 2013.

效率提升

在我們論文中訓練的深度神經網絡由兩個卷積層和兩個完全連接層組成。輸入是3秒鐘音頻片斷的聲譜。對于更長音頻片斷的預測，只需要把它分成幾個3秒鐘長的窗口，然后把這些窗口的預測值作平均。

我在Spotify接觸了大量歌曲的數據源，以及從不同的協同過濾模型產生的隱藏因素表征（latent factor representations）。我還配備了一臺高級的GPU，用于實驗運算。它們相當地提升了效率。現在我正在訓練總數達7層或8層的卷積神經網絡（convnets），使用了大得多的中間表征和更多的參數。

架構

下面詳細介紹的，是我已經實驗過的諸多架構中的一個。它有四個卷積層和三個稠密層（dense layers）。你將看到為了音頻信號設計的卷積神經網絡，與用于計算機視覺網絡任務的傳統神經網絡，有一些重要的不同。

警告：下面有可怕的細節！如果你不太關心諸如ReLUs，較大值池化（max-pooling）和小批量梯度下降法（minibatch gradient descent）等細節，盡管直接跳到“分析”段落。

我試驗過的用于隱藏因素預測的一種卷積神經網絡架構。縱軸是時間軸（在其上卷積）。

網絡輸入是一系列梅爾聲譜（mel-spectrograms），它們有599幀（frames）和128 個頻點（frequency bins）。梅爾聲譜是一種時間-頻率表證（time-frequency representation）。是從音頻信號的窄重疊窗口傅立葉變換（Fourier transforms）得到的。每一個傅立葉變換構成一幀。然后將這些連續的幀排列成一個矩陣，就形成了這個聲譜。最后將頻率軸由線性刻度變成梅爾刻度（mel scale）以降低維數，并且采用對數刻度值。

卷積層用紅色矩形顯示，表現了過濾器滑過輸入時的情形。它們使用了線性修正單位（ReLUs, 使用的激活函數是max(0, x)）。請注意所有這些卷積都是一維的；卷積僅僅在時間維度出現，而不在頻率維度。雖然技術上可以沿著聲譜圖的兩個坐標軸都進行卷積，但現在我并沒有這樣做。要意識到與圖像不一樣，聲譜圖兩個軸的意義是不同的（時間和頻率），這個非常重要。結果就是，在圖像數據中典型的方形過濾器，在這里是沒有意義的。

在卷積層之間用較大值池化運算（max-pooling operations）降低時域中間表征采樣率，同時增大過程的時不變性。這些操作用“MP”表示?？梢钥闯鲈诿總€卷積層中使用了尺寸為4幀的過濾器，在第一與第二卷積層之間是池尺寸為4的較大池化（主要是出于性能方面的考慮），而在其他層之間是池尺寸為2的較大池化。

在最后卷積層的后面，我增加了一個全局時域池化層（global temporal pooling layer）。這一層覆蓋整個時間軸，有效地計算時域學習特征的統計值。我引入了三個不同的池化功能：平均值（mean），較大值（maximum）和L2范數（L2-norm）。

我這樣做的原因是由于從音頻信號中檢測到的位置特征，與手頭任務的要求不是特別地相關。這里的情況與圖像分類不同：在圖像分類中，知道一個特征的大概位置就可以了。例如，檢測出云朵特征很可能激活圖像的上半部分。如果激活在下半部分，可能檢測到羊了。在音樂推薦場合，我們通常只對音樂中某些特征整體上是出現還是缺乏感興趣，所以在時間上做池化是在情理之中的。

另外一種處理方法可以是用短音頻片段訓練網絡，通過平均這些窗口的輸出得到較長片段的數據，就像我們在NIPS論文中做的那樣。不過在模型中引用池化似乎更好一些，因為在學習階段就可以開始使用這種處理步驟。

2048個線性修正單位的全局池化特征輸入到了一串完全連結層（fully-connected layers）。在本網絡中這一串只有兩個。該網絡的最后一層是輸出層（output layer），它選用Spotify用過的各種協同過濾算法中的vector_exp 算法，預測40個隱藏因素。

訓練

訓練網絡減少協同過濾模型輸出的隱藏因素向量與音頻預測之間的均方差(MSE)。這些向量首先要按照單位規范（unit norm）標準作規范化。這樣做是為了降低歌曲人氣的影響（許多協同過濾模型的隱藏因素向量范數往往與歌曲的人氣相關）。在稠密層中采用丟棄法（Dropout）作為正規化方法。

我現在使用的數據集是從Spotify保存的一百萬條最流行曲目中截取的30秒長的梅爾聲譜。我使用了大約一半曲目用做訓練（0.5M），大約5000條做在線驗證，其余的用做測試。在訓練的時候，通過沿著時間軸做隨機的偏移，稍稍調整了聲譜，擴展了數據。

實現的網絡采用了英偉達（NVIDIA ）GeForce GTX 780Ti GPU硬件，Theano軟件框架。使用了小批量梯度下降法，和涅斯捷羅夫沖量因子（Nesterov momentum）。用一個多帶帶的進程進行數據加載和調整，所以當GPU用于大塊數據訓練時，下一批數據可以并行地加載進來?？偣矆绦辛舜蠹s750000個梯度更新。我已經記不清訓練這個特殊架構的準確時間了，但我記得總的試驗時間在18到36小時之間。

變化（Variation）

正像我在前面講到的，這只是我試驗過的架構中的一個例子。我已經試過，或將要試驗的還有：

更多層級！

使用較大輸出單位（maxout unit）而不是線性修正單位（rectified linear unit）。

使用隨機池化（stochastic pooling）而不是較大池化（max-pooling）。

在網絡的輸出層引入L2規范化。

在時域上拉伸或壓縮聲譜擴展數據。

多重級聯各種協同過濾模型輸出的隱藏因素向量。

這里是幾點工作效果不如預期的地方：

用全局時域池化從每個卷積層到網絡完全連結層增加的‘旁路’（‘bypass’）連接?；A假設是低級特征的統計結果也對推薦有用，很不幸的是它對訓練產生了太多的限制。

像混合密度網絡（mixture density networks）一樣預測因素的條件方差，得到預測的置信估計，而在隱藏因素預測困難的時候用于識別歌曲。很不幸的是似乎它使訓練變得異常困難，而且置信估計也表現得與預期的不同。

分析：它在學習什么？

現在到了有點酷的部分：這些網絡究竟在學習什么？特征看起來是怎樣的？我選擇卷積網絡解決這個問題的主要原因，是認為根據音頻信號的音樂推薦，是一個連接多層次抽象的復雜問題。我希望連續的網絡層能像在圖像分類問題中那樣，漸進地學會更復雜和更多的不變特征。

實際情況看起來確實如此。首先讓我們看一看第一個卷積層，它學習直接應用于輸入聲譜的一組過濾器。這些過濾器是容易可視化的。它們顯示在下列圖像中。點擊就能看到高分辨率版本（5584x562, ~600kB）。負值是紅色，正值是藍色而白色是零值。注意每個過濾器寬度僅僅是四幀。深紅色的垂直線將各個過濾器分隔開來。

第一卷積層學習過濾器的可視化。時間軸是橫軸，頻率軸是豎軸（頻率從頂部到底部是增加的）。點擊就能看到高分辨率版本（5584x562, ~600kB）。

從這個表示中可以看出，許多過濾器探測出了諧波成分，這體現在不同頻率處并行的紅藍條帶上。有時候這些條帶是向上或向下傾斜的，表示出現了音高的升高或降低。它證明這些過濾器有助于檢測人聲。

低級特征播放表：較大激活

為了對過濾器學習的是什么有更好的理解，我準備了一些較大激活的測試歌曲集播放表。下面是幾個例子。網絡的第一層有256個過濾器，它們被從0到255編號。注意這個編號是任意的，因為過濾器沒有排序。

通過查找在分析的30秒內對給定過濾器較大激活的歌曲，得到了這四個播放列表。我從第一卷積層中選擇了幾個看起來有趣的過濾器，計算了每個特征表現，然后從整個測試集中查找較大激活。請注意如果要了解過濾器正在接收的內容，應該聽取曲目的中段，因為這部分音頻信號才是被分析的部分。

下面每個Spotify播放表都有10個曲目。由于版權的問題有些曲目在有的國家收聽不到。

過濾器 14：顫音歌唱過濾器 ? ? ? ? 242: 環境氣氛（ambience）

過濾器 250：人聲大三度（vocal thirds） ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 過濾器 253: 低音鼓

過濾器14，242， 250 和 253的特寫圖。

過濾器 14 似乎探測出顫音歌聲（vibrato singing）。

過濾器 242探測出某種響鈴氛圍（ringing ambience）。

過濾器 250 探測出人聲大三度（ vocal thirds），即多個歌唱者同唱一首歌，但音符相隔大三度（四個半音）。

過濾器 253 探測出各種類型的低音鼓音。

這些播放表中曲目的流派是很不同的，這表示它們主要是從音頻信號的低級特性中檢測出這些特征的。

低級特征播放表：平均激活

下面四個播放表是用稍微不同的方式獲得的：首先對每個曲目計算時域特征的激活平均，然后找出它們中的較大值。這意味著在這些播放表中，涉及的過濾器在分析的30秒鐘內一直有效（也就是，它不會只是一個‘峰值’）。這對于檢測和聲模式更加有用。

過濾器 1：噪音，失真 ? ? ? ? ? ? ? ?過濾器 2：音高（A， Bb）

過濾器 4：嗡嗡聲過濾器 28：和聲（A, Am）

過濾器1，2，4和28的特寫圖。

過濾器1 檢測噪音和（吉他）失真音。

過濾器2好像檢測到一個特殊音高：一個低音Bb。它有時也檢測出A聲（低半音），因為梅爾聲譜的頻率分辨率還沒有高到足以區分這兩個音。

過濾器 4 檢測各種低音嗡嗡聲（drones）。

過濾器 28 檢測A和弦。看起來它既檢測小音階也檢測大音階版本，所以它可能只檢測音高A和E（五度音程）。

我覺得很有趣的是，該網絡學會了檢測特別的音高和和聲。我以前還以為歌曲中準確的音高和和聲的出現，不會影響聽眾的喜愛程度。至于為什么會這樣我有兩點推測：

用不同的諧音訓練了各種過濾器以后，這個網絡其實僅僅學習了檢測調和性（harmonicity）。然后在更高層級上它們被池化到一起，以檢測各種音高的調和性。

網絡學會了在某些流派的音樂中，某個和弦以及和弦進行（chord progressions）比其他和弦更加常用。

我還沒有驗證上述兩點中的任何一點，但看起來后者對于網絡有更大的挑戰，因此我認為前者的可能性更大。

高級特征播放表

網絡的每一層都從下一層取得特征表現，然后從中提取一組高級特征。在網絡最上面的完全連接層，即最靠近輸出層的前面一層，學習過的過濾器對某些副主題是非常有選擇性的。顯而易見，在聲譜級可視化這些過濾器的檢測結果不是一件簡單的事情。下面是六個測試集歌曲的播放表，這些歌曲較大激活了其中的幾個高級過濾器。

過濾器 3：基督教搖滾（christian rock） ? ?過濾器 15：合唱/無伴奏合唱+時尚爵士

過濾器 26：福音歌 ? ? ? ? ? ? ? ? ? ?過濾器 37：華語流行

過濾器 49：合成電子樂，8比特過濾器 1024：deep house音樂

很明顯，其中每個過濾器都識別一種特定的類型。有趣的是有些過濾器，比如第15號，似乎是多模式的（multimodal)：它強烈地被兩種或更多種風格的音樂激活，而那些音樂經常是完全不相關的。大概這些過濾器在結合了所有其它過濾器的激活以后，消除了輸出歧義。

過濾器37很有趣，因為它似乎可以識別中文語言。這不是完全不可能的，因為中文的語音庫與其他語言相比是很獨特的。有其他幾個過濾器似乎學習了特定的語言：比如有一個能檢測出西班牙語的rap音樂。也有可能性是華語流行音樂存在其它可區分的特性，而那個模型就是檢測到了此特性。

我花了一些時間對開始的約50個過濾器作了詳細的分析。我想出的其他幾個過濾器種類還有：酒廊音樂，雷鬼樂（reggae），暗潮（darkwave），鄉村音樂，金屬核（metalcore），莎莎舞樂（salsa），荷蘭和德國的狂歡節音樂，兒童歌曲，人聲電音（vocal trance），朋克（punk），土耳其流行樂，還有我最喜愛的 ‘exclusively Armin van Buuren’。很明顯由于他有那么多的曲目，所以他才有了自己的過濾器。

經過Alex Krizhevsky ImageNet網絡學習的過濾器，已經被重復用在各種計算機視覺任務中，并獲得了極大的成功。基于這些過濾器的多樣性和不變性特性（invariance properties），這些學習音頻信號的過濾器，除了能預測隱藏因素之外，也可以用于其他音樂信息檢索任務。

基于相似度的播放列表

預測的隱因素向量也可以用來查找聽起來相似的歌曲。下面是這樣產生的幾個播放表：首先預測給定歌曲的因素向量，然后從測試集中查找出這樣的歌曲，其預測因素向量的余弦距離，靠近給定的歌曲。這樣播放列表中的第一個曲目永遠是查詢曲目本身。

The Notorious B.I.G. – Juicy ? ? ? ? ? ? ? ? Cloudkicker - He would be riding on

? ? ? ? ? （嘻哈舞曲） ? ? ? ? ? ? ? ? ? ? ? ? the subway...后現代搖滾，前衛金屬）

Architects - Numbers Count For Nothing ? ? ? ?Neophyte - Army of Hardcore

? ? ? ? ? ? ? ? ? （金屬核，硬核） ? ? ? ? ? ? ? ? ?（硬式電子音樂, 蓋巴舞曲）

Fleet Foxes - Sun It Rises（獨立民謠） ?John Coltrane - My Favorite Things（爵士樂）

絕大多數相似的曲目都是很合適向查詢該曲目的歌迷推薦的。當然這些列表并不是很完美的，但是考慮到僅僅依靠音頻信號，就獲得了這樣的結果，應該算是相當不錯了。有一個有錯誤的例子出現在John Coltrane的‘My Favorite Things’播放表中，此播放表的一個不同點是包含幾個奇異值（outliers），最明顯的地方是在Elvis Presley的‘Crawfish’中。其原因可能是在被分析的音頻信號段（從8:40 到9:10）包含一段瘋狂的薩克斯獨奏。如果分析整首歌曲，可能會有比較好的結果。

它們有什么用？

Spotify已經在其推薦管道中使用了一大堆不同的信息源和算法，因此我的工作最明顯的應用就是添加成另外一個信號源。當然它也可以用來過濾由其它算法推薦的異常結果。我在前面已經指出，協同過濾算法趨向于在推薦中包含引曲、終曲、翻唱曲和混音曲。這些可以通過基于音頻的方法有效地過濾。

我在這項工作中的一個主要目標是可以用它推薦新的，以及尚未流行的音樂。我希望這樣提供幫助，那些不太知名和未來的樂隊，通過允許Spotify向適合的聽眾推薦他們的音樂，得到公平的競爭環境。（宣傳未來的樂隊碰巧也是我一個非營利網站got-djent.com的主要目標。）

希望不久它們的部分功能就能開始 A/B 測試，于是我們可以知道這個基于音頻的推薦，能不能在實踐中表現非凡。這是我非常興奮的一件事情，因為它不是在學術界輕松做到的。

今后的工作

Spotify收集到的另一種用戶反饋形式是用戶對電臺播放曲目的向上拇指和向下拇指。這類信息對于確定哪些曲目是類似的十分有用。不幸的是其中的噪音也很大。我目前正在嘗試在‘排序學習’（learning to rank）設置中使用這些數據。我也在實驗各種距離度量學習方案，比如DrLIM。如果有任何很酷的結果我可能會寫一篇新的文章。

結論

本文中我概述了在Spotify機器學習實習中到目前為止所做的工作。我解釋了使用卷積網絡做基于音頻的音樂推薦的方法，并提出了有關該卷積網絡的實際學習效果的心得。有關這個方法更詳細的內容，請參考由我和 A?ron van den Oord在NIPS 2013合寫的論文 ‘基于內容的深度音樂推薦’（Deep content-based music recommendation）。

如果你對深度學習，特征學習以及它在音樂中的應用有興趣，可以到我網站的research中看看，了解一下我在這個領域做過的其它工作。如果你對在音樂推薦中Spotify的方法有興趣，參考一下Slideshare和Erik Bernhardsson在其博客中的介紹。

Spotify是一個很酷的工作場所。他們對其使用的方法很開放（同時允許我寫這篇博客文章），這在工業界并不是很常見的。

如果你對本文有任何問題或者反饋意見，請留下你的評論！

原文鏈接：Recommending music on Spotify with deep learning

GPU云服務器云服務器基于內容的推薦算法深度學習做推薦基于深度學習的深度教學基于深度學習的語音增強

文章版權歸作者所有，未經允許請勿轉載,若此文章存在違規行為，您可以聯系管理員刪除。

轉載請注明本文地址：http://specialneedsforspecialkids.com/yun/4294.html

原創翻譯 | 10個音頻處理任務讓你開始使用深度學習應用

摘要：這是機器學習課程中的一個典型例子，他把演講者的聲音和背景音樂分開。雖然用于啟動檢測的技術主要依賴于音頻特征工程和機器學習，但在這里可以很容易地使用深度學習來優化結果。介紹想象一個能理解你想要什么，且當你打電話給客戶服務中心時能理解你的感受的機器--如果你對某件事感到不高興，你可以很快地和一個人交談。如果您正在尋找特定的信息，您可能不需要與某人交談(除非您愿意！)。 ...

notebin 2019-04-25 18:24 評論0 收藏0
遞歸的藝術 - 深度遞歸網絡在序列式推薦的應用

摘要：因為在每一時刻對過去的記憶信息和當前的輸入處理策略都是一致的，這在其他領域如自然語言處理，語音識別等問題不大，但并不適用于個性化推薦，一個用戶的聽歌點擊序列，有正負向之分。在內容爆炸性增長的今天，個性化推薦發揮著越來越重要的作用，如何在海量的數據中幫助用戶找到感興趣的物品，成為大數據領域極具挑戰性的一項工作；另一方面，深度學習已經被證明在圖像處理，計算機視覺，自然語言處理等領域都取得了不俗...

ZweiZhao 2019-04-25 18:06 評論0 收藏0
cnn卷積神經網絡打造人臉登錄系統

摘要：本文基于環境，采用為基礎來構建實時人臉檢測與識別系統，探索人臉識別系統在現實應用中的難點。對于人臉檢測方法，效果好于的方法，但是檢測力度也難以達到現場應用標準。本文中，我們采用了基于深度學習方法的人臉檢測系統。 git地址：https://github.com/chenlinzho... 本文主要介紹了系統涉及的人臉檢測與識別的詳細方法，該系統基于python2.7.10/opencv...

jackwang 2019-06-28 16:54 評論0 收藏0
cnn卷積神經網絡打造人臉登錄系統

摘要：本文基于環境，采用為基礎來構建實時人臉檢測與識別系統，探索人臉識別系統在現實應用中的難點。對于人臉檢測方法，效果好于的方法，但是檢測力度也難以達到現場應用標準。本文中，我們采用了基于深度學習方法的人臉檢測系統。 git地址：https://github.com/chenlinzho... 本文主要介紹了系統涉及的人臉檢測與識別的詳細方法，該系統基于python2.7.10/opencv...

KavenFan 2019-07-30 18:41 評論0 收藏0
達觀數據紀達麒：個性化推薦系統商業化，五大要素不可或缺

摘要：在峰會大數據專場上，達觀數據紀達麒圍繞數據挖掘算法落地實踐做了主題演講，就個性化推薦系統商業化的五大要素進行了詳細探討。在機器學習領域，每一個單一算法都是針對一類特定的問題，因而針對同一個推薦任務，不同的算法效果相差很大。在日前舉行的2017 CSDI 中國軟件研發管理行業峰會上，包括摩拜單車創始人及CTO夏一平、華為首席系統工程專家徐琦海、京東云、攜程等一線互聯網企業大數據平臺負責...

raoyi 2019-06-26 18:14 評論0 收藏0