摘要:摘要背景深度學習是一種表示學習方法,非常適合用來處理數字病理學中的圖像分析問題。優質的注釋樣本是深度學習重要的先決條件,但是處理數字病理學中最大的挑戰就是獲取高質量的注釋樣本。本文使用的深度學習主要由四個模塊組成。
Deep learning for digital pathology image analysis: A comprehensive tutorial with selected use cases
Deep learning for digital pathology image analysis: A comprehensive tutorial with selected use cases
Andrew Janowczyk, Anant Madabhushi
背景: 深度學習(deep learning, DL)是一種表示學習方法,非常適合用來處理數字病理學(digital pathology, DP)中的圖像分析問題。DP中有各種圖像分析任務,包括檢測和計數(例如有絲分裂)、分割(例如細胞核)、組織分類(例如癌/非癌)等等。但是由于產生數字病理學圖像的過程(制片、著色、掃描)和供應商平臺的不統一,以及生物差異(如不同等級疾病有不同表現),DP中的圖像分析任務特別具有挑戰性。傳統方法在特定領域人為設計任務相關的handcrafted特征,這需要大量的微調以適應這些差異;而深度學習是一種相對來說領域無關的方法,它將特征的發現與實現相結合,最大化感興趣的類別間的差異。雖然DL在部分DP圖像分析任務中表現優異,但是當前并沒有開源的工具或教程提供這方面的指導,比如:(a)選擇合適的放大倍數,(b)控制訓練集中的注釋錯誤,(c)確定一個合適的包含豐富信息樣本的訓練集,這些是將DL成功應用于DP任務中所必須的基本概念。
目標: 本文有7個獨立的DP任務,用來探索DL應用于不同DP領域所需要的技巧。
結果: 本文展示了如何使用深度學習解決以下問題:
● (a)細胞核分割(nuclei segmentation),F?score of 0.83 across 12,000 nuclei
● (b)上皮細胞分割(epithelium segmentation),F?score of 0.84 across 1735 regions
● (c)細管分割(tubule segmentation),F?score of 0.83 from 795 tubules
● (d)淋巴細胞檢測(lymphocyte detection),F?score of 0.90 across 3064 lymphocytes
● (e)有絲分裂檢測(mitosis detection),F?score of 0.53 across 550 mitotic events
● (f)浸潤性導管癌檢測(invasive ductal carcinoma detection),F?score of 0.7648 on 50 k testing patches
● (g)淋巴瘤分類(lymphoma classification),classification?accuracy?of?0.97?across 374 images
結論: 本文對深度學習方法在數字病理學領域的應用進行了迄今為止最大范圍的綜合研究,在評估中使用了超過1200張數字病理學圖像。
數字病理學(digital pathology, DP)是指將組織切片數字化,以生成高分辨率的圖像,這樣就可以使用圖像分析技術來處理DP領域中的檢測、分割、分類等任務。很多DP領域的圖像分析都涉及到量化(如細胞或有絲分裂計數)或者組織分級(分類)。如圖1中所示,這些任務都需要識別組織基元(histologic primitive),例如細胞核、有絲分裂、細管、上皮組織細胞等。
現有方法主要有兩個缺點:(1)任務相關方法的開發需要很長時間的研究及開發周期,對某個特定數據集性能良好的處理參數一般不能直接應用于另一個獨立的數據集,還需要額外的參數進行調整;(2)如何尋找或調整最優參數一般只能依靠算法的開發者,對其他人來說無法直觀理解。深度學習沒有任務或者數據相關的先驗假設,完全由數據驅動生成合適的特征空間,這是DL的關鍵特性,使得訓練得到的特征可以泛化應用到其他獨立的測試集上。
3 DIGITAL?PATHOLOGY?TASKS?ADDRESSED表1展示了本文處理的7個任務。
分割任務要描繪出組織基元(例如細胞核、有絲分裂、細管、浸潤性導管癌IDC)的精確邊界,所以需要提取精確的形態特征。檢測任務(例如檢測淋巴細胞和有絲分裂)一般只是確定基元的中心而不需要描繪出輪廓,所以分割要比檢測更具有挑戰性,尤其是基元存在多個可能形態時。
3.2 Tissue?Based Classification Task本文處理的另一類實例屬于組織級別分類。使用DL方法可以直接學習到組織類別的特征表示,而不需要定義單個組織基元以通過相關組織基元的特定特征來進行預測。DL的方法不需要定義基元,在不了解相關領域的基元的前提下也可以直接對組織類別進行預測。DL方法只需要標示了類別的圖像塊(patch)就可以學習到具有較強類別區分性的表示。
3.3 Manual Annotation for Ground Truth Generation優質的注釋樣本是深度學習重要的先決條件,但是處理數字病理學中最大的挑戰就是獲取高質量的注釋樣本。有文章顯示在組織分類器的在更高分辨率上會發生退化,主要是因為醫學專家注釋的并沒有那么精細(圖5是一種類似情況)。
病理學家一般不會耗費精力來標注高分辨率病理圖像,所以(a)很少有精確到像素級的標注;(b)一般標注較低分辨率圖像;(c)標注樣本包含大量的假陽/陰區域。
4 DEEP?LEARNING?METHODS 4.1 Overview of Deep Learning Workflows本文使用的深度學習主要由四個模塊組成。
Casting
設計一個適當的網絡一般需要確定很多問題,比如:輸入圖像塊的尺寸、網絡層的數量、卷積的屬性等。本文使用現有的AlexNet,因為發現一個成功的網絡架構也是比較困難的,本文實現框架為Caffe。
Patch generation
一旦確定了網絡結構,那么輸入尺寸也就確定了,接下來就是生成圖像塊來構成訓練/驗證集。這個階段需要一定的相關領域知識,以確定生成的訓練集包含多樣性的表示。本文選定的網絡性能一般,雖然可以減輕過擬合的問題,但樣本的選取會很大程度的影響最終的效果。這個問題在病理學領域尤為顯著,因為同一類別中也存在很大的差異。
Training
使用固定batch size的隨機梯度下降(SGD)方法,(a)將預處理的圖像塊輸入網絡;(b)計算誤差導數;(c)反向傳播更新網絡參數。學習率隨訓練時間減小,以確定收斂到局部最小。保存訓練得到的參數(也就是模型)用于測試。
Testing
使用訓練好的模型對測試集數據進行預測。
Convolutional layer 略
Pooling layer 略
Inner product (fully connected) 略
Activation layer 略
Dropout layer 略
Softmax layer 略
網絡結構見表2,超參數設置見表3,輸入圖像尺寸為32x32。
注:對于文中醫學相關的名詞翻譯可能不準確,如有異議請指正。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/19649.html
摘要:折交叉驗證集,每折包含約張訓練圖像和張測試圖像,正樣本邊界負樣本其他負樣本,訓練集中共圖像塊。浸潤性導管癌是乳腺癌中最長出現的亞種。 Deep learning for digital pathology image analysis: A comprehensive tutorial with selected use cases Deep learning for digital ...
摘要:淋巴細胞是白細胞的一個亞種,在免疫系統中很重要?;疾』蛴挟愇锏膮^域淋巴細胞數量會極大增加,所以通過確認和定量淋巴細胞的密度和位置有助于評估疾病。本節目標是確定淋巴細胞的中心,是一個檢測任務。常見的假陽性和真實正例見圖。 Deep learning for digital pathology image analysis: A comprehensive tutorial with se...
摘要:貢獻者飛龍版本最近總是有人問我,把這些資料看完一遍要用多長時間,如果你一本書一本書看的話,的確要用很長時間。為了方便大家,我就把每本書的章節拆開,再按照知識點合并,手動整理了這個知識樹。 Special Sponsors showImg(https://segmentfault.com/img/remote/1460000018907426?w=1760&h=200); 貢獻者:飛龍版...
閱讀 1166·2021-11-22 15:22
閱讀 3837·2021-10-19 13:13
閱讀 3570·2021-10-08 10:05
閱讀 3292·2021-09-26 10:20
閱讀 2984·2019-08-29 14:21
閱讀 2192·2019-08-27 10:55
閱讀 1871·2019-08-26 10:31
閱讀 2578·2019-08-23 16:47