PyTorch教程自定義層

不知名網友發布于2021-11-29 10:50 / 1953人閱讀

摘要：上一小節講的是怎么自定義初始化參數。這個自建一層的作用是讓每一個特征量都減去其平均值。第一個是一個線性層。第二個就是我們的自定義層。帶參數的層這個租賃一層是自定義實現了一個全鏈接層。輸出它的權重看一下，確實是能生成的權重矩陣。

上一小節講的是怎么自定義初始化參數。
這一節是看怎么自定義層。

這樣可以想一下之前接觸的樓層是什么。比如nn.Linear,nn.ReLU等。他們的作用就是作為某一層的處理。他們兩個的區別在于前者有參數，后者是沒有參數列表的。那現在我們也來實現一些有參數和沒有參數列表的層操作。

import torchimport torch.nn.functional as Ffrom torch import nn

不帶參數的層

class CenteredLayer(nn.Module):    def __init__(self):        super().__init__()    def forward(self, X):        return X - X.mean()

我們也只需要定義前向傳播就可以了。這個自建一層的作用是讓每一個特征量都減去其平均值。

layer = CenteredLayer()X = torch.arange(5)*0.1print(layer(X))

>>tensor([-0.2000, -0.1000,  0.0000,  0.1000,  0.2000])

經過測試我們可以看到這個層是完全有效的。

那如果將其放到復雜的模型之中呢。

net = nn.Sequential(nn.Linear(8, 128), CenteredLayer())Y = torch.rand(10, 8)print(net(Y).mean().data)

>>tensor(7.8231e-09)

好吧，這個模型其實并不復雜，它只有兩層。第一個是一個線性層。第二個就是我們的自定義層。

生成一組隨機的測試數據Y。然后使用我們構建的網絡對外進行計算，然后輸出其結果的平均值。

不出意外結果應該是0。雖然這里顯示的不是0。這是因為浮點數的存儲精度問題，你當然可以把這個極小的數近似看作它是0。

至于結果為什么失靈，這是一個數學問題，會去列幾個數字自己算一下就明白了。

帶參數的層

class MyLinear(nn.Module):    def __init__(self, in_units, units):        super().__init__()        self.weight = nn.Parameter(torch.ones(in_units, units))        self.bias = nn.Parameter(torch.zeros(units,))    def forward(self, X):        linear = torch.matmul(X, self.weight.data) + self.bias.data        return F.relu(linear)

這個租賃一層是自定義實現了一個全鏈接層。這個層里的參數需要用到權重和偏置，在計算之后最后返回再使用ReLU激活函數。

linear = MyLinear(5, 3)print(linear.weight.data)

>>tensor([[ 1.0599,  0.3885,  1.2025],        [-1.8313,  0.2097, -1.6529],        [ 1.4119,  0.2675, -0.4148],        [ 0.2596, -0.0319,  1.9548],        [-1.2874,  1.0776,  0.5804]])

輸出它的權重看一下，確實是能生成5×3的權重矩陣。

X = torch.rand(2, 5)linear(X)

>>tensor([[2.3819, 2.3819, 2.3819],        [1.8295, 1.8295, 1.8295]])

單層測試結果也沒有問題。

net = nn.Sequential(MyLinear(64, 8), MyLinear(8, 1))net(torch.rand(2, 64))

>>tensor([[0.4589],        [0.0000]])

將其放在網絡中結果也沒有問題。

現在我來放一段對比代碼，就是我們自己寫的這個層和pytorch人家寫的層該怎么實現同樣的功能。

net1 = nn.Sequential(MyLinear(64, 8), MyLinear(8, 1))net2 = nn.Sequential(nn.Linear(64,8),                     nn.ReLU(),                     nn.Linear(8,1),                     nn.ReLU())def init(m):    if type(m)==nn.Linear:        nn.init.ones_(m.weight)        nn.init.zeros_(m.bias)net2.apply(init)Y = torch.rand(4, 64)print(net1(Y).data)print(net2(Y).data)

>>tensor([[270.5055],        [253.7892],        [238.7834],        [258.4998]])tensor([[270.5055],        [253.7892],        [238.7834],        [258.4998]])

這樣乍一看是不是兩個結果完全一樣。

相對于pytorch自帶的實現來說，這個不需要你寫一個加權重的過程，也不需要你再加一個ReLU層。

這樣看起來很省事，但是實際中不建議你自己實現pytorch之中已經有的功能。因為使用人家的方法計算效率更高。

GPU云服務器云服務器自定義頭像自定義網站自定義自定義按鈕

文章版權歸作者所有，未經允許請勿轉載,若此文章存在違規行為，您可以聯系管理員刪除。

轉載請注明本文地址：http://specialneedsforspecialkids.com/yun/125513.html

Keras vs PyTorch：誰是「第一」深度學習框架？

摘要：第一個深度學習框架該怎么選對于初學者而言一直是個頭疼的問題。簡介和是頗受數據科學家歡迎的深度學習開源框架。就訓練速度而言，勝過對比總結和都是深度學習框架初學者非常棒的選擇。「第一個深度學習框架該怎么選」對于初學者而言一直是個頭疼的問題。本文中，來自 deepsense.ai 的研究員給出了他們在高級框架上的答案。在 Keras 與 PyTorch 的對比中，作者還給出了相同神經網絡在不同框...

_DangJin 2019-04-25 18:28 評論0 收藏0
從零開始PyTorch項目：YOLO v3目標檢測實現

摘要：全卷積神經網絡僅使用卷積層，這就使其成為全卷積神經網絡。輸入圖像中包含了真值對象框中心的網格會作為負責預測對象的單元格。在圖像中，它是被標記為紅色的單元格，其中包含了真值框的中心被標記為黃色。在過去幾個月中，我一直在實驗室中研究提升目標檢測的方法。在這之中我獲得的較大啟發就是意識到：學習目標檢測的較佳方法就是自己動手實現這些算法，而這正是本教程引導你去做的。在本教程中，我們將使用 P...

sourcenode 2019-06-18 11:19 評論0 收藏0
LeCun推薦：最新PyTorch圖神經網絡庫，速度快15倍

摘要：圖神經網絡是近年發展起來的一個很有前景的深度學習方向，也是一種強大的圖點云和流形表示學習方法。地址基于的幾何深度學習擴展庫是一個基于的幾何深度學習擴展庫，用于不規則結構輸入數據，例如圖點云和流形。與相比，訓練模型的速度快了倍。過去十年來，深度學習方法（例如卷積神經網絡和遞歸神經網絡）在許多領域取得了前所未有的成就，例如計算機視覺和語音識別。研究者主要將深度學習方法應用于歐氏結構數據 (Eu...

pinecone 2019-04-25 18:33 評論0 收藏0
PyTorch教程參數訪問

摘要：因為在訓練的過程中，我們的目標就是找到讓損失函數最小化的參數值。經過訓練之后我們需要將這些參數拿出來做預測，或者在其他地方使用。在不同模型組件間共享參數。當通過類定義模型時，我們可以通過索引來訪問模型的任意層。為什么要單獨摘出來參數講一下。因為在訓練的過程中，我們的目標就是找到讓損失函數最小化的參數值。經過訓...

番茄西紅柿 2021-11-26 11:11 評論0 收藏2637
教程 | 圖像分類: Caltech 256數據集

摘要：在該數據集中，圖片被分為類，每個類別的圖片超過張。這樣做是為了減小圖片的范圍，使得圖片的特征更易于學習。為了在數據集上獲得更高的準確率，讀者可嘗試取消凍結參數的設置，使得卷積層也參與訓練。 Caltech 256是什么？ Caltech 256數據集是加利福尼亞理工學院收集整理的數據集，該數據集選自Google Image數據集，并手工去除了不符合其類別的圖片。在該數據集中，圖片被分為...

Channe 2019-06-26 18:45 評論0 收藏0