2016-04-06 20 views

Theano'dan Torch'a geçiş yapıyorum. Yani lütfen benimle kal. Theano'da, özgül bir ağırlıkta bile, kayıp fonksiyonunun gradyanlarını hesaplamak düz bir yoldaydı. Merak ediyorum, bunu Torch'da nasıl yapabilirim?Meşale'de rasgele bir katmana/ağırlığa göre kayma gradyanı nasıl hesaplanır?

t = require 'torch' 
require 'nn' 
require 'cunn' 
require 'cutorch' 

-- Generate random labels 
function randLabels(nExamples, nClasses) 
    -- nClasses: number of classes 
    -- nExamples: number of examples 
    label = {} 
    for i=1, nExamples do 
     label[i] = t.random(1, nClasses) 
    return t.FloatTensor(label) 

inputs = t.rand(1000, 3, 32, 32) -- 1000 samples, 3 color channels 
inputs = inputs:cuda() 
labels = randLabels(inputs:size()[1], 10) 
labels = labels:cuda() 

net = nn.Sequential() 
net:add(nn.SpatialConvolution(3, 6, 5, 5)) 
net:add(nn.SpatialMaxPooling(2, 2, 2, 2)) 
net:add(nn.Linear(6*14*14, 300)) 
net:add(nn.Linear(300, 10)) 
net = net:cuda() 

-- Loss 
criterion = nn.CrossEntropyCriterion() 
criterion = criterion:cuda() 
forwardPass = net:forward(inputs) 
dEd_WeightsOfLayer1 -- How to compute this? 

forwardPass = nil 
net = nil 
criterion = nil 
inputs = nil 
labels = nil 


nasıl convolutinal tabakanın ağırlıkları w.r.t gradyanı hesaplayabilir:

bazı veri/etiket oluşturur ve bir model tanımlar aşağıdaki kodu olduğunu varsayalım?



Tamam, cevabı buldum (Torch7 Google grubundaki alban desmaison'a teşekkürler). Sorunun kodunda bir hata var ve çalışmıyor. Bu yüzden kodu tekrar yazdım. Burada her bir düğüm/parametreye göre geçişlerini alabilirsiniz açıklanmıştır:

t = require 'torch' 
require 'cunn' 
require 'nn' 
require 'cutorch' 

-- A function to generate some random labels 
function randLabels(nExamples, nClasses) 
    -- nClasses: number of classes 
    -- nExamples: number of examples 
    label = {} 
    for i=1, nExamples do 
     label[i] = t.random(1, nClasses) 
    return t.FloatTensor(label) 

-- Declare some variables 
nClass = 10 
kernelSize = 5 
stride = 2 
poolKernelSize = 2 
nData = 100 
nChannel = 3 
imageSize = 32 

-- Generate some [random] data 
data = t.rand(nData, nChannel, imageSize, imageSize) -- 100 Random images with 3 channels 
data = data:cuda() -- Transfer to the GPU (remove this line if you're not using GPU) 
label = randLabels(data:size()[1], nClass) 
label = label:cuda() -- Transfer to the GPU (remove this line if you're not using GPU) 

-- Define model 
net = nn.Sequential() 
net:add(nn.SpatialConvolution(3, 6, 5, 5)) 
net:add(nn.SpatialMaxPooling(poolKernelSize, poolKernelSize, stride, stride)) 
net:add(nn.Linear(6*14*14, 350)) 
net:add(nn.Linear(350, 10)) 
net = net:cuda() -- Transfer to the GPU (remove this line if you're not using GPU) 

criterion = nn.CrossEntropyCriterion() 
criterion = criterion:cuda() -- Transfer to the GPU (remove this line if you're not using GPU) 

-- Do forward pass and get the gradient for each node/parameter: 

net:forward(data) -- Do the forward propagation 
criterion:forward(net.output, label) -- Computer the overall negative log-likelihood error 
criterion:backward(net.output, label); -- Don't forget to put ';'. Otherwise you'll get everything printed on the screen 
net:backward(data, criterion.gradInput); -- Don't forget to put ';'. Otherwise you'll get everything printed on the screen 

-- Now you can access the gradient values 

layer1InputGrad = net:get(1).gradInput 
layer1WeightGrads = net:get(1).gradWeight 

net = nil 
data = nil 
label = nil 
criterion = nil 

Kopyala ve kodu yapıştırın ve çekicilik gibi çalışır :)

İlgili konular