Torch: embedding层的实现

2016-3-28 17:13:40

收藏：0

阅读：72

评论：1

我是torch的初学者，正在阅读LSTM语言模型的代码。我对embedding层的实现（https://github.com/oxford-cs-ml-2015/practical6/blob/master/Embedding.lua）感到困惑。

这是embedding层中的updateGradInput函数：

function Embedding:updateGradInput(input, gradOutput)
  if self.gradInput then
    self.gradInput:resize(input:size())
    return self.gradInput
  end
end

我的第一个问题是为什么在这个函数中有一个if语句，而不是像下面一样：

function Embedding:updateGradInput(input, gradOutput)
  self.gradInput:resize(input:size())
  return self.gradInput
end

我认为self.gradInput将始终为真，因为在nn.Module的__init()中已经初始化了self.gradInput。

我的第二个问题是为什么直接返回self.gradInput，而不是使用input和gradOutput计算self.gradInput？我的意思是self.gradInput = gradOutput *（关于输入的输出的导数）。

我最后一个问题是关于Embedding.lua中这段代码的影响是什么：

-- we do not need to accumulate parameters when sharing
Embedding.sharedAccUpdateGradParameters = Embedding.accUpdateGradParameters

"我们在共享时不需要累积参数"是什么意思？

用户117844

(1) 的原因是如果有人明确地取消 gradInput，则不要计算它。 (2) 的原因是嵌入层实际上没有 gradInput，输入不可微分。

2016-03-28 17:51:57

评论区的留言会收到邮件通知哦~

作者:

用户3480490

技术支撑

Nana 框架
Kong API 网关
Nuxt 服务端渲染

统计信息

会员 0
文章数: 0
话题数: ...