Torch：如何更新模型参数？

2017-8-22 21:16:44

收藏：0

阅读：92

评论：1

这里是一个玩具模型。我在调用 backward 前仅打印了一次模型参数，然后再次打印模型参数。结果发现参数没有改变。如果在调用 backward 后添加了 model:updateParameters(<learning_rate>) 这行代码，就能看到参数被更新了。

但是在例子代码中，比如 https://github.com/torch/demos/blob/master/train-a-digit-classifier/train-on-mnist.lua，没有人真正调用过 updateParameters。另外，似乎 optim.sgd、optim.adam 和 nn.StochasticGradient 也从来没有调用过 updateParameters。我错过了什么？参数是如何自动更新的？如果我必须调用 updateParameters，为什么没有例子这样做？

require 'nn'
require 'optim'

local model = nn.Sequential()
model:add(nn.Linear(4, 1, false))
local params, grads = model:getParameters()

local criterion = nn.MSECriterion()
local inputs    = torch.randn(1, 4)
local labels    = torch.Tensor{1}

print(params)

model:zeroGradParameters()
local output = model:forward(inputs)
local loss   = criterion:forward(output, labels)
local dfdw   = criterion:backward(output, labels)
model:backward(inputs, dfdw)

-- 将以下行注释去掉，参数将被更新：
-- model:updateParameters(1000)

print(params)

用户4687565

backward()函数不应该改变参数，它只是计算网络所有参数对于误差函数的导数。

通常，训练的步骤如下：

repeat
  local output = model:forward(input) --查看模型的预测结果
  local loss = criterion:forward(output, answer) --查看错误率
  local loss_grad = criterion:backward(output, answer) --查看最错误的位置
  model:backward(input,loss_grad) --查看每个参数对误差的贡献程度
  model:updateParameters(learningRate) --根据错误情况修正参数
  model:zeroGradParameters() --由于网络参数已经变化，老的梯度无用了
until is_user_satisfied()

updateParameters实现了最简单的优化算法（梯度下降）。如果想要，可以自己写函数代替它。在理论上，可以显式遍历整个网络来更新参数。在实际操作中，通常调用 getParameters()。

local model_parameters,model_parameters_gradient=model:getParameters()

这会返回所有参数的均匀张量及其梯度。这些张量是网络中的视图，因此对它们进行更改会影响网络。不一定知道网络中哪个点对应的是哪个值，但大多数优化器并不关心这一点。

optim.sgd用法的演示可以在demo中找到：

optim.sgd(
   function_to_return_error_and_its_gradients,
   model_parameters,
   optimizer_special_settings)

具体内容在演示中有介绍，但在此处，重要的是优化器将 model_parameters 作为参数接收，并具有对网络进行写操作的功能。尽管在文档中并没有明确说明，但在 source code 中可以看到，优化器会改变其输入张量的值（同时，注意它返回的是接收到的 相同的 张量）。

2017-08-24 04:23:55

评论区的留言会收到邮件通知哦~

作者:

用户1830334

Torch：如何更新模型参数？

社区规范

发文指南

社区文章

开源项目 & 应用

🎮 游戏开发

World of Warcraft

Roblox

Defold

LÖVE 2D

🌐 高性能网络与 Web 服务

OpenResty

Kong

Redis

Nmap

LuaJIT

Wapiti

Wireshark

⚙️ 嵌入式系统与应用工具

LuatOS

TeX Live

Awesome WM

Vim/Neovim

FFmpeg

🧠 人工智能与科学计算

Torch

SciLua