最佳答案
为什么在训练期间需要调用zero_grad()
?
| zero_grad(self)
| Sets gradients of all model parameters to zero.