最佳答案
考虑到 示例代码。
我想知道如何应用这个网络的 RNN 梯度剪辑有爆炸梯度的可能性。
tf.clip_by_value(t, clip_value_min, clip_value_max, name=None)
这是一个可以使用的例子,但是我应该在哪里介绍呢? 为了 RNN
lstm_cell = rnn_cell.BasicLSTMCell(n_hidden, forget_bias=1.0)
# Split data because rnn cell needs a list of inputs for the RNN inner loop
_X = tf.split(0, n_steps, _X) # n_steps
tf.clip_by_value(_X, -1, 1, name=None)
But this doesn't make sense as the tensor _X is the input and not the grad what is to be clipped?
我必须为此定义自己的优化器,还是有一个更简单的选项?