Fix formula and text rendering.

author: Seb Bro <brodehl@uni-mainz.de> 2018-08-11 22:26:40 +0200
committer: GitHub <noreply@github.com> 2018-08-11 22:26:40 +0200
commit: 6ded4099af9527d224fbf6837aa928f501e80b0f (patch)
tree: 1f9357ea38dbfef4dc6fe0850756a5d7115f7949 /tensorflow/contrib/optimizer_v2
parent: 954a367d6464cee12cc09ebde38970344d89ae97 (diff)
1 files changed, 4 insertions, 5 deletions
diff --git a/tensorflow/contrib/optimizer_v2/adam.py b/tensorflow/contrib/optimizer_v2/adam.py
index 631d4f44df..04b1552b61 100644
--- a/tensorflow/contrib/optimizer_v2/adam.py
+++ b/tensorflow/contrib/optimizer_v2/adam.py
@@ -40,15 +40,14 @@ class AdamOptimizer(optimizer_v2.OptimizerV2):
 
     Initialization:
 
-    $$m_0 := 0 (Initialize initial 1st moment vector)$$
-    $$v_0 := 0 (Initialize initial 2nd moment vector)$$
-    $$t := 0 (Initialize timestep)$$
-
+    $$m_0 := 0 \text{(Initialize initial 1st moment vector)}$$
+    $$v_0 := 0 \text{(Initialize initial 2nd moment vector)}$$
+    $$t := 0 \text{(Initialize timestep)}$$
     The update rule for `variable` with gradient `g` uses an optimization
     described at the end of section2 of the paper:
 
     $$t := t + 1$$
-    $$lr_t := \text{learning_rate} * \sqrt{(1 - beta_2^t) / (1 - beta_1^t)}$$
+    $$lr_t := \text{learning\_rate} * \sqrt{1 - beta_2^t} / (1 - beta_1^t)$$
 
     $$m_t := beta_1 * m_{t-1} + (1 - beta_1) * g$$
     $$v_t := beta_2 * v_{t-1} + (1 - beta_2) * g * g$$
author	Seb Bro <brodehl@uni-mainz.de>	2018-08-11 22:26:40 +0200
committer	GitHub <noreply@github.com>	2018-08-11 22:26:40 +0200
commit	6ded4099af9527d224fbf6837aa928f501e80b0f (patch)
tree	1f9357ea38dbfef4dc6fe0850756a5d7115f7949 /tensorflow/contrib/optimizer_v2
parent	954a367d6464cee12cc09ebde38970344d89ae97 (diff)