Add parallel_iterations option to batch_jacobian and jacobian functions.

PiperOrigin-RevId: 223241273
2018-11-28 14:56:02 -08:00 · 2018-11-28 14:56:02 -08:00 · a7b3f17a16
commit a7b3f17a16
parent bbb81ea428
4 changed files with 35 additions and 8 deletions
--- a/tensorflow/python/eager/backprop.py
+++ b/tensorflow/python/eager/backprop.py
@ -955,6 +955,7 @@ class GradientTape(object):
               target,
               sources,
               unconnected_gradients=UnconnectedGradients.NONE,
+               parallel_iterations=None,
               experimental_use_pfor=True):
    """Computes the jacobian using operations recorded in context of this tape.

@ -978,6 +979,8 @@ class GradientTape(object):
        alters the value which will be returned if the target and sources are
        unconnected. The possible values and effects are detailed in
        'UnconnectedGradients' and it defaults to 'none'.
+      parallel_iterations: A knob to control how many iterations are dispatched
+        in parallel. This knob can be used to control the total memory usage.
      experimental_use_pfor: If true, vectorizes the jacobian computation. Else
        falls back to a sequential while_loop. Vectorization can sometimes fail
        or lead to excessive memory usage. This option can be used to disable
@ -1016,7 +1019,8 @@ class GradientTape(object):

    if experimental_use_pfor:
      try:
-        output = pfor_ops.pfor(loop_fn, target_size)
+        output = pfor_ops.pfor(loop_fn, target_size,
+                               parallel_iterations=parallel_iterations)
      except ValueError as err:
        six.reraise(
            ValueError,
@ -1032,7 +1036,8 @@ class GradientTape(object):
            " to compute the jacobian with eager execution enabled and with "
            " experimental_use_pfor set to False.")
      output = pfor_ops.for_loop(
-          loop_fn, [target.dtype] * len(flat_sources), target_size)
+          loop_fn, [target.dtype] * len(flat_sources), target_size,
+          parallel_iterations=parallel_iterations)

    for i, out in enumerate(output):
      if out is not None:
@ -1049,6 +1054,7 @@ class GradientTape(object):
                     target,
                     source,
                     unconnected_gradients=UnconnectedGradients.NONE,
+                     parallel_iterations=None,
                     experimental_use_pfor=True):
    """Computes and stacks per-example jacobians.

@ -1081,6 +1087,8 @@ class GradientTape(object):
        alters the value which will be returned if the target and sources are
        unconnected. The possible values and effects are detailed in
        'UnconnectedGradients' and it defaults to 'none'.
+      parallel_iterations: A knob to control how many iterations are dispatched
+        in parallel. This knob can be used to control the total memory usage.
      experimental_use_pfor: If true, uses pfor for computing the Jacobian. Else
        uses a tf.while_loop.

@ -1127,7 +1135,8 @@ class GradientTape(object):

    if experimental_use_pfor:
      try:
-        output = pfor_ops.pfor(loop_fn, target_row_size)
+        output = pfor_ops.pfor(loop_fn, target_row_size,
+                               parallel_iterations=parallel_iterations)
      except ValueError as err:
        six.reraise(
            ValueError,
@ -1142,7 +1151,8 @@ class GradientTape(object):
            "GradientTape must be created with persistent=True"
            " to compute the batch_jacobian with eager execution enabled and "
            " with experimental_use_pfor set to False.")
-      output = pfor_ops.for_loop(loop_fn, target.dtype, target_row_size)
+      output = pfor_ops.for_loop(loop_fn, target.dtype, target_row_size,
+                                 parallel_iterations=parallel_iterations)
    if output is None:
      return None
    output = array_ops.reshape(output,
--- a/tensorflow/python/eager/backprop_test.py
+++ b/tensorflow/python/eager/backprop_test.py
@ -1303,6 +1303,14 @@ class JacobianTest(test.TestCase):
    with self.assertRaisesRegexp(ValueError, 'No converter'):
      g.jacobian(y, x, experimental_use_pfor=True)

+  def test_parallel_iterations(self):
+    with backprop.GradientTape(persistent=True) as g:
+      x = constant_op.constant([[1., 2], [3, 4]])
+      g.watch(x)
+      y = math_ops.matmul(x, x)
+    self.assertAllClose(g.jacobian(y, x, parallel_iterations=2),
+                        g.jacobian(y, x, parallel_iterations=3))
+

@test_util.run_all_in_graph_and_eager_modes
 class BatchJacobianTest(test.TestCase):
@ -1397,5 +1405,14 @@ class BatchJacobianTest(test.TestCase):
    with self.assertRaisesRegexp(ValueError, 'No converter'):
      g.batch_jacobian(y, x, experimental_use_pfor=True)

+  def test_parallel_iterations(self):
+    with backprop.GradientTape(persistent=True) as g:
+      x = constant_op.constant([[1., 2], [3, 4]])
+      g.watch(x)
+      w = constant_op.constant([[1., 2, 3, 4], [5, 6, 7, 8]])
+      y = math_ops.matmul(x, w)
+    self.assertAllClose(g.batch_jacobian(y, x, parallel_iterations=2),
+                        g.batch_jacobian(y, x, parallel_iterations=3))
+
 if __name__ == '__main__':
  test.main()
--- a/tensorflow/tools/api/golden/v1/tensorflow.-gradient-tape.pbtxt
+++ b/tensorflow/tools/api/golden/v1/tensorflow.-gradient-tape.pbtxt
@ -8,7 +8,7 @@ tf_class {
  }
  member_method {
    name: "batch_jacobian"
-    argspec: "args=[\'self\', \'target\', \'source\', \'unconnected_gradients\', \'experimental_use_pfor\'], varargs=None, keywords=None, defaults=[\'UnconnectedGradients.NONE\', \'True\'], "
+    argspec: "args=[\'self\', \'target\', \'source\', \'unconnected_gradients\', \'parallel_iterations\', \'experimental_use_pfor\'], varargs=None, keywords=None, defaults=[\'UnconnectedGradients.NONE\', \'None\', \'True\'], "
  }
  member_method {
    name: "gradient"
@ -16,7 +16,7 @@ tf_class {
  }
  member_method {
    name: "jacobian"
-    argspec: "args=[\'self\', \'target\', \'sources\', \'unconnected_gradients\', \'experimental_use_pfor\'], varargs=None, keywords=None, defaults=[\'UnconnectedGradients.NONE\', \'True\'], "
+    argspec: "args=[\'self\', \'target\', \'sources\', \'unconnected_gradients\', \'parallel_iterations\', \'experimental_use_pfor\'], varargs=None, keywords=None, defaults=[\'UnconnectedGradients.NONE\', \'None\', \'True\'], "
  }
  member_method {
    name: "reset"
--- a/tensorflow/tools/api/golden/v2/tensorflow.-gradient-tape.pbtxt
+++ b/tensorflow/tools/api/golden/v2/tensorflow.-gradient-tape.pbtxt
@ -8,7 +8,7 @@ tf_class {
  }
  member_method {
    name: "batch_jacobian"
-    argspec: "args=[\'self\', \'target\', \'source\', \'unconnected_gradients\', \'experimental_use_pfor\'], varargs=None, keywords=None, defaults=[\'UnconnectedGradients.NONE\', \'True\'], "
+    argspec: "args=[\'self\', \'target\', \'source\', \'unconnected_gradients\', \'parallel_iterations\', \'experimental_use_pfor\'], varargs=None, keywords=None, defaults=[\'UnconnectedGradients.NONE\', \'None\', \'True\'], "
  }
  member_method {
    name: "gradient"
@ -16,7 +16,7 @@ tf_class {
  }
  member_method {
    name: "jacobian"
-    argspec: "args=[\'self\', \'target\', \'sources\', \'unconnected_gradients\', \'experimental_use_pfor\'], varargs=None, keywords=None, defaults=[\'UnconnectedGradients.NONE\', \'True\'], "
+    argspec: "args=[\'self\', \'target\', \'sources\', \'unconnected_gradients\', \'parallel_iterations\', \'experimental_use_pfor\'], varargs=None, keywords=None, defaults=[\'UnconnectedGradients.NONE\', \'None\', \'True\'], "
  }
  member_method {
    name: "reset"