Modified `cumulative_logsumexp` to improve handling of `-inf` elements.

Fixes b/153928926 PiperOrigin-RevId: 307475953 Change-Id: I2d59e0076a08d04e88bac6d66dfad8b227078f42
2020-04-20 14:23:26 -07:00 · 2020-04-20 14:23:26 -07:00 · e885af2941
parent a29adb7b49
commit e885af2941
2 changed files with 77 additions and 11 deletions
--- a/tensorflow/core/kernels/scan_ops.h
+++ b/tensorflow/core/kernels/scan_ops.h
@ -24,6 +24,7 @@ namespace functor {
 typedef Eigen::Index Index;
 // TODO(b/154339590): Needs to be vectorized.
 template <typename Device, typename Reducer, typename T>
 struct Scan {
  void operator()(const Device& d, typename TTypes<T, 3>::ConstTensor in,
@ -44,18 +45,33 @@ template <typename T>
 struct LogSumExp {
  EIGEN_DEVICE_FUNC EIGEN_STRONG_INLINE T operator()(const T& a,
                                                     const T& b) const {
-    Eigen::internal::scalar_sum_op<T> sum_op;
+    auto mi = Eigen::internal::scalar_min_op<T>()(a, b);
-    Eigen::internal::scalar_exp_op<T> exp_op;
+    auto ma = Eigen::internal::scalar_max_op<T>()(a, b);
    Eigen::internal::scalar_log_op<T> log_op;
    Eigen::internal::scalar_max_op<T> max_op;
    Eigen::internal::scalar_min_op<T> min_op;
    Eigen::internal::scalar_log1p_op<T> log1p_op;
    Eigen::internal::scalar_difference_op<T> diff_op;
-    auto mi = min_op(a, b);
+    auto sub = Eigen::internal::scalar_difference_op<T>();
-    auto ma = max_op(a, b);
+    auto add = Eigen::internal::scalar_sum_op<T>();
    auto exp = Eigen::internal::scalar_exp_op<T>();
    auto log1p = Eigen::internal::scalar_log1p_op<T>();
    auto cmp_lt =
        Eigen::internal::scalar_cmp_op<T, T, Eigen::internal::cmp_LT>();
-    return sum_op(log1p_op(exp_op(diff_op(mi, ma))), ma);
+    auto logsumexp = add(log1p(exp(sub(mi, ma))), ma);
    return cmp_lt(ma, Eigen::NumTraits<T>::lowest()) ? ma : logsumexp;
  }
  EIGEN_DEVICE_FUNC EIGEN_STRONG_INLINE T packetOp(const T& a,
                                                   const T& b) const {
    auto mi = Eigen::internal::pmin(a, b);
    auto ma = Eigen::internal::pmax(a, b);
    using Eigen::internal::padd;
    using Eigen::internal::pcmp_lt;
    using Eigen::internal::pexp;
    using Eigen::internal::plog1p;
    using Eigen::internal::pset1;
    using Eigen::internal::psub;
    auto logsumexp = padd(plog1p(pexp(psub(mi, ma))), ma);
    return pselect(pcmp_lt(ma, pset1(Eigen::NumTraits<T>::lowest())), ma,
                   logsumexp);
  }
 };
@ -66,13 +82,58 @@ struct LogSumExpReducer {
    *accum = logsumexp(*accum, t);
  }
  template <typename Packet>
  EIGEN_DEVICE_FUNC EIGEN_STRONG_INLINE void reducePacket(const Packet& p,
                                                          Packet* accum) const {
    LogSumExp<T> logsumexp;
    *accum = logsumexp.packetOp(*accum, p);
  }
  EIGEN_DEVICE_FUNC EIGEN_STRONG_INLINE T initialize() const {
-    return Eigen::NumTraits<T>::lowest();
+    return -Eigen::NumTraits<T>::infinity();
  }
  template <typename Packet>
  EIGEN_DEVICE_FUNC EIGEN_STRONG_INLINE Packet initializePacket() const {
    return Eigen::internal::pset1(initialize());
  }
  EIGEN_DEVICE_FUNC EIGEN_STRONG_INLINE T finalize(const T accum) const {
    return accum;
  }
  template <typename Packet>
  EIGEN_DEVICE_FUNC EIGEN_STRONG_INLINE Packet
  finalizePacket(const Packet& vaccum) const {
    return vaccum;
  }
  template <typename Packet>
  EIGEN_DEVICE_FUNC EIGEN_STRONG_INLINE T
  finalizeBoth(const T saccum, const Packet& vaccum) const {
    auto max_reducer = Eigen::internal::MaxReducer<T>();
    auto sum_reducer = Eigen::internal::SumReducer<T>();
    auto exp = Eigen::internal::scalar_exp_op<T>();
    auto cmp_lt =
        Eigen::internal::scalar_cmp_op<T, T, Eigen::internal::cmp_LT>();
    auto log = Eigen::internal::scalar_log_op<T>();
    auto add = Eigen::internal::scalar_sum_op<T>();
    using Eigen::internal::pexp;
    using Eigen::internal::psub;
    // `ma = max(x1, ..., xn)`
    // If the max of all of the `xi` is `-infinity` then the result is
    // -infinity. If the max is larger than `-infinity` then it's safe to use
    // for normalization even if the other elements are `-infinity`.
    //
    // `logsumexp(x1, ..., xn) = ma + log (exp(x1 - ma) + ... + exp(xn - ma))`
    auto ma = max_reducer.finalizeBoth(saccum, vaccum);
    auto logsumexp = add(log(sum_reducer.finalizeBoth(
                             exp(saccum - ma), pexp(psub(vaccum, pset1(ma))))),
                         ma);
    return cmp_lt(ma, Eigen::NumTraits<T>::lowest()) ? initialize() : logsumexp;
  }
 };
 }  // namespace functor
--- a/tensorflow/python/kernel_tests/cumulative_logsumexp_test.py
+++ b/tensorflow/python/kernel_tests/cumulative_logsumexp_test.py
@ -55,6 +55,11 @@ class CumulativeLogsumexpTest(test.TestCase):
              reverse=reverse, exclusive=exclusive,
              axis=axis)
  def testMinusInfinity(self):
    x = np.log([0., 0., 1., 1., 1., 1., 0., 0.])
    self._testLogSumExpAllArgs(x, use_gpu=False)
    self._testLogSumExpAllArgs(x, use_gpu=True)
  def test1D(self):
    x = np.arange(10) / 10.0 - 0.5
    self._testLogSumExpAllArgs(x, use_gpu=False)