[MLIR][KernelGen] Fix performance discrepancy for logical_not kernel

Loads and stores are not successfully vectorized. Disable loop unrolling to increase parallelism. PiperOrigin-RevId: 346293461 Change-Id: Ibfc360360eacc66c570ea990580fccfedac8c1de
2020-12-08 04:12:37 -08:00 · 2020-12-08 04:12:37 -08:00 · 40cd0a047d
commit 40cd0a047d
parent b0e5853cf0
1 changed files with 1 additions and 1 deletions
--- a/tensorflow/core/kernels/mlir_generated/BUILD
+++ b/tensorflow/core/kernels/mlir_generated/BUILD
@ -289,7 +289,7 @@ gen_kernel_library(
    generate_unranked = True,
    tile_size = "256",
    types = ["i1"],
-    unroll_factors = "4",
+    unroll_factors = "1",
 )

 gen_kernel_library(