QS8 DWCONV microkernels with RNDNU requantization Enable RNDNU-requantized DWCONV microkernels on AArch32 for a minor performance improvement on Pixel 2: - QS8 MobileNet v1: 73234 us -> 72757 us - QS8 MobileNet v1: 51472 us -> 51203 us PiperOrigin-RevId: 385261813

commit: be18f5c37f28e5439ecec2835f4e86d662f795e9 [log] [tgz]
author: Marat Dukhan <maratek@google.com> Fri Jul 16 18:46:39 2021 -0700
committer: XNNPACK Team <xnnpack-github-robot@google.com> Fri Jul 16 18:47:19 2021 -0700
tree: 8d4b0b7f92e3f7badc238abd2cd361f23c436091
parent: f975d7f85a65fa68eb83097c8169a6a303e31e17 [diff] [blame]
diff --git a/BUILD.bazel b/BUILD.bazel
index 9f6715a..9db490a 100644
--- a/BUILD.bazel
+++ b/BUILD.bazel

@@ -1926,12 +1926,16 @@
     "src/qc8-igemm/gen/4x16-minmax-fp32-neon-mlal-lane.c",
     "src/qs8-dwconv/gen/up8x9-minmax-fp32-neon-mul16.c",
     "src/qs8-dwconv/gen/up8x9-minmax-gemmlowp-neon-mul16.c",
+    "src/qs8-dwconv/gen/up8x9-minmax-rndnu-neon-mul16.c",
     "src/qs8-dwconv/gen/up8x25-minmax-fp32-neon-mul16.c",
     "src/qs8-dwconv/gen/up8x25-minmax-gemmlowp-neon-mul16.c",
+    "src/qs8-dwconv/gen/up8x25-minmax-rndnu-neon-mul16.c",
     "src/qs8-dwconv/gen/up16x9-minmax-fp32-neon-mul16.c",
     "src/qs8-dwconv/gen/up16x9-minmax-gemmlowp-neon-mul16.c",
+    "src/qs8-dwconv/gen/up16x9-minmax-rndnu-neon-mul16.c",
     "src/qs8-dwconv/gen/up16x25-minmax-fp32-neon-mul16.c",
     "src/qs8-dwconv/gen/up16x25-minmax-gemmlowp-neon-mul16.c",
+    "src/qs8-dwconv/gen/up16x25-minmax-rndnu-neon-mul16.c",
     "src/qs8-dwconv/gen/up24x9-minmax-fp32-neon-mul16.c",
     "src/qs8-dwconv/gen/up24x9-minmax-gemmlowp-neon-mul16.c",
     "src/qs8-dwconv/gen/up24x25-minmax-fp32-neon-mul16.c",
@@ -7748,6 +7752,16 @@
 )
 
 xnnpack_unit_test(
+    name = "qs8_dwconv_minmax_fp32_test",
+    srcs = [
+        "test/qs8-dwconv-minmax-fp32.cc",
+        "test/dwconv-microkernel-tester.h",
+        "src/xnnpack/AlignedAllocator.h",
+    ] + WEIGHTS_PACK_HDRS + MICROKERNEL_TEST_HDRS,
+    deps = MICROKERNEL_TEST_DEPS + [":packing"],
+)
+
+xnnpack_unit_test(
     name = "qs8_dwconv_minmax_gemmlowp_test",
     srcs = [
         "test/qs8-dwconv-minmax-gemmlowp.cc",
@@ -7758,9 +7772,9 @@
 )
 
 xnnpack_unit_test(
-    name = "qs8_dwconv_minmax_fp32_test",
+    name = "qs8_dwconv_minmax_rndnu_test",
     srcs = [
-        "test/qs8-dwconv-minmax-fp32.cc",
+        "test/qs8-dwconv-minmax-rndnu.cc",
         "test/dwconv-microkernel-tester.h",
         "src/xnnpack/AlignedAllocator.h",
     ] + WEIGHTS_PACK_HDRS + MICROKERNEL_TEST_HDRS,
commit	be18f5c37f28e5439ecec2835f4e86d662f795e9	[log] [tgz]
author	Marat Dukhan <maratek@google.com>	Fri Jul 16 18:46:39 2021 -0700
committer	XNNPACK Team <xnnpack-github-robot@google.com>	Fri Jul 16 18:47:19 2021 -0700
tree	8d4b0b7f92e3f7badc238abd2cd361f23c436091
parent	f975d7f85a65fa68eb83097c8169a6a303e31e17 [diff] [blame]