Neon shuffle GEMM and IGEMM kernels. M1 is 7.1% faster on mobilenet_v2 M2 is 6.5% faster on mobilenet_v2 PiperOrigin-RevId: 281623279

commit: df06d80baaeea9241cbc84bb55a20eaa728deb55 [log] [tgz]
author: Frank Barchard <fbarchard@google.com> Wed Nov 20 15:53:46 2019 -0800
committer: XNNPACK Team <xnnpack-github-robot@google.com> Wed Nov 20 16:20:49 2019 -0800
tree: ee84a9038a78fbdffbd77f5e3d62c9ba73614757
parent: 93d29a38d9b2bdd6072c446d6365d5b8dde04965 [diff] [blame]
diff --git a/test/f32-gemminc.yaml b/test/f32-gemminc.yaml
index 4e52c3d..ce7ea69 100644
--- a/test/f32-gemminc.yaml
+++ b/test/f32-gemminc.yaml

@@ -75,6 +75,14 @@
   k-block: 2
 - name: xnn_f32_gemminc_ukernel_6x8__neon_ld64
   k-block: 2
+- name: xnn_f32_gemminc_ukernel_1x8s4__neon
+  k-block: 4
+- name: xnn_f32_gemminc_ukernel_4x8s4__neon
+  k-block: 4
+- name: xnn_f32_gemminc_ukernel_6x8s4__neon
+  k-block: 4
+- name: xnn_f32_gemminc_ukernel_8x8s4__neon
+  k-block: 4
 - name: xnn_f32_gemminc_ukernel_1x8__neonfma_ld64
   k-block: 2
 - name: xnn_f32_gemminc_ukernel_4x8__neonfma_ld64
@@ -85,6 +93,14 @@
   k-block: 2
 - name: xnn_f32_gemminc_ukernel_6x8__neonfma_ld64
   k-block: 2
+- name: xnn_f32_gemminc_ukernel_1x8s4__neonfma
+  k-block: 4
+- name: xnn_f32_gemminc_ukernel_4x8s4__neonfma
+  k-block: 4
+- name: xnn_f32_gemminc_ukernel_6x8s4__neonfma
+  k-block: 4
+- name: xnn_f32_gemminc_ukernel_8x8s4__neonfma
+  k-block: 4
 - name: xnn_f32_gemminc_ukernel_1x8__sse_load1
   k-block: 1
 - name: xnn_f32_gemminc_ukernel_4x8__sse_load1
commit	df06d80baaeea9241cbc84bb55a20eaa728deb55	[log] [tgz]
author	Frank Barchard <fbarchard@google.com>	Wed Nov 20 15:53:46 2019 -0800
committer	XNNPACK Team <xnnpack-github-robot@google.com>	Wed Nov 20 16:20:49 2019 -0800
tree	ee84a9038a78fbdffbd77f5e3d62c9ba73614757
parent	93d29a38d9b2bdd6072c446d6365d5b8dde04965 [diff] [blame]