Use XNN_ARCH_* macros for architecture-specific parts in micro-kernels PiperOrigin-RevId: 282810001

commit: c72fa1e65f314612a9746a6ce783c0b218695f1b [log] [tgz]
author: Marat Dukhan <maratek@google.com> Wed Nov 27 11:54:03 2019 -0800
committer: XNNPACK Team <xnnpack-github-robot@google.com> Wed Nov 27 11:54:31 2019 -0800
tree: e17b227f72a59a1a50c11f33fec29a1db750497c
parent: 69172d92ecd316804cc8a80e779b07cc51defb81 [diff] [blame]
diff --git a/src/q8-gavgpool/up7-neon.c b/src/q8-gavgpool/up7-neon.c
index 09a2d20..5591dbc 100644
--- a/src/q8-gavgpool/up7-neon.c
+++ b/src/q8-gavgpool/up7-neon.c

@@ -10,6 +10,7 @@
 
 #include <arm_neon.h>
 
+#include <xnnpack/common.h>
 #include <xnnpack/gavgpool.h>
 
 
@@ -53,7 +54,7 @@
   }
 
   const int32x4_t vbias = vld1q_dup_s32(&params->neon.bias);
-#ifdef __aarch64__
+#if XNN_ARCH_ARM64
   const int32x4_t vmultiplier = vld1q_dup_s32(&params->neon.multiplier);
 #else
   const int32x2_t vmultiplier = vld1_dup_s32(&params->neon.multiplier);
@@ -85,7 +86,7 @@
     const int32x4_t vneg_mask_lo = vreinterpretq_s32_u32(vcltq_s32(vacc_lo, vmovq_n_s32(0)));
     const int32x4_t vneg_mask_hi = vreinterpretq_s32_u32(vcltq_s32(vacc_hi, vmovq_n_s32(0)));
 
-#if defined(__aarch64__)
+#if XNN_ARCH_ARM64
     const int64x2_t vproduct01 = vmull_s32(vget_low_s32(vacc_lo), vget_low_s32(vmultiplier));
     const int64x2_t vproduct23 = vmull_high_s32(vacc_lo, vmultiplier);
     const int64x2_t vproduct45 = vmull_s32(vget_low_s32(vacc_hi), vget_low_s32(vmultiplier));
@@ -112,7 +113,7 @@
     const int64x2_t vscaled_acc45 = vrshlq_s64(vadjusted_product45, vleft_shift);
     const int64x2_t vscaled_acc67 = vrshlq_s64(vadjusted_product67, vleft_shift);
 
-#ifdef __aarch64__
+#if XNN_ARCH_ARM64
     vacc_lo = vuzp1q_s32(vreinterpretq_s32_s64(vscaled_acc01), vreinterpretq_s32_s64(vscaled_acc23));
     vacc_hi = vuzp1q_s32(vreinterpretq_s32_s64(vscaled_acc45), vreinterpretq_s32_s64(vscaled_acc67));
 
@@ -155,7 +156,7 @@
     const int32x4_t vneg_mask_lo = vreinterpretq_s32_u32(vcltq_s32(vacc_lo, vmovq_n_s32(0)));
     const int32x4_t vneg_mask_hi = vreinterpretq_s32_u32(vcltq_s32(vacc_hi, vmovq_n_s32(0)));
 
-#if defined(__aarch64__)
+#if XNN_ARCH_ARM64
     const int64x2_t vproduct01 = vmull_s32(vget_low_s32(vacc_lo), vget_low_s32(vmultiplier));
     const int64x2_t vproduct23 = vmull_high_s32(vacc_lo, vmultiplier);
     const int64x2_t vproduct45 = vmull_s32(vget_low_s32(vacc_hi), vget_low_s32(vmultiplier));
@@ -182,7 +183,7 @@
     const int64x2_t vscaled_acc45 = vrshlq_s64(vadjusted_product45, vleft_shift);
     const int64x2_t vscaled_acc67 = vrshlq_s64(vadjusted_product67, vleft_shift);
 
-#ifdef __aarch64__
+#if XNN_ARCH_ARM64
     vacc_lo = vuzp1q_s32(vreinterpretq_s32_s64(vscaled_acc01), vreinterpretq_s32_s64(vscaled_acc23));
     vacc_hi = vuzp1q_s32(vreinterpretq_s32_s64(vscaled_acc45), vreinterpretq_s32_s64(vscaled_acc67));
commit	c72fa1e65f314612a9746a6ce783c0b218695f1b	[log] [tgz]
author	Marat Dukhan <maratek@google.com>	Wed Nov 27 11:54:03 2019 -0800
committer	XNNPACK Team <xnnpack-github-robot@google.com>	Wed Nov 27 11:54:31 2019 -0800
tree	e17b227f72a59a1a50c11f33fec29a1db750497c
parent	69172d92ecd316804cc8a80e779b07cc51defb81 [diff] [blame]