Log - 42f5c50972cccb2ee5250d821b99121f62b0430e - platform/external/XNNPACK

42f5c50 LOADDUP variant of c2 microkernel by Frank Barchard · 3 years ago
94c11e6 Initialize compute type in Bankers' Rounding node by Marat Dukhan · 3 years ago
d2ad6d0 Disable NHWC->NCHW graph rewriting for non-FP32 nodes by Marat Dukhan · 3 years ago
8605333 Initialize xnn_compute_type in remaining Subgraph Nodes by Marat Dukhan · 3 years ago
b1325b9 Introduce xnn_compute_type in Subgraph Nodes by Marat Dukhan · 3 years ago
e22685a Remove padal from quantized microkernel names. by Frank Barchard · 3 years ago
eb704f7 QS8 C4S2 Neon GEMM/IGEMM microkernels by Frank Barchard · 3 years ago
9eb52c7 Fix build with older gcc versions on x86-64 by Marat Dukhan · 3 years ago
4133313 Remove duplicate e2e benchmark. by Frank Barchard · 3 years ago
a0c6168 F32->F16 Convert operator by Marat Dukhan · 3 years ago
e7043ff Enable C2S4 for QC8 GEMM/IGEMM microkernels. by Frank Barchard · 3 years ago
07228a3 Remove E2E MR=1 benchmarks by Frank Barchard · 3 years ago
c7a032d C2S4 QS8 Neon GEMM/IGEMM microkernels. by Frank Barchard · 3 years ago
1fe8995 Scalar F32->F16 VCVT microkernels by Marat Dukhan · 3 years ago
78f039d Scalar F16->F32 evaluation stubs of bitcast-based and fabsf-based variants by Marat Dukhan · 3 years ago
4edfdbf NEON F32->F16 VCVT microkernels by Marat Dukhan · 3 years ago
b4cde5a Fix CMake build on ARM by Marat Dukhan · 3 years ago
22e31c8 WAsm SIMD F32->F16 VCVT microkernels by Marat Dukhan · 3 years ago
eb84423 SSE2, SSE4.1, and AVX F32->F16 VCVT microkernels by Marat Dukhan · 3 years ago
79c78b2 Evaluation stubs for WAsm SIMD F32->F16 conversion by Marat Dukhan · 3 years ago
056f49d Evaluation stubs for SSE2 & SSE4.1 F32->F16 conversion by Marat Dukhan · 3 years ago
a6eb1e5 Evaluation stubs for NEON F32->F16 conversion by Marat Dukhan · 3 years ago
5132010 QS8 C4 Neon GEMM and E2E benchmarks by Frank Barchard · 3 years ago
f975ee0 Cortex A35 use A55 microkernels by Frank Barchard · 3 years ago
46cc1e1 Evaluation stubs for scalar F32->F16 conversion by Marat Dukhan · 3 years ago
cefc376 Fixes asan error in dwconv-microkernel-tester.h. by Alan Kelly · 3 years ago
287952a QS8 C4 Neon GEMM/IGEMM microkernels by Frank Barchard · 3 years ago
05f6e17 Expose quantized deconvolution via the subgraph API by Yury Kartynnik · 3 years ago
66ae257 Switch from C2 to S4C2 for qs8 microkernels on 32 bit ARM by Frank Barchard · 3 years ago
758b979 Expose XNNPACK transpose convolution implementation as TRANSPOSE_CONV builtin op by Yury Kartynnik · 3 years ago
0214d86 Expose XNNPACK transpose convolution implementation as TRANSPOSE_CONV builtin op by XNNPACK Team · 3 years ago
47a74db Add specific microkernel for 1D convolutions with 1x3 kernel size for Android backend by Artsiom Ablavatski · 3 years ago
dcdc2a2 Expose the optionality of bias in 2D deconvolution by Yury Kartynnik · 3 years ago
1f31f99 Expose XNNPACK transpose convolution implementation as TRANSPOSE_CONV builtin op by Yury Kartynnik · 3 years ago
494cd2b S4 variant of C2 Neon GEMM/IGEMM microkernel by Frank Barchard · 3 years ago
952cb51 S4 variant of C2 Neon GEMM/IGEMM mull microkernel by Frank Barchard · 3 years ago
fa4daf0 Add ISA check to QU8 GEMM benchmark by Frank Barchard · 3 years ago
ccbaedf C2 Neon microkernel remove duplicate DUP instructions from NR loop. by Frank Barchard · 3 years ago
1d41247 Neon C2 microkernels switch to rndnu from gemmlowp by Frank Barchard · 3 years ago
8e9a66f Parse shuffle after channels for test names by Frank Barchard · 3 years ago
582e184 Evaluation stubs and tests for FP16->FP32 conversion by Marat Dukhan · 3 years ago
ddb3d16 F16 Fully Connected operator by Marat Dukhan · 3 years ago
d77f77d F32->F16 VCVT microkernels for NEON-FP16, F16C, and AVX512 by Marat Dukhan · 3 years ago
af2ba00 F16->F32 Convert operator by Marat Dukhan · 3 years ago
ade893c Support unary elementwise ops on 0-dimensional tensors (scalars) by Marat Dukhan · 3 years ago
c9f9d67 Add Channel Tile of 16 for float and 32 for half float. by Frank Barchard · 3 years, 1 month ago
dbe781b Enable 8x4, 8x9, 8x25 f32 dwconv by Frank Barchard · 3 years, 1 month ago
e2c0001 Scalar FP16->FP32 VCVT microkernels by Marat Dukhan · 3 years, 1 month ago
434352f Benchmarks for FP16->FP32 VCVT microkernels by Marat Dukhan · 3 years, 1 month ago
f6507f8 WAsm SIMD FP16->FP32 VCVT microkernels by Marat Dukhan · 3 years, 1 month ago
322ed6f NEON FP16->FP32 VCVT microkernels by Marat Dukhan · 3 years, 1 month ago
1227adb SSE2/SSE4.1/AVX FP16->FP32 VCVT microkernels by Marat Dukhan · 3 years, 1 month ago
2dd18fd Parse ROW_TILE field in multipass DWCONV variant by Frank Barchard · 3 years, 1 month ago
3c6d6b4 Update performance data on Raspberry Pi by Marat Dukhan · 3 years, 1 month ago
1851410 f32 dwconv load params first by Frank Barchard · 3 years, 1 month ago
e187b79 f32 dwconv remainder handler remove branch by Frank Barchard · 3 years, 1 month ago
758c7ca f32 dwconv remove vector push/pop by Frank Barchard · 3 years, 1 month ago
e40ef6e f32 dwconv use STR instead of ST1 by Frank Barchard · 3 years, 1 month ago
60f903b NEON FP16->FP32 conversion evaluation stubs by Marat Dukhan · 3 years, 1 month ago
a18926a WAsm SIMD FP16->FP32 conversion evaluation stubs by Marat Dukhan · 3 years, 1 month ago
3ed866b Test evaluation stubs for F16->F32 conversion by Marat Dukhan · 3 years, 1 month ago
8ff372c NEON-FP16 implementation of F16->F32 VCVT microkernels by Marat Dukhan · 3 years, 1 month ago
0630d29 Refactor creation and setup of Operators from Nodes by Marat Dukhan · 3 years, 1 month ago
354cbc6 QU8 MUL8 variant of DWCONV by Frank Barchard · 3 years, 1 month ago
1b1b032 Avoid backward references in Bazel targets by Marat Dukhan · 3 years, 1 month ago
79c76ab F16->F32 conversion microkernels in AVX512-SKX implementation by Marat Dukhan · 3 years, 1 month ago
f1a6ed3 F16->F32 conversion microkernels in F16C implementation by Marat Dukhan · 3 years, 1 month ago
694d252 Fix incorrect initialization of QC8 GEMM/IGEMM parameters on AArch32+NEONDOT by Marat Dukhan · 3 years, 1 month ago
0bf8afa Leverage f32x4.pmin and f32x4.pmax WAsm SIMD instructions by Marat Dukhan · 3 years, 1 month ago
a4ad988 X8 LUT microkernels for WAsm SIMD by Marat Dukhan · 3 years, 2 months ago
aea2d55 Fix test failure in quantized Leaky ReLU NC test under ASan by Marat Dukhan · 3 years, 2 months ago
2aa2e2a q8 dwconv add channel tiles of 24 and 32 for mul16 rndnu microkernels by Frank Barchard · 3 years, 2 months ago
5cc31e3 Replace _mm512_(loadu/storeu)_epi8 with _mm512_(loadu/storeu)_si512 by Marat Dukhan · 3 years, 2 months ago
37c3077 Avoid _mm512_(loadu/storeu)_epi32 in _mm512_(loadu/storeu)_epi8 polyfills by Marat Dukhan · 3 years, 2 months ago
2ea9075 Script to sort file names in BUILD and CMakeLists.txt by Frank Barchard · 3 years, 2 months ago
d0bf04c Fully qualify std::signbit in ELUOperatorTester by Marat Dukhan · 3 years, 2 months ago
b54871d Polyfill _mm512_loadu_epi8 & _mm512_storeu_epi8 for pre GCC-11 by Marat Dukhan · 3 years, 2 months ago
67492b0 Expose quantized ELU operator in Subgraph API by Marat Dukhan · 3 years, 2 months ago
eec0052 QS8 ELU operator by Marat Dukhan · 3 years, 2 months ago
e4118ef Polyfill vld1q_u8_x4 for older AArch64 gcc versions by Marat Dukhan · 3 years, 2 months ago
55bad94 Change QS8 to QU8 in dwconv test by Frank Barchard · 3 years, 2 months ago
2366290 Add qu8_gemm_4x16__aarch64_neon_mlal_lane_cortex_a75 benchmark to E2E by Frank Barchard · 3 years, 2 months ago
98e054b Enable vectorized X8 LUT microkernels by Marat Dukhan · 3 years, 2 months ago
2b3c410 AVX512BW implementations of X8 LUT microkernels by Marat Dukhan · 3 years, 2 months ago
7c478e3 SSSE3, AVX, and AVX2 X8 LUT microkernels by Marat Dukhan · 3 years, 2 months ago
5de7bc0 QS8/QU8 Tanh operator using LUT microkernels by Marat Dukhan · 3 years, 2 months ago
f718232 X8 LUT NEON microkernels by Marat Dukhan · 3 years, 2 months ago
548542c Fix CMake build by Marat Dukhan · 3 years, 2 months ago
a4ba5d4 Expose quantized Sigmoid operator in Subgraph API by Marat Dukhan · 3 years, 2 months ago
71a9bb1 QS8 Sigmoid operator by Marat Dukhan · 3 years, 2 months ago
f6c991e Implement generic LUT-based elementwise operator by Marat Dukhan · 3 years, 2 months ago
5407437 Benchmark for X8 LUT microkernels by Marat Dukhan · 3 years, 2 months ago
d67539d Auto-generate X8 LUT microkernels and tests by Marat Dukhan · 3 years, 2 months ago
2df7542 Add qu8_4x8__neon_mlal_lane benchmark by Frank Barchard · 3 years, 2 months ago
cdf59a5 Add QU8 NR=32 microkernels by Frank Barchard · 3 years, 2 months ago
d460d0b Neon IGEMM do remainder with reversed MR for shifts by Frank Barchard · 3 years, 2 months ago
dfe763f Expose quantized Subtract operator in Subgraph API by Marat Dukhan · 3 years, 2 months ago
b8cbcb5 Fuse rounding term into bias in QS8 & QU8 VADD[C] microkernels by Marat Dukhan · 3 years, 2 months ago
031ff4b Template bug fix in stores for remainder of 8 in Neon QS8 microkernels by Frank Barchard · 3 years, 2 months ago
8e2fd20 QS8 and QU8 Subtract ND operators by Marat Dukhan · 3 years, 2 months ago