Log - 4a1c6a8179d1e9932f586b56c9163a62a6778851 - platform/external/XNNPACK

4a1c6a8 Implement ldp (d registers) offset and post index for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
193f4e1 Disable QU8 dot product for AArch32 IOS by Frank Barchard · 2 years, 10 months ago
048704d Implement stp (q registers) offset and post indexed for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
3cec451 Implement tst (immediate) for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
8709ac9 Implement csel for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
ba5091f Enable QC8 4x8 dot product GEMM AArch32 microkernel for Cortex A55 by Frank Barchard · 2 years, 10 months ago
a1cad4a Add x8 transpose bench by Alan Kelly · 2 years, 10 months ago
ba68f44 Add x64 transpose bench by Alan Kelly · 2 years, 10 months ago
e1ff738 Update assembly register usage comments. by Frank Barchard · 2 years, 10 months ago
35d8e68 Implemnet stp (d register) offset and pre-index for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
6c30427 Remove unused transpose ukernel declarations and unnecessary semi-colons. by Alan Kelly · 2 years, 10 months ago
c821ea7 Refactor x16 transpose bench and add missing ukernels. by Alan Kelly · 2 years, 10 months ago
658a67d Implement add (x registers) for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
80eac62 Implement cmp (immediate) for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
c98f0d2 Fix patching of branch instructions immediate by Zhi An Ng · 2 years, 10 months ago
e8bbda0 Re-factor x32 transpose bench by Alan Kelly · 2 years, 10 months ago
ac654f1 QC8 4x8 dot product GEMM AArch32 microkernel for Cortex A55 by Frank Barchard · 2 years, 10 months ago
364598a Enable QS8 4x8 dot product GEMM AArch32 microkernel little core by Frank Barchard · 2 years, 10 months ago
1e277fd Bug fixes for QS8 Cortex A55 by Frank Barchard · 2 years, 10 months ago
491e9e0 Implement ldr for s and d registers and str for d registers (post-indexed) for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
708874b Add cpu configs to support iOS simulator builds on M1-based macs. by XNNPACK Team · 2 years, 10 months ago
1228b3e Enable QS8 4x8 dot product GEMM AArch32 microkernel for Cortex A55 by Frank Barchard · 2 years, 10 months ago
0f294ad QS8 4x8 dot product GEMM AArch32 microkernel for Cortex A55 by Frank Barchard · 2 years, 10 months ago
2f24c3e Implement dup (vector) for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
f761632 Implement str (q register, post-indexed) and str (s register, offset) for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
5a5c9e1 Implement mov (VRegister) for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
5e31395 Implement stp (post-indexed) for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
4915509 Implement add with immediate for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
4ab1390 Rename kTbz enum to kTbxz and add comment to clarify its usage for both TBZ and TBNZ by Zhi An Ng · 2 years, 10 months ago
b10677e Implement unconditional branch for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
56e8b91 Implement tbz for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
cdfff79 Implement ret for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
039a388 Exclude quantized AVX512 microkernels from mobile builds by Marat Dukhan · 2 years, 10 months ago
3176868 Implement sub (x register) for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
3f34299 Implement st1 for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
544d73d Implement fmax and fmin (vector) for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
ecfb1f0 Implement fadd (vector) for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
0981080 Implement tbnz for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
6a1151b Implement fmla for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
157b0f4 Implement ldr ldp for q registers in aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
f67f1be Implement labels and B.cond for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
e2dc2ec Implement subs for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
234d6b4 Implement prfm (only PLDL1KEEP) on aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
65ccb13 Implement movi for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
6e68f54 Implement ld1 for 1, 2, and 3 registers for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
5702efb Implement ld2r for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
04cdc41 Implement ldr for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
0ba29e7 Implement LDP for aarch64 assembler by Zhi An Ng · 2 years, 10 months ago
70ea0a2 Specialize F32 GEMM A53 JIT microkernel for min/max params by Zhi An Ng · 2 years, 10 months ago
109a5eb Initial aarch64 assembler structure by Zhi An Ng · 2 years, 10 months ago
8f920a6 Initialize F16 microkernel pointers on x86 by Marat Dukhan · 2 years, 10 months ago
ffbf7ff Cleanup transpose microkernels in BUILD & CMakeLists by Marat Dukhan · 2 years, 10 months ago
66eb508 Add missing declarations and unit tests for F16 DWCONV microkernels by Marat Dukhan · 2 years, 10 months ago
0ec25cf Duplicate test methods in gemm-microkernel-test for JIT codegen, update IGEMM generator signature and test generation script. by Zhi An Ng · 2 years, 10 months ago
e7225eb Specialize F32 GEMM (a53) on kc by Zhi An Ng · 2 years, 10 months ago
8d07e40 Enable QU8 4x8 NEON MLA Lane microkernel AArch32 assembly language by Frank Barchard · 2 years, 10 months ago
901845c QU8 4x8 NEON MLA Lane microkernel AArch32 assembly language by Frank Barchard · 2 years, 10 months ago
b26ead1 F16C implementation of F16 GAVGPOOL microkernels by Marat Dukhan · 2 years, 10 months ago
c7c92b0 Generate F16 GAVGPOOL NEONFP16ARITH microkernels from template by Marat Dukhan · 2 years, 10 months ago
01f6aee Add unreachable check for F32 GEMM a53 generator by Zhi An Ng · 2 years, 10 months ago
e78eb33 Bump shard count for f32_igemm_minmax_test (timing out on coverage runs) by Zhi An Ng · 2 years, 10 months ago
13599f3 Specialize F32 GEMM (a53) on nc by Zhi An Ng · 2 years, 10 months ago
1d6b7c9 Support FP32 weights in FP16 NC Fully Connected operator by Marat Dukhan · 2 years, 10 months ago
d2e8d4d Enable QC8 AArch32 4x8 lane GEMM/IGEMM assembly microkernels for ARMv7 NEON by Frank Barchard · 2 years, 10 months ago
6989ec4 Support FP32 weights in FP16 NHWC Convolution operator by Marat Dukhan · 2 years, 10 months ago
5e1a303 QC8 GEMM/IGEMM assembly microkernels for ARMv7 NEON by Frank Barchard · 2 years, 10 months ago
83844ae Change JIT generator signature to accept nc and kc to specialize on those values by Zhi An Ng · 2 years, 10 months ago
b1a869d Merge generate transpose scripts by Alan Kelly · 2 years, 10 months ago
9dfdfb5 Remove unused transpose function declarations. by Alan Kelly · 2 years, 10 months ago
667e0f1 Regenerate transpose tests by Alan Kelly · 2 years, 10 months ago
4b23423 Split test generator for qu8-gavgpool by Frank Barchard · 2 years, 10 months ago
5da6d38 SSE2 transpose microkernel code generator. by Alan Kelly · 2 years, 10 months ago
d19bde9 Add x64 scalar transpose microkernels by Alan Kelly · 2 years, 10 months ago
cd21b02 Add x8 scalar transpose microkernels by Alan Kelly · 2 years, 10 months ago
84aae41 Add x16 scalar transpose microkernels by Alan Kelly · 2 years, 10 months ago
6315472 Remove declarations for scalar transpose microkernels that don't exist by Alan Kelly · 2 years, 10 months ago
d7111a5 Remove F32 GEMM E2E JIT benchmarks (temporarily) as we are changing the JIT generator interface by Zhi An Ng · 2 years, 10 months ago
58fe65e Change default JIT code buffer size to 16kb by Zhi An Ng · 2 years, 10 months ago
af9ff85 Fix GEMM test templates to use variable n instead of fixed NR and regenerate tests by Zhi An Ng · 2 years, 10 months ago
2d38e3c Fix more errors in CMakeLists by Marat Dukhan · 2 years, 10 months ago
1e074d7 Fix CMake build by Marat Dukhan · 2 years, 10 months ago
8575504 Switch QS8/QU8 GAVGPOOL NEON microkernels to RNDNU requantization by Marat Dukhan · 2 years, 10 months ago
33a98fa Switch QS8/QU8 VMUL[C] NEON microkernels to RNDNU requantization by Marat Dukhan · 2 years, 10 months ago
d1f53e4 Generate QU8 GAVGPOOL microkernels from QS8 GAVGPOOL templates by Marat Dukhan · 2 years, 10 months ago
d81fa0a Pipeline remaining QS8 AVGPOOL microkernels by Marat Dukhan · 2 years, 10 months ago
139337c Include vcvtnq_f32 polyfill in QS8 GAVGPOOL NEONV8 microkernels by Marat Dukhan · 2 years, 10 months ago
9e258d6 Remove multi-accumulator support in QS8 GAVGPOOL microkernels by Marat Dukhan · 2 years, 10 months ago
7d45d90 Create a new jit-test for jit-related tests that are not architecture specific by Zhi An Ng · 2 years, 10 months ago
7781786 Enable QU8 3x8 lane for AArch32 by Frank Barchard · 2 years, 10 months ago
d7a4b22 Generate missing QS8 GAVGPOOL microkernels by Marat Dukhan · 2 years, 10 months ago
6faf955 Reoptimize SSE QS8 GAVGPOOL microkernels by Marat Dukhan · 2 years, 10 months ago
847ff5e Refactor naming of QS8 GAVGPOOL microkernels by Marat Dukhan · 2 years, 10 months ago
53f4106 Switch QS8 GAVGPOOL microkernels to use FP32 requantization by Marat Dukhan · 2 years, 10 months ago
e9e9708 Add missing asserts for requantization scale in MUL parameters initialization by Marat Dukhan · 2 years, 10 months ago
34cb23f Re-generate amalgamated microkernels by Marat Dukhan · 2 years, 10 months ago
1789a3c Fix CMake builds by Zhi An Ng · 2 years, 10 months ago
1581248 Specify 8-byte alignment for packed WAsm SIMD parameters by Marat Dukhan · 2 years, 10 months ago
1a856c1 Change unit tests to depend on jit_test_mode by Zhi An Ng · 2 years, 10 months ago
90a10b8 Replicate QS8/QU8 MUL WAsm SIMD parameters to 64 bit rather than 128 bit by Marat Dukhan · 2 years, 10 months ago
3b32963 Fix bug in not changing memory to be executable when we have unused capacity. by Zhi An Ng · 2 years, 10 months ago