blob: d018881c4c5554b043dd9d254e7e7df4fc97f249 [file] [log] [blame]
Marat Dukhanf9480682020-07-31 14:50:24 -07001#!/bin/sh
2# Copyright 2020 Google LLC
3#
4# This source code is licensed under the BSD-style license found in the
5# LICENSE file in the root directory of this source tree.
6
Marat Dukhana1a4e782021-05-07 17:49:47 -07007#################################### Scalar ###################################
Frank Barchardaae722a2021-08-30 12:37:30 -07008tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=2 -D REQUANTIZATION=GEMMLOWP -D VARIANT= -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/1x2-minmax-gemmlowp-scalar.c &
9tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=2 -D REQUANTIZATION=GEMMLOWP -D VARIANT= -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/2x2-minmax-gemmlowp-scalar.c &
10tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=2 -D REQUANTIZATION=GEMMLOWP -D VARIANT= -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/3x2-minmax-gemmlowp-scalar.c &
11tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=2 -D REQUANTIZATION=GEMMLOWP -D VARIANT= -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/4x2-minmax-gemmlowp-scalar.c &
Marat Dukhana1a4e782021-05-07 17:49:47 -070012
Frank Barchardaae722a2021-08-30 12:37:30 -070013tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=2 -D REQUANTIZATION=RNDNU -D VARIANT= -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/1x2-minmax-rndnu-scalar.c &
14tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=2 -D REQUANTIZATION=RNDNU -D VARIANT= -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/2x2-minmax-rndnu-scalar.c &
15tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=2 -D REQUANTIZATION=RNDNU -D VARIANT= -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/3x2-minmax-rndnu-scalar.c &
16tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=2 -D REQUANTIZATION=RNDNU -D VARIANT= -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/4x2-minmax-rndnu-scalar.c &
Frank Barchard1a2dbe12021-07-22 20:13:58 -070017
Frank Barchardaae722a2021-08-30 12:37:30 -070018tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/1x2-minmax-fp32-scalar-lrint.c &
19tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/2x2-minmax-fp32-scalar-lrint.c &
20tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/3x2-minmax-fp32-scalar-lrint.c &
21tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/4x2-minmax-fp32-scalar-lrint.c &
Marat Dukhan779b2532021-06-29 14:14:13 -070022
Frank Barchardaae722a2021-08-30 12:37:30 -070023tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/1x2-minmax-fp32-scalar-lrint.c &
24tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/2x2-minmax-fp32-scalar-lrint.c &
25tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/3x2-minmax-fp32-scalar-lrint.c &
26tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/4x2-minmax-fp32-scalar-lrint.c &
Marat Dukhan779b2532021-06-29 14:14:13 -070027
Frank Barchardaae722a2021-08-30 12:37:30 -070028tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/1x2-minmax-fp32-scalar-lrint.c &
29tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/2x2-minmax-fp32-scalar-lrint.c &
30tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/3x2-minmax-fp32-scalar-lrint.c &
31tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/4x2-minmax-fp32-scalar-lrint.c &
Marat Dukhan779b2532021-06-29 14:14:13 -070032
Frank Barchardaae722a2021-08-30 12:37:30 -070033tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/1x2-minmax-fp32-scalar-magic.c &
34tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/2x2-minmax-fp32-scalar-magic.c &
35tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/3x2-minmax-fp32-scalar-magic.c &
36tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/4x2-minmax-fp32-scalar-magic.c &
Marat Dukhan779b2532021-06-29 14:14:13 -070037
Frank Barchardaae722a2021-08-30 12:37:30 -070038tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/1x2-minmax-fp32-scalar-magic.c &
39tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/2x2-minmax-fp32-scalar-magic.c &
40tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/3x2-minmax-fp32-scalar-magic.c &
41tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/4x2-minmax-fp32-scalar-magic.c &
Marat Dukhand6021542021-06-30 09:04:20 -070042
Frank Barchardaae722a2021-08-30 12:37:30 -070043tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/1x2-minmax-fp32-scalar-magic.c &
44tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/2x2-minmax-fp32-scalar-magic.c &
45tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/3x2-minmax-fp32-scalar-magic.c &
46tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/4x2-minmax-fp32-scalar-magic.c &
Marat Dukhand6021542021-06-30 09:04:20 -070047
Frank Barchardaae722a2021-08-30 12:37:30 -070048tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=4 -D REQUANTIZATION=GEMMLOWP -D VARIANT= -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/1x4-minmax-gemmlowp-scalar.c &
49tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=4 -D REQUANTIZATION=GEMMLOWP -D VARIANT= -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/2x4-minmax-gemmlowp-scalar.c &
50tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=4 -D REQUANTIZATION=GEMMLOWP -D VARIANT= -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/3x4-minmax-gemmlowp-scalar.c &
51tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=4 -D REQUANTIZATION=GEMMLOWP -D VARIANT= -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/4x4-minmax-gemmlowp-scalar.c &
Marat Dukhand6021542021-06-30 09:04:20 -070052
Frank Barchardaae722a2021-08-30 12:37:30 -070053tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=4 -D REQUANTIZATION=RNDNU -D VARIANT= -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/1x4-minmax-rndnu-scalar.c &
54tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=4 -D REQUANTIZATION=RNDNU -D VARIANT= -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/2x4-minmax-rndnu-scalar.c &
55tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=4 -D REQUANTIZATION=RNDNU -D VARIANT= -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/3x4-minmax-rndnu-scalar.c &
56tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=4 -D REQUANTIZATION=RNDNU -D VARIANT= -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/4x4-minmax-rndnu-scalar.c &
Frank Barchard1a2dbe12021-07-22 20:13:58 -070057
Frank Barchardaae722a2021-08-30 12:37:30 -070058tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/1x4-minmax-fp32-scalar-lrint.c &
59tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/2x4-minmax-fp32-scalar-lrint.c &
60tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/3x4-minmax-fp32-scalar-lrint.c &
61tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/4x4-minmax-fp32-scalar-lrint.c &
Marat Dukhand6021542021-06-30 09:04:20 -070062
Frank Barchardaae722a2021-08-30 12:37:30 -070063tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/1x4-minmax-fp32-scalar-lrint.c &
64tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/2x4-minmax-fp32-scalar-lrint.c &
65tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/3x4-minmax-fp32-scalar-lrint.c &
66tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/4x4-minmax-fp32-scalar-lrint.c &
Marat Dukhan927d4742021-07-15 13:42:49 -070067
Frank Barchardaae722a2021-08-30 12:37:30 -070068tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/1x4-minmax-fp32-scalar-lrint.c &
69tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/2x4-minmax-fp32-scalar-lrint.c &
70tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/3x4-minmax-fp32-scalar-lrint.c &
71tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINT -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/4x4-minmax-fp32-scalar-lrint.c &
Marat Dukhan927d4742021-07-15 13:42:49 -070072
Frank Barchardaae722a2021-08-30 12:37:30 -070073tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/1x4-minmax-fp32-scalar-magic.c &
74tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/2x4-minmax-fp32-scalar-magic.c &
75tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/3x4-minmax-fp32-scalar-magic.c &
76tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/4x4-minmax-fp32-scalar-magic.c &
Marat Dukhan927d4742021-07-15 13:42:49 -070077
Frank Barchardaae722a2021-08-30 12:37:30 -070078tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/1x4-minmax-fp32-scalar-magic.c &
79tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/2x4-minmax-fp32-scalar-magic.c &
80tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/3x4-minmax-fp32-scalar-magic.c &
81tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/4x4-minmax-fp32-scalar-magic.c &
Marat Dukhan927d4742021-07-15 13:42:49 -070082
Frank Barchardaae722a2021-08-30 12:37:30 -070083tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/1x4-minmax-fp32-scalar-magic.c &
84tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/2x4-minmax-fp32-scalar-magic.c &
85tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/3x4-minmax-fp32-scalar-magic.c &
86tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=MAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/4x4-minmax-fp32-scalar-magic.c &
Marat Dukhana1a4e782021-05-07 17:49:47 -070087
Marat Dukhan27203da2020-08-05 15:19:03 -070088################################## WAsm SIMD ##################################
Marat Dukhan8dc106e2021-08-31 15:23:02 -070089### C2 micro-kernels
90tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/1x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
91tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/2x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
92tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/3x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
93tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/4x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
94
95tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/1x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
96tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/2x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
97tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/3x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
98tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
99
100tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/1x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
101tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/2x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
102tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/3x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
103tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/4x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
104
105tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/1x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
106tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/2x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
107tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/3x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
108tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/4x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
109
110tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/1x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
111tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/2x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
112tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/3x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
113tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
114
115tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/1x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
116tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/2x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
117tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/3x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
118tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/4x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
119
Marat Dukhanef4ce312020-09-10 12:29:08 -0700120### C8 micro-kernels
Marat Dukhan8dc106e2021-08-31 15:23:02 -0700121tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
122tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
123tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
124tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/4x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
125
126tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
127tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
128tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
129tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
130
131tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
132tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
133tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
134tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/4x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
135
136tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
137tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
138tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
139tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/4x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
140
141tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
142tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
143tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
144tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
145
146tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
147tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
148tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
149tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/4x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
150
Frank Barchardaae722a2021-08-30 12:37:30 -0700151tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=1 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-mul16-ld64.c &
152tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=2 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-mul16-ld64.c &
153tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=3 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-mul16-ld64.c &
Marat Dukhan4741e412021-06-30 13:38:06 -0700154
Frank Barchardaae722a2021-08-30 12:37:30 -0700155tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=1 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-mul16-ld64.c &
156tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=2 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-mul16-ld64.c &
157tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=3 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-mul16-ld64.c &
Marat Dukhan4741e412021-06-30 13:38:06 -0700158
Frank Barchardaae722a2021-08-30 12:37:30 -0700159tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul32.c.in -D MR=1 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-mul32-ld64.c &
160tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul32.c.in -D MR=2 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-mul32-ld64.c &
161tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul32.c.in -D MR=3 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-mul32-ld64.c &
Marat Dukhan47c12202021-06-30 15:09:34 -0700162
Frank Barchardaae722a2021-08-30 12:37:30 -0700163tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=1 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-mul16-ld128.c &
164tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=2 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-mul16-ld128.c &
165tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=3 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-mul16-ld128.c &
Marat Dukhan43bee052021-07-14 20:57:18 -0700166
Frank Barchardaae722a2021-08-30 12:37:30 -0700167tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=1 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-mul16-ld128.c &
168tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=2 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-mul16-ld128.c &
169tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=3 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-mul16-ld128.c &
Marat Dukhan43bee052021-07-14 20:57:18 -0700170
Frank Barchardaae722a2021-08-30 12:37:30 -0700171tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul32.c.in -D MR=1 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-mul32-ld128.c &
172tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul32.c.in -D MR=2 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-mul32-ld128.c &
173tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul32.c.in -D MR=3 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-mul32-ld128.c &
Marat Dukhan27203da2020-08-05 15:19:03 -0700174
Marat Dukhan40bbafe2020-08-04 02:04:22 -0700175################################### ARM NEON ##################################
Frank Barchardaae722a2021-08-30 12:37:30 -0700176tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=GEMMLOWP -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/1x8-minmax-gemmlowp-neon-mlal-lane.c &
177tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=2 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=GEMMLOWP -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/2x8-minmax-gemmlowp-neon-mlal-lane.c &
178tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=3 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=GEMMLOWP -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/3x8-minmax-gemmlowp-neon-mlal-lane.c &
179tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=GEMMLOWP -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/4x8-minmax-gemmlowp-neon-mlal-lane.c &
180tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=6 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=GEMMLOWP -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/6x8-minmax-gemmlowp-neon-mlal-lane.c &
181tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=GEMMLOWP -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/1x16-minmax-gemmlowp-neon-mlal-lane.c &
182tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=2 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=GEMMLOWP -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/2x16-minmax-gemmlowp-neon-mlal-lane.c &
183tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=3 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=GEMMLOWP -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/3x16-minmax-gemmlowp-neon-mlal-lane.c &
184tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=GEMMLOWP -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/4x16-minmax-gemmlowp-neon-mlal-lane.c &
185tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=6 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=GEMMLOWP -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/6x16-minmax-gemmlowp-neon-mlal-lane.c &
Frank Barchardda78da12021-03-02 14:28:00 -0800186
Frank Barchardaae722a2021-08-30 12:37:30 -0700187tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/1x16-minmax-rndnu-neon-mlal-lane.c &
188tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/4x16-minmax-rndnu-neon-mlal-lane.c &
Frank Barchard22fbe772021-07-20 15:56:32 -0700189
Frank Barchardaae722a2021-08-30 12:37:30 -0700190tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QU8 -D ARMV8=0 -o src/qu8-igemm/gen/1x8-minmax-rndnu-neon-mlal-lane.c &
191tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QU8 -D ARMV8=0 -o src/qu8-igemm/gen/4x8-minmax-rndnu-neon-mlal-lane.c &
192tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QU8 -D ARMV8=0 -o src/qu8-igemm/gen/1x16-minmax-rndnu-neon-mlal-lane.c &
193tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QU8 -D ARMV8=0 -o src/qu8-igemm/gen/4x16-minmax-rndnu-neon-mlal-lane.c &
Marat Dukhan173661d2021-07-26 23:47:08 -0700194
Frank Barchardaae722a2021-08-30 12:37:30 -0700195tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/1x16-minmax-fp32-neon-mlal-lane.c &
196tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/4x16-minmax-fp32-neon-mlal-lane.c &
Marat Dukhan69c8a292021-07-14 19:34:56 -0700197
Frank Barchardaae722a2021-08-30 12:37:30 -0700198tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/1x16-minmax-fp32-neon-mlal-lane.c &
199tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/4x16-minmax-fp32-neon-mlal-lane.c &
Marat Dukhancf055852021-06-26 09:05:09 -0700200
Frank Barchardaae722a2021-08-30 12:37:30 -0700201tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -D ARMV8=0 -o src/qu8-igemm/gen/1x16-minmax-fp32-neon-mlal-lane.c &
202tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -D ARMV8=0 -o src/qu8-igemm/gen/4x16-minmax-fp32-neon-mlal-lane.c &
Marat Dukhan69c8a292021-07-14 19:34:56 -0700203
Frank Barchardaae722a2021-08-30 12:37:30 -0700204tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/1x16-minmax-fp32-neonv8-mlal-lane.c &
205tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/4x16-minmax-fp32-neonv8-mlal-lane.c &
Marat Dukhancf055852021-06-26 09:05:09 -0700206
Frank Barchardaae722a2021-08-30 12:37:30 -0700207tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -D ARMV8=1 -o src/qs8-igemm/gen/1x16-minmax-fp32-neonv8-mlal-lane.c &
208tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -D ARMV8=1 -o src/qs8-igemm/gen/4x16-minmax-fp32-neonv8-mlal-lane.c &
Marat Dukhane76478b2021-06-28 16:35:40 -0700209
Frank Barchardaae722a2021-08-30 12:37:30 -0700210tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -D ARMV8=1 -o src/qu8-igemm/gen/1x16-minmax-fp32-neonv8-mlal-lane.c &
211tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -D ARMV8=1 -o src/qu8-igemm/gen/4x16-minmax-fp32-neonv8-mlal-lane.c &
Marat Dukhane76478b2021-06-28 16:35:40 -0700212
Frank Barchardaae722a2021-08-30 12:37:30 -0700213tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=8 -D PREFETCH=1 -D REQUANTIZATION=GEMMLOWP -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/1x8-minmax-gemmlowp-neon-mlal-lane-prfm.c &
214tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=2 -D NR=8 -D PREFETCH=1 -D REQUANTIZATION=GEMMLOWP -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/2x8-minmax-gemmlowp-neon-mlal-lane-prfm.c &
215tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=3 -D NR=8 -D PREFETCH=1 -D REQUANTIZATION=GEMMLOWP -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/3x8-minmax-gemmlowp-neon-mlal-lane-prfm.c &
216tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=8 -D PREFETCH=1 -D REQUANTIZATION=GEMMLOWP -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/4x8-minmax-gemmlowp-neon-mlal-lane-prfm.c &
217tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=6 -D NR=8 -D PREFETCH=1 -D REQUANTIZATION=GEMMLOWP -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/6x8-minmax-gemmlowp-neon-mlal-lane-prfm.c &
218tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=16 -D PREFETCH=1 -D REQUANTIZATION=GEMMLOWP -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/1x16-minmax-gemmlowp-neon-mlal-lane-prfm.c &
219tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=2 -D NR=16 -D PREFETCH=1 -D REQUANTIZATION=GEMMLOWP -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/2x16-minmax-gemmlowp-neon-mlal-lane-prfm.c &
220tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=3 -D NR=16 -D PREFETCH=1 -D REQUANTIZATION=GEMMLOWP -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/3x16-minmax-gemmlowp-neon-mlal-lane-prfm.c &
221tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=16 -D PREFETCH=1 -D REQUANTIZATION=GEMMLOWP -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/4x16-minmax-gemmlowp-neon-mlal-lane-prfm.c &
222tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=6 -D NR=16 -D PREFETCH=1 -D REQUANTIZATION=GEMMLOWP -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/6x16-minmax-gemmlowp-neon-mlal-lane-prfm.c &
Marat Dukhan40bbafe2020-08-04 02:04:22 -0700223
Frank Barchardaae722a2021-08-30 12:37:30 -0700224tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=16 -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/1x16-minmax-rndnu-neon-mlal-lane-prfm.c &
225tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=16 -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/4x16-minmax-rndnu-neon-mlal-lane-prfm.c &
Frank Barchard22fbe772021-07-20 15:56:32 -0700226
Frank Barchardaae722a2021-08-30 12:37:30 -0700227tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=1 -D NR=8 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8-minmax-gemmlowp-neon-mull-addw-dup.c &
228tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=2 -D NR=8 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8-minmax-gemmlowp-neon-mull-addw-dup.c &
229tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=3 -D NR=8 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -o src/qs8-igemm/gen/3x8-minmax-gemmlowp-neon-mull-addw-dup.c &
230tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=4 -D NR=8 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x8-minmax-gemmlowp-neon-mull-addw-dup.c &
Frank Barchardda78da12021-03-02 14:28:00 -0800231
Frank Barchardaae722a2021-08-30 12:37:30 -0700232tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=1 -D NR=16 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x16-minmax-gemmlowp-neon-mull-addw-dup.c &
233tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=2 -D NR=16 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x16-minmax-gemmlowp-neon-mull-addw-dup.c &
234tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=3 -D NR=16 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -o src/qs8-igemm/gen/3x16-minmax-gemmlowp-neon-mull-addw-dup.c &
235tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=4 -D NR=16 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x16-minmax-gemmlowp-neon-mull-addw-dup.c &
Frank Barchard510b8e02021-07-26 17:25:18 -0700236
Frank Barchardaae722a2021-08-30 12:37:30 -0700237tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=1 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8-minmax-rndnu-neon-mull-addw-dup.c &
238tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=2 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8-minmax-rndnu-neon-mull-addw-dup.c &
239tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=3 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/3x8-minmax-rndnu-neon-mull-addw-dup.c &
240tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=4 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x8-minmax-rndnu-neon-mull-addw-dup.c &
Frank Barchard510b8e02021-07-26 17:25:18 -0700241
Frank Barchardaae722a2021-08-30 12:37:30 -0700242tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=1 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x16-minmax-rndnu-neon-mull-addw-dup.c &
243tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=2 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x16-minmax-rndnu-neon-mull-addw-dup.c &
244tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=3 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/3x16-minmax-rndnu-neon-mull-addw-dup.c &
245tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=4 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x16-minmax-rndnu-neon-mull-addw-dup.c &
Frank Barchardda78da12021-03-02 14:28:00 -0800246
247### C2 micro-kernels
Frank Barchard15eec022021-11-17 13:26:20 -0800248tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/1x8c2-minmax-rndnu-neon-mull-dup.c &
249tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/2x8c2-minmax-rndnu-neon-mull-dup.c &
250tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/3x8c2-minmax-rndnu-neon-mull-dup.c &
251tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/4x8c2-minmax-rndnu-neon-mull-dup.c &
252tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/1x16c2-minmax-rndnu-neon-mull-dup.c &
253tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/2x16c2-minmax-rndnu-neon-mull-dup.c &
254tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/3x16c2-minmax-rndnu-neon-mull-dup.c &
255tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/4x16c2-minmax-rndnu-neon-mull-dup.c &
Frank Barchardda78da12021-03-02 14:28:00 -0800256
Frank Barchard15eec022021-11-17 13:26:20 -0800257tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/1x8c2-minmax-rndnu-neon-mlal-dup.c &
258tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/2x8c2-minmax-rndnu-neon-mlal-dup.c &
259tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/3x8c2-minmax-rndnu-neon-mlal-dup.c &
260tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/4x8c2-minmax-rndnu-neon-mlal-dup.c &
261tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/1x16c2-minmax-rndnu-neon-mlal-dup.c &
262tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/2x16c2-minmax-rndnu-neon-mlal-dup.c &
263tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/3x16c2-minmax-rndnu-neon-mlal-dup.c &
264tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/4x16c2-minmax-rndnu-neon-mlal-dup.c &
Frank Barchardc7a032d2021-11-10 12:37:49 -0800265
Frank Barchard15eec022021-11-17 13:26:20 -0800266tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/1x8c2-minmax-fp32-neon-mlal-dup.c &
267tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/2x8c2-minmax-fp32-neon-mlal-dup.c &
Marat Dukhan14f325e2021-06-30 18:46:25 -0700268
Frank Barchard15eec022021-11-17 13:26:20 -0800269tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=DUP -o src/qc8-igemm/gen/1x8c2-minmax-fp32-neon-mlal-dup.c &
270tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=DUP -o src/qc8-igemm/gen/2x8c2-minmax-fp32-neon-mlal-dup.c &
Marat Dukhan14f325e2021-06-30 18:46:25 -0700271
Frank Barchard15eec022021-11-17 13:26:20 -0800272tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=DUP -o src/qs8-igemm/gen/1x8c2-minmax-fp32-neonv8-mlal-dup.c &
273tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=DUP -o src/qs8-igemm/gen/2x8c2-minmax-fp32-neonv8-mlal-dup.c &
Marat Dukhan14f325e2021-06-30 18:46:25 -0700274
Frank Barchard15eec022021-11-17 13:26:20 -0800275tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=DUP -o src/qc8-igemm/gen/1x8c2-minmax-fp32-neonv8-mlal-dup.c &
276tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=DUP -o src/qc8-igemm/gen/2x8c2-minmax-fp32-neonv8-mlal-dup.c &
Frank Barchardda78da12021-03-02 14:28:00 -0800277
Frank Barchard15eec022021-11-17 13:26:20 -0800278tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/1x8c2-minmax-gemmlowp-neon-mlal-dup.c &
279tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/2x8c2-minmax-gemmlowp-neon-mlal-dup.c &
280
281### C2 LD1R micro-kernels
282tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/1x8c2-minmax-rndnu-neon-mull-ld1r.c &
283tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/2x8c2-minmax-rndnu-neon-mull-ld1r.c &
284tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/3x8c2-minmax-rndnu-neon-mull-ld1r.c &
285tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/4x8c2-minmax-rndnu-neon-mull-ld1r.c &
286tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/1x16c2-minmax-rndnu-neon-mull-ld1r.c &
287tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/2x16c2-minmax-rndnu-neon-mull-ld1r.c &
288tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/3x16c2-minmax-rndnu-neon-mull-ld1r.c &
289tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/4x16c2-minmax-rndnu-neon-mull-ld1r.c &
290
291tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/1x8c2-minmax-rndnu-neon-mlal-ld1r.c &
292tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/2x8c2-minmax-rndnu-neon-mlal-ld1r.c &
293tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/3x8c2-minmax-rndnu-neon-mlal-ld1r.c &
294tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/4x8c2-minmax-rndnu-neon-mlal-ld1r.c &
295tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/1x16c2-minmax-rndnu-neon-mlal-ld1r.c &
296tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/2x16c2-minmax-rndnu-neon-mlal-ld1r.c &
297tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/3x16c2-minmax-rndnu-neon-mlal-ld1r.c &
298tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/4x16c2-minmax-rndnu-neon-mlal-ld1r.c &
299
300tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/1x8c2-minmax-fp32-neon-mlal-ld1r.c &
301tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/2x8c2-minmax-fp32-neon-mlal-ld1r.c &
302
303tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=LD1R -o src/qc8-igemm/gen/1x8c2-minmax-fp32-neon-mlal-ld1r.c &
304tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=LD1R -o src/qc8-igemm/gen/2x8c2-minmax-fp32-neon-mlal-ld1r.c &
305
306tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=LD1R -o src/qs8-igemm/gen/1x8c2-minmax-fp32-neonv8-mlal-ld1r.c &
307tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=LD1R -o src/qs8-igemm/gen/2x8c2-minmax-fp32-neonv8-mlal-ld1r.c &
308
309tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=LD1R -o src/qc8-igemm/gen/1x8c2-minmax-fp32-neonv8-mlal-ld1r.c &
310tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=LD1R -o src/qc8-igemm/gen/2x8c2-minmax-fp32-neonv8-mlal-ld1r.c &
311
312### C2 LD2R micro-kernels
313tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/1x8c2-minmax-rndnu-neon-mull-ld2r.c &
314tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/2x8c2-minmax-rndnu-neon-mull-ld2r.c &
315tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/3x8c2-minmax-rndnu-neon-mull-ld2r.c &
316tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/4x8c2-minmax-rndnu-neon-mull-ld2r.c &
317tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/1x16c2-minmax-rndnu-neon-mull-ld2r.c &
318tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/2x16c2-minmax-rndnu-neon-mull-ld2r.c &
319tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/3x16c2-minmax-rndnu-neon-mull-ld2r.c &
320tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/4x16c2-minmax-rndnu-neon-mull-ld2r.c &
321
322tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/1x8c2-minmax-rndnu-neon-mlal-ld2r.c &
323tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/2x8c2-minmax-rndnu-neon-mlal-ld2r.c &
324tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/3x8c2-minmax-rndnu-neon-mlal-ld2r.c &
325tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/4x8c2-minmax-rndnu-neon-mlal-ld2r.c &
326tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/1x16c2-minmax-rndnu-neon-mlal-ld2r.c &
327tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/2x16c2-minmax-rndnu-neon-mlal-ld2r.c &
328tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/3x16c2-minmax-rndnu-neon-mlal-ld2r.c &
329tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/4x16c2-minmax-rndnu-neon-mlal-ld2r.c &
330
331tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/1x8c2-minmax-fp32-neon-mlal-ld2r.c &
332tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/2x8c2-minmax-fp32-neon-mlal-ld2r.c &
333
334tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=LD2R -o src/qc8-igemm/gen/1x8c2-minmax-fp32-neon-mlal-ld2r.c &
335tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=LD2R -o src/qc8-igemm/gen/2x8c2-minmax-fp32-neon-mlal-ld2r.c &
336
337tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=LD2R -o src/qs8-igemm/gen/1x8c2-minmax-fp32-neonv8-mlal-ld2r.c &
338tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=LD2R -o src/qs8-igemm/gen/2x8c2-minmax-fp32-neonv8-mlal-ld2r.c &
339
340tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=LD2R -o src/qc8-igemm/gen/1x8c2-minmax-fp32-neonv8-mlal-ld2r.c &
341tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=LD2R -o src/qc8-igemm/gen/2x8c2-minmax-fp32-neonv8-mlal-ld2r.c &
Frank Barchard42f5c502021-11-16 10:04:21 -0800342
343### C2 LD4R micro-kernels
Frank Barchard15eec022021-11-17 13:26:20 -0800344tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/1x8c2-minmax-rndnu-neon-mull-ld4r.c &
345tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/2x8c2-minmax-rndnu-neon-mull-ld4r.c &
346tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/3x8c2-minmax-rndnu-neon-mull-ld4r.c &
347tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/4x8c2-minmax-rndnu-neon-mull-ld4r.c &
348tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/1x16c2-minmax-rndnu-neon-mull-ld4r.c &
349tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/2x16c2-minmax-rndnu-neon-mull-ld4r.c &
350tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/3x16c2-minmax-rndnu-neon-mull-ld4r.c &
351tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/4x16c2-minmax-rndnu-neon-mull-ld4r.c &
Frank Barchard42f5c502021-11-16 10:04:21 -0800352
Frank Barchard15eec022021-11-17 13:26:20 -0800353tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/1x8c2-minmax-rndnu-neon-mlal-ld4r.c &
354tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/2x8c2-minmax-rndnu-neon-mlal-ld4r.c &
355tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/3x8c2-minmax-rndnu-neon-mlal-ld4r.c &
356tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/4x8c2-minmax-rndnu-neon-mlal-ld4r.c &
357tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/1x16c2-minmax-rndnu-neon-mlal-ld4r.c &
358tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/2x16c2-minmax-rndnu-neon-mlal-ld4r.c &
359tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/3x16c2-minmax-rndnu-neon-mlal-ld4r.c &
360tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/4x16c2-minmax-rndnu-neon-mlal-ld4r.c &
Frank Barchard42f5c502021-11-16 10:04:21 -0800361
Frank Barchard15eec022021-11-17 13:26:20 -0800362tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/1x8c2-minmax-fp32-neon-mlal-ld4r.c &
363tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/2x8c2-minmax-fp32-neon-mlal-ld4r.c &
Frank Barchard42f5c502021-11-16 10:04:21 -0800364
Frank Barchard15eec022021-11-17 13:26:20 -0800365tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=LD4R -o src/qc8-igemm/gen/1x8c2-minmax-fp32-neon-mlal-ld4r.c &
366tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=LD4R -o src/qc8-igemm/gen/2x8c2-minmax-fp32-neon-mlal-ld4r.c &
Frank Barchard42f5c502021-11-16 10:04:21 -0800367
Frank Barchard15eec022021-11-17 13:26:20 -0800368tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=LD4R -o src/qs8-igemm/gen/1x8c2-minmax-fp32-neonv8-mlal-ld4r.c &
369tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=LD4R -o src/qs8-igemm/gen/2x8c2-minmax-fp32-neonv8-mlal-ld4r.c &
Frank Barchard42f5c502021-11-16 10:04:21 -0800370
Frank Barchard15eec022021-11-17 13:26:20 -0800371tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=LD4R -o src/qc8-igemm/gen/1x8c2-minmax-fp32-neonv8-mlal-ld4r.c &
372tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=LD4R -o src/qc8-igemm/gen/2x8c2-minmax-fp32-neonv8-mlal-ld4r.c &
Marat Dukhane903dff2021-07-16 19:43:41 -0700373
Frank Barchardc7a032d2021-11-10 12:37:49 -0800374### C2S4 micro-kernels
Frank Barcharde22685a2021-11-12 11:36:58 -0800375tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x8c2s4-minmax-rndnu-neon-mull.c &
376tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x8c2s4-minmax-rndnu-neon-mull.c &
377tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=3 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x8c2s4-minmax-rndnu-neon-mull.c &
378tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=4 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x8c2s4-minmax-rndnu-neon-mull.c &
379tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=1 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x16c2s4-minmax-rndnu-neon-mull.c &
380tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=2 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x16c2s4-minmax-rndnu-neon-mull.c &
381tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=3 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x16c2s4-minmax-rndnu-neon-mull.c &
382tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=4 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x16c2s4-minmax-rndnu-neon-mull.c &
Frank Barchardc7a032d2021-11-10 12:37:49 -0800383
Frank Barcharde22685a2021-11-12 11:36:58 -0800384tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x8c2s4-minmax-rndnu-neon-mlal.c &
385tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x8c2s4-minmax-rndnu-neon-mlal.c &
386tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=3 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x8c2s4-minmax-rndnu-neon-mlal.c &
387tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=4 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x8c2s4-minmax-rndnu-neon-mlal.c &
388tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=1 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x16c2s4-minmax-rndnu-neon-mlal.c &
389tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=2 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x16c2s4-minmax-rndnu-neon-mlal.c &
390tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=3 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x16c2s4-minmax-rndnu-neon-mlal.c &
391tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=4 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x16c2s4-minmax-rndnu-neon-mlal.c &
Frank Barchardc7a032d2021-11-10 12:37:49 -0800392
Frank Barcharde22685a2021-11-12 11:36:58 -0800393tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x8c2s4-minmax-fp32-neon-mlal.c &
394tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x8c2s4-minmax-fp32-neon-mlal.c &
Frank Barchardc7a032d2021-11-10 12:37:49 -0800395
Frank Barcharde22685a2021-11-12 11:36:58 -0800396tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -o src/qc8-igemm/gen/1x8c2s4-minmax-fp32-neon-mlal.c &
397tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -o src/qc8-igemm/gen/2x8c2s4-minmax-fp32-neon-mlal.c &
Frank Barchardc7a032d2021-11-10 12:37:49 -0800398
Frank Barcharde22685a2021-11-12 11:36:58 -0800399tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -o src/qs8-igemm/gen/1x8c2s4-minmax-fp32-neonv8-mlal.c &
400tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -o src/qs8-igemm/gen/2x8c2s4-minmax-fp32-neonv8-mlal.c &
Frank Barchardc7a032d2021-11-10 12:37:49 -0800401
Frank Barcharde22685a2021-11-12 11:36:58 -0800402tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -o src/qc8-igemm/gen/1x8c2s4-minmax-fp32-neonv8-mlal.c &
403tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -o src/qc8-igemm/gen/2x8c2s4-minmax-fp32-neonv8-mlal.c &
Frank Barchardc7a032d2021-11-10 12:37:49 -0800404
Frank Barchard287952a2021-11-03 15:26:45 -0700405### C4 micro-kernels
Frank Barchard64ab1b72021-11-22 10:57:40 -0800406tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/1x8c4-minmax-rndnu-neon-mull-dup.c &
407tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/2x8c4-minmax-rndnu-neon-mull-dup.c &
408tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/3x8c4-minmax-rndnu-neon-mull-dup.c &
409tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/4x8c4-minmax-rndnu-neon-mull-dup.c &
410tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/1x16c4-minmax-rndnu-neon-mull-dup.c &
411tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/2x16c4-minmax-rndnu-neon-mull-dup.c &
412tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/3x16c4-minmax-rndnu-neon-mull-dup.c &
413tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/4x16c4-minmax-rndnu-neon-mull-dup.c &
Frank Barchard287952a2021-11-03 15:26:45 -0700414
Frank Barchard64ab1b72021-11-22 10:57:40 -0800415tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/1x8c4-minmax-rndnu-neon-mlal-dup.c &
416tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/2x8c4-minmax-rndnu-neon-mlal-dup.c &
417tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/3x8c4-minmax-rndnu-neon-mlal-dup.c &
418tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/4x8c4-minmax-rndnu-neon-mlal-dup.c &
419tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/1x16c4-minmax-rndnu-neon-mlal-dup.c &
420tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/2x16c4-minmax-rndnu-neon-mlal-dup.c &
421tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/3x16c4-minmax-rndnu-neon-mlal-dup.c &
422tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/4x16c4-minmax-rndnu-neon-mlal-dup.c &
Frank Barchard287952a2021-11-03 15:26:45 -0700423
Frank Barchard64ab1b72021-11-22 10:57:40 -0800424tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/1x8c4-minmax-fp32-neon-mlal-dup.c &
425tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/2x8c4-minmax-fp32-neon-mlal-dup.c &
Frank Barchard287952a2021-11-03 15:26:45 -0700426
Frank Barchard64ab1b72021-11-22 10:57:40 -0800427tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=DUP -o src/qc8-igemm/gen/1x8c4-minmax-fp32-neon-mlal-dup.c &
428tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=DUP -o src/qc8-igemm/gen/2x8c4-minmax-fp32-neon-mlal-dup.c &
Frank Barchard287952a2021-11-03 15:26:45 -0700429
Frank Barchard64ab1b72021-11-22 10:57:40 -0800430tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=DUP -o src/qs8-igemm/gen/1x8c4-minmax-fp32-neonv8-mlal-dup.c &
431tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=DUP -o src/qs8-igemm/gen/2x8c4-minmax-fp32-neonv8-mlal-dup.c &
Frank Barchard287952a2021-11-03 15:26:45 -0700432
Frank Barchard64ab1b72021-11-22 10:57:40 -0800433tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=DUP -o src/qc8-igemm/gen/1x8c4-minmax-fp32-neonv8-mlal-dup.c &
434tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=DUP -o src/qc8-igemm/gen/2x8c4-minmax-fp32-neonv8-mlal-dup.c &
435
436### C4 LD1R micro-kernels
437tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/1x8c4-minmax-rndnu-neon-mull-ld1r.c &
438tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/2x8c4-minmax-rndnu-neon-mull-ld1r.c &
439tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/3x8c4-minmax-rndnu-neon-mull-ld1r.c &
440tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/4x8c4-minmax-rndnu-neon-mull-ld1r.c &
441tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/1x16c4-minmax-rndnu-neon-mull-ld1r.c &
442tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/2x16c4-minmax-rndnu-neon-mull-ld1r.c &
443tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/3x16c4-minmax-rndnu-neon-mull-ld1r.c &
444tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/4x16c4-minmax-rndnu-neon-mull-ld1r.c &
445
446tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/1x8c4-minmax-rndnu-neon-mlal-ld1r.c &
447tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/2x8c4-minmax-rndnu-neon-mlal-ld1r.c &
448tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/3x8c4-minmax-rndnu-neon-mlal-ld1r.c &
449tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/4x8c4-minmax-rndnu-neon-mlal-ld1r.c &
450tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/1x16c4-minmax-rndnu-neon-mlal-ld1r.c &
451tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/2x16c4-minmax-rndnu-neon-mlal-ld1r.c &
452tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/3x16c4-minmax-rndnu-neon-mlal-ld1r.c &
453tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/4x16c4-minmax-rndnu-neon-mlal-ld1r.c &
454
455tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/1x8c4-minmax-fp32-neon-mlal-ld1r.c &
456tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/2x8c4-minmax-fp32-neon-mlal-ld1r.c &
457
458tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=LD1R -o src/qc8-igemm/gen/1x8c4-minmax-fp32-neon-mlal-ld1r.c &
459tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=LD1R -o src/qc8-igemm/gen/2x8c4-minmax-fp32-neon-mlal-ld1r.c &
460
461tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=LD1R -o src/qs8-igemm/gen/1x8c4-minmax-fp32-neonv8-mlal-ld1r.c &
462tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=LD1R -o src/qs8-igemm/gen/2x8c4-minmax-fp32-neonv8-mlal-ld1r.c &
463
464tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=LD1R -o src/qc8-igemm/gen/1x8c4-minmax-fp32-neonv8-mlal-ld1r.c &
465tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=LD1R -o src/qc8-igemm/gen/2x8c4-minmax-fp32-neonv8-mlal-ld1r.c &
466
467### C4 LD2R micro-kernels
468tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/1x8c4-minmax-rndnu-neon-mull-ld2r.c &
469tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/2x8c4-minmax-rndnu-neon-mull-ld2r.c &
470tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/3x8c4-minmax-rndnu-neon-mull-ld2r.c &
471tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/4x8c4-minmax-rndnu-neon-mull-ld2r.c &
472tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/1x16c4-minmax-rndnu-neon-mull-ld2r.c &
473tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/2x16c4-minmax-rndnu-neon-mull-ld2r.c &
474tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/3x16c4-minmax-rndnu-neon-mull-ld2r.c &
475tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/4x16c4-minmax-rndnu-neon-mull-ld2r.c &
476
477tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/1x8c4-minmax-rndnu-neon-mlal-ld2r.c &
478tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/2x8c4-minmax-rndnu-neon-mlal-ld2r.c &
479tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/3x8c4-minmax-rndnu-neon-mlal-ld2r.c &
480tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/4x8c4-minmax-rndnu-neon-mlal-ld2r.c &
481tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/1x16c4-minmax-rndnu-neon-mlal-ld2r.c &
482tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/2x16c4-minmax-rndnu-neon-mlal-ld2r.c &
483tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/3x16c4-minmax-rndnu-neon-mlal-ld2r.c &
484tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/4x16c4-minmax-rndnu-neon-mlal-ld2r.c &
485
486tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/1x8c4-minmax-fp32-neon-mlal-ld2r.c &
487tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/2x8c4-minmax-fp32-neon-mlal-ld2r.c &
488
489tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=LD2R -o src/qc8-igemm/gen/1x8c4-minmax-fp32-neon-mlal-ld2r.c &
490tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=LD2R -o src/qc8-igemm/gen/2x8c4-minmax-fp32-neon-mlal-ld2r.c &
491
492tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=LD2R -o src/qs8-igemm/gen/1x8c4-minmax-fp32-neonv8-mlal-ld2r.c &
493tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=LD2R -o src/qs8-igemm/gen/2x8c4-minmax-fp32-neonv8-mlal-ld2r.c &
494
495tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=LD2R -o src/qc8-igemm/gen/1x8c4-minmax-fp32-neonv8-mlal-ld2r.c &
496tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=LD2R -o src/qc8-igemm/gen/2x8c4-minmax-fp32-neonv8-mlal-ld2r.c &
Frank Barchardeb704f72021-11-12 01:26:50 -0800497
498### C4S2 micro-kernels
Frank Barcharde22685a2021-11-12 11:36:58 -0800499tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x8c4s2-minmax-rndnu-neon-mull.c &
500tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x8c4s2-minmax-rndnu-neon-mull.c &
501tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=3 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x8c4s2-minmax-rndnu-neon-mull.c &
502tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=4 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x8c4s2-minmax-rndnu-neon-mull.c &
503tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=1 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x16c4s2-minmax-rndnu-neon-mull.c &
504tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=2 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x16c4s2-minmax-rndnu-neon-mull.c &
505tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=3 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x16c4s2-minmax-rndnu-neon-mull.c &
506tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=4 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x16c4s2-minmax-rndnu-neon-mull.c &
Frank Barchardeb704f72021-11-12 01:26:50 -0800507
Frank Barcharde22685a2021-11-12 11:36:58 -0800508tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x8c4s2-minmax-rndnu-neon-mlal.c &
509tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x8c4s2-minmax-rndnu-neon-mlal.c &
510tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=3 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x8c4s2-minmax-rndnu-neon-mlal.c &
511tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=4 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x8c4s2-minmax-rndnu-neon-mlal.c &
512tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=1 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x16c4s2-minmax-rndnu-neon-mlal.c &
513tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=2 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x16c4s2-minmax-rndnu-neon-mlal.c &
514tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=3 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x16c4s2-minmax-rndnu-neon-mlal.c &
515tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=4 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x16c4s2-minmax-rndnu-neon-mlal.c &
Frank Barchardeb704f72021-11-12 01:26:50 -0800516
Frank Barcharde22685a2021-11-12 11:36:58 -0800517tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x8c4s2-minmax-fp32-neon-mlal.c &
518tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x8c4s2-minmax-fp32-neon-mlal.c &
Frank Barchardeb704f72021-11-12 01:26:50 -0800519
Frank Barcharde22685a2021-11-12 11:36:58 -0800520tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -o src/qc8-igemm/gen/1x8c4s2-minmax-fp32-neon-mlal.c &
521tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -o src/qc8-igemm/gen/2x8c4s2-minmax-fp32-neon-mlal.c &
Frank Barchardeb704f72021-11-12 01:26:50 -0800522
Frank Barcharde22685a2021-11-12 11:36:58 -0800523tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -o src/qs8-igemm/gen/1x8c4s2-minmax-fp32-neonv8-mlal.c &
524tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -o src/qs8-igemm/gen/2x8c4s2-minmax-fp32-neonv8-mlal.c &
Frank Barchardeb704f72021-11-12 01:26:50 -0800525
Frank Barcharde22685a2021-11-12 11:36:58 -0800526tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -o src/qc8-igemm/gen/1x8c4s2-minmax-fp32-neonv8-mlal.c &
527tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -o src/qc8-igemm/gen/2x8c4s2-minmax-fp32-neonv8-mlal.c &
Frank Barchard287952a2021-11-03 15:26:45 -0700528
Frank Barchardd79391d2021-02-15 14:22:32 -0800529### C8 micro-kernels
Frank Barcharde22685a2021-11-12 11:36:58 -0800530tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=1 -D NR=8 -D MLA=0 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x8c8-minmax-gemmlowp-neon-mull.c &
531tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=2 -D NR=8 -D MLA=0 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x8c8-minmax-gemmlowp-neon-mull.c &
532tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=3 -D NR=8 -D MLA=0 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x8c8-minmax-gemmlowp-neon-mull.c &
533tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=4 -D NR=8 -D MLA=0 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x8c8-minmax-gemmlowp-neon-mull.c &
534tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=1 -D NR=16 -D MLA=0 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x16c8-minmax-gemmlowp-neon-mull.c &
535tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=2 -D NR=16 -D MLA=0 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x16c8-minmax-gemmlowp-neon-mull.c &
536tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=3 -D NR=16 -D MLA=0 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x16c8-minmax-gemmlowp-neon-mull.c &
537tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=4 -D NR=16 -D MLA=0 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x16c8-minmax-gemmlowp-neon-mull.c &
Frank Barchardda78da12021-03-02 14:28:00 -0800538
Frank Barcharde22685a2021-11-12 11:36:58 -0800539tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x8c8-minmax-fp32-neon-mlal.c &
540tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x8c8-minmax-fp32-neon-mlal.c &
Marat Dukhancf055852021-06-26 09:05:09 -0700541
Frank Barcharde22685a2021-11-12 11:36:58 -0800542tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -o src/qc8-igemm/gen/1x8c8-minmax-fp32-neon-mlal.c &
543tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -o src/qc8-igemm/gen/2x8c8-minmax-fp32-neon-mlal.c &
Marat Dukhane76478b2021-06-28 16:35:40 -0700544
Frank Barcharde22685a2021-11-12 11:36:58 -0800545tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -o src/qs8-igemm/gen/1x8c8-minmax-fp32-neonv8-mlal.c &
546tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -o src/qs8-igemm/gen/2x8c8-minmax-fp32-neonv8-mlal.c &
Marat Dukhane76478b2021-06-28 16:35:40 -0700547
Frank Barcharde22685a2021-11-12 11:36:58 -0800548tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -o src/qc8-igemm/gen/1x8c8-minmax-fp32-neonv8-mlal.c &
549tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -o src/qc8-igemm/gen/2x8c8-minmax-fp32-neonv8-mlal.c &
Frank Barchardd79391d2021-02-15 14:22:32 -0800550
Frank Barcharde22685a2021-11-12 11:36:58 -0800551tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x8c8-minmax-gemmlowp-neon-mlal.c &
552tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x8c8-minmax-gemmlowp-neon-mlal.c &
553tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=3 -D NR=8 -D MLA=1 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x8c8-minmax-gemmlowp-neon-mlal.c &
554tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=4 -D NR=8 -D MLA=1 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x8c8-minmax-gemmlowp-neon-mlal.c &
555tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=1 -D NR=16 -D MLA=1 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x16c8-minmax-gemmlowp-neon-mlal.c &
556tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=2 -D NR=16 -D MLA=1 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x16c8-minmax-gemmlowp-neon-mlal.c &
557tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=3 -D NR=16 -D MLA=1 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x16c8-minmax-gemmlowp-neon-mlal.c &
558tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=4 -D NR=16 -D MLA=1 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x16c8-minmax-gemmlowp-neon-mlal.c &
Marat Dukhane903dff2021-07-16 19:43:41 -0700559
Frank Barcharde22685a2021-11-12 11:36:58 -0800560tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x8c8-minmax-rndnu-neon-mlal.c &
561tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x8c8-minmax-rndnu-neon-mlal.c &
Marat Dukhane903dff2021-07-16 19:43:41 -0700562
Frank Barchard36f95cf2021-02-23 03:12:52 -0800563### C16 micro-kernels
Frank Barcharde22685a2021-11-12 11:36:58 -0800564tools/xngen src/qs8-igemm/c16-neon-mlal.c.in -D MR=1 -D NR=8 -o src/qs8-igemm/gen/1x8c16-minmax-gemmlowp-neon-mlal.c &
565tools/xngen src/qs8-igemm/c16-neon-mlal.c.in -D MR=2 -D NR=8 -o src/qs8-igemm/gen/2x8c16-minmax-gemmlowp-neon-mlal.c &
566tools/xngen src/qs8-igemm/c16-neon-mlal.c.in -D MR=3 -D NR=8 -o src/qs8-igemm/gen/3x8c16-minmax-gemmlowp-neon-mlal.c &
567tools/xngen src/qs8-igemm/c16-neon-mlal.c.in -D MR=4 -D NR=8 -o src/qs8-igemm/gen/4x8c16-minmax-gemmlowp-neon-mlal.c &
568tools/xngen src/qs8-igemm/c16-neon-mlal.c.in -D MR=1 -D NR=16 -o src/qs8-igemm/gen/1x16c16-minmax-gemmlowp-neon-mlal.c &
569tools/xngen src/qs8-igemm/c16-neon-mlal.c.in -D MR=2 -D NR=16 -o src/qs8-igemm/gen/2x16c16-minmax-gemmlowp-neon-mlal.c &
570tools/xngen src/qs8-igemm/c16-neon-mlal.c.in -D MR=3 -D NR=16 -o src/qs8-igemm/gen/3x16c16-minmax-gemmlowp-neon-mlal.c &
571tools/xngen src/qs8-igemm/c16-neon-mlal.c.in -D MR=4 -D NR=16 -o src/qs8-igemm/gen/4x16c16-minmax-gemmlowp-neon-mlal.c &
Frank Barchard36f95cf2021-02-23 03:12:52 -0800572
Benoit Jacoba05487f2020-08-14 13:37:21 -0700573### C4 micro-kernels
Frank Barchardaae722a2021-08-30 12:37:30 -0700574tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=1 -D NR=8 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c4-minmax-fp32-neondot.c &
Marat Dukhane76478b2021-06-28 16:35:40 -0700575
Frank Barchardaae722a2021-08-30 12:37:30 -0700576tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=1 -D NR=8 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/1x8c4-minmax-fp32-neondot.c &
577tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=4 -D NR=8 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/4x8c4-minmax-fp32-neondot.c &
578tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=6 -D NR=8 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/6x8c4-minmax-fp32-neondot.c &
579tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=8 -D NR=8 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/8x8c4-minmax-fp32-neondot.c &
580tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=1 -D NR=16 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/1x16c4-minmax-fp32-neondot.c &
581tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=4 -D NR=16 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/4x16c4-minmax-fp32-neondot.c &
582tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=6 -D NR=16 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/6x16c4-minmax-fp32-neondot.c &
583tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=8 -D NR=16 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/8x16c4-minmax-fp32-neondot.c &
Marat Dukhan66ccf642020-09-28 16:23:42 -0700584
Frank Barchardaae722a2021-08-30 12:37:30 -0700585tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=1 -D NR=8 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c4-minmax-fp32-neondot.c &
586tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=1 -D NR=8 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c4-minmax-gemmlowp-neondot.c &
Marat Dukhane903dff2021-07-16 19:43:41 -0700587
Frank Barchardaae722a2021-08-30 12:37:30 -0700588tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=1 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c4-minmax-rndnu-neondot.c &
589tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=4 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x8c4-minmax-rndnu-neondot.c &
590tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=6 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/6x8c4-minmax-rndnu-neondot.c &
591tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=8 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/8x8c4-minmax-rndnu-neondot.c &
592tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=1 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x16c4-minmax-rndnu-neondot.c &
593tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=4 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x16c4-minmax-rndnu-neondot.c &
594tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=6 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/6x16c4-minmax-rndnu-neondot.c &
595tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=8 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/8x16c4-minmax-rndnu-neondot.c &
Frank Barchard4a352042021-04-13 15:52:08 -0700596
Frank Barchardaae722a2021-08-30 12:37:30 -0700597tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=1 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/1x8c4-minmax-rndnu-neondot.c &
598tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=2 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/2x8c4-minmax-rndnu-neondot.c &
599tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=3 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/3x8c4-minmax-rndnu-neondot.c &
600tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=4 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/4x8c4-minmax-rndnu-neondot.c &
601tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=5 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/5x8c4-minmax-rndnu-neondot.c &
602tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=6 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/6x8c4-minmax-rndnu-neondot.c &
603tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=8 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/8x8c4-minmax-rndnu-neondot.c &
604tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=1 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/1x16c4-minmax-rndnu-neondot.c &
605tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=2 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/2x16c4-minmax-rndnu-neondot.c &
606tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=3 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/3x16c4-minmax-rndnu-neondot.c &
607tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=4 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/4x16c4-minmax-rndnu-neondot.c &
608tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=5 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/5x16c4-minmax-rndnu-neondot.c &
609tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=6 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/6x16c4-minmax-rndnu-neondot.c &
610tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=8 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/8x16c4-minmax-rndnu-neondot.c &
Frank Barchardcdf59a52021-09-08 13:55:24 -0700611tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=1 -D NR=32 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/1x32c4-minmax-rndnu-neondot.c &
612tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=2 -D NR=32 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/2x32c4-minmax-rndnu-neondot.c &
613tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=3 -D NR=32 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/3x32c4-minmax-rndnu-neondot.c &
Frank Barchard88e839c2021-08-11 00:12:31 -0700614
Frank Barchard4a352042021-04-13 15:52:08 -0700615############################### AArch64 assembly ##############################
Frank Barchardd68e1142021-04-26 15:15:08 -0700616# Cortex A53 micro-kernel
Frank Barchardaae722a2021-08-30 12:37:30 -0700617tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-cortex-a53.S.in -D PREFETCH=0 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x16-minmax-gemmlowp-aarch64-neon-mlal-lane-cortex-a53.S &
618tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-cortex-a53.S.in -D PREFETCH=1 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x16-minmax-gemmlowp-aarch64-neon-mlal-lane-prfm-cortex-a53.S &
Frank Barchard98af05c2021-06-30 12:15:04 -0700619
Frank Barchardaae722a2021-08-30 12:37:30 -0700620tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-cortex-a53.S.in -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x16-minmax-rndnu-aarch64-neon-mlal-lane-cortex-a53.S &
621tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-cortex-a53.S.in -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x16-minmax-rndnu-aarch64-neon-mlal-lane-prfm-cortex-a53.S &
Frank Barchard13db60f2021-07-20 14:34:35 -0700622
Frank Barchardaae722a2021-08-30 12:37:30 -0700623tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-cortex-a53.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x16-minmax-fp32-aarch64-neon-mlal-lane-cortex-a53.S &
624tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-cortex-a53.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x16-minmax-fp32-aarch64-neon-mlal-lane-prfm-cortex-a53.S &
Frank Barchard98af05c2021-06-30 12:15:04 -0700625
Frank Barchardaae722a2021-08-30 12:37:30 -0700626tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-cortex-a53.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D DATATYPE=QC8 -o src/qc8-igemm/gen/4x16-minmax-fp32-aarch64-neon-mlal-lane-cortex-a53.S &
627tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-cortex-a53.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D DATATYPE=QC8 -o src/qc8-igemm/gen/4x16-minmax-fp32-aarch64-neon-mlal-lane-prfm-cortex-a53.S &
Frank Barchard59ed1da2021-08-02 11:34:59 -0700628
Frank Barchardfb3a94f2021-08-02 20:37:06 -0700629# QU8 micro-kernels
Frank Barchardaae722a2021-08-30 12:37:30 -0700630tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-cortex-a53.S.in -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QU8 -o src/qu8-igemm/gen/4x16-minmax-rndnu-aarch64-neon-mlal-lane-cortex-a53.S &
631tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-cortex-a53.S.in -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QU8 -o src/qu8-igemm/gen/4x16-minmax-rndnu-aarch64-neon-mlal-lane-prfm-cortex-a53.S &
Frank Barchardd68e1142021-04-26 15:15:08 -0700632
Frank Barchardaae722a2021-08-30 12:37:30 -0700633tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-cortex-a75.S.in -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QU8 -o src/qu8-igemm/gen/4x16-minmax-rndnu-aarch64-neon-mlal-lane-cortex-a75.S &
634tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-cortex-a75.S.in -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QU8 -o src/qu8-igemm/gen/4x16-minmax-rndnu-aarch64-neon-mlal-lane-prfm-cortex-a75.S &
Frank Barchardfb3a94f2021-08-02 20:37:06 -0700635
Frank Barchard1a0b2762021-06-29 18:37:59 -0700636### C4 micro-kernels
Frank Barchardaae722a2021-08-30 12:37:30 -0700637tools/xngen src/qs8-igemm/4x16c4-aarch64-neondot-cortex-a55.S.in -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x16c4-minmax-gemmlowp-aarch64-neondot-cortex-a55.S &
638tools/xngen src/qs8-igemm/4x16c4-aarch64-neondot-ld64.S.in -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x16c4-minmax-gemmlowp-aarch64-neondot-ld64.S &
639tools/xngen src/qs8-igemm/4x16c4-aarch64-neondot-ld128.S.in -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x16c4-minmax-gemmlowp-aarch64-neondot-ld128.S &
Frank Barchard1a0b2762021-06-29 18:37:59 -0700640
Frank Barchardaae722a2021-08-30 12:37:30 -0700641tools/xngen src/qs8-igemm/4x16c4-aarch64-neondot-cortex-a55.S.in -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x16c4-minmax-rndnu-aarch64-neondot-cortex-a55.S &
642tools/xngen src/qs8-igemm/4x16c4-aarch64-neondot-ld64.S.in -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x16c4-minmax-rndnu-aarch64-neondot-ld64.S &
643tools/xngen src/qs8-igemm/4x16c4-aarch64-neondot-ld128.S.in -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x16c4-minmax-rndnu-aarch64-neondot-ld128.S &
Frank Barchard60729d02021-07-20 12:25:09 -0700644
Frank Barchardaae722a2021-08-30 12:37:30 -0700645tools/xngen src/qs8-igemm/4x16c4-aarch64-neondot-cortex-a55.S.in -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x16c4-minmax-fp32-aarch64-neondot-cortex-a55.S &
646tools/xngen src/qs8-igemm/4x16c4-aarch64-neondot-ld64.S.in -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x16c4-minmax-fp32-aarch64-neondot-ld64.S &
647tools/xngen src/qs8-igemm/4x16c4-aarch64-neondot-ld128.S.in -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x16c4-minmax-fp32-aarch64-neondot-ld128.S &
Frank Barchardf10af6c2021-06-30 12:42:29 -0700648
Frank Barchardaae722a2021-08-30 12:37:30 -0700649tools/xngen src/qs8-igemm/4x16c4-aarch64-neondot-cortex-a55.S.in -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/4x16c4-minmax-fp32-aarch64-neondot-cortex-a55.S &
650tools/xngen src/qs8-igemm/4x16c4-aarch64-neondot-ld64.S.in -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/4x16c4-minmax-fp32-aarch64-neondot-ld64.S &
651tools/xngen src/qs8-igemm/4x16c4-aarch64-neondot-ld128.S.in -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/4x16c4-minmax-fp32-aarch64-neondot-ld128.S &
Frank Barchard4a352042021-04-13 15:52:08 -0700652
Frank Barchardca4c68e2021-08-25 19:06:40 -0700653### C4 QU8 micro-kernels
Frank Barcharda49e41f2021-08-31 20:30:24 -0700654tools/xngen src/qu8-igemm/4x8c4-aarch64-neondot-cortex-a55.S.in -D REQUANTIZATION=RNDNU -o src/qu8-igemm/gen/4x8c4-minmax-rndnu-aarch64-neondot-cortex-a55.S &
Frank Barcharddf8e6042021-09-03 13:56:29 -0700655tools/xngen src/qu8-igemm/4x8c4-aarch64-neondot-ld128.S.in -D REQUANTIZATION=RNDNU -o src/qu8-igemm/gen/4x8c4-minmax-rndnu-aarch64-neondot-ld128.S &
Frank Barcharda49e41f2021-08-31 20:30:24 -0700656tools/xngen src/qu8-igemm/4x16c4-aarch64-neondot-cortex-a55.S.in -D REQUANTIZATION=RNDNU -o src/qu8-igemm/gen/4x16c4-minmax-rndnu-aarch64-neondot-cortex-a55.S &
657tools/xngen src/qu8-igemm/4x16c4-aarch64-neondot-ld128.S.in -D REQUANTIZATION=RNDNU -o src/qu8-igemm/gen/4x16c4-minmax-rndnu-aarch64-neondot-ld128.S &
Frank Barchard0049e892021-08-22 09:37:21 -0700658
Frank Barchard1663c0c2021-07-01 11:20:06 -0700659### C8 / C16 micro-kernels
Frank Barcharde22685a2021-11-12 11:36:58 -0800660tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=0 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c8-minmax-gemmlowp-aarch64-neon-mlal-cortex-a53.S &
661tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=1 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c8-minmax-gemmlowp-aarch64-neon-mlal-prfm-cortex-a53.S &
662tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=0 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c8-minmax-gemmlowp-aarch64-neon-mlal-cortex-a53.S &
663tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=1 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c8-minmax-gemmlowp-aarch64-neon-mlal-prfm-cortex-a53.S &
664tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal.S.in -D PREFETCH=0 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c8-minmax-gemmlowp-aarch64-neon-mlal.S &
665tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal.S.in -D PREFETCH=1 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c8-minmax-gemmlowp-aarch64-neon-mlal-prfm.S &
666tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal.S.in -D PREFETCH=0 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c8-minmax-gemmlowp-aarch64-neon-mlal.S &
667tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal.S.in -D PREFETCH=1 -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c8-minmax-gemmlowp-aarch64-neon-mlal-prfm.S &
668tools/xngen src/qs8-igemm/2x8c16-aarch64-neon-mlal.S.in -D REQUANTIZATION=GEMMLOWP -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c16-minmax-gemmlowp-aarch64-neon-mlal.S &
Frank Barchard1663c0c2021-07-01 11:20:06 -0700669
Frank Barcharde22685a2021-11-12 11:36:58 -0800670tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c8-minmax-rndnu-aarch64-neon-mlal-cortex-a53.S &
671tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c8-minmax-rndnu-aarch64-neon-mlal-prfm-cortex-a53.S &
672tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c8-minmax-rndnu-aarch64-neon-mlal-cortex-a53.S &
673tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c8-minmax-rndnu-aarch64-neon-mlal-prfm-cortex-a53.S &
674tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal.S.in -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c8-minmax-rndnu-aarch64-neon-mlal.S &
675tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal.S.in -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c8-minmax-rndnu-aarch64-neon-mlal-prfm.S &
676tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal.S.in -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c8-minmax-rndnu-aarch64-neon-mlal.S &
677tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal.S.in -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c8-minmax-rndnu-aarch64-neon-mlal-prfm.S &
678tools/xngen src/qs8-igemm/2x8c16-aarch64-neon-mlal.S.in -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c16-minmax-rndnu-aarch64-neon-mlal.S &
Frank Barchard13db60f2021-07-20 14:34:35 -0700679
Frank Barcharde22685a2021-11-12 11:36:58 -0800680tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c8-minmax-fp32-aarch64-neon-mlal-cortex-a53.S &
681tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c8-minmax-fp32-aarch64-neon-mlal-prfm-cortex-a53.S &
682tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c8-minmax-fp32-aarch64-neon-mlal-cortex-a53.S &
683tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c8-minmax-fp32-aarch64-neon-mlal-prfm-cortex-a53.S &
684tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c8-minmax-fp32-aarch64-neon-mlal.S &
685tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c8-minmax-fp32-aarch64-neon-mlal-prfm.S &
686tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c8-minmax-fp32-aarch64-neon-mlal.S &
687tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c8-minmax-fp32-aarch64-neon-mlal-prfm.S &
688tools/xngen src/qs8-igemm/2x8c16-aarch64-neon-mlal.S.in -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c16-minmax-fp32-aarch64-neon-mlal.S &
Frank Barchard1663c0c2021-07-01 11:20:06 -0700689
Frank Barcharde22685a2021-11-12 11:36:58 -0800690tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/1x8c8-minmax-fp32-aarch64-neon-mlal-cortex-a53.S &
691tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/1x8c8-minmax-fp32-aarch64-neon-mlal-prfm-cortex-a53.S &
692tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/2x8c8-minmax-fp32-aarch64-neon-mlal-cortex-a53.S &
693tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/2x8c8-minmax-fp32-aarch64-neon-mlal-prfm-cortex-a53.S &
694tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/1x8c8-minmax-fp32-aarch64-neon-mlal.S &
695tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/1x8c8-minmax-fp32-aarch64-neon-mlal-prfm.S &
696tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/2x8c8-minmax-fp32-aarch64-neon-mlal.S &
697tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/2x8c8-minmax-fp32-aarch64-neon-mlal-prfm.S &
698tools/xngen src/qs8-igemm/2x8c16-aarch64-neon-mlal.S.in -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/2x8c16-minmax-fp32-aarch64-neon-mlal.S &
Frank Barchard1663c0c2021-07-01 11:20:06 -0700699
700
Marat Dukhanf9480682020-07-31 14:50:24 -0700701################################### x86 SSE ###################################
702### C2 micro-kernels
Frank Barchardaae722a2021-08-30 12:37:30 -0700703tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=GEMMLOWP -D VARIANT=LD64 -o src/qs8-igemm/gen/4x4c2-minmax-gemmlowp-sse2-ld64.c &
704tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=GEMMLOWP -D VARIANT=LD64 -o src/qu8-igemm/gen/4x4c2-minmax-gemmlowp-sse2-ld64.c &
Marat Dukhancdbe9a32021-07-01 23:52:04 -0700705
Frank Barchardaae722a2021-08-30 12:37:30 -0700706tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=3 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=GEMMLOWP -D VARIANT=LD64 -o src/qs8-igemm/gen/4x4c2-minmax-gemmlowp-ssse3-ld64.c &
707tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=3 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=GEMMLOWP -D VARIANT=LD64 -o src/qu8-igemm/gen/4x4c2-minmax-gemmlowp-ssse3-ld64.c &
Marat Dukhan3d5aac62021-07-02 11:50:38 -0700708
Frank Barchardaae722a2021-08-30 12:37:30 -0700709tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=GEMMLOWP -D VARIANT=LD64 -o src/qs8-igemm/gen/4x4c2-minmax-gemmlowp-sse41-ld64.c &
710tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=GEMMLOWP -D VARIANT=LD64 -o src/qu8-igemm/gen/4x4c2-minmax-gemmlowp-sse41-ld64.c &
Marat Dukhan3d5aac62021-07-02 11:50:38 -0700711
Frank Barchardaae722a2021-08-30 12:37:30 -0700712tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/1x4c2-minmax-fp32-sse2-ld64.c &
713tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/2x4c2-minmax-fp32-sse2-ld64.c &
714tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/3x4c2-minmax-fp32-sse2-ld64.c &
715tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/4x4c2-minmax-fp32-sse2-ld64.c &
Marat Dukhanf9480682020-07-31 14:50:24 -0700716
Frank Barchardaae722a2021-08-30 12:37:30 -0700717tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/1x4c2-minmax-fp32-sse2-ld64.c &
718tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/2x4c2-minmax-fp32-sse2-ld64.c &
719tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/3x4c2-minmax-fp32-sse2-ld64.c &
720tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/4x4c2-minmax-fp32-sse2-ld64.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700721
Frank Barchardaae722a2021-08-30 12:37:30 -0700722tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/1x4c2-minmax-fp32-sse2-ld64.c &
723tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/2x4c2-minmax-fp32-sse2-ld64.c &
724tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/3x4c2-minmax-fp32-sse2-ld64.c &
725tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/4x4c2-minmax-fp32-sse2-ld64.c &
Marat Dukhandee732b2020-07-31 17:32:04 -0700726
Frank Barchardaae722a2021-08-30 12:37:30 -0700727tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/1x4c2-minmax-fp32-sse41-ld64.c &
728tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/2x4c2-minmax-fp32-sse41-ld64.c &
729tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/3x4c2-minmax-fp32-sse41-ld64.c &
730tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/4x4c2-minmax-fp32-sse41-ld64.c &
Marat Dukhana3c16332021-04-02 15:03:27 -0700731
Frank Barchardaae722a2021-08-30 12:37:30 -0700732tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/1x4c2-minmax-fp32-sse41-ld64.c &
733tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/2x4c2-minmax-fp32-sse41-ld64.c &
734tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/3x4c2-minmax-fp32-sse41-ld64.c &
735tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/4x4c2-minmax-fp32-sse41-ld64.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700736
Frank Barchardaae722a2021-08-30 12:37:30 -0700737tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/1x4c2-minmax-fp32-sse41-ld64.c &
738tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/2x4c2-minmax-fp32-sse41-ld64.c &
739tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/3x4c2-minmax-fp32-sse41-ld64.c &
740tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/4x4c2-minmax-fp32-sse41-ld64.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700741
Frank Barchardaae722a2021-08-30 12:37:30 -0700742tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/1x4c2-minmax-fp32-avx-ld64.c &
743tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/2x4c2-minmax-fp32-avx-ld64.c &
744tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/3x4c2-minmax-fp32-avx-ld64.c &
745tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/4x4c2-minmax-fp32-avx-ld64.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700746
Frank Barchardaae722a2021-08-30 12:37:30 -0700747tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/1x4c2-minmax-fp32-avx-ld64.c &
748tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/2x4c2-minmax-fp32-avx-ld64.c &
749tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/3x4c2-minmax-fp32-avx-ld64.c &
750tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/4x4c2-minmax-fp32-avx-ld64.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700751
Frank Barchardaae722a2021-08-30 12:37:30 -0700752tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/1x4c2-minmax-fp32-avx-ld64.c &
753tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/2x4c2-minmax-fp32-avx-ld64.c &
754tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/3x4c2-minmax-fp32-avx-ld64.c &
755tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/4x4c2-minmax-fp32-avx-ld64.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700756
Frank Barchardaae722a2021-08-30 12:37:30 -0700757tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/1x4c2-minmax-fp32-xop-ld64.c &
758tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/2x4c2-minmax-fp32-xop-ld64.c &
759tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/3x4c2-minmax-fp32-xop-ld64.c &
760tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/4x4c2-minmax-fp32-xop-ld64.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700761
Frank Barchardaae722a2021-08-30 12:37:30 -0700762tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/1x4c2-minmax-fp32-xop-ld64.c &
763tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/2x4c2-minmax-fp32-xop-ld64.c &
764tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/3x4c2-minmax-fp32-xop-ld64.c &
765tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/4x4c2-minmax-fp32-xop-ld64.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700766
Frank Barchardaae722a2021-08-30 12:37:30 -0700767tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/1x4c2-minmax-fp32-xop-ld64.c &
768tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/2x4c2-minmax-fp32-xop-ld64.c &
769tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/3x4c2-minmax-fp32-xop-ld64.c &
770tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/4x4c2-minmax-fp32-xop-ld64.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700771
Frank Barchardaae722a2021-08-30 12:37:30 -0700772tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/1x4c2-minmax-fp32-sse2-ld128.c &
773tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/2x4c2-minmax-fp32-sse2-ld128.c &
774tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/3x4c2-minmax-fp32-sse2-ld128.c &
775tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/4x4c2-minmax-fp32-sse2-ld128.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700776
Frank Barchardaae722a2021-08-30 12:37:30 -0700777tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/1x4c2-minmax-fp32-sse2-ld128.c &
778tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/2x4c2-minmax-fp32-sse2-ld128.c &
779tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/3x4c2-minmax-fp32-sse2-ld128.c &
780tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/4x4c2-minmax-fp32-sse2-ld128.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700781
Frank Barchardaae722a2021-08-30 12:37:30 -0700782tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/1x4c2-minmax-fp32-sse2-ld128.c &
783tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/2x4c2-minmax-fp32-sse2-ld128.c &
784tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/3x4c2-minmax-fp32-sse2-ld128.c &
785tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/4x4c2-minmax-fp32-sse2-ld128.c &
Marat Dukhanfc188ed2021-06-03 12:21:22 -0700786
Frank Barchardaae722a2021-08-30 12:37:30 -0700787tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/1x4c2-minmax-fp32-sse41-ld128.c &
788tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/2x4c2-minmax-fp32-sse41-ld128.c &
789tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/3x4c2-minmax-fp32-sse41-ld128.c &
790tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/4x4c2-minmax-fp32-sse41-ld128.c &
Marat Dukhanfc188ed2021-06-03 12:21:22 -0700791
Frank Barchardaae722a2021-08-30 12:37:30 -0700792tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/1x4c2-minmax-fp32-sse41-ld128.c &
793tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/2x4c2-minmax-fp32-sse41-ld128.c &
794tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/3x4c2-minmax-fp32-sse41-ld128.c &
795tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/4x4c2-minmax-fp32-sse41-ld128.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700796
Frank Barchardaae722a2021-08-30 12:37:30 -0700797tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/1x4c2-minmax-fp32-sse41-ld128.c &
798tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/2x4c2-minmax-fp32-sse41-ld128.c &
799tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/3x4c2-minmax-fp32-sse41-ld128.c &
800tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/4x4c2-minmax-fp32-sse41-ld128.c &
Marat Dukhanfc188ed2021-06-03 12:21:22 -0700801
Frank Barchardaae722a2021-08-30 12:37:30 -0700802tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/1x4c2-minmax-fp32-avx-ld128.c &
803tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/2x4c2-minmax-fp32-avx-ld128.c &
804tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/3x4c2-minmax-fp32-avx-ld128.c &
805tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/4x4c2-minmax-fp32-avx-ld128.c &
Marat Dukhanfc188ed2021-06-03 12:21:22 -0700806
Frank Barchardaae722a2021-08-30 12:37:30 -0700807tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/1x4c2-minmax-fp32-avx-ld128.c &
808tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/2x4c2-minmax-fp32-avx-ld128.c &
809tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/3x4c2-minmax-fp32-avx-ld128.c &
810tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/4x4c2-minmax-fp32-avx-ld128.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700811
Frank Barchardaae722a2021-08-30 12:37:30 -0700812tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/1x4c2-minmax-fp32-avx-ld128.c &
813tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/2x4c2-minmax-fp32-avx-ld128.c &
814tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/3x4c2-minmax-fp32-avx-ld128.c &
815tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/4x4c2-minmax-fp32-avx-ld128.c &
Marat Dukhanfc188ed2021-06-03 12:21:22 -0700816
Frank Barchardaae722a2021-08-30 12:37:30 -0700817tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/1x4c2-minmax-fp32-xop-ld128.c &
818tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/2x4c2-minmax-fp32-xop-ld128.c &
819tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/3x4c2-minmax-fp32-xop-ld128.c &
820tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/4x4c2-minmax-fp32-xop-ld128.c &
Marat Dukhan1566fee2020-08-02 21:55:41 -0700821
Frank Barchardaae722a2021-08-30 12:37:30 -0700822tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/1x4c2-minmax-fp32-xop-ld128.c &
823tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/2x4c2-minmax-fp32-xop-ld128.c &
824tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/3x4c2-minmax-fp32-xop-ld128.c &
825tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/4x4c2-minmax-fp32-xop-ld128.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700826
Frank Barchardaae722a2021-08-30 12:37:30 -0700827tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/1x4c2-minmax-fp32-xop-ld128.c &
828tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/2x4c2-minmax-fp32-xop-ld128.c &
829tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/3x4c2-minmax-fp32-xop-ld128.c &
830tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/4x4c2-minmax-fp32-xop-ld128.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700831
Marat Dukhan07bd2522020-07-31 19:12:39 -0700832### C8 micro-kernels
Frank Barchardaae722a2021-08-30 12:37:30 -0700833tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=GEMMLOWP -D VARIANT=LD64 -o src/qs8-igemm/gen/2x4c8-minmax-gemmlowp-sse2-ld64.c &
834tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=GEMMLOWP -D VARIANT=LD64 -o src/qu8-igemm/gen/2x4c8-minmax-gemmlowp-sse2-ld64.c &
Marat Dukhancdbe9a32021-07-01 23:52:04 -0700835
Frank Barchardaae722a2021-08-30 12:37:30 -0700836tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=3 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=GEMMLOWP -D VARIANT=LD64 -o src/qs8-igemm/gen/2x4c8-minmax-gemmlowp-ssse3-ld64.c &
837tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=3 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=GEMMLOWP -D VARIANT=LD64 -o src/qu8-igemm/gen/2x4c8-minmax-gemmlowp-ssse3-ld64.c &
Marat Dukhane60e9972021-07-02 11:34:03 -0700838
Frank Barchardaae722a2021-08-30 12:37:30 -0700839tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=GEMMLOWP -D VARIANT=LD64 -o src/qs8-igemm/gen/2x4c8-minmax-gemmlowp-sse41-ld64.c &
840tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=GEMMLOWP -D VARIANT=LD64 -o src/qu8-igemm/gen/2x4c8-minmax-gemmlowp-sse41-ld64.c &
Marat Dukhane60e9972021-07-02 11:34:03 -0700841
Frank Barchardaae722a2021-08-30 12:37:30 -0700842tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-sse2-ld64.c &
843tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-sse2-ld64.c &
844tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-sse2-ld64.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700845
Frank Barchardaae722a2021-08-30 12:37:30 -0700846tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-sse2-ld64.c &
847tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-sse2-ld64.c &
848tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-sse2-ld64.c &
Marat Dukhan07bd2522020-07-31 19:12:39 -0700849
Frank Barchardaae722a2021-08-30 12:37:30 -0700850tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-sse2-ld64.c &
851tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-sse2-ld64.c &
852tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-sse2-ld64.c &
Marat Dukhan07bd2522020-07-31 19:12:39 -0700853
Frank Barchardaae722a2021-08-30 12:37:30 -0700854tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=3 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-ssse3-ld64.c &
855tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=3 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-ssse3-ld64.c &
856tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=3 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-ssse3-ld64.c &
Marat Dukhan07bd2522020-07-31 19:12:39 -0700857
Frank Barchardaae722a2021-08-30 12:37:30 -0700858tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-sse41-ld64.c &
859tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-sse41-ld64.c &
860tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-sse41-ld64.c &
Marat Dukhana3c16332021-04-02 15:03:27 -0700861
Frank Barchardaae722a2021-08-30 12:37:30 -0700862tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-sse41-ld64.c &
863tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-sse41-ld64.c &
864tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-sse41-ld64.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700865
Frank Barchardaae722a2021-08-30 12:37:30 -0700866tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-sse41-ld64.c &
867tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-sse41-ld64.c &
868tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-sse41-ld64.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700869
Frank Barchardaae722a2021-08-30 12:37:30 -0700870tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-avx-ld64.c &
871tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-avx-ld64.c &
872tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-avx-ld64.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700873
Frank Barchardaae722a2021-08-30 12:37:30 -0700874tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-avx-ld64.c &
875tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-avx-ld64.c &
876tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-avx-ld64.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700877
Frank Barchardaae722a2021-08-30 12:37:30 -0700878tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-avx-ld64.c &
879tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-avx-ld64.c &
880tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-avx-ld64.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700881
Frank Barchardaae722a2021-08-30 12:37:30 -0700882tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-xop-ld64.c &
883tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-xop-ld64.c &
884tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-xop-ld64.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700885
Frank Barchardaae722a2021-08-30 12:37:30 -0700886tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-xop-ld64.c &
887tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-xop-ld64.c &
888tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-xop-ld64.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700889
Frank Barchardaae722a2021-08-30 12:37:30 -0700890tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-xop-ld64.c &
891tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-xop-ld64.c &
892tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-xop-ld64.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700893
Frank Barchardaae722a2021-08-30 12:37:30 -0700894tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-sse2-ld128.c &
895tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-sse2-ld128.c &
896tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-sse2-ld128.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700897
Frank Barchardaae722a2021-08-30 12:37:30 -0700898tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-sse2-ld128.c &
899tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-sse2-ld128.c &
900tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-sse2-ld128.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700901
Frank Barchardaae722a2021-08-30 12:37:30 -0700902tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-sse2-ld128.c &
903tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-sse2-ld128.c &
904tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-sse2-ld128.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700905
Frank Barchardaae722a2021-08-30 12:37:30 -0700906tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=3 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-ssse3-ld128.c &
907tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=3 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-ssse3-ld128.c &
908tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=3 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-ssse3-ld128.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700909
Frank Barchardaae722a2021-08-30 12:37:30 -0700910tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-sse41-ld128.c &
911tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-sse41-ld128.c &
912tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-sse41-ld128.c &
Marat Dukhanfc188ed2021-06-03 12:21:22 -0700913
Frank Barchardaae722a2021-08-30 12:37:30 -0700914tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-sse41-ld128.c &
915tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-sse41-ld128.c &
916tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-sse41-ld128.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700917
Frank Barchardaae722a2021-08-30 12:37:30 -0700918tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-sse41-ld128.c &
919tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-sse41-ld128.c &
920tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-sse41-ld128.c &
Marat Dukhanfc188ed2021-06-03 12:21:22 -0700921
Frank Barchardaae722a2021-08-30 12:37:30 -0700922tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-avx-ld128.c &
923tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-avx-ld128.c &
924tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-avx-ld128.c &
Marat Dukhanfc188ed2021-06-03 12:21:22 -0700925
Frank Barchardaae722a2021-08-30 12:37:30 -0700926tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-avx-ld128.c &
927tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-avx-ld128.c &
928tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-avx-ld128.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700929
Frank Barchardaae722a2021-08-30 12:37:30 -0700930tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-avx-ld128.c &
931tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-avx-ld128.c &
932tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-avx-ld128.c &
Marat Dukhanfc188ed2021-06-03 12:21:22 -0700933
Frank Barchardaae722a2021-08-30 12:37:30 -0700934tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-xop-ld128.c &
935tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-xop-ld128.c &
936tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-xop-ld128.c &
Marat Dukhan1566fee2020-08-02 21:55:41 -0700937
Frank Barchardaae722a2021-08-30 12:37:30 -0700938tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-xop-ld128.c &
939tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-xop-ld128.c &
940tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-xop-ld128.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700941
Frank Barchardaae722a2021-08-30 12:37:30 -0700942tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-xop-ld128.c &
943tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-xop-ld128.c &
944tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-xop-ld128.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700945
Marat Dukhan12809522020-08-02 22:23:51 -0700946################################### x86 AVX2 ##################################
947### C8 micro-kernels
Frank Barchardaae722a2021-08-30 12:37:30 -0700948tools/xngen src/qs8-igemm/MRx8c8-avx2.c.in -D MR=3 -D DATATYPE=QS8 -D REQUANTIZATION=GEMMLOWP -o src/qs8-igemm/gen/3x8c8-minmax-gemmlowp-avx2.c &
Marat Dukhan9b474cf2021-05-25 16:37:48 -0700949
Frank Barchardaae722a2021-08-30 12:37:30 -0700950tools/xngen src/qs8-igemm/MRx8c8-avx2.c.in -D MR=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -o src/qc8-igemm/gen/1x8c8-minmax-fp32-avx2.c &
951tools/xngen src/qs8-igemm/MRx8c8-avx2.c.in -D MR=2 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -o src/qc8-igemm/gen/2x8c8-minmax-fp32-avx2.c &
952tools/xngen src/qs8-igemm/MRx8c8-avx2.c.in -D MR=3 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -o src/qc8-igemm/gen/3x8c8-minmax-fp32-avx2.c &
Marat Dukhan902ef7f2021-07-02 16:11:06 -0700953
Frank Barchardaae722a2021-08-30 12:37:30 -0700954tools/xngen src/qs8-igemm/MRx8c8-avx2.c.in -D MR=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -o src/qs8-igemm/gen/1x8c8-minmax-fp32-avx2.c &
955tools/xngen src/qs8-igemm/MRx8c8-avx2.c.in -D MR=2 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -o src/qs8-igemm/gen/2x8c8-minmax-fp32-avx2.c &
956tools/xngen src/qs8-igemm/MRx8c8-avx2.c.in -D MR=3 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -o src/qs8-igemm/gen/3x8c8-minmax-fp32-avx2.c &
Marat Dukhane06c8132021-06-03 08:59:11 -0700957
Frank Barchardaae722a2021-08-30 12:37:30 -0700958tools/xngen src/qs8-igemm/MRx8c8-avx2.c.in -D MR=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -o src/qu8-igemm/gen/1x8c8-minmax-fp32-avx2.c &
959tools/xngen src/qs8-igemm/MRx8c8-avx2.c.in -D MR=2 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -o src/qu8-igemm/gen/2x8c8-minmax-fp32-avx2.c &
960tools/xngen src/qs8-igemm/MRx8c8-avx2.c.in -D MR=3 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -o src/qu8-igemm/gen/3x8c8-minmax-fp32-avx2.c &
Marat Dukhan12809522020-08-02 22:23:51 -0700961
Marat Dukhanbb00b1d2020-08-10 11:37:23 -0700962################################## x86 AVX512 #################################
963### C8 micro-kernels
Frank Barchardaae722a2021-08-30 12:37:30 -0700964tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=4 -D VARIANT=LD256 -D DATATYPE=QS8 -D REQUANTIZATION=GEMMLOWP -o src/qs8-igemm/gen/4x16c8-minmax-gemmlowp-avx512skx.c &
Marat Dukhan71855ee2021-05-25 19:05:06 -0700965
Frank Barchardaae722a2021-08-30 12:37:30 -0700966tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=1 -D VARIANT=LD256 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -o src/qc8-igemm/gen/1x16c8-minmax-fp32-avx512skx.c &
967tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=2 -D VARIANT=LD256 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -o src/qc8-igemm/gen/2x16c8-minmax-fp32-avx512skx.c &
968tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=3 -D VARIANT=LD256 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -o src/qc8-igemm/gen/3x16c8-minmax-fp32-avx512skx.c &
969tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=4 -D VARIANT=LD256 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -o src/qc8-igemm/gen/4x16c8-minmax-fp32-avx512skx.c &
Marat Dukhan3cf2e222021-07-08 11:38:45 -0700970
Frank Barchardaae722a2021-08-30 12:37:30 -0700971tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=1 -D VARIANT=LD256 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -o src/qs8-igemm/gen/1x16c8-minmax-fp32-avx512skx.c &
972tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=2 -D VARIANT=LD256 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -o src/qs8-igemm/gen/2x16c8-minmax-fp32-avx512skx.c &
973tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=3 -D VARIANT=LD256 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -o src/qs8-igemm/gen/3x16c8-minmax-fp32-avx512skx.c &
974tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=4 -D VARIANT=LD256 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -o src/qs8-igemm/gen/4x16c8-minmax-fp32-avx512skx.c &
Marat Dukhanc3e3f1c2021-06-03 09:56:16 -0700975
Frank Barchardaae722a2021-08-30 12:37:30 -0700976tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=1 -D VARIANT=LD256 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -o src/qu8-igemm/gen/1x16c8-minmax-fp32-avx512skx.c &
977tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=2 -D VARIANT=LD256 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -o src/qu8-igemm/gen/2x16c8-minmax-fp32-avx512skx.c &
978tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=3 -D VARIANT=LD256 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -o src/qu8-igemm/gen/3x16c8-minmax-fp32-avx512skx.c &
979tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=4 -D VARIANT=LD256 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -o src/qu8-igemm/gen/4x16c8-minmax-fp32-avx512skx.c &
Marat Dukhanbb00b1d2020-08-10 11:37:23 -0700980
Marat Dukhanf9480682020-07-31 14:50:24 -0700981################################## Unit tests #################################
Frank Barchardaae722a2021-08-30 12:37:30 -0700982tools/generate-gemm-test.py --spec test/qc8-igemm-minmax-fp32.yaml --output test/qc8-igemm-minmax-fp32.cc &
983tools/generate-gemm-test.py --spec test/qs8-igemm-minmax-fp32.yaml --output test/qs8-igemm-minmax-fp32.cc &
984tools/generate-gemm-test.py --spec test/qu8-igemm-minmax-fp32.yaml --output test/qu8-igemm-minmax-fp32.cc &
Marat Dukhane903dff2021-07-16 19:43:41 -0700985
Frank Barchardaae722a2021-08-30 12:37:30 -0700986tools/generate-gemm-test.py --spec test/qs8-igemm-minmax-gemmlowp.yaml --output test/qs8-igemm-minmax-gemmlowp.cc &
987tools/generate-gemm-test.py --spec test/qu8-igemm-minmax-gemmlowp.yaml --output test/qu8-igemm-minmax-gemmlowp.cc &
Marat Dukhane903dff2021-07-16 19:43:41 -0700988
Frank Barchardaae722a2021-08-30 12:37:30 -0700989tools/generate-gemm-test.py --spec test/qs8-igemm-minmax-rndnu.yaml --output test/qs8-igemm-minmax-rndnu.cc &
990tools/generate-gemm-test.py --spec test/qu8-igemm-minmax-rndnu.yaml --output test/qu8-igemm-minmax-rndnu.cc &
991
992wait