blob: 95974d2dd52f19602be1aa693d048a3939902e6c [file] [log] [blame]
Marat Dukhanf9480682020-07-31 14:50:24 -07001#!/bin/sh
2# Copyright 2020 Google LLC
3#
4# This source code is licensed under the BSD-style license found in the
5# LICENSE file in the root directory of this source tree.
6
Marat Dukhana1a4e782021-05-07 17:49:47 -07007#################################### Scalar ###################################
Marat Dukhan2ac722e2022-01-04 01:54:20 -08008tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/1x2-minmax-fp32-scalar-fmagic.c &
9tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/2x2-minmax-fp32-scalar-fmagic.c &
10tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/3x2-minmax-fp32-scalar-fmagic.c &
11tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/4x2-minmax-fp32-scalar-fmagic.c &
Marat Dukhan779b2532021-06-29 14:14:13 -070012
Marat Dukhan2ac722e2022-01-04 01:54:20 -080013tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/1x2-minmax-fp32-scalar-fmagic.c &
14tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/2x2-minmax-fp32-scalar-fmagic.c &
15tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/3x2-minmax-fp32-scalar-fmagic.c &
16tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/4x2-minmax-fp32-scalar-fmagic.c &
Marat Dukhan779b2532021-06-29 14:14:13 -070017
Marat Dukhan2ac722e2022-01-04 01:54:20 -080018tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/1x2-minmax-fp32-scalar-fmagic.c &
19tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/2x2-minmax-fp32-scalar-fmagic.c &
20tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/3x2-minmax-fp32-scalar-fmagic.c &
21tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/4x2-minmax-fp32-scalar-fmagic.c &
Marat Dukhand6021542021-06-30 09:04:20 -070022
Marat Dukhan272d4d92022-01-04 15:07:14 -080023tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/1x2-minmax-fp32-scalar-imagic.c &
24tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/2x2-minmax-fp32-scalar-imagic.c &
25tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/3x2-minmax-fp32-scalar-imagic.c &
26tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/4x2-minmax-fp32-scalar-imagic.c &
Marat Dukhand6021542021-06-30 09:04:20 -070027
Marat Dukhan272d4d92022-01-04 15:07:14 -080028tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/1x2-minmax-fp32-scalar-imagic.c &
29tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/2x2-minmax-fp32-scalar-imagic.c &
30tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/3x2-minmax-fp32-scalar-imagic.c &
31tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/4x2-minmax-fp32-scalar-imagic.c &
Frank Barchard1a2dbe12021-07-22 20:13:58 -070032
Marat Dukhan272d4d92022-01-04 15:07:14 -080033tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/1x2-minmax-fp32-scalar-imagic.c &
34tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/2x2-minmax-fp32-scalar-imagic.c &
35tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/3x2-minmax-fp32-scalar-imagic.c &
36tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/4x2-minmax-fp32-scalar-imagic.c &
37
38tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/1x2-minmax-fp32-scalar-lrintf.c &
39tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/2x2-minmax-fp32-scalar-lrintf.c &
40tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/3x2-minmax-fp32-scalar-lrintf.c &
41tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/4x2-minmax-fp32-scalar-lrintf.c &
42
43tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/1x2-minmax-fp32-scalar-lrintf.c &
44tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/2x2-minmax-fp32-scalar-lrintf.c &
45tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/3x2-minmax-fp32-scalar-lrintf.c &
46tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/4x2-minmax-fp32-scalar-lrintf.c &
47
48tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/1x2-minmax-fp32-scalar-lrintf.c &
49tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/2x2-minmax-fp32-scalar-lrintf.c &
50tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/3x2-minmax-fp32-scalar-lrintf.c &
51tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/4x2-minmax-fp32-scalar-lrintf.c &
Marat Dukhand6021542021-06-30 09:04:20 -070052
Marat Dukhan2ac722e2022-01-04 01:54:20 -080053tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/1x4-minmax-fp32-scalar-fmagic.c &
54tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/2x4-minmax-fp32-scalar-fmagic.c &
55tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/3x4-minmax-fp32-scalar-fmagic.c &
56tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/4x4-minmax-fp32-scalar-fmagic.c &
Marat Dukhan927d4742021-07-15 13:42:49 -070057
Marat Dukhan2ac722e2022-01-04 01:54:20 -080058tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/1x4-minmax-fp32-scalar-fmagic.c &
59tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/2x4-minmax-fp32-scalar-fmagic.c &
60tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/3x4-minmax-fp32-scalar-fmagic.c &
61tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/4x4-minmax-fp32-scalar-fmagic.c &
Marat Dukhan927d4742021-07-15 13:42:49 -070062
Marat Dukhan2ac722e2022-01-04 01:54:20 -080063tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/1x4-minmax-fp32-scalar-fmagic.c &
64tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/2x4-minmax-fp32-scalar-fmagic.c &
65tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/3x4-minmax-fp32-scalar-fmagic.c &
66tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/4x4-minmax-fp32-scalar-fmagic.c &
Marat Dukhana1a4e782021-05-07 17:49:47 -070067
Marat Dukhan272d4d92022-01-04 15:07:14 -080068tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/1x4-minmax-fp32-scalar-imagic.c &
69tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/2x4-minmax-fp32-scalar-imagic.c &
70tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/3x4-minmax-fp32-scalar-imagic.c &
71tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/4x4-minmax-fp32-scalar-imagic.c &
72
73tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/1x4-minmax-fp32-scalar-imagic.c &
74tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/2x4-minmax-fp32-scalar-imagic.c &
75tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/3x4-minmax-fp32-scalar-imagic.c &
76tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/4x4-minmax-fp32-scalar-imagic.c &
77
78tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/1x4-minmax-fp32-scalar-imagic.c &
79tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/2x4-minmax-fp32-scalar-imagic.c &
80tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/3x4-minmax-fp32-scalar-imagic.c &
81tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=IMAGIC -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/4x4-minmax-fp32-scalar-imagic.c &
82
83tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/1x4-minmax-fp32-scalar-lrintf.c &
84tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/2x4-minmax-fp32-scalar-lrintf.c &
85tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/3x4-minmax-fp32-scalar-lrintf.c &
86tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QC8 -D WASM=0 -o src/qc8-igemm/gen/4x4-minmax-fp32-scalar-lrintf.c &
87
88tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/1x4-minmax-fp32-scalar-lrintf.c &
89tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/2x4-minmax-fp32-scalar-lrintf.c &
90tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/3x4-minmax-fp32-scalar-lrintf.c &
91tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QS8 -D WASM=0 -o src/qs8-igemm/gen/4x4-minmax-fp32-scalar-lrintf.c &
92
93tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/1x4-minmax-fp32-scalar-lrintf.c &
94tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/2x4-minmax-fp32-scalar-lrintf.c &
95tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/3x4-minmax-fp32-scalar-lrintf.c &
96tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=LRINTF -D DATATYPE=QU8 -D WASM=0 -o src/qu8-igemm/gen/4x4-minmax-fp32-scalar-lrintf.c &
97
Marat Dukhan7c1115f2022-01-04 17:18:41 -080098#################################### Scalar ###################################
99tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QC8 -D WASM=1 -o src/qc8-igemm/gen/1x2-minmax-fp32-wasm-fmagic.c &
100tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QC8 -D WASM=1 -o src/qc8-igemm/gen/2x2-minmax-fp32-wasm-fmagic.c &
101tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QC8 -D WASM=1 -o src/qc8-igemm/gen/3x2-minmax-fp32-wasm-fmagic.c &
102tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QC8 -D WASM=1 -o src/qc8-igemm/gen/4x2-minmax-fp32-wasm-fmagic.c &
103
104tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QS8 -D WASM=1 -o src/qs8-igemm/gen/1x2-minmax-fp32-wasm-fmagic.c &
105tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QS8 -D WASM=1 -o src/qs8-igemm/gen/2x2-minmax-fp32-wasm-fmagic.c &
106tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QS8 -D WASM=1 -o src/qs8-igemm/gen/3x2-minmax-fp32-wasm-fmagic.c &
107tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QS8 -D WASM=1 -o src/qs8-igemm/gen/4x2-minmax-fp32-wasm-fmagic.c &
108
109tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QU8 -D WASM=1 -o src/qu8-igemm/gen/1x2-minmax-fp32-wasm-fmagic.c &
110tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QU8 -D WASM=1 -o src/qu8-igemm/gen/2x2-minmax-fp32-wasm-fmagic.c &
111tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QU8 -D WASM=1 -o src/qu8-igemm/gen/3x2-minmax-fp32-wasm-fmagic.c &
112tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=2 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QU8 -D WASM=1 -o src/qu8-igemm/gen/4x2-minmax-fp32-wasm-fmagic.c &
113
114tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QC8 -D WASM=1 -o src/qc8-igemm/gen/1x4-minmax-fp32-wasm-fmagic.c &
115tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QC8 -D WASM=1 -o src/qc8-igemm/gen/2x4-minmax-fp32-wasm-fmagic.c &
116tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QC8 -D WASM=1 -o src/qc8-igemm/gen/3x4-minmax-fp32-wasm-fmagic.c &
117tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QC8 -D WASM=1 -o src/qc8-igemm/gen/4x4-minmax-fp32-wasm-fmagic.c &
118
119tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QS8 -D WASM=1 -o src/qs8-igemm/gen/1x4-minmax-fp32-wasm-fmagic.c &
120tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QS8 -D WASM=1 -o src/qs8-igemm/gen/2x4-minmax-fp32-wasm-fmagic.c &
121tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QS8 -D WASM=1 -o src/qs8-igemm/gen/3x4-minmax-fp32-wasm-fmagic.c &
122tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QS8 -D WASM=1 -o src/qs8-igemm/gen/4x4-minmax-fp32-wasm-fmagic.c &
123
124tools/xngen src/qs8-igemm/scalar.c.in -D MR=1 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QU8 -D WASM=1 -o src/qu8-igemm/gen/1x4-minmax-fp32-wasm-fmagic.c &
125tools/xngen src/qs8-igemm/scalar.c.in -D MR=2 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QU8 -D WASM=1 -o src/qu8-igemm/gen/2x4-minmax-fp32-wasm-fmagic.c &
126tools/xngen src/qs8-igemm/scalar.c.in -D MR=3 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QU8 -D WASM=1 -o src/qu8-igemm/gen/3x4-minmax-fp32-wasm-fmagic.c &
127tools/xngen src/qs8-igemm/scalar.c.in -D MR=4 -D NR=4 -D REQUANTIZATION=FP32 -D VARIANT=FMAGIC -D DATATYPE=QU8 -D WASM=1 -o src/qu8-igemm/gen/4x4-minmax-fp32-wasm-fmagic.c &
128
Marat Dukhan27203da2020-08-05 15:19:03 -0700129################################## WAsm SIMD ##################################
Marat Dukhan8dc106e2021-08-31 15:23:02 -0700130### C2 micro-kernels
Marat Dukhan0f1ed942021-12-08 23:25:50 -0800131tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/1x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
132tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/2x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
133tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/3x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
134tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/4x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
135
136tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/1x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
137tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/2x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
138tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/3x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
139tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
140
141tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/1x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
142tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/2x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
143tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/3x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
144tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/4x4c2-minmax-fp32-wasmsimd-dot16x2-ld64.c &
145
146tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/1x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
147tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/2x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
148tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/3x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
149tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/4x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
150
151tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/1x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
152tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/2x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
153tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/3x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
154tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
155
156tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/1x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
157tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/2x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
158tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/3x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
159tools/xngen src/qs8-igemm/MRx4c2-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/4x4c2-minmax-fp32-wasmsimd-dot16x2-ld128.c &
Marat Dukhan8dc106e2021-08-31 15:23:02 -0700160
Marat Dukhan0f1ed942021-12-08 23:25:50 -0800161tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/1x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld64.c &
162tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/2x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld64.c &
163tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/3x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld64.c &
164tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/4x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld64.c &
Marat Dukhan8dc106e2021-08-31 15:23:02 -0700165
Marat Dukhan0f1ed942021-12-08 23:25:50 -0800166tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/1x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld64.c &
167tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/2x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld64.c &
168tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/3x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld64.c &
169tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld64.c &
Marat Dukhan8dc106e2021-08-31 15:23:02 -0700170
Marat Dukhan348c3772022-02-01 00:36:50 -0800171tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/1x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld64.c &
172tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/2x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld64.c &
173tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/3x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld64.c &
174tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/4x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld64.c &
175
Marat Dukhan0f1ed942021-12-08 23:25:50 -0800176tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/1x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld128.c &
177tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/2x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld128.c &
178tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/3x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld128.c &
179tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/4x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld128.c &
Marat Dukhan8dc106e2021-08-31 15:23:02 -0700180
Marat Dukhan0f1ed942021-12-08 23:25:50 -0800181tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/1x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld128.c &
182tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/2x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld128.c &
183tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/3x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld128.c &
184tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld128.c &
Marat Dukhan8dc106e2021-08-31 15:23:02 -0700185
Marat Dukhan348c3772022-02-01 00:36:50 -0800186tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/1x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld128.c &
187tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/2x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld128.c &
188tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/3x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld128.c &
189tools/xngen src/qs8-igemm/MRx4c2s4-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/4x4c2s4-minmax-fp32-wasmsimd-dot16x2-ld128.c &
190
Marat Dukhanef4ce312020-09-10 12:29:08 -0700191### C8 micro-kernels
Marat Dukhan8dc106e2021-08-31 15:23:02 -0700192tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
193tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
194tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
195tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/4x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
196
197tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
198tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
199tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
200tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
201
202tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
203tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
204tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
205tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/4x4c8-minmax-fp32-wasmsimd-dot16x2-ld64.c &
206
207tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
208tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
209tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
210tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/4x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
211
212tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
213tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
214tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
215tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
216
217tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=1 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
218tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=2 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
219tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=3 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
220tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-dot16x2.c.in -D MR=4 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/4x4c8-minmax-fp32-wasmsimd-dot16x2-ld128.c &
221
Frank Barchardaae722a2021-08-30 12:37:30 -0700222tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=1 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-mul16-ld64.c &
223tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=2 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-mul16-ld64.c &
224tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=3 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-mul16-ld64.c &
Marat Dukhan4741e412021-06-30 13:38:06 -0700225
Frank Barchardaae722a2021-08-30 12:37:30 -0700226tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=1 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-mul16-ld64.c &
227tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=2 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-mul16-ld64.c &
228tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=3 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-mul16-ld64.c &
Marat Dukhan4741e412021-06-30 13:38:06 -0700229
Frank Barchardaae722a2021-08-30 12:37:30 -0700230tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul32.c.in -D MR=1 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-mul32-ld64.c &
231tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul32.c.in -D MR=2 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-mul32-ld64.c &
232tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul32.c.in -D MR=3 -D VARIANT=LD64 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-mul32-ld64.c &
Marat Dukhan47c12202021-06-30 15:09:34 -0700233
Frank Barchardaae722a2021-08-30 12:37:30 -0700234tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=1 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-mul16-ld128.c &
235tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=2 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-mul16-ld128.c &
236tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=3 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-mul16-ld128.c &
Marat Dukhan43bee052021-07-14 20:57:18 -0700237
Frank Barchardaae722a2021-08-30 12:37:30 -0700238tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=1 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-mul16-ld128.c &
239tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=2 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-mul16-ld128.c &
240tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul16.c.in -D MR=3 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-mul16-ld128.c &
Marat Dukhan43bee052021-07-14 20:57:18 -0700241
Frank Barchardaae722a2021-08-30 12:37:30 -0700242tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul32.c.in -D MR=1 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-wasmsimd-mul32-ld128.c &
243tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul32.c.in -D MR=2 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-wasmsimd-mul32-ld128.c &
244tools/xngen src/qs8-igemm/MRx4c8-wasmsimd-mul32.c.in -D MR=3 -D VARIANT=LD128 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-wasmsimd-mul32-ld128.c &
Marat Dukhan27203da2020-08-05 15:19:03 -0700245
Marat Dukhan40bbafe2020-08-04 02:04:22 -0700246################################### ARM NEON ##################################
Frank Barchard27bf92c2021-11-24 15:47:52 -0800247tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/1x8-minmax-rndnu-neon-mlal-lane.c &
248tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=2 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/2x8-minmax-rndnu-neon-mlal-lane.c &
249tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=3 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/3x8-minmax-rndnu-neon-mlal-lane.c &
250tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/4x8-minmax-rndnu-neon-mlal-lane.c &
251tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=6 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/6x8-minmax-rndnu-neon-mlal-lane.c &
Frank Barchardaae722a2021-08-30 12:37:30 -0700252tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/1x16-minmax-rndnu-neon-mlal-lane.c &
Frank Barchard27bf92c2021-11-24 15:47:52 -0800253tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=2 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/2x16-minmax-rndnu-neon-mlal-lane.c &
254tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=3 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/3x16-minmax-rndnu-neon-mlal-lane.c &
Frank Barchardaae722a2021-08-30 12:37:30 -0700255tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/4x16-minmax-rndnu-neon-mlal-lane.c &
Frank Barchard27bf92c2021-11-24 15:47:52 -0800256tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=6 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/6x16-minmax-rndnu-neon-mlal-lane.c &
Frank Barchard22fbe772021-07-20 15:56:32 -0700257
Frank Barchard27bf92c2021-11-24 15:47:52 -0800258tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=8 -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/1x8-minmax-rndnu-neon-mlal-lane-prfm.c &
259tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=2 -D NR=8 -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/2x8-minmax-rndnu-neon-mlal-lane-prfm.c &
260tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=3 -D NR=8 -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/3x8-minmax-rndnu-neon-mlal-lane-prfm.c &
261tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=8 -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/4x8-minmax-rndnu-neon-mlal-lane-prfm.c &
262tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=6 -D NR=8 -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/6x8-minmax-rndnu-neon-mlal-lane-prfm.c &
Frank Barchardaae722a2021-08-30 12:37:30 -0700263tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=16 -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/1x16-minmax-rndnu-neon-mlal-lane-prfm.c &
Frank Barchard27bf92c2021-11-24 15:47:52 -0800264tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=2 -D NR=16 -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/2x16-minmax-rndnu-neon-mlal-lane-prfm.c &
265tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=3 -D NR=16 -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/3x16-minmax-rndnu-neon-mlal-lane-prfm.c &
Frank Barchardaae722a2021-08-30 12:37:30 -0700266tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=16 -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/4x16-minmax-rndnu-neon-mlal-lane-prfm.c &
Frank Barchard27bf92c2021-11-24 15:47:52 -0800267tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=6 -D NR=16 -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/6x16-minmax-rndnu-neon-mlal-lane-prfm.c &
Frank Barchard22fbe772021-07-20 15:56:32 -0700268
Frank Barchardf6237402022-01-05 00:26:09 -0800269tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/1x8-minmax-fp32-neon-mlal-lane.c &
270tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=2 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/2x8-minmax-fp32-neon-mlal-lane.c &
271tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=3 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/3x8-minmax-fp32-neon-mlal-lane.c &
272tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/4x8-minmax-fp32-neon-mlal-lane.c &
273tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=6 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/6x8-minmax-fp32-neon-mlal-lane.c &
274tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/1x16-minmax-fp32-neon-mlal-lane.c &
275tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=2 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/2x16-minmax-fp32-neon-mlal-lane.c &
276tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=3 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/3x16-minmax-fp32-neon-mlal-lane.c &
277tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/4x16-minmax-fp32-neon-mlal-lane.c &
278tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=6 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/6x16-minmax-fp32-neon-mlal-lane.c &
279
280tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/1x8-minmax-fp32-neonv8-mlal-lane.c &
281tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=2 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/2x8-minmax-fp32-neonv8-mlal-lane.c &
282tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=3 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/3x8-minmax-fp32-neonv8-mlal-lane.c &
283tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/4x8-minmax-fp32-neonv8-mlal-lane.c &
284tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=6 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/6x8-minmax-fp32-neonv8-mlal-lane.c &
285tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/1x16-minmax-fp32-neonv8-mlal-lane.c &
286tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=2 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/2x16-minmax-fp32-neonv8-mlal-lane.c &
287tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=3 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/3x16-minmax-fp32-neonv8-mlal-lane.c &
288tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/4x16-minmax-fp32-neonv8-mlal-lane.c &
289tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=6 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/6x16-minmax-fp32-neonv8-mlal-lane.c &
290
291tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=8 -D PREFETCH=1 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/1x8-minmax-fp32-neon-mlal-lane-prfm.c &
292tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=2 -D NR=8 -D PREFETCH=1 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/2x8-minmax-fp32-neon-mlal-lane-prfm.c &
293tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=3 -D NR=8 -D PREFETCH=1 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/3x8-minmax-fp32-neon-mlal-lane-prfm.c &
294tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=8 -D PREFETCH=1 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/4x8-minmax-fp32-neon-mlal-lane-prfm.c &
295tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=6 -D NR=8 -D PREFETCH=1 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/6x8-minmax-fp32-neon-mlal-lane-prfm.c &
296tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=16 -D PREFETCH=1 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/1x16-minmax-fp32-neon-mlal-lane-prfm.c &
297tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=2 -D NR=16 -D PREFETCH=1 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/2x16-minmax-fp32-neon-mlal-lane-prfm.c &
298tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=3 -D NR=16 -D PREFETCH=1 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/3x16-minmax-fp32-neon-mlal-lane-prfm.c &
299tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=16 -D PREFETCH=1 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/4x16-minmax-fp32-neon-mlal-lane-prfm.c &
300tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=6 -D NR=16 -D PREFETCH=1 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/6x16-minmax-fp32-neon-mlal-lane-prfm.c &
301
302tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=8 -D PREFETCH=1 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/1x8-minmax-fp32-neonv8-mlal-lane-prfm.c &
303tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=2 -D NR=8 -D PREFETCH=1 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/2x8-minmax-fp32-neonv8-mlal-lane-prfm.c &
304tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=3 -D NR=8 -D PREFETCH=1 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/3x8-minmax-fp32-neonv8-mlal-lane-prfm.c &
305tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=8 -D PREFETCH=1 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/4x8-minmax-fp32-neonv8-mlal-lane-prfm.c &
306tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=6 -D NR=8 -D PREFETCH=1 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/6x8-minmax-fp32-neonv8-mlal-lane-prfm.c &
307tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=16 -D PREFETCH=1 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/1x16-minmax-fp32-neonv8-mlal-lane-prfm.c &
308tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=2 -D NR=16 -D PREFETCH=1 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/2x16-minmax-fp32-neonv8-mlal-lane-prfm.c &
309tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=3 -D NR=16 -D PREFETCH=1 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/3x16-minmax-fp32-neonv8-mlal-lane-prfm.c &
310tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=16 -D PREFETCH=1 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/4x16-minmax-fp32-neonv8-mlal-lane-prfm.c &
311tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=6 -D NR=16 -D PREFETCH=1 -D REQUANTIZATION=FP32 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/6x16-minmax-fp32-neonv8-mlal-lane-prfm.c &
312
313tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QU8 -D ARMV8=0 -o src/qu8-igemm/gen/1x8-minmax-rndnu-neon-mlal-lane.c &
Frank Barchardd5a53332022-01-10 03:44:40 -0800314tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=2 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QU8 -D ARMV8=0 -o src/qu8-igemm/gen/2x8-minmax-rndnu-neon-mlal-lane.c &
315tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=3 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QU8 -D ARMV8=0 -o src/qu8-igemm/gen/3x8-minmax-rndnu-neon-mlal-lane.c &
Frank Barchardf6237402022-01-05 00:26:09 -0800316tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QU8 -D ARMV8=0 -o src/qu8-igemm/gen/4x8-minmax-rndnu-neon-mlal-lane.c &
Frank Barchardd5a53332022-01-10 03:44:40 -0800317tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=6 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QU8 -D ARMV8=0 -o src/qu8-igemm/gen/6x8-minmax-rndnu-neon-mlal-lane.c &
Frank Barchardf6237402022-01-05 00:26:09 -0800318tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QU8 -D ARMV8=0 -o src/qu8-igemm/gen/1x16-minmax-rndnu-neon-mlal-lane.c &
Frank Barchardd5a53332022-01-10 03:44:40 -0800319tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=2 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QU8 -D ARMV8=0 -o src/qu8-igemm/gen/2x16-minmax-rndnu-neon-mlal-lane.c &
320tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=3 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QU8 -D ARMV8=0 -o src/qu8-igemm/gen/3x16-minmax-rndnu-neon-mlal-lane.c &
Frank Barchardf6237402022-01-05 00:26:09 -0800321tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QU8 -D ARMV8=0 -o src/qu8-igemm/gen/4x16-minmax-rndnu-neon-mlal-lane.c &
Frank Barchardd5a53332022-01-10 03:44:40 -0800322tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=6 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D DATATYPE=QU8 -D ARMV8=0 -o src/qu8-igemm/gen/6x16-minmax-rndnu-neon-mlal-lane.c &
Frank Barchardf6237402022-01-05 00:26:09 -0800323
324tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/1x16-minmax-fp32-neon-mlal-lane.c &
325tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/4x16-minmax-fp32-neon-mlal-lane.c &
326
327tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -D ARMV8=0 -o src/qu8-igemm/gen/1x8-minmax-fp32-neon-mlal-lane.c &
328tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=8 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -D ARMV8=0 -o src/qu8-igemm/gen/4x8-minmax-fp32-neon-mlal-lane.c &
329tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -D ARMV8=0 -o src/qu8-igemm/gen/1x16-minmax-fp32-neon-mlal-lane.c &
330tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -D ARMV8=0 -o src/qu8-igemm/gen/4x16-minmax-fp32-neon-mlal-lane.c &
331
332tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -D ARMV8=1 -o src/qs8-igemm/gen/1x16-minmax-fp32-neonv8-mlal-lane.c &
333tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QS8 -D ARMV8=1 -o src/qs8-igemm/gen/4x16-minmax-fp32-neonv8-mlal-lane.c &
334
335tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=1 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -D ARMV8=1 -o src/qu8-igemm/gen/1x16-minmax-fp32-neonv8-mlal-lane.c &
336tools/xngen src/qs8-igemm/neon-mlal-lane.c.in -D MR=4 -D NR=16 -D PREFETCH=0 -D REQUANTIZATION=FP32 -D DATATYPE=QU8 -D ARMV8=1 -o src/qu8-igemm/gen/4x16-minmax-fp32-neonv8-mlal-lane.c &
337
Frank Barchardaae722a2021-08-30 12:37:30 -0700338tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=1 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8-minmax-rndnu-neon-mull-addw-dup.c &
339tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=2 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8-minmax-rndnu-neon-mull-addw-dup.c &
340tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=3 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/3x8-minmax-rndnu-neon-mull-addw-dup.c &
341tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=4 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x8-minmax-rndnu-neon-mull-addw-dup.c &
Frank Barchard510b8e02021-07-26 17:25:18 -0700342
Frank Barchardaae722a2021-08-30 12:37:30 -0700343tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=1 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x16-minmax-rndnu-neon-mull-addw-dup.c &
344tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=2 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x16-minmax-rndnu-neon-mull-addw-dup.c &
345tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=3 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/3x16-minmax-rndnu-neon-mull-addw-dup.c &
346tools/xngen src/qs8-igemm/neon-mull-addw-dup.c.in -D MR=4 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x16-minmax-rndnu-neon-mull-addw-dup.c &
Frank Barchardda78da12021-03-02 14:28:00 -0800347
348### C2 micro-kernels
Frank Barchard15eec022021-11-17 13:26:20 -0800349tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/1x8c2-minmax-rndnu-neon-mull-dup.c &
350tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/2x8c2-minmax-rndnu-neon-mull-dup.c &
351tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/3x8c2-minmax-rndnu-neon-mull-dup.c &
352tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/4x8c2-minmax-rndnu-neon-mull-dup.c &
353tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/1x16c2-minmax-rndnu-neon-mull-dup.c &
354tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/2x16c2-minmax-rndnu-neon-mull-dup.c &
355tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/3x16c2-minmax-rndnu-neon-mull-dup.c &
356tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/4x16c2-minmax-rndnu-neon-mull-dup.c &
Frank Barchardda78da12021-03-02 14:28:00 -0800357
Frank Barchard15eec022021-11-17 13:26:20 -0800358tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/1x8c2-minmax-rndnu-neon-mlal-dup.c &
359tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/2x8c2-minmax-rndnu-neon-mlal-dup.c &
360tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/3x8c2-minmax-rndnu-neon-mlal-dup.c &
361tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/4x8c2-minmax-rndnu-neon-mlal-dup.c &
362tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/1x16c2-minmax-rndnu-neon-mlal-dup.c &
363tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/2x16c2-minmax-rndnu-neon-mlal-dup.c &
364tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/3x16c2-minmax-rndnu-neon-mlal-dup.c &
365tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/4x16c2-minmax-rndnu-neon-mlal-dup.c &
Frank Barchardc7a032d2021-11-10 12:37:49 -0800366
Frank Barchard15eec022021-11-17 13:26:20 -0800367tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/1x8c2-minmax-fp32-neon-mlal-dup.c &
368tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/2x8c2-minmax-fp32-neon-mlal-dup.c &
Marat Dukhan14f325e2021-06-30 18:46:25 -0700369
Frank Barchard15eec022021-11-17 13:26:20 -0800370tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=DUP -o src/qc8-igemm/gen/1x8c2-minmax-fp32-neon-mlal-dup.c &
371tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=DUP -o src/qc8-igemm/gen/2x8c2-minmax-fp32-neon-mlal-dup.c &
Marat Dukhan14f325e2021-06-30 18:46:25 -0700372
Frank Barchard15eec022021-11-17 13:26:20 -0800373tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=DUP -o src/qs8-igemm/gen/1x8c2-minmax-fp32-neonv8-mlal-dup.c &
374tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=DUP -o src/qs8-igemm/gen/2x8c2-minmax-fp32-neonv8-mlal-dup.c &
Marat Dukhan14f325e2021-06-30 18:46:25 -0700375
Frank Barchard15eec022021-11-17 13:26:20 -0800376tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=DUP -o src/qc8-igemm/gen/1x8c2-minmax-fp32-neonv8-mlal-dup.c &
377tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=DUP -o src/qc8-igemm/gen/2x8c2-minmax-fp32-neonv8-mlal-dup.c &
Frank Barchardda78da12021-03-02 14:28:00 -0800378
Frank Barchard15eec022021-11-17 13:26:20 -0800379### C2 LD1R micro-kernels
380tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/1x8c2-minmax-rndnu-neon-mull-ld1r.c &
381tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/2x8c2-minmax-rndnu-neon-mull-ld1r.c &
382tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/3x8c2-minmax-rndnu-neon-mull-ld1r.c &
383tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/4x8c2-minmax-rndnu-neon-mull-ld1r.c &
384tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/1x16c2-minmax-rndnu-neon-mull-ld1r.c &
385tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/2x16c2-minmax-rndnu-neon-mull-ld1r.c &
386tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/3x16c2-minmax-rndnu-neon-mull-ld1r.c &
387tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/4x16c2-minmax-rndnu-neon-mull-ld1r.c &
388
389tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/1x8c2-minmax-rndnu-neon-mlal-ld1r.c &
390tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/2x8c2-minmax-rndnu-neon-mlal-ld1r.c &
391tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/3x8c2-minmax-rndnu-neon-mlal-ld1r.c &
392tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/4x8c2-minmax-rndnu-neon-mlal-ld1r.c &
393tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/1x16c2-minmax-rndnu-neon-mlal-ld1r.c &
394tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/2x16c2-minmax-rndnu-neon-mlal-ld1r.c &
395tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/3x16c2-minmax-rndnu-neon-mlal-ld1r.c &
396tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/4x16c2-minmax-rndnu-neon-mlal-ld1r.c &
397
398tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/1x8c2-minmax-fp32-neon-mlal-ld1r.c &
399tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/2x8c2-minmax-fp32-neon-mlal-ld1r.c &
400
401tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=LD1R -o src/qc8-igemm/gen/1x8c2-minmax-fp32-neon-mlal-ld1r.c &
402tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=LD1R -o src/qc8-igemm/gen/2x8c2-minmax-fp32-neon-mlal-ld1r.c &
403
404tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=LD1R -o src/qs8-igemm/gen/1x8c2-minmax-fp32-neonv8-mlal-ld1r.c &
405tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=LD1R -o src/qs8-igemm/gen/2x8c2-minmax-fp32-neonv8-mlal-ld1r.c &
406
407tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=LD1R -o src/qc8-igemm/gen/1x8c2-minmax-fp32-neonv8-mlal-ld1r.c &
408tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=LD1R -o src/qc8-igemm/gen/2x8c2-minmax-fp32-neonv8-mlal-ld1r.c &
409
410### C2 LD2R micro-kernels
411tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/1x8c2-minmax-rndnu-neon-mull-ld2r.c &
412tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/2x8c2-minmax-rndnu-neon-mull-ld2r.c &
413tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/3x8c2-minmax-rndnu-neon-mull-ld2r.c &
414tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/4x8c2-minmax-rndnu-neon-mull-ld2r.c &
415tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/1x16c2-minmax-rndnu-neon-mull-ld2r.c &
416tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/2x16c2-minmax-rndnu-neon-mull-ld2r.c &
417tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/3x16c2-minmax-rndnu-neon-mull-ld2r.c &
418tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/4x16c2-minmax-rndnu-neon-mull-ld2r.c &
419
420tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/1x8c2-minmax-rndnu-neon-mlal-ld2r.c &
421tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/2x8c2-minmax-rndnu-neon-mlal-ld2r.c &
422tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/3x8c2-minmax-rndnu-neon-mlal-ld2r.c &
423tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/4x8c2-minmax-rndnu-neon-mlal-ld2r.c &
424tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/1x16c2-minmax-rndnu-neon-mlal-ld2r.c &
425tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/2x16c2-minmax-rndnu-neon-mlal-ld2r.c &
426tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/3x16c2-minmax-rndnu-neon-mlal-ld2r.c &
427tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/4x16c2-minmax-rndnu-neon-mlal-ld2r.c &
428
429tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/1x8c2-minmax-fp32-neon-mlal-ld2r.c &
430tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/2x8c2-minmax-fp32-neon-mlal-ld2r.c &
431
432tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=LD2R -o src/qc8-igemm/gen/1x8c2-minmax-fp32-neon-mlal-ld2r.c &
433tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=LD2R -o src/qc8-igemm/gen/2x8c2-minmax-fp32-neon-mlal-ld2r.c &
434
435tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=LD2R -o src/qs8-igemm/gen/1x8c2-minmax-fp32-neonv8-mlal-ld2r.c &
436tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=LD2R -o src/qs8-igemm/gen/2x8c2-minmax-fp32-neonv8-mlal-ld2r.c &
437
438tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=LD2R -o src/qc8-igemm/gen/1x8c2-minmax-fp32-neonv8-mlal-ld2r.c &
439tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=LD2R -o src/qc8-igemm/gen/2x8c2-minmax-fp32-neonv8-mlal-ld2r.c &
Frank Barchard42f5c502021-11-16 10:04:21 -0800440
441### C2 LD4R micro-kernels
Frank Barchard15eec022021-11-17 13:26:20 -0800442tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/1x8c2-minmax-rndnu-neon-mull-ld4r.c &
443tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/2x8c2-minmax-rndnu-neon-mull-ld4r.c &
444tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/3x8c2-minmax-rndnu-neon-mull-ld4r.c &
445tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/4x8c2-minmax-rndnu-neon-mull-ld4r.c &
446tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/1x16c2-minmax-rndnu-neon-mull-ld4r.c &
447tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/2x16c2-minmax-rndnu-neon-mull-ld4r.c &
448tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/3x16c2-minmax-rndnu-neon-mull-ld4r.c &
449tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/4x16c2-minmax-rndnu-neon-mull-ld4r.c &
Frank Barchard42f5c502021-11-16 10:04:21 -0800450
Frank Barchard15eec022021-11-17 13:26:20 -0800451tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/1x8c2-minmax-rndnu-neon-mlal-ld4r.c &
452tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/2x8c2-minmax-rndnu-neon-mlal-ld4r.c &
453tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/3x8c2-minmax-rndnu-neon-mlal-ld4r.c &
454tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/4x8c2-minmax-rndnu-neon-mlal-ld4r.c &
455tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/1x16c2-minmax-rndnu-neon-mlal-ld4r.c &
456tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/2x16c2-minmax-rndnu-neon-mlal-ld4r.c &
457tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/3x16c2-minmax-rndnu-neon-mlal-ld4r.c &
458tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/4x16c2-minmax-rndnu-neon-mlal-ld4r.c &
Frank Barchard42f5c502021-11-16 10:04:21 -0800459
Frank Barchard15eec022021-11-17 13:26:20 -0800460tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/1x8c2-minmax-fp32-neon-mlal-ld4r.c &
461tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD4R -o src/qs8-igemm/gen/2x8c2-minmax-fp32-neon-mlal-ld4r.c &
Frank Barchard42f5c502021-11-16 10:04:21 -0800462
Frank Barchard15eec022021-11-17 13:26:20 -0800463tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=LD4R -o src/qc8-igemm/gen/1x8c2-minmax-fp32-neon-mlal-ld4r.c &
464tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=LD4R -o src/qc8-igemm/gen/2x8c2-minmax-fp32-neon-mlal-ld4r.c &
Frank Barchard42f5c502021-11-16 10:04:21 -0800465
Frank Barchard15eec022021-11-17 13:26:20 -0800466tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=LD4R -o src/qs8-igemm/gen/1x8c2-minmax-fp32-neonv8-mlal-ld4r.c &
467tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=LD4R -o src/qs8-igemm/gen/2x8c2-minmax-fp32-neonv8-mlal-ld4r.c &
Frank Barchard42f5c502021-11-16 10:04:21 -0800468
Frank Barchard15eec022021-11-17 13:26:20 -0800469tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=LD4R -o src/qc8-igemm/gen/1x8c2-minmax-fp32-neonv8-mlal-ld4r.c &
470tools/xngen src/qs8-igemm/c2-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=LD4R -o src/qc8-igemm/gen/2x8c2-minmax-fp32-neonv8-mlal-ld4r.c &
Marat Dukhane903dff2021-07-16 19:43:41 -0700471
Frank Barchardc7a032d2021-11-10 12:37:49 -0800472### C2S4 micro-kernels
Frank Barcharde22685a2021-11-12 11:36:58 -0800473tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x8c2s4-minmax-rndnu-neon-mull.c &
474tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x8c2s4-minmax-rndnu-neon-mull.c &
475tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=3 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x8c2s4-minmax-rndnu-neon-mull.c &
476tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=4 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x8c2s4-minmax-rndnu-neon-mull.c &
477tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=1 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x16c2s4-minmax-rndnu-neon-mull.c &
478tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=2 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x16c2s4-minmax-rndnu-neon-mull.c &
479tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=3 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x16c2s4-minmax-rndnu-neon-mull.c &
480tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=4 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x16c2s4-minmax-rndnu-neon-mull.c &
Frank Barchardc7a032d2021-11-10 12:37:49 -0800481
Frank Barcharde22685a2021-11-12 11:36:58 -0800482tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x8c2s4-minmax-rndnu-neon-mlal.c &
483tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x8c2s4-minmax-rndnu-neon-mlal.c &
484tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=3 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x8c2s4-minmax-rndnu-neon-mlal.c &
485tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=4 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x8c2s4-minmax-rndnu-neon-mlal.c &
486tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=1 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x16c2s4-minmax-rndnu-neon-mlal.c &
487tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=2 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x16c2s4-minmax-rndnu-neon-mlal.c &
488tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=3 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x16c2s4-minmax-rndnu-neon-mlal.c &
489tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=4 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x16c2s4-minmax-rndnu-neon-mlal.c &
Frank Barchardc7a032d2021-11-10 12:37:49 -0800490
Frank Barcharde22685a2021-11-12 11:36:58 -0800491tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x8c2s4-minmax-fp32-neon-mlal.c &
492tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x8c2s4-minmax-fp32-neon-mlal.c &
Frank Barchardc7a032d2021-11-10 12:37:49 -0800493
Frank Barcharde22685a2021-11-12 11:36:58 -0800494tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -o src/qc8-igemm/gen/1x8c2s4-minmax-fp32-neon-mlal.c &
495tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -o src/qc8-igemm/gen/2x8c2s4-minmax-fp32-neon-mlal.c &
Frank Barchardc7a032d2021-11-10 12:37:49 -0800496
Frank Barcharde22685a2021-11-12 11:36:58 -0800497tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -o src/qs8-igemm/gen/1x8c2s4-minmax-fp32-neonv8-mlal.c &
498tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -o src/qs8-igemm/gen/2x8c2s4-minmax-fp32-neonv8-mlal.c &
Frank Barchardc7a032d2021-11-10 12:37:49 -0800499
Frank Barcharde22685a2021-11-12 11:36:58 -0800500tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -o src/qc8-igemm/gen/1x8c2s4-minmax-fp32-neonv8-mlal.c &
501tools/xngen src/qs8-igemm/c2-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -o src/qc8-igemm/gen/2x8c2s4-minmax-fp32-neonv8-mlal.c &
Frank Barchardc7a032d2021-11-10 12:37:49 -0800502
Frank Barchard287952a2021-11-03 15:26:45 -0700503### C4 micro-kernels
Frank Barchard64ab1b72021-11-22 10:57:40 -0800504tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/1x8c4-minmax-rndnu-neon-mull-dup.c &
505tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/2x8c4-minmax-rndnu-neon-mull-dup.c &
506tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/3x8c4-minmax-rndnu-neon-mull-dup.c &
507tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/4x8c4-minmax-rndnu-neon-mull-dup.c &
508tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/1x16c4-minmax-rndnu-neon-mull-dup.c &
509tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/2x16c4-minmax-rndnu-neon-mull-dup.c &
510tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/3x16c4-minmax-rndnu-neon-mull-dup.c &
511tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/4x16c4-minmax-rndnu-neon-mull-dup.c &
Frank Barchard287952a2021-11-03 15:26:45 -0700512
Frank Barchard64ab1b72021-11-22 10:57:40 -0800513tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/1x8c4-minmax-rndnu-neon-mlal-dup.c &
514tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/2x8c4-minmax-rndnu-neon-mlal-dup.c &
515tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/3x8c4-minmax-rndnu-neon-mlal-dup.c &
516tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/4x8c4-minmax-rndnu-neon-mlal-dup.c &
517tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/1x16c4-minmax-rndnu-neon-mlal-dup.c &
518tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/2x16c4-minmax-rndnu-neon-mlal-dup.c &
519tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/3x16c4-minmax-rndnu-neon-mlal-dup.c &
520tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/4x16c4-minmax-rndnu-neon-mlal-dup.c &
Frank Barchard287952a2021-11-03 15:26:45 -0700521
Frank Barchard64ab1b72021-11-22 10:57:40 -0800522tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/1x8c4-minmax-fp32-neon-mlal-dup.c &
523tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=DUP -o src/qs8-igemm/gen/2x8c4-minmax-fp32-neon-mlal-dup.c &
Frank Barchard287952a2021-11-03 15:26:45 -0700524
Frank Barchard64ab1b72021-11-22 10:57:40 -0800525tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=DUP -o src/qc8-igemm/gen/1x8c4-minmax-fp32-neon-mlal-dup.c &
526tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=DUP -o src/qc8-igemm/gen/2x8c4-minmax-fp32-neon-mlal-dup.c &
Frank Barchard287952a2021-11-03 15:26:45 -0700527
Frank Barchard64ab1b72021-11-22 10:57:40 -0800528tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=DUP -o src/qs8-igemm/gen/1x8c4-minmax-fp32-neonv8-mlal-dup.c &
529tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=DUP -o src/qs8-igemm/gen/2x8c4-minmax-fp32-neonv8-mlal-dup.c &
Frank Barchard287952a2021-11-03 15:26:45 -0700530
Frank Barchard64ab1b72021-11-22 10:57:40 -0800531tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=DUP -o src/qc8-igemm/gen/1x8c4-minmax-fp32-neonv8-mlal-dup.c &
532tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=DUP -o src/qc8-igemm/gen/2x8c4-minmax-fp32-neonv8-mlal-dup.c &
533
534### C4 LD1R micro-kernels
535tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/1x8c4-minmax-rndnu-neon-mull-ld1r.c &
536tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/2x8c4-minmax-rndnu-neon-mull-ld1r.c &
537tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/3x8c4-minmax-rndnu-neon-mull-ld1r.c &
538tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/4x8c4-minmax-rndnu-neon-mull-ld1r.c &
539tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/1x16c4-minmax-rndnu-neon-mull-ld1r.c &
540tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/2x16c4-minmax-rndnu-neon-mull-ld1r.c &
541tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/3x16c4-minmax-rndnu-neon-mull-ld1r.c &
542tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/4x16c4-minmax-rndnu-neon-mull-ld1r.c &
543
544tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/1x8c4-minmax-rndnu-neon-mlal-ld1r.c &
545tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/2x8c4-minmax-rndnu-neon-mlal-ld1r.c &
546tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/3x8c4-minmax-rndnu-neon-mlal-ld1r.c &
547tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/4x8c4-minmax-rndnu-neon-mlal-ld1r.c &
548tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/1x16c4-minmax-rndnu-neon-mlal-ld1r.c &
549tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/2x16c4-minmax-rndnu-neon-mlal-ld1r.c &
550tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/3x16c4-minmax-rndnu-neon-mlal-ld1r.c &
551tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/4x16c4-minmax-rndnu-neon-mlal-ld1r.c &
552
553tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/1x8c4-minmax-fp32-neon-mlal-ld1r.c &
554tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD1R -o src/qs8-igemm/gen/2x8c4-minmax-fp32-neon-mlal-ld1r.c &
555
556tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=LD1R -o src/qc8-igemm/gen/1x8c4-minmax-fp32-neon-mlal-ld1r.c &
557tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=LD1R -o src/qc8-igemm/gen/2x8c4-minmax-fp32-neon-mlal-ld1r.c &
558
559tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=LD1R -o src/qs8-igemm/gen/1x8c4-minmax-fp32-neonv8-mlal-ld1r.c &
560tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=LD1R -o src/qs8-igemm/gen/2x8c4-minmax-fp32-neonv8-mlal-ld1r.c &
561
562tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=LD1R -o src/qc8-igemm/gen/1x8c4-minmax-fp32-neonv8-mlal-ld1r.c &
563tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=LD1R -o src/qc8-igemm/gen/2x8c4-minmax-fp32-neonv8-mlal-ld1r.c &
564
565### C4 LD2R micro-kernels
566tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/1x8c4-minmax-rndnu-neon-mull-ld2r.c &
567tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/2x8c4-minmax-rndnu-neon-mull-ld2r.c &
568tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/3x8c4-minmax-rndnu-neon-mull-ld2r.c &
569tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/4x8c4-minmax-rndnu-neon-mull-ld2r.c &
570tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/1x16c4-minmax-rndnu-neon-mull-ld2r.c &
571tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/2x16c4-minmax-rndnu-neon-mull-ld2r.c &
572tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/3x16c4-minmax-rndnu-neon-mull-ld2r.c &
573tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/4x16c4-minmax-rndnu-neon-mull-ld2r.c &
574
575tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/1x8c4-minmax-rndnu-neon-mlal-ld2r.c &
576tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/2x8c4-minmax-rndnu-neon-mlal-ld2r.c &
577tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/3x8c4-minmax-rndnu-neon-mlal-ld2r.c &
578tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/4x8c4-minmax-rndnu-neon-mlal-ld2r.c &
579tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/1x16c4-minmax-rndnu-neon-mlal-ld2r.c &
580tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/2x16c4-minmax-rndnu-neon-mlal-ld2r.c &
581tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=3 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/3x16c4-minmax-rndnu-neon-mlal-ld2r.c &
582tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=4 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/4x16c4-minmax-rndnu-neon-mlal-ld2r.c &
583
584tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/1x8c4-minmax-fp32-neon-mlal-ld2r.c &
585tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -D DUP=LD2R -o src/qs8-igemm/gen/2x8c4-minmax-fp32-neon-mlal-ld2r.c &
586
587tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=LD2R -o src/qc8-igemm/gen/1x8c4-minmax-fp32-neon-mlal-ld2r.c &
588tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -D DUP=LD2R -o src/qc8-igemm/gen/2x8c4-minmax-fp32-neon-mlal-ld2r.c &
589
590tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=LD2R -o src/qs8-igemm/gen/1x8c4-minmax-fp32-neonv8-mlal-ld2r.c &
591tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -D DUP=LD2R -o src/qs8-igemm/gen/2x8c4-minmax-fp32-neonv8-mlal-ld2r.c &
592
593tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=LD2R -o src/qc8-igemm/gen/1x8c4-minmax-fp32-neonv8-mlal-ld2r.c &
594tools/xngen src/qs8-igemm/c4-neon-mull-dup.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -D DUP=LD2R -o src/qc8-igemm/gen/2x8c4-minmax-fp32-neonv8-mlal-ld2r.c &
Frank Barchardeb704f72021-11-12 01:26:50 -0800595
596### C4S2 micro-kernels
Frank Barcharde22685a2021-11-12 11:36:58 -0800597tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x8c4s2-minmax-rndnu-neon-mull.c &
598tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x8c4s2-minmax-rndnu-neon-mull.c &
599tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=3 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x8c4s2-minmax-rndnu-neon-mull.c &
600tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=4 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x8c4s2-minmax-rndnu-neon-mull.c &
601tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=1 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x16c4s2-minmax-rndnu-neon-mull.c &
602tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=2 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x16c4s2-minmax-rndnu-neon-mull.c &
603tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=3 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x16c4s2-minmax-rndnu-neon-mull.c &
604tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=4 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x16c4s2-minmax-rndnu-neon-mull.c &
Frank Barchardeb704f72021-11-12 01:26:50 -0800605
Frank Barcharde22685a2021-11-12 11:36:58 -0800606tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x8c4s2-minmax-rndnu-neon-mlal.c &
607tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x8c4s2-minmax-rndnu-neon-mlal.c &
608tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=3 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x8c4s2-minmax-rndnu-neon-mlal.c &
609tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=4 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x8c4s2-minmax-rndnu-neon-mlal.c &
610tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=1 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x16c4s2-minmax-rndnu-neon-mlal.c &
611tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=2 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x16c4s2-minmax-rndnu-neon-mlal.c &
612tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=3 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x16c4s2-minmax-rndnu-neon-mlal.c &
613tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=4 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x16c4s2-minmax-rndnu-neon-mlal.c &
Frank Barchardeb704f72021-11-12 01:26:50 -0800614
Frank Barcharde22685a2021-11-12 11:36:58 -0800615tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x8c4s2-minmax-fp32-neon-mlal.c &
616tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x8c4s2-minmax-fp32-neon-mlal.c &
Frank Barchardeb704f72021-11-12 01:26:50 -0800617
Frank Barcharde22685a2021-11-12 11:36:58 -0800618tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -o src/qc8-igemm/gen/1x8c4s2-minmax-fp32-neon-mlal.c &
619tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -o src/qc8-igemm/gen/2x8c4s2-minmax-fp32-neon-mlal.c &
Frank Barchardeb704f72021-11-12 01:26:50 -0800620
Frank Barcharde22685a2021-11-12 11:36:58 -0800621tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -o src/qs8-igemm/gen/1x8c4s2-minmax-fp32-neonv8-mlal.c &
622tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -o src/qs8-igemm/gen/2x8c4s2-minmax-fp32-neonv8-mlal.c &
Frank Barchardeb704f72021-11-12 01:26:50 -0800623
Frank Barcharde22685a2021-11-12 11:36:58 -0800624tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -o src/qc8-igemm/gen/1x8c4s2-minmax-fp32-neonv8-mlal.c &
625tools/xngen src/qs8-igemm/c4-neon-mull-shuffle.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -o src/qc8-igemm/gen/2x8c4s2-minmax-fp32-neonv8-mlal.c &
Frank Barchard287952a2021-11-03 15:26:45 -0700626
Frank Barchardd79391d2021-02-15 14:22:32 -0800627### C8 micro-kernels
Marat Dukhan89991902021-12-06 00:54:36 -0800628tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=1 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x8c8-minmax-rndnu-neon-mull.c &
629tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=2 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x8c8-minmax-rndnu-neon-mull.c &
630tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=3 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x8c8-minmax-rndnu-neon-mull.c &
631tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=4 -D NR=8 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x8c8-minmax-rndnu-neon-mull.c &
632tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=1 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x16c8-minmax-rndnu-neon-mull.c &
633tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=2 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x16c8-minmax-rndnu-neon-mull.c &
634tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=3 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x16c8-minmax-rndnu-neon-mull.c &
635tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=4 -D NR=16 -D MLA=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x16c8-minmax-rndnu-neon-mull.c &
Frank Barchardda78da12021-03-02 14:28:00 -0800636
Marat Dukhan89991902021-12-06 00:54:36 -0800637tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x8c8-minmax-fp32-neon-mlal.c &
638tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x8c8-minmax-fp32-neon-mlal.c &
Marat Dukhancf055852021-06-26 09:05:09 -0700639
Marat Dukhan89991902021-12-06 00:54:36 -0800640tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -o src/qc8-igemm/gen/1x8c8-minmax-fp32-neon-mlal.c &
641tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=0 -o src/qc8-igemm/gen/2x8c8-minmax-fp32-neon-mlal.c &
Marat Dukhane76478b2021-06-28 16:35:40 -0700642
Marat Dukhan89991902021-12-06 00:54:36 -0800643tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -o src/qs8-igemm/gen/1x8c8-minmax-fp32-neonv8-mlal.c &
644tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D ARMV8=1 -o src/qs8-igemm/gen/2x8c8-minmax-fp32-neonv8-mlal.c &
Marat Dukhane76478b2021-06-28 16:35:40 -0700645
Marat Dukhan89991902021-12-06 00:54:36 -0800646tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -o src/qc8-igemm/gen/1x8c8-minmax-fp32-neonv8-mlal.c &
647tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D ARMV8=1 -o src/qc8-igemm/gen/2x8c8-minmax-fp32-neonv8-mlal.c &
Frank Barchardd79391d2021-02-15 14:22:32 -0800648
Marat Dukhan89991902021-12-06 00:54:36 -0800649tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=1 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x8c8-minmax-rndnu-neon-mlal.c &
650tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=2 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x8c8-minmax-rndnu-neon-mlal.c &
651tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=3 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x8c8-minmax-rndnu-neon-mlal.c &
652tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=4 -D NR=8 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x8c8-minmax-rndnu-neon-mlal.c &
653tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=1 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/1x16c8-minmax-rndnu-neon-mlal.c &
654tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=2 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/2x16c8-minmax-rndnu-neon-mlal.c &
655tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=3 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/3x16c8-minmax-rndnu-neon-mlal.c &
656tools/xngen src/qs8-igemm/c8-neon-mull.c.in -D MR=4 -D NR=16 -D MLA=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D ARMV8=0 -o src/qs8-igemm/gen/4x16c8-minmax-rndnu-neon-mlal.c &
Marat Dukhane903dff2021-07-16 19:43:41 -0700657
Frank Barchard36f95cf2021-02-23 03:12:52 -0800658### C16 micro-kernels
Marat Dukhan89991902021-12-06 00:54:36 -0800659tools/xngen src/qs8-igemm/c16-neon-mlal.c.in -D MR=1 -D NR=8 -D REQUANTIZATION=RNDNU -o src/qs8-igemm/gen/1x8c16-minmax-rndnu-neon-mlal.c &
660tools/xngen src/qs8-igemm/c16-neon-mlal.c.in -D MR=2 -D NR=8 -D REQUANTIZATION=RNDNU -o src/qs8-igemm/gen/2x8c16-minmax-rndnu-neon-mlal.c &
661tools/xngen src/qs8-igemm/c16-neon-mlal.c.in -D MR=3 -D NR=8 -D REQUANTIZATION=RNDNU -o src/qs8-igemm/gen/3x8c16-minmax-rndnu-neon-mlal.c &
662tools/xngen src/qs8-igemm/c16-neon-mlal.c.in -D MR=4 -D NR=8 -D REQUANTIZATION=RNDNU -o src/qs8-igemm/gen/4x8c16-minmax-rndnu-neon-mlal.c &
663tools/xngen src/qs8-igemm/c16-neon-mlal.c.in -D MR=1 -D NR=16 -D REQUANTIZATION=RNDNU -o src/qs8-igemm/gen/1x16c16-minmax-rndnu-neon-mlal.c &
664tools/xngen src/qs8-igemm/c16-neon-mlal.c.in -D MR=2 -D NR=16 -D REQUANTIZATION=RNDNU -o src/qs8-igemm/gen/2x16c16-minmax-rndnu-neon-mlal.c &
665tools/xngen src/qs8-igemm/c16-neon-mlal.c.in -D MR=3 -D NR=16 -D REQUANTIZATION=RNDNU -o src/qs8-igemm/gen/3x16c16-minmax-rndnu-neon-mlal.c &
666tools/xngen src/qs8-igemm/c16-neon-mlal.c.in -D MR=4 -D NR=16 -D REQUANTIZATION=RNDNU -o src/qs8-igemm/gen/4x16c16-minmax-rndnu-neon-mlal.c &
Frank Barchard36f95cf2021-02-23 03:12:52 -0800667
Benoit Jacoba05487f2020-08-14 13:37:21 -0700668### C4 micro-kernels
Frank Barchardaae722a2021-08-30 12:37:30 -0700669tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=1 -D NR=8 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c4-minmax-fp32-neondot.c &
Marat Dukhane76478b2021-06-28 16:35:40 -0700670
Frank Barchardaae722a2021-08-30 12:37:30 -0700671tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=1 -D NR=8 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/1x8c4-minmax-fp32-neondot.c &
672tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=4 -D NR=8 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/4x8c4-minmax-fp32-neondot.c &
673tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=6 -D NR=8 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/6x8c4-minmax-fp32-neondot.c &
674tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=8 -D NR=8 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/8x8c4-minmax-fp32-neondot.c &
675tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=1 -D NR=16 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/1x16c4-minmax-fp32-neondot.c &
676tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=4 -D NR=16 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/4x16c4-minmax-fp32-neondot.c &
677tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=6 -D NR=16 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/6x16c4-minmax-fp32-neondot.c &
678tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=8 -D NR=16 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/8x16c4-minmax-fp32-neondot.c &
Marat Dukhan66ccf642020-09-28 16:23:42 -0700679
Marat Dukhane903dff2021-07-16 19:43:41 -0700680
Frank Barchardaae722a2021-08-30 12:37:30 -0700681tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=1 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c4-minmax-rndnu-neondot.c &
682tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=4 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x8c4-minmax-rndnu-neondot.c &
683tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=6 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/6x8c4-minmax-rndnu-neondot.c &
684tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=8 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/8x8c4-minmax-rndnu-neondot.c &
685tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=1 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x16c4-minmax-rndnu-neondot.c &
686tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=4 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x16c4-minmax-rndnu-neondot.c &
687tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=6 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/6x16c4-minmax-rndnu-neondot.c &
688tools/xngen src/qs8-igemm/c4-neondot.c.in -D MR=8 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/8x16c4-minmax-rndnu-neondot.c &
Frank Barchard4a352042021-04-13 15:52:08 -0700689
Frank Barchardaae722a2021-08-30 12:37:30 -0700690tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=1 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/1x8c4-minmax-rndnu-neondot.c &
691tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=2 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/2x8c4-minmax-rndnu-neondot.c &
692tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=3 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/3x8c4-minmax-rndnu-neondot.c &
693tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=4 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/4x8c4-minmax-rndnu-neondot.c &
694tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=5 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/5x8c4-minmax-rndnu-neondot.c &
695tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=6 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/6x8c4-minmax-rndnu-neondot.c &
696tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=8 -D NR=8 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/8x8c4-minmax-rndnu-neondot.c &
697tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=1 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/1x16c4-minmax-rndnu-neondot.c &
698tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=2 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/2x16c4-minmax-rndnu-neondot.c &
699tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=3 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/3x16c4-minmax-rndnu-neondot.c &
700tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=4 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/4x16c4-minmax-rndnu-neondot.c &
701tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=5 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/5x16c4-minmax-rndnu-neondot.c &
702tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=6 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/6x16c4-minmax-rndnu-neondot.c &
703tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=8 -D NR=16 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/8x16c4-minmax-rndnu-neondot.c &
Frank Barchardcdf59a52021-09-08 13:55:24 -0700704tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=1 -D NR=32 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/1x32c4-minmax-rndnu-neondot.c &
705tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=2 -D NR=32 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/2x32c4-minmax-rndnu-neondot.c &
706tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=3 -D NR=32 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qu8-igemm/gen/3x32c4-minmax-rndnu-neondot.c &
Frank Barchard88e839c2021-08-11 00:12:31 -0700707
Digant Desai9982ed32021-11-24 13:03:54 -0800708tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=1 -D NR=16 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qu8-igemm/gen/1x16c4-minmax-fp32-neondot.c &
709tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=2 -D NR=16 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qu8-igemm/gen/2x16c4-minmax-fp32-neondot.c &
710tools/xngen src/qu8-igemm/c4-neondot.c.in -D MR=4 -D NR=16 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qu8-igemm/gen/4x16c4-minmax-fp32-neondot.c &
711
Frank Barchard48410212021-12-20 17:14:00 -0800712############################### AArch32 assembly ##############################
Frank Barcharde48b5c12021-12-21 07:22:45 -0800713### Cortex-A53 lane micro-kernels
Frank Barchard901845c2022-01-19 01:45:22 -0800714tools/xngen src/qs8-igemm/4x8-aarch32-neon-mlal-lane-ld64.S.in -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/4x8-minmax-rndnu-aarch32-neon-mlal-lane-ld64.S &
715tools/xngen src/qs8-igemm/4x8-aarch32-neon-mlal-lane-ld64.S.in -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QS8 -D ARMV8=0 -o src/qs8-igemm/gen/4x8-minmax-rndnu-aarch32-neon-mlal-lane-prfm-ld64.S &
Frank Barchard87fe4102021-12-28 14:42:23 -0800716
Frank Barchard901845c2022-01-19 01:45:22 -0800717tools/xngen src/qs8-igemm/4x8-aarch32-neon-mlal-lane-ld64.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/4x8-minmax-fp32-aarch32-neon-mlal-lane-ld64.S &
718tools/xngen src/qs8-igemm/4x8-aarch32-neon-mlal-lane-ld64.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D DATATYPE=QC8 -D ARMV8=0 -o src/qc8-igemm/gen/4x8-minmax-fp32-aarch32-neon-mlal-lane-prfm-ld64.S &
Frank Barchard5e1a3032022-01-14 13:12:41 -0800719
Frank Barchard901845c2022-01-19 01:45:22 -0800720tools/xngen src/qs8-igemm/4x8-aarch32-neon-mlal-lane-ld64.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/4x8-minmax-fp32-aarch32-neonv8-mlal-lane-ld64.S &
721tools/xngen src/qs8-igemm/4x8-aarch32-neon-mlal-lane-ld64.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D DATATYPE=QC8 -D ARMV8=1 -o src/qc8-igemm/gen/4x8-minmax-fp32-aarch32-neonv8-mlal-lane-prfm-ld64.S &
722
723### QU8 micro-kernels
724tools/xngen src/qs8-igemm/4x8-aarch32-neon-mlal-lane-ld64.S.in -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QU8 -D ARMV8=0 -o src/qu8-igemm/gen/4x8-minmax-rndnu-aarch32-neon-mlal-lane-ld64.S &
725tools/xngen src/qs8-igemm/4x8-aarch32-neon-mlal-lane-ld64.S.in -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QU8 -D ARMV8=0 -o src/qu8-igemm/gen/4x8-minmax-rndnu-aarch32-neon-mlal-lane-prfm-ld64.S &
Frank Barcharde48b5c12021-12-21 07:22:45 -0800726
Frank Barchard48410212021-12-20 17:14:00 -0800727### C4 micro-kernels
Frank Barchard870108c2022-01-26 11:21:46 -0800728tools/xngen src/qs8-igemm/4x8c4-aarch32-neondot-ld64.S.in -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x8c4-minmax-rndnu-aarch32-neondot-ld64.S &
729tools/xngen src/qs8-igemm/4x8c4-aarch32-neondot-ld64.S.in -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D DATATYPE=QC8 -o src/qc8-igemm/gen/4x8c4-minmax-fp32-aarch32-neondot-ld64.S &
730tools/xngen src/qs8-igemm/4x8c4-aarch32-neondot-cortex-a55.S.in -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x8c4-minmax-rndnu-aarch32-neondot-cortex-a55.S &
731tools/xngen src/qs8-igemm/4x8c4-aarch32-neondot-cortex-a55.S.in -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D DATATYPE=QC8 -o src/qc8-igemm/gen/4x8c4-minmax-fp32-aarch32-neondot-cortex-a55.S &
Frank Barchard48410212021-12-20 17:14:00 -0800732
Frank Barchard4a352042021-04-13 15:52:08 -0700733############################### AArch64 assembly ##############################
Frank Barchard5cffb642021-11-22 13:59:43 -0800734### Cortex-A53 lane micro-kernels
Frank Barchard901845c2022-01-19 01:45:22 -0800735tools/xngen src/qs8-igemm/4x8-aarch64-neon-mlal-lane-ld64.S.in -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x8-minmax-rndnu-aarch64-neon-mlal-lane-ld64.S &
736tools/xngen src/qs8-igemm/4x8-aarch64-neon-mlal-lane-ld64.S.in -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x8-minmax-rndnu-aarch64-neon-mlal-lane-prfm-ld64.S &
Frank Barchard914f57b2021-12-13 12:31:42 -0800737
Frank Barchard901845c2022-01-19 01:45:22 -0800738tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-cortex-a53.S.in -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x16-minmax-rndnu-aarch64-neon-mlal-lane-cortex-a53.S &
739tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-cortex-a53.S.in -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x16-minmax-rndnu-aarch64-neon-mlal-lane-prfm-cortex-a53.S &
Frank Barchard13db60f2021-07-20 14:34:35 -0700740
Frank Barchard901845c2022-01-19 01:45:22 -0800741tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-cortex-a53.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x16-minmax-fp32-aarch64-neon-mlal-lane-cortex-a53.S &
742tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-cortex-a53.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x16-minmax-fp32-aarch64-neon-mlal-lane-prfm-cortex-a53.S &
Frank Barchard98af05c2021-06-30 12:15:04 -0700743
Frank Barchard901845c2022-01-19 01:45:22 -0800744tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-cortex-a53.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D DATATYPE=QC8 -o src/qc8-igemm/gen/4x16-minmax-fp32-aarch64-neon-mlal-lane-cortex-a53.S &
745tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-cortex-a53.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D DATATYPE=QC8 -o src/qc8-igemm/gen/4x16-minmax-fp32-aarch64-neon-mlal-lane-prfm-cortex-a53.S &
Frank Barchard59ed1da2021-08-02 11:34:59 -0700746
Frank Barchard901845c2022-01-19 01:45:22 -0800747tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-ld64.S.in -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x16-minmax-rndnu-aarch64-neon-mlal-lane-ld64.S &
748tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-ld64.S.in -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x16-minmax-rndnu-aarch64-neon-mlal-lane-prfm-ld64.S &
Frank Barchard5cffb642021-11-22 13:59:43 -0800749
Frank Barchard901845c2022-01-19 01:45:22 -0800750tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-ld64.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x16-minmax-fp32-aarch64-neon-mlal-lane-ld64.S &
751tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-ld64.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -D DATATYPE=QS8 -o src/qs8-igemm/gen/4x16-minmax-fp32-aarch64-neon-mlal-lane-prfm-ld64.S &
Frank Barchard5cffb642021-11-22 13:59:43 -0800752
Frank Barchard901845c2022-01-19 01:45:22 -0800753tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-ld64.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D DATATYPE=QC8 -o src/qc8-igemm/gen/4x16-minmax-fp32-aarch64-neon-mlal-lane-ld64.S &
754tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-ld64.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -D DATATYPE=QC8 -o src/qc8-igemm/gen/4x16-minmax-fp32-aarch64-neon-mlal-lane-prfm-ld64.S &
Frank Barchard5cffb642021-11-22 13:59:43 -0800755
756### QU8 micro-kernels
Frank Barchard901845c2022-01-19 01:45:22 -0800757tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-cortex-a53.S.in -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QU8 -o src/qu8-igemm/gen/4x16-minmax-rndnu-aarch64-neon-mlal-lane-cortex-a53.S &
758tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-cortex-a53.S.in -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QU8 -o src/qu8-igemm/gen/4x16-minmax-rndnu-aarch64-neon-mlal-lane-prfm-cortex-a53.S &
Frank Barchardd68e1142021-04-26 15:15:08 -0700759
Frank Barchard901845c2022-01-19 01:45:22 -0800760tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-ld64.S.in -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QU8 -o src/qu8-igemm/gen/4x16-minmax-rndnu-aarch64-neon-mlal-lane-ld64.S &
761tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-ld64.S.in -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QU8 -o src/qu8-igemm/gen/4x16-minmax-rndnu-aarch64-neon-mlal-lane-prfm-ld64.S &
Frank Barchard9cdc10d2021-11-22 19:03:54 -0800762
Frank Barchard901845c2022-01-19 01:45:22 -0800763tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-cortex-a75.S.in -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QU8 -o src/qu8-igemm/gen/4x16-minmax-rndnu-aarch64-neon-mlal-lane-cortex-a75.S &
764tools/xngen src/qs8-igemm/4x16-aarch64-neon-mlal-lane-cortex-a75.S.in -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -D DATATYPE=QU8 -o src/qu8-igemm/gen/4x16-minmax-rndnu-aarch64-neon-mlal-lane-prfm-cortex-a75.S &
Frank Barchard5cffb642021-11-22 13:59:43 -0800765
Frank Barchard1a0b2762021-06-29 18:37:59 -0700766### C4 micro-kernels
Frank Barchardaae722a2021-08-30 12:37:30 -0700767tools/xngen src/qs8-igemm/4x16c4-aarch64-neondot-cortex-a55.S.in -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x16c4-minmax-rndnu-aarch64-neondot-cortex-a55.S &
768tools/xngen src/qs8-igemm/4x16c4-aarch64-neondot-ld64.S.in -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x16c4-minmax-rndnu-aarch64-neondot-ld64.S &
769tools/xngen src/qs8-igemm/4x16c4-aarch64-neondot-ld128.S.in -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x16c4-minmax-rndnu-aarch64-neondot-ld128.S &
Frank Barchard60729d02021-07-20 12:25:09 -0700770
Frank Barchardaae722a2021-08-30 12:37:30 -0700771tools/xngen src/qs8-igemm/4x16c4-aarch64-neondot-cortex-a55.S.in -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x16c4-minmax-fp32-aarch64-neondot-cortex-a55.S &
772tools/xngen src/qs8-igemm/4x16c4-aarch64-neondot-ld64.S.in -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x16c4-minmax-fp32-aarch64-neondot-ld64.S &
773tools/xngen src/qs8-igemm/4x16c4-aarch64-neondot-ld128.S.in -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/4x16c4-minmax-fp32-aarch64-neondot-ld128.S &
Frank Barchardf10af6c2021-06-30 12:42:29 -0700774
Frank Barchardaae722a2021-08-30 12:37:30 -0700775tools/xngen src/qs8-igemm/4x16c4-aarch64-neondot-cortex-a55.S.in -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/4x16c4-minmax-fp32-aarch64-neondot-cortex-a55.S &
776tools/xngen src/qs8-igemm/4x16c4-aarch64-neondot-ld64.S.in -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/4x16c4-minmax-fp32-aarch64-neondot-ld64.S &
777tools/xngen src/qs8-igemm/4x16c4-aarch64-neondot-ld128.S.in -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/4x16c4-minmax-fp32-aarch64-neondot-ld128.S &
Frank Barchard4a352042021-04-13 15:52:08 -0700778
Frank Barchardca4c68e2021-08-25 19:06:40 -0700779### C4 QU8 micro-kernels
Frank Barcharda49e41f2021-08-31 20:30:24 -0700780tools/xngen src/qu8-igemm/4x8c4-aarch64-neondot-cortex-a55.S.in -D REQUANTIZATION=RNDNU -o src/qu8-igemm/gen/4x8c4-minmax-rndnu-aarch64-neondot-cortex-a55.S &
Frank Barcharddf8e6042021-09-03 13:56:29 -0700781tools/xngen src/qu8-igemm/4x8c4-aarch64-neondot-ld128.S.in -D REQUANTIZATION=RNDNU -o src/qu8-igemm/gen/4x8c4-minmax-rndnu-aarch64-neondot-ld128.S &
Frank Barcharda49e41f2021-08-31 20:30:24 -0700782tools/xngen src/qu8-igemm/4x16c4-aarch64-neondot-cortex-a55.S.in -D REQUANTIZATION=RNDNU -o src/qu8-igemm/gen/4x16c4-minmax-rndnu-aarch64-neondot-cortex-a55.S &
783tools/xngen src/qu8-igemm/4x16c4-aarch64-neondot-ld128.S.in -D REQUANTIZATION=RNDNU -o src/qu8-igemm/gen/4x16c4-minmax-rndnu-aarch64-neondot-ld128.S &
Frank Barchard0049e892021-08-22 09:37:21 -0700784
Digant Desai10f9f622021-11-23 13:33:52 -0800785tools/xngen src/qu8-igemm/4x16c4-aarch64-neondot-cortex-a55.S.in -D REQUANTIZATION=FP32 -o src/qu8-igemm/gen/4x16c4-minmax-fp32-aarch64-neondot-cortex-a55.S &
Digant Desai2e2d1792021-11-24 11:06:37 -0800786tools/xngen src/qu8-igemm/4x16c4-aarch64-neondot-ld128.S.in -D REQUANTIZATION=FP32 -o src/qu8-igemm/gen/4x16c4-minmax-fp32-aarch64-neondot-ld128.S &
Digant Desai10f9f622021-11-23 13:33:52 -0800787
Frank Barchard1663c0c2021-07-01 11:20:06 -0700788### C8 / C16 micro-kernels
Frank Barcharde22685a2021-11-12 11:36:58 -0800789tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c8-minmax-rndnu-aarch64-neon-mlal-cortex-a53.S &
790tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c8-minmax-rndnu-aarch64-neon-mlal-prfm-cortex-a53.S &
791tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c8-minmax-rndnu-aarch64-neon-mlal-cortex-a53.S &
792tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c8-minmax-rndnu-aarch64-neon-mlal-prfm-cortex-a53.S &
793tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal.S.in -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c8-minmax-rndnu-aarch64-neon-mlal.S &
794tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal.S.in -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c8-minmax-rndnu-aarch64-neon-mlal-prfm.S &
795tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal.S.in -D PREFETCH=0 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c8-minmax-rndnu-aarch64-neon-mlal.S &
796tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal.S.in -D PREFETCH=1 -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c8-minmax-rndnu-aarch64-neon-mlal-prfm.S &
797tools/xngen src/qs8-igemm/2x8c16-aarch64-neon-mlal.S.in -D REQUANTIZATION=RNDNU -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c16-minmax-rndnu-aarch64-neon-mlal.S &
Frank Barchard13db60f2021-07-20 14:34:35 -0700798
Frank Barcharde22685a2021-11-12 11:36:58 -0800799tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c8-minmax-fp32-aarch64-neon-mlal-cortex-a53.S &
800tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c8-minmax-fp32-aarch64-neon-mlal-prfm-cortex-a53.S &
801tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c8-minmax-fp32-aarch64-neon-mlal-cortex-a53.S &
802tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c8-minmax-fp32-aarch64-neon-mlal-prfm-cortex-a53.S &
803tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c8-minmax-fp32-aarch64-neon-mlal.S &
804tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/1x8c8-minmax-fp32-aarch64-neon-mlal-prfm.S &
805tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c8-minmax-fp32-aarch64-neon-mlal.S &
806tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c8-minmax-fp32-aarch64-neon-mlal-prfm.S &
807tools/xngen src/qs8-igemm/2x8c16-aarch64-neon-mlal.S.in -D REQUANTIZATION=FP32 -D CHANNELWISE=0 -o src/qs8-igemm/gen/2x8c16-minmax-fp32-aarch64-neon-mlal.S &
Frank Barchard1663c0c2021-07-01 11:20:06 -0700808
Frank Barcharde22685a2021-11-12 11:36:58 -0800809tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/1x8c8-minmax-fp32-aarch64-neon-mlal-cortex-a53.S &
810tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/1x8c8-minmax-fp32-aarch64-neon-mlal-prfm-cortex-a53.S &
811tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/2x8c8-minmax-fp32-aarch64-neon-mlal-cortex-a53.S &
812tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal-cortex-a53.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/2x8c8-minmax-fp32-aarch64-neon-mlal-prfm-cortex-a53.S &
813tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/1x8c8-minmax-fp32-aarch64-neon-mlal.S &
814tools/xngen src/qs8-igemm/1x8c8-aarch64-neon-mlal.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/1x8c8-minmax-fp32-aarch64-neon-mlal-prfm.S &
815tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal.S.in -D PREFETCH=0 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/2x8c8-minmax-fp32-aarch64-neon-mlal.S &
816tools/xngen src/qs8-igemm/2x8c8-aarch64-neon-mlal.S.in -D PREFETCH=1 -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/2x8c8-minmax-fp32-aarch64-neon-mlal-prfm.S &
817tools/xngen src/qs8-igemm/2x8c16-aarch64-neon-mlal.S.in -D REQUANTIZATION=FP32 -D CHANNELWISE=1 -o src/qc8-igemm/gen/2x8c16-minmax-fp32-aarch64-neon-mlal.S &
Frank Barchard1663c0c2021-07-01 11:20:06 -0700818
819
Marat Dukhanf9480682020-07-31 14:50:24 -0700820################################### x86 SSE ###################################
821### C2 micro-kernels
Frank Barchardaae722a2021-08-30 12:37:30 -0700822tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/1x4c2-minmax-fp32-sse2-ld64.c &
823tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/2x4c2-minmax-fp32-sse2-ld64.c &
824tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/3x4c2-minmax-fp32-sse2-ld64.c &
825tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/4x4c2-minmax-fp32-sse2-ld64.c &
Marat Dukhanf9480682020-07-31 14:50:24 -0700826
Frank Barchardaae722a2021-08-30 12:37:30 -0700827tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/1x4c2-minmax-fp32-sse2-ld64.c &
828tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/2x4c2-minmax-fp32-sse2-ld64.c &
829tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/3x4c2-minmax-fp32-sse2-ld64.c &
830tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/4x4c2-minmax-fp32-sse2-ld64.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700831
Frank Barchardaae722a2021-08-30 12:37:30 -0700832tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/1x4c2-minmax-fp32-sse2-ld64.c &
833tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/2x4c2-minmax-fp32-sse2-ld64.c &
834tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/3x4c2-minmax-fp32-sse2-ld64.c &
835tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/4x4c2-minmax-fp32-sse2-ld64.c &
Marat Dukhandee732b2020-07-31 17:32:04 -0700836
Frank Barchardaae722a2021-08-30 12:37:30 -0700837tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/1x4c2-minmax-fp32-sse41-ld64.c &
838tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/2x4c2-minmax-fp32-sse41-ld64.c &
839tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/3x4c2-minmax-fp32-sse41-ld64.c &
840tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/4x4c2-minmax-fp32-sse41-ld64.c &
Marat Dukhana3c16332021-04-02 15:03:27 -0700841
Frank Barchardaae722a2021-08-30 12:37:30 -0700842tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/1x4c2-minmax-fp32-sse41-ld64.c &
843tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/2x4c2-minmax-fp32-sse41-ld64.c &
844tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/3x4c2-minmax-fp32-sse41-ld64.c &
845tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/4x4c2-minmax-fp32-sse41-ld64.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700846
Frank Barchardaae722a2021-08-30 12:37:30 -0700847tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/1x4c2-minmax-fp32-sse41-ld64.c &
848tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/2x4c2-minmax-fp32-sse41-ld64.c &
849tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/3x4c2-minmax-fp32-sse41-ld64.c &
850tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/4x4c2-minmax-fp32-sse41-ld64.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700851
Frank Barchardaae722a2021-08-30 12:37:30 -0700852tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/1x4c2-minmax-fp32-avx-ld64.c &
853tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/2x4c2-minmax-fp32-avx-ld64.c &
854tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/3x4c2-minmax-fp32-avx-ld64.c &
855tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/4x4c2-minmax-fp32-avx-ld64.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700856
Frank Barchardaae722a2021-08-30 12:37:30 -0700857tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/1x4c2-minmax-fp32-avx-ld64.c &
858tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/2x4c2-minmax-fp32-avx-ld64.c &
859tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/3x4c2-minmax-fp32-avx-ld64.c &
860tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/4x4c2-minmax-fp32-avx-ld64.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700861
Frank Barchardaae722a2021-08-30 12:37:30 -0700862tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/1x4c2-minmax-fp32-avx-ld64.c &
863tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/2x4c2-minmax-fp32-avx-ld64.c &
864tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/3x4c2-minmax-fp32-avx-ld64.c &
865tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/4x4c2-minmax-fp32-avx-ld64.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700866
Frank Barchardaae722a2021-08-30 12:37:30 -0700867tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/1x4c2-minmax-fp32-xop-ld64.c &
868tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/2x4c2-minmax-fp32-xop-ld64.c &
869tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/3x4c2-minmax-fp32-xop-ld64.c &
870tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/4x4c2-minmax-fp32-xop-ld64.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700871
Frank Barchardaae722a2021-08-30 12:37:30 -0700872tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/1x4c2-minmax-fp32-xop-ld64.c &
873tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/2x4c2-minmax-fp32-xop-ld64.c &
874tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/3x4c2-minmax-fp32-xop-ld64.c &
875tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/4x4c2-minmax-fp32-xop-ld64.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700876
Frank Barchardaae722a2021-08-30 12:37:30 -0700877tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/1x4c2-minmax-fp32-xop-ld64.c &
878tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/2x4c2-minmax-fp32-xop-ld64.c &
879tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/3x4c2-minmax-fp32-xop-ld64.c &
880tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/4x4c2-minmax-fp32-xop-ld64.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700881
Frank Barchardaae722a2021-08-30 12:37:30 -0700882tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/1x4c2-minmax-fp32-sse2-ld128.c &
883tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/2x4c2-minmax-fp32-sse2-ld128.c &
884tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/3x4c2-minmax-fp32-sse2-ld128.c &
885tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/4x4c2-minmax-fp32-sse2-ld128.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700886
Frank Barchardaae722a2021-08-30 12:37:30 -0700887tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/1x4c2-minmax-fp32-sse2-ld128.c &
888tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/2x4c2-minmax-fp32-sse2-ld128.c &
889tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/3x4c2-minmax-fp32-sse2-ld128.c &
890tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/4x4c2-minmax-fp32-sse2-ld128.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700891
Frank Barchardaae722a2021-08-30 12:37:30 -0700892tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/1x4c2-minmax-fp32-sse2-ld128.c &
893tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/2x4c2-minmax-fp32-sse2-ld128.c &
894tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/3x4c2-minmax-fp32-sse2-ld128.c &
895tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/4x4c2-minmax-fp32-sse2-ld128.c &
Marat Dukhanfc188ed2021-06-03 12:21:22 -0700896
Frank Barchardaae722a2021-08-30 12:37:30 -0700897tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/1x4c2-minmax-fp32-sse41-ld128.c &
898tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/2x4c2-minmax-fp32-sse41-ld128.c &
899tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/3x4c2-minmax-fp32-sse41-ld128.c &
900tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/4x4c2-minmax-fp32-sse41-ld128.c &
Marat Dukhanfc188ed2021-06-03 12:21:22 -0700901
Frank Barchardaae722a2021-08-30 12:37:30 -0700902tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/1x4c2-minmax-fp32-sse41-ld128.c &
903tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/2x4c2-minmax-fp32-sse41-ld128.c &
904tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/3x4c2-minmax-fp32-sse41-ld128.c &
905tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/4x4c2-minmax-fp32-sse41-ld128.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700906
Frank Barchardaae722a2021-08-30 12:37:30 -0700907tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/1x4c2-minmax-fp32-sse41-ld128.c &
908tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/2x4c2-minmax-fp32-sse41-ld128.c &
909tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/3x4c2-minmax-fp32-sse41-ld128.c &
910tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/4x4c2-minmax-fp32-sse41-ld128.c &
Marat Dukhanfc188ed2021-06-03 12:21:22 -0700911
Frank Barchardaae722a2021-08-30 12:37:30 -0700912tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/1x4c2-minmax-fp32-avx-ld128.c &
913tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/2x4c2-minmax-fp32-avx-ld128.c &
914tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/3x4c2-minmax-fp32-avx-ld128.c &
915tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/4x4c2-minmax-fp32-avx-ld128.c &
Marat Dukhanfc188ed2021-06-03 12:21:22 -0700916
Frank Barchardaae722a2021-08-30 12:37:30 -0700917tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/1x4c2-minmax-fp32-avx-ld128.c &
918tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/2x4c2-minmax-fp32-avx-ld128.c &
919tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/3x4c2-minmax-fp32-avx-ld128.c &
920tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/4x4c2-minmax-fp32-avx-ld128.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700921
Frank Barchardaae722a2021-08-30 12:37:30 -0700922tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/1x4c2-minmax-fp32-avx-ld128.c &
923tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/2x4c2-minmax-fp32-avx-ld128.c &
924tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/3x4c2-minmax-fp32-avx-ld128.c &
925tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/4x4c2-minmax-fp32-avx-ld128.c &
Marat Dukhanfc188ed2021-06-03 12:21:22 -0700926
Frank Barchardaae722a2021-08-30 12:37:30 -0700927tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/1x4c2-minmax-fp32-xop-ld128.c &
928tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/2x4c2-minmax-fp32-xop-ld128.c &
929tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/3x4c2-minmax-fp32-xop-ld128.c &
930tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/4x4c2-minmax-fp32-xop-ld128.c &
Marat Dukhan1566fee2020-08-02 21:55:41 -0700931
Frank Barchardaae722a2021-08-30 12:37:30 -0700932tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/1x4c2-minmax-fp32-xop-ld128.c &
933tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/2x4c2-minmax-fp32-xop-ld128.c &
934tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/3x4c2-minmax-fp32-xop-ld128.c &
935tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/4x4c2-minmax-fp32-xop-ld128.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700936
Frank Barchardaae722a2021-08-30 12:37:30 -0700937tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/1x4c2-minmax-fp32-xop-ld128.c &
938tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/2x4c2-minmax-fp32-xop-ld128.c &
939tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/3x4c2-minmax-fp32-xop-ld128.c &
940tools/xngen src/qs8-igemm/MRx4c2-sse.c.in -D MR=4 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/4x4c2-minmax-fp32-xop-ld128.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700941
Marat Dukhan07bd2522020-07-31 19:12:39 -0700942### C8 micro-kernels
Frank Barchardaae722a2021-08-30 12:37:30 -0700943tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-sse2-ld64.c &
944tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-sse2-ld64.c &
945tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-sse2-ld64.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700946
Frank Barchardaae722a2021-08-30 12:37:30 -0700947tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-sse2-ld64.c &
948tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-sse2-ld64.c &
949tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-sse2-ld64.c &
Marat Dukhan07bd2522020-07-31 19:12:39 -0700950
Frank Barchardaae722a2021-08-30 12:37:30 -0700951tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-sse2-ld64.c &
952tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-sse2-ld64.c &
953tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-sse2-ld64.c &
Marat Dukhan07bd2522020-07-31 19:12:39 -0700954
Frank Barchardaae722a2021-08-30 12:37:30 -0700955tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=3 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-ssse3-ld64.c &
956tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=3 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-ssse3-ld64.c &
957tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=3 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-ssse3-ld64.c &
Marat Dukhan07bd2522020-07-31 19:12:39 -0700958
Frank Barchardaae722a2021-08-30 12:37:30 -0700959tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-sse41-ld64.c &
960tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-sse41-ld64.c &
961tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-sse41-ld64.c &
Marat Dukhana3c16332021-04-02 15:03:27 -0700962
Frank Barchardaae722a2021-08-30 12:37:30 -0700963tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-sse41-ld64.c &
964tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-sse41-ld64.c &
965tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-sse41-ld64.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700966
Frank Barchardaae722a2021-08-30 12:37:30 -0700967tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-sse41-ld64.c &
968tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-sse41-ld64.c &
969tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-sse41-ld64.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700970
Frank Barchardaae722a2021-08-30 12:37:30 -0700971tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-avx-ld64.c &
972tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-avx-ld64.c &
973tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-avx-ld64.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700974
Frank Barchardaae722a2021-08-30 12:37:30 -0700975tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-avx-ld64.c &
976tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-avx-ld64.c &
977tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-avx-ld64.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700978
Frank Barchardaae722a2021-08-30 12:37:30 -0700979tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-avx-ld64.c &
980tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-avx-ld64.c &
981tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-avx-ld64.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700982
Frank Barchardaae722a2021-08-30 12:37:30 -0700983tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-xop-ld64.c &
984tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-xop-ld64.c &
985tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-xop-ld64.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700986
Frank Barchardaae722a2021-08-30 12:37:30 -0700987tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-xop-ld64.c &
988tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-xop-ld64.c &
989tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-xop-ld64.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -0700990
Frank Barchardaae722a2021-08-30 12:37:30 -0700991tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-xop-ld64.c &
992tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-xop-ld64.c &
993tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD64 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-xop-ld64.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700994
Frank Barchardaae722a2021-08-30 12:37:30 -0700995tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-sse2-ld128.c &
996tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-sse2-ld128.c &
997tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-sse2-ld128.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -0700998
Frank Barchardaae722a2021-08-30 12:37:30 -0700999tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-sse2-ld128.c &
1000tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-sse2-ld128.c &
1001tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-sse2-ld128.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -07001002
Frank Barchardaae722a2021-08-30 12:37:30 -07001003tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-sse2-ld128.c &
1004tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-sse2-ld128.c &
1005tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=2 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-sse2-ld128.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -07001006
Frank Barchardaae722a2021-08-30 12:37:30 -07001007tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=3 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-ssse3-ld128.c &
1008tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=3 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-ssse3-ld128.c &
1009tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=3 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-ssse3-ld128.c &
Marat Dukhanc46e6712021-06-01 19:00:16 -07001010
Frank Barchardaae722a2021-08-30 12:37:30 -07001011tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-sse41-ld128.c &
1012tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-sse41-ld128.c &
1013tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-sse41-ld128.c &
Marat Dukhanfc188ed2021-06-03 12:21:22 -07001014
Frank Barchardaae722a2021-08-30 12:37:30 -07001015tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-sse41-ld128.c &
1016tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-sse41-ld128.c &
1017tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-sse41-ld128.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -07001018
Frank Barchardaae722a2021-08-30 12:37:30 -07001019tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-sse41-ld128.c &
1020tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-sse41-ld128.c &
1021tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=0 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-sse41-ld128.c &
Marat Dukhanfc188ed2021-06-03 12:21:22 -07001022
Frank Barchardaae722a2021-08-30 12:37:30 -07001023tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-avx-ld128.c &
1024tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-avx-ld128.c &
1025tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-avx-ld128.c &
Marat Dukhanfc188ed2021-06-03 12:21:22 -07001026
Frank Barchardaae722a2021-08-30 12:37:30 -07001027tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-avx-ld128.c &
1028tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-avx-ld128.c &
1029tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-avx-ld128.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -07001030
Frank Barchardaae722a2021-08-30 12:37:30 -07001031tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-avx-ld128.c &
1032tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-avx-ld128.c &
1033tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=0 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-avx-ld128.c &
Marat Dukhanfc188ed2021-06-03 12:21:22 -07001034
Frank Barchardaae722a2021-08-30 12:37:30 -07001035tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/1x4c8-minmax-fp32-xop-ld128.c &
1036tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/2x4c8-minmax-fp32-xop-ld128.c &
1037tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qc8-igemm/gen/3x4c8-minmax-fp32-xop-ld128.c &
Marat Dukhan1566fee2020-08-02 21:55:41 -07001038
Frank Barchardaae722a2021-08-30 12:37:30 -07001039tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/1x4c8-minmax-fp32-xop-ld128.c &
1040tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/2x4c8-minmax-fp32-xop-ld128.c &
1041tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qs8-igemm/gen/3x4c8-minmax-fp32-xop-ld128.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -07001042
Frank Barchardaae722a2021-08-30 12:37:30 -07001043tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=1 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/1x4c8-minmax-fp32-xop-ld128.c &
1044tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=2 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/2x4c8-minmax-fp32-xop-ld128.c &
1045tools/xngen src/qs8-igemm/MRx4c8-sse.c.in -D MR=3 -D SSE=4 -D AVX=1 -D XOP=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -D VARIANT=LD128 -o src/qu8-igemm/gen/3x4c8-minmax-fp32-xop-ld128.c &
Marat Dukhanef47f8d2021-07-02 15:08:32 -07001046
Marat Dukhan12809522020-08-02 22:23:51 -07001047################################### x86 AVX2 ##################################
1048### C8 micro-kernels
Frank Barchardaae722a2021-08-30 12:37:30 -07001049tools/xngen src/qs8-igemm/MRx8c8-avx2.c.in -D MR=1 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -o src/qc8-igemm/gen/1x8c8-minmax-fp32-avx2.c &
1050tools/xngen src/qs8-igemm/MRx8c8-avx2.c.in -D MR=2 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -o src/qc8-igemm/gen/2x8c8-minmax-fp32-avx2.c &
1051tools/xngen src/qs8-igemm/MRx8c8-avx2.c.in -D MR=3 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -o src/qc8-igemm/gen/3x8c8-minmax-fp32-avx2.c &
Marat Dukhan902ef7f2021-07-02 16:11:06 -07001052
Frank Barchardaae722a2021-08-30 12:37:30 -07001053tools/xngen src/qs8-igemm/MRx8c8-avx2.c.in -D MR=1 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -o src/qs8-igemm/gen/1x8c8-minmax-fp32-avx2.c &
1054tools/xngen src/qs8-igemm/MRx8c8-avx2.c.in -D MR=2 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -o src/qs8-igemm/gen/2x8c8-minmax-fp32-avx2.c &
1055tools/xngen src/qs8-igemm/MRx8c8-avx2.c.in -D MR=3 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -o src/qs8-igemm/gen/3x8c8-minmax-fp32-avx2.c &
Marat Dukhane06c8132021-06-03 08:59:11 -07001056
Frank Barchardaae722a2021-08-30 12:37:30 -07001057tools/xngen src/qs8-igemm/MRx8c8-avx2.c.in -D MR=1 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -o src/qu8-igemm/gen/1x8c8-minmax-fp32-avx2.c &
1058tools/xngen src/qs8-igemm/MRx8c8-avx2.c.in -D MR=2 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -o src/qu8-igemm/gen/2x8c8-minmax-fp32-avx2.c &
1059tools/xngen src/qs8-igemm/MRx8c8-avx2.c.in -D MR=3 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -o src/qu8-igemm/gen/3x8c8-minmax-fp32-avx2.c &
Marat Dukhan12809522020-08-02 22:23:51 -07001060
Marat Dukhanbb00b1d2020-08-10 11:37:23 -07001061################################## x86 AVX512 #################################
1062### C8 micro-kernels
Frank Barchardaae722a2021-08-30 12:37:30 -07001063tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=1 -D VARIANT=LD256 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -o src/qc8-igemm/gen/1x16c8-minmax-fp32-avx512skx.c &
1064tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=2 -D VARIANT=LD256 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -o src/qc8-igemm/gen/2x16c8-minmax-fp32-avx512skx.c &
1065tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=3 -D VARIANT=LD256 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -o src/qc8-igemm/gen/3x16c8-minmax-fp32-avx512skx.c &
1066tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=4 -D VARIANT=LD256 -D DATATYPE=QC8 -D REQUANTIZATION=FP32 -o src/qc8-igemm/gen/4x16c8-minmax-fp32-avx512skx.c &
Marat Dukhan3cf2e222021-07-08 11:38:45 -07001067
Frank Barchardaae722a2021-08-30 12:37:30 -07001068tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=1 -D VARIANT=LD256 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -o src/qs8-igemm/gen/1x16c8-minmax-fp32-avx512skx.c &
1069tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=2 -D VARIANT=LD256 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -o src/qs8-igemm/gen/2x16c8-minmax-fp32-avx512skx.c &
1070tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=3 -D VARIANT=LD256 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -o src/qs8-igemm/gen/3x16c8-minmax-fp32-avx512skx.c &
1071tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=4 -D VARIANT=LD256 -D DATATYPE=QS8 -D REQUANTIZATION=FP32 -o src/qs8-igemm/gen/4x16c8-minmax-fp32-avx512skx.c &
Marat Dukhanc3e3f1c2021-06-03 09:56:16 -07001072
Frank Barchardaae722a2021-08-30 12:37:30 -07001073tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=1 -D VARIANT=LD256 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -o src/qu8-igemm/gen/1x16c8-minmax-fp32-avx512skx.c &
1074tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=2 -D VARIANT=LD256 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -o src/qu8-igemm/gen/2x16c8-minmax-fp32-avx512skx.c &
1075tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=3 -D VARIANT=LD256 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -o src/qu8-igemm/gen/3x16c8-minmax-fp32-avx512skx.c &
1076tools/xngen src/qs8-igemm/MRx16c8-avx512skx.c.in -D MR=4 -D VARIANT=LD256 -D DATATYPE=QU8 -D REQUANTIZATION=FP32 -o src/qu8-igemm/gen/4x16c8-minmax-fp32-avx512skx.c &
Marat Dukhanbb00b1d2020-08-10 11:37:23 -07001077
Marat Dukhanf9480682020-07-31 14:50:24 -07001078################################## Unit tests #################################
Zhi An Ng4c1fd6f2022-01-10 19:35:06 -08001079tools/generate-gemm-test.py --spec test/qc8-igemm-minmax-fp32.yaml --output test/qc8-igemm-minmax-fp32.cc --output test/qc8-igemm-minmax-fp32-2.cc --output test/qc8-igemm-minmax-fp32-3.cc &
1080tools/generate-gemm-test.py --spec test/qs8-igemm-minmax-fp32.yaml --output test/qs8-igemm-minmax-fp32.cc --output test/qs8-igemm-minmax-fp32-2.cc &
1081tools/generate-gemm-test.py --spec test/qu8-igemm-minmax-fp32.yaml --output test/qu8-igemm-minmax-fp32.cc --output test/qu8-igemm-minmax-fp32-2.cc &
Marat Dukhane903dff2021-07-16 19:43:41 -07001082
Zhi An Nge96b6bc2022-02-03 10:49:46 -08001083tools/generate-gemm-test.py --spec test/qs8-igemm-minmax-rndnu.yaml --output test/qs8-igemm-minmax-rndnu.cc --output test/qs8-igemm-minmax-rndnu-2.cc --output test/qs8-igemm-minmax-rndnu-3.cc --output test/qs8-igemm-minmax-rndnu-4.cc &
Zhi An Ng4c1fd6f2022-01-10 19:35:06 -08001084tools/generate-gemm-test.py --spec test/qu8-igemm-minmax-rndnu.yaml --output test/qu8-igemm-minmax-rndnu.cc --output test/qu8-igemm-minmax-rndnu-2.cc &
Frank Barchardaae722a2021-08-30 12:37:30 -07001085
1086wait