Blame - llvm/lib/Target/X86/X86Schedule.td - toolchain/llvm-project

blob: ad2974d0d7980b80b04da613c29e53d4c711ef56 [file] [log] [blame]

Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	1	//===-- X86Schedule.td - X86 Scheduling Definitions --------- tablegen --===//
				2	//
				3	// The LLVM Compiler Infrastructure
				4	//
				5	// This file is distributed under the University of Illinois Open Source
				6	// License. See LICENSE.TXT for details.
				7	//
				8	//===----------------------------------------------------------------------===//
				9
Simon Pilgrim	963bf4d	2018-04-13 14:24:06 +0000	[diff] [blame]	10	//===----------------------------------------------------------------------===//
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	11	// InstrSchedModel annotations for out-of-order CPUs.
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	12
				13	// Instructions with folded loads need to read the memory operand immediately,
				14	// but other register operands don't have to be read until the load is ready.
				15	// These operands are marked with ReadAfterLd.
				16	def ReadAfterLd : SchedRead;
				17
				18	// Instructions with both a load and a store folded are modeled as a folded
				19	// load + WriteRMW.
				20	def WriteRMW : SchedWrite;
				21
				22	// Most instructions can fold loads, so almost every SchedWrite comes in two
				23	// variants: With and without a folded load.
				24	// An X86FoldableSchedWrite holds a reference to the corresponding SchedWrite
				25	// with a folded load.
				26	class X86FoldableSchedWrite : SchedWrite {
				27	// The SchedWrite to use when a load is folded into the instruction.
				28	SchedWrite Folded;
				29	}
				30
				31	// Multiclass that produces a linked pair of SchedWrites.
				32	multiclass X86SchedWritePair {
				33	// Register-Memory operation.
				34	def Ld : SchedWrite;
				35	// Register-Register operation.
				36	def NAME : X86FoldableSchedWrite {
				37	let Folded = !cast<SchedWrite>(NAME#"Ld");
				38	}
				39	}
				40
Simon Pilgrim	3c35408	2018-04-30 18:18:38 +0000	[diff] [blame]	41	// Multiclass that wraps X86FoldableSchedWrite for each vector width.
				42	class X86SchedWriteWidths<X86FoldableSchedWrite sScl,
				43	X86FoldableSchedWrite s128,
				44	X86FoldableSchedWrite s256,
				45	X86FoldableSchedWrite s512> {
				46	X86FoldableSchedWrite Scl = sScl; // Scalar float/double operations.
				47	X86FoldableSchedWrite MMX = sScl; // MMX operations.
				48	X86FoldableSchedWrite XMM = s128; // XMM operations.
				49	X86FoldableSchedWrite YMM = s256; // YMM operations.
				50	X86FoldableSchedWrite ZMM = s512; // ZMM operations.
				51	}
				52
Craig Topper	b7baa35	2018-04-08 17:53:18 +0000	[diff] [blame]	53	// Loads, stores, and moves, not folded with other operations.
				54	def WriteLoad : SchedWrite;
				55	def WriteStore : SchedWrite;
				56	def WriteMove : SchedWrite;
				57
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	58	// Arithmetic.
				59	defm WriteALU : X86SchedWritePair; // Simple integer ALU op.
Craig Topper	b7baa35	2018-04-08 17:53:18 +0000	[diff] [blame]	60	def WriteALURMW : WriteSequence<[WriteALULd, WriteStore]>;
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	61	defm WriteIMul : X86SchedWritePair; // Integer multiplication.
				62	def WriteIMulH : SchedWrite; // Integer multiplication, high part.
				63	defm WriteIDiv : X86SchedWritePair; // Integer division.
				64	def WriteLEA : SchedWrite; // LEA instructions can't fold loads.
				65
Simon Pilgrim	f33d905	2018-03-26 18:19:28 +0000	[diff] [blame]	66	defm WriteBitScan : X86SchedWritePair; // Bit scan forward/reverse.
				67	defm WritePOPCNT : X86SchedWritePair; // Bit population count.
				68	defm WriteLZCNT : X86SchedWritePair; // Leading zero count.
				69	defm WriteTZCNT : X86SchedWritePair; // Trailing zero count.
Craig Topper	b7baa35	2018-04-08 17:53:18 +0000	[diff] [blame]	70	defm WriteCMOV : X86SchedWritePair; // Conditional move.
				71	def WriteSETCC : SchedWrite; // Set register based on condition code.
				72	def WriteSETCCStore : SchedWrite;
Simon Pilgrim	f33d905	2018-03-26 18:19:28 +0000	[diff] [blame]	73
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	74	// Integer shifts and rotates.
				75	defm WriteShift : X86SchedWritePair;
				76
Craig Topper	89310f5	2018-03-29 20:41:39 +0000	[diff] [blame]	77	// BMI1 BEXTR, BMI2 BZHI
				78	defm WriteBEXTR : X86SchedWritePair;
				79	defm WriteBZHI : X86SchedWritePair;
				80
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	81	// Idioms that clear a register, like xorps %xmm0, %xmm0.
				82	// These can often bypass execution ports completely.
				83	def WriteZero : SchedWrite;
				84
				85	// Branches don't produce values, so they have no latency, but they still
				86	// consume resources. Indirect branches can fold loads.
				87	defm WriteJump : X86SchedWritePair;
				88
				89	// Floating point. This covers both scalar and vector operations.
Simon Pilgrim	fb7aa57	2018-03-15 14:45:30 +0000	[diff] [blame]	90	def WriteFLoad : SchedWrite;
				91	def WriteFStore : SchedWrite;
				92	def WriteFMove : SchedWrite;
Simon Pilgrim	86e3c269	2018-04-17 07:22:44 +0000	[diff] [blame]	93	defm WriteFAdd : X86SchedWritePair; // Floating point add/sub.
Simon Pilgrim	5269167f	2018-05-01 16:13:42 +0000	[diff] [blame]	94	defm WriteFAddY : X86SchedWritePair; // Floating point add/sub (YMM/ZMM).
Simon Pilgrim	86e3c269	2018-04-17 07:22:44 +0000	[diff] [blame]	95	defm WriteFCmp : X86SchedWritePair; // Floating point compare.
Simon Pilgrim	c546f94	2018-05-01 16:50:16 +0000	[diff] [blame^]	96	defm WriteFCmpY : X86SchedWritePair; // Floating point compare (YMM/ZMM).
Simon Pilgrim	86e3c269	2018-04-17 07:22:44 +0000	[diff] [blame]	97	defm WriteFCom : X86SchedWritePair; // Floating point compare to flags.
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	98	defm WriteFMul : X86SchedWritePair; // Floating point multiplication.
				99	defm WriteFDiv : X86SchedWritePair; // Floating point division.
				100	defm WriteFSqrt : X86SchedWritePair; // Floating point square root.
				101	defm WriteFRcp : X86SchedWritePair; // Floating point reciprocal estimate.
				102	defm WriteFRsqrt : X86SchedWritePair; // Floating point reciprocal square root estimate.
				103	defm WriteFMA : X86SchedWritePair; // Fused Multiply Add.
Simon Pilgrim	dbd1ae7	2018-04-25 13:07:58 +0000	[diff] [blame]	104	defm WriteFMAS : X86SchedWritePair; // Fused Multiply Add (Scalar).
				105	defm WriteFMAY : X86SchedWritePair; // Fused Multiply Add (YMM/ZMM).
Simon Pilgrim	b2aa89c	2018-04-27 15:50:33 +0000	[diff] [blame]	106	defm WriteFSign : X86SchedWritePair; // Floating point fabs/fchs.
				107	defm WriteFLogic : X86SchedWritePair; // Floating point and/or/xor logicals.
				108	defm WriteFLogicY : X86SchedWritePair; // Floating point and/or/xor logicals (YMM/ZMM).
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	109	defm WriteFShuffle : X86SchedWritePair; // Floating point vector shuffles.
Simon Pilgrim	dd8eae1	2018-05-01 14:25:01 +0000	[diff] [blame]	110	defm WriteFShuffleY : X86SchedWritePair; // Floating point vector shuffles (YMM/ZMM).
Simon Pilgrim	89c8a10	2018-04-11 13:49:19 +0000	[diff] [blame]	111	defm WriteFVarShuffle : X86SchedWritePair; // Floating point vector variable shuffles.
Simon Pilgrim	8a937e0	2018-04-27 18:19:48 +0000	[diff] [blame]	112	defm WriteFVarShuffleY : X86SchedWritePair; // Floating point vector variable shuffles (YMM/ZMM).
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	113	defm WriteFBlend : X86SchedWritePair; // Floating point vector blends.
Simon Pilgrim	8a937e0	2018-04-27 18:19:48 +0000	[diff] [blame]	114	defm WriteFBlendY : X86SchedWritePair; // Floating point vector blends (YMM/ZMM).
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	115	defm WriteFVarBlend : X86SchedWritePair; // Fp vector variable blends.
Simon Pilgrim	8a937e0	2018-04-27 18:19:48 +0000	[diff] [blame]	116	defm WriteFVarBlendY : X86SchedWritePair; // Fp vector variable blends (YMM/ZMM).
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	117
				118	// FMA Scheduling helper class.
				119	class FMASC { X86FoldableSchedWrite Sched = WriteFAdd; }
				120
Andrew V. Tischenko	8cb1d09	2017-06-08 16:44:13 +0000	[diff] [blame]	121	// Horizontal Add/Sub (float and integer)
				122	defm WriteFHAdd : X86SchedWritePair;
Simon Pilgrim	c3c767b	2018-04-27 16:11:57 +0000	[diff] [blame]	123	defm WriteFHAddY : X86SchedWritePair; // YMM/ZMM.
				124	defm WritePHAdd : X86SchedWritePair;
Andrew V. Tischenko	8cb1d09	2017-06-08 16:44:13 +0000	[diff] [blame]	125
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	126	// Vector integer operations.
Simon Pilgrim	fb7aa57	2018-03-15 14:45:30 +0000	[diff] [blame]	127	def WriteVecLoad : SchedWrite;
				128	def WriteVecStore : SchedWrite;
				129	def WriteVecMove : SchedWrite;
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	130	defm WriteVecALU : X86SchedWritePair; // Vector integer ALU op, no logicals.
Simon Pilgrim	d14d2e7	2018-04-20 21:16:05 +0000	[diff] [blame]	131	defm WriteVecLogic : X86SchedWritePair; // Vector integer and/or/xor logicals.
Simon Pilgrim	57f2b18	2018-05-01 12:39:17 +0000	[diff] [blame]	132	defm WriteVecLogicY: X86SchedWritePair; // Vector integer and/or/xor logicals (YMM/ZMM).
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	133	defm WriteVecShift : X86SchedWritePair; // Vector integer shifts.
				134	defm WriteVecIMul : X86SchedWritePair; // Vector integer multiply.
Craig Topper	13a0f83	2018-03-31 04:54:32 +0000	[diff] [blame]	135	defm WritePMULLD : X86SchedWritePair; // PMULLD
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	136	defm WriteShuffle : X86SchedWritePair; // Vector shuffles.
Simon Pilgrim	89c8a10	2018-04-11 13:49:19 +0000	[diff] [blame]	137	defm WriteVarShuffle : X86SchedWritePair; // Vector variable shuffles.
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	138	defm WriteBlend : X86SchedWritePair; // Vector blends.
				139	defm WriteVarBlend : X86SchedWritePair; // Vector variable blends.
Craig Topper	e56a2fc	2018-04-17 19:35:19 +0000	[diff] [blame]	140	defm WritePSADBW : X86SchedWritePair; // Vector PSADBW.
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	141	defm WriteMPSAD : X86SchedWritePair; // Vector MPSAD.
Simon Pilgrim	27bc83e	2018-04-24 18:49:25 +0000	[diff] [blame]	142	defm WritePHMINPOS : X86SchedWritePair; // Vector PHMINPOS.
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	143
Simon Pilgrim	f7d2a93	2018-04-24 13:21:41 +0000	[diff] [blame]	144	// Vector insert/extract operations.
				145	defm WriteVecInsert : X86SchedWritePair; // Insert gpr to vector element.
				146	def WriteVecExtract : SchedWrite; // Extract vector element to gpr.
				147	def WriteVecExtractSt : SchedWrite; // Extract vector element and store.
				148
Simon Pilgrim	a2f2678	2018-03-27 20:38:54 +0000	[diff] [blame]	149	// MOVMSK operations.
				150	def WriteFMOVMSK : SchedWrite;
				151	def WriteVecMOVMSK : SchedWrite;
				152	def WriteMMXMOVMSK : SchedWrite;
				153
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	154	// Conversion between integer and float.
				155	defm WriteCvtF2I : X86SchedWritePair; // Float -> Integer.
				156	defm WriteCvtI2F : X86SchedWritePair; // Integer -> Float.
				157	defm WriteCvtF2F : X86SchedWritePair; // Float -> Float size conversion.
Simon Pilgrim	f0945aa	2018-04-24 16:43:07 +0000	[diff] [blame]	158	def WriteCvtF2FSt : SchedWrite; // // Float -> Float + store size conversion.
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	159
Simon Pilgrim	28e7bcb	2018-03-26 21:06:14 +0000	[diff] [blame]	160	// CRC32 instruction.
				161	defm WriteCRC32 : X86SchedWritePair;
				162
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	163	// Strings instructions.
				164	// Packed Compare Implicit Length Strings, Return Mask
				165	defm WritePCmpIStrM : X86SchedWritePair;
				166	// Packed Compare Explicit Length Strings, Return Mask
				167	defm WritePCmpEStrM : X86SchedWritePair;
				168	// Packed Compare Implicit Length Strings, Return Index
				169	defm WritePCmpIStrI : X86SchedWritePair;
				170	// Packed Compare Explicit Length Strings, Return Index
				171	defm WritePCmpEStrI : X86SchedWritePair;
				172
				173	// AES instructions.
				174	defm WriteAESDecEnc : X86SchedWritePair; // Decryption, encryption.
				175	defm WriteAESIMC : X86SchedWritePair; // InvMixColumn.
				176	defm WriteAESKeyGen : X86SchedWritePair; // Key Generation.
				177
				178	// Carry-less multiplication instructions.
				179	defm WriteCLMul : X86SchedWritePair;
				180
Craig Topper	05242bf	2018-04-21 18:07:36 +0000	[diff] [blame]	181	// Load/store MXCSR
				182	def WriteLDMXCSR : SchedWrite;
				183	def WriteSTMXCSR : SchedWrite;
				184
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	185	// Catch-all for expensive system instructions.
				186	def WriteSystem : SchedWrite;
				187
				188	// AVX2.
				189	defm WriteFShuffle256 : X86SchedWritePair; // Fp 256-bit width vector shuffles.
Simon Pilgrim	89c8a10	2018-04-11 13:49:19 +0000	[diff] [blame]	190	defm WriteFVarShuffle256 : X86SchedWritePair; // Fp 256-bit width variable shuffles.
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	191	defm WriteShuffle256 : X86SchedWritePair; // 256-bit width vector shuffles.
Simon Pilgrim	89c8a10	2018-04-11 13:49:19 +0000	[diff] [blame]	192	defm WriteVarShuffle256 : X86SchedWritePair; // 256-bit width vector variable shuffles.
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	193	defm WriteVarVecShift : X86SchedWritePair; // Variable vector shifts.
				194
				195	// Old microcoded instructions that nobody use.
				196	def WriteMicrocoded : SchedWrite;
				197
				198	// Fence instructions.
				199	def WriteFence : SchedWrite;
				200
				201	// Nop, not very useful expect it provides a model for nops!
				202	def WriteNop : SchedWrite;
				203
Simon Pilgrim	3c35408	2018-04-30 18:18:38 +0000	[diff] [blame]	204	// Vector width wrappers.
				205	def SchedWriteFAdd
Simon Pilgrim	5269167f	2018-05-01 16:13:42 +0000	[diff] [blame]	206	: X86SchedWriteWidths<WriteFAdd, WriteFAdd, WriteFAddY, WriteFAddY>;
Simon Pilgrim	3c35408	2018-04-30 18:18:38 +0000	[diff] [blame]	207	def SchedWriteFCmp
Simon Pilgrim	c546f94	2018-05-01 16:50:16 +0000	[diff] [blame^]	208	: X86SchedWriteWidths<WriteFCmp, WriteFCmp, WriteFCmpY, WriteFCmpY>;
Simon Pilgrim	3c35408	2018-04-30 18:18:38 +0000	[diff] [blame]	209	def SchedWriteFMul
				210	: X86SchedWriteWidths<WriteFMul, WriteFMul, WriteFMul, WriteFMul>;
				211	def SchedWriteFDiv
				212	: X86SchedWriteWidths<WriteFDiv, WriteFDiv, WriteFDiv, WriteFDiv>;
Simon Pilgrim	1b7a80d	2018-05-01 15:57:17 +0000	[diff] [blame]	213	def SchedWriteFRcp
				214	: X86SchedWriteWidths<WriteFRcp, WriteFRcp, WriteFRcp, WriteFRcp>;
				215	def SchedWriteFRsqrt
				216	: X86SchedWriteWidths<WriteFRsqrt, WriteFRsqrt, WriteFRsqrt, WriteFRsqrt>;
Simon Pilgrim	3c35408	2018-04-30 18:18:38 +0000	[diff] [blame]	217	def SchedWriteFLogic
				218	: X86SchedWriteWidths<WriteFLogic, WriteFLogic, WriteFLogicY, WriteFLogicY>;
				219
				220	def SchedWriteFShuffle
				221	: X86SchedWriteWidths<WriteFShuffle, WriteFShuffle,
Simon Pilgrim	dd8eae1	2018-05-01 14:25:01 +0000	[diff] [blame]	222	WriteFShuffleY, WriteFShuffleY>;
Simon Pilgrim	3c35408	2018-04-30 18:18:38 +0000	[diff] [blame]	223	def SchedWriteFVarShuffle
				224	: X86SchedWriteWidths<WriteFVarShuffle, WriteFVarShuffle,
				225	WriteFVarShuffleY, WriteFVarShuffleY>;
				226	def SchedWriteFBlend
				227	: X86SchedWriteWidths<WriteFBlend, WriteFBlend, WriteFBlendY, WriteFBlendY>;
				228	def SchedWriteFVarBlend
				229	: X86SchedWriteWidths<WriteFVarBlend, WriteFVarBlend,
				230	WriteFVarBlendY, WriteFVarBlendY>;
				231
				232	def SchedWriteVecALU
				233	: X86SchedWriteWidths<WriteVecALU, WriteVecALU, WriteVecALU, WriteVecALU>;
				234	def SchedWriteVecLogic
				235	: X86SchedWriteWidths<WriteVecLogic, WriteVecLogic,
Simon Pilgrim	57f2b18	2018-05-01 12:39:17 +0000	[diff] [blame]	236	WriteVecLogicY, WriteVecLogicY>;
Simon Pilgrim	3c35408	2018-04-30 18:18:38 +0000	[diff] [blame]	237	def SchedWriteVecShift
				238	: X86SchedWriteWidths<WriteVecShift, WriteVecShift,
				239	WriteVecShift, WriteVecShift>;
				240	def SchedWriteVecIMul
				241	: X86SchedWriteWidths<WriteVecIMul, WriteVecIMul,
				242	WriteVecIMul, WriteVecIMul>;
				243	def SchedWritePMULLD
				244	: X86SchedWriteWidths<WritePMULLD, WritePMULLD,
				245	WritePMULLD, WritePMULLD>;
				246
				247	def SchedWriteShuffle
				248	: X86SchedWriteWidths<WriteShuffle, WriteShuffle,
				249	WriteShuffle, WriteShuffle>;
				250	def SchedWriteVarShuffle
				251	: X86SchedWriteWidths<WriteVarShuffle, WriteVarShuffle,
				252	WriteVarShuffle, WriteVarShuffle>;
				253	def SchedWriteBlend
				254	: X86SchedWriteWidths<WriteBlend, WriteBlend, WriteBlend, WriteBlend>;
				255	def SchedWriteVarBlend
				256	: X86SchedWriteWidths<WriteVarBlend, WriteVarBlend,
				257	WriteVarBlend, WriteVarBlend>;
				258
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	259	//===----------------------------------------------------------------------===//
Simon Pilgrim	35935c0	2018-04-12 18:46:15 +0000	[diff] [blame]	260	// Generic Processor Scheduler Models.
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	261
				262	// IssueWidth is analogous to the number of decode units. Core and its
				263	// descendents, including Nehalem and SandyBridge have 4 decoders.
				264	// Resources beyond the decoder operate on micro-ops and are bufferred
				265	// so adjacent micro-ops don't directly compete.
				266	//
				267	// MicroOpBufferSize > 1 indicates that RAW dependencies can be
				268	// decoded in the same cycle. The value 32 is a reasonably arbitrary
				269	// number of in-flight instructions.
				270	//
				271	// HighLatency=10 is optimistic. X86InstrInfo::isHighLatencyDef
				272	// indicates high latency opcodes. Alternatively, InstrItinData
				273	// entries may be included here to define specific operand
				274	// latencies. Since these latencies are not used for pipeline hazards,
				275	// they do not need to be exact.
				276	//
Simon Pilgrim	e0c7868	2018-04-13 14:31:57 +0000	[diff] [blame]	277	// The GenericX86Model contains no instruction schedules
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	278	// and disables PostRAScheduler.
				279	class GenericX86Model : SchedMachineModel {
				280	let IssueWidth = 4;
				281	let MicroOpBufferSize = 32;
				282	let LoadLatency = 4;
				283	let HighLatency = 10;
				284	let PostRAScheduler = 0;
				285	let CompleteModel = 0;
				286	}
				287
				288	def GenericModel : GenericX86Model;
				289
				290	// Define a model with the PostRAScheduler enabled.
				291	def GenericPostRAModel : GenericX86Model {
				292	let PostRAScheduler = 1;
				293	}
				294