Blame - llvm/lib/Target/X86/X86Schedule.td - toolchain/llvm-project

blob: dd2ffeddf49aa1bbc571371459776509e6ae51da [file] [log] [blame]

Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	1	//===-- X86Schedule.td - X86 Scheduling Definitions --------- tablegen --===//
				2	//
				3	// The LLVM Compiler Infrastructure
				4	//
				5	// This file is distributed under the University of Illinois Open Source
				6	// License. See LICENSE.TXT for details.
				7	//
				8	//===----------------------------------------------------------------------===//
				9
Simon Pilgrim	963bf4d	2018-04-13 14:24:06 +0000	[diff] [blame]	10	//===----------------------------------------------------------------------===//
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	11	// InstrSchedModel annotations for out-of-order CPUs.
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	12
				13	// Instructions with folded loads need to read the memory operand immediately,
				14	// but other register operands don't have to be read until the load is ready.
				15	// These operands are marked with ReadAfterLd.
				16	def ReadAfterLd : SchedRead;
				17
				18	// Instructions with both a load and a store folded are modeled as a folded
				19	// load + WriteRMW.
				20	def WriteRMW : SchedWrite;
				21
				22	// Most instructions can fold loads, so almost every SchedWrite comes in two
				23	// variants: With and without a folded load.
				24	// An X86FoldableSchedWrite holds a reference to the corresponding SchedWrite
				25	// with a folded load.
				26	class X86FoldableSchedWrite : SchedWrite {
				27	// The SchedWrite to use when a load is folded into the instruction.
				28	SchedWrite Folded;
				29	}
				30
				31	// Multiclass that produces a linked pair of SchedWrites.
				32	multiclass X86SchedWritePair {
				33	// Register-Memory operation.
				34	def Ld : SchedWrite;
				35	// Register-Register operation.
				36	def NAME : X86FoldableSchedWrite {
				37	let Folded = !cast<SchedWrite>(NAME#"Ld");
				38	}
				39	}
				40
Craig Topper	b7baa35	2018-04-08 17:53:18 +0000	[diff] [blame]	41	// Loads, stores, and moves, not folded with other operations.
				42	def WriteLoad : SchedWrite;
				43	def WriteStore : SchedWrite;
				44	def WriteMove : SchedWrite;
				45
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	46	// Arithmetic.
				47	defm WriteALU : X86SchedWritePair; // Simple integer ALU op.
Craig Topper	b7baa35	2018-04-08 17:53:18 +0000	[diff] [blame]	48	def WriteALURMW : WriteSequence<[WriteALULd, WriteStore]>;
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	49	defm WriteIMul : X86SchedWritePair; // Integer multiplication.
				50	def WriteIMulH : SchedWrite; // Integer multiplication, high part.
				51	defm WriteIDiv : X86SchedWritePair; // Integer division.
				52	def WriteLEA : SchedWrite; // LEA instructions can't fold loads.
				53
Simon Pilgrim	f33d905	2018-03-26 18:19:28 +0000	[diff] [blame]	54	defm WriteBitScan : X86SchedWritePair; // Bit scan forward/reverse.
				55	defm WritePOPCNT : X86SchedWritePair; // Bit population count.
				56	defm WriteLZCNT : X86SchedWritePair; // Leading zero count.
				57	defm WriteTZCNT : X86SchedWritePair; // Trailing zero count.
Craig Topper	b7baa35	2018-04-08 17:53:18 +0000	[diff] [blame]	58	defm WriteCMOV : X86SchedWritePair; // Conditional move.
				59	def WriteSETCC : SchedWrite; // Set register based on condition code.
				60	def WriteSETCCStore : SchedWrite;
Simon Pilgrim	f33d905	2018-03-26 18:19:28 +0000	[diff] [blame]	61
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	62	// Integer shifts and rotates.
				63	defm WriteShift : X86SchedWritePair;
				64
Craig Topper	89310f5	2018-03-29 20:41:39 +0000	[diff] [blame]	65	// BMI1 BEXTR, BMI2 BZHI
				66	defm WriteBEXTR : X86SchedWritePair;
				67	defm WriteBZHI : X86SchedWritePair;
				68
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	69	// Idioms that clear a register, like xorps %xmm0, %xmm0.
				70	// These can often bypass execution ports completely.
				71	def WriteZero : SchedWrite;
				72
				73	// Branches don't produce values, so they have no latency, but they still
				74	// consume resources. Indirect branches can fold loads.
				75	defm WriteJump : X86SchedWritePair;
				76
				77	// Floating point. This covers both scalar and vector operations.
Simon Pilgrim	fb7aa57	2018-03-15 14:45:30 +0000	[diff] [blame]	78	def WriteFLoad : SchedWrite;
				79	def WriteFStore : SchedWrite;
				80	def WriteFMove : SchedWrite;
Simon Pilgrim	86e3c269	2018-04-17 07:22:44 +0000	[diff] [blame]	81	defm WriteFAdd : X86SchedWritePair; // Floating point add/sub.
				82	defm WriteFCmp : X86SchedWritePair; // Floating point compare.
				83	defm WriteFCom : X86SchedWritePair; // Floating point compare to flags.
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	84	defm WriteFMul : X86SchedWritePair; // Floating point multiplication.
				85	defm WriteFDiv : X86SchedWritePair; // Floating point division.
				86	defm WriteFSqrt : X86SchedWritePair; // Floating point square root.
				87	defm WriteFRcp : X86SchedWritePair; // Floating point reciprocal estimate.
				88	defm WriteFRsqrt : X86SchedWritePair; // Floating point reciprocal square root estimate.
				89	defm WriteFMA : X86SchedWritePair; // Fused Multiply Add.
				90	defm WriteFShuffle : X86SchedWritePair; // Floating point vector shuffles.
Simon Pilgrim	89c8a10	2018-04-11 13:49:19 +0000	[diff] [blame]	91	defm WriteFVarShuffle : X86SchedWritePair; // Floating point vector variable shuffles.
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	92	defm WriteFBlend : X86SchedWritePair; // Floating point vector blends.
				93	defm WriteFVarBlend : X86SchedWritePair; // Fp vector variable blends.
				94
				95	// FMA Scheduling helper class.
				96	class FMASC { X86FoldableSchedWrite Sched = WriteFAdd; }
				97
Andrew V. Tischenko	8cb1d09	2017-06-08 16:44:13 +0000	[diff] [blame]	98	// Horizontal Add/Sub (float and integer)
				99	defm WriteFHAdd : X86SchedWritePair;
				100	defm WritePHAdd : X86SchedWritePair;
				101
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	102	// Vector integer operations.
Simon Pilgrim	fb7aa57	2018-03-15 14:45:30 +0000	[diff] [blame]	103	def WriteVecLoad : SchedWrite;
				104	def WriteVecStore : SchedWrite;
				105	def WriteVecMove : SchedWrite;
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	106	defm WriteVecALU : X86SchedWritePair; // Vector integer ALU op, no logicals.
				107	defm WriteVecShift : X86SchedWritePair; // Vector integer shifts.
				108	defm WriteVecIMul : X86SchedWritePair; // Vector integer multiply.
Craig Topper	13a0f83	2018-03-31 04:54:32 +0000	[diff] [blame]	109	defm WritePMULLD : X86SchedWritePair; // PMULLD
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	110	defm WriteShuffle : X86SchedWritePair; // Vector shuffles.
Simon Pilgrim	89c8a10	2018-04-11 13:49:19 +0000	[diff] [blame]	111	defm WriteVarShuffle : X86SchedWritePair; // Vector variable shuffles.
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	112	defm WriteBlend : X86SchedWritePair; // Vector blends.
				113	defm WriteVarBlend : X86SchedWritePair; // Vector variable blends.
Craig Topper	e56a2fc	2018-04-17 19:35:19 +0000	[diff] [blame]	114	defm WritePSADBW : X86SchedWritePair; // Vector PSADBW.
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	115	defm WriteMPSAD : X86SchedWritePair; // Vector MPSAD.
				116
				117	// Vector bitwise operations.
				118	// These are often used on both floating point and integer vectors.
				119	defm WriteVecLogic : X86SchedWritePair; // Vector and/or/xor.
				120
Simon Pilgrim	a2f2678	2018-03-27 20:38:54 +0000	[diff] [blame]	121	// MOVMSK operations.
				122	def WriteFMOVMSK : SchedWrite;
				123	def WriteVecMOVMSK : SchedWrite;
				124	def WriteMMXMOVMSK : SchedWrite;
				125
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	126	// Conversion between integer and float.
				127	defm WriteCvtF2I : X86SchedWritePair; // Float -> Integer.
				128	defm WriteCvtI2F : X86SchedWritePair; // Integer -> Float.
				129	defm WriteCvtF2F : X86SchedWritePair; // Float -> Float size conversion.
				130
Simon Pilgrim	28e7bcb	2018-03-26 21:06:14 +0000	[diff] [blame]	131	// CRC32 instruction.
				132	defm WriteCRC32 : X86SchedWritePair;
				133
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	134	// Strings instructions.
				135	// Packed Compare Implicit Length Strings, Return Mask
				136	defm WritePCmpIStrM : X86SchedWritePair;
				137	// Packed Compare Explicit Length Strings, Return Mask
				138	defm WritePCmpEStrM : X86SchedWritePair;
				139	// Packed Compare Implicit Length Strings, Return Index
				140	defm WritePCmpIStrI : X86SchedWritePair;
				141	// Packed Compare Explicit Length Strings, Return Index
				142	defm WritePCmpEStrI : X86SchedWritePair;
				143
				144	// AES instructions.
				145	defm WriteAESDecEnc : X86SchedWritePair; // Decryption, encryption.
				146	defm WriteAESIMC : X86SchedWritePair; // InvMixColumn.
				147	defm WriteAESKeyGen : X86SchedWritePair; // Key Generation.
				148
				149	// Carry-less multiplication instructions.
				150	defm WriteCLMul : X86SchedWritePair;
				151
				152	// Catch-all for expensive system instructions.
				153	def WriteSystem : SchedWrite;
				154
				155	// AVX2.
				156	defm WriteFShuffle256 : X86SchedWritePair; // Fp 256-bit width vector shuffles.
Simon Pilgrim	89c8a10	2018-04-11 13:49:19 +0000	[diff] [blame]	157	defm WriteFVarShuffle256 : X86SchedWritePair; // Fp 256-bit width variable shuffles.
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	158	defm WriteShuffle256 : X86SchedWritePair; // 256-bit width vector shuffles.
Simon Pilgrim	89c8a10	2018-04-11 13:49:19 +0000	[diff] [blame]	159	defm WriteVarShuffle256 : X86SchedWritePair; // 256-bit width vector variable shuffles.
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	160	defm WriteVarVecShift : X86SchedWritePair; // Variable vector shifts.
				161
				162	// Old microcoded instructions that nobody use.
				163	def WriteMicrocoded : SchedWrite;
				164
				165	// Fence instructions.
				166	def WriteFence : SchedWrite;
				167
				168	// Nop, not very useful expect it provides a model for nops!
				169	def WriteNop : SchedWrite;
				170
				171	//===----------------------------------------------------------------------===//
Simon Pilgrim	35935c0	2018-04-12 18:46:15 +0000	[diff] [blame]	172	// Generic Processor Scheduler Models.
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	173
				174	// IssueWidth is analogous to the number of decode units. Core and its
				175	// descendents, including Nehalem and SandyBridge have 4 decoders.
				176	// Resources beyond the decoder operate on micro-ops and are bufferred
				177	// so adjacent micro-ops don't directly compete.
				178	//
				179	// MicroOpBufferSize > 1 indicates that RAW dependencies can be
				180	// decoded in the same cycle. The value 32 is a reasonably arbitrary
				181	// number of in-flight instructions.
				182	//
				183	// HighLatency=10 is optimistic. X86InstrInfo::isHighLatencyDef
				184	// indicates high latency opcodes. Alternatively, InstrItinData
				185	// entries may be included here to define specific operand
				186	// latencies. Since these latencies are not used for pipeline hazards,
				187	// they do not need to be exact.
				188	//
Simon Pilgrim	e0c7868	2018-04-13 14:31:57 +0000	[diff] [blame]	189	// The GenericX86Model contains no instruction schedules
Simon Pilgrim	a271c54	2017-05-03 15:42:29 +0000	[diff] [blame]	190	// and disables PostRAScheduler.
				191	class GenericX86Model : SchedMachineModel {
				192	let IssueWidth = 4;
				193	let MicroOpBufferSize = 32;
				194	let LoadLatency = 4;
				195	let HighLatency = 10;
				196	let PostRAScheduler = 0;
				197	let CompleteModel = 0;
				198	}
				199
				200	def GenericModel : GenericX86Model;
				201
				202	// Define a model with the PostRAScheduler enabled.
				203	def GenericPostRAModel : GenericX86Model {
				204	let PostRAScheduler = 1;
				205	}
				206