Blame - llvm/lib/Target/AMDGPU/AMDGPUInstrInfo.td - toolchain/llvm-project

blob: cf087b7ebc300f0436cbd47cda1485b0e1edf924 [file] [log] [blame]

Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	1	//===-- AMDGPUInstrInfo.td - AMDGPU DAG nodes --------------- tablegen --===//
				2	//
				3	// The LLVM Compiler Infrastructure
				4	//
				5	// This file is distributed under the University of Illinois Open Source
				6	// License. See LICENSE.TXT for details.
				7	//
				8	//===----------------------------------------------------------------------===//
				9	//
				10	// This file contains DAG node defintions for the AMDGPU target.
				11	//
				12	//===----------------------------------------------------------------------===//
				13
				14	//===----------------------------------------------------------------------===//
				15	// AMDGPU DAG Profiles
				16	//===----------------------------------------------------------------------===//
				17
				18	def AMDGPUDTIntTernaryOp : SDTypeProfile<1, 3, [
				19	SDTCisSameAs<0, 1>, SDTCisSameAs<0, 2>, SDTCisInt<0>, SDTCisInt<3>
				20	]>;
				21
Matt Arsenault	a0050b0	2014-06-19 01:19:19 +0000	[diff] [blame]	22	def AMDGPUTrigPreOp : SDTypeProfile<1, 2,
				23	[SDTCisSameAs<0, 1>, SDTCisFP<0>, SDTCisInt<2>]
				24	>;
				25
Matt Arsenault	2e7cc48	2014-08-15 17:30:25 +0000	[diff] [blame]	26	def AMDGPULdExpOp : SDTypeProfile<1, 2,
				27	[SDTCisSameAs<0, 1>, SDTCisFP<0>, SDTCisInt<2>]
				28	>;
				29
Matt Arsenault	4831ce5	2015-01-06 23:00:37 +0000	[diff] [blame]	30	def AMDGPUFPClassOp : SDTypeProfile<1, 2,
				31	[SDTCisInt<0>, SDTCisFP<1>, SDTCisInt<2>]
				32	>;
				33
Matt Arsenault	a0050b0	2014-06-19 01:19:19 +0000	[diff] [blame]	34	def AMDGPUDivScaleOp : SDTypeProfile<2, 3,
				35	[SDTCisFP<0>, SDTCisInt<1>, SDTCisSameAs<0, 2>, SDTCisSameAs<0, 3>, SDTCisSameAs<0, 4>]
				36	>;
				37
Matt Arsenault	1bc9d95	2015-02-14 04:22:00 +0000	[diff] [blame]	38	// float, float, float, vcc
				39	def AMDGPUFmasOp : SDTypeProfile<1, 4,
				40	[SDTCisFP<0>, SDTCisSameAs<0, 1>, SDTCisSameAs<0, 2>, SDTCisSameAs<0, 3>, SDTCisInt<4>]
				41	>;
				42
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	43	//===----------------------------------------------------------------------===//
				44	// AMDGPU DAG Nodes
				45	//
				46
Jan Vesely	fbcb754	2016-05-13 20:39:18 +0000	[diff] [blame]	47	def AMDGPUconstdata_ptr : SDNode<
				48	"AMDGPUISD::CONST_DATA_PTR", SDTypeProfile <1, 1, [SDTCisVT<0, iPTR>,
				49	SDTCisVT<0, iPTR>]>
				50	>;
				51
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	52	// This argument to this node is a dword address.
				53	def AMDGPUdwordaddr : SDNode<"AMDGPUISD::DWORDADDR", SDTIntUnaryOp>;
				54
Matt Arsenault	ad14ce8	2014-07-19 18:44:39 +0000	[diff] [blame]	55	def AMDGPUcos : SDNode<"AMDGPUISD::COS_HW", SDTFPUnaryOp>;
				56	def AMDGPUsin : SDNode<"AMDGPUISD::SIN_HW", SDTFPUnaryOp>;
				57
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	58	// out = a - floor(a)
				59	def AMDGPUfract : SDNode<"AMDGPUISD::FRACT", SDTFPUnaryOp>;
				60
Matt Arsenault	a0050b0	2014-06-19 01:19:19 +0000	[diff] [blame]	61	// out = 1.0 / a
				62	def AMDGPUrcp : SDNode<"AMDGPUISD::RCP", SDTFPUnaryOp>;
				63
				64	// out = 1.0 / sqrt(a)
				65	def AMDGPUrsq : SDNode<"AMDGPUISD::RSQ", SDTFPUnaryOp>;
				66
Matt Arsenault	257d48d	2014-06-24 22:13:39 +0000	[diff] [blame]	67	// out = 1.0 / sqrt(a)
				68	def AMDGPUrsq_legacy : SDNode<"AMDGPUISD::RSQ_LEGACY", SDTFPUnaryOp>;
				69
				70	// out = 1.0 / sqrt(a) result clamped to +/- max_float.
Matt Arsenault	79963e8	2016-02-13 01:03:00 +0000	[diff] [blame]	71	def AMDGPUrsq_clamp : SDNode<"AMDGPUISD::RSQ_CLAMP", SDTFPUnaryOp>;
Matt Arsenault	257d48d	2014-06-24 22:13:39 +0000	[diff] [blame]	72
Matt Arsenault	2e7cc48	2014-08-15 17:30:25 +0000	[diff] [blame]	73	def AMDGPUldexp : SDNode<"AMDGPUISD::LDEXP", AMDGPULdExpOp>;
				74
Matt Arsenault	4831ce5	2015-01-06 23:00:37 +0000	[diff] [blame]	75	def AMDGPUfp_class : SDNode<"AMDGPUISD::FP_CLASS", AMDGPUFPClassOp>;
				76
Matt Arsenault	da59f3d	2014-11-13 23:03:09 +0000	[diff] [blame]	77	// out = max(a, b) a and b are floats, where a nan comparison fails.
				78	// This is not commutative because this gives the second operand:
				79	// x < nan ? x : nan -> nan
				80	// nan < x ? nan : x -> x
				81	def AMDGPUfmax_legacy : SDNode<"AMDGPUISD::FMAX_LEGACY", SDTFPBinOp,
Matt Arsenault	145d571	2014-12-12 02:30:33 +0000	[diff] [blame]	82	[]
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	83	>;
				84
Matt Arsenault	5d47d4a	2014-06-12 21:15:44 +0000	[diff] [blame]	85	def AMDGPUclamp : SDNode<"AMDGPUISD::CLAMP", SDTFPTernaryOp, []>;
				86
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	87	// out = max(a, b) a and b are signed ints
				88	def AMDGPUsmax : SDNode<"AMDGPUISD::SMAX", SDTIntBinOp,
				89	[SDNPCommutative, SDNPAssociative]
				90	>;
				91
				92	// out = max(a, b) a and b are unsigned ints
				93	def AMDGPUumax : SDNode<"AMDGPUISD::UMAX", SDTIntBinOp,
				94	[SDNPCommutative, SDNPAssociative]
				95	>;
				96
Matt Arsenault	da59f3d	2014-11-13 23:03:09 +0000	[diff] [blame]	97	// out = min(a, b) a and b are floats, where a nan comparison fails.
				98	def AMDGPUfmin_legacy : SDNode<"AMDGPUISD::FMIN_LEGACY", SDTFPBinOp,
Matt Arsenault	145d571	2014-12-12 02:30:33 +0000	[diff] [blame]	99	[]
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	100	>;
				101
Matt Arsenault	cc3c2b3	2014-11-14 20:08:52 +0000	[diff] [blame]	102	// FIXME: TableGen doesn't like commutative instructions with more
				103	// than 2 operands.
				104	// out = max(a, b, c) a, b and c are floats
				105	def AMDGPUfmax3 : SDNode<"AMDGPUISD::FMAX3", SDTFPTernaryOp,
				106	[/SDNPCommutative, SDNPAssociative/]
				107	>;
				108
				109	// out = max(a, b, c) a, b, and c are signed ints
				110	def AMDGPUsmax3 : SDNode<"AMDGPUISD::SMAX3", AMDGPUDTIntTernaryOp,
				111	[/SDNPCommutative, SDNPAssociative/]
				112	>;
				113
				114	// out = max(a, b, c) a, b and c are unsigned ints
				115	def AMDGPUumax3 : SDNode<"AMDGPUISD::UMAX3", AMDGPUDTIntTernaryOp,
				116	[/SDNPCommutative, SDNPAssociative/]
				117	>;
				118
				119	// out = min(a, b, c) a, b and c are floats
				120	def AMDGPUfmin3 : SDNode<"AMDGPUISD::FMIN3", SDTFPTernaryOp,
				121	[/SDNPCommutative, SDNPAssociative/]
				122	>;
				123
				124	// out = min(a, b, c) a, b and c are signed ints
				125	def AMDGPUsmin3 : SDNode<"AMDGPUISD::SMIN3", AMDGPUDTIntTernaryOp,
				126	[/SDNPCommutative, SDNPAssociative/]
				127	>;
				128
				129	// out = min(a, b) a and b are unsigned ints
				130	def AMDGPUumin3 : SDNode<"AMDGPUISD::UMIN3", AMDGPUDTIntTernaryOp,
				131	[/SDNPCommutative, SDNPAssociative/]
				132	>;
Matt Arsenault	364a674	2014-06-11 17:50:44 +0000	[diff] [blame]	133
Jan Vesely	808fff5	2015-04-30 17:15:56 +0000	[diff] [blame]	134	// out = (src0 + src1 > 0xFFFFFFFF) ? 1 : 0
				135	def AMDGPUcarry : SDNode<"AMDGPUISD::CARRY", SDTIntBinOp, []>;
				136
				137	// out = (src1 > src0) ? 1 : 0
				138	def AMDGPUborrow : SDNode<"AMDGPUISD::BORROW", SDTIntBinOp, []>;
				139
				140
Matt Arsenault	364a674	2014-06-11 17:50:44 +0000	[diff] [blame]	141	def AMDGPUcvt_f32_ubyte0 : SDNode<"AMDGPUISD::CVT_F32_UBYTE0",
				142	SDTIntToFPOp, []>;
				143	def AMDGPUcvt_f32_ubyte1 : SDNode<"AMDGPUISD::CVT_F32_UBYTE1",
				144	SDTIntToFPOp, []>;
				145	def AMDGPUcvt_f32_ubyte2 : SDNode<"AMDGPUISD::CVT_F32_UBYTE2",
				146	SDTIntToFPOp, []>;
				147	def AMDGPUcvt_f32_ubyte3 : SDNode<"AMDGPUISD::CVT_F32_UBYTE3",
				148	SDTIntToFPOp, []>;
				149
				150
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	151	// urecip - This operation is a helper for integer division, it returns the
				152	// result of 1 / a as a fractional unsigned integer.
				153	// out = (2^32 / a) + e
				154	// e is rounding error
				155	def AMDGPUurecip : SDNode<"AMDGPUISD::URECIP", SDTIntUnaryOp>;
				156
Matt Arsenault	a0050b0	2014-06-19 01:19:19 +0000	[diff] [blame]	157	// Special case divide preop and flags.
				158	def AMDGPUdiv_scale : SDNode<"AMDGPUISD::DIV_SCALE", AMDGPUDivScaleOp>;
				159
				160	// Special case divide FMA with scale and flags (src0 = Quotient,
				161	// src1 = Denominator, src2 = Numerator).
Matt Arsenault	1bc9d95	2015-02-14 04:22:00 +0000	[diff] [blame]	162	def AMDGPUdiv_fmas : SDNode<"AMDGPUISD::DIV_FMAS", AMDGPUFmasOp>;
Matt Arsenault	a0050b0	2014-06-19 01:19:19 +0000	[diff] [blame]	163
				164	// Single or double precision division fixup.
				165	// Special case divide fixup and flags(src0 = Quotient, src1 =
				166	// Denominator, src2 = Numerator).
				167	def AMDGPUdiv_fixup : SDNode<"AMDGPUISD::DIV_FIXUP", SDTFPTernaryOp>;
				168
				169	// Look Up 2.0 / pi src0 with segment select src1[4:0]
				170	def AMDGPUtrig_preop : SDNode<"AMDGPUISD::TRIG_PREOP", AMDGPUTrigPreOp>;
				171
Tom Stellard	f3b2a1e	2013-02-06 17:32:29 +0000	[diff] [blame]	172	def AMDGPUregister_load : SDNode<"AMDGPUISD::REGISTER_LOAD",
				173	SDTypeProfile<1, 2, [SDTCisPtrTy<1>, SDTCisInt<2>]>,
				174	[SDNPHasChain, SDNPMayLoad]>;
				175
				176	def AMDGPUregister_store : SDNode<"AMDGPUISD::REGISTER_STORE",
				177	SDTypeProfile<0, 3, [SDTCisPtrTy<1>, SDTCisInt<2>]>,
				178	[SDNPHasChain, SDNPMayStore]>;
Tom Stellard	d3ee8c1	2013-08-16 01:12:06 +0000	[diff] [blame]	179
Tom Stellard	f3d166a	2013-08-26 15:05:49 +0000	[diff] [blame]	180	// MSKOR instructions are atomic memory instructions used mainly for storing
				181	// 8-bit and 16-bit values. The definition is:
				182	//
				183	// MSKOR(dst, mask, src) MEM[dst] = ((MEM[dst] & ~mask) \| src)
				184	//
				185	// src0: vec4(src, 0, 0, mask)
Matt Arsenault	da59f3d	2014-11-13 23:03:09 +0000	[diff] [blame]	186	// src1: dst - rat offset (aka pointer) in dwords
Tom Stellard	d3ee8c1	2013-08-16 01:12:06 +0000	[diff] [blame]	187	def AMDGPUstore_mskor : SDNode<"AMDGPUISD::STORE_MSKOR",
				188	SDTypeProfile<0, 2, []>,
				189	[SDNPHasChain, SDNPMayStore, SDNPMemOperand]>;
Tom Stellard	4d566b2	2013-11-27 21:23:20 +0000	[diff] [blame]	190
Tom Stellard	354a43c	2016-04-01 18:27:37 +0000	[diff] [blame]	191	def AMDGPUatomic_cmp_swap : SDNode<"AMDGPUISD::ATOMIC_CMP_SWAP",
				192	SDTypeProfile<1, 2, [SDTCisPtrTy<1>, SDTCisVec<2>]>,
				193	[SDNPHasChain, SDNPMayStore, SDNPMayLoad,
				194	SDNPMemOperand]>;
				195
Tom Stellard	4d566b2	2013-11-27 21:23:20 +0000	[diff] [blame]	196	def AMDGPUround : SDNode<"ISD::FROUND",
				197	SDTypeProfile<1, 1, [SDTCisFP<0>, SDTCisSameAs<0,1>]>>;
Matt Arsenault	fae0298	2014-03-17 18:58:11 +0000	[diff] [blame]	198
				199	def AMDGPUbfe_u32 : SDNode<"AMDGPUISD::BFE_U32", AMDGPUDTIntTernaryOp>;
				200	def AMDGPUbfe_i32 : SDNode<"AMDGPUISD::BFE_I32", AMDGPUDTIntTernaryOp>;
Matt Arsenault	b345836	2014-03-31 18:21:13 +0000	[diff] [blame]	201	def AMDGPUbfi : SDNode<"AMDGPUISD::BFI", AMDGPUDTIntTernaryOp>;
				202	def AMDGPUbfm : SDNode<"AMDGPUISD::BFM", SDTIntBinOp>;
Matt Arsenault	fae0298	2014-03-17 18:58:11 +0000	[diff] [blame]	203
Matt Arsenault	de5fbe9	2016-01-11 17:02:00 +0000	[diff] [blame]	204	def AMDGPUffbh_u32 : SDNode<"AMDGPUISD::FFBH_U32", SDTIntUnaryOp>;
Matt Arsenault	c96e1de	2016-07-18 18:35:05 +0000	[diff] [blame^]	205	def AMDGPUffbh_i32 : SDNode<"AMDGPUISD::FFBH_I32", SDTIntUnaryOp>;
Matt Arsenault	de5fbe9	2016-01-11 17:02:00 +0000	[diff] [blame]	206
Tom Stellard	50122a5	2014-04-07 19:45:41 +0000	[diff] [blame]	207	// Signed and unsigned 24-bit mulitply. The highest 8-bits are ignore when
				208	// performing the mulitply. The result is a 32-bit value.
				209	def AMDGPUmul_u24 : SDNode<"AMDGPUISD::MUL_U24", SDTIntBinOp,
				210	[SDNPCommutative]
				211	>;
				212	def AMDGPUmul_i24 : SDNode<"AMDGPUISD::MUL_I24", SDTIntBinOp,
				213	[SDNPCommutative]
				214	>;
Matt Arsenault	eb26020	2014-05-22 18:00:15 +0000	[diff] [blame]	215
				216	def AMDGPUmad_u24 : SDNode<"AMDGPUISD::MAD_U24", AMDGPUDTIntTernaryOp,
				217	[]
				218	>;
				219	def AMDGPUmad_i24 : SDNode<"AMDGPUISD::MAD_I24", AMDGPUDTIntTernaryOp,
				220	[]
				221	>;
Tom Stellard	bc5b537	2014-06-13 16:38:59 +0000	[diff] [blame]	222
Matt Arsenault	f639c32	2016-01-28 20:53:42 +0000	[diff] [blame]	223	def AMDGPUsmed3 : SDNode<"AMDGPUISD::SMED3", AMDGPUDTIntTernaryOp,
				224	[]
				225	>;
				226
				227	def AMDGPUumed3 : SDNode<"AMDGPUISD::UMED3", AMDGPUDTIntTernaryOp,
				228	[]
				229	>;
				230
				231	def AMDGPUfmed3 : SDNode<"AMDGPUISD::FMED3", SDTFPTernaryOp, []>;
				232
Tom Stellard	fc92e77	2015-05-12 14:18:14 +0000	[diff] [blame]	233	def AMDGPUsendmsg : SDNode<"AMDGPUISD::SENDMSG",
				234	SDTypeProfile<0, 1, [SDTCisInt<0>]>,
				235	[SDNPHasChain, SDNPInGlue]>;
				236
Tom Stellard	2a9d947	2015-05-12 15:00:46 +0000	[diff] [blame]	237	def AMDGPUinterp_mov : SDNode<"AMDGPUISD::INTERP_MOV",
				238	SDTypeProfile<1, 3, [SDTCisFP<0>]>,
				239	[SDNPInGlue]>;
				240
				241	def AMDGPUinterp_p1 : SDNode<"AMDGPUISD::INTERP_P1",
				242	SDTypeProfile<1, 3, [SDTCisFP<0>]>,
				243	[SDNPInGlue, SDNPOutGlue]>;
				244
				245	def AMDGPUinterp_p2 : SDNode<"AMDGPUISD::INTERP_P2",
				246	SDTypeProfile<1, 4, [SDTCisFP<0>]>,
				247	[SDNPInGlue]>;
				248
Tom Stellard	bc5b537	2014-06-13 16:38:59 +0000	[diff] [blame]	249	//===----------------------------------------------------------------------===//
				250	// Flow Control Profile Types
				251	//===----------------------------------------------------------------------===//
				252	// Branch instruction where second and third are basic blocks
				253	def SDTIL_BRCond : SDTypeProfile<0, 2, [
				254	SDTCisVT<0, OtherVT>
				255	]>;
				256
				257	//===----------------------------------------------------------------------===//
				258	// Flow Control DAG Nodes
				259	//===----------------------------------------------------------------------===//
				260	def IL_brcond : SDNode<"AMDGPUISD::BRANCH_COND", SDTIL_BRCond, [SDNPHasChain]>;
				261
				262	//===----------------------------------------------------------------------===//
				263	// Call/Return DAG Nodes
				264	//===----------------------------------------------------------------------===//
Matt Arsenault	9babdf4	2016-06-22 20:15:28 +0000	[diff] [blame]	265	def AMDGPUendpgm : SDNode<"AMDGPUISD::ENDPGM", SDTNone,
				266	[SDNPHasChain, SDNPOptInGlue]>;
				267
				268	def AMDGPUreturn : SDNode<"AMDGPUISD::RETURN", SDTNone,
Marek Olsak	8a0f335	2016-01-13 17:23:04 +0000	[diff] [blame]	269	[SDNPHasChain, SDNPOptInGlue, SDNPVariadic]>;