Blame - llvm/lib/Target/R600/AMDGPUISelLowering.h - toolchain/llvm-project

blob: e2000a04ba4ec1c6bd4ae675b5bc4492a78f05e9 [file] [log] [blame]

Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	1	//===-- AMDGPUISelLowering.h - AMDGPU Lowering Interface --------- C++ --===//
				2	//
				3	// The LLVM Compiler Infrastructure
				4	//
				5	// This file is distributed under the University of Illinois Open Source
				6	// License. See LICENSE.TXT for details.
				7	//
				8	//===----------------------------------------------------------------------===//
				9	//
				10	/// \file
				11	/// \brief Interface definition of the TargetLowering class that is common
				12	/// to all AMD GPUs.
				13	//
				14	//===----------------------------------------------------------------------===//
				15
				16	#ifndef AMDGPUISELLOWERING_H
				17	#define AMDGPUISELLOWERING_H
				18
				19	#include "llvm/Target/TargetLowering.h"
				20
				21	namespace llvm {
				22
Tom Stellard	c026e8b	2013-06-28 15:47:08 +0000	[diff] [blame]	23	class AMDGPUMachineFunction;
Matt Arsenault	41e2f2b	2014-02-24 21:01:28 +0000	[diff] [blame]	24	class AMDGPUSubtarget;
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	25	class MachineRegisterInfo;
				26
				27	class AMDGPUTargetLowering : public TargetLowering {
Matt Arsenault	41e2f2b	2014-02-24 21:01:28 +0000	[diff] [blame]	28	protected:
				29	const AMDGPUSubtarget *Subtarget;
				30
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	31	private:
Tom Stellard	04c0e98	2014-01-22 19:24:21 +0000	[diff] [blame]	32	SDValue LowerConstantInitializer(const Constant* Init, const GlobalValue *GV,
				33	const SDValue &InitPtr,
				34	SDValue Chain,
				35	SelectionDAG &DAG) const;
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	36	SDValue LowerFrameIndex(SDValue Op, SelectionDAG &DAG) const;
Tom Stellard	d86003e	2013-08-14 23:25:00 +0000	[diff] [blame]	37	SDValue LowerEXTRACT_SUBVECTOR(SDValue Op, SelectionDAG &DAG) const;
				38	SDValue LowerCONCAT_VECTORS(SDValue Op, SelectionDAG &DAG) const;
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	39	SDValue LowerINTRINSIC_WO_CHAIN(SDValue Op, SelectionDAG &DAG) const;
Tom Stellard	2ffc330	2013-08-26 15:05:44 +0000	[diff] [blame]	40	/// \brief Lower vector stores by merging the vector elements into an integer
				41	/// of the same bitwidth.
				42	SDValue MergeVectorStore(const SDValue &Op, SelectionDAG &DAG) const;
				43	/// \brief Split a vector store into multiple scalar stores.
Matt Arsenault	209a7b9	2014-04-18 07:40:20 +0000	[diff] [blame]	44	/// \returns The resulting chain.
Matt Arsenault	1578aa7	2014-06-15 20:08:02 +0000	[diff] [blame]	45
				46	SDValue LowerSDIV(SDValue Op, SelectionDAG &DAG) const;
				47	SDValue LowerSDIV24(SDValue Op, SelectionDAG &DAG) const;
				48	SDValue LowerSDIV32(SDValue Op, SelectionDAG &DAG) const;
				49	SDValue LowerSDIV64(SDValue Op, SelectionDAG &DAG) const;
				50	SDValue LowerSREM(SDValue Op, SelectionDAG &DAG) const;
				51	SDValue LowerSREM32(SDValue Op, SelectionDAG &DAG) const;
				52	SDValue LowerSREM64(SDValue Op, SelectionDAG &DAG) const;
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	53	SDValue LowerUDIVREM(SDValue Op, SelectionDAG &DAG) const;
Matt Arsenault	4601093	2014-06-18 17:05:30 +0000	[diff] [blame]	54	SDValue LowerFCEIL(SDValue Op, SelectionDAG &DAG) const;
				55	SDValue LowerFTRUNC(SDValue Op, SelectionDAG &DAG) const;
Matt Arsenault	e8208ec	2014-06-18 17:05:26 +0000	[diff] [blame]	56	SDValue LowerFRINT(SDValue Op, SelectionDAG &DAG) const;
Matt Arsenault	692bd5e	2014-06-18 22:03:45 +0000	[diff] [blame]	57	SDValue LowerFNEARBYINT(SDValue Op, SelectionDAG &DAG) const;
Matt Arsenault	4601093	2014-06-18 17:05:30 +0000	[diff] [blame]	58	SDValue LowerFFLOOR(SDValue Op, SelectionDAG &DAG) const;
				59
Tom Stellard	c947d8c	2013-10-30 17:22:05 +0000	[diff] [blame]	60	SDValue LowerUINT_TO_FP(SDValue Op, SelectionDAG &DAG) const;
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	61
Matt Arsenault	14d4645	2014-06-15 20:23:38 +0000	[diff] [blame]	62	SDValue ExpandSIGN_EXTEND_INREG(SDValue Op,
				63	unsigned BitsDiff,
				64	SelectionDAG &DAG) const;
				65	SDValue LowerSIGN_EXTEND_INREG(SDValue Op, SelectionDAG &DAG) const;
				66
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	67	protected:
Matt Arsenault	c9df794	2014-06-11 03:29:54 +0000	[diff] [blame]	68	static EVT getEquivalentMemType(LLVMContext &Context, EVT VT);
				69	static EVT getEquivalentLoadRegType(LLVMContext &Context, EVT VT);
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	70
				71	/// \brief Helper function that adds Reg to the LiveIn list of the DAG's
				72	/// MachineFunction.
				73	///
				74	/// \returns a RegisterSDNode representing Reg.
Tom Stellard	94593ee	2013-06-03 17:40:18 +0000	[diff] [blame]	75	virtual SDValue CreateLiveInRegister(SelectionDAG &DAG,
				76	const TargetRegisterClass *RC,
				77	unsigned Reg, EVT VT) const;
Tom Stellard	c026e8b	2013-06-28 15:47:08 +0000	[diff] [blame]	78	SDValue LowerGlobalAddress(AMDGPUMachineFunction *MFI, SDValue Op,
				79	SelectionDAG &DAG) const;
Tom Stellard	35bb18c	2013-08-26 15:06:04 +0000	[diff] [blame]	80	/// \brief Split a vector load into multiple scalar loads.
				81	SDValue SplitVectorLoad(const SDValue &Op, SelectionDAG &DAG) const;
Tom Stellard	af77543	2013-10-23 00:44:32 +0000	[diff] [blame]	82	SDValue SplitVectorStore(SDValue Op, SelectionDAG &DAG) const;
Tom Stellard	e937360	2014-01-22 19:24:14 +0000	[diff] [blame]	83	SDValue LowerLOAD(SDValue Op, SelectionDAG &DAG) const;
Tom Stellard	2ffc330	2013-08-26 15:05:44 +0000	[diff] [blame]	84	SDValue LowerSTORE(SDValue Op, SelectionDAG &DAG) const;
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	85	bool isHWTrueValue(SDValue Op) const;
				86	bool isHWFalseValue(SDValue Op) const;
				87
Tom Stellard	af77543	2013-10-23 00:44:32 +0000	[diff] [blame]	88	/// The SelectionDAGBuilder will automatically promote function arguments
				89	/// with illegal types. However, this does not work for the AMDGPU targets
				90	/// since the function arguments are stored in memory as these illegal types.
				91	/// In order to handle this properly we need to get the origianl types sizes
				92	/// from the LLVM IR Function and fixup the ISD:InputArg values before
				93	/// passing them to AnalyzeFormalArguments()
				94	void getOriginalFunctionArgs(SelectionDAG &DAG,
				95	const Function *F,
				96	const SmallVectorImpl<ISD::InputArg> &Ins,
				97	SmallVectorImpl<ISD::InputArg> &OrigIns) const;
Christian Konig	2c8f6d5	2013-03-07 09:03:52 +0000	[diff] [blame]	98	void AnalyzeFormalArguments(CCState &State,
				99	const SmallVectorImpl<ISD::InputArg> &Ins) const;
				100
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	101	public:
				102	AMDGPUTargetLowering(TargetMachine &TM);
				103
Craig Topper	5656db4	2014-04-29 07:57:24 +0000	[diff] [blame]	104	bool isFAbsFree(EVT VT) const override;
				105	bool isFNegFree(EVT VT) const override;
				106	bool isTruncateFree(EVT Src, EVT Dest) const override;
				107	bool isTruncateFree(Type Src, Type Dest) const override;
Matt Arsenault	b517c81	2014-03-27 17:23:31 +0000	[diff] [blame]	108
Craig Topper	5656db4	2014-04-29 07:57:24 +0000	[diff] [blame]	109	bool isZExtFree(Type Src, Type Dest) const override;
				110	bool isZExtFree(EVT Src, EVT Dest) const override;
Matt Arsenault	b517c81	2014-03-27 17:23:31 +0000	[diff] [blame]	111
Craig Topper	5656db4	2014-04-29 07:57:24 +0000	[diff] [blame]	112	bool isNarrowingProfitable(EVT VT1, EVT VT2) const override;
Matt Arsenault	a7f1e0c	2014-03-24 19:43:31 +0000	[diff] [blame]	113
Craig Topper	5656db4	2014-04-29 07:57:24 +0000	[diff] [blame]	114	MVT getVectorIdxTy() const override;
Matt Arsenault	14d4645	2014-06-15 20:23:38 +0000	[diff] [blame]	115
				116	bool isFPImmLegal(const APFloat &Imm, EVT VT) const override;
				117	bool ShouldShrinkFPConstant(EVT VT) const override;
				118
Craig Topper	5656db4	2014-04-29 07:57:24 +0000	[diff] [blame]	119	bool isLoadBitCastBeneficial(EVT, EVT) const override;
				120	SDValue LowerReturn(SDValue Chain, CallingConv::ID CallConv,
				121	bool isVarArg,
				122	const SmallVectorImpl<ISD::OutputArg> &Outs,
				123	const SmallVectorImpl<SDValue> &OutVals,
				124	SDLoc DL, SelectionDAG &DAG) const override;
				125	SDValue LowerCall(CallLoweringInfo &CLI,
				126	SmallVectorImpl<SDValue> &InVals) const override;
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	127
Craig Topper	5656db4	2014-04-29 07:57:24 +0000	[diff] [blame]	128	SDValue LowerOperation(SDValue Op, SelectionDAG &DAG) const override;
Matt Arsenault	14d4645	2014-06-15 20:23:38 +0000	[diff] [blame]	129	SDValue PerformDAGCombine(SDNode *N, DAGCombinerInfo &DCI) const override;
Craig Topper	5656db4	2014-04-29 07:57:24 +0000	[diff] [blame]	130	void ReplaceNodeResults(SDNode * N,
				131	SmallVectorImpl<SDValue> &Results,
				132	SelectionDAG &DAG) const override;
Matt Arsenault	d125d74	2014-03-27 17:23:24 +0000	[diff] [blame]	133
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	134	SDValue LowerIntrinsicIABS(SDValue Op, SelectionDAG &DAG) const;
				135	SDValue LowerIntrinsicLRP(SDValue Op, SelectionDAG &DAG) const;
Tom Stellard	afa8b53	2014-05-09 16:42:16 +0000	[diff] [blame]	136	SDValue CombineMinMax(SDNode *N, SelectionDAG &DAG) const;
Craig Topper	5656db4	2014-04-29 07:57:24 +0000	[diff] [blame]	137	const char* getTargetNodeName(unsigned Opcode) const override;
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	138
Craig Topper	5656db4	2014-04-29 07:57:24 +0000	[diff] [blame]	139	virtual SDNode PostISelFolding(MachineSDNode N,
				140	SelectionDAG &DAG) const {
Christian Konig	d910b7d	2013-02-26 17:52:16 +0000	[diff] [blame]	141	return N;
				142	}
				143
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	144	/// \brief Determine which of the bits specified in \p Mask are known to be
				145	/// either zero or one and return them in the \p KnownZero and \p KnownOne
				146	/// bitsets.
Jay Foad	a0653a3	2014-05-14 21:14:37 +0000	[diff] [blame]	147	void computeKnownBitsForTargetNode(const SDValue Op,
				148	APInt &KnownZero,
				149	APInt &KnownOne,
				150	const SelectionDAG &DAG,
				151	unsigned Depth = 0) const override;
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	152
Matt Arsenault	bf8694d	2014-05-22 18:09:03 +0000	[diff] [blame]	153	virtual unsigned ComputeNumSignBitsForTargetNode(
				154	SDValue Op,
				155	const SelectionDAG &DAG,
				156	unsigned Depth = 0) const override;
				157
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	158	private:
Matt Arsenault	14d4645	2014-06-15 20:23:38 +0000	[diff] [blame]	159	// Functions defined in AMDILISelLowering.cpp
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	160	void InitAMDILLowering();
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	161	SDValue LowerBRCOND(SDValue Op, SelectionDAG &DAG) const;
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	162	};
				163
				164	namespace AMDGPUISD {
				165
				166	enum {
				167	// AMDIL ISD Opcodes
				168	FIRST_NUMBER = ISD::BUILTIN_OP_END,
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	169	CALL, // Function call based on a single integer
				170	UMUL, // 32bit unsigned multiplication
				171	DIV_INF, // Divide with infinity returned on zero divisor
				172	RET_FLAG,
				173	BRANCH_COND,
				174	// End AMDIL ISD Opcodes
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	175	DWORDADDR,
				176	FRACT,
Matt Arsenault	5d47d4a	2014-06-12 21:15:44 +0000	[diff] [blame]	177	CLAMP,
Matt Arsenault	a0050b0	2014-06-19 01:19:19 +0000	[diff] [blame^]	178
				179	// SIN_HW, COS_HW - f32 for SI, 1 ULP max error, valid from -100 pi to 100 pi.
				180	// Denormals handled on some parts.
Vincent Lejeune	b55940c	2013-07-09 15:03:11 +0000	[diff] [blame]	181	COS_HW,
				182	SIN_HW,
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	183	FMAX,
				184	SMAX,
				185	UMAX,
				186	FMIN,
				187	SMIN,
				188	UMIN,
				189	URECIP,
Matt Arsenault	a0050b0	2014-06-19 01:19:19 +0000	[diff] [blame^]	190	DIV_SCALE,
				191	DIV_FMAS,
				192	DIV_FIXUP,
				193	TRIG_PREOP, // 1 ULP max error for f64
				194
				195	// RCP, RSQ - For f32, 1 ULP max error, no denormal handling.
				196	// For f64, max error 2^29 ULP, handles denormals.
				197	RCP,
				198	RSQ,
Vincent Lejeune	519f21e	2013-05-17 16:50:32 +0000	[diff] [blame]	199	DOT4,
Matt Arsenault	fae0298	2014-03-17 18:58:11 +0000	[diff] [blame]	200	BFE_U32, // Extract range of bits with zero extension to 32-bits.
				201	BFE_I32, // Extract range of bits with sign extension to 32-bits.
Matt Arsenault	b345836	2014-03-31 18:21:13 +0000	[diff] [blame]	202	BFI, // (src0 & src1) \| (~src0 & src2)
				203	BFM, // Insert a range of bits into a 32-bit word.
Matt Arsenault	43160e7	2014-06-18 17:13:57 +0000	[diff] [blame]	204	BREV, // Reverse bits.
Tom Stellard	50122a5	2014-04-07 19:45:41 +0000	[diff] [blame]	205	MUL_U24,
				206	MUL_I24,
Matt Arsenault	eb26020	2014-05-22 18:00:15 +0000	[diff] [blame]	207	MAD_U24,
				208	MAD_I24,
Vincent Lejeune	d3eed66	2013-05-17 16:50:20 +0000	[diff] [blame]	209	TEXTURE_FETCH,
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	210	EXPORT,
Tom Stellard	ff62c35	2013-01-23 02:09:03 +0000	[diff] [blame]	211	CONST_ADDRESS,
Tom Stellard	f3b2a1e	2013-02-06 17:32:29 +0000	[diff] [blame]	212	REGISTER_LOAD,
				213	REGISTER_STORE,
Tom Stellard	9fa1791	2013-08-14 23:24:45 +0000	[diff] [blame]	214	LOAD_INPUT,
				215	SAMPLE,
				216	SAMPLEB,
				217	SAMPLED,
				218	SAMPLEL,
Matt Arsenault	364a674	2014-06-11 17:50:44 +0000	[diff] [blame]	219
				220	// These cvt_f32_ubyte* nodes need to remain consecutive and in order.
				221	CVT_F32_UBYTE0,
				222	CVT_F32_UBYTE1,
				223	CVT_F32_UBYTE2,
				224	CVT_F32_UBYTE3,
Tom Stellard	880a80a	2014-06-17 16:53:14 +0000	[diff] [blame]	225	/// This node is for VLIW targets and it is used to represent a vector
				226	/// that is stored in consecutive registers with the same channel.
				227	/// For example:
				228	/// \|X \|Y\|Z\|W\|
				229	/// T0\|v.x\| \| \| \|
				230	/// T1\|v.y\| \| \| \|
				231	/// T2\|v.z\| \| \| \|
				232	/// T3\|v.w\| \| \| \|
				233	BUILD_VERTICAL_VECTOR,
Tom Stellard	9fa1791	2013-08-14 23:24:45 +0000	[diff] [blame]	234	FIRST_MEM_OPCODE_NUMBER = ISD::FIRST_TARGET_MEMORY_OPCODE,
Tom Stellard	d3ee8c1	2013-08-16 01:12:06 +0000	[diff] [blame]	235	STORE_MSKOR,
Tom Stellard	9fa1791	2013-08-14 23:24:45 +0000	[diff] [blame]	236	LOAD_CONSTANT,
Tom Stellard	afcf12f	2013-09-12 02:55:14 +0000	[diff] [blame]	237	TBUFFER_STORE_FORMAT,
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	238	LAST_AMDGPU_ISD_NUMBER
				239	};
				240
				241
				242	} // End namespace AMDGPUISD
				243
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	244	} // End namespace llvm
				245
				246	#endif // AMDGPUISELLOWERING_H