Blame - llvm/lib/Target/R600/SIInstrInfo.cpp - toolchain/llvm-project

blob: aa9e1a3178238b1ea1c0dba18d73b4d6510a1283 [file] [log] [blame]

Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	1	//===-- SIInstrInfo.cpp - SI Instruction Information ---------------------===//
				2	//
				3	// The LLVM Compiler Infrastructure
				4	//
				5	// This file is distributed under the University of Illinois Open Source
				6	// License. See LICENSE.TXT for details.
				7	//
				8	//===----------------------------------------------------------------------===//
				9	//
				10	/// \file
				11	/// \brief SI Implementation of TargetInstrInfo.
				12	//
				13	//===----------------------------------------------------------------------===//
				14
				15
				16	#include "SIInstrInfo.h"
				17	#include "AMDGPUTargetMachine.h"
Tom Stellard	16a9a20	2013-08-14 23:24:17 +0000	[diff] [blame]	18	#include "SIDefines.h"
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	19	#include "SIMachineFunctionInfo.h"
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	20	#include "llvm/CodeGen/MachineFrameInfo.h"
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	21	#include "llvm/CodeGen/MachineInstrBuilder.h"
				22	#include "llvm/CodeGen/MachineRegisterInfo.h"
Tom Stellard	4e07b1d	2014-06-10 21:20:41 +0000	[diff] [blame]	23	#include "llvm/IR/Function.h"
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	24	#include "llvm/CodeGen/RegisterScavenging.h"
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	25	#include "llvm/MC/MCInstrDesc.h"
Matt Arsenault	c09cc3c	2014-11-19 00:01:31 +0000	[diff] [blame]	26	#include "llvm/Support/Debug.h"
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	27
				28	using namespace llvm;
				29
Tom Stellard	2e59a45	2014-06-13 01:32:00 +0000	[diff] [blame]	30	SIInstrInfo::SIInstrInfo(const AMDGPUSubtarget &st)
				31	: AMDGPUInstrInfo(st),
				32	RI(st) { }
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	33
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	34	//===----------------------------------------------------------------------===//
				35	// TargetInstrInfo callbacks
				36	//===----------------------------------------------------------------------===//
				37
Matt Arsenault	c10853f	2014-08-06 00:29:43 +0000	[diff] [blame]	38	static unsigned getNumOperandsNoGlue(SDNode *Node) {
				39	unsigned N = Node->getNumOperands();
				40	while (N && Node->getOperand(N - 1).getValueType() == MVT::Glue)
				41	--N;
				42	return N;
				43	}
				44
				45	static SDValue findChainOperand(SDNode *Load) {
				46	SDValue LastOp = Load->getOperand(getNumOperandsNoGlue(Load) - 1);
				47	assert(LastOp.getValueType() == MVT::Other && "Chain missing from load node");
				48	return LastOp;
				49	}
				50
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	51	/// \brief Returns true if both nodes have the same value for the given
				52	/// operand \p Op, or if both nodes do not have this operand.
				53	static bool nodesHaveSameOperandValue(SDNode N0, SDNode N1, unsigned OpName) {
				54	unsigned Opc0 = N0->getMachineOpcode();
				55	unsigned Opc1 = N1->getMachineOpcode();
				56
				57	int Op0Idx = AMDGPU::getNamedOperandIdx(Opc0, OpName);
				58	int Op1Idx = AMDGPU::getNamedOperandIdx(Opc1, OpName);
				59
				60	if (Op0Idx == -1 && Op1Idx == -1)
				61	return true;
				62
				63
				64	if ((Op0Idx == -1 && Op1Idx != -1) \|\|
				65	(Op1Idx == -1 && Op0Idx != -1))
				66	return false;
				67
				68	// getNamedOperandIdx returns the index for the MachineInstr's operands,
				69	// which includes the result as the first operand. We are indexing into the
				70	// MachineSDNode's operands, so we need to skip the result operand to get
				71	// the real index.
				72	--Op0Idx;
				73	--Op1Idx;
				74
Tom Stellard	b8b8413	2014-09-03 15:22:39 +0000	[diff] [blame]	75	return N0->getOperand(Op0Idx) == N1->getOperand(Op1Idx);
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	76	}
				77
Matt Arsenault	c10853f	2014-08-06 00:29:43 +0000	[diff] [blame]	78	bool SIInstrInfo::areLoadsFromSameBasePtr(SDNode Load0, SDNode Load1,
				79	int64_t &Offset0,
				80	int64_t &Offset1) const {
				81	if (!Load0->isMachineOpcode() \|\| !Load1->isMachineOpcode())
				82	return false;
				83
				84	unsigned Opc0 = Load0->getMachineOpcode();
				85	unsigned Opc1 = Load1->getMachineOpcode();
				86
				87	// Make sure both are actually loads.
				88	if (!get(Opc0).mayLoad() \|\| !get(Opc1).mayLoad())
				89	return false;
				90
				91	if (isDS(Opc0) && isDS(Opc1)) {
Tom Stellard	20fa0be	2014-10-07 21:09:20 +0000	[diff] [blame]	92
				93	// FIXME: Handle this case:
				94	if (getNumOperandsNoGlue(Load0) != getNumOperandsNoGlue(Load1))
				95	return false;
Matt Arsenault	c10853f	2014-08-06 00:29:43 +0000	[diff] [blame]	96
Matt Arsenault	c10853f	2014-08-06 00:29:43 +0000	[diff] [blame]	97	// Check base reg.
				98	if (Load0->getOperand(1) != Load1->getOperand(1))
				99	return false;
				100
				101	// Check chain.
				102	if (findChainOperand(Load0) != findChainOperand(Load1))
				103	return false;
				104
Matt Arsenault	972c12a	2014-09-17 17:48:32 +0000	[diff] [blame]	105	// Skip read2 / write2 variants for simplicity.
				106	// TODO: We should report true if the used offsets are adjacent (excluded
				107	// st64 versions).
				108	if (AMDGPU::getNamedOperandIdx(Opc0, AMDGPU::OpName::data1) != -1 \|\|
				109	AMDGPU::getNamedOperandIdx(Opc1, AMDGPU::OpName::data1) != -1)
				110	return false;
				111
Matt Arsenault	c10853f	2014-08-06 00:29:43 +0000	[diff] [blame]	112	Offset0 = cast<ConstantSDNode>(Load0->getOperand(2))->getZExtValue();
				113	Offset1 = cast<ConstantSDNode>(Load1->getOperand(2))->getZExtValue();
				114	return true;
				115	}
				116
				117	if (isSMRD(Opc0) && isSMRD(Opc1)) {
				118	assert(getNumOperandsNoGlue(Load0) == getNumOperandsNoGlue(Load1));
				119
				120	// Check base reg.
				121	if (Load0->getOperand(0) != Load1->getOperand(0))
				122	return false;
				123
				124	// Check chain.
				125	if (findChainOperand(Load0) != findChainOperand(Load1))
				126	return false;
				127
				128	Offset0 = cast<ConstantSDNode>(Load0->getOperand(1))->getZExtValue();
				129	Offset1 = cast<ConstantSDNode>(Load1->getOperand(1))->getZExtValue();
				130	return true;
				131	}
				132
				133	// MUBUF and MTBUF can access the same addresses.
				134	if ((isMUBUF(Opc0) \|\| isMTBUF(Opc0)) && (isMUBUF(Opc1) \|\| isMTBUF(Opc1))) {
Matt Arsenault	c10853f	2014-08-06 00:29:43 +0000	[diff] [blame]	135
				136	// MUBUF and MTBUF have vaddr at different indices.
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	137	if (!nodesHaveSameOperandValue(Load0, Load1, AMDGPU::OpName::soffset) \|\|
				138	findChainOperand(Load0) != findChainOperand(Load1) \|\|
				139	!nodesHaveSameOperandValue(Load0, Load1, AMDGPU::OpName::vaddr) \|\|
Tom Stellard	b8b8413	2014-09-03 15:22:39 +0000	[diff] [blame]	140	!nodesHaveSameOperandValue(Load0, Load1, AMDGPU::OpName::srsrc))
Matt Arsenault	c10853f	2014-08-06 00:29:43 +0000	[diff] [blame]	141	return false;
				142
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	143	int OffIdx0 = AMDGPU::getNamedOperandIdx(Opc0, AMDGPU::OpName::offset);
				144	int OffIdx1 = AMDGPU::getNamedOperandIdx(Opc1, AMDGPU::OpName::offset);
				145
				146	if (OffIdx0 == -1 \|\| OffIdx1 == -1)
				147	return false;
				148
				149	// getNamedOperandIdx returns the index for MachineInstrs. Since they
				150	// inlcude the output in the operand list, but SDNodes don't, we need to
				151	// subtract the index by one.
				152	--OffIdx0;
				153	--OffIdx1;
				154
				155	SDValue Off0 = Load0->getOperand(OffIdx0);
				156	SDValue Off1 = Load1->getOperand(OffIdx1);
				157
				158	// The offset might be a FrameIndexSDNode.
				159	if (!isa<ConstantSDNode>(Off0) \|\| !isa<ConstantSDNode>(Off1))
				160	return false;
				161
				162	Offset0 = cast<ConstantSDNode>(Off0)->getZExtValue();
				163	Offset1 = cast<ConstantSDNode>(Off1)->getZExtValue();
Matt Arsenault	c10853f	2014-08-06 00:29:43 +0000	[diff] [blame]	164	return true;
				165	}
				166
				167	return false;
				168	}
				169
Matt Arsenault	2e99112	2014-09-10 23:26:16 +0000	[diff] [blame]	170	static bool isStride64(unsigned Opc) {
				171	switch (Opc) {
				172	case AMDGPU::DS_READ2ST64_B32:
				173	case AMDGPU::DS_READ2ST64_B64:
				174	case AMDGPU::DS_WRITE2ST64_B32:
				175	case AMDGPU::DS_WRITE2ST64_B64:
				176	return true;
				177	default:
				178	return false;
				179	}
				180	}
				181
Matt Arsenault	1acc72f	2014-07-29 21:34:55 +0000	[diff] [blame]	182	bool SIInstrInfo::getLdStBaseRegImmOfs(MachineInstr *LdSt,
				183	unsigned &BaseReg, unsigned &Offset,
				184	const TargetRegisterInfo *TRI) const {
				185	unsigned Opc = LdSt->getOpcode();
				186	if (isDS(Opc)) {
Matt Arsenault	1acc72f	2014-07-29 21:34:55 +0000	[diff] [blame]	187	const MachineOperand OffsetImm = getNamedOperand(LdSt,
				188	AMDGPU::OpName::offset);
Matt Arsenault	7eb0a10	2014-07-30 01:01:10 +0000	[diff] [blame]	189	if (OffsetImm) {
				190	// Normal, single offset LDS instruction.
				191	const MachineOperand AddrReg = getNamedOperand(LdSt,
				192	AMDGPU::OpName::addr);
Matt Arsenault	1acc72f	2014-07-29 21:34:55 +0000	[diff] [blame]	193
Matt Arsenault	7eb0a10	2014-07-30 01:01:10 +0000	[diff] [blame]	194	BaseReg = AddrReg->getReg();
				195	Offset = OffsetImm->getImm();
				196	return true;
Matt Arsenault	1acc72f	2014-07-29 21:34:55 +0000	[diff] [blame]	197	}
				198
Matt Arsenault	7eb0a10	2014-07-30 01:01:10 +0000	[diff] [blame]	199	// The 2 offset instructions use offset0 and offset1 instead. We can treat
				200	// these as a load with a single offset if the 2 offsets are consecutive. We
				201	// will use this for some partially aligned loads.
				202	const MachineOperand Offset0Imm = getNamedOperand(LdSt,
				203	AMDGPU::OpName::offset0);
				204	const MachineOperand Offset1Imm = getNamedOperand(LdSt,
				205	AMDGPU::OpName::offset1);
Matt Arsenault	1acc72f	2014-07-29 21:34:55 +0000	[diff] [blame]	206
Matt Arsenault	7eb0a10	2014-07-30 01:01:10 +0000	[diff] [blame]	207	uint8_t Offset0 = Offset0Imm->getImm();
				208	uint8_t Offset1 = Offset1Imm->getImm();
				209	assert(Offset1 > Offset0);
				210
				211	if (Offset1 - Offset0 == 1) {
				212	// Each of these offsets is in element sized units, so we need to convert
				213	// to bytes of the individual reads.
				214
				215	unsigned EltSize;
				216	if (LdSt->mayLoad())
				217	EltSize = getOpRegClass(*LdSt, 0)->getSize() / 2;
				218	else {
				219	assert(LdSt->mayStore());
				220	int Data0Idx = AMDGPU::getNamedOperandIdx(Opc, AMDGPU::OpName::data0);
				221	EltSize = getOpRegClass(*LdSt, Data0Idx)->getSize();
				222	}
				223
Matt Arsenault	2e99112	2014-09-10 23:26:16 +0000	[diff] [blame]	224	if (isStride64(Opc))
				225	EltSize *= 64;
				226
Matt Arsenault	7eb0a10	2014-07-30 01:01:10 +0000	[diff] [blame]	227	const MachineOperand AddrReg = getNamedOperand(LdSt,
				228	AMDGPU::OpName::addr);
				229	BaseReg = AddrReg->getReg();
				230	Offset = EltSize * Offset0;
				231	return true;
				232	}
				233
				234	return false;
Matt Arsenault	1acc72f	2014-07-29 21:34:55 +0000	[diff] [blame]	235	}
				236
				237	if (isMUBUF(Opc) \|\| isMTBUF(Opc)) {
				238	if (AMDGPU::getNamedOperandIdx(Opc, AMDGPU::OpName::soffset) != -1)
				239	return false;
				240
				241	const MachineOperand AddrReg = getNamedOperand(LdSt,
				242	AMDGPU::OpName::vaddr);
				243	if (!AddrReg)
				244	return false;
				245
				246	const MachineOperand OffsetImm = getNamedOperand(LdSt,
				247	AMDGPU::OpName::offset);
				248	BaseReg = AddrReg->getReg();
				249	Offset = OffsetImm->getImm();
				250	return true;
				251	}
				252
				253	if (isSMRD(Opc)) {
				254	const MachineOperand OffsetImm = getNamedOperand(LdSt,
				255	AMDGPU::OpName::offset);
				256	if (!OffsetImm)
				257	return false;
				258
				259	const MachineOperand SBaseReg = getNamedOperand(LdSt,
				260	AMDGPU::OpName::sbase);
				261	BaseReg = SBaseReg->getReg();
				262	Offset = OffsetImm->getImm();
				263	return true;
				264	}
				265
				266	return false;
				267	}
				268
Matt Arsenault	0e75a06	2014-09-17 17:48:30 +0000	[diff] [blame]	269	bool SIInstrInfo::shouldClusterLoads(MachineInstr *FirstLdSt,
				270	MachineInstr *SecondLdSt,
				271	unsigned NumLoads) const {
				272	unsigned Opc0 = FirstLdSt->getOpcode();
				273	unsigned Opc1 = SecondLdSt->getOpcode();
				274
				275	// TODO: This needs finer tuning
				276	if (NumLoads > 4)
				277	return false;
				278
				279	if (isDS(Opc0) && isDS(Opc1))
				280	return true;
				281
				282	if (isSMRD(Opc0) && isSMRD(Opc1))
				283	return true;
				284
				285	if ((isMUBUF(Opc0) \|\| isMTBUF(Opc0)) && (isMUBUF(Opc1) \|\| isMTBUF(Opc1)))
				286	return true;
				287
				288	return false;
				289	}
				290
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	291	void
				292	SIInstrInfo::copyPhysReg(MachineBasicBlock &MBB,
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	293	MachineBasicBlock::iterator MI, DebugLoc DL,
				294	unsigned DestReg, unsigned SrcReg,
				295	bool KillSrc) const {
				296
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	297	// If we are trying to copy to or from SCC, there is a bug somewhere else in
				298	// the backend. While it may be theoretically possible to do this, it should
				299	// never be necessary.
				300	assert(DestReg != AMDGPU::SCC && SrcReg != AMDGPU::SCC);
				301
Craig Topper	0afd0ab	2013-07-15 06:39:13 +0000	[diff] [blame]	302	static const int16_t Sub0_15[] = {
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	303	AMDGPU::sub0, AMDGPU::sub1, AMDGPU::sub2, AMDGPU::sub3,
				304	AMDGPU::sub4, AMDGPU::sub5, AMDGPU::sub6, AMDGPU::sub7,
				305	AMDGPU::sub8, AMDGPU::sub9, AMDGPU::sub10, AMDGPU::sub11,
				306	AMDGPU::sub12, AMDGPU::sub13, AMDGPU::sub14, AMDGPU::sub15, 0
				307	};
				308
Craig Topper	0afd0ab	2013-07-15 06:39:13 +0000	[diff] [blame]	309	static const int16_t Sub0_7[] = {
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	310	AMDGPU::sub0, AMDGPU::sub1, AMDGPU::sub2, AMDGPU::sub3,
				311	AMDGPU::sub4, AMDGPU::sub5, AMDGPU::sub6, AMDGPU::sub7, 0
				312	};
				313
Craig Topper	0afd0ab	2013-07-15 06:39:13 +0000	[diff] [blame]	314	static const int16_t Sub0_3[] = {
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	315	AMDGPU::sub0, AMDGPU::sub1, AMDGPU::sub2, AMDGPU::sub3, 0
				316	};
				317
Craig Topper	0afd0ab	2013-07-15 06:39:13 +0000	[diff] [blame]	318	static const int16_t Sub0_2[] = {
Christian Konig	8b1ed28	2013-04-10 08:39:16 +0000	[diff] [blame]	319	AMDGPU::sub0, AMDGPU::sub1, AMDGPU::sub2, 0
				320	};
				321
Craig Topper	0afd0ab	2013-07-15 06:39:13 +0000	[diff] [blame]	322	static const int16_t Sub0_1[] = {
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	323	AMDGPU::sub0, AMDGPU::sub1, 0
				324	};
				325
				326	unsigned Opcode;
				327	const int16_t *SubIndices;
				328
				329	if (AMDGPU::SReg_32RegClass.contains(DestReg)) {
				330	assert(AMDGPU::SReg_32RegClass.contains(SrcReg));
				331	BuildMI(MBB, MI, DL, get(AMDGPU::S_MOV_B32), DestReg)
				332	.addReg(SrcReg, getKillRegState(KillSrc));
				333	return;
				334
Tom Stellard	aac1889	2013-02-07 19:39:43 +0000	[diff] [blame]	335	} else if (AMDGPU::SReg_64RegClass.contains(DestReg)) {
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	336	assert(AMDGPU::SReg_64RegClass.contains(SrcReg));
				337	BuildMI(MBB, MI, DL, get(AMDGPU::S_MOV_B64), DestReg)
				338	.addReg(SrcReg, getKillRegState(KillSrc));
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	339	return;
				340
				341	} else if (AMDGPU::SReg_128RegClass.contains(DestReg)) {
				342	assert(AMDGPU::SReg_128RegClass.contains(SrcReg));
				343	Opcode = AMDGPU::S_MOV_B32;
				344	SubIndices = Sub0_3;
				345
				346	} else if (AMDGPU::SReg_256RegClass.contains(DestReg)) {
				347	assert(AMDGPU::SReg_256RegClass.contains(SrcReg));
				348	Opcode = AMDGPU::S_MOV_B32;
				349	SubIndices = Sub0_7;
				350
				351	} else if (AMDGPU::SReg_512RegClass.contains(DestReg)) {
				352	assert(AMDGPU::SReg_512RegClass.contains(SrcReg));
				353	Opcode = AMDGPU::S_MOV_B32;
				354	SubIndices = Sub0_15;
				355
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	356	} else if (AMDGPU::VReg_32RegClass.contains(DestReg)) {
				357	assert(AMDGPU::VReg_32RegClass.contains(SrcReg) \|\|
NAKAMURA Takumi	4bb85f9	2013-10-28 04:07:23 +0000	[diff] [blame]	358	AMDGPU::SReg_32RegClass.contains(SrcReg));
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	359	BuildMI(MBB, MI, DL, get(AMDGPU::V_MOV_B32_e32), DestReg)
				360	.addReg(SrcReg, getKillRegState(KillSrc));
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	361	return;
				362
				363	} else if (AMDGPU::VReg_64RegClass.contains(DestReg)) {
				364	assert(AMDGPU::VReg_64RegClass.contains(SrcReg) \|\|
NAKAMURA Takumi	4bb85f9	2013-10-28 04:07:23 +0000	[diff] [blame]	365	AMDGPU::SReg_64RegClass.contains(SrcReg));
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	366	Opcode = AMDGPU::V_MOV_B32_e32;
				367	SubIndices = Sub0_1;
				368
Christian Konig	8b1ed28	2013-04-10 08:39:16 +0000	[diff] [blame]	369	} else if (AMDGPU::VReg_96RegClass.contains(DestReg)) {
				370	assert(AMDGPU::VReg_96RegClass.contains(SrcReg));
				371	Opcode = AMDGPU::V_MOV_B32_e32;
				372	SubIndices = Sub0_2;
				373
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	374	} else if (AMDGPU::VReg_128RegClass.contains(DestReg)) {
				375	assert(AMDGPU::VReg_128RegClass.contains(SrcReg) \|\|
NAKAMURA Takumi	4bb85f9	2013-10-28 04:07:23 +0000	[diff] [blame]	376	AMDGPU::SReg_128RegClass.contains(SrcReg));
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	377	Opcode = AMDGPU::V_MOV_B32_e32;
				378	SubIndices = Sub0_3;
				379
				380	} else if (AMDGPU::VReg_256RegClass.contains(DestReg)) {
				381	assert(AMDGPU::VReg_256RegClass.contains(SrcReg) \|\|
NAKAMURA Takumi	4bb85f9	2013-10-28 04:07:23 +0000	[diff] [blame]	382	AMDGPU::SReg_256RegClass.contains(SrcReg));
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	383	Opcode = AMDGPU::V_MOV_B32_e32;
				384	SubIndices = Sub0_7;
				385
				386	} else if (AMDGPU::VReg_512RegClass.contains(DestReg)) {
				387	assert(AMDGPU::VReg_512RegClass.contains(SrcReg) \|\|
NAKAMURA Takumi	4bb85f9	2013-10-28 04:07:23 +0000	[diff] [blame]	388	AMDGPU::SReg_512RegClass.contains(SrcReg));
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	389	Opcode = AMDGPU::V_MOV_B32_e32;
				390	SubIndices = Sub0_15;
				391
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	392	} else {
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	393	llvm_unreachable("Can't copy register!");
				394	}
				395
				396	while (unsigned SubIdx = *SubIndices++) {
				397	MachineInstrBuilder Builder = BuildMI(MBB, MI, DL,
				398	get(Opcode), RI.getSubReg(DestReg, SubIdx));
				399
				400	Builder.addReg(RI.getSubReg(SrcReg, SubIdx), getKillRegState(KillSrc));
				401
				402	if (*SubIndices)
				403	Builder.addReg(DestReg, RegState::Define \| RegState::Implicit);
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	404	}
				405	}
				406
Christian Konig	3c14580	2013-03-27 09:12:59 +0000	[diff] [blame]	407	unsigned SIInstrInfo::commuteOpcode(unsigned Opcode) const {
Christian Konig	3c14580	2013-03-27 09:12:59 +0000	[diff] [blame]	408	int NewOpc;
				409
				410	// Try to map original to commuted opcode
				411	if ((NewOpc = AMDGPU::getCommuteRev(Opcode)) != -1)
				412	return NewOpc;
				413
				414	// Try to map commuted to original opcode
				415	if ((NewOpc = AMDGPU::getCommuteOrig(Opcode)) != -1)
				416	return NewOpc;
				417
				418	return Opcode;
				419	}
				420
Tom Stellard	ef3b864	2015-01-07 19:56:17 +0000	[diff] [blame]	421	unsigned SIInstrInfo::getMovOpcode(const TargetRegisterClass *DstRC) const {
				422
				423	if (DstRC->getSize() == 4) {
				424	return RI.isSGPRClass(DstRC) ? AMDGPU::S_MOV_B32 : AMDGPU::V_MOV_B32_e32;
				425	} else if (DstRC->getSize() == 8 && RI.isSGPRClass(DstRC)) {
				426	return AMDGPU::S_MOV_B64;
Tom Stellard	4842c05	2015-01-07 20:27:25 +0000	[diff] [blame^]	427	} else if (DstRC->getSize() == 8 && !RI.isSGPRClass(DstRC)) {
				428	return AMDGPU::V_MOV_B64_PSEUDO;
Tom Stellard	ef3b864	2015-01-07 19:56:17 +0000	[diff] [blame]	429	}
				430	return AMDGPU::COPY;
				431	}
				432
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	433	static bool shouldTryToSpillVGPRs(MachineFunction *MF) {
				434
				435	SIMachineFunctionInfo *MFI = MF->getInfo<SIMachineFunctionInfo>();
				436	const TargetMachine &TM = MF->getTarget();
				437
				438	// FIXME: Even though it can cause problems, we need to enable
				439	// spilling at -O0, since the fast register allocator always
				440	// spills registers that are live at the end of blocks.
				441	return MFI->getShaderType() == ShaderType::COMPUTE &&
				442	TM.getOptLevel() == CodeGenOpt::None;
				443
				444	}
				445
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	446	void SIInstrInfo::storeRegToStackSlot(MachineBasicBlock &MBB,
				447	MachineBasicBlock::iterator MI,
				448	unsigned SrcReg, bool isKill,
				449	int FrameIndex,
				450	const TargetRegisterClass *RC,
				451	const TargetRegisterInfo *TRI) const {
Tom Stellard	4e07b1d	2014-06-10 21:20:41 +0000	[diff] [blame]	452	MachineFunction *MF = MBB.getParent();
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	453	MachineFrameInfo *FrameInfo = MF->getFrameInfo();
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	454	DebugLoc DL = MBB.findDebugLoc(MI);
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	455	int Opcode = -1;
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	456
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	457	if (RI.isSGPRClass(RC)) {
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	458	// We are only allowed to create one new instruction when spilling
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	459	// registers, so we need to use pseudo instruction for spilling
				460	// SGPRs.
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	461	switch (RC->getSize() * 8) {
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	462	case 32: Opcode = AMDGPU::SI_SPILL_S32_SAVE; break;
				463	case 64: Opcode = AMDGPU::SI_SPILL_S64_SAVE; break;
				464	case 128: Opcode = AMDGPU::SI_SPILL_S128_SAVE; break;
				465	case 256: Opcode = AMDGPU::SI_SPILL_S256_SAVE; break;
				466	case 512: Opcode = AMDGPU::SI_SPILL_S512_SAVE; break;
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	467	}
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	468	} else if(shouldTryToSpillVGPRs(MF) && RI.hasVGPRs(RC)) {
				469	switch(RC->getSize() * 8) {
				470	case 32: Opcode = AMDGPU::SI_SPILL_V32_SAVE; break;
				471	case 64: Opcode = AMDGPU::SI_SPILL_V64_SAVE; break;
				472	case 96: Opcode = AMDGPU::SI_SPILL_V96_SAVE; break;
				473	case 128: Opcode = AMDGPU::SI_SPILL_V128_SAVE; break;
				474	case 256: Opcode = AMDGPU::SI_SPILL_V256_SAVE; break;
				475	case 512: Opcode = AMDGPU::SI_SPILL_V512_SAVE; break;
				476	}
				477	}
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	478
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	479	if (Opcode != -1) {
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	480	FrameInfo->setObjectAlignment(FrameIndex, 4);
				481	BuildMI(MBB, MI, DL, get(Opcode))
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	482	.addReg(SrcReg)
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	483	.addFrameIndex(FrameIndex);
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	484	} else {
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	485	LLVMContext &Ctx = MF->getFunction()->getContext();
				486	Ctx.emitError("SIInstrInfo::storeRegToStackSlot - Do not know how to"
				487	" spill register");
				488	BuildMI(MBB, MI, DL, get(AMDGPU::V_MOV_B32_e32), AMDGPU::VGPR0)
				489	.addReg(SrcReg);
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	490	}
				491	}
				492
				493	void SIInstrInfo::loadRegFromStackSlot(MachineBasicBlock &MBB,
				494	MachineBasicBlock::iterator MI,
				495	unsigned DestReg, int FrameIndex,
				496	const TargetRegisterClass *RC,
				497	const TargetRegisterInfo *TRI) const {
Tom Stellard	4e07b1d	2014-06-10 21:20:41 +0000	[diff] [blame]	498	MachineFunction *MF = MBB.getParent();
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	499	MachineFrameInfo *FrameInfo = MF->getFrameInfo();
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	500	DebugLoc DL = MBB.findDebugLoc(MI);
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	501	int Opcode = -1;
Tom Stellard	4e07b1d	2014-06-10 21:20:41 +0000	[diff] [blame]	502
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	503	if (RI.isSGPRClass(RC)){
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	504	switch(RC->getSize() * 8) {
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	505	case 32: Opcode = AMDGPU::SI_SPILL_S32_RESTORE; break;
				506	case 64: Opcode = AMDGPU::SI_SPILL_S64_RESTORE; break;
				507	case 128: Opcode = AMDGPU::SI_SPILL_S128_RESTORE; break;
				508	case 256: Opcode = AMDGPU::SI_SPILL_S256_RESTORE; break;
				509	case 512: Opcode = AMDGPU::SI_SPILL_S512_RESTORE; break;
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	510	}
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	511	} else if(shouldTryToSpillVGPRs(MF) && RI.hasVGPRs(RC)) {
				512	switch(RC->getSize() * 8) {
				513	case 32: Opcode = AMDGPU::SI_SPILL_V32_RESTORE; break;
				514	case 64: Opcode = AMDGPU::SI_SPILL_V64_RESTORE; break;
				515	case 96: Opcode = AMDGPU::SI_SPILL_V96_RESTORE; break;
				516	case 128: Opcode = AMDGPU::SI_SPILL_V128_RESTORE; break;
				517	case 256: Opcode = AMDGPU::SI_SPILL_V256_RESTORE; break;
				518	case 512: Opcode = AMDGPU::SI_SPILL_V512_RESTORE; break;
				519	}
				520	}
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	521
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	522	if (Opcode != -1) {
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	523	FrameInfo->setObjectAlignment(FrameIndex, 4);
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	524	BuildMI(MBB, MI, DL, get(Opcode), DestReg)
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	525	.addFrameIndex(FrameIndex);
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	526	} else {
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	527	LLVMContext &Ctx = MF->getFunction()->getContext();
				528	Ctx.emitError("SIInstrInfo::loadRegFromStackSlot - Do not know how to"
				529	" restore register");
				530	BuildMI(MBB, MI, DL, get(AMDGPU::V_MOV_B32_e32), DestReg)
				531	.addReg(AMDGPU::VGPR0);
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	532	}
				533	}
				534
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	535	/// \param @Offset Offset in bytes of the FrameIndex being spilled
				536	unsigned SIInstrInfo::calculateLDSSpillAddress(MachineBasicBlock &MBB,
				537	MachineBasicBlock::iterator MI,
				538	RegScavenger *RS, unsigned TmpReg,
				539	unsigned FrameOffset,
				540	unsigned Size) const {
				541	MachineFunction *MF = MBB.getParent();
				542	SIMachineFunctionInfo *MFI = MF->getInfo<SIMachineFunctionInfo>();
				543	const AMDGPUSubtarget &ST = MF->getTarget().getSubtarget<AMDGPUSubtarget>();
				544	const SIRegisterInfo *TRI =
				545	static_cast<const SIRegisterInfo*>(ST.getRegisterInfo());
				546	DebugLoc DL = MBB.findDebugLoc(MI);
				547	unsigned WorkGroupSize = MFI->getMaximumWorkGroupSize(*MF);
				548	unsigned WavefrontSize = ST.getWavefrontSize();
				549
				550	unsigned TIDReg = MFI->getTIDReg();
				551	if (!MFI->hasCalculatedTID()) {
				552	MachineBasicBlock &Entry = MBB.getParent()->front();
				553	MachineBasicBlock::iterator Insert = Entry.front();
				554	DebugLoc DL = Insert->getDebugLoc();
				555
				556	TIDReg = RI.findUnusedVGPR(MF->getRegInfo());
				557	if (TIDReg == AMDGPU::NoRegister)
				558	return TIDReg;
				559
				560
				561	if (MFI->getShaderType() == ShaderType::COMPUTE &&
				562	WorkGroupSize > WavefrontSize) {
				563
				564	unsigned TIDIGXReg = TRI->getPreloadedValue(*MF, SIRegisterInfo::TIDIG_X);
				565	unsigned TIDIGYReg = TRI->getPreloadedValue(*MF, SIRegisterInfo::TIDIG_Y);
				566	unsigned TIDIGZReg = TRI->getPreloadedValue(*MF, SIRegisterInfo::TIDIG_Z);
				567	unsigned InputPtrReg =
				568	TRI->getPreloadedValue(*MF, SIRegisterInfo::INPUT_PTR);
				569	static const unsigned TIDIGRegs[3] = {
				570	TIDIGXReg, TIDIGYReg, TIDIGZReg
				571	};
				572	for (unsigned Reg : TIDIGRegs) {
				573	if (!Entry.isLiveIn(Reg))
				574	Entry.addLiveIn(Reg);
				575	}
				576
				577	RS->enterBasicBlock(&Entry);
				578	unsigned STmp0 = RS->scavengeRegister(&AMDGPU::SGPR_32RegClass, 0);
				579	unsigned STmp1 = RS->scavengeRegister(&AMDGPU::SGPR_32RegClass, 0);
				580	BuildMI(Entry, Insert, DL, get(AMDGPU::S_LOAD_DWORD_IMM), STmp0)
				581	.addReg(InputPtrReg)
				582	.addImm(SI::KernelInputOffsets::NGROUPS_Z);
				583	BuildMI(Entry, Insert, DL, get(AMDGPU::S_LOAD_DWORD_IMM), STmp1)
				584	.addReg(InputPtrReg)
				585	.addImm(SI::KernelInputOffsets::NGROUPS_Y);
				586
				587	// NGROUPS.X * NGROUPS.Y
				588	BuildMI(Entry, Insert, DL, get(AMDGPU::S_MUL_I32), STmp1)
				589	.addReg(STmp1)
				590	.addReg(STmp0);
				591	// (NGROUPS.X * NGROUPS.Y) * TIDIG.X
				592	BuildMI(Entry, Insert, DL, get(AMDGPU::V_MUL_U32_U24_e32), TIDReg)
				593	.addReg(STmp1)
				594	.addReg(TIDIGXReg);
				595	// NGROUPS.Z * TIDIG.Y + (NGROUPS.X * NGROPUS.Y * TIDIG.X)
				596	BuildMI(Entry, Insert, DL, get(AMDGPU::V_MAD_U32_U24), TIDReg)
				597	.addReg(STmp0)
				598	.addReg(TIDIGYReg)
				599	.addReg(TIDReg);
				600	// (NGROUPS.Z * TIDIG.Y + (NGROUPS.X * NGROPUS.Y * TIDIG.X)) + TIDIG.Z
				601	BuildMI(Entry, Insert, DL, get(AMDGPU::V_ADD_I32_e32), TIDReg)
				602	.addReg(TIDReg)
				603	.addReg(TIDIGZReg);
				604	} else {
				605	// Get the wave id
				606	BuildMI(Entry, Insert, DL, get(AMDGPU::V_MBCNT_LO_U32_B32_e64),
				607	TIDReg)
				608	.addImm(-1)
				609	.addImm(0);
				610
				611	BuildMI(Entry, Insert, DL, get(AMDGPU::V_MBCNT_HI_U32_B32_e32),
				612	TIDReg)
				613	.addImm(-1)
				614	.addReg(TIDReg);
				615	}
				616
				617	BuildMI(Entry, Insert, DL, get(AMDGPU::V_LSHLREV_B32_e32),
				618	TIDReg)
				619	.addImm(2)
				620	.addReg(TIDReg);
				621	MFI->setTIDReg(TIDReg);
				622	}
				623
				624	// Add FrameIndex to LDS offset
				625	unsigned LDSOffset = MFI->LDSSize + (FrameOffset * WorkGroupSize);
				626	BuildMI(MBB, MI, DL, get(AMDGPU::V_ADD_I32_e32), TmpReg)
				627	.addImm(LDSOffset)
				628	.addReg(TIDReg);
				629
				630	return TmpReg;
				631	}
				632
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	633	void SIInstrInfo::insertNOPs(MachineBasicBlock::iterator MI,
				634	int Count) const {
				635	while (Count > 0) {
				636	int Arg;
				637	if (Count >= 8)
				638	Arg = 7;
				639	else
				640	Arg = Count - 1;
				641	Count -= 8;
				642	BuildMI(*MI->getParent(), MI, MI->getDebugLoc(), get(AMDGPU::S_NOP))
				643	.addImm(Arg);
				644	}
				645	}
				646
				647	bool SIInstrInfo::expandPostRAPseudo(MachineBasicBlock::iterator MI) const {
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	648	MachineBasicBlock &MBB = *MI->getParent();
				649	DebugLoc DL = MBB.findDebugLoc(MI);
				650	switch (MI->getOpcode()) {
				651	default: return AMDGPUInstrInfo::expandPostRAPseudo(MI);
				652
Tom Stellard	067c815	2014-07-21 14:01:14 +0000	[diff] [blame]	653	case AMDGPU::SI_CONSTDATA_PTR: {
				654	unsigned Reg = MI->getOperand(0).getReg();
				655	unsigned RegLo = RI.getSubReg(Reg, AMDGPU::sub0);
				656	unsigned RegHi = RI.getSubReg(Reg, AMDGPU::sub1);
				657
				658	BuildMI(MBB, MI, DL, get(AMDGPU::S_GETPC_B64), Reg);
				659
				660	// Add 32-bit offset from this instruction to the start of the constant data.
Tom Stellard	80942a1	2014-09-05 14:07:59 +0000	[diff] [blame]	661	BuildMI(MBB, MI, DL, get(AMDGPU::S_ADD_U32), RegLo)
Tom Stellard	067c815	2014-07-21 14:01:14 +0000	[diff] [blame]	662	.addReg(RegLo)
				663	.addTargetIndex(AMDGPU::TI_CONSTDATA_START)
				664	.addReg(AMDGPU::SCC, RegState::Define \| RegState::Implicit);
				665	BuildMI(MBB, MI, DL, get(AMDGPU::S_ADDC_U32), RegHi)
				666	.addReg(RegHi)
				667	.addImm(0)
				668	.addReg(AMDGPU::SCC, RegState::Define \| RegState::Implicit)
				669	.addReg(AMDGPU::SCC, RegState::Implicit);
				670	MI->eraseFromParent();
				671	break;
				672	}
Tom Stellard	60024a0	2014-09-24 01:33:24 +0000	[diff] [blame]	673	case AMDGPU::SGPR_USE:
				674	// This is just a placeholder for register allocation.
				675	MI->eraseFromParent();
				676	break;
Tom Stellard	4842c05	2015-01-07 20:27:25 +0000	[diff] [blame^]	677
				678	case AMDGPU::V_MOV_B64_PSEUDO: {
				679	unsigned Dst = MI->getOperand(0).getReg();
				680	unsigned DstLo = RI.getSubReg(Dst, AMDGPU::sub0);
				681	unsigned DstHi = RI.getSubReg(Dst, AMDGPU::sub1);
				682
				683	const MachineOperand &SrcOp = MI->getOperand(1);
				684	// FIXME: Will this work for 64-bit floating point immediates?
				685	assert(!SrcOp.isFPImm());
				686	if (SrcOp.isImm()) {
				687	APInt Imm(64, SrcOp.getImm());
				688	BuildMI(MBB, MI, DL, get(AMDGPU::V_MOV_B32_e32), DstLo)
				689	.addImm(Imm.getLoBits(32).getZExtValue())
				690	.addReg(Dst, RegState::Implicit);
				691	BuildMI(MBB, MI, DL, get(AMDGPU::V_MOV_B32_e32), DstHi)
				692	.addImm(Imm.getHiBits(32).getZExtValue())
				693	.addReg(Dst, RegState::Implicit);
				694	} else {
				695	assert(SrcOp.isReg());
				696	BuildMI(MBB, MI, DL, get(AMDGPU::V_MOV_B32_e32), DstLo)
				697	.addReg(RI.getSubReg(SrcOp.getReg(), AMDGPU::sub0))
				698	.addReg(Dst, RegState::Implicit);
				699	BuildMI(MBB, MI, DL, get(AMDGPU::V_MOV_B32_e32), DstHi)
				700	.addReg(RI.getSubReg(SrcOp.getReg(), AMDGPU::sub1))
				701	.addReg(Dst, RegState::Implicit);
				702	}
				703	MI->eraseFromParent();
				704	break;
				705	}
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	706	}
				707	return true;
				708	}
				709
Christian Konig	76edd4f	2013-02-26 17:52:29 +0000	[diff] [blame]	710	MachineInstr SIInstrInfo::commuteInstruction(MachineInstr MI,
				711	bool NewMI) const {
Matt Arsenault	aff65fb	2014-09-26 17:54:43 +0000	[diff] [blame]	712	if (MI->getNumOperands() < 3)
Craig Topper	062a2ba	2014-04-25 05:30:21 +0000	[diff] [blame]	713	return nullptr;
Christian Konig	76edd4f	2013-02-26 17:52:29 +0000	[diff] [blame]	714
Matt Arsenault	aff65fb	2014-09-26 17:54:43 +0000	[diff] [blame]	715	int Src0Idx = AMDGPU::getNamedOperandIdx(MI->getOpcode(),
				716	AMDGPU::OpName::src0);
				717	assert(Src0Idx != -1 && "Should always have src0 operand");
				718
Matt Arsenault	aa5ccfb	2014-10-17 18:00:37 +0000	[diff] [blame]	719	MachineOperand &Src0 = MI->getOperand(Src0Idx);
				720	if (!Src0.isReg())
Matt Arsenault	aff65fb	2014-09-26 17:54:43 +0000	[diff] [blame]	721	return nullptr;
				722
				723	int Src1Idx = AMDGPU::getNamedOperandIdx(MI->getOpcode(),
				724	AMDGPU::OpName::src1);
Matt Arsenault	aa5ccfb	2014-10-17 18:00:37 +0000	[diff] [blame]	725	if (Src1Idx == -1)
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	726	return nullptr;
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	727
Matt Arsenault	aa5ccfb	2014-10-17 18:00:37 +0000	[diff] [blame]	728	MachineOperand &Src1 = MI->getOperand(Src1Idx);
				729
Matt Arsenault	933c38d	2014-10-17 18:02:31 +0000	[diff] [blame]	730	// Make sure it's legal to commute operands for VOP2.
Matt Arsenault	aa5ccfb	2014-10-17 18:00:37 +0000	[diff] [blame]	731	if (isVOP2(MI->getOpcode()) &&
				732	(!isOperandLegal(MI, Src0Idx, &Src1) \|\|
				733	!isOperandLegal(MI, Src1Idx, &Src0)))
				734	return nullptr;
				735
				736	if (!Src1.isReg()) {
Matt Arsenault	6d3cd54	2014-10-17 18:00:39 +0000	[diff] [blame]	737	// Allow commuting instructions with Imm or FPImm operands.
				738	if (NewMI \|\| (!Src1.isImm() && !Src1.isFPImm()) \|\|
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	739	(!isVOP2(MI->getOpcode()) && !isVOP3(MI->getOpcode()))) {
Craig Topper	062a2ba	2014-04-25 05:30:21 +0000	[diff] [blame]	740	return nullptr;
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	741	}
				742
Matt Arsenault	d282ada	2014-10-17 18:00:48 +0000	[diff] [blame]	743	// Be sure to copy the source modifiers to the right place.
				744	if (MachineOperand *Src0Mods
				745	= getNamedOperand(*MI, AMDGPU::OpName::src0_modifiers)) {
				746	MachineOperand *Src1Mods
				747	= getNamedOperand(*MI, AMDGPU::OpName::src1_modifiers);
				748
				749	int Src0ModsVal = Src0Mods->getImm();
				750	if (!Src1Mods && Src0ModsVal != 0)
				751	return nullptr;
				752
				753	// XXX - This assert might be a lie. It might be useful to have a neg
				754	// modifier with 0.0.
				755	int Src1ModsVal = Src1Mods->getImm();
				756	assert((Src1ModsVal == 0) && "Not expecting modifiers with immediates");
				757
				758	Src1Mods->setImm(Src0ModsVal);
				759	Src0Mods->setImm(Src1ModsVal);
				760	}
				761
Matt Arsenault	aa5ccfb	2014-10-17 18:00:37 +0000	[diff] [blame]	762	unsigned Reg = Src0.getReg();
				763	unsigned SubReg = Src0.getSubReg();
Matt Arsenault	6d3cd54	2014-10-17 18:00:39 +0000	[diff] [blame]	764	if (Src1.isImm())
				765	Src0.ChangeToImmediate(Src1.getImm());
				766	else if (Src1.isFPImm())
				767	Src0.ChangeToFPImmediate(Src1.getFPImm());
				768	else
				769	llvm_unreachable("Should only have immediates");
				770
Matt Arsenault	aa5ccfb	2014-10-17 18:00:37 +0000	[diff] [blame]	771	Src1.ChangeToRegister(Reg, false);
				772	Src1.setSubReg(SubReg);
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	773	} else {
				774	MI = TargetInstrInfo::commuteInstruction(MI, NewMI);
				775	}
Christian Konig	3c14580	2013-03-27 09:12:59 +0000	[diff] [blame]	776
				777	if (MI)
				778	MI->setDesc(get(commuteOpcode(MI->getOpcode())));
				779
				780	return MI;
Christian Konig	76edd4f	2013-02-26 17:52:29 +0000	[diff] [blame]	781	}
				782
Matt Arsenault	92befe7	2014-09-26 17:54:54 +0000	[diff] [blame]	783	// This needs to be implemented because the source modifiers may be inserted
				784	// between the true commutable operands, and the base
				785	// TargetInstrInfo::commuteInstruction uses it.
				786	bool SIInstrInfo::findCommutedOpIndices(MachineInstr *MI,
				787	unsigned &SrcOpIdx1,
				788	unsigned &SrcOpIdx2) const {
				789	const MCInstrDesc &MCID = MI->getDesc();
				790	if (!MCID.isCommutable())
				791	return false;
				792
				793	unsigned Opc = MI->getOpcode();
				794	int Src0Idx = AMDGPU::getNamedOperandIdx(Opc, AMDGPU::OpName::src0);
				795	if (Src0Idx == -1)
				796	return false;
				797
				798	// FIXME: Workaround TargetInstrInfo::commuteInstruction asserting on
				799	// immediate.
				800	if (!MI->getOperand(Src0Idx).isReg())
				801	return false;
				802
				803	int Src1Idx = AMDGPU::getNamedOperandIdx(Opc, AMDGPU::OpName::src1);
				804	if (Src1Idx == -1)
				805	return false;
				806
				807	if (!MI->getOperand(Src1Idx).isReg())
				808	return false;
				809
Matt Arsenault	ace5b76	2014-10-17 18:00:43 +0000	[diff] [blame]	810	// If any source modifiers are set, the generic instruction commuting won't
				811	// understand how to copy the source modifiers.
				812	if (hasModifiersSet(*MI, AMDGPU::OpName::src0_modifiers) \|\|
				813	hasModifiersSet(*MI, AMDGPU::OpName::src1_modifiers))
				814	return false;
				815
Matt Arsenault	92befe7	2014-09-26 17:54:54 +0000	[diff] [blame]	816	SrcOpIdx1 = Src0Idx;
				817	SrcOpIdx2 = Src1Idx;
				818	return true;
				819	}
				820
Tom Stellard	26a3b67	2013-10-22 18:19:10 +0000	[diff] [blame]	821	MachineInstr SIInstrInfo::buildMovInstr(MachineBasicBlock MBB,
				822	MachineBasicBlock::iterator I,
				823	unsigned DstReg,
				824	unsigned SrcReg) const {
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	825	return BuildMI(*MBB, I, MBB->findDebugLoc(I), get(AMDGPU::V_MOV_B32_e32),
				826	DstReg) .addReg(SrcReg);
Tom Stellard	26a3b67	2013-10-22 18:19:10 +0000	[diff] [blame]	827	}
				828
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	829	bool SIInstrInfo::isMov(unsigned Opcode) const {
				830	switch(Opcode) {
				831	default: return false;
				832	case AMDGPU::S_MOV_B32:
				833	case AMDGPU::S_MOV_B64:
				834	case AMDGPU::V_MOV_B32_e32:
				835	case AMDGPU::V_MOV_B32_e64:
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	836	return true;
				837	}
				838	}
				839
				840	bool
				841	SIInstrInfo::isSafeToMoveRegClassDefs(const TargetRegisterClass *RC) const {
				842	return RC != &AMDGPU::EXECRegRegClass;
				843	}
Tom Stellard	f3b2a1e	2013-02-06 17:32:29 +0000	[diff] [blame]	844
Tom Stellard	30f5941	2014-03-31 14:01:56 +0000	[diff] [blame]	845	bool
				846	SIInstrInfo::isTriviallyReMaterializable(const MachineInstr *MI,
				847	AliasAnalysis *AA) const {
				848	switch(MI->getOpcode()) {
				849	default: return AMDGPUInstrInfo::isTriviallyReMaterializable(MI, AA);
				850	case AMDGPU::S_MOV_B32:
				851	case AMDGPU::S_MOV_B64:
				852	case AMDGPU::V_MOV_B32_e32:
				853	return MI->getOperand(1).isImm();
				854	}
				855	}
				856
Matt Arsenault	c09cc3c	2014-11-19 00:01:31 +0000	[diff] [blame]	857	static bool offsetsDoNotOverlap(int WidthA, int OffsetA,
				858	int WidthB, int OffsetB) {
				859	int LowOffset = OffsetA < OffsetB ? OffsetA : OffsetB;
				860	int HighOffset = OffsetA < OffsetB ? OffsetB : OffsetA;
				861	int LowWidth = (LowOffset == OffsetA) ? WidthA : WidthB;
				862	return LowOffset + LowWidth <= HighOffset;
				863	}
				864
				865	bool SIInstrInfo::checkInstOffsetsDoNotOverlap(MachineInstr *MIa,
				866	MachineInstr *MIb) const {
				867	unsigned BaseReg0, Offset0;
				868	unsigned BaseReg1, Offset1;
				869
				870	if (getLdStBaseRegImmOfs(MIa, BaseReg0, Offset0, &RI) &&
				871	getLdStBaseRegImmOfs(MIb, BaseReg1, Offset1, &RI)) {
				872	assert(MIa->hasOneMemOperand() && MIb->hasOneMemOperand() &&
				873	"read2 / write2 not expected here yet");
				874	unsigned Width0 = (*MIa->memoperands_begin())->getSize();
				875	unsigned Width1 = (*MIb->memoperands_begin())->getSize();
				876	if (BaseReg0 == BaseReg1 &&
				877	offsetsDoNotOverlap(Width0, Offset0, Width1, Offset1)) {
				878	return true;
				879	}
				880	}
				881
				882	return false;
				883	}
				884
				885	bool SIInstrInfo::areMemAccessesTriviallyDisjoint(MachineInstr *MIa,
				886	MachineInstr *MIb,
				887	AliasAnalysis *AA) const {
				888	unsigned Opc0 = MIa->getOpcode();
				889	unsigned Opc1 = MIb->getOpcode();
				890
				891	assert(MIa && (MIa->mayLoad() \|\| MIa->mayStore()) &&
				892	"MIa must load from or modify a memory location");
				893	assert(MIb && (MIb->mayLoad() \|\| MIb->mayStore()) &&
				894	"MIb must load from or modify a memory location");
				895
				896	if (MIa->hasUnmodeledSideEffects() \|\| MIb->hasUnmodeledSideEffects())
				897	return false;
				898
				899	// XXX - Can we relax this between address spaces?
				900	if (MIa->hasOrderedMemoryRef() \|\| MIb->hasOrderedMemoryRef())
				901	return false;
				902
				903	// TODO: Should we check the address space from the MachineMemOperand? That
				904	// would allow us to distinguish objects we know don't alias based on the
				905	// underlying addres space, even if it was lowered to a different one,
				906	// e.g. private accesses lowered to use MUBUF instructions on a scratch
				907	// buffer.
				908	if (isDS(Opc0)) {
				909	if (isDS(Opc1))
				910	return checkInstOffsetsDoNotOverlap(MIa, MIb);
				911
				912	return !isFLAT(Opc1);
				913	}
				914
				915	if (isMUBUF(Opc0) \|\| isMTBUF(Opc0)) {
				916	if (isMUBUF(Opc1) \|\| isMTBUF(Opc1))
				917	return checkInstOffsetsDoNotOverlap(MIa, MIb);
				918
				919	return !isFLAT(Opc1) && !isSMRD(Opc1);
				920	}
				921
				922	if (isSMRD(Opc0)) {
				923	if (isSMRD(Opc1))
				924	return checkInstOffsetsDoNotOverlap(MIa, MIb);
				925
				926	return !isFLAT(Opc1) && !isMUBUF(Opc0) && !isMTBUF(Opc0);
				927	}
				928
				929	if (isFLAT(Opc0)) {
				930	if (isFLAT(Opc1))
				931	return checkInstOffsetsDoNotOverlap(MIa, MIb);
				932
				933	return false;
				934	}
				935
				936	return false;
				937	}
				938
Matt Arsenault	d7bdcc4	2014-03-31 19:54:27 +0000	[diff] [blame]	939	bool SIInstrInfo::isInlineConstant(const APInt &Imm) const {
Matt Arsenault	303011a	2014-12-17 21:04:08 +0000	[diff] [blame]	940	int64_t SVal = Imm.getSExtValue();
				941	if (SVal >= -16 && SVal <= 64)
Matt Arsenault	d7bdcc4	2014-03-31 19:54:27 +0000	[diff] [blame]	942	return true;
Tom Stellard	d008446	2014-03-17 17:03:52 +0000	[diff] [blame]	943
Matt Arsenault	303011a	2014-12-17 21:04:08 +0000	[diff] [blame]	944	if (Imm.getBitWidth() == 64) {
				945	uint64_t Val = Imm.getZExtValue();
				946	return (DoubleToBits(0.0) == Val) \|\|
				947	(DoubleToBits(1.0) == Val) \|\|
				948	(DoubleToBits(-1.0) == Val) \|\|
				949	(DoubleToBits(0.5) == Val) \|\|
				950	(DoubleToBits(-0.5) == Val) \|\|
				951	(DoubleToBits(2.0) == Val) \|\|
				952	(DoubleToBits(-2.0) == Val) \|\|
				953	(DoubleToBits(4.0) == Val) \|\|
				954	(DoubleToBits(-4.0) == Val);
				955	}
				956
Tom Stellard	d008446	2014-03-17 17:03:52 +0000	[diff] [blame]	957	// The actual type of the operand does not seem to matter as long
				958	// as the bits match one of the inline immediate values. For example:
				959	//
				960	// -nan has the hexadecimal encoding of 0xfffffffe which is -2 in decimal,
				961	// so it is a legal inline immediate.
				962	//
				963	// 1065353216 has the hexadecimal encoding 0x3f800000 which is 1.0f in
				964	// floating-point, so it is a legal inline immediate.
Matt Arsenault	303011a	2014-12-17 21:04:08 +0000	[diff] [blame]	965	uint32_t Val = Imm.getZExtValue();
Matt Arsenault	d7bdcc4	2014-03-31 19:54:27 +0000	[diff] [blame]	966
Matt Arsenault	303011a	2014-12-17 21:04:08 +0000	[diff] [blame]	967	return (FloatToBits(0.0f) == Val) \|\|
				968	(FloatToBits(1.0f) == Val) \|\|
				969	(FloatToBits(-1.0f) == Val) \|\|
				970	(FloatToBits(0.5f) == Val) \|\|
				971	(FloatToBits(-0.5f) == Val) \|\|
				972	(FloatToBits(2.0f) == Val) \|\|
				973	(FloatToBits(-2.0f) == Val) \|\|
				974	(FloatToBits(4.0f) == Val) \|\|
				975	(FloatToBits(-4.0f) == Val);
Matt Arsenault	d7bdcc4	2014-03-31 19:54:27 +0000	[diff] [blame]	976	}
				977
				978	bool SIInstrInfo::isInlineConstant(const MachineOperand &MO) const {
				979	if (MO.isImm())
				980	return isInlineConstant(APInt(32, MO.getImm(), true));
				981
				982	if (MO.isFPImm()) {
				983	APFloat FpImm = MO.getFPImm()->getValueAPF();
				984	return isInlineConstant(FpImm.bitcastToAPInt());
				985	}
				986
				987	return false;
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	988	}
				989
				990	bool SIInstrInfo::isLiteralConstant(const MachineOperand &MO) const {
				991	return (MO.isImm() \|\| MO.isFPImm()) && !isInlineConstant(MO);
				992	}
				993
Matt Arsenault	becb140	2014-06-23 18:28:31 +0000	[diff] [blame]	994	static bool compareMachineOp(const MachineOperand &Op0,
				995	const MachineOperand &Op1) {
				996	if (Op0.getType() != Op1.getType())
				997	return false;
				998
				999	switch (Op0.getType()) {
				1000	case MachineOperand::MO_Register:
				1001	return Op0.getReg() == Op1.getReg();
				1002	case MachineOperand::MO_Immediate:
				1003	return Op0.getImm() == Op1.getImm();
				1004	case MachineOperand::MO_FPImmediate:
				1005	return Op0.getFPImm() == Op1.getFPImm();
				1006	default:
				1007	llvm_unreachable("Didn't expect to be comparing these operand types");
				1008	}
				1009	}
				1010
Tom Stellard	b02094e	2014-07-21 15:45:01 +0000	[diff] [blame]	1011	bool SIInstrInfo::isImmOperandLegal(const MachineInstr *MI, unsigned OpNo,
				1012	const MachineOperand &MO) const {
				1013	const MCOperandInfo &OpInfo = get(MI->getOpcode()).OpInfo[OpNo];
				1014
Tom Stellard	73ae1cb	2014-09-23 21:26:25 +0000	[diff] [blame]	1015	assert(MO.isImm() \|\| MO.isFPImm() \|\| MO.isTargetIndex() \|\| MO.isFI());
Tom Stellard	b02094e	2014-07-21 15:45:01 +0000	[diff] [blame]	1016
				1017	if (OpInfo.OperandType == MCOI::OPERAND_IMMEDIATE)
				1018	return true;
				1019
				1020	if (OpInfo.RegClass < 0)
				1021	return false;
				1022
Tom Stellard	73ae1cb	2014-09-23 21:26:25 +0000	[diff] [blame]	1023	if (isLiteralConstant(MO))
				1024	return RI.regClassCanUseLiteralConstant(OpInfo.RegClass);
				1025
				1026	return RI.regClassCanUseInlineConstant(OpInfo.RegClass);
Tom Stellard	b02094e	2014-07-21 15:45:01 +0000	[diff] [blame]	1027	}
				1028
Marek Olsak	58f61a8	2014-12-07 17:17:38 +0000	[diff] [blame]	1029	bool SIInstrInfo::canFoldOffset(unsigned OffsetSize, unsigned AS) const {
Matt Arsenault	b2baffa	2014-08-15 17:49:05 +0000	[diff] [blame]	1030	switch (AS) {
				1031	case AMDGPUAS::GLOBAL_ADDRESS: {
				1032	// MUBUF instructions a 12-bit offset in bytes.
				1033	return isUInt<12>(OffsetSize);
				1034	}
				1035	case AMDGPUAS::CONSTANT_ADDRESS: {
Marek Olsak	58f61a8	2014-12-07 17:17:38 +0000	[diff] [blame]	1036	// SMRD instructions have an 8-bit offset in dwords on SI and
				1037	// a 20-bit offset in bytes on VI.
				1038	if (RI.ST.getGeneration() >= AMDGPUSubtarget::VOLCANIC_ISLANDS)
				1039	return isUInt<20>(OffsetSize);
				1040	else
				1041	return (OffsetSize % 4 == 0) && isUInt<8>(OffsetSize / 4);
Matt Arsenault	b2baffa	2014-08-15 17:49:05 +0000	[diff] [blame]	1042	}
				1043	case AMDGPUAS::LOCAL_ADDRESS:
				1044	case AMDGPUAS::REGION_ADDRESS: {
				1045	// The single offset versions have a 16-bit offset in bytes.
				1046	return isUInt<16>(OffsetSize);
				1047	}
				1048	case AMDGPUAS::PRIVATE_ADDRESS:
				1049	// Indirect register addressing does not use any offsets.
				1050	default:
				1051	return 0;
				1052	}
				1053	}
				1054
Tom Stellard	86d12eb	2014-08-01 00:32:28 +0000	[diff] [blame]	1055	bool SIInstrInfo::hasVALU32BitEncoding(unsigned Opcode) const {
				1056	return AMDGPU::getVOPe32(Opcode) != -1;
				1057	}
				1058
Tom Stellard	b4a313a	2014-08-01 00:32:39 +0000	[diff] [blame]	1059	bool SIInstrInfo::hasModifiers(unsigned Opcode) const {
				1060	// The src0_modifier operand is present on all instructions
				1061	// that have modifiers.
				1062
				1063	return AMDGPU::getNamedOperandIdx(Opcode,
				1064	AMDGPU::OpName::src0_modifiers) != -1;
				1065	}
				1066
Matt Arsenault	ace5b76	2014-10-17 18:00:43 +0000	[diff] [blame]	1067	bool SIInstrInfo::hasModifiersSet(const MachineInstr &MI,
				1068	unsigned OpName) const {
				1069	const MachineOperand *Mods = getNamedOperand(MI, OpName);
				1070	return Mods && Mods->getImm();
				1071	}
				1072
Tom Stellard	73ae1cb	2014-09-23 21:26:25 +0000	[diff] [blame]	1073	bool SIInstrInfo::usesConstantBus(const MachineRegisterInfo &MRI,
				1074	const MachineOperand &MO) const {
				1075	// Literal constants use the constant bus.
				1076	if (isLiteralConstant(MO))
				1077	return true;
				1078
				1079	if (!MO.isReg() \|\| !MO.isUse())
				1080	return false;
				1081
				1082	if (TargetRegisterInfo::isVirtualRegister(MO.getReg()))
				1083	return RI.isSGPRClass(MRI.getRegClass(MO.getReg()));
				1084
				1085	// FLAT_SCR is just an SGPR pair.
				1086	if (!MO.isImplicit() && (MO.getReg() == AMDGPU::FLAT_SCR))
				1087	return true;
				1088
				1089	// EXEC register uses the constant bus.
				1090	if (!MO.isImplicit() && MO.getReg() == AMDGPU::EXEC)
				1091	return true;
				1092
				1093	// SGPRs use the constant bus
				1094	if (MO.getReg() == AMDGPU::M0 \|\| MO.getReg() == AMDGPU::VCC \|\|
				1095	(!MO.isImplicit() &&
				1096	(AMDGPU::SGPR_32RegClass.contains(MO.getReg()) \|\|
				1097	AMDGPU::SGPR_64RegClass.contains(MO.getReg())))) {
				1098	return true;
				1099	}
				1100
				1101	return false;
				1102	}
				1103
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	1104	bool SIInstrInfo::verifyInstruction(const MachineInstr *MI,
				1105	StringRef &ErrInfo) const {
				1106	uint16_t Opcode = MI->getOpcode();
Tom Stellard	73ae1cb	2014-09-23 21:26:25 +0000	[diff] [blame]	1107	const MachineRegisterInfo &MRI = MI->getParent()->getParent()->getRegInfo();
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	1108	int Src0Idx = AMDGPU::getNamedOperandIdx(Opcode, AMDGPU::OpName::src0);
				1109	int Src1Idx = AMDGPU::getNamedOperandIdx(Opcode, AMDGPU::OpName::src1);
				1110	int Src2Idx = AMDGPU::getNamedOperandIdx(Opcode, AMDGPU::OpName::src2);
				1111
Tom Stellard	ca700e4	2014-03-17 17:03:49 +0000	[diff] [blame]	1112	// Make sure the number of operands is correct.
				1113	const MCInstrDesc &Desc = get(Opcode);
				1114	if (!Desc.isVariadic() &&
				1115	Desc.getNumOperands() != MI->getNumExplicitOperands()) {
				1116	ErrInfo = "Instruction has wrong number of operands.";
				1117	return false;
				1118	}
				1119
				1120	// Make sure the register classes are correct
Tom Stellard	b4a313a	2014-08-01 00:32:39 +0000	[diff] [blame]	1121	for (int i = 0, e = Desc.getNumOperands(); i != e; ++i) {
Tom Stellard	ca700e4	2014-03-17 17:03:49 +0000	[diff] [blame]	1122	switch (Desc.OpInfo[i].OperandType) {
Tom Stellard	a305f93	2014-07-02 20:53:44 +0000	[diff] [blame]	1123	case MCOI::OPERAND_REGISTER: {
Tom Stellard	73ae1cb	2014-09-23 21:26:25 +0000	[diff] [blame]	1124	if ((MI->getOperand(i).isImm() \|\| MI->getOperand(i).isFPImm()) &&
				1125	!isImmOperandLegal(MI, i, MI->getOperand(i))) {
				1126	ErrInfo = "Illegal immediate value for operand.";
Tom Stellard	b4a313a	2014-08-01 00:32:39 +0000	[diff] [blame]	1127	return false;
				1128	}
Tom Stellard	a305f93	2014-07-02 20:53:44 +0000	[diff] [blame]	1129	}
Tom Stellard	ca700e4	2014-03-17 17:03:49 +0000	[diff] [blame]	1130	break;
				1131	case MCOI::OPERAND_IMMEDIATE:
Tom Stellard	b02094e	2014-07-21 15:45:01 +0000	[diff] [blame]	1132	// Check if this operand is an immediate.
				1133	// FrameIndex operands will be replaced by immediates, so they are
				1134	// allowed.
				1135	if (!MI->getOperand(i).isImm() && !MI->getOperand(i).isFPImm() &&
				1136	!MI->getOperand(i).isFI()) {
Tom Stellard	ca700e4	2014-03-17 17:03:49 +0000	[diff] [blame]	1137	ErrInfo = "Expected immediate, but got non-immediate";
				1138	return false;
				1139	}
				1140	// Fall-through
				1141	default:
				1142	continue;
				1143	}
				1144
				1145	if (!MI->getOperand(i).isReg())
				1146	continue;
				1147
				1148	int RegClass = Desc.OpInfo[i].RegClass;
				1149	if (RegClass != -1) {
				1150	unsigned Reg = MI->getOperand(i).getReg();
				1151	if (TargetRegisterInfo::isVirtualRegister(Reg))
				1152	continue;
				1153
				1154	const TargetRegisterClass *RC = RI.getRegClass(RegClass);
				1155	if (!RC->contains(Reg)) {
				1156	ErrInfo = "Operand has incorrect register class.";
				1157	return false;
				1158	}
				1159	}
				1160	}
				1161
				1162
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	1163	// Verify VOP*
				1164	if (isVOP1(Opcode) \|\| isVOP2(Opcode) \|\| isVOP3(Opcode) \|\| isVOPC(Opcode)) {
Matt Arsenault	e368cb3	2014-12-11 23:37:32 +0000	[diff] [blame]	1165	// Only look at the true operands. Only a real operand can use the constant
				1166	// bus, and we don't want to check pseudo-operands like the source modifier
				1167	// flags.
				1168	const int OpIndices[] = { Src0Idx, Src1Idx, Src2Idx };
				1169
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	1170	unsigned ConstantBusCount = 0;
				1171	unsigned SGPRUsed = AMDGPU::NoRegister;
Matt Arsenault	e368cb3	2014-12-11 23:37:32 +0000	[diff] [blame]	1172	for (int OpIdx : OpIndices) {
				1173	if (OpIdx == -1)
				1174	break;
				1175
				1176	const MachineOperand &MO = MI->getOperand(OpIdx);
Tom Stellard	73ae1cb	2014-09-23 21:26:25 +0000	[diff] [blame]	1177	if (usesConstantBus(MRI, MO)) {
				1178	if (MO.isReg()) {
				1179	if (MO.getReg() != SGPRUsed)
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	1180	++ConstantBusCount;
Tom Stellard	73ae1cb	2014-09-23 21:26:25 +0000	[diff] [blame]	1181	SGPRUsed = MO.getReg();
				1182	} else {
				1183	++ConstantBusCount;
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	1184	}
				1185	}
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	1186	}
				1187	if (ConstantBusCount > 1) {
				1188	ErrInfo = "VOP* instruction uses the constant bus more than once";
				1189	return false;
				1190	}
				1191	}
				1192
				1193	// Verify SRC1 for VOP2 and VOPC
				1194	if (Src1Idx != -1 && (isVOP2(Opcode) \|\| isVOPC(Opcode))) {
				1195	const MachineOperand &Src1 = MI->getOperand(Src1Idx);
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1196	if (Src1.isImm() \|\| Src1.isFPImm()) {
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	1197	ErrInfo = "VOP[2C] src1 cannot be an immediate.";
				1198	return false;
				1199	}
				1200	}
				1201
				1202	// Verify VOP3
				1203	if (isVOP3(Opcode)) {
				1204	if (Src0Idx != -1 && isLiteralConstant(MI->getOperand(Src0Idx))) {
				1205	ErrInfo = "VOP3 src0 cannot be a literal constant.";
				1206	return false;
				1207	}
				1208	if (Src1Idx != -1 && isLiteralConstant(MI->getOperand(Src1Idx))) {
				1209	ErrInfo = "VOP3 src1 cannot be a literal constant.";
				1210	return false;
				1211	}
				1212	if (Src2Idx != -1 && isLiteralConstant(MI->getOperand(Src2Idx))) {
				1213	ErrInfo = "VOP3 src2 cannot be a literal constant.";
				1214	return false;
				1215	}
				1216	}
Matt Arsenault	becb140	2014-06-23 18:28:31 +0000	[diff] [blame]	1217
				1218	// Verify misc. restrictions on specific instructions.
				1219	if (Desc.getOpcode() == AMDGPU::V_DIV_SCALE_F32 \|\|
				1220	Desc.getOpcode() == AMDGPU::V_DIV_SCALE_F64) {
Matt Arsenault	262407b	2014-09-24 02:17:09 +0000	[diff] [blame]	1221	const MachineOperand &Src0 = MI->getOperand(Src0Idx);
				1222	const MachineOperand &Src1 = MI->getOperand(Src1Idx);
				1223	const MachineOperand &Src2 = MI->getOperand(Src2Idx);
Matt Arsenault	becb140	2014-06-23 18:28:31 +0000	[diff] [blame]	1224	if (Src0.isReg() && Src1.isReg() && Src2.isReg()) {
				1225	if (!compareMachineOp(Src0, Src1) &&
				1226	!compareMachineOp(Src0, Src2)) {
				1227	ErrInfo = "v_div_scale_{f32\|f64} require src0 = src1 or src2";
				1228	return false;
				1229	}
				1230	}
				1231	}
				1232
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	1233	return true;
				1234	}
				1235
Matt Arsenault	f14032a	2013-11-15 22:02:28 +0000	[diff] [blame]	1236	unsigned SIInstrInfo::getVALUOp(const MachineInstr &MI) {
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1237	switch (MI.getOpcode()) {
				1238	default: return AMDGPU::INSTRUCTION_LIST_END;
				1239	case AMDGPU::REG_SEQUENCE: return AMDGPU::REG_SEQUENCE;
				1240	case AMDGPU::COPY: return AMDGPU::COPY;
				1241	case AMDGPU::PHI: return AMDGPU::PHI;
Tom Stellard	204e61b	2014-04-07 19:45:45 +0000	[diff] [blame]	1242	case AMDGPU::INSERT_SUBREG: return AMDGPU::INSERT_SUBREG;
Tom Stellard	e038720	2014-03-21 15:51:54 +0000	[diff] [blame]	1243	case AMDGPU::S_MOV_B32:
				1244	return MI.getOperand(1).isReg() ?
Tom Stellard	8c12fd9	2014-03-24 16:12:34 +0000	[diff] [blame]	1245	AMDGPU::COPY : AMDGPU::V_MOV_B32_e32;
Tom Stellard	80942a1	2014-09-05 14:07:59 +0000	[diff] [blame]	1246	case AMDGPU::S_ADD_I32:
				1247	case AMDGPU::S_ADD_U32: return AMDGPU::V_ADD_I32_e32;
Matt Arsenault	43b8e4e	2013-11-18 20:09:29 +0000	[diff] [blame]	1248	case AMDGPU::S_ADDC_U32: return AMDGPU::V_ADDC_U32_e32;
Tom Stellard	80942a1	2014-09-05 14:07:59 +0000	[diff] [blame]	1249	case AMDGPU::S_SUB_I32:
				1250	case AMDGPU::S_SUB_U32: return AMDGPU::V_SUB_I32_e32;
Matt Arsenault	43b8e4e	2013-11-18 20:09:29 +0000	[diff] [blame]	1251	case AMDGPU::S_SUBB_U32: return AMDGPU::V_SUBB_U32_e32;
Matt Arsenault	869cd07	2014-09-03 23:24:35 +0000	[diff] [blame]	1252	case AMDGPU::S_MUL_I32: return AMDGPU::V_MUL_LO_I32;
Matt Arsenault	8e2581b	2014-03-21 18:01:18 +0000	[diff] [blame]	1253	case AMDGPU::S_AND_B32: return AMDGPU::V_AND_B32_e32;
				1254	case AMDGPU::S_OR_B32: return AMDGPU::V_OR_B32_e32;
				1255	case AMDGPU::S_XOR_B32: return AMDGPU::V_XOR_B32_e32;
				1256	case AMDGPU::S_MIN_I32: return AMDGPU::V_MIN_I32_e32;
				1257	case AMDGPU::S_MIN_U32: return AMDGPU::V_MIN_U32_e32;
				1258	case AMDGPU::S_MAX_I32: return AMDGPU::V_MAX_I32_e32;
				1259	case AMDGPU::S_MAX_U32: return AMDGPU::V_MAX_U32_e32;
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1260	case AMDGPU::S_ASHR_I32: return AMDGPU::V_ASHR_I32_e32;
				1261	case AMDGPU::S_ASHR_I64: return AMDGPU::V_ASHR_I64;
				1262	case AMDGPU::S_LSHL_B32: return AMDGPU::V_LSHL_B32_e32;
				1263	case AMDGPU::S_LSHL_B64: return AMDGPU::V_LSHL_B64;
				1264	case AMDGPU::S_LSHR_B32: return AMDGPU::V_LSHR_B32_e32;
				1265	case AMDGPU::S_LSHR_B64: return AMDGPU::V_LSHR_B64;
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	1266	case AMDGPU::S_SEXT_I32_I8: return AMDGPU::V_BFE_I32;
				1267	case AMDGPU::S_SEXT_I32_I16: return AMDGPU::V_BFE_I32;
Matt Arsenault	78b8670	2014-04-18 05:19:26 +0000	[diff] [blame]	1268	case AMDGPU::S_BFE_U32: return AMDGPU::V_BFE_U32;
				1269	case AMDGPU::S_BFE_I32: return AMDGPU::V_BFE_I32;
Matt Arsenault	43160e7	2014-06-18 17:13:57 +0000	[diff] [blame]	1270	case AMDGPU::S_BREV_B32: return AMDGPU::V_BFREV_B32_e32;
Matt Arsenault	2c33562	2014-04-09 07:16:16 +0000	[diff] [blame]	1271	case AMDGPU::S_NOT_B32: return AMDGPU::V_NOT_B32_e32;
Matt Arsenault	689f325	2014-06-09 16:36:31 +0000	[diff] [blame]	1272	case AMDGPU::S_NOT_B64: return AMDGPU::V_NOT_B32_e32;
Matt Arsenault	0cb92e1	2014-04-11 19:25:18 +0000	[diff] [blame]	1273	case AMDGPU::S_CMP_EQ_I32: return AMDGPU::V_CMP_EQ_I32_e32;
				1274	case AMDGPU::S_CMP_LG_I32: return AMDGPU::V_CMP_NE_I32_e32;
				1275	case AMDGPU::S_CMP_GT_I32: return AMDGPU::V_CMP_GT_I32_e32;
				1276	case AMDGPU::S_CMP_GE_I32: return AMDGPU::V_CMP_GE_I32_e32;
				1277	case AMDGPU::S_CMP_LT_I32: return AMDGPU::V_CMP_LT_I32_e32;
				1278	case AMDGPU::S_CMP_LE_I32: return AMDGPU::V_CMP_LE_I32_e32;
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1279	case AMDGPU::S_LOAD_DWORD_IMM:
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1280	case AMDGPU::S_LOAD_DWORD_SGPR: return AMDGPU::BUFFER_LOAD_DWORD_ADDR64;
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1281	case AMDGPU::S_LOAD_DWORDX2_IMM:
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1282	case AMDGPU::S_LOAD_DWORDX2_SGPR: return AMDGPU::BUFFER_LOAD_DWORDX2_ADDR64;
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1283	case AMDGPU::S_LOAD_DWORDX4_IMM:
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1284	case AMDGPU::S_LOAD_DWORDX4_SGPR: return AMDGPU::BUFFER_LOAD_DWORDX4_ADDR64;
Matt Arsenault	b5b5110	2014-06-10 19:18:21 +0000	[diff] [blame]	1285	case AMDGPU::S_BCNT1_I32_B32: return AMDGPU::V_BCNT_U32_B32_e32;
Matt Arsenault	295b86e	2014-06-17 17:36:27 +0000	[diff] [blame]	1286	case AMDGPU::S_FF1_I32_B32: return AMDGPU::V_FFBL_B32_e32;
Matt Arsenault	8579601	2014-06-17 17:36:24 +0000	[diff] [blame]	1287	case AMDGPU::S_FLBIT_I32_B32: return AMDGPU::V_FFBH_U32_e32;
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1288	}
				1289	}
				1290
				1291	bool SIInstrInfo::isSALUOpSupportedOnVALU(const MachineInstr &MI) const {
				1292	return getVALUOp(MI) != AMDGPU::INSTRUCTION_LIST_END;
				1293	}
				1294
				1295	const TargetRegisterClass *SIInstrInfo::getOpRegClass(const MachineInstr &MI,
				1296	unsigned OpNo) const {
				1297	const MachineRegisterInfo &MRI = MI.getParent()->getParent()->getRegInfo();
				1298	const MCInstrDesc &Desc = get(MI.getOpcode());
				1299	if (MI.isVariadic() \|\| OpNo >= Desc.getNumOperands() \|\|
Matt Arsenault	102a704	2014-12-11 23:37:34 +0000	[diff] [blame]	1300	Desc.OpInfo[OpNo].RegClass == -1) {
				1301	unsigned Reg = MI.getOperand(OpNo).getReg();
				1302
				1303	if (TargetRegisterInfo::isVirtualRegister(Reg))
				1304	return MRI.getRegClass(Reg);
				1305	return RI.getRegClass(Reg);
				1306	}
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1307
				1308	unsigned RCID = Desc.OpInfo[OpNo].RegClass;
				1309	return RI.getRegClass(RCID);
				1310	}
				1311
				1312	bool SIInstrInfo::canReadVGPR(const MachineInstr &MI, unsigned OpNo) const {
				1313	switch (MI.getOpcode()) {
				1314	case AMDGPU::COPY:
				1315	case AMDGPU::REG_SEQUENCE:
Tom Stellard	4f3b04d	2014-04-17 21:00:07 +0000	[diff] [blame]	1316	case AMDGPU::PHI:
Tom Stellard	a568738	2014-05-15 14:41:55 +0000	[diff] [blame]	1317	case AMDGPU::INSERT_SUBREG:
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1318	return RI.hasVGPRs(getOpRegClass(MI, 0));
				1319	default:
				1320	return RI.hasVGPRs(getOpRegClass(MI, OpNo));
				1321	}
				1322	}
				1323
				1324	void SIInstrInfo::legalizeOpWithMove(MachineInstr *MI, unsigned OpIdx) const {
				1325	MachineBasicBlock::iterator I = MI;
Matt Arsenault	3f3a275	2014-10-13 15:47:59 +0000	[diff] [blame]	1326	MachineBasicBlock *MBB = MI->getParent();
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1327	MachineOperand &MO = MI->getOperand(OpIdx);
Matt Arsenault	3f3a275	2014-10-13 15:47:59 +0000	[diff] [blame]	1328	MachineRegisterInfo &MRI = MBB->getParent()->getRegInfo();
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1329	unsigned RCID = get(MI->getOpcode()).OpInfo[OpIdx].RegClass;
				1330	const TargetRegisterClass *RC = RI.getRegClass(RCID);
				1331	unsigned Opcode = AMDGPU::V_MOV_B32_e32;
Matt Arsenault	3f3a275	2014-10-13 15:47:59 +0000	[diff] [blame]	1332	if (MO.isReg())
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1333	Opcode = AMDGPU::COPY;
Matt Arsenault	3f3a275	2014-10-13 15:47:59 +0000	[diff] [blame]	1334	else if (RI.isSGPRClass(RC))
Matt Arsenault	671a005	2013-11-14 10:08:50 +0000	[diff] [blame]	1335	Opcode = AMDGPU::S_MOV_B32;
Matt Arsenault	3f3a275	2014-10-13 15:47:59 +0000	[diff] [blame]	1336
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1337
Matt Arsenault	3a4d86a	2013-11-18 20:09:55 +0000	[diff] [blame]	1338	const TargetRegisterClass *VRC = RI.getEquivalentVGPRClass(RC);
Matt Arsenault	3f3a275	2014-10-13 15:47:59 +0000	[diff] [blame]	1339	if (RI.getCommonSubClass(&AMDGPU::VReg_64RegClass, VRC))
Tom Stellard	0c93c9e	2014-09-05 14:08:01 +0000	[diff] [blame]	1340	VRC = &AMDGPU::VReg_64RegClass;
Matt Arsenault	3f3a275	2014-10-13 15:47:59 +0000	[diff] [blame]	1341	else
Tom Stellard	0c93c9e	2014-09-05 14:08:01 +0000	[diff] [blame]	1342	VRC = &AMDGPU::VReg_32RegClass;
Matt Arsenault	3f3a275	2014-10-13 15:47:59 +0000	[diff] [blame]	1343
Matt Arsenault	3a4d86a	2013-11-18 20:09:55 +0000	[diff] [blame]	1344	unsigned Reg = MRI.createVirtualRegister(VRC);
Matt Arsenault	3f3a275	2014-10-13 15:47:59 +0000	[diff] [blame]	1345	DebugLoc DL = MBB->findDebugLoc(I);
				1346	BuildMI(*MI->getParent(), I, DL, get(Opcode), Reg)
				1347	.addOperand(MO);
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1348	MO.ChangeToRegister(Reg, false);
				1349	}
				1350
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1351	unsigned SIInstrInfo::buildExtractSubReg(MachineBasicBlock::iterator MI,
				1352	MachineRegisterInfo &MRI,
				1353	MachineOperand &SuperReg,
				1354	const TargetRegisterClass *SuperRC,
				1355	unsigned SubIdx,
				1356	const TargetRegisterClass *SubRC)
				1357	const {
				1358	assert(SuperReg.isReg());
				1359
				1360	unsigned NewSuperReg = MRI.createVirtualRegister(SuperRC);
				1361	unsigned SubReg = MRI.createVirtualRegister(SubRC);
				1362
				1363	// Just in case the super register is itself a sub-register, copy it to a new
Matt Arsenault	08d8494	2014-06-03 23:06:13 +0000	[diff] [blame]	1364	// value so we don't need to worry about merging its subreg index with the
				1365	// SubIdx passed to this function. The register coalescer should be able to
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1366	// eliminate this extra copy.
Matt Arsenault	7480a0e	2014-11-17 21:11:37 +0000	[diff] [blame]	1367	MachineBasicBlock *MBB = MI->getParent();
				1368	DebugLoc DL = MI->getDebugLoc();
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1369
Matt Arsenault	7480a0e	2014-11-17 21:11:37 +0000	[diff] [blame]	1370	BuildMI(*MBB, MI, DL, get(TargetOpcode::COPY), NewSuperReg)
				1371	.addReg(SuperReg.getReg(), 0, SuperReg.getSubReg());
				1372
				1373	BuildMI(*MBB, MI, DL, get(TargetOpcode::COPY), SubReg)
				1374	.addReg(NewSuperReg, 0, SubIdx);
				1375
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1376	return SubReg;
				1377	}
				1378
Matt Arsenault	248b7b6	2014-03-24 20:08:09 +0000	[diff] [blame]	1379	MachineOperand SIInstrInfo::buildExtractSubRegOrImm(
				1380	MachineBasicBlock::iterator MII,
				1381	MachineRegisterInfo &MRI,
				1382	MachineOperand &Op,
				1383	const TargetRegisterClass *SuperRC,
				1384	unsigned SubIdx,
				1385	const TargetRegisterClass *SubRC) const {
				1386	if (Op.isImm()) {
				1387	// XXX - Is there a better way to do this?
				1388	if (SubIdx == AMDGPU::sub0)
				1389	return MachineOperand::CreateImm(Op.getImm() & 0xFFFFFFFF);
				1390	if (SubIdx == AMDGPU::sub1)
				1391	return MachineOperand::CreateImm(Op.getImm() >> 32);
				1392
				1393	llvm_unreachable("Unhandled register index for immediate");
				1394	}
				1395
				1396	unsigned SubReg = buildExtractSubReg(MII, MRI, Op, SuperRC,
				1397	SubIdx, SubRC);
				1398	return MachineOperand::CreateReg(SubReg, false);
				1399	}
				1400
Matt Arsenault	bd99580	2014-03-24 18:26:52 +0000	[diff] [blame]	1401	unsigned SIInstrInfo::split64BitImm(SmallVectorImpl<MachineInstr *> &Worklist,
				1402	MachineBasicBlock::iterator MI,
				1403	MachineRegisterInfo &MRI,
				1404	const TargetRegisterClass *RC,
				1405	const MachineOperand &Op) const {
				1406	MachineBasicBlock *MBB = MI->getParent();
				1407	DebugLoc DL = MI->getDebugLoc();
				1408	unsigned LoDst = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
				1409	unsigned HiDst = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
				1410	unsigned Dst = MRI.createVirtualRegister(RC);
				1411
				1412	MachineInstr Lo = BuildMI(MBB, MI, DL, get(AMDGPU::S_MOV_B32),
				1413	LoDst)
				1414	.addImm(Op.getImm() & 0xFFFFFFFF);
				1415	MachineInstr Hi = BuildMI(MBB, MI, DL, get(AMDGPU::S_MOV_B32),
				1416	HiDst)
				1417	.addImm(Op.getImm() >> 32);
				1418
				1419	BuildMI(*MBB, MI, DL, get(TargetOpcode::REG_SEQUENCE), Dst)
				1420	.addReg(LoDst)
				1421	.addImm(AMDGPU::sub0)
				1422	.addReg(HiDst)
				1423	.addImm(AMDGPU::sub1);
				1424
				1425	Worklist.push_back(Lo);
				1426	Worklist.push_back(Hi);
				1427
				1428	return Dst;
				1429	}
				1430
Marek Olsak	be04780	2014-12-07 12:19:03 +0000	[diff] [blame]	1431	// Change the order of operands from (0, 1, 2) to (0, 2, 1)
				1432	void SIInstrInfo::swapOperands(MachineBasicBlock::iterator Inst) const {
				1433	assert(Inst->getNumExplicitOperands() == 3);
				1434	MachineOperand Op1 = Inst->getOperand(1);
				1435	Inst->RemoveOperand(1);
				1436	Inst->addOperand(Op1);
				1437	}
				1438
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1439	bool SIInstrInfo::isOperandLegal(const MachineInstr *MI, unsigned OpIdx,
				1440	const MachineOperand *MO) const {
				1441	const MachineRegisterInfo &MRI = MI->getParent()->getParent()->getRegInfo();
				1442	const MCInstrDesc &InstDesc = get(MI->getOpcode());
				1443	const MCOperandInfo &OpInfo = InstDesc.OpInfo[OpIdx];
				1444	const TargetRegisterClass *DefinedRC =
				1445	OpInfo.RegClass != -1 ? RI.getRegClass(OpInfo.RegClass) : nullptr;
				1446	if (!MO)
				1447	MO = &MI->getOperand(OpIdx);
				1448
Tom Stellard	5352f35	2014-12-19 22:15:37 +0000	[diff] [blame]	1449	if (isVALU(InstDesc.Opcode) && usesConstantBus(MRI, *MO)) {
Aaron Ballman	f086a14	2014-09-24 13:54:56 +0000	[diff] [blame]	1450	unsigned SGPRUsed =
				1451	MO->isReg() ? MO->getReg() : (unsigned)AMDGPU::NoRegister;
Tom Stellard	73ae1cb	2014-09-23 21:26:25 +0000	[diff] [blame]	1452	for (unsigned i = 0, e = MI->getNumOperands(); i != e; ++i) {
				1453	if (i == OpIdx)
				1454	continue;
				1455	if (usesConstantBus(MRI, MI->getOperand(i)) &&
				1456	MI->getOperand(i).isReg() && MI->getOperand(i).getReg() != SGPRUsed) {
				1457	return false;
				1458	}
				1459	}
				1460	}
				1461
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1462	if (MO->isReg()) {
				1463	assert(DefinedRC);
				1464	const TargetRegisterClass *RC = MRI.getRegClass(MO->getReg());
Tom Stellard	e0ddfd1	2014-11-19 16:58:49 +0000	[diff] [blame]	1465
				1466	// In order to be legal, the common sub-class must be equal to the
				1467	// class of the current operand. For example:
				1468	//
				1469	// v_mov_b32 s0 ; Operand defined as vsrc_32
				1470	// ; RI.getCommonSubClass(s0,vsrc_32) = sgpr ; LEGAL
				1471	//
				1472	// s_sendmsg 0, s0 ; Operand defined as m0reg
				1473	// ; RI.getCommonSubClass(s0,m0reg) = m0reg ; NOT LEGAL
				1474	return RI.getCommonSubClass(RC, RI.getRegClass(OpInfo.RegClass)) == RC;
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1475	}
				1476
				1477
				1478	// Handle non-register types that are treated like immediates.
				1479	assert(MO->isImm() \|\| MO->isFPImm() \|\| MO->isTargetIndex() \|\| MO->isFI());
				1480
Matt Arsenault	4364fef	2014-09-23 18:30:57 +0000	[diff] [blame]	1481	if (!DefinedRC) {
				1482	// This operand expects an immediate.
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1483	return true;
Matt Arsenault	4364fef	2014-09-23 18:30:57 +0000	[diff] [blame]	1484	}
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1485
Tom Stellard	73ae1cb	2014-09-23 21:26:25 +0000	[diff] [blame]	1486	return isImmOperandLegal(MI, OpIdx, *MO);
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1487	}
				1488
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1489	void SIInstrInfo::legalizeOperands(MachineInstr *MI) const {
				1490	MachineRegisterInfo &MRI = MI->getParent()->getParent()->getRegInfo();
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1491
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1492	int Src0Idx = AMDGPU::getNamedOperandIdx(MI->getOpcode(),
				1493	AMDGPU::OpName::src0);
				1494	int Src1Idx = AMDGPU::getNamedOperandIdx(MI->getOpcode(),
				1495	AMDGPU::OpName::src1);
				1496	int Src2Idx = AMDGPU::getNamedOperandIdx(MI->getOpcode(),
				1497	AMDGPU::OpName::src2);
				1498
				1499	// Legalize VOP2
				1500	if (isVOP2(MI->getOpcode()) && Src1Idx != -1) {
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1501	// Legalize src0
				1502	if (!isOperandLegal(MI, Src0Idx))
Matt Arsenault	08f7e37	2013-11-18 20:09:50 +0000	[diff] [blame]	1503	legalizeOpWithMove(MI, Src0Idx);
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1504
				1505	// Legalize src1
				1506	if (isOperandLegal(MI, Src1Idx))
Matt Arsenault	08f7e37	2013-11-18 20:09:50 +0000	[diff] [blame]	1507	return;
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1508
				1509	// Usually src0 of VOP2 instructions allow more types of inputs
				1510	// than src1, so try to commute the instruction to decrease our
				1511	// chances of having to insert a MOV instruction to legalize src1.
				1512	if (MI->isCommutable()) {
				1513	if (commuteInstruction(MI))
				1514	// If we are successful in commuting, then we know MI is legal, so
				1515	// we are done.
				1516	return;
Matt Arsenault	08f7e37	2013-11-18 20:09:50 +0000	[diff] [blame]	1517	}
				1518
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1519	legalizeOpWithMove(MI, Src1Idx);
				1520	return;
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1521	}
				1522
Matt Arsenault	08f7e37	2013-11-18 20:09:50 +0000	[diff] [blame]	1523	// XXX - Do any VOP3 instructions read VCC?
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1524	// Legalize VOP3
				1525	if (isVOP3(MI->getOpcode())) {
Matt Arsenault	5885bef	2014-09-26 17:54:52 +0000	[diff] [blame]	1526	int VOP3Idx[3] = { Src0Idx, Src1Idx, Src2Idx };
				1527
Matt Arsenault	6a0919f	2014-09-26 17:55:03 +0000	[diff] [blame]	1528	// Find the one SGPR operand we are allowed to use.
Matt Arsenault	ee522bf	2014-09-26 17:55:06 +0000	[diff] [blame]	1529	unsigned SGPRReg = findUsedSGPR(MI, VOP3Idx);
Matt Arsenault	5885bef	2014-09-26 17:54:52 +0000	[diff] [blame]	1530
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1531	for (unsigned i = 0; i < 3; ++i) {
				1532	int Idx = VOP3Idx[i];
				1533	if (Idx == -1)
Matt Arsenault	2dd3129	2014-09-26 17:55:14 +0000	[diff] [blame]	1534	break;
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1535	MachineOperand &MO = MI->getOperand(Idx);
				1536
				1537	if (MO.isReg()) {
				1538	if (!RI.isSGPRClass(MRI.getRegClass(MO.getReg())))
				1539	continue; // VGPRs are legal
				1540
Matt Arsenault	f0b1e3a	2013-11-18 20:09:21 +0000	[diff] [blame]	1541	assert(MO.getReg() != AMDGPU::SCC && "SCC operand to VOP3 instruction");
				1542
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1543	if (SGPRReg == AMDGPU::NoRegister \|\| SGPRReg == MO.getReg()) {
				1544	SGPRReg = MO.getReg();
				1545	// We can use one SGPR in each VOP3 instruction.
				1546	continue;
				1547	}
				1548	} else if (!isLiteralConstant(MO)) {
				1549	// If it is not a register and not a literal constant, then it must be
				1550	// an inline constant which is always legal.
				1551	continue;
				1552	}
				1553	// If we make it this far, then the operand is not legal and we must
				1554	// legalize it.
				1555	legalizeOpWithMove(MI, Idx);
				1556	}
				1557	}
				1558
Tom Stellard	4f3b04d	2014-04-17 21:00:07 +0000	[diff] [blame]	1559	// Legalize REG_SEQUENCE and PHI
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1560	// The register class of the operands much be the same type as the register
				1561	// class of the output.
Tom Stellard	4f3b04d	2014-04-17 21:00:07 +0000	[diff] [blame]	1562	if (MI->getOpcode() == AMDGPU::REG_SEQUENCE \|\|
				1563	MI->getOpcode() == AMDGPU::PHI) {
Craig Topper	062a2ba	2014-04-25 05:30:21 +0000	[diff] [blame]	1564	const TargetRegisterClass RC = nullptr, SRC = nullptr, *VRC = nullptr;
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1565	for (unsigned i = 1, e = MI->getNumOperands(); i != e; i+=2) {
				1566	if (!MI->getOperand(i).isReg() \|\|
				1567	!TargetRegisterInfo::isVirtualRegister(MI->getOperand(i).getReg()))
				1568	continue;
				1569	const TargetRegisterClass *OpRC =
				1570	MRI.getRegClass(MI->getOperand(i).getReg());
				1571	if (RI.hasVGPRs(OpRC)) {
				1572	VRC = OpRC;
				1573	} else {
				1574	SRC = OpRC;
				1575	}
				1576	}
				1577
				1578	// If any of the operands are VGPR registers, then they all most be
				1579	// otherwise we will create illegal VGPR->SGPR copies when legalizing
				1580	// them.
				1581	if (VRC \|\| !RI.isSGPRClass(getOpRegClass(*MI, 0))) {
				1582	if (!VRC) {
				1583	assert(SRC);
				1584	VRC = RI.getEquivalentVGPRClass(SRC);
				1585	}
				1586	RC = VRC;
				1587	} else {
				1588	RC = SRC;
				1589	}
				1590
				1591	// Update all the operands so they have the same type.
				1592	for (unsigned i = 1, e = MI->getNumOperands(); i != e; i+=2) {
				1593	if (!MI->getOperand(i).isReg() \|\|
				1594	!TargetRegisterInfo::isVirtualRegister(MI->getOperand(i).getReg()))
				1595	continue;
				1596	unsigned DstReg = MRI.createVirtualRegister(RC);
Tom Stellard	4f3b04d	2014-04-17 21:00:07 +0000	[diff] [blame]	1597	MachineBasicBlock *InsertBB;
				1598	MachineBasicBlock::iterator Insert;
				1599	if (MI->getOpcode() == AMDGPU::REG_SEQUENCE) {
				1600	InsertBB = MI->getParent();
				1601	Insert = MI;
				1602	} else {
				1603	// MI is a PHI instruction.
				1604	InsertBB = MI->getOperand(i + 1).getMBB();
				1605	Insert = InsertBB->getFirstTerminator();
				1606	}
				1607	BuildMI(*InsertBB, Insert, MI->getDebugLoc(),
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1608	get(AMDGPU::COPY), DstReg)
				1609	.addOperand(MI->getOperand(i));
				1610	MI->getOperand(i).setReg(DstReg);
				1611	}
				1612	}
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1613
Tom Stellard	a568738	2014-05-15 14:41:55 +0000	[diff] [blame]	1614	// Legalize INSERT_SUBREG
				1615	// src0 must have the same register class as dst
				1616	if (MI->getOpcode() == AMDGPU::INSERT_SUBREG) {
				1617	unsigned Dst = MI->getOperand(0).getReg();
				1618	unsigned Src0 = MI->getOperand(1).getReg();
				1619	const TargetRegisterClass *DstRC = MRI.getRegClass(Dst);
				1620	const TargetRegisterClass *Src0RC = MRI.getRegClass(Src0);
				1621	if (DstRC != Src0RC) {
				1622	MachineBasicBlock &MBB = *MI->getParent();
				1623	unsigned NewSrc0 = MRI.createVirtualRegister(DstRC);
				1624	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::COPY), NewSrc0)
				1625	.addReg(Src0);
				1626	MI->getOperand(1).setReg(NewSrc0);
				1627	}
				1628	return;
				1629	}
				1630
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1631	// Legalize MUBUF* instructions
				1632	// FIXME: If we start using the non-addr64 instructions for compute, we
				1633	// may need to legalize them here.
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1634	int SRsrcIdx =
				1635	AMDGPU::getNamedOperandIdx(MI->getOpcode(), AMDGPU::OpName::srsrc);
				1636	if (SRsrcIdx != -1) {
				1637	// We have an MUBUF instruction
				1638	MachineOperand *SRsrc = &MI->getOperand(SRsrcIdx);
				1639	unsigned SRsrcRC = get(MI->getOpcode()).OpInfo[SRsrcIdx].RegClass;
				1640	if (RI.getCommonSubClass(MRI.getRegClass(SRsrc->getReg()),
				1641	RI.getRegClass(SRsrcRC))) {
				1642	// The operands are legal.
				1643	// FIXME: We may need to legalize operands besided srsrc.
				1644	return;
				1645	}
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1646
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1647	MachineBasicBlock &MBB = *MI->getParent();
				1648	// Extract the the ptr from the resource descriptor.
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1649
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1650	// SRsrcPtrLo = srsrc:sub0
				1651	unsigned SRsrcPtrLo = buildExtractSubReg(MI, MRI, *SRsrc,
				1652	&AMDGPU::VReg_128RegClass, AMDGPU::sub0, &AMDGPU::VReg_32RegClass);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1653
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1654	// SRsrcPtrHi = srsrc:sub1
				1655	unsigned SRsrcPtrHi = buildExtractSubReg(MI, MRI, *SRsrc,
				1656	&AMDGPU::VReg_128RegClass, AMDGPU::sub1, &AMDGPU::VReg_32RegClass);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1657
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1658	// Create an empty resource descriptor
				1659	unsigned Zero64 = MRI.createVirtualRegister(&AMDGPU::SReg_64RegClass);
				1660	unsigned SRsrcFormatLo = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
				1661	unsigned SRsrcFormatHi = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
				1662	unsigned NewSRsrc = MRI.createVirtualRegister(&AMDGPU::SReg_128RegClass);
Tom Stellard	794c8c0	2014-12-02 17:05:41 +0000	[diff] [blame]	1663	uint64_t RsrcDataFormat = getDefaultRsrcDataFormat();
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1664
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1665	// Zero64 = 0
				1666	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B64),
				1667	Zero64)
				1668	.addImm(0);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1669
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1670	// SRsrcFormatLo = RSRC_DATA_FORMAT{31-0}
				1671	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32),
				1672	SRsrcFormatLo)
Tom Stellard	794c8c0	2014-12-02 17:05:41 +0000	[diff] [blame]	1673	.addImm(RsrcDataFormat & 0xFFFFFFFF);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1674
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1675	// SRsrcFormatHi = RSRC_DATA_FORMAT{63-32}
				1676	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32),
				1677	SRsrcFormatHi)
Tom Stellard	794c8c0	2014-12-02 17:05:41 +0000	[diff] [blame]	1678	.addImm(RsrcDataFormat >> 32);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1679
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1680	// NewSRsrc = {Zero64, SRsrcFormat}
				1681	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::REG_SEQUENCE),
				1682	NewSRsrc)
				1683	.addReg(Zero64)
				1684	.addImm(AMDGPU::sub0_sub1)
				1685	.addReg(SRsrcFormatLo)
				1686	.addImm(AMDGPU::sub2)
				1687	.addReg(SRsrcFormatHi)
				1688	.addImm(AMDGPU::sub3);
				1689
				1690	MachineOperand VAddr = getNamedOperand(MI, AMDGPU::OpName::vaddr);
				1691	unsigned NewVAddr = MRI.createVirtualRegister(&AMDGPU::VReg_64RegClass);
				1692	unsigned NewVAddrLo;
				1693	unsigned NewVAddrHi;
				1694	if (VAddr) {
				1695	// This is already an ADDR64 instruction so we need to add the pointer
				1696	// extracted from the resource descriptor to the current value of VAddr.
				1697	NewVAddrLo = MRI.createVirtualRegister(&AMDGPU::VReg_32RegClass);
				1698	NewVAddrHi = MRI.createVirtualRegister(&AMDGPU::VReg_32RegClass);
				1699
				1700	// NewVaddrLo = SRsrcPtrLo + VAddr:sub0
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1701	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::V_ADD_I32_e32),
				1702	NewVAddrLo)
				1703	.addReg(SRsrcPtrLo)
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1704	.addReg(VAddr->getReg(), 0, AMDGPU::sub0)
				1705	.addReg(AMDGPU::VCC, RegState::ImplicitDefine);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1706
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1707	// NewVaddrHi = SRsrcPtrHi + VAddr:sub1
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1708	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::V_ADDC_U32_e32),
				1709	NewVAddrHi)
				1710	.addReg(SRsrcPtrHi)
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1711	.addReg(VAddr->getReg(), 0, AMDGPU::sub1)
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1712	.addReg(AMDGPU::VCC, RegState::ImplicitDefine)
				1713	.addReg(AMDGPU::VCC, RegState::Implicit);
				1714
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1715	} else {
				1716	// This instructions is the _OFFSET variant, so we need to convert it to
				1717	// ADDR64.
				1718	MachineOperand VData = getNamedOperand(MI, AMDGPU::OpName::vdata);
				1719	MachineOperand Offset = getNamedOperand(MI, AMDGPU::OpName::offset);
				1720	MachineOperand SOffset = getNamedOperand(MI, AMDGPU::OpName::soffset);
				1721	assert(SOffset->isImm() && SOffset->getImm() == 0 && "Legalizing MUBUF "
				1722	"with non-zero soffset is not implemented");
NAKAMURA Takumi	5f79ee5	2014-08-11 23:03:38 +0000	[diff] [blame]	1723	(void)SOffset;
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1724
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1725	// Create the new instruction.
				1726	unsigned Addr64Opcode = AMDGPU::getAddr64Inst(MI->getOpcode());
				1727	MachineInstr *Addr64 =
				1728	BuildMI(MBB, MI, MI->getDebugLoc(), get(Addr64Opcode))
				1729	.addOperand(*VData)
				1730	.addOperand(*SRsrc)
				1731	.addReg(AMDGPU::NoRegister) // Dummy value for vaddr.
				1732	// This will be replaced later
				1733	// with the new value of vaddr.
				1734	.addOperand(*Offset);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1735
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1736	MI->removeFromParent();
				1737	MI = Addr64;
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1738
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1739	NewVAddrLo = SRsrcPtrLo;
				1740	NewVAddrHi = SRsrcPtrHi;
				1741	VAddr = getNamedOperand(*MI, AMDGPU::OpName::vaddr);
				1742	SRsrc = getNamedOperand(*MI, AMDGPU::OpName::srsrc);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1743	}
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1744
				1745	// NewVaddr = {NewVaddrHi, NewVaddrLo}
				1746	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::REG_SEQUENCE),
				1747	NewVAddr)
				1748	.addReg(NewVAddrLo)
				1749	.addImm(AMDGPU::sub0)
				1750	.addReg(NewVAddrHi)
				1751	.addImm(AMDGPU::sub1);
				1752
				1753
				1754	// Update the instruction to use NewVaddr
				1755	VAddr->setReg(NewVAddr);
				1756	// Update the instruction to use NewSRsrc
				1757	SRsrc->setReg(NewSRsrc);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1758	}
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1759	}
				1760
Tom Stellard	745f2ed	2014-08-21 20:41:00 +0000	[diff] [blame]	1761	void SIInstrInfo::splitSMRD(MachineInstr *MI,
				1762	const TargetRegisterClass *HalfRC,
				1763	unsigned HalfImmOp, unsigned HalfSGPROp,
				1764	MachineInstr &Lo, MachineInstr &Hi) const {
				1765
				1766	DebugLoc DL = MI->getDebugLoc();
				1767	MachineBasicBlock *MBB = MI->getParent();
				1768	MachineRegisterInfo &MRI = MBB->getParent()->getRegInfo();
				1769	unsigned RegLo = MRI.createVirtualRegister(HalfRC);
				1770	unsigned RegHi = MRI.createVirtualRegister(HalfRC);
				1771	unsigned HalfSize = HalfRC->getSize();
				1772	const MachineOperand *OffOp =
				1773	getNamedOperand(*MI, AMDGPU::OpName::offset);
				1774	const MachineOperand SBase = getNamedOperand(MI, AMDGPU::OpName::sbase);
				1775
Marek Olsak	58f61a8	2014-12-07 17:17:38 +0000	[diff] [blame]	1776	// The SMRD has an 8-bit offset in dwords on SI and a 20-bit offset in bytes
				1777	// on VI.
Tom Stellard	745f2ed	2014-08-21 20:41:00 +0000	[diff] [blame]	1778	if (OffOp) {
Marek Olsak	58f61a8	2014-12-07 17:17:38 +0000	[diff] [blame]	1779	bool isVI = RI.ST.getGeneration() >= AMDGPUSubtarget::VOLCANIC_ISLANDS;
				1780	unsigned OffScale = isVI ? 1 : 4;
Tom Stellard	745f2ed	2014-08-21 20:41:00 +0000	[diff] [blame]	1781	// Handle the _IMM variant
Marek Olsak	58f61a8	2014-12-07 17:17:38 +0000	[diff] [blame]	1782	unsigned LoOffset = OffOp->getImm() * OffScale;
				1783	unsigned HiOffset = LoOffset + HalfSize;
Tom Stellard	745f2ed	2014-08-21 20:41:00 +0000	[diff] [blame]	1784	Lo = BuildMI(*MBB, MI, DL, get(HalfImmOp), RegLo)
				1785	.addOperand(*SBase)
Marek Olsak	58f61a8	2014-12-07 17:17:38 +0000	[diff] [blame]	1786	.addImm(LoOffset / OffScale);
Tom Stellard	745f2ed	2014-08-21 20:41:00 +0000	[diff] [blame]	1787
Marek Olsak	58f61a8	2014-12-07 17:17:38 +0000	[diff] [blame]	1788	if (!isUInt<20>(HiOffset) \|\| (!isVI && !isUInt<8>(HiOffset / OffScale))) {
Tom Stellard	745f2ed	2014-08-21 20:41:00 +0000	[diff] [blame]	1789	unsigned OffsetSGPR =
				1790	MRI.createVirtualRegister(&AMDGPU::SReg_32RegClass);
				1791	BuildMI(*MBB, MI, DL, get(AMDGPU::S_MOV_B32), OffsetSGPR)
Marek Olsak	58f61a8	2014-12-07 17:17:38 +0000	[diff] [blame]	1792	.addImm(HiOffset); // The offset in register is in bytes.
Tom Stellard	745f2ed	2014-08-21 20:41:00 +0000	[diff] [blame]	1793	Hi = BuildMI(*MBB, MI, DL, get(HalfSGPROp), RegHi)
				1794	.addOperand(*SBase)
				1795	.addReg(OffsetSGPR);
				1796	} else {
				1797	Hi = BuildMI(*MBB, MI, DL, get(HalfImmOp), RegHi)
				1798	.addOperand(*SBase)
Marek Olsak	58f61a8	2014-12-07 17:17:38 +0000	[diff] [blame]	1799	.addImm(HiOffset / OffScale);
Tom Stellard	745f2ed	2014-08-21 20:41:00 +0000	[diff] [blame]	1800	}
				1801	} else {
				1802	// Handle the _SGPR variant
				1803	MachineOperand SOff = getNamedOperand(MI, AMDGPU::OpName::soff);
				1804	Lo = BuildMI(*MBB, MI, DL, get(HalfSGPROp), RegLo)
				1805	.addOperand(*SBase)
				1806	.addOperand(*SOff);
				1807	unsigned OffsetSGPR = MRI.createVirtualRegister(&AMDGPU::SReg_32RegClass);
				1808	BuildMI(*MBB, MI, DL, get(AMDGPU::S_ADD_I32), OffsetSGPR)
				1809	.addOperand(*SOff)
				1810	.addImm(HalfSize);
				1811	Hi = BuildMI(*MBB, MI, DL, get(HalfSGPROp))
				1812	.addOperand(*SBase)
				1813	.addReg(OffsetSGPR);
				1814	}
				1815
				1816	unsigned SubLo, SubHi;
				1817	switch (HalfSize) {
				1818	case 4:
				1819	SubLo = AMDGPU::sub0;
				1820	SubHi = AMDGPU::sub1;
				1821	break;
				1822	case 8:
				1823	SubLo = AMDGPU::sub0_sub1;
				1824	SubHi = AMDGPU::sub2_sub3;
				1825	break;
				1826	case 16:
				1827	SubLo = AMDGPU::sub0_sub1_sub2_sub3;
				1828	SubHi = AMDGPU::sub4_sub5_sub6_sub7;
				1829	break;
				1830	case 32:
				1831	SubLo = AMDGPU::sub0_sub1_sub2_sub3_sub4_sub5_sub6_sub7;
				1832	SubHi = AMDGPU::sub8_sub9_sub10_sub11_sub12_sub13_sub14_sub15;
				1833	break;
				1834	default:
				1835	llvm_unreachable("Unhandled HalfSize");
				1836	}
				1837
				1838	BuildMI(*MBB, MI, DL, get(AMDGPU::REG_SEQUENCE))
				1839	.addOperand(MI->getOperand(0))
				1840	.addReg(RegLo)
				1841	.addImm(SubLo)
				1842	.addReg(RegHi)
				1843	.addImm(SubHi);
				1844	}
				1845
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1846	void SIInstrInfo::moveSMRDToVALU(MachineInstr *MI, MachineRegisterInfo &MRI) const {
				1847	MachineBasicBlock *MBB = MI->getParent();
				1848	switch (MI->getOpcode()) {
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1849	case AMDGPU::S_LOAD_DWORD_IMM:
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1850	case AMDGPU::S_LOAD_DWORD_SGPR:
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1851	case AMDGPU::S_LOAD_DWORDX2_IMM:
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1852	case AMDGPU::S_LOAD_DWORDX2_SGPR:
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1853	case AMDGPU::S_LOAD_DWORDX4_IMM:
Tom Stellard	745f2ed	2014-08-21 20:41:00 +0000	[diff] [blame]	1854	case AMDGPU::S_LOAD_DWORDX4_SGPR: {
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1855	unsigned NewOpcode = getVALUOp(*MI);
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1856	unsigned RegOffset;
				1857	unsigned ImmOffset;
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1858
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1859	if (MI->getOperand(2).isReg()) {
				1860	RegOffset = MI->getOperand(2).getReg();
				1861	ImmOffset = 0;
				1862	} else {
				1863	assert(MI->getOperand(2).isImm());
Marek Olsak	58f61a8	2014-12-07 17:17:38 +0000	[diff] [blame]	1864	// SMRD instructions take a dword offsets on SI and byte offset on VI
				1865	// and MUBUF instructions always take a byte offset.
				1866	ImmOffset = MI->getOperand(2).getImm();
				1867	if (RI.ST.getGeneration() <= AMDGPUSubtarget::SEA_ISLANDS)
				1868	ImmOffset <<= 2;
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1869	RegOffset = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
Marek Olsak	58f61a8	2014-12-07 17:17:38 +0000	[diff] [blame]	1870
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1871	if (isUInt<12>(ImmOffset)) {
				1872	BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32),
				1873	RegOffset)
				1874	.addImm(0);
				1875	} else {
				1876	BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32),
				1877	RegOffset)
				1878	.addImm(ImmOffset);
				1879	ImmOffset = 0;
				1880	}
				1881	}
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1882
				1883	unsigned SRsrc = MRI.createVirtualRegister(&AMDGPU::SReg_128RegClass);
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1884	unsigned DWord0 = RegOffset;
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1885	unsigned DWord1 = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
				1886	unsigned DWord2 = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
				1887	unsigned DWord3 = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
Tom Stellard	794c8c0	2014-12-02 17:05:41 +0000	[diff] [blame]	1888	uint64_t RsrcDataFormat = getDefaultRsrcDataFormat();
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1889
				1890	BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32), DWord1)
				1891	.addImm(0);
				1892	BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32), DWord2)
Tom Stellard	794c8c0	2014-12-02 17:05:41 +0000	[diff] [blame]	1893	.addImm(RsrcDataFormat & 0xFFFFFFFF);
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1894	BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32), DWord3)
Tom Stellard	794c8c0	2014-12-02 17:05:41 +0000	[diff] [blame]	1895	.addImm(RsrcDataFormat >> 32);
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1896	BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::REG_SEQUENCE), SRsrc)
				1897	.addReg(DWord0)
				1898	.addImm(AMDGPU::sub0)
				1899	.addReg(DWord1)
				1900	.addImm(AMDGPU::sub1)
				1901	.addReg(DWord2)
				1902	.addImm(AMDGPU::sub2)
				1903	.addReg(DWord3)
				1904	.addImm(AMDGPU::sub3);
Tom Stellard	745f2ed	2014-08-21 20:41:00 +0000	[diff] [blame]	1905	MI->setDesc(get(NewOpcode));
				1906	if (MI->getOperand(2).isReg()) {
				1907	MI->getOperand(2).setReg(MI->getOperand(1).getReg());
				1908	} else {
				1909	MI->getOperand(2).ChangeToRegister(MI->getOperand(1).getReg(), false);
				1910	}
				1911	MI->getOperand(1).setReg(SRsrc);
				1912	MI->addOperand(*MBB->getParent(), MachineOperand::CreateImm(ImmOffset));
				1913
				1914	const TargetRegisterClass *NewDstRC =
				1915	RI.getRegClass(get(NewOpcode).OpInfo[0].RegClass);
				1916
				1917	unsigned DstReg = MI->getOperand(0).getReg();
				1918	unsigned NewDstReg = MRI.createVirtualRegister(NewDstRC);
				1919	MRI.replaceRegWith(DstReg, NewDstReg);
				1920	break;
				1921	}
				1922	case AMDGPU::S_LOAD_DWORDX8_IMM:
				1923	case AMDGPU::S_LOAD_DWORDX8_SGPR: {
				1924	MachineInstr Lo, Hi;
				1925	splitSMRD(MI, &AMDGPU::SReg_128RegClass, AMDGPU::S_LOAD_DWORDX4_IMM,
				1926	AMDGPU::S_LOAD_DWORDX4_SGPR, Lo, Hi);
				1927	MI->eraseFromParent();
				1928	moveSMRDToVALU(Lo, MRI);
				1929	moveSMRDToVALU(Hi, MRI);
				1930	break;
				1931	}
				1932
				1933	case AMDGPU::S_LOAD_DWORDX16_IMM:
				1934	case AMDGPU::S_LOAD_DWORDX16_SGPR: {
				1935	MachineInstr Lo, Hi;
				1936	splitSMRD(MI, &AMDGPU::SReg_256RegClass, AMDGPU::S_LOAD_DWORDX8_IMM,
				1937	AMDGPU::S_LOAD_DWORDX8_SGPR, Lo, Hi);
				1938	MI->eraseFromParent();
				1939	moveSMRDToVALU(Lo, MRI);
				1940	moveSMRDToVALU(Hi, MRI);
				1941	break;
				1942	}
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1943	}
				1944	}
				1945
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1946	void SIInstrInfo::moveToVALU(MachineInstr &TopInst) const {
				1947	SmallVector<MachineInstr *, 128> Worklist;
				1948	Worklist.push_back(&TopInst);
				1949
				1950	while (!Worklist.empty()) {
				1951	MachineInstr *Inst = Worklist.pop_back_val();
Tom Stellard	e038720	2014-03-21 15:51:54 +0000	[diff] [blame]	1952	MachineBasicBlock *MBB = Inst->getParent();
				1953	MachineRegisterInfo &MRI = MBB->getParent()->getRegInfo();
				1954
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	1955	unsigned Opcode = Inst->getOpcode();
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1956	unsigned NewOpcode = getVALUOp(*Inst);
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	1957
Tom Stellard	e038720	2014-03-21 15:51:54 +0000	[diff] [blame]	1958	// Handle some special cases
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	1959	switch (Opcode) {
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1960	default:
				1961	if (isSMRD(Inst->getOpcode())) {
				1962	moveSMRDToVALU(Inst, MRI);
				1963	}
				1964	break;
Matt Arsenault	bd99580	2014-03-24 18:26:52 +0000	[diff] [blame]	1965	case AMDGPU::S_MOV_B64: {
				1966	DebugLoc DL = Inst->getDebugLoc();
Tom Stellard	e038720	2014-03-21 15:51:54 +0000	[diff] [blame]	1967
Matt Arsenault	bd99580	2014-03-24 18:26:52 +0000	[diff] [blame]	1968	// If the source operand is a register we can replace this with a
				1969	// copy.
				1970	if (Inst->getOperand(1).isReg()) {
				1971	MachineInstr Copy = BuildMI(MBB, Inst, DL, get(TargetOpcode::COPY))
				1972	.addOperand(Inst->getOperand(0))
				1973	.addOperand(Inst->getOperand(1));
				1974	Worklist.push_back(Copy);
				1975	} else {
				1976	// Otherwise, we need to split this into two movs, because there is
				1977	// no 64-bit VALU move instruction.
				1978	unsigned Reg = Inst->getOperand(0).getReg();
				1979	unsigned Dst = split64BitImm(Worklist,
				1980	Inst,
				1981	MRI,
				1982	MRI.getRegClass(Reg),
				1983	Inst->getOperand(1));
				1984	MRI.replaceRegWith(Reg, Dst);
Tom Stellard	e038720	2014-03-21 15:51:54 +0000	[diff] [blame]	1985	}
Matt Arsenault	bd99580	2014-03-24 18:26:52 +0000	[diff] [blame]	1986	Inst->eraseFromParent();
				1987	continue;
				1988	}
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1989	case AMDGPU::S_AND_B64:
Matt Arsenault	689f325	2014-06-09 16:36:31 +0000	[diff] [blame]	1990	splitScalar64BitBinaryOp(Worklist, Inst, AMDGPU::S_AND_B32);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1991	Inst->eraseFromParent();
				1992	continue;
				1993
				1994	case AMDGPU::S_OR_B64:
Matt Arsenault	689f325	2014-06-09 16:36:31 +0000	[diff] [blame]	1995	splitScalar64BitBinaryOp(Worklist, Inst, AMDGPU::S_OR_B32);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1996	Inst->eraseFromParent();
				1997	continue;
				1998
				1999	case AMDGPU::S_XOR_B64:
Matt Arsenault	689f325	2014-06-09 16:36:31 +0000	[diff] [blame]	2000	splitScalar64BitBinaryOp(Worklist, Inst, AMDGPU::S_XOR_B32);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	2001	Inst->eraseFromParent();
				2002	continue;
				2003
				2004	case AMDGPU::S_NOT_B64:
Matt Arsenault	689f325	2014-06-09 16:36:31 +0000	[diff] [blame]	2005	splitScalar64BitUnaryOp(Worklist, Inst, AMDGPU::S_NOT_B32);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	2006	Inst->eraseFromParent();
				2007	continue;
				2008
Matt Arsenault	8333e43	2014-06-10 19:18:24 +0000	[diff] [blame]	2009	case AMDGPU::S_BCNT1_I32_B64:
				2010	splitScalar64BitBCNT(Worklist, Inst);
				2011	Inst->eraseFromParent();
				2012	continue;
				2013
Matt Arsenault	9481221	2014-11-14 18:18:16 +0000	[diff] [blame]	2014	case AMDGPU::S_BFE_I64: {
				2015	splitScalar64BitBFE(Worklist, Inst);
				2016	Inst->eraseFromParent();
				2017	continue;
				2018	}
				2019
Marek Olsak	be04780	2014-12-07 12:19:03 +0000	[diff] [blame]	2020	case AMDGPU::S_LSHL_B32:
				2021	if (ST.getGeneration() >= AMDGPUSubtarget::VOLCANIC_ISLANDS) {
				2022	NewOpcode = AMDGPU::V_LSHLREV_B32_e64;
				2023	swapOperands(Inst);
				2024	}
				2025	break;
				2026	case AMDGPU::S_ASHR_I32:
				2027	if (ST.getGeneration() >= AMDGPUSubtarget::VOLCANIC_ISLANDS) {
				2028	NewOpcode = AMDGPU::V_ASHRREV_I32_e64;
				2029	swapOperands(Inst);
				2030	}
				2031	break;
				2032	case AMDGPU::S_LSHR_B32:
				2033	if (ST.getGeneration() >= AMDGPUSubtarget::VOLCANIC_ISLANDS) {
				2034	NewOpcode = AMDGPU::V_LSHRREV_B32_e64;
				2035	swapOperands(Inst);
				2036	}
				2037	break;
				2038
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	2039	case AMDGPU::S_BFE_U64:
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	2040	case AMDGPU::S_BFM_B64:
				2041	llvm_unreachable("Moving this op to VALU not implemented");
Tom Stellard	e038720	2014-03-21 15:51:54 +0000	[diff] [blame]	2042	}
				2043
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	2044	if (NewOpcode == AMDGPU::INSTRUCTION_LIST_END) {
				2045	// We cannot move this instruction to the VALU, so we should try to
				2046	// legalize its operands instead.
				2047	legalizeOperands(Inst);
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	2048	continue;
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	2049	}
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	2050
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	2051	// Use the new VALU Opcode.
				2052	const MCInstrDesc &NewDesc = get(NewOpcode);
				2053	Inst->setDesc(NewDesc);
				2054
Matt Arsenault	f0b1e3a	2013-11-18 20:09:21 +0000	[diff] [blame]	2055	// Remove any references to SCC. Vector instructions can't read from it, and
				2056	// We're just about to add the implicit use / defs of VCC, and we don't want
				2057	// both.
				2058	for (unsigned i = Inst->getNumOperands() - 1; i > 0; --i) {
				2059	MachineOperand &Op = Inst->getOperand(i);
				2060	if (Op.isReg() && Op.getReg() == AMDGPU::SCC)
				2061	Inst->RemoveOperand(i);
				2062	}
				2063
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	2064	if (Opcode == AMDGPU::S_SEXT_I32_I8 \|\| Opcode == AMDGPU::S_SEXT_I32_I16) {
				2065	// We are converting these to a BFE, so we need to add the missing
				2066	// operands for the size and offset.
				2067	unsigned Size = (Opcode == AMDGPU::S_SEXT_I32_I8) ? 8 : 16;
				2068	Inst->addOperand(MachineOperand::CreateImm(0));
				2069	Inst->addOperand(MachineOperand::CreateImm(Size));
				2070
Matt Arsenault	b5b5110	2014-06-10 19:18:21 +0000	[diff] [blame]	2071	} else if (Opcode == AMDGPU::S_BCNT1_I32_B32) {
				2072	// The VALU version adds the second operand to the result, so insert an
				2073	// extra 0 operand.
				2074	Inst->addOperand(MachineOperand::CreateImm(0));
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	2075	}
				2076
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	2077	addDescImplicitUseDef(NewDesc, Inst);
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	2078
Matt Arsenault	78b8670	2014-04-18 05:19:26 +0000	[diff] [blame]	2079	if (Opcode == AMDGPU::S_BFE_I32 \|\| Opcode == AMDGPU::S_BFE_U32) {
				2080	const MachineOperand &OffsetWidthOp = Inst->getOperand(2);
				2081	// If we need to move this to VGPRs, we need to unpack the second operand
				2082	// back into the 2 separate ones for bit offset and width.
				2083	assert(OffsetWidthOp.isImm() &&
				2084	"Scalar BFE is only implemented for constant width and offset");
				2085	uint32_t Imm = OffsetWidthOp.getImm();
				2086
				2087	uint32_t Offset = Imm & 0x3f; // Extract bits [5:0].
				2088	uint32_t BitWidth = (Imm & 0x7f0000) >> 16; // Extract bits [22:16].
Matt Arsenault	78b8670	2014-04-18 05:19:26 +0000	[diff] [blame]	2089	Inst->RemoveOperand(2); // Remove old immediate.
				2090	Inst->addOperand(MachineOperand::CreateImm(Offset));
Vincent Lejeune	94af31f	2014-05-10 19:18:33 +0000	[diff] [blame]	2091	Inst->addOperand(MachineOperand::CreateImm(BitWidth));
Matt Arsenault	78b8670	2014-04-18 05:19:26 +0000	[diff] [blame]	2092	}
				2093
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	2094	// Update the destination register class.
Tom Stellard	e1a2445	2014-04-17 21:00:01 +0000	[diff] [blame]	2095
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	2096	const TargetRegisterClass NewDstRC = getOpRegClass(Inst, 0);
				2097
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	2098	switch (Opcode) {
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	2099	// For target instructions, getOpRegClass just returns the virtual
				2100	// register class associated with the operand, so we need to find an
				2101	// equivalent VGPR register class in order to move the instruction to the
				2102	// VALU.
				2103	case AMDGPU::COPY:
				2104	case AMDGPU::PHI:
				2105	case AMDGPU::REG_SEQUENCE:
Tom Stellard	204e61b	2014-04-07 19:45:45 +0000	[diff] [blame]	2106	case AMDGPU::INSERT_SUBREG:
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	2107	if (RI.hasVGPRs(NewDstRC))
				2108	continue;
				2109	NewDstRC = RI.getEquivalentVGPRClass(NewDstRC);
				2110	if (!NewDstRC)
				2111	continue;
				2112	break;
				2113	default:
				2114	break;
				2115	}
				2116
				2117	unsigned DstReg = Inst->getOperand(0).getReg();
				2118	unsigned NewDstReg = MRI.createVirtualRegister(NewDstRC);
				2119	MRI.replaceRegWith(DstReg, NewDstReg);
				2120
Tom Stellard	e1a2445	2014-04-17 21:00:01 +0000	[diff] [blame]	2121	// Legalize the operands
				2122	legalizeOperands(Inst);
				2123
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	2124	for (MachineRegisterInfo::use_iterator I = MRI.use_begin(NewDstReg),
				2125	E = MRI.use_end(); I != E; ++I) {
Owen Anderson	16c6bf4	2014-03-13 23:12:04 +0000	[diff] [blame]	2126	MachineInstr &UseMI = *I->getParent();
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	2127	if (!canReadVGPR(UseMI, I.getOperandNo())) {
				2128	Worklist.push_back(&UseMI);
				2129	}
				2130	}
				2131	}
				2132	}
				2133
Tom Stellard	f3b2a1e	2013-02-06 17:32:29 +0000	[diff] [blame]	2134	//===----------------------------------------------------------------------===//
				2135	// Indirect addressing callbacks
				2136	//===----------------------------------------------------------------------===//
				2137
				2138	unsigned SIInstrInfo::calculateIndirectAddress(unsigned RegIndex,
				2139	unsigned Channel) const {
				2140	assert(Channel == 0);
				2141	return RegIndex;
				2142	}
				2143
Tom Stellard	26a3b67	2013-10-22 18:19:10 +0000	[diff] [blame]	2144	const TargetRegisterClass *SIInstrInfo::getIndirectAddrRegClass() const {
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	2145	return &AMDGPU::VReg_32RegClass;
Tom Stellard	f3b2a1e	2013-02-06 17:32:29 +0000	[diff] [blame]	2146	}
				2147
Matt Arsenault	689f325	2014-06-09 16:36:31 +0000	[diff] [blame]	2148	void SIInstrInfo::splitScalar64BitUnaryOp(
				2149	SmallVectorImpl<MachineInstr *> &Worklist,
				2150	MachineInstr *Inst,
				2151	unsigned Opcode) const {
				2152	MachineBasicBlock &MBB = *Inst->getParent();
				2153	MachineRegisterInfo &MRI = MBB.getParent()->getRegInfo();
				2154
				2155	MachineOperand &Dest = Inst->getOperand(0);
				2156	MachineOperand &Src0 = Inst->getOperand(1);
				2157	DebugLoc DL = Inst->getDebugLoc();
				2158
				2159	MachineBasicBlock::iterator MII = Inst;
				2160
				2161	const MCInstrDesc &InstDesc = get(Opcode);
				2162	const TargetRegisterClass *Src0RC = Src0.isReg() ?
				2163	MRI.getRegClass(Src0.getReg()) :
				2164	&AMDGPU::SGPR_32RegClass;
				2165
				2166	const TargetRegisterClass *Src0SubRC = RI.getSubRegClass(Src0RC, AMDGPU::sub0);
				2167
				2168	MachineOperand SrcReg0Sub0 = buildExtractSubRegOrImm(MII, MRI, Src0, Src0RC,
				2169	AMDGPU::sub0, Src0SubRC);
				2170
				2171	const TargetRegisterClass *DestRC = MRI.getRegClass(Dest.getReg());
				2172	const TargetRegisterClass *DestSubRC = RI.getSubRegClass(DestRC, AMDGPU::sub0);
				2173
				2174	unsigned DestSub0 = MRI.createVirtualRegister(DestRC);
				2175	MachineInstr *LoHalf = BuildMI(MBB, MII, DL, InstDesc, DestSub0)
				2176	.addOperand(SrcReg0Sub0);
				2177
				2178	MachineOperand SrcReg0Sub1 = buildExtractSubRegOrImm(MII, MRI, Src0, Src0RC,
				2179	AMDGPU::sub1, Src0SubRC);
				2180
				2181	unsigned DestSub1 = MRI.createVirtualRegister(DestSubRC);
				2182	MachineInstr *HiHalf = BuildMI(MBB, MII, DL, InstDesc, DestSub1)
				2183	.addOperand(SrcReg0Sub1);
				2184
				2185	unsigned FullDestReg = MRI.createVirtualRegister(DestRC);
				2186	BuildMI(MBB, MII, DL, get(TargetOpcode::REG_SEQUENCE), FullDestReg)
				2187	.addReg(DestSub0)
				2188	.addImm(AMDGPU::sub0)
				2189	.addReg(DestSub1)
				2190	.addImm(AMDGPU::sub1);
				2191
				2192	MRI.replaceRegWith(Dest.getReg(), FullDestReg);
				2193
				2194	// Try to legalize the operands in case we need to swap the order to keep it
				2195	// valid.
				2196	Worklist.push_back(LoHalf);
				2197	Worklist.push_back(HiHalf);
				2198	}
				2199
				2200	void SIInstrInfo::splitScalar64BitBinaryOp(
				2201	SmallVectorImpl<MachineInstr *> &Worklist,
				2202	MachineInstr *Inst,
				2203	unsigned Opcode) const {
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	2204	MachineBasicBlock &MBB = *Inst->getParent();
				2205	MachineRegisterInfo &MRI = MBB.getParent()->getRegInfo();
				2206
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	2207	MachineOperand &Dest = Inst->getOperand(0);
				2208	MachineOperand &Src0 = Inst->getOperand(1);
				2209	MachineOperand &Src1 = Inst->getOperand(2);
				2210	DebugLoc DL = Inst->getDebugLoc();
				2211
				2212	MachineBasicBlock::iterator MII = Inst;
				2213
				2214	const MCInstrDesc &InstDesc = get(Opcode);
Matt Arsenault	684dc80	2014-03-24 20:08:13 +0000	[diff] [blame]	2215	const TargetRegisterClass *Src0RC = Src0.isReg() ?
				2216	MRI.getRegClass(Src0.getReg()) :
				2217	&AMDGPU::SGPR_32RegClass;
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	2218
Matt Arsenault	684dc80	2014-03-24 20:08:13 +0000	[diff] [blame]	2219	const TargetRegisterClass *Src0SubRC = RI.getSubRegClass(Src0RC, AMDGPU::sub0);
				2220	const TargetRegisterClass *Src1RC = Src1.isReg() ?
				2221	MRI.getRegClass(Src1.getReg()) :
				2222	&AMDGPU::SGPR_32RegClass;
				2223
				2224	const TargetRegisterClass *Src1SubRC = RI.getSubRegClass(Src1RC, AMDGPU::sub0);
				2225
				2226	MachineOperand SrcReg0Sub0 = buildExtractSubRegOrImm(MII, MRI, Src0, Src0RC,
				2227	AMDGPU::sub0, Src0SubRC);
				2228	MachineOperand SrcReg1Sub0 = buildExtractSubRegOrImm(MII, MRI, Src1, Src1RC,
				2229	AMDGPU::sub0, Src1SubRC);
				2230
				2231	const TargetRegisterClass *DestRC = MRI.getRegClass(Dest.getReg());
				2232	const TargetRegisterClass *DestSubRC = RI.getSubRegClass(DestRC, AMDGPU::sub0);
				2233
				2234	unsigned DestSub0 = MRI.createVirtualRegister(DestRC);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	2235	MachineInstr *LoHalf = BuildMI(MBB, MII, DL, InstDesc, DestSub0)
Matt Arsenault	248b7b6	2014-03-24 20:08:09 +0000	[diff] [blame]	2236	.addOperand(SrcReg0Sub0)
				2237	.addOperand(SrcReg1Sub0);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	2238
Matt Arsenault	684dc80	2014-03-24 20:08:13 +0000	[diff] [blame]	2239	MachineOperand SrcReg0Sub1 = buildExtractSubRegOrImm(MII, MRI, Src0, Src0RC,
				2240	AMDGPU::sub1, Src0SubRC);
				2241	MachineOperand SrcReg1Sub1 = buildExtractSubRegOrImm(MII, MRI, Src1, Src1RC,
				2242	AMDGPU::sub1, Src1SubRC);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	2243
Matt Arsenault	684dc80	2014-03-24 20:08:13 +0000	[diff] [blame]	2244	unsigned DestSub1 = MRI.createVirtualRegister(DestSubRC);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	2245	MachineInstr *HiHalf = BuildMI(MBB, MII, DL, InstDesc, DestSub1)
Matt Arsenault	248b7b6	2014-03-24 20:08:09 +0000	[diff] [blame]	2246	.addOperand(SrcReg0Sub1)
				2247	.addOperand(SrcReg1Sub1);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	2248
Matt Arsenault	684dc80	2014-03-24 20:08:13 +0000	[diff] [blame]	2249	unsigned FullDestReg = MRI.createVirtualRegister(DestRC);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	2250	BuildMI(MBB, MII, DL, get(TargetOpcode::REG_SEQUENCE), FullDestReg)
				2251	.addReg(DestSub0)
				2252	.addImm(AMDGPU::sub0)
				2253	.addReg(DestSub1)
				2254	.addImm(AMDGPU::sub1);
				2255
				2256	MRI.replaceRegWith(Dest.getReg(), FullDestReg);
				2257
				2258	// Try to legalize the operands in case we need to swap the order to keep it
				2259	// valid.
				2260	Worklist.push_back(LoHalf);
				2261	Worklist.push_back(HiHalf);
				2262	}
				2263
Matt Arsenault	8333e43	2014-06-10 19:18:24 +0000	[diff] [blame]	2264	void SIInstrInfo::splitScalar64BitBCNT(SmallVectorImpl<MachineInstr *> &Worklist,
				2265	MachineInstr *Inst) const {
				2266	MachineBasicBlock &MBB = *Inst->getParent();
				2267	MachineRegisterInfo &MRI = MBB.getParent()->getRegInfo();
				2268
				2269	MachineBasicBlock::iterator MII = Inst;
				2270	DebugLoc DL = Inst->getDebugLoc();
				2271
				2272	MachineOperand &Dest = Inst->getOperand(0);
				2273	MachineOperand &Src = Inst->getOperand(1);
				2274
				2275	const MCInstrDesc &InstDesc = get(AMDGPU::V_BCNT_U32_B32_e32);
				2276	const TargetRegisterClass *SrcRC = Src.isReg() ?
				2277	MRI.getRegClass(Src.getReg()) :
				2278	&AMDGPU::SGPR_32RegClass;
				2279
				2280	unsigned MidReg = MRI.createVirtualRegister(&AMDGPU::VGPR_32RegClass);
				2281	unsigned ResultReg = MRI.createVirtualRegister(&AMDGPU::VGPR_32RegClass);
				2282
				2283	const TargetRegisterClass *SrcSubRC = RI.getSubRegClass(SrcRC, AMDGPU::sub0);
				2284
				2285	MachineOperand SrcRegSub0 = buildExtractSubRegOrImm(MII, MRI, Src, SrcRC,
				2286	AMDGPU::sub0, SrcSubRC);
				2287	MachineOperand SrcRegSub1 = buildExtractSubRegOrImm(MII, MRI, Src, SrcRC,
				2288	AMDGPU::sub1, SrcSubRC);
				2289
				2290	MachineInstr *First = BuildMI(MBB, MII, DL, InstDesc, MidReg)
				2291	.addOperand(SrcRegSub0)
				2292	.addImm(0);
				2293
				2294	MachineInstr *Second = BuildMI(MBB, MII, DL, InstDesc, ResultReg)
				2295	.addOperand(SrcRegSub1)
				2296	.addReg(MidReg);
				2297
				2298	MRI.replaceRegWith(Dest.getReg(), ResultReg);
				2299
				2300	Worklist.push_back(First);
				2301	Worklist.push_back(Second);
				2302	}
				2303
Matt Arsenault	9481221	2014-11-14 18:18:16 +0000	[diff] [blame]	2304	void SIInstrInfo::splitScalar64BitBFE(SmallVectorImpl<MachineInstr *> &Worklist,
				2305	MachineInstr *Inst) const {
				2306	MachineBasicBlock &MBB = *Inst->getParent();
				2307	MachineRegisterInfo &MRI = MBB.getParent()->getRegInfo();
				2308	MachineBasicBlock::iterator MII = Inst;
				2309	DebugLoc DL = Inst->getDebugLoc();
				2310
				2311	MachineOperand &Dest = Inst->getOperand(0);
				2312	uint32_t Imm = Inst->getOperand(2).getImm();
				2313	uint32_t Offset = Imm & 0x3f; // Extract bits [5:0].
				2314	uint32_t BitWidth = (Imm & 0x7f0000) >> 16; // Extract bits [22:16].
				2315
Matt Arsenault	6ad3426	2014-11-14 18:40:49 +0000	[diff] [blame]	2316	(void) Offset;
				2317
Matt Arsenault	9481221	2014-11-14 18:18:16 +0000	[diff] [blame]	2318	// Only sext_inreg cases handled.
				2319	assert(Inst->getOpcode() == AMDGPU::S_BFE_I64 &&
				2320	BitWidth <= 32 &&
				2321	Offset == 0 &&
				2322	"Not implemented");
				2323
				2324	if (BitWidth < 32) {
				2325	unsigned MidRegLo = MRI.createVirtualRegister(&AMDGPU::VGPR_32RegClass);
				2326	unsigned MidRegHi = MRI.createVirtualRegister(&AMDGPU::VGPR_32RegClass);
				2327	unsigned ResultReg = MRI.createVirtualRegister(&AMDGPU::VReg_64RegClass);
				2328
				2329	BuildMI(MBB, MII, DL, get(AMDGPU::V_BFE_I32), MidRegLo)
				2330	.addReg(Inst->getOperand(1).getReg(), 0, AMDGPU::sub0)
				2331	.addImm(0)
				2332	.addImm(BitWidth);
				2333
				2334	BuildMI(MBB, MII, DL, get(AMDGPU::V_ASHRREV_I32_e32), MidRegHi)
				2335	.addImm(31)
				2336	.addReg(MidRegLo);
				2337
				2338	BuildMI(MBB, MII, DL, get(TargetOpcode::REG_SEQUENCE), ResultReg)
				2339	.addReg(MidRegLo)
				2340	.addImm(AMDGPU::sub0)
				2341	.addReg(MidRegHi)
				2342	.addImm(AMDGPU::sub1);
				2343
				2344	MRI.replaceRegWith(Dest.getReg(), ResultReg);
				2345	return;
				2346	}
				2347
				2348	MachineOperand &Src = Inst->getOperand(1);
				2349	unsigned TmpReg = MRI.createVirtualRegister(&AMDGPU::VGPR_32RegClass);
				2350	unsigned ResultReg = MRI.createVirtualRegister(&AMDGPU::VReg_64RegClass);
				2351
				2352	BuildMI(MBB, MII, DL, get(AMDGPU::V_ASHRREV_I32_e64), TmpReg)
				2353	.addImm(31)
				2354	.addReg(Src.getReg(), 0, AMDGPU::sub0);
				2355
				2356	BuildMI(MBB, MII, DL, get(TargetOpcode::REG_SEQUENCE), ResultReg)
				2357	.addReg(Src.getReg(), 0, AMDGPU::sub0)
				2358	.addImm(AMDGPU::sub0)
				2359	.addReg(TmpReg)
				2360	.addImm(AMDGPU::sub1);
				2361
				2362	MRI.replaceRegWith(Dest.getReg(), ResultReg);
				2363	}
				2364
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	2365	void SIInstrInfo::addDescImplicitUseDef(const MCInstrDesc &NewDesc,
				2366	MachineInstr *Inst) const {
				2367	// Add the implict and explicit register definitions.
				2368	if (NewDesc.ImplicitUses) {
				2369	for (unsigned i = 0; NewDesc.ImplicitUses[i]; ++i) {
				2370	unsigned Reg = NewDesc.ImplicitUses[i];
				2371	Inst->addOperand(MachineOperand::CreateReg(Reg, false, true));
				2372	}
				2373	}
				2374
				2375	if (NewDesc.ImplicitDefs) {
				2376	for (unsigned i = 0; NewDesc.ImplicitDefs[i]; ++i) {
				2377	unsigned Reg = NewDesc.ImplicitDefs[i];
				2378	Inst->addOperand(MachineOperand::CreateReg(Reg, true, true));
				2379	}
				2380	}
				2381	}
				2382
Matt Arsenault	ee522bf	2014-09-26 17:55:06 +0000	[diff] [blame]	2383	unsigned SIInstrInfo::findUsedSGPR(const MachineInstr *MI,
				2384	int OpIndices[3]) const {
				2385	const MCInstrDesc &Desc = get(MI->getOpcode());
				2386
				2387	// Find the one SGPR operand we are allowed to use.
				2388	unsigned SGPRReg = AMDGPU::NoRegister;
				2389
				2390	// First we need to consider the instruction's operand requirements before
				2391	// legalizing. Some operands are required to be SGPRs, such as implicit uses
				2392	// of VCC, but we are still bound by the constant bus requirement to only use
				2393	// one.
				2394	//
				2395	// If the operand's class is an SGPR, we can never move it.
				2396
				2397	for (const MachineOperand &MO : MI->implicit_operands()) {
				2398	// We only care about reads.
				2399	if (MO.isDef())
				2400	continue;
				2401
				2402	if (MO.getReg() == AMDGPU::VCC)
				2403	return AMDGPU::VCC;
				2404
				2405	if (MO.getReg() == AMDGPU::FLAT_SCR)
				2406	return AMDGPU::FLAT_SCR;
				2407	}
				2408
				2409	unsigned UsedSGPRs[3] = { AMDGPU::NoRegister };
				2410	const MachineRegisterInfo &MRI = MI->getParent()->getParent()->getRegInfo();
				2411
				2412	for (unsigned i = 0; i < 3; ++i) {
				2413	int Idx = OpIndices[i];
				2414	if (Idx == -1)
				2415	break;
				2416
				2417	const MachineOperand &MO = MI->getOperand(Idx);
				2418	if (RI.isSGPRClassID(Desc.OpInfo[Idx].RegClass))
				2419	SGPRReg = MO.getReg();
				2420
				2421	if (MO.isReg() && RI.isSGPRClass(MRI.getRegClass(MO.getReg())))
				2422	UsedSGPRs[i] = MO.getReg();
				2423	}
				2424
				2425	if (SGPRReg != AMDGPU::NoRegister)
				2426	return SGPRReg;
				2427
				2428	// We don't have a required SGPR operand, so we have a bit more freedom in
				2429	// selecting operands to move.
				2430
				2431	// Try to select the most used SGPR. If an SGPR is equal to one of the
				2432	// others, we choose that.
				2433	//
				2434	// e.g.
				2435	// V_FMA_F32 v0, s0, s0, s0 -> No moves
				2436	// V_FMA_F32 v0, s0, s1, s0 -> Move s1
				2437
				2438	if (UsedSGPRs[0] != AMDGPU::NoRegister) {
				2439	if (UsedSGPRs[0] == UsedSGPRs[1] \|\| UsedSGPRs[0] == UsedSGPRs[2])
				2440	SGPRReg = UsedSGPRs[0];
				2441	}
				2442
				2443	if (SGPRReg == AMDGPU::NoRegister && UsedSGPRs[1] != AMDGPU::NoRegister) {
				2444	if (UsedSGPRs[1] == UsedSGPRs[2])
				2445	SGPRReg = UsedSGPRs[1];
				2446	}
				2447
				2448	return SGPRReg;
				2449	}
				2450
Tom Stellard	f3b2a1e	2013-02-06 17:32:29 +0000	[diff] [blame]	2451	MachineInstrBuilder SIInstrInfo::buildIndirectWrite(
				2452	MachineBasicBlock *MBB,
				2453	MachineBasicBlock::iterator I,
				2454	unsigned ValueReg,
				2455	unsigned Address, unsigned OffsetReg) const {
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	2456	const DebugLoc &DL = MBB->findDebugLoc(I);
				2457	unsigned IndirectBaseReg = AMDGPU::VReg_32RegClass.getRegister(
				2458	getIndirectIndexBegin(*MBB->getParent()));
				2459
				2460	return BuildMI(*MBB, I, DL, get(AMDGPU::SI_INDIRECT_DST_V1))
				2461	.addReg(IndirectBaseReg, RegState::Define)
				2462	.addOperand(I->getOperand(0))
				2463	.addReg(IndirectBaseReg)
				2464	.addReg(OffsetReg)
				2465	.addImm(0)
				2466	.addReg(ValueReg);
Tom Stellard	f3b2a1e	2013-02-06 17:32:29 +0000	[diff] [blame]	2467	}
				2468
				2469	MachineInstrBuilder SIInstrInfo::buildIndirectRead(
				2470	MachineBasicBlock *MBB,
				2471	MachineBasicBlock::iterator I,
				2472	unsigned ValueReg,
				2473	unsigned Address, unsigned OffsetReg) const {
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	2474	const DebugLoc &DL = MBB->findDebugLoc(I);
				2475	unsigned IndirectBaseReg = AMDGPU::VReg_32RegClass.getRegister(
				2476	getIndirectIndexBegin(*MBB->getParent()));
				2477
				2478	return BuildMI(*MBB, I, DL, get(AMDGPU::SI_INDIRECT_SRC))
				2479	.addOperand(I->getOperand(0))
				2480	.addOperand(I->getOperand(1))
				2481	.addReg(IndirectBaseReg)
				2482	.addReg(OffsetReg)
				2483	.addImm(0);
				2484
				2485	}
				2486
				2487	void SIInstrInfo::reserveIndirectRegisters(BitVector &Reserved,
				2488	const MachineFunction &MF) const {
				2489	int End = getIndirectIndexEnd(MF);
				2490	int Begin = getIndirectIndexBegin(MF);
				2491
				2492	if (End == -1)
				2493	return;
				2494
				2495
				2496	for (int Index = Begin; Index <= End; ++Index)
				2497	Reserved.set(AMDGPU::VReg_32RegClass.getRegister(Index));
				2498
Tom Stellard	415ef6d	2013-11-13 23:58:51 +0000	[diff] [blame]	2499	for (int Index = std::max(0, Begin - 1); Index <= End; ++Index)
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	2500	Reserved.set(AMDGPU::VReg_64RegClass.getRegister(Index));
				2501
Tom Stellard	415ef6d	2013-11-13 23:58:51 +0000	[diff] [blame]	2502	for (int Index = std::max(0, Begin - 2); Index <= End; ++Index)
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	2503	Reserved.set(AMDGPU::VReg_96RegClass.getRegister(Index));
				2504
Tom Stellard	415ef6d	2013-11-13 23:58:51 +0000	[diff] [blame]	2505	for (int Index = std::max(0, Begin - 3); Index <= End; ++Index)
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	2506	Reserved.set(AMDGPU::VReg_128RegClass.getRegister(Index));
				2507
Tom Stellard	415ef6d	2013-11-13 23:58:51 +0000	[diff] [blame]	2508	for (int Index = std::max(0, Begin - 7); Index <= End; ++Index)
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	2509	Reserved.set(AMDGPU::VReg_256RegClass.getRegister(Index));
				2510
Tom Stellard	415ef6d	2013-11-13 23:58:51 +0000	[diff] [blame]	2511	for (int Index = std::max(0, Begin - 15); Index <= End; ++Index)
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	2512	Reserved.set(AMDGPU::VReg_512RegClass.getRegister(Index));
Tom Stellard	f3b2a1e	2013-02-06 17:32:29 +0000	[diff] [blame]	2513	}
Tom Stellard	1aaad69	2014-07-21 16:55:33 +0000	[diff] [blame]	2514
Tom Stellard	6407e1e	2014-08-01 00:32:33 +0000	[diff] [blame]	2515	MachineOperand *SIInstrInfo::getNamedOperand(MachineInstr &MI,
Matt Arsenault	ace5b76	2014-10-17 18:00:43 +0000	[diff] [blame]	2516	unsigned OperandName) const {
Tom Stellard	1aaad69	2014-07-21 16:55:33 +0000	[diff] [blame]	2517	int Idx = AMDGPU::getNamedOperandIdx(MI.getOpcode(), OperandName);
				2518	if (Idx == -1)
				2519	return nullptr;
				2520
				2521	return &MI.getOperand(Idx);
				2522	}
Tom Stellard	794c8c0	2014-12-02 17:05:41 +0000	[diff] [blame]	2523
				2524	uint64_t SIInstrInfo::getDefaultRsrcDataFormat() const {
				2525	uint64_t RsrcDataFormat = AMDGPU::RSRC_DATA_FORMAT;
				2526	if (ST.isAmdHsaOS())
				2527	RsrcDataFormat \|= (1ULL << 56);
				2528
				2529	return RsrcDataFormat;
				2530	}