Blame - llvm/lib/Target/R600/SIInstrInfo.cpp - toolchain/llvm-project

blob: 94f7d6920abb561d5f7aa679679b8569b2f221fb [file] [log] [blame]

Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	1	//===-- SIInstrInfo.cpp - SI Instruction Information ---------------------===//
				2	//
				3	// The LLVM Compiler Infrastructure
				4	//
				5	// This file is distributed under the University of Illinois Open Source
				6	// License. See LICENSE.TXT for details.
				7	//
				8	//===----------------------------------------------------------------------===//
				9	//
				10	/// \file
				11	/// \brief SI Implementation of TargetInstrInfo.
				12	//
				13	//===----------------------------------------------------------------------===//
				14
				15
				16	#include "SIInstrInfo.h"
				17	#include "AMDGPUTargetMachine.h"
Tom Stellard	16a9a20	2013-08-14 23:24:17 +0000	[diff] [blame]	18	#include "SIDefines.h"
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	19	#include "SIMachineFunctionInfo.h"
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	20	#include "llvm/CodeGen/MachineFrameInfo.h"
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	21	#include "llvm/CodeGen/MachineInstrBuilder.h"
				22	#include "llvm/CodeGen/MachineRegisterInfo.h"
Tom Stellard	4e07b1d	2014-06-10 21:20:41 +0000	[diff] [blame]	23	#include "llvm/IR/Function.h"
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	24	#include "llvm/CodeGen/RegisterScavenging.h"
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	25	#include "llvm/MC/MCInstrDesc.h"
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	26
				27	using namespace llvm;
				28
Tom Stellard	2e59a45	2014-06-13 01:32:00 +0000	[diff] [blame]	29	SIInstrInfo::SIInstrInfo(const AMDGPUSubtarget &st)
				30	: AMDGPUInstrInfo(st),
				31	RI(st) { }
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	32
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	33	//===----------------------------------------------------------------------===//
				34	// TargetInstrInfo callbacks
				35	//===----------------------------------------------------------------------===//
				36
Matt Arsenault	c10853f	2014-08-06 00:29:43 +0000	[diff] [blame]	37	static unsigned getNumOperandsNoGlue(SDNode *Node) {
				38	unsigned N = Node->getNumOperands();
				39	while (N && Node->getOperand(N - 1).getValueType() == MVT::Glue)
				40	--N;
				41	return N;
				42	}
				43
				44	static SDValue findChainOperand(SDNode *Load) {
				45	SDValue LastOp = Load->getOperand(getNumOperandsNoGlue(Load) - 1);
				46	assert(LastOp.getValueType() == MVT::Other && "Chain missing from load node");
				47	return LastOp;
				48	}
				49
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	50	/// \brief Returns true if both nodes have the same value for the given
				51	/// operand \p Op, or if both nodes do not have this operand.
				52	static bool nodesHaveSameOperandValue(SDNode N0, SDNode N1, unsigned OpName) {
				53	unsigned Opc0 = N0->getMachineOpcode();
				54	unsigned Opc1 = N1->getMachineOpcode();
				55
				56	int Op0Idx = AMDGPU::getNamedOperandIdx(Opc0, OpName);
				57	int Op1Idx = AMDGPU::getNamedOperandIdx(Opc1, OpName);
				58
				59	if (Op0Idx == -1 && Op1Idx == -1)
				60	return true;
				61
				62
				63	if ((Op0Idx == -1 && Op1Idx != -1) \|\|
				64	(Op1Idx == -1 && Op0Idx != -1))
				65	return false;
				66
				67	// getNamedOperandIdx returns the index for the MachineInstr's operands,
				68	// which includes the result as the first operand. We are indexing into the
				69	// MachineSDNode's operands, so we need to skip the result operand to get
				70	// the real index.
				71	--Op0Idx;
				72	--Op1Idx;
				73
Tom Stellard	b8b8413	2014-09-03 15:22:39 +0000	[diff] [blame]	74	return N0->getOperand(Op0Idx) == N1->getOperand(Op1Idx);
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	75	}
				76
Matt Arsenault	c10853f	2014-08-06 00:29:43 +0000	[diff] [blame]	77	bool SIInstrInfo::areLoadsFromSameBasePtr(SDNode Load0, SDNode Load1,
				78	int64_t &Offset0,
				79	int64_t &Offset1) const {
				80	if (!Load0->isMachineOpcode() \|\| !Load1->isMachineOpcode())
				81	return false;
				82
				83	unsigned Opc0 = Load0->getMachineOpcode();
				84	unsigned Opc1 = Load1->getMachineOpcode();
				85
				86	// Make sure both are actually loads.
				87	if (!get(Opc0).mayLoad() \|\| !get(Opc1).mayLoad())
				88	return false;
				89
				90	if (isDS(Opc0) && isDS(Opc1)) {
Tom Stellard	20fa0be	2014-10-07 21:09:20 +0000	[diff] [blame]	91
				92	// FIXME: Handle this case:
				93	if (getNumOperandsNoGlue(Load0) != getNumOperandsNoGlue(Load1))
				94	return false;
Matt Arsenault	c10853f	2014-08-06 00:29:43 +0000	[diff] [blame]	95
Matt Arsenault	c10853f	2014-08-06 00:29:43 +0000	[diff] [blame]	96	// Check base reg.
				97	if (Load0->getOperand(1) != Load1->getOperand(1))
				98	return false;
				99
				100	// Check chain.
				101	if (findChainOperand(Load0) != findChainOperand(Load1))
				102	return false;
				103
Matt Arsenault	972c12a	2014-09-17 17:48:32 +0000	[diff] [blame]	104	// Skip read2 / write2 variants for simplicity.
				105	// TODO: We should report true if the used offsets are adjacent (excluded
				106	// st64 versions).
				107	if (AMDGPU::getNamedOperandIdx(Opc0, AMDGPU::OpName::data1) != -1 \|\|
				108	AMDGPU::getNamedOperandIdx(Opc1, AMDGPU::OpName::data1) != -1)
				109	return false;
				110
Matt Arsenault	c10853f	2014-08-06 00:29:43 +0000	[diff] [blame]	111	Offset0 = cast<ConstantSDNode>(Load0->getOperand(2))->getZExtValue();
				112	Offset1 = cast<ConstantSDNode>(Load1->getOperand(2))->getZExtValue();
				113	return true;
				114	}
				115
				116	if (isSMRD(Opc0) && isSMRD(Opc1)) {
				117	assert(getNumOperandsNoGlue(Load0) == getNumOperandsNoGlue(Load1));
				118
				119	// Check base reg.
				120	if (Load0->getOperand(0) != Load1->getOperand(0))
				121	return false;
				122
				123	// Check chain.
				124	if (findChainOperand(Load0) != findChainOperand(Load1))
				125	return false;
				126
				127	Offset0 = cast<ConstantSDNode>(Load0->getOperand(1))->getZExtValue();
				128	Offset1 = cast<ConstantSDNode>(Load1->getOperand(1))->getZExtValue();
				129	return true;
				130	}
				131
				132	// MUBUF and MTBUF can access the same addresses.
				133	if ((isMUBUF(Opc0) \|\| isMTBUF(Opc0)) && (isMUBUF(Opc1) \|\| isMTBUF(Opc1))) {
Matt Arsenault	c10853f	2014-08-06 00:29:43 +0000	[diff] [blame]	134
				135	// MUBUF and MTBUF have vaddr at different indices.
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	136	if (!nodesHaveSameOperandValue(Load0, Load1, AMDGPU::OpName::soffset) \|\|
				137	findChainOperand(Load0) != findChainOperand(Load1) \|\|
				138	!nodesHaveSameOperandValue(Load0, Load1, AMDGPU::OpName::vaddr) \|\|
Tom Stellard	b8b8413	2014-09-03 15:22:39 +0000	[diff] [blame]	139	!nodesHaveSameOperandValue(Load0, Load1, AMDGPU::OpName::srsrc))
Matt Arsenault	c10853f	2014-08-06 00:29:43 +0000	[diff] [blame]	140	return false;
				141
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	142	int OffIdx0 = AMDGPU::getNamedOperandIdx(Opc0, AMDGPU::OpName::offset);
				143	int OffIdx1 = AMDGPU::getNamedOperandIdx(Opc1, AMDGPU::OpName::offset);
				144
				145	if (OffIdx0 == -1 \|\| OffIdx1 == -1)
				146	return false;
				147
				148	// getNamedOperandIdx returns the index for MachineInstrs. Since they
				149	// inlcude the output in the operand list, but SDNodes don't, we need to
				150	// subtract the index by one.
				151	--OffIdx0;
				152	--OffIdx1;
				153
				154	SDValue Off0 = Load0->getOperand(OffIdx0);
				155	SDValue Off1 = Load1->getOperand(OffIdx1);
				156
				157	// The offset might be a FrameIndexSDNode.
				158	if (!isa<ConstantSDNode>(Off0) \|\| !isa<ConstantSDNode>(Off1))
				159	return false;
				160
				161	Offset0 = cast<ConstantSDNode>(Off0)->getZExtValue();
				162	Offset1 = cast<ConstantSDNode>(Off1)->getZExtValue();
Matt Arsenault	c10853f	2014-08-06 00:29:43 +0000	[diff] [blame]	163	return true;
				164	}
				165
				166	return false;
				167	}
				168
Matt Arsenault	2e99112	2014-09-10 23:26:16 +0000	[diff] [blame]	169	static bool isStride64(unsigned Opc) {
				170	switch (Opc) {
				171	case AMDGPU::DS_READ2ST64_B32:
				172	case AMDGPU::DS_READ2ST64_B64:
				173	case AMDGPU::DS_WRITE2ST64_B32:
				174	case AMDGPU::DS_WRITE2ST64_B64:
				175	return true;
				176	default:
				177	return false;
				178	}
				179	}
				180
Matt Arsenault	1acc72f	2014-07-29 21:34:55 +0000	[diff] [blame]	181	bool SIInstrInfo::getLdStBaseRegImmOfs(MachineInstr *LdSt,
				182	unsigned &BaseReg, unsigned &Offset,
				183	const TargetRegisterInfo *TRI) const {
				184	unsigned Opc = LdSt->getOpcode();
				185	if (isDS(Opc)) {
Matt Arsenault	1acc72f	2014-07-29 21:34:55 +0000	[diff] [blame]	186	const MachineOperand OffsetImm = getNamedOperand(LdSt,
				187	AMDGPU::OpName::offset);
Matt Arsenault	7eb0a10	2014-07-30 01:01:10 +0000	[diff] [blame]	188	if (OffsetImm) {
				189	// Normal, single offset LDS instruction.
				190	const MachineOperand AddrReg = getNamedOperand(LdSt,
				191	AMDGPU::OpName::addr);
Matt Arsenault	1acc72f	2014-07-29 21:34:55 +0000	[diff] [blame]	192
Matt Arsenault	7eb0a10	2014-07-30 01:01:10 +0000	[diff] [blame]	193	BaseReg = AddrReg->getReg();
				194	Offset = OffsetImm->getImm();
				195	return true;
Matt Arsenault	1acc72f	2014-07-29 21:34:55 +0000	[diff] [blame]	196	}
				197
Matt Arsenault	7eb0a10	2014-07-30 01:01:10 +0000	[diff] [blame]	198	// The 2 offset instructions use offset0 and offset1 instead. We can treat
				199	// these as a load with a single offset if the 2 offsets are consecutive. We
				200	// will use this for some partially aligned loads.
				201	const MachineOperand Offset0Imm = getNamedOperand(LdSt,
				202	AMDGPU::OpName::offset0);
				203	const MachineOperand Offset1Imm = getNamedOperand(LdSt,
				204	AMDGPU::OpName::offset1);
Matt Arsenault	1acc72f	2014-07-29 21:34:55 +0000	[diff] [blame]	205
Matt Arsenault	7eb0a10	2014-07-30 01:01:10 +0000	[diff] [blame]	206	uint8_t Offset0 = Offset0Imm->getImm();
				207	uint8_t Offset1 = Offset1Imm->getImm();
				208	assert(Offset1 > Offset0);
				209
				210	if (Offset1 - Offset0 == 1) {
				211	// Each of these offsets is in element sized units, so we need to convert
				212	// to bytes of the individual reads.
				213
				214	unsigned EltSize;
				215	if (LdSt->mayLoad())
				216	EltSize = getOpRegClass(*LdSt, 0)->getSize() / 2;
				217	else {
				218	assert(LdSt->mayStore());
				219	int Data0Idx = AMDGPU::getNamedOperandIdx(Opc, AMDGPU::OpName::data0);
				220	EltSize = getOpRegClass(*LdSt, Data0Idx)->getSize();
				221	}
				222
Matt Arsenault	2e99112	2014-09-10 23:26:16 +0000	[diff] [blame]	223	if (isStride64(Opc))
				224	EltSize *= 64;
				225
Matt Arsenault	7eb0a10	2014-07-30 01:01:10 +0000	[diff] [blame]	226	const MachineOperand AddrReg = getNamedOperand(LdSt,
				227	AMDGPU::OpName::addr);
				228	BaseReg = AddrReg->getReg();
				229	Offset = EltSize * Offset0;
				230	return true;
				231	}
				232
				233	return false;
Matt Arsenault	1acc72f	2014-07-29 21:34:55 +0000	[diff] [blame]	234	}
				235
				236	if (isMUBUF(Opc) \|\| isMTBUF(Opc)) {
				237	if (AMDGPU::getNamedOperandIdx(Opc, AMDGPU::OpName::soffset) != -1)
				238	return false;
				239
				240	const MachineOperand AddrReg = getNamedOperand(LdSt,
				241	AMDGPU::OpName::vaddr);
				242	if (!AddrReg)
				243	return false;
				244
				245	const MachineOperand OffsetImm = getNamedOperand(LdSt,
				246	AMDGPU::OpName::offset);
				247	BaseReg = AddrReg->getReg();
				248	Offset = OffsetImm->getImm();
				249	return true;
				250	}
				251
				252	if (isSMRD(Opc)) {
				253	const MachineOperand OffsetImm = getNamedOperand(LdSt,
				254	AMDGPU::OpName::offset);
				255	if (!OffsetImm)
				256	return false;
				257
				258	const MachineOperand SBaseReg = getNamedOperand(LdSt,
				259	AMDGPU::OpName::sbase);
				260	BaseReg = SBaseReg->getReg();
				261	Offset = OffsetImm->getImm();
				262	return true;
				263	}
				264
				265	return false;
				266	}
				267
Matt Arsenault	0e75a06	2014-09-17 17:48:30 +0000	[diff] [blame]	268	bool SIInstrInfo::shouldClusterLoads(MachineInstr *FirstLdSt,
				269	MachineInstr *SecondLdSt,
				270	unsigned NumLoads) const {
				271	unsigned Opc0 = FirstLdSt->getOpcode();
				272	unsigned Opc1 = SecondLdSt->getOpcode();
				273
				274	// TODO: This needs finer tuning
				275	if (NumLoads > 4)
				276	return false;
				277
				278	if (isDS(Opc0) && isDS(Opc1))
				279	return true;
				280
				281	if (isSMRD(Opc0) && isSMRD(Opc1))
				282	return true;
				283
				284	if ((isMUBUF(Opc0) \|\| isMTBUF(Opc0)) && (isMUBUF(Opc1) \|\| isMTBUF(Opc1)))
				285	return true;
				286
				287	return false;
				288	}
				289
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	290	void
				291	SIInstrInfo::copyPhysReg(MachineBasicBlock &MBB,
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	292	MachineBasicBlock::iterator MI, DebugLoc DL,
				293	unsigned DestReg, unsigned SrcReg,
				294	bool KillSrc) const {
				295
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	296	// If we are trying to copy to or from SCC, there is a bug somewhere else in
				297	// the backend. While it may be theoretically possible to do this, it should
				298	// never be necessary.
				299	assert(DestReg != AMDGPU::SCC && SrcReg != AMDGPU::SCC);
				300
Craig Topper	0afd0ab	2013-07-15 06:39:13 +0000	[diff] [blame]	301	static const int16_t Sub0_15[] = {
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	302	AMDGPU::sub0, AMDGPU::sub1, AMDGPU::sub2, AMDGPU::sub3,
				303	AMDGPU::sub4, AMDGPU::sub5, AMDGPU::sub6, AMDGPU::sub7,
				304	AMDGPU::sub8, AMDGPU::sub9, AMDGPU::sub10, AMDGPU::sub11,
				305	AMDGPU::sub12, AMDGPU::sub13, AMDGPU::sub14, AMDGPU::sub15, 0
				306	};
				307
Craig Topper	0afd0ab	2013-07-15 06:39:13 +0000	[diff] [blame]	308	static const int16_t Sub0_7[] = {
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	309	AMDGPU::sub0, AMDGPU::sub1, AMDGPU::sub2, AMDGPU::sub3,
				310	AMDGPU::sub4, AMDGPU::sub5, AMDGPU::sub6, AMDGPU::sub7, 0
				311	};
				312
Craig Topper	0afd0ab	2013-07-15 06:39:13 +0000	[diff] [blame]	313	static const int16_t Sub0_3[] = {
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	314	AMDGPU::sub0, AMDGPU::sub1, AMDGPU::sub2, AMDGPU::sub3, 0
				315	};
				316
Craig Topper	0afd0ab	2013-07-15 06:39:13 +0000	[diff] [blame]	317	static const int16_t Sub0_2[] = {
Christian Konig	8b1ed28	2013-04-10 08:39:16 +0000	[diff] [blame]	318	AMDGPU::sub0, AMDGPU::sub1, AMDGPU::sub2, 0
				319	};
				320
Craig Topper	0afd0ab	2013-07-15 06:39:13 +0000	[diff] [blame]	321	static const int16_t Sub0_1[] = {
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	322	AMDGPU::sub0, AMDGPU::sub1, 0
				323	};
				324
				325	unsigned Opcode;
				326	const int16_t *SubIndices;
				327
Christian Konig	082c661	2013-03-26 14:04:12 +0000	[diff] [blame]	328	if (AMDGPU::M0 == DestReg) {
				329	// Check if M0 isn't already set to this value
				330	for (MachineBasicBlock::reverse_iterator E = MBB.rend(),
				331	I = MachineBasicBlock::reverse_iterator(MI); I != E; ++I) {
				332
				333	if (!I->definesRegister(AMDGPU::M0))
				334	continue;
				335
				336	unsigned Opc = I->getOpcode();
				337	if (Opc != TargetOpcode::COPY && Opc != AMDGPU::S_MOV_B32)
				338	break;
				339
				340	if (!I->readsRegister(SrcReg))
				341	break;
				342
				343	// The copy isn't necessary
				344	return;
				345	}
				346	}
				347
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	348	if (AMDGPU::SReg_32RegClass.contains(DestReg)) {
				349	assert(AMDGPU::SReg_32RegClass.contains(SrcReg));
				350	BuildMI(MBB, MI, DL, get(AMDGPU::S_MOV_B32), DestReg)
				351	.addReg(SrcReg, getKillRegState(KillSrc));
				352	return;
				353
Tom Stellard	aac1889	2013-02-07 19:39:43 +0000	[diff] [blame]	354	} else if (AMDGPU::SReg_64RegClass.contains(DestReg)) {
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	355	assert(AMDGPU::SReg_64RegClass.contains(SrcReg));
				356	BuildMI(MBB, MI, DL, get(AMDGPU::S_MOV_B64), DestReg)
				357	.addReg(SrcReg, getKillRegState(KillSrc));
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	358	return;
				359
				360	} else if (AMDGPU::SReg_128RegClass.contains(DestReg)) {
				361	assert(AMDGPU::SReg_128RegClass.contains(SrcReg));
				362	Opcode = AMDGPU::S_MOV_B32;
				363	SubIndices = Sub0_3;
				364
				365	} else if (AMDGPU::SReg_256RegClass.contains(DestReg)) {
				366	assert(AMDGPU::SReg_256RegClass.contains(SrcReg));
				367	Opcode = AMDGPU::S_MOV_B32;
				368	SubIndices = Sub0_7;
				369
				370	} else if (AMDGPU::SReg_512RegClass.contains(DestReg)) {
				371	assert(AMDGPU::SReg_512RegClass.contains(SrcReg));
				372	Opcode = AMDGPU::S_MOV_B32;
				373	SubIndices = Sub0_15;
				374
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	375	} else if (AMDGPU::VReg_32RegClass.contains(DestReg)) {
				376	assert(AMDGPU::VReg_32RegClass.contains(SrcReg) \|\|
NAKAMURA Takumi	4bb85f9	2013-10-28 04:07:23 +0000	[diff] [blame]	377	AMDGPU::SReg_32RegClass.contains(SrcReg));
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	378	BuildMI(MBB, MI, DL, get(AMDGPU::V_MOV_B32_e32), DestReg)
				379	.addReg(SrcReg, getKillRegState(KillSrc));
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	380	return;
				381
				382	} else if (AMDGPU::VReg_64RegClass.contains(DestReg)) {
				383	assert(AMDGPU::VReg_64RegClass.contains(SrcReg) \|\|
NAKAMURA Takumi	4bb85f9	2013-10-28 04:07:23 +0000	[diff] [blame]	384	AMDGPU::SReg_64RegClass.contains(SrcReg));
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	385	Opcode = AMDGPU::V_MOV_B32_e32;
				386	SubIndices = Sub0_1;
				387
Christian Konig	8b1ed28	2013-04-10 08:39:16 +0000	[diff] [blame]	388	} else if (AMDGPU::VReg_96RegClass.contains(DestReg)) {
				389	assert(AMDGPU::VReg_96RegClass.contains(SrcReg));
				390	Opcode = AMDGPU::V_MOV_B32_e32;
				391	SubIndices = Sub0_2;
				392
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	393	} else if (AMDGPU::VReg_128RegClass.contains(DestReg)) {
				394	assert(AMDGPU::VReg_128RegClass.contains(SrcReg) \|\|
NAKAMURA Takumi	4bb85f9	2013-10-28 04:07:23 +0000	[diff] [blame]	395	AMDGPU::SReg_128RegClass.contains(SrcReg));
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	396	Opcode = AMDGPU::V_MOV_B32_e32;
				397	SubIndices = Sub0_3;
				398
				399	} else if (AMDGPU::VReg_256RegClass.contains(DestReg)) {
				400	assert(AMDGPU::VReg_256RegClass.contains(SrcReg) \|\|
NAKAMURA Takumi	4bb85f9	2013-10-28 04:07:23 +0000	[diff] [blame]	401	AMDGPU::SReg_256RegClass.contains(SrcReg));
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	402	Opcode = AMDGPU::V_MOV_B32_e32;
				403	SubIndices = Sub0_7;
				404
				405	} else if (AMDGPU::VReg_512RegClass.contains(DestReg)) {
				406	assert(AMDGPU::VReg_512RegClass.contains(SrcReg) \|\|
NAKAMURA Takumi	4bb85f9	2013-10-28 04:07:23 +0000	[diff] [blame]	407	AMDGPU::SReg_512RegClass.contains(SrcReg));
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	408	Opcode = AMDGPU::V_MOV_B32_e32;
				409	SubIndices = Sub0_15;
				410
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	411	} else {
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	412	llvm_unreachable("Can't copy register!");
				413	}
				414
				415	while (unsigned SubIdx = *SubIndices++) {
				416	MachineInstrBuilder Builder = BuildMI(MBB, MI, DL,
				417	get(Opcode), RI.getSubReg(DestReg, SubIdx));
				418
				419	Builder.addReg(RI.getSubReg(SrcReg, SubIdx), getKillRegState(KillSrc));
				420
				421	if (*SubIndices)
				422	Builder.addReg(DestReg, RegState::Define \| RegState::Implicit);
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	423	}
				424	}
				425
Christian Konig	3c14580	2013-03-27 09:12:59 +0000	[diff] [blame]	426	unsigned SIInstrInfo::commuteOpcode(unsigned Opcode) const {
Christian Konig	3c14580	2013-03-27 09:12:59 +0000	[diff] [blame]	427	int NewOpc;
				428
				429	// Try to map original to commuted opcode
				430	if ((NewOpc = AMDGPU::getCommuteRev(Opcode)) != -1)
				431	return NewOpc;
				432
				433	// Try to map commuted to original opcode
				434	if ((NewOpc = AMDGPU::getCommuteOrig(Opcode)) != -1)
				435	return NewOpc;
				436
				437	return Opcode;
				438	}
				439
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	440	static bool shouldTryToSpillVGPRs(MachineFunction *MF) {
				441
				442	SIMachineFunctionInfo *MFI = MF->getInfo<SIMachineFunctionInfo>();
				443	const TargetMachine &TM = MF->getTarget();
				444
				445	// FIXME: Even though it can cause problems, we need to enable
				446	// spilling at -O0, since the fast register allocator always
				447	// spills registers that are live at the end of blocks.
				448	return MFI->getShaderType() == ShaderType::COMPUTE &&
				449	TM.getOptLevel() == CodeGenOpt::None;
				450
				451	}
				452
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	453	void SIInstrInfo::storeRegToStackSlot(MachineBasicBlock &MBB,
				454	MachineBasicBlock::iterator MI,
				455	unsigned SrcReg, bool isKill,
				456	int FrameIndex,
				457	const TargetRegisterClass *RC,
				458	const TargetRegisterInfo *TRI) const {
Tom Stellard	4e07b1d	2014-06-10 21:20:41 +0000	[diff] [blame]	459	MachineFunction *MF = MBB.getParent();
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	460	MachineFrameInfo *FrameInfo = MF->getFrameInfo();
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	461	DebugLoc DL = MBB.findDebugLoc(MI);
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	462	int Opcode = -1;
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	463
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	464	if (RI.isSGPRClass(RC)) {
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	465	// We are only allowed to create one new instruction when spilling
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	466	// registers, so we need to use pseudo instruction for spilling
				467	// SGPRs.
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	468	switch (RC->getSize() * 8) {
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	469	case 32: Opcode = AMDGPU::SI_SPILL_S32_SAVE; break;
				470	case 64: Opcode = AMDGPU::SI_SPILL_S64_SAVE; break;
				471	case 128: Opcode = AMDGPU::SI_SPILL_S128_SAVE; break;
				472	case 256: Opcode = AMDGPU::SI_SPILL_S256_SAVE; break;
				473	case 512: Opcode = AMDGPU::SI_SPILL_S512_SAVE; break;
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	474	}
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	475	} else if(shouldTryToSpillVGPRs(MF) && RI.hasVGPRs(RC)) {
				476	switch(RC->getSize() * 8) {
				477	case 32: Opcode = AMDGPU::SI_SPILL_V32_SAVE; break;
				478	case 64: Opcode = AMDGPU::SI_SPILL_V64_SAVE; break;
				479	case 96: Opcode = AMDGPU::SI_SPILL_V96_SAVE; break;
				480	case 128: Opcode = AMDGPU::SI_SPILL_V128_SAVE; break;
				481	case 256: Opcode = AMDGPU::SI_SPILL_V256_SAVE; break;
				482	case 512: Opcode = AMDGPU::SI_SPILL_V512_SAVE; break;
				483	}
				484	}
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	485
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	486	if (Opcode != -1) {
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	487	FrameInfo->setObjectAlignment(FrameIndex, 4);
				488	BuildMI(MBB, MI, DL, get(Opcode))
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	489	.addReg(SrcReg)
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	490	.addFrameIndex(FrameIndex);
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	491	} else {
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	492	LLVMContext &Ctx = MF->getFunction()->getContext();
				493	Ctx.emitError("SIInstrInfo::storeRegToStackSlot - Do not know how to"
				494	" spill register");
				495	BuildMI(MBB, MI, DL, get(AMDGPU::V_MOV_B32_e32), AMDGPU::VGPR0)
				496	.addReg(SrcReg);
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	497	}
				498	}
				499
				500	void SIInstrInfo::loadRegFromStackSlot(MachineBasicBlock &MBB,
				501	MachineBasicBlock::iterator MI,
				502	unsigned DestReg, int FrameIndex,
				503	const TargetRegisterClass *RC,
				504	const TargetRegisterInfo *TRI) const {
Tom Stellard	4e07b1d	2014-06-10 21:20:41 +0000	[diff] [blame]	505	MachineFunction *MF = MBB.getParent();
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	506	MachineFrameInfo *FrameInfo = MF->getFrameInfo();
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	507	DebugLoc DL = MBB.findDebugLoc(MI);
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	508	int Opcode = -1;
Tom Stellard	4e07b1d	2014-06-10 21:20:41 +0000	[diff] [blame]	509
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	510	if (RI.isSGPRClass(RC)){
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	511	switch(RC->getSize() * 8) {
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	512	case 32: Opcode = AMDGPU::SI_SPILL_S32_RESTORE; break;
				513	case 64: Opcode = AMDGPU::SI_SPILL_S64_RESTORE; break;
				514	case 128: Opcode = AMDGPU::SI_SPILL_S128_RESTORE; break;
				515	case 256: Opcode = AMDGPU::SI_SPILL_S256_RESTORE; break;
				516	case 512: Opcode = AMDGPU::SI_SPILL_S512_RESTORE; break;
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	517	}
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	518	} else if(shouldTryToSpillVGPRs(MF) && RI.hasVGPRs(RC)) {
				519	switch(RC->getSize() * 8) {
				520	case 32: Opcode = AMDGPU::SI_SPILL_V32_RESTORE; break;
				521	case 64: Opcode = AMDGPU::SI_SPILL_V64_RESTORE; break;
				522	case 96: Opcode = AMDGPU::SI_SPILL_V96_RESTORE; break;
				523	case 128: Opcode = AMDGPU::SI_SPILL_V128_RESTORE; break;
				524	case 256: Opcode = AMDGPU::SI_SPILL_V256_RESTORE; break;
				525	case 512: Opcode = AMDGPU::SI_SPILL_V512_RESTORE; break;
				526	}
				527	}
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	528
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	529	if (Opcode != -1) {
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	530	FrameInfo->setObjectAlignment(FrameIndex, 4);
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	531	BuildMI(MBB, MI, DL, get(Opcode), DestReg)
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	532	.addFrameIndex(FrameIndex);
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	533	} else {
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	534	LLVMContext &Ctx = MF->getFunction()->getContext();
				535	Ctx.emitError("SIInstrInfo::loadRegFromStackSlot - Do not know how to"
				536	" restore register");
				537	BuildMI(MBB, MI, DL, get(AMDGPU::V_MOV_B32_e32), DestReg)
				538	.addReg(AMDGPU::VGPR0);
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	539	}
				540	}
				541
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	542	/// \param @Offset Offset in bytes of the FrameIndex being spilled
				543	unsigned SIInstrInfo::calculateLDSSpillAddress(MachineBasicBlock &MBB,
				544	MachineBasicBlock::iterator MI,
				545	RegScavenger *RS, unsigned TmpReg,
				546	unsigned FrameOffset,
				547	unsigned Size) const {
				548	MachineFunction *MF = MBB.getParent();
				549	SIMachineFunctionInfo *MFI = MF->getInfo<SIMachineFunctionInfo>();
				550	const AMDGPUSubtarget &ST = MF->getTarget().getSubtarget<AMDGPUSubtarget>();
				551	const SIRegisterInfo *TRI =
				552	static_cast<const SIRegisterInfo*>(ST.getRegisterInfo());
				553	DebugLoc DL = MBB.findDebugLoc(MI);
				554	unsigned WorkGroupSize = MFI->getMaximumWorkGroupSize(*MF);
				555	unsigned WavefrontSize = ST.getWavefrontSize();
				556
				557	unsigned TIDReg = MFI->getTIDReg();
				558	if (!MFI->hasCalculatedTID()) {
				559	MachineBasicBlock &Entry = MBB.getParent()->front();
				560	MachineBasicBlock::iterator Insert = Entry.front();
				561	DebugLoc DL = Insert->getDebugLoc();
				562
				563	TIDReg = RI.findUnusedVGPR(MF->getRegInfo());
				564	if (TIDReg == AMDGPU::NoRegister)
				565	return TIDReg;
				566
				567
				568	if (MFI->getShaderType() == ShaderType::COMPUTE &&
				569	WorkGroupSize > WavefrontSize) {
				570
				571	unsigned TIDIGXReg = TRI->getPreloadedValue(*MF, SIRegisterInfo::TIDIG_X);
				572	unsigned TIDIGYReg = TRI->getPreloadedValue(*MF, SIRegisterInfo::TIDIG_Y);
				573	unsigned TIDIGZReg = TRI->getPreloadedValue(*MF, SIRegisterInfo::TIDIG_Z);
				574	unsigned InputPtrReg =
				575	TRI->getPreloadedValue(*MF, SIRegisterInfo::INPUT_PTR);
				576	static const unsigned TIDIGRegs[3] = {
				577	TIDIGXReg, TIDIGYReg, TIDIGZReg
				578	};
				579	for (unsigned Reg : TIDIGRegs) {
				580	if (!Entry.isLiveIn(Reg))
				581	Entry.addLiveIn(Reg);
				582	}
				583
				584	RS->enterBasicBlock(&Entry);
				585	unsigned STmp0 = RS->scavengeRegister(&AMDGPU::SGPR_32RegClass, 0);
				586	unsigned STmp1 = RS->scavengeRegister(&AMDGPU::SGPR_32RegClass, 0);
				587	BuildMI(Entry, Insert, DL, get(AMDGPU::S_LOAD_DWORD_IMM), STmp0)
				588	.addReg(InputPtrReg)
				589	.addImm(SI::KernelInputOffsets::NGROUPS_Z);
				590	BuildMI(Entry, Insert, DL, get(AMDGPU::S_LOAD_DWORD_IMM), STmp1)
				591	.addReg(InputPtrReg)
				592	.addImm(SI::KernelInputOffsets::NGROUPS_Y);
				593
				594	// NGROUPS.X * NGROUPS.Y
				595	BuildMI(Entry, Insert, DL, get(AMDGPU::S_MUL_I32), STmp1)
				596	.addReg(STmp1)
				597	.addReg(STmp0);
				598	// (NGROUPS.X * NGROUPS.Y) * TIDIG.X
				599	BuildMI(Entry, Insert, DL, get(AMDGPU::V_MUL_U32_U24_e32), TIDReg)
				600	.addReg(STmp1)
				601	.addReg(TIDIGXReg);
				602	// NGROUPS.Z * TIDIG.Y + (NGROUPS.X * NGROPUS.Y * TIDIG.X)
				603	BuildMI(Entry, Insert, DL, get(AMDGPU::V_MAD_U32_U24), TIDReg)
				604	.addReg(STmp0)
				605	.addReg(TIDIGYReg)
				606	.addReg(TIDReg);
				607	// (NGROUPS.Z * TIDIG.Y + (NGROUPS.X * NGROPUS.Y * TIDIG.X)) + TIDIG.Z
				608	BuildMI(Entry, Insert, DL, get(AMDGPU::V_ADD_I32_e32), TIDReg)
				609	.addReg(TIDReg)
				610	.addReg(TIDIGZReg);
				611	} else {
				612	// Get the wave id
				613	BuildMI(Entry, Insert, DL, get(AMDGPU::V_MBCNT_LO_U32_B32_e64),
				614	TIDReg)
				615	.addImm(-1)
				616	.addImm(0);
				617
				618	BuildMI(Entry, Insert, DL, get(AMDGPU::V_MBCNT_HI_U32_B32_e32),
				619	TIDReg)
				620	.addImm(-1)
				621	.addReg(TIDReg);
				622	}
				623
				624	BuildMI(Entry, Insert, DL, get(AMDGPU::V_LSHLREV_B32_e32),
				625	TIDReg)
				626	.addImm(2)
				627	.addReg(TIDReg);
				628	MFI->setTIDReg(TIDReg);
				629	}
				630
				631	// Add FrameIndex to LDS offset
				632	unsigned LDSOffset = MFI->LDSSize + (FrameOffset * WorkGroupSize);
				633	BuildMI(MBB, MI, DL, get(AMDGPU::V_ADD_I32_e32), TmpReg)
				634	.addImm(LDSOffset)
				635	.addReg(TIDReg);
				636
				637	return TmpReg;
				638	}
				639
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	640	void SIInstrInfo::insertNOPs(MachineBasicBlock::iterator MI,
				641	int Count) const {
				642	while (Count > 0) {
				643	int Arg;
				644	if (Count >= 8)
				645	Arg = 7;
				646	else
				647	Arg = Count - 1;
				648	Count -= 8;
				649	BuildMI(*MI->getParent(), MI, MI->getDebugLoc(), get(AMDGPU::S_NOP))
				650	.addImm(Arg);
				651	}
				652	}
				653
				654	bool SIInstrInfo::expandPostRAPseudo(MachineBasicBlock::iterator MI) const {
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	655	MachineBasicBlock &MBB = *MI->getParent();
				656	DebugLoc DL = MBB.findDebugLoc(MI);
				657	switch (MI->getOpcode()) {
				658	default: return AMDGPUInstrInfo::expandPostRAPseudo(MI);
				659
Tom Stellard	067c815	2014-07-21 14:01:14 +0000	[diff] [blame]	660	case AMDGPU::SI_CONSTDATA_PTR: {
				661	unsigned Reg = MI->getOperand(0).getReg();
				662	unsigned RegLo = RI.getSubReg(Reg, AMDGPU::sub0);
				663	unsigned RegHi = RI.getSubReg(Reg, AMDGPU::sub1);
				664
				665	BuildMI(MBB, MI, DL, get(AMDGPU::S_GETPC_B64), Reg);
				666
				667	// Add 32-bit offset from this instruction to the start of the constant data.
Tom Stellard	80942a1	2014-09-05 14:07:59 +0000	[diff] [blame]	668	BuildMI(MBB, MI, DL, get(AMDGPU::S_ADD_U32), RegLo)
Tom Stellard	067c815	2014-07-21 14:01:14 +0000	[diff] [blame]	669	.addReg(RegLo)
				670	.addTargetIndex(AMDGPU::TI_CONSTDATA_START)
				671	.addReg(AMDGPU::SCC, RegState::Define \| RegState::Implicit);
				672	BuildMI(MBB, MI, DL, get(AMDGPU::S_ADDC_U32), RegHi)
				673	.addReg(RegHi)
				674	.addImm(0)
				675	.addReg(AMDGPU::SCC, RegState::Define \| RegState::Implicit)
				676	.addReg(AMDGPU::SCC, RegState::Implicit);
				677	MI->eraseFromParent();
				678	break;
				679	}
Tom Stellard	60024a0	2014-09-24 01:33:24 +0000	[diff] [blame]	680	case AMDGPU::SGPR_USE:
				681	// This is just a placeholder for register allocation.
				682	MI->eraseFromParent();
				683	break;
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	684	}
				685	return true;
				686	}
				687
Christian Konig	76edd4f	2013-02-26 17:52:29 +0000	[diff] [blame]	688	MachineInstr SIInstrInfo::commuteInstruction(MachineInstr MI,
				689	bool NewMI) const {
Matt Arsenault	aff65fb	2014-09-26 17:54:43 +0000	[diff] [blame]	690	if (MI->getNumOperands() < 3)
Craig Topper	062a2ba	2014-04-25 05:30:21 +0000	[diff] [blame]	691	return nullptr;
Christian Konig	76edd4f	2013-02-26 17:52:29 +0000	[diff] [blame]	692
Matt Arsenault	aff65fb	2014-09-26 17:54:43 +0000	[diff] [blame]	693	int Src0Idx = AMDGPU::getNamedOperandIdx(MI->getOpcode(),
				694	AMDGPU::OpName::src0);
				695	assert(Src0Idx != -1 && "Should always have src0 operand");
				696
Matt Arsenault	aa5ccfb	2014-10-17 18:00:37 +0000	[diff] [blame]	697	MachineOperand &Src0 = MI->getOperand(Src0Idx);
				698	if (!Src0.isReg())
Matt Arsenault	aff65fb	2014-09-26 17:54:43 +0000	[diff] [blame]	699	return nullptr;
				700
				701	int Src1Idx = AMDGPU::getNamedOperandIdx(MI->getOpcode(),
				702	AMDGPU::OpName::src1);
Matt Arsenault	aa5ccfb	2014-10-17 18:00:37 +0000	[diff] [blame]	703	if (Src1Idx == -1)
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	704	return nullptr;
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	705
Matt Arsenault	aa5ccfb	2014-10-17 18:00:37 +0000	[diff] [blame]	706	MachineOperand &Src1 = MI->getOperand(Src1Idx);
				707
Matt Arsenault	933c38d	2014-10-17 18:02:31 +0000	[diff] [blame]	708	// Make sure it's legal to commute operands for VOP2.
Matt Arsenault	aa5ccfb	2014-10-17 18:00:37 +0000	[diff] [blame]	709	if (isVOP2(MI->getOpcode()) &&
				710	(!isOperandLegal(MI, Src0Idx, &Src1) \|\|
				711	!isOperandLegal(MI, Src1Idx, &Src0)))
				712	return nullptr;
				713
				714	if (!Src1.isReg()) {
Matt Arsenault	6d3cd54	2014-10-17 18:00:39 +0000	[diff] [blame]	715	// Allow commuting instructions with Imm or FPImm operands.
				716	if (NewMI \|\| (!Src1.isImm() && !Src1.isFPImm()) \|\|
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	717	(!isVOP2(MI->getOpcode()) && !isVOP3(MI->getOpcode()))) {
Craig Topper	062a2ba	2014-04-25 05:30:21 +0000	[diff] [blame]	718	return nullptr;
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	719	}
				720
Matt Arsenault	d282ada	2014-10-17 18:00:48 +0000	[diff] [blame]	721	// Be sure to copy the source modifiers to the right place.
				722	if (MachineOperand *Src0Mods
				723	= getNamedOperand(*MI, AMDGPU::OpName::src0_modifiers)) {
				724	MachineOperand *Src1Mods
				725	= getNamedOperand(*MI, AMDGPU::OpName::src1_modifiers);
				726
				727	int Src0ModsVal = Src0Mods->getImm();
				728	if (!Src1Mods && Src0ModsVal != 0)
				729	return nullptr;
				730
				731	// XXX - This assert might be a lie. It might be useful to have a neg
				732	// modifier with 0.0.
				733	int Src1ModsVal = Src1Mods->getImm();
				734	assert((Src1ModsVal == 0) && "Not expecting modifiers with immediates");
				735
				736	Src1Mods->setImm(Src0ModsVal);
				737	Src0Mods->setImm(Src1ModsVal);
				738	}
				739
Matt Arsenault	aa5ccfb	2014-10-17 18:00:37 +0000	[diff] [blame]	740	unsigned Reg = Src0.getReg();
				741	unsigned SubReg = Src0.getSubReg();
Matt Arsenault	6d3cd54	2014-10-17 18:00:39 +0000	[diff] [blame]	742	if (Src1.isImm())
				743	Src0.ChangeToImmediate(Src1.getImm());
				744	else if (Src1.isFPImm())
				745	Src0.ChangeToFPImmediate(Src1.getFPImm());
				746	else
				747	llvm_unreachable("Should only have immediates");
				748
Matt Arsenault	aa5ccfb	2014-10-17 18:00:37 +0000	[diff] [blame]	749	Src1.ChangeToRegister(Reg, false);
				750	Src1.setSubReg(SubReg);
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	751	} else {
				752	MI = TargetInstrInfo::commuteInstruction(MI, NewMI);
				753	}
Christian Konig	3c14580	2013-03-27 09:12:59 +0000	[diff] [blame]	754
				755	if (MI)
				756	MI->setDesc(get(commuteOpcode(MI->getOpcode())));
				757
				758	return MI;
Christian Konig	76edd4f	2013-02-26 17:52:29 +0000	[diff] [blame]	759	}
				760
Matt Arsenault	92befe7	2014-09-26 17:54:54 +0000	[diff] [blame]	761	// This needs to be implemented because the source modifiers may be inserted
				762	// between the true commutable operands, and the base
				763	// TargetInstrInfo::commuteInstruction uses it.
				764	bool SIInstrInfo::findCommutedOpIndices(MachineInstr *MI,
				765	unsigned &SrcOpIdx1,
				766	unsigned &SrcOpIdx2) const {
				767	const MCInstrDesc &MCID = MI->getDesc();
				768	if (!MCID.isCommutable())
				769	return false;
				770
				771	unsigned Opc = MI->getOpcode();
				772	int Src0Idx = AMDGPU::getNamedOperandIdx(Opc, AMDGPU::OpName::src0);
				773	if (Src0Idx == -1)
				774	return false;
				775
				776	// FIXME: Workaround TargetInstrInfo::commuteInstruction asserting on
				777	// immediate.
				778	if (!MI->getOperand(Src0Idx).isReg())
				779	return false;
				780
				781	int Src1Idx = AMDGPU::getNamedOperandIdx(Opc, AMDGPU::OpName::src1);
				782	if (Src1Idx == -1)
				783	return false;
				784
				785	if (!MI->getOperand(Src1Idx).isReg())
				786	return false;
				787
Matt Arsenault	ace5b76	2014-10-17 18:00:43 +0000	[diff] [blame]	788	// If any source modifiers are set, the generic instruction commuting won't
				789	// understand how to copy the source modifiers.
				790	if (hasModifiersSet(*MI, AMDGPU::OpName::src0_modifiers) \|\|
				791	hasModifiersSet(*MI, AMDGPU::OpName::src1_modifiers))
				792	return false;
				793
Matt Arsenault	92befe7	2014-09-26 17:54:54 +0000	[diff] [blame]	794	SrcOpIdx1 = Src0Idx;
				795	SrcOpIdx2 = Src1Idx;
				796	return true;
				797	}
				798
Tom Stellard	26a3b67	2013-10-22 18:19:10 +0000	[diff] [blame]	799	MachineInstr SIInstrInfo::buildMovInstr(MachineBasicBlock MBB,
				800	MachineBasicBlock::iterator I,
				801	unsigned DstReg,
				802	unsigned SrcReg) const {
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	803	return BuildMI(*MBB, I, MBB->findDebugLoc(I), get(AMDGPU::V_MOV_B32_e32),
				804	DstReg) .addReg(SrcReg);
Tom Stellard	26a3b67	2013-10-22 18:19:10 +0000	[diff] [blame]	805	}
				806
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	807	bool SIInstrInfo::isMov(unsigned Opcode) const {
				808	switch(Opcode) {
				809	default: return false;
				810	case AMDGPU::S_MOV_B32:
				811	case AMDGPU::S_MOV_B64:
				812	case AMDGPU::V_MOV_B32_e32:
				813	case AMDGPU::V_MOV_B32_e64:
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	814	return true;
				815	}
				816	}
				817
				818	bool
				819	SIInstrInfo::isSafeToMoveRegClassDefs(const TargetRegisterClass *RC) const {
				820	return RC != &AMDGPU::EXECRegRegClass;
				821	}
Tom Stellard	f3b2a1e	2013-02-06 17:32:29 +0000	[diff] [blame]	822
Tom Stellard	30f5941	2014-03-31 14:01:56 +0000	[diff] [blame]	823	bool
				824	SIInstrInfo::isTriviallyReMaterializable(const MachineInstr *MI,
				825	AliasAnalysis *AA) const {
				826	switch(MI->getOpcode()) {
				827	default: return AMDGPUInstrInfo::isTriviallyReMaterializable(MI, AA);
				828	case AMDGPU::S_MOV_B32:
				829	case AMDGPU::S_MOV_B64:
				830	case AMDGPU::V_MOV_B32_e32:
				831	return MI->getOperand(1).isImm();
				832	}
				833	}
				834
Tom Stellard	5d7aaae	2014-02-10 16:58:30 +0000	[diff] [blame]	835	namespace llvm {
				836	namespace AMDGPU {
				837	// Helper function generated by tablegen. We are wrapping this with
Matt Arsenault	57e74d2	2014-07-29 00:02:40 +0000	[diff] [blame]	838	// an SIInstrInfo function that returns bool rather than int.
Tom Stellard	5d7aaae	2014-02-10 16:58:30 +0000	[diff] [blame]	839	int isDS(uint16_t Opcode);
				840	}
				841	}
				842
				843	bool SIInstrInfo::isDS(uint16_t Opcode) const {
				844	return ::AMDGPU::isDS(Opcode) != -1;
				845	}
				846
Matt Arsenault	b9f46ee	2014-07-28 17:59:38 +0000	[diff] [blame]	847	bool SIInstrInfo::isMIMG(uint16_t Opcode) const {
Tom Stellard	16a9a20	2013-08-14 23:24:17 +0000	[diff] [blame]	848	return get(Opcode).TSFlags & SIInstrFlags::MIMG;
				849	}
				850
Matt Arsenault	b9f46ee	2014-07-28 17:59:38 +0000	[diff] [blame]	851	bool SIInstrInfo::isSMRD(uint16_t Opcode) const {
Michel Danzer	20680b1	2013-08-16 16:19:24 +0000	[diff] [blame]	852	return get(Opcode).TSFlags & SIInstrFlags::SMRD;
				853	}
				854
Matt Arsenault	e2fabd3	2014-07-29 18:51:56 +0000	[diff] [blame]	855	bool SIInstrInfo::isMUBUF(uint16_t Opcode) const {
				856	return get(Opcode).TSFlags & SIInstrFlags::MUBUF;
				857	}
				858
				859	bool SIInstrInfo::isMTBUF(uint16_t Opcode) const {
				860	return get(Opcode).TSFlags & SIInstrFlags::MTBUF;
				861	}
				862
Matt Arsenault	3f98140	2014-09-15 15:41:53 +0000	[diff] [blame]	863	bool SIInstrInfo::isFLAT(uint16_t Opcode) const {
				864	return get(Opcode).TSFlags & SIInstrFlags::FLAT;
				865	}
				866
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	867	bool SIInstrInfo::isVOP1(uint16_t Opcode) const {
				868	return get(Opcode).TSFlags & SIInstrFlags::VOP1;
				869	}
				870
				871	bool SIInstrInfo::isVOP2(uint16_t Opcode) const {
				872	return get(Opcode).TSFlags & SIInstrFlags::VOP2;
				873	}
				874
				875	bool SIInstrInfo::isVOP3(uint16_t Opcode) const {
				876	return get(Opcode).TSFlags & SIInstrFlags::VOP3;
				877	}
				878
				879	bool SIInstrInfo::isVOPC(uint16_t Opcode) const {
				880	return get(Opcode).TSFlags & SIInstrFlags::VOPC;
				881	}
				882
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	883	bool SIInstrInfo::isSALUInstr(const MachineInstr &MI) const {
				884	return get(MI.getOpcode()).TSFlags & SIInstrFlags::SALU;
				885	}
				886
Matt Arsenault	d7bdcc4	2014-03-31 19:54:27 +0000	[diff] [blame]	887	bool SIInstrInfo::isInlineConstant(const APInt &Imm) const {
				888	int32_t Val = Imm.getSExtValue();
				889	if (Val >= -16 && Val <= 64)
				890	return true;
Tom Stellard	d008446	2014-03-17 17:03:52 +0000	[diff] [blame]	891
				892	// The actual type of the operand does not seem to matter as long
				893	// as the bits match one of the inline immediate values. For example:
				894	//
				895	// -nan has the hexadecimal encoding of 0xfffffffe which is -2 in decimal,
				896	// so it is a legal inline immediate.
				897	//
				898	// 1065353216 has the hexadecimal encoding 0x3f800000 which is 1.0f in
				899	// floating-point, so it is a legal inline immediate.
Matt Arsenault	d7bdcc4	2014-03-31 19:54:27 +0000	[diff] [blame]	900
				901	return (APInt::floatToBits(0.0f) == Imm) \|\|
				902	(APInt::floatToBits(1.0f) == Imm) \|\|
				903	(APInt::floatToBits(-1.0f) == Imm) \|\|
				904	(APInt::floatToBits(0.5f) == Imm) \|\|
				905	(APInt::floatToBits(-0.5f) == Imm) \|\|
				906	(APInt::floatToBits(2.0f) == Imm) \|\|
				907	(APInt::floatToBits(-2.0f) == Imm) \|\|
				908	(APInt::floatToBits(4.0f) == Imm) \|\|
				909	(APInt::floatToBits(-4.0f) == Imm);
				910	}
				911
				912	bool SIInstrInfo::isInlineConstant(const MachineOperand &MO) const {
				913	if (MO.isImm())
				914	return isInlineConstant(APInt(32, MO.getImm(), true));
				915
				916	if (MO.isFPImm()) {
				917	APFloat FpImm = MO.getFPImm()->getValueAPF();
				918	return isInlineConstant(FpImm.bitcastToAPInt());
				919	}
				920
				921	return false;
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	922	}
				923
				924	bool SIInstrInfo::isLiteralConstant(const MachineOperand &MO) const {
				925	return (MO.isImm() \|\| MO.isFPImm()) && !isInlineConstant(MO);
				926	}
				927
Matt Arsenault	becb140	2014-06-23 18:28:31 +0000	[diff] [blame]	928	static bool compareMachineOp(const MachineOperand &Op0,
				929	const MachineOperand &Op1) {
				930	if (Op0.getType() != Op1.getType())
				931	return false;
				932
				933	switch (Op0.getType()) {
				934	case MachineOperand::MO_Register:
				935	return Op0.getReg() == Op1.getReg();
				936	case MachineOperand::MO_Immediate:
				937	return Op0.getImm() == Op1.getImm();
				938	case MachineOperand::MO_FPImmediate:
				939	return Op0.getFPImm() == Op1.getFPImm();
				940	default:
				941	llvm_unreachable("Didn't expect to be comparing these operand types");
				942	}
				943	}
				944
Tom Stellard	b02094e	2014-07-21 15:45:01 +0000	[diff] [blame]	945	bool SIInstrInfo::isImmOperandLegal(const MachineInstr *MI, unsigned OpNo,
				946	const MachineOperand &MO) const {
				947	const MCOperandInfo &OpInfo = get(MI->getOpcode()).OpInfo[OpNo];
				948
Tom Stellard	73ae1cb	2014-09-23 21:26:25 +0000	[diff] [blame]	949	assert(MO.isImm() \|\| MO.isFPImm() \|\| MO.isTargetIndex() \|\| MO.isFI());
Tom Stellard	b02094e	2014-07-21 15:45:01 +0000	[diff] [blame]	950
				951	if (OpInfo.OperandType == MCOI::OPERAND_IMMEDIATE)
				952	return true;
				953
				954	if (OpInfo.RegClass < 0)
				955	return false;
				956
Tom Stellard	73ae1cb	2014-09-23 21:26:25 +0000	[diff] [blame]	957	if (isLiteralConstant(MO))
				958	return RI.regClassCanUseLiteralConstant(OpInfo.RegClass);
				959
				960	return RI.regClassCanUseInlineConstant(OpInfo.RegClass);
Tom Stellard	b02094e	2014-07-21 15:45:01 +0000	[diff] [blame]	961	}
				962
Matt Arsenault	b2baffa	2014-08-15 17:49:05 +0000	[diff] [blame]	963	bool SIInstrInfo::canFoldOffset(unsigned OffsetSize, unsigned AS) {
				964	switch (AS) {
				965	case AMDGPUAS::GLOBAL_ADDRESS: {
				966	// MUBUF instructions a 12-bit offset in bytes.
				967	return isUInt<12>(OffsetSize);
				968	}
				969	case AMDGPUAS::CONSTANT_ADDRESS: {
				970	// SMRD instructions have an 8-bit offset in dwords.
				971	return (OffsetSize % 4 == 0) && isUInt<8>(OffsetSize / 4);
				972	}
				973	case AMDGPUAS::LOCAL_ADDRESS:
				974	case AMDGPUAS::REGION_ADDRESS: {
				975	// The single offset versions have a 16-bit offset in bytes.
				976	return isUInt<16>(OffsetSize);
				977	}
				978	case AMDGPUAS::PRIVATE_ADDRESS:
				979	// Indirect register addressing does not use any offsets.
				980	default:
				981	return 0;
				982	}
				983	}
				984
Tom Stellard	86d12eb	2014-08-01 00:32:28 +0000	[diff] [blame]	985	bool SIInstrInfo::hasVALU32BitEncoding(unsigned Opcode) const {
				986	return AMDGPU::getVOPe32(Opcode) != -1;
				987	}
				988
Tom Stellard	b4a313a	2014-08-01 00:32:39 +0000	[diff] [blame]	989	bool SIInstrInfo::hasModifiers(unsigned Opcode) const {
				990	// The src0_modifier operand is present on all instructions
				991	// that have modifiers.
				992
				993	return AMDGPU::getNamedOperandIdx(Opcode,
				994	AMDGPU::OpName::src0_modifiers) != -1;
				995	}
				996
Matt Arsenault	ace5b76	2014-10-17 18:00:43 +0000	[diff] [blame]	997	bool SIInstrInfo::hasModifiersSet(const MachineInstr &MI,
				998	unsigned OpName) const {
				999	const MachineOperand *Mods = getNamedOperand(MI, OpName);
				1000	return Mods && Mods->getImm();
				1001	}
				1002
Tom Stellard	73ae1cb	2014-09-23 21:26:25 +0000	[diff] [blame]	1003	bool SIInstrInfo::usesConstantBus(const MachineRegisterInfo &MRI,
				1004	const MachineOperand &MO) const {
				1005	// Literal constants use the constant bus.
				1006	if (isLiteralConstant(MO))
				1007	return true;
				1008
				1009	if (!MO.isReg() \|\| !MO.isUse())
				1010	return false;
				1011
				1012	if (TargetRegisterInfo::isVirtualRegister(MO.getReg()))
				1013	return RI.isSGPRClass(MRI.getRegClass(MO.getReg()));
				1014
				1015	// FLAT_SCR is just an SGPR pair.
				1016	if (!MO.isImplicit() && (MO.getReg() == AMDGPU::FLAT_SCR))
				1017	return true;
				1018
				1019	// EXEC register uses the constant bus.
				1020	if (!MO.isImplicit() && MO.getReg() == AMDGPU::EXEC)
				1021	return true;
				1022
				1023	// SGPRs use the constant bus
				1024	if (MO.getReg() == AMDGPU::M0 \|\| MO.getReg() == AMDGPU::VCC \|\|
				1025	(!MO.isImplicit() &&
				1026	(AMDGPU::SGPR_32RegClass.contains(MO.getReg()) \|\|
				1027	AMDGPU::SGPR_64RegClass.contains(MO.getReg())))) {
				1028	return true;
				1029	}
				1030
				1031	return false;
				1032	}
				1033
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	1034	bool SIInstrInfo::verifyInstruction(const MachineInstr *MI,
				1035	StringRef &ErrInfo) const {
				1036	uint16_t Opcode = MI->getOpcode();
Tom Stellard	73ae1cb	2014-09-23 21:26:25 +0000	[diff] [blame]	1037	const MachineRegisterInfo &MRI = MI->getParent()->getParent()->getRegInfo();
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	1038	int Src0Idx = AMDGPU::getNamedOperandIdx(Opcode, AMDGPU::OpName::src0);
				1039	int Src1Idx = AMDGPU::getNamedOperandIdx(Opcode, AMDGPU::OpName::src1);
				1040	int Src2Idx = AMDGPU::getNamedOperandIdx(Opcode, AMDGPU::OpName::src2);
				1041
Tom Stellard	ca700e4	2014-03-17 17:03:49 +0000	[diff] [blame]	1042	// Make sure the number of operands is correct.
				1043	const MCInstrDesc &Desc = get(Opcode);
				1044	if (!Desc.isVariadic() &&
				1045	Desc.getNumOperands() != MI->getNumExplicitOperands()) {
				1046	ErrInfo = "Instruction has wrong number of operands.";
				1047	return false;
				1048	}
				1049
				1050	// Make sure the register classes are correct
Tom Stellard	b4a313a	2014-08-01 00:32:39 +0000	[diff] [blame]	1051	for (int i = 0, e = Desc.getNumOperands(); i != e; ++i) {
Tom Stellard	ca700e4	2014-03-17 17:03:49 +0000	[diff] [blame]	1052	switch (Desc.OpInfo[i].OperandType) {
Tom Stellard	a305f93	2014-07-02 20:53:44 +0000	[diff] [blame]	1053	case MCOI::OPERAND_REGISTER: {
Tom Stellard	73ae1cb	2014-09-23 21:26:25 +0000	[diff] [blame]	1054	if ((MI->getOperand(i).isImm() \|\| MI->getOperand(i).isFPImm()) &&
				1055	!isImmOperandLegal(MI, i, MI->getOperand(i))) {
				1056	ErrInfo = "Illegal immediate value for operand.";
Tom Stellard	b4a313a	2014-08-01 00:32:39 +0000	[diff] [blame]	1057	return false;
				1058	}
Tom Stellard	a305f93	2014-07-02 20:53:44 +0000	[diff] [blame]	1059	}
Tom Stellard	ca700e4	2014-03-17 17:03:49 +0000	[diff] [blame]	1060	break;
				1061	case MCOI::OPERAND_IMMEDIATE:
Tom Stellard	b02094e	2014-07-21 15:45:01 +0000	[diff] [blame]	1062	// Check if this operand is an immediate.
				1063	// FrameIndex operands will be replaced by immediates, so they are
				1064	// allowed.
				1065	if (!MI->getOperand(i).isImm() && !MI->getOperand(i).isFPImm() &&
				1066	!MI->getOperand(i).isFI()) {
Tom Stellard	ca700e4	2014-03-17 17:03:49 +0000	[diff] [blame]	1067	ErrInfo = "Expected immediate, but got non-immediate";
				1068	return false;
				1069	}
				1070	// Fall-through
				1071	default:
				1072	continue;
				1073	}
				1074
				1075	if (!MI->getOperand(i).isReg())
				1076	continue;
				1077
				1078	int RegClass = Desc.OpInfo[i].RegClass;
				1079	if (RegClass != -1) {
				1080	unsigned Reg = MI->getOperand(i).getReg();
				1081	if (TargetRegisterInfo::isVirtualRegister(Reg))
				1082	continue;
				1083
				1084	const TargetRegisterClass *RC = RI.getRegClass(RegClass);
				1085	if (!RC->contains(Reg)) {
				1086	ErrInfo = "Operand has incorrect register class.";
				1087	return false;
				1088	}
				1089	}
				1090	}
				1091
				1092
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	1093	// Verify VOP*
				1094	if (isVOP1(Opcode) \|\| isVOP2(Opcode) \|\| isVOP3(Opcode) \|\| isVOPC(Opcode)) {
				1095	unsigned ConstantBusCount = 0;
				1096	unsigned SGPRUsed = AMDGPU::NoRegister;
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	1097	for (int i = 0, e = MI->getNumOperands(); i != e; ++i) {
				1098	const MachineOperand &MO = MI->getOperand(i);
Tom Stellard	73ae1cb	2014-09-23 21:26:25 +0000	[diff] [blame]	1099	if (usesConstantBus(MRI, MO)) {
				1100	if (MO.isReg()) {
				1101	if (MO.getReg() != SGPRUsed)
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	1102	++ConstantBusCount;
Tom Stellard	73ae1cb	2014-09-23 21:26:25 +0000	[diff] [blame]	1103	SGPRUsed = MO.getReg();
				1104	} else {
				1105	++ConstantBusCount;
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	1106	}
				1107	}
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	1108	}
				1109	if (ConstantBusCount > 1) {
				1110	ErrInfo = "VOP* instruction uses the constant bus more than once";
				1111	return false;
				1112	}
				1113	}
				1114
				1115	// Verify SRC1 for VOP2 and VOPC
				1116	if (Src1Idx != -1 && (isVOP2(Opcode) \|\| isVOPC(Opcode))) {
				1117	const MachineOperand &Src1 = MI->getOperand(Src1Idx);
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1118	if (Src1.isImm() \|\| Src1.isFPImm()) {
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	1119	ErrInfo = "VOP[2C] src1 cannot be an immediate.";
				1120	return false;
				1121	}
				1122	}
				1123
				1124	// Verify VOP3
				1125	if (isVOP3(Opcode)) {
				1126	if (Src0Idx != -1 && isLiteralConstant(MI->getOperand(Src0Idx))) {
				1127	ErrInfo = "VOP3 src0 cannot be a literal constant.";
				1128	return false;
				1129	}
				1130	if (Src1Idx != -1 && isLiteralConstant(MI->getOperand(Src1Idx))) {
				1131	ErrInfo = "VOP3 src1 cannot be a literal constant.";
				1132	return false;
				1133	}
				1134	if (Src2Idx != -1 && isLiteralConstant(MI->getOperand(Src2Idx))) {
				1135	ErrInfo = "VOP3 src2 cannot be a literal constant.";
				1136	return false;
				1137	}
				1138	}
Matt Arsenault	becb140	2014-06-23 18:28:31 +0000	[diff] [blame]	1139
				1140	// Verify misc. restrictions on specific instructions.
				1141	if (Desc.getOpcode() == AMDGPU::V_DIV_SCALE_F32 \|\|
				1142	Desc.getOpcode() == AMDGPU::V_DIV_SCALE_F64) {
Matt Arsenault	262407b	2014-09-24 02:17:09 +0000	[diff] [blame]	1143	const MachineOperand &Src0 = MI->getOperand(Src0Idx);
				1144	const MachineOperand &Src1 = MI->getOperand(Src1Idx);
				1145	const MachineOperand &Src2 = MI->getOperand(Src2Idx);
Matt Arsenault	becb140	2014-06-23 18:28:31 +0000	[diff] [blame]	1146	if (Src0.isReg() && Src1.isReg() && Src2.isReg()) {
				1147	if (!compareMachineOp(Src0, Src1) &&
				1148	!compareMachineOp(Src0, Src2)) {
				1149	ErrInfo = "v_div_scale_{f32\|f64} require src0 = src1 or src2";
				1150	return false;
				1151	}
				1152	}
				1153	}
				1154
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	1155	return true;
				1156	}
				1157
Matt Arsenault	f14032a	2013-11-15 22:02:28 +0000	[diff] [blame]	1158	unsigned SIInstrInfo::getVALUOp(const MachineInstr &MI) {
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1159	switch (MI.getOpcode()) {
				1160	default: return AMDGPU::INSTRUCTION_LIST_END;
				1161	case AMDGPU::REG_SEQUENCE: return AMDGPU::REG_SEQUENCE;
				1162	case AMDGPU::COPY: return AMDGPU::COPY;
				1163	case AMDGPU::PHI: return AMDGPU::PHI;
Tom Stellard	204e61b	2014-04-07 19:45:45 +0000	[diff] [blame]	1164	case AMDGPU::INSERT_SUBREG: return AMDGPU::INSERT_SUBREG;
Tom Stellard	e038720	2014-03-21 15:51:54 +0000	[diff] [blame]	1165	case AMDGPU::S_MOV_B32:
				1166	return MI.getOperand(1).isReg() ?
Tom Stellard	8c12fd9	2014-03-24 16:12:34 +0000	[diff] [blame]	1167	AMDGPU::COPY : AMDGPU::V_MOV_B32_e32;
Tom Stellard	80942a1	2014-09-05 14:07:59 +0000	[diff] [blame]	1168	case AMDGPU::S_ADD_I32:
				1169	case AMDGPU::S_ADD_U32: return AMDGPU::V_ADD_I32_e32;
Matt Arsenault	43b8e4e	2013-11-18 20:09:29 +0000	[diff] [blame]	1170	case AMDGPU::S_ADDC_U32: return AMDGPU::V_ADDC_U32_e32;
Tom Stellard	80942a1	2014-09-05 14:07:59 +0000	[diff] [blame]	1171	case AMDGPU::S_SUB_I32:
				1172	case AMDGPU::S_SUB_U32: return AMDGPU::V_SUB_I32_e32;
Matt Arsenault	43b8e4e	2013-11-18 20:09:29 +0000	[diff] [blame]	1173	case AMDGPU::S_SUBB_U32: return AMDGPU::V_SUBB_U32_e32;
Matt Arsenault	869cd07	2014-09-03 23:24:35 +0000	[diff] [blame]	1174	case AMDGPU::S_MUL_I32: return AMDGPU::V_MUL_LO_I32;
Matt Arsenault	8e2581b	2014-03-21 18:01:18 +0000	[diff] [blame]	1175	case AMDGPU::S_AND_B32: return AMDGPU::V_AND_B32_e32;
				1176	case AMDGPU::S_OR_B32: return AMDGPU::V_OR_B32_e32;
				1177	case AMDGPU::S_XOR_B32: return AMDGPU::V_XOR_B32_e32;
				1178	case AMDGPU::S_MIN_I32: return AMDGPU::V_MIN_I32_e32;
				1179	case AMDGPU::S_MIN_U32: return AMDGPU::V_MIN_U32_e32;
				1180	case AMDGPU::S_MAX_I32: return AMDGPU::V_MAX_I32_e32;
				1181	case AMDGPU::S_MAX_U32: return AMDGPU::V_MAX_U32_e32;
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1182	case AMDGPU::S_ASHR_I32: return AMDGPU::V_ASHR_I32_e32;
				1183	case AMDGPU::S_ASHR_I64: return AMDGPU::V_ASHR_I64;
				1184	case AMDGPU::S_LSHL_B32: return AMDGPU::V_LSHL_B32_e32;
				1185	case AMDGPU::S_LSHL_B64: return AMDGPU::V_LSHL_B64;
				1186	case AMDGPU::S_LSHR_B32: return AMDGPU::V_LSHR_B32_e32;
				1187	case AMDGPU::S_LSHR_B64: return AMDGPU::V_LSHR_B64;
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	1188	case AMDGPU::S_SEXT_I32_I8: return AMDGPU::V_BFE_I32;
				1189	case AMDGPU::S_SEXT_I32_I16: return AMDGPU::V_BFE_I32;
Matt Arsenault	78b8670	2014-04-18 05:19:26 +0000	[diff] [blame]	1190	case AMDGPU::S_BFE_U32: return AMDGPU::V_BFE_U32;
				1191	case AMDGPU::S_BFE_I32: return AMDGPU::V_BFE_I32;
Matt Arsenault	43160e7	2014-06-18 17:13:57 +0000	[diff] [blame]	1192	case AMDGPU::S_BREV_B32: return AMDGPU::V_BFREV_B32_e32;
Matt Arsenault	2c33562	2014-04-09 07:16:16 +0000	[diff] [blame]	1193	case AMDGPU::S_NOT_B32: return AMDGPU::V_NOT_B32_e32;
Matt Arsenault	689f325	2014-06-09 16:36:31 +0000	[diff] [blame]	1194	case AMDGPU::S_NOT_B64: return AMDGPU::V_NOT_B32_e32;
Matt Arsenault	0cb92e1	2014-04-11 19:25:18 +0000	[diff] [blame]	1195	case AMDGPU::S_CMP_EQ_I32: return AMDGPU::V_CMP_EQ_I32_e32;
				1196	case AMDGPU::S_CMP_LG_I32: return AMDGPU::V_CMP_NE_I32_e32;
				1197	case AMDGPU::S_CMP_GT_I32: return AMDGPU::V_CMP_GT_I32_e32;
				1198	case AMDGPU::S_CMP_GE_I32: return AMDGPU::V_CMP_GE_I32_e32;
				1199	case AMDGPU::S_CMP_LT_I32: return AMDGPU::V_CMP_LT_I32_e32;
				1200	case AMDGPU::S_CMP_LE_I32: return AMDGPU::V_CMP_LE_I32_e32;
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1201	case AMDGPU::S_LOAD_DWORD_IMM:
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1202	case AMDGPU::S_LOAD_DWORD_SGPR: return AMDGPU::BUFFER_LOAD_DWORD_ADDR64;
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1203	case AMDGPU::S_LOAD_DWORDX2_IMM:
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1204	case AMDGPU::S_LOAD_DWORDX2_SGPR: return AMDGPU::BUFFER_LOAD_DWORDX2_ADDR64;
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1205	case AMDGPU::S_LOAD_DWORDX4_IMM:
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1206	case AMDGPU::S_LOAD_DWORDX4_SGPR: return AMDGPU::BUFFER_LOAD_DWORDX4_ADDR64;
Matt Arsenault	b5b5110	2014-06-10 19:18:21 +0000	[diff] [blame]	1207	case AMDGPU::S_BCNT1_I32_B32: return AMDGPU::V_BCNT_U32_B32_e32;
Matt Arsenault	295b86e	2014-06-17 17:36:27 +0000	[diff] [blame]	1208	case AMDGPU::S_FF1_I32_B32: return AMDGPU::V_FFBL_B32_e32;
Matt Arsenault	8579601	2014-06-17 17:36:24 +0000	[diff] [blame]	1209	case AMDGPU::S_FLBIT_I32_B32: return AMDGPU::V_FFBH_U32_e32;
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1210	}
				1211	}
				1212
				1213	bool SIInstrInfo::isSALUOpSupportedOnVALU(const MachineInstr &MI) const {
				1214	return getVALUOp(MI) != AMDGPU::INSTRUCTION_LIST_END;
				1215	}
				1216
				1217	const TargetRegisterClass *SIInstrInfo::getOpRegClass(const MachineInstr &MI,
				1218	unsigned OpNo) const {
				1219	const MachineRegisterInfo &MRI = MI.getParent()->getParent()->getRegInfo();
				1220	const MCInstrDesc &Desc = get(MI.getOpcode());
				1221	if (MI.isVariadic() \|\| OpNo >= Desc.getNumOperands() \|\|
				1222	Desc.OpInfo[OpNo].RegClass == -1)
				1223	return MRI.getRegClass(MI.getOperand(OpNo).getReg());
				1224
				1225	unsigned RCID = Desc.OpInfo[OpNo].RegClass;
				1226	return RI.getRegClass(RCID);
				1227	}
				1228
				1229	bool SIInstrInfo::canReadVGPR(const MachineInstr &MI, unsigned OpNo) const {
				1230	switch (MI.getOpcode()) {
				1231	case AMDGPU::COPY:
				1232	case AMDGPU::REG_SEQUENCE:
Tom Stellard	4f3b04d	2014-04-17 21:00:07 +0000	[diff] [blame]	1233	case AMDGPU::PHI:
Tom Stellard	a568738	2014-05-15 14:41:55 +0000	[diff] [blame]	1234	case AMDGPU::INSERT_SUBREG:
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1235	return RI.hasVGPRs(getOpRegClass(MI, 0));
				1236	default:
				1237	return RI.hasVGPRs(getOpRegClass(MI, OpNo));
				1238	}
				1239	}
				1240
				1241	void SIInstrInfo::legalizeOpWithMove(MachineInstr *MI, unsigned OpIdx) const {
				1242	MachineBasicBlock::iterator I = MI;
Matt Arsenault	3f3a275	2014-10-13 15:47:59 +0000	[diff] [blame]	1243	MachineBasicBlock *MBB = MI->getParent();
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1244	MachineOperand &MO = MI->getOperand(OpIdx);
Matt Arsenault	3f3a275	2014-10-13 15:47:59 +0000	[diff] [blame]	1245	MachineRegisterInfo &MRI = MBB->getParent()->getRegInfo();
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1246	unsigned RCID = get(MI->getOpcode()).OpInfo[OpIdx].RegClass;
				1247	const TargetRegisterClass *RC = RI.getRegClass(RCID);
				1248	unsigned Opcode = AMDGPU::V_MOV_B32_e32;
Matt Arsenault	3f3a275	2014-10-13 15:47:59 +0000	[diff] [blame]	1249	if (MO.isReg())
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1250	Opcode = AMDGPU::COPY;
Matt Arsenault	3f3a275	2014-10-13 15:47:59 +0000	[diff] [blame]	1251	else if (RI.isSGPRClass(RC))
Matt Arsenault	671a005	2013-11-14 10:08:50 +0000	[diff] [blame]	1252	Opcode = AMDGPU::S_MOV_B32;
Matt Arsenault	3f3a275	2014-10-13 15:47:59 +0000	[diff] [blame]	1253
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1254
Matt Arsenault	3a4d86a	2013-11-18 20:09:55 +0000	[diff] [blame]	1255	const TargetRegisterClass *VRC = RI.getEquivalentVGPRClass(RC);
Matt Arsenault	3f3a275	2014-10-13 15:47:59 +0000	[diff] [blame]	1256	if (RI.getCommonSubClass(&AMDGPU::VReg_64RegClass, VRC))
Tom Stellard	0c93c9e	2014-09-05 14:08:01 +0000	[diff] [blame]	1257	VRC = &AMDGPU::VReg_64RegClass;
Matt Arsenault	3f3a275	2014-10-13 15:47:59 +0000	[diff] [blame]	1258	else
Tom Stellard	0c93c9e	2014-09-05 14:08:01 +0000	[diff] [blame]	1259	VRC = &AMDGPU::VReg_32RegClass;
Matt Arsenault	3f3a275	2014-10-13 15:47:59 +0000	[diff] [blame]	1260
Matt Arsenault	3a4d86a	2013-11-18 20:09:55 +0000	[diff] [blame]	1261	unsigned Reg = MRI.createVirtualRegister(VRC);
Matt Arsenault	3f3a275	2014-10-13 15:47:59 +0000	[diff] [blame]	1262	DebugLoc DL = MBB->findDebugLoc(I);
				1263	BuildMI(*MI->getParent(), I, DL, get(Opcode), Reg)
				1264	.addOperand(MO);
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1265	MO.ChangeToRegister(Reg, false);
				1266	}
				1267
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1268	unsigned SIInstrInfo::buildExtractSubReg(MachineBasicBlock::iterator MI,
				1269	MachineRegisterInfo &MRI,
				1270	MachineOperand &SuperReg,
				1271	const TargetRegisterClass *SuperRC,
				1272	unsigned SubIdx,
				1273	const TargetRegisterClass *SubRC)
				1274	const {
				1275	assert(SuperReg.isReg());
				1276
				1277	unsigned NewSuperReg = MRI.createVirtualRegister(SuperRC);
				1278	unsigned SubReg = MRI.createVirtualRegister(SubRC);
				1279
				1280	// Just in case the super register is itself a sub-register, copy it to a new
Matt Arsenault	08d8494	2014-06-03 23:06:13 +0000	[diff] [blame]	1281	// value so we don't need to worry about merging its subreg index with the
				1282	// SubIdx passed to this function. The register coalescer should be able to
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1283	// eliminate this extra copy.
Matt Arsenault	7480a0e	2014-11-17 21:11:37 +0000	[diff] [blame^]	1284	MachineBasicBlock *MBB = MI->getParent();
				1285	DebugLoc DL = MI->getDebugLoc();
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1286
Matt Arsenault	7480a0e	2014-11-17 21:11:37 +0000	[diff] [blame^]	1287	BuildMI(*MBB, MI, DL, get(TargetOpcode::COPY), NewSuperReg)
				1288	.addReg(SuperReg.getReg(), 0, SuperReg.getSubReg());
				1289
				1290	BuildMI(*MBB, MI, DL, get(TargetOpcode::COPY), SubReg)
				1291	.addReg(NewSuperReg, 0, SubIdx);
				1292
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1293	return SubReg;
				1294	}
				1295
Matt Arsenault	248b7b6	2014-03-24 20:08:09 +0000	[diff] [blame]	1296	MachineOperand SIInstrInfo::buildExtractSubRegOrImm(
				1297	MachineBasicBlock::iterator MII,
				1298	MachineRegisterInfo &MRI,
				1299	MachineOperand &Op,
				1300	const TargetRegisterClass *SuperRC,
				1301	unsigned SubIdx,
				1302	const TargetRegisterClass *SubRC) const {
				1303	if (Op.isImm()) {
				1304	// XXX - Is there a better way to do this?
				1305	if (SubIdx == AMDGPU::sub0)
				1306	return MachineOperand::CreateImm(Op.getImm() & 0xFFFFFFFF);
				1307	if (SubIdx == AMDGPU::sub1)
				1308	return MachineOperand::CreateImm(Op.getImm() >> 32);
				1309
				1310	llvm_unreachable("Unhandled register index for immediate");
				1311	}
				1312
				1313	unsigned SubReg = buildExtractSubReg(MII, MRI, Op, SuperRC,
				1314	SubIdx, SubRC);
				1315	return MachineOperand::CreateReg(SubReg, false);
				1316	}
				1317
Matt Arsenault	bd99580	2014-03-24 18:26:52 +0000	[diff] [blame]	1318	unsigned SIInstrInfo::split64BitImm(SmallVectorImpl<MachineInstr *> &Worklist,
				1319	MachineBasicBlock::iterator MI,
				1320	MachineRegisterInfo &MRI,
				1321	const TargetRegisterClass *RC,
				1322	const MachineOperand &Op) const {
				1323	MachineBasicBlock *MBB = MI->getParent();
				1324	DebugLoc DL = MI->getDebugLoc();
				1325	unsigned LoDst = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
				1326	unsigned HiDst = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
				1327	unsigned Dst = MRI.createVirtualRegister(RC);
				1328
				1329	MachineInstr Lo = BuildMI(MBB, MI, DL, get(AMDGPU::S_MOV_B32),
				1330	LoDst)
				1331	.addImm(Op.getImm() & 0xFFFFFFFF);
				1332	MachineInstr Hi = BuildMI(MBB, MI, DL, get(AMDGPU::S_MOV_B32),
				1333	HiDst)
				1334	.addImm(Op.getImm() >> 32);
				1335
				1336	BuildMI(*MBB, MI, DL, get(TargetOpcode::REG_SEQUENCE), Dst)
				1337	.addReg(LoDst)
				1338	.addImm(AMDGPU::sub0)
				1339	.addReg(HiDst)
				1340	.addImm(AMDGPU::sub1);
				1341
				1342	Worklist.push_back(Lo);
				1343	Worklist.push_back(Hi);
				1344
				1345	return Dst;
				1346	}
				1347
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1348	bool SIInstrInfo::isOperandLegal(const MachineInstr *MI, unsigned OpIdx,
				1349	const MachineOperand *MO) const {
				1350	const MachineRegisterInfo &MRI = MI->getParent()->getParent()->getRegInfo();
				1351	const MCInstrDesc &InstDesc = get(MI->getOpcode());
				1352	const MCOperandInfo &OpInfo = InstDesc.OpInfo[OpIdx];
				1353	const TargetRegisterClass *DefinedRC =
				1354	OpInfo.RegClass != -1 ? RI.getRegClass(OpInfo.RegClass) : nullptr;
				1355	if (!MO)
				1356	MO = &MI->getOperand(OpIdx);
				1357
Tom Stellard	73ae1cb	2014-09-23 21:26:25 +0000	[diff] [blame]	1358	if (usesConstantBus(MRI, *MO)) {
Aaron Ballman	f086a14	2014-09-24 13:54:56 +0000	[diff] [blame]	1359	unsigned SGPRUsed =
				1360	MO->isReg() ? MO->getReg() : (unsigned)AMDGPU::NoRegister;
Tom Stellard	73ae1cb	2014-09-23 21:26:25 +0000	[diff] [blame]	1361	for (unsigned i = 0, e = MI->getNumOperands(); i != e; ++i) {
				1362	if (i == OpIdx)
				1363	continue;
				1364	if (usesConstantBus(MRI, MI->getOperand(i)) &&
				1365	MI->getOperand(i).isReg() && MI->getOperand(i).getReg() != SGPRUsed) {
				1366	return false;
				1367	}
				1368	}
				1369	}
				1370
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1371	if (MO->isReg()) {
				1372	assert(DefinedRC);
				1373	const TargetRegisterClass *RC = MRI.getRegClass(MO->getReg());
				1374	return RI.getCommonSubClass(RC, RI.getRegClass(OpInfo.RegClass));
				1375	}
				1376
				1377
				1378	// Handle non-register types that are treated like immediates.
				1379	assert(MO->isImm() \|\| MO->isFPImm() \|\| MO->isTargetIndex() \|\| MO->isFI());
				1380
Matt Arsenault	4364fef	2014-09-23 18:30:57 +0000	[diff] [blame]	1381	if (!DefinedRC) {
				1382	// This operand expects an immediate.
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1383	return true;
Matt Arsenault	4364fef	2014-09-23 18:30:57 +0000	[diff] [blame]	1384	}
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1385
Tom Stellard	73ae1cb	2014-09-23 21:26:25 +0000	[diff] [blame]	1386	return isImmOperandLegal(MI, OpIdx, *MO);
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1387	}
				1388
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1389	void SIInstrInfo::legalizeOperands(MachineInstr *MI) const {
				1390	MachineRegisterInfo &MRI = MI->getParent()->getParent()->getRegInfo();
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1391
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1392	int Src0Idx = AMDGPU::getNamedOperandIdx(MI->getOpcode(),
				1393	AMDGPU::OpName::src0);
				1394	int Src1Idx = AMDGPU::getNamedOperandIdx(MI->getOpcode(),
				1395	AMDGPU::OpName::src1);
				1396	int Src2Idx = AMDGPU::getNamedOperandIdx(MI->getOpcode(),
				1397	AMDGPU::OpName::src2);
				1398
				1399	// Legalize VOP2
				1400	if (isVOP2(MI->getOpcode()) && Src1Idx != -1) {
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1401	// Legalize src0
				1402	if (!isOperandLegal(MI, Src0Idx))
Matt Arsenault	08f7e37	2013-11-18 20:09:50 +0000	[diff] [blame]	1403	legalizeOpWithMove(MI, Src0Idx);
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1404
				1405	// Legalize src1
				1406	if (isOperandLegal(MI, Src1Idx))
Matt Arsenault	08f7e37	2013-11-18 20:09:50 +0000	[diff] [blame]	1407	return;
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1408
				1409	// Usually src0 of VOP2 instructions allow more types of inputs
				1410	// than src1, so try to commute the instruction to decrease our
				1411	// chances of having to insert a MOV instruction to legalize src1.
				1412	if (MI->isCommutable()) {
				1413	if (commuteInstruction(MI))
				1414	// If we are successful in commuting, then we know MI is legal, so
				1415	// we are done.
				1416	return;
Matt Arsenault	08f7e37	2013-11-18 20:09:50 +0000	[diff] [blame]	1417	}
				1418
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1419	legalizeOpWithMove(MI, Src1Idx);
				1420	return;
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1421	}
				1422
Matt Arsenault	08f7e37	2013-11-18 20:09:50 +0000	[diff] [blame]	1423	// XXX - Do any VOP3 instructions read VCC?
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1424	// Legalize VOP3
				1425	if (isVOP3(MI->getOpcode())) {
Matt Arsenault	5885bef	2014-09-26 17:54:52 +0000	[diff] [blame]	1426	int VOP3Idx[3] = { Src0Idx, Src1Idx, Src2Idx };
				1427
Matt Arsenault	6a0919f	2014-09-26 17:55:03 +0000	[diff] [blame]	1428	// Find the one SGPR operand we are allowed to use.
Matt Arsenault	ee522bf	2014-09-26 17:55:06 +0000	[diff] [blame]	1429	unsigned SGPRReg = findUsedSGPR(MI, VOP3Idx);
Matt Arsenault	5885bef	2014-09-26 17:54:52 +0000	[diff] [blame]	1430
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1431	for (unsigned i = 0; i < 3; ++i) {
				1432	int Idx = VOP3Idx[i];
				1433	if (Idx == -1)
Matt Arsenault	2dd3129	2014-09-26 17:55:14 +0000	[diff] [blame]	1434	break;
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1435	MachineOperand &MO = MI->getOperand(Idx);
				1436
				1437	if (MO.isReg()) {
				1438	if (!RI.isSGPRClass(MRI.getRegClass(MO.getReg())))
				1439	continue; // VGPRs are legal
				1440
Matt Arsenault	f0b1e3a	2013-11-18 20:09:21 +0000	[diff] [blame]	1441	assert(MO.getReg() != AMDGPU::SCC && "SCC operand to VOP3 instruction");
				1442
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1443	if (SGPRReg == AMDGPU::NoRegister \|\| SGPRReg == MO.getReg()) {
				1444	SGPRReg = MO.getReg();
				1445	// We can use one SGPR in each VOP3 instruction.
				1446	continue;
				1447	}
				1448	} else if (!isLiteralConstant(MO)) {
				1449	// If it is not a register and not a literal constant, then it must be
				1450	// an inline constant which is always legal.
				1451	continue;
				1452	}
				1453	// If we make it this far, then the operand is not legal and we must
				1454	// legalize it.
				1455	legalizeOpWithMove(MI, Idx);
				1456	}
				1457	}
				1458
Tom Stellard	4f3b04d	2014-04-17 21:00:07 +0000	[diff] [blame]	1459	// Legalize REG_SEQUENCE and PHI
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1460	// The register class of the operands much be the same type as the register
				1461	// class of the output.
Tom Stellard	4f3b04d	2014-04-17 21:00:07 +0000	[diff] [blame]	1462	if (MI->getOpcode() == AMDGPU::REG_SEQUENCE \|\|
				1463	MI->getOpcode() == AMDGPU::PHI) {
Craig Topper	062a2ba	2014-04-25 05:30:21 +0000	[diff] [blame]	1464	const TargetRegisterClass RC = nullptr, SRC = nullptr, *VRC = nullptr;
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1465	for (unsigned i = 1, e = MI->getNumOperands(); i != e; i+=2) {
				1466	if (!MI->getOperand(i).isReg() \|\|
				1467	!TargetRegisterInfo::isVirtualRegister(MI->getOperand(i).getReg()))
				1468	continue;
				1469	const TargetRegisterClass *OpRC =
				1470	MRI.getRegClass(MI->getOperand(i).getReg());
				1471	if (RI.hasVGPRs(OpRC)) {
				1472	VRC = OpRC;
				1473	} else {
				1474	SRC = OpRC;
				1475	}
				1476	}
				1477
				1478	// If any of the operands are VGPR registers, then they all most be
				1479	// otherwise we will create illegal VGPR->SGPR copies when legalizing
				1480	// them.
				1481	if (VRC \|\| !RI.isSGPRClass(getOpRegClass(*MI, 0))) {
				1482	if (!VRC) {
				1483	assert(SRC);
				1484	VRC = RI.getEquivalentVGPRClass(SRC);
				1485	}
				1486	RC = VRC;
				1487	} else {
				1488	RC = SRC;
				1489	}
				1490
				1491	// Update all the operands so they have the same type.
				1492	for (unsigned i = 1, e = MI->getNumOperands(); i != e; i+=2) {
				1493	if (!MI->getOperand(i).isReg() \|\|
				1494	!TargetRegisterInfo::isVirtualRegister(MI->getOperand(i).getReg()))
				1495	continue;
				1496	unsigned DstReg = MRI.createVirtualRegister(RC);
Tom Stellard	4f3b04d	2014-04-17 21:00:07 +0000	[diff] [blame]	1497	MachineBasicBlock *InsertBB;
				1498	MachineBasicBlock::iterator Insert;
				1499	if (MI->getOpcode() == AMDGPU::REG_SEQUENCE) {
				1500	InsertBB = MI->getParent();
				1501	Insert = MI;
				1502	} else {
				1503	// MI is a PHI instruction.
				1504	InsertBB = MI->getOperand(i + 1).getMBB();
				1505	Insert = InsertBB->getFirstTerminator();
				1506	}
				1507	BuildMI(*InsertBB, Insert, MI->getDebugLoc(),
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1508	get(AMDGPU::COPY), DstReg)
				1509	.addOperand(MI->getOperand(i));
				1510	MI->getOperand(i).setReg(DstReg);
				1511	}
				1512	}
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1513
Tom Stellard	a568738	2014-05-15 14:41:55 +0000	[diff] [blame]	1514	// Legalize INSERT_SUBREG
				1515	// src0 must have the same register class as dst
				1516	if (MI->getOpcode() == AMDGPU::INSERT_SUBREG) {
				1517	unsigned Dst = MI->getOperand(0).getReg();
				1518	unsigned Src0 = MI->getOperand(1).getReg();
				1519	const TargetRegisterClass *DstRC = MRI.getRegClass(Dst);
				1520	const TargetRegisterClass *Src0RC = MRI.getRegClass(Src0);
				1521	if (DstRC != Src0RC) {
				1522	MachineBasicBlock &MBB = *MI->getParent();
				1523	unsigned NewSrc0 = MRI.createVirtualRegister(DstRC);
				1524	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::COPY), NewSrc0)
				1525	.addReg(Src0);
				1526	MI->getOperand(1).setReg(NewSrc0);
				1527	}
				1528	return;
				1529	}
				1530
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1531	// Legalize MUBUF* instructions
				1532	// FIXME: If we start using the non-addr64 instructions for compute, we
				1533	// may need to legalize them here.
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1534	int SRsrcIdx =
				1535	AMDGPU::getNamedOperandIdx(MI->getOpcode(), AMDGPU::OpName::srsrc);
				1536	if (SRsrcIdx != -1) {
				1537	// We have an MUBUF instruction
				1538	MachineOperand *SRsrc = &MI->getOperand(SRsrcIdx);
				1539	unsigned SRsrcRC = get(MI->getOpcode()).OpInfo[SRsrcIdx].RegClass;
				1540	if (RI.getCommonSubClass(MRI.getRegClass(SRsrc->getReg()),
				1541	RI.getRegClass(SRsrcRC))) {
				1542	// The operands are legal.
				1543	// FIXME: We may need to legalize operands besided srsrc.
				1544	return;
				1545	}
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1546
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1547	MachineBasicBlock &MBB = *MI->getParent();
				1548	// Extract the the ptr from the resource descriptor.
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1549
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1550	// SRsrcPtrLo = srsrc:sub0
				1551	unsigned SRsrcPtrLo = buildExtractSubReg(MI, MRI, *SRsrc,
				1552	&AMDGPU::VReg_128RegClass, AMDGPU::sub0, &AMDGPU::VReg_32RegClass);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1553
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1554	// SRsrcPtrHi = srsrc:sub1
				1555	unsigned SRsrcPtrHi = buildExtractSubReg(MI, MRI, *SRsrc,
				1556	&AMDGPU::VReg_128RegClass, AMDGPU::sub1, &AMDGPU::VReg_32RegClass);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1557
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1558	// Create an empty resource descriptor
				1559	unsigned Zero64 = MRI.createVirtualRegister(&AMDGPU::SReg_64RegClass);
				1560	unsigned SRsrcFormatLo = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
				1561	unsigned SRsrcFormatHi = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
				1562	unsigned NewSRsrc = MRI.createVirtualRegister(&AMDGPU::SReg_128RegClass);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1563
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1564	// Zero64 = 0
				1565	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B64),
				1566	Zero64)
				1567	.addImm(0);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1568
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1569	// SRsrcFormatLo = RSRC_DATA_FORMAT{31-0}
				1570	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32),
				1571	SRsrcFormatLo)
				1572	.addImm(AMDGPU::RSRC_DATA_FORMAT & 0xFFFFFFFF);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1573
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1574	// SRsrcFormatHi = RSRC_DATA_FORMAT{63-32}
				1575	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32),
				1576	SRsrcFormatHi)
				1577	.addImm(AMDGPU::RSRC_DATA_FORMAT >> 32);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1578
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1579	// NewSRsrc = {Zero64, SRsrcFormat}
				1580	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::REG_SEQUENCE),
				1581	NewSRsrc)
				1582	.addReg(Zero64)
				1583	.addImm(AMDGPU::sub0_sub1)
				1584	.addReg(SRsrcFormatLo)
				1585	.addImm(AMDGPU::sub2)
				1586	.addReg(SRsrcFormatHi)
				1587	.addImm(AMDGPU::sub3);
				1588
				1589	MachineOperand VAddr = getNamedOperand(MI, AMDGPU::OpName::vaddr);
				1590	unsigned NewVAddr = MRI.createVirtualRegister(&AMDGPU::VReg_64RegClass);
				1591	unsigned NewVAddrLo;
				1592	unsigned NewVAddrHi;
				1593	if (VAddr) {
				1594	// This is already an ADDR64 instruction so we need to add the pointer
				1595	// extracted from the resource descriptor to the current value of VAddr.
				1596	NewVAddrLo = MRI.createVirtualRegister(&AMDGPU::VReg_32RegClass);
				1597	NewVAddrHi = MRI.createVirtualRegister(&AMDGPU::VReg_32RegClass);
				1598
				1599	// NewVaddrLo = SRsrcPtrLo + VAddr:sub0
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1600	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::V_ADD_I32_e32),
				1601	NewVAddrLo)
				1602	.addReg(SRsrcPtrLo)
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1603	.addReg(VAddr->getReg(), 0, AMDGPU::sub0)
				1604	.addReg(AMDGPU::VCC, RegState::ImplicitDefine);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1605
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1606	// NewVaddrHi = SRsrcPtrHi + VAddr:sub1
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1607	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::V_ADDC_U32_e32),
				1608	NewVAddrHi)
				1609	.addReg(SRsrcPtrHi)
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1610	.addReg(VAddr->getReg(), 0, AMDGPU::sub1)
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1611	.addReg(AMDGPU::VCC, RegState::ImplicitDefine)
				1612	.addReg(AMDGPU::VCC, RegState::Implicit);
				1613
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1614	} else {
				1615	// This instructions is the _OFFSET variant, so we need to convert it to
				1616	// ADDR64.
				1617	MachineOperand VData = getNamedOperand(MI, AMDGPU::OpName::vdata);
				1618	MachineOperand Offset = getNamedOperand(MI, AMDGPU::OpName::offset);
				1619	MachineOperand SOffset = getNamedOperand(MI, AMDGPU::OpName::soffset);
				1620	assert(SOffset->isImm() && SOffset->getImm() == 0 && "Legalizing MUBUF "
				1621	"with non-zero soffset is not implemented");
NAKAMURA Takumi	5f79ee5	2014-08-11 23:03:38 +0000	[diff] [blame]	1622	(void)SOffset;
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1623
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1624	// Create the new instruction.
				1625	unsigned Addr64Opcode = AMDGPU::getAddr64Inst(MI->getOpcode());
				1626	MachineInstr *Addr64 =
				1627	BuildMI(MBB, MI, MI->getDebugLoc(), get(Addr64Opcode))
				1628	.addOperand(*VData)
				1629	.addOperand(*SRsrc)
				1630	.addReg(AMDGPU::NoRegister) // Dummy value for vaddr.
				1631	// This will be replaced later
				1632	// with the new value of vaddr.
				1633	.addOperand(*Offset);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1634
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1635	MI->removeFromParent();
				1636	MI = Addr64;
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1637
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1638	NewVAddrLo = SRsrcPtrLo;
				1639	NewVAddrHi = SRsrcPtrHi;
				1640	VAddr = getNamedOperand(*MI, AMDGPU::OpName::vaddr);
				1641	SRsrc = getNamedOperand(*MI, AMDGPU::OpName::srsrc);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1642	}
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1643
				1644	// NewVaddr = {NewVaddrHi, NewVaddrLo}
				1645	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::REG_SEQUENCE),
				1646	NewVAddr)
				1647	.addReg(NewVAddrLo)
				1648	.addImm(AMDGPU::sub0)
				1649	.addReg(NewVAddrHi)
				1650	.addImm(AMDGPU::sub1);
				1651
				1652
				1653	// Update the instruction to use NewVaddr
				1654	VAddr->setReg(NewVAddr);
				1655	// Update the instruction to use NewSRsrc
				1656	SRsrc->setReg(NewSRsrc);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1657	}
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1658	}
				1659
Tom Stellard	745f2ed	2014-08-21 20:41:00 +0000	[diff] [blame]	1660	void SIInstrInfo::splitSMRD(MachineInstr *MI,
				1661	const TargetRegisterClass *HalfRC,
				1662	unsigned HalfImmOp, unsigned HalfSGPROp,
				1663	MachineInstr &Lo, MachineInstr &Hi) const {
				1664
				1665	DebugLoc DL = MI->getDebugLoc();
				1666	MachineBasicBlock *MBB = MI->getParent();
				1667	MachineRegisterInfo &MRI = MBB->getParent()->getRegInfo();
				1668	unsigned RegLo = MRI.createVirtualRegister(HalfRC);
				1669	unsigned RegHi = MRI.createVirtualRegister(HalfRC);
				1670	unsigned HalfSize = HalfRC->getSize();
				1671	const MachineOperand *OffOp =
				1672	getNamedOperand(*MI, AMDGPU::OpName::offset);
				1673	const MachineOperand SBase = getNamedOperand(MI, AMDGPU::OpName::sbase);
				1674
				1675	if (OffOp) {
				1676	// Handle the _IMM variant
				1677	unsigned LoOffset = OffOp->getImm();
				1678	unsigned HiOffset = LoOffset + (HalfSize / 4);
				1679	Lo = BuildMI(*MBB, MI, DL, get(HalfImmOp), RegLo)
				1680	.addOperand(*SBase)
				1681	.addImm(LoOffset);
				1682
				1683	if (!isUInt<8>(HiOffset)) {
				1684	unsigned OffsetSGPR =
				1685	MRI.createVirtualRegister(&AMDGPU::SReg_32RegClass);
				1686	BuildMI(*MBB, MI, DL, get(AMDGPU::S_MOV_B32), OffsetSGPR)
				1687	.addImm(HiOffset << 2); // The immediate offset is in dwords,
				1688	// but offset in register is in bytes.
				1689	Hi = BuildMI(*MBB, MI, DL, get(HalfSGPROp), RegHi)
				1690	.addOperand(*SBase)
				1691	.addReg(OffsetSGPR);
				1692	} else {
				1693	Hi = BuildMI(*MBB, MI, DL, get(HalfImmOp), RegHi)
				1694	.addOperand(*SBase)
				1695	.addImm(HiOffset);
				1696	}
				1697	} else {
				1698	// Handle the _SGPR variant
				1699	MachineOperand SOff = getNamedOperand(MI, AMDGPU::OpName::soff);
				1700	Lo = BuildMI(*MBB, MI, DL, get(HalfSGPROp), RegLo)
				1701	.addOperand(*SBase)
				1702	.addOperand(*SOff);
				1703	unsigned OffsetSGPR = MRI.createVirtualRegister(&AMDGPU::SReg_32RegClass);
				1704	BuildMI(*MBB, MI, DL, get(AMDGPU::S_ADD_I32), OffsetSGPR)
				1705	.addOperand(*SOff)
				1706	.addImm(HalfSize);
				1707	Hi = BuildMI(*MBB, MI, DL, get(HalfSGPROp))
				1708	.addOperand(*SBase)
				1709	.addReg(OffsetSGPR);
				1710	}
				1711
				1712	unsigned SubLo, SubHi;
				1713	switch (HalfSize) {
				1714	case 4:
				1715	SubLo = AMDGPU::sub0;
				1716	SubHi = AMDGPU::sub1;
				1717	break;
				1718	case 8:
				1719	SubLo = AMDGPU::sub0_sub1;
				1720	SubHi = AMDGPU::sub2_sub3;
				1721	break;
				1722	case 16:
				1723	SubLo = AMDGPU::sub0_sub1_sub2_sub3;
				1724	SubHi = AMDGPU::sub4_sub5_sub6_sub7;
				1725	break;
				1726	case 32:
				1727	SubLo = AMDGPU::sub0_sub1_sub2_sub3_sub4_sub5_sub6_sub7;
				1728	SubHi = AMDGPU::sub8_sub9_sub10_sub11_sub12_sub13_sub14_sub15;
				1729	break;
				1730	default:
				1731	llvm_unreachable("Unhandled HalfSize");
				1732	}
				1733
				1734	BuildMI(*MBB, MI, DL, get(AMDGPU::REG_SEQUENCE))
				1735	.addOperand(MI->getOperand(0))
				1736	.addReg(RegLo)
				1737	.addImm(SubLo)
				1738	.addReg(RegHi)
				1739	.addImm(SubHi);
				1740	}
				1741
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1742	void SIInstrInfo::moveSMRDToVALU(MachineInstr *MI, MachineRegisterInfo &MRI) const {
				1743	MachineBasicBlock *MBB = MI->getParent();
				1744	switch (MI->getOpcode()) {
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1745	case AMDGPU::S_LOAD_DWORD_IMM:
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1746	case AMDGPU::S_LOAD_DWORD_SGPR:
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1747	case AMDGPU::S_LOAD_DWORDX2_IMM:
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1748	case AMDGPU::S_LOAD_DWORDX2_SGPR:
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1749	case AMDGPU::S_LOAD_DWORDX4_IMM:
Tom Stellard	745f2ed	2014-08-21 20:41:00 +0000	[diff] [blame]	1750	case AMDGPU::S_LOAD_DWORDX4_SGPR: {
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1751	unsigned NewOpcode = getVALUOp(*MI);
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1752	unsigned RegOffset;
				1753	unsigned ImmOffset;
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1754
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1755	if (MI->getOperand(2).isReg()) {
				1756	RegOffset = MI->getOperand(2).getReg();
				1757	ImmOffset = 0;
				1758	} else {
				1759	assert(MI->getOperand(2).isImm());
				1760	// SMRD instructions take a dword offsets and MUBUF instructions
				1761	// take a byte offset.
				1762	ImmOffset = MI->getOperand(2).getImm() << 2;
				1763	RegOffset = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
				1764	if (isUInt<12>(ImmOffset)) {
				1765	BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32),
				1766	RegOffset)
				1767	.addImm(0);
				1768	} else {
				1769	BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32),
				1770	RegOffset)
				1771	.addImm(ImmOffset);
				1772	ImmOffset = 0;
				1773	}
				1774	}
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1775
				1776	unsigned SRsrc = MRI.createVirtualRegister(&AMDGPU::SReg_128RegClass);
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1777	unsigned DWord0 = RegOffset;
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1778	unsigned DWord1 = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
				1779	unsigned DWord2 = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
				1780	unsigned DWord3 = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
				1781
				1782	BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32), DWord1)
				1783	.addImm(0);
				1784	BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32), DWord2)
				1785	.addImm(AMDGPU::RSRC_DATA_FORMAT & 0xFFFFFFFF);
				1786	BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32), DWord3)
				1787	.addImm(AMDGPU::RSRC_DATA_FORMAT >> 32);
				1788	BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::REG_SEQUENCE), SRsrc)
				1789	.addReg(DWord0)
				1790	.addImm(AMDGPU::sub0)
				1791	.addReg(DWord1)
				1792	.addImm(AMDGPU::sub1)
				1793	.addReg(DWord2)
				1794	.addImm(AMDGPU::sub2)
				1795	.addReg(DWord3)
				1796	.addImm(AMDGPU::sub3);
Tom Stellard	745f2ed	2014-08-21 20:41:00 +0000	[diff] [blame]	1797	MI->setDesc(get(NewOpcode));
				1798	if (MI->getOperand(2).isReg()) {
				1799	MI->getOperand(2).setReg(MI->getOperand(1).getReg());
				1800	} else {
				1801	MI->getOperand(2).ChangeToRegister(MI->getOperand(1).getReg(), false);
				1802	}
				1803	MI->getOperand(1).setReg(SRsrc);
				1804	MI->addOperand(*MBB->getParent(), MachineOperand::CreateImm(ImmOffset));
				1805
				1806	const TargetRegisterClass *NewDstRC =
				1807	RI.getRegClass(get(NewOpcode).OpInfo[0].RegClass);
				1808
				1809	unsigned DstReg = MI->getOperand(0).getReg();
				1810	unsigned NewDstReg = MRI.createVirtualRegister(NewDstRC);
				1811	MRI.replaceRegWith(DstReg, NewDstReg);
				1812	break;
				1813	}
				1814	case AMDGPU::S_LOAD_DWORDX8_IMM:
				1815	case AMDGPU::S_LOAD_DWORDX8_SGPR: {
				1816	MachineInstr Lo, Hi;
				1817	splitSMRD(MI, &AMDGPU::SReg_128RegClass, AMDGPU::S_LOAD_DWORDX4_IMM,
				1818	AMDGPU::S_LOAD_DWORDX4_SGPR, Lo, Hi);
				1819	MI->eraseFromParent();
				1820	moveSMRDToVALU(Lo, MRI);
				1821	moveSMRDToVALU(Hi, MRI);
				1822	break;
				1823	}
				1824
				1825	case AMDGPU::S_LOAD_DWORDX16_IMM:
				1826	case AMDGPU::S_LOAD_DWORDX16_SGPR: {
				1827	MachineInstr Lo, Hi;
				1828	splitSMRD(MI, &AMDGPU::SReg_256RegClass, AMDGPU::S_LOAD_DWORDX8_IMM,
				1829	AMDGPU::S_LOAD_DWORDX8_SGPR, Lo, Hi);
				1830	MI->eraseFromParent();
				1831	moveSMRDToVALU(Lo, MRI);
				1832	moveSMRDToVALU(Hi, MRI);
				1833	break;
				1834	}
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1835	}
				1836	}
				1837
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1838	void SIInstrInfo::moveToVALU(MachineInstr &TopInst) const {
				1839	SmallVector<MachineInstr *, 128> Worklist;
				1840	Worklist.push_back(&TopInst);
				1841
				1842	while (!Worklist.empty()) {
				1843	MachineInstr *Inst = Worklist.pop_back_val();
Tom Stellard	e038720	2014-03-21 15:51:54 +0000	[diff] [blame]	1844	MachineBasicBlock *MBB = Inst->getParent();
				1845	MachineRegisterInfo &MRI = MBB->getParent()->getRegInfo();
				1846
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	1847	unsigned Opcode = Inst->getOpcode();
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1848	unsigned NewOpcode = getVALUOp(*Inst);
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	1849
Tom Stellard	e038720	2014-03-21 15:51:54 +0000	[diff] [blame]	1850	// Handle some special cases
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	1851	switch (Opcode) {
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1852	default:
				1853	if (isSMRD(Inst->getOpcode())) {
				1854	moveSMRDToVALU(Inst, MRI);
				1855	}
				1856	break;
Matt Arsenault	bd99580	2014-03-24 18:26:52 +0000	[diff] [blame]	1857	case AMDGPU::S_MOV_B64: {
				1858	DebugLoc DL = Inst->getDebugLoc();
Tom Stellard	e038720	2014-03-21 15:51:54 +0000	[diff] [blame]	1859
Matt Arsenault	bd99580	2014-03-24 18:26:52 +0000	[diff] [blame]	1860	// If the source operand is a register we can replace this with a
				1861	// copy.
				1862	if (Inst->getOperand(1).isReg()) {
				1863	MachineInstr Copy = BuildMI(MBB, Inst, DL, get(TargetOpcode::COPY))
				1864	.addOperand(Inst->getOperand(0))
				1865	.addOperand(Inst->getOperand(1));
				1866	Worklist.push_back(Copy);
				1867	} else {
				1868	// Otherwise, we need to split this into two movs, because there is
				1869	// no 64-bit VALU move instruction.
				1870	unsigned Reg = Inst->getOperand(0).getReg();
				1871	unsigned Dst = split64BitImm(Worklist,
				1872	Inst,
				1873	MRI,
				1874	MRI.getRegClass(Reg),
				1875	Inst->getOperand(1));
				1876	MRI.replaceRegWith(Reg, Dst);
Tom Stellard	e038720	2014-03-21 15:51:54 +0000	[diff] [blame]	1877	}
Matt Arsenault	bd99580	2014-03-24 18:26:52 +0000	[diff] [blame]	1878	Inst->eraseFromParent();
				1879	continue;
				1880	}
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1881	case AMDGPU::S_AND_B64:
Matt Arsenault	689f325	2014-06-09 16:36:31 +0000	[diff] [blame]	1882	splitScalar64BitBinaryOp(Worklist, Inst, AMDGPU::S_AND_B32);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1883	Inst->eraseFromParent();
				1884	continue;
				1885
				1886	case AMDGPU::S_OR_B64:
Matt Arsenault	689f325	2014-06-09 16:36:31 +0000	[diff] [blame]	1887	splitScalar64BitBinaryOp(Worklist, Inst, AMDGPU::S_OR_B32);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1888	Inst->eraseFromParent();
				1889	continue;
				1890
				1891	case AMDGPU::S_XOR_B64:
Matt Arsenault	689f325	2014-06-09 16:36:31 +0000	[diff] [blame]	1892	splitScalar64BitBinaryOp(Worklist, Inst, AMDGPU::S_XOR_B32);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1893	Inst->eraseFromParent();
				1894	continue;
				1895
				1896	case AMDGPU::S_NOT_B64:
Matt Arsenault	689f325	2014-06-09 16:36:31 +0000	[diff] [blame]	1897	splitScalar64BitUnaryOp(Worklist, Inst, AMDGPU::S_NOT_B32);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1898	Inst->eraseFromParent();
				1899	continue;
				1900
Matt Arsenault	8333e43	2014-06-10 19:18:24 +0000	[diff] [blame]	1901	case AMDGPU::S_BCNT1_I32_B64:
				1902	splitScalar64BitBCNT(Worklist, Inst);
				1903	Inst->eraseFromParent();
				1904	continue;
				1905
Matt Arsenault	9481221	2014-11-14 18:18:16 +0000	[diff] [blame]	1906	case AMDGPU::S_BFE_I64: {
				1907	splitScalar64BitBFE(Worklist, Inst);
				1908	Inst->eraseFromParent();
				1909	continue;
				1910	}
				1911
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1912	case AMDGPU::S_BFE_U64:
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1913	case AMDGPU::S_BFM_B64:
				1914	llvm_unreachable("Moving this op to VALU not implemented");
Tom Stellard	e038720	2014-03-21 15:51:54 +0000	[diff] [blame]	1915	}
				1916
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1917	if (NewOpcode == AMDGPU::INSTRUCTION_LIST_END) {
				1918	// We cannot move this instruction to the VALU, so we should try to
				1919	// legalize its operands instead.
				1920	legalizeOperands(Inst);
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1921	continue;
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1922	}
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1923
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1924	// Use the new VALU Opcode.
				1925	const MCInstrDesc &NewDesc = get(NewOpcode);
				1926	Inst->setDesc(NewDesc);
				1927
Matt Arsenault	f0b1e3a	2013-11-18 20:09:21 +0000	[diff] [blame]	1928	// Remove any references to SCC. Vector instructions can't read from it, and
				1929	// We're just about to add the implicit use / defs of VCC, and we don't want
				1930	// both.
				1931	for (unsigned i = Inst->getNumOperands() - 1; i > 0; --i) {
				1932	MachineOperand &Op = Inst->getOperand(i);
				1933	if (Op.isReg() && Op.getReg() == AMDGPU::SCC)
				1934	Inst->RemoveOperand(i);
				1935	}
				1936
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	1937	if (Opcode == AMDGPU::S_SEXT_I32_I8 \|\| Opcode == AMDGPU::S_SEXT_I32_I16) {
				1938	// We are converting these to a BFE, so we need to add the missing
				1939	// operands for the size and offset.
				1940	unsigned Size = (Opcode == AMDGPU::S_SEXT_I32_I8) ? 8 : 16;
				1941	Inst->addOperand(MachineOperand::CreateImm(0));
				1942	Inst->addOperand(MachineOperand::CreateImm(Size));
				1943
Matt Arsenault	b5b5110	2014-06-10 19:18:21 +0000	[diff] [blame]	1944	} else if (Opcode == AMDGPU::S_BCNT1_I32_B32) {
				1945	// The VALU version adds the second operand to the result, so insert an
				1946	// extra 0 operand.
				1947	Inst->addOperand(MachineOperand::CreateImm(0));
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1948	}
				1949
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	1950	addDescImplicitUseDef(NewDesc, Inst);
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1951
Matt Arsenault	78b8670	2014-04-18 05:19:26 +0000	[diff] [blame]	1952	if (Opcode == AMDGPU::S_BFE_I32 \|\| Opcode == AMDGPU::S_BFE_U32) {
				1953	const MachineOperand &OffsetWidthOp = Inst->getOperand(2);
				1954	// If we need to move this to VGPRs, we need to unpack the second operand
				1955	// back into the 2 separate ones for bit offset and width.
				1956	assert(OffsetWidthOp.isImm() &&
				1957	"Scalar BFE is only implemented for constant width and offset");
				1958	uint32_t Imm = OffsetWidthOp.getImm();
				1959
				1960	uint32_t Offset = Imm & 0x3f; // Extract bits [5:0].
				1961	uint32_t BitWidth = (Imm & 0x7f0000) >> 16; // Extract bits [22:16].
Matt Arsenault	78b8670	2014-04-18 05:19:26 +0000	[diff] [blame]	1962	Inst->RemoveOperand(2); // Remove old immediate.
				1963	Inst->addOperand(MachineOperand::CreateImm(Offset));
Vincent Lejeune	94af31f	2014-05-10 19:18:33 +0000	[diff] [blame]	1964	Inst->addOperand(MachineOperand::CreateImm(BitWidth));
Matt Arsenault	78b8670	2014-04-18 05:19:26 +0000	[diff] [blame]	1965	}
				1966
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1967	// Update the destination register class.
Tom Stellard	e1a2445	2014-04-17 21:00:01 +0000	[diff] [blame]	1968
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1969	const TargetRegisterClass NewDstRC = getOpRegClass(Inst, 0);
				1970
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	1971	switch (Opcode) {
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1972	// For target instructions, getOpRegClass just returns the virtual
				1973	// register class associated with the operand, so we need to find an
				1974	// equivalent VGPR register class in order to move the instruction to the
				1975	// VALU.
				1976	case AMDGPU::COPY:
				1977	case AMDGPU::PHI:
				1978	case AMDGPU::REG_SEQUENCE:
Tom Stellard	204e61b	2014-04-07 19:45:45 +0000	[diff] [blame]	1979	case AMDGPU::INSERT_SUBREG:
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1980	if (RI.hasVGPRs(NewDstRC))
				1981	continue;
				1982	NewDstRC = RI.getEquivalentVGPRClass(NewDstRC);
				1983	if (!NewDstRC)
				1984	continue;
				1985	break;
				1986	default:
				1987	break;
				1988	}
				1989
				1990	unsigned DstReg = Inst->getOperand(0).getReg();
				1991	unsigned NewDstReg = MRI.createVirtualRegister(NewDstRC);
				1992	MRI.replaceRegWith(DstReg, NewDstReg);
				1993
Tom Stellard	e1a2445	2014-04-17 21:00:01 +0000	[diff] [blame]	1994	// Legalize the operands
				1995	legalizeOperands(Inst);
				1996
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1997	for (MachineRegisterInfo::use_iterator I = MRI.use_begin(NewDstReg),
				1998	E = MRI.use_end(); I != E; ++I) {
Owen Anderson	16c6bf4	2014-03-13 23:12:04 +0000	[diff] [blame]	1999	MachineInstr &UseMI = *I->getParent();
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	2000	if (!canReadVGPR(UseMI, I.getOperandNo())) {
				2001	Worklist.push_back(&UseMI);
				2002	}
				2003	}
				2004	}
				2005	}
				2006
Tom Stellard	f3b2a1e	2013-02-06 17:32:29 +0000	[diff] [blame]	2007	//===----------------------------------------------------------------------===//
				2008	// Indirect addressing callbacks
				2009	//===----------------------------------------------------------------------===//
				2010
				2011	unsigned SIInstrInfo::calculateIndirectAddress(unsigned RegIndex,
				2012	unsigned Channel) const {
				2013	assert(Channel == 0);
				2014	return RegIndex;
				2015	}
				2016
Tom Stellard	26a3b67	2013-10-22 18:19:10 +0000	[diff] [blame]	2017	const TargetRegisterClass *SIInstrInfo::getIndirectAddrRegClass() const {
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	2018	return &AMDGPU::VReg_32RegClass;
Tom Stellard	f3b2a1e	2013-02-06 17:32:29 +0000	[diff] [blame]	2019	}
				2020
Matt Arsenault	689f325	2014-06-09 16:36:31 +0000	[diff] [blame]	2021	void SIInstrInfo::splitScalar64BitUnaryOp(
				2022	SmallVectorImpl<MachineInstr *> &Worklist,
				2023	MachineInstr *Inst,
				2024	unsigned Opcode) const {
				2025	MachineBasicBlock &MBB = *Inst->getParent();
				2026	MachineRegisterInfo &MRI = MBB.getParent()->getRegInfo();
				2027
				2028	MachineOperand &Dest = Inst->getOperand(0);
				2029	MachineOperand &Src0 = Inst->getOperand(1);
				2030	DebugLoc DL = Inst->getDebugLoc();
				2031
				2032	MachineBasicBlock::iterator MII = Inst;
				2033
				2034	const MCInstrDesc &InstDesc = get(Opcode);
				2035	const TargetRegisterClass *Src0RC = Src0.isReg() ?
				2036	MRI.getRegClass(Src0.getReg()) :
				2037	&AMDGPU::SGPR_32RegClass;
				2038
				2039	const TargetRegisterClass *Src0SubRC = RI.getSubRegClass(Src0RC, AMDGPU::sub0);
				2040
				2041	MachineOperand SrcReg0Sub0 = buildExtractSubRegOrImm(MII, MRI, Src0, Src0RC,
				2042	AMDGPU::sub0, Src0SubRC);
				2043
				2044	const TargetRegisterClass *DestRC = MRI.getRegClass(Dest.getReg());
				2045	const TargetRegisterClass *DestSubRC = RI.getSubRegClass(DestRC, AMDGPU::sub0);
				2046
				2047	unsigned DestSub0 = MRI.createVirtualRegister(DestRC);
				2048	MachineInstr *LoHalf = BuildMI(MBB, MII, DL, InstDesc, DestSub0)
				2049	.addOperand(SrcReg0Sub0);
				2050
				2051	MachineOperand SrcReg0Sub1 = buildExtractSubRegOrImm(MII, MRI, Src0, Src0RC,
				2052	AMDGPU::sub1, Src0SubRC);
				2053
				2054	unsigned DestSub1 = MRI.createVirtualRegister(DestSubRC);
				2055	MachineInstr *HiHalf = BuildMI(MBB, MII, DL, InstDesc, DestSub1)
				2056	.addOperand(SrcReg0Sub1);
				2057
				2058	unsigned FullDestReg = MRI.createVirtualRegister(DestRC);
				2059	BuildMI(MBB, MII, DL, get(TargetOpcode::REG_SEQUENCE), FullDestReg)
				2060	.addReg(DestSub0)
				2061	.addImm(AMDGPU::sub0)
				2062	.addReg(DestSub1)
				2063	.addImm(AMDGPU::sub1);
				2064
				2065	MRI.replaceRegWith(Dest.getReg(), FullDestReg);
				2066
				2067	// Try to legalize the operands in case we need to swap the order to keep it
				2068	// valid.
				2069	Worklist.push_back(LoHalf);
				2070	Worklist.push_back(HiHalf);
				2071	}
				2072
				2073	void SIInstrInfo::splitScalar64BitBinaryOp(
				2074	SmallVectorImpl<MachineInstr *> &Worklist,
				2075	MachineInstr *Inst,
				2076	unsigned Opcode) const {
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	2077	MachineBasicBlock &MBB = *Inst->getParent();
				2078	MachineRegisterInfo &MRI = MBB.getParent()->getRegInfo();
				2079
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	2080	MachineOperand &Dest = Inst->getOperand(0);
				2081	MachineOperand &Src0 = Inst->getOperand(1);
				2082	MachineOperand &Src1 = Inst->getOperand(2);
				2083	DebugLoc DL = Inst->getDebugLoc();
				2084
				2085	MachineBasicBlock::iterator MII = Inst;
				2086
				2087	const MCInstrDesc &InstDesc = get(Opcode);
Matt Arsenault	684dc80	2014-03-24 20:08:13 +0000	[diff] [blame]	2088	const TargetRegisterClass *Src0RC = Src0.isReg() ?
				2089	MRI.getRegClass(Src0.getReg()) :
				2090	&AMDGPU::SGPR_32RegClass;
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	2091
Matt Arsenault	684dc80	2014-03-24 20:08:13 +0000	[diff] [blame]	2092	const TargetRegisterClass *Src0SubRC = RI.getSubRegClass(Src0RC, AMDGPU::sub0);
				2093	const TargetRegisterClass *Src1RC = Src1.isReg() ?
				2094	MRI.getRegClass(Src1.getReg()) :
				2095	&AMDGPU::SGPR_32RegClass;
				2096
				2097	const TargetRegisterClass *Src1SubRC = RI.getSubRegClass(Src1RC, AMDGPU::sub0);
				2098
				2099	MachineOperand SrcReg0Sub0 = buildExtractSubRegOrImm(MII, MRI, Src0, Src0RC,
				2100	AMDGPU::sub0, Src0SubRC);
				2101	MachineOperand SrcReg1Sub0 = buildExtractSubRegOrImm(MII, MRI, Src1, Src1RC,
				2102	AMDGPU::sub0, Src1SubRC);
				2103
				2104	const TargetRegisterClass *DestRC = MRI.getRegClass(Dest.getReg());
				2105	const TargetRegisterClass *DestSubRC = RI.getSubRegClass(DestRC, AMDGPU::sub0);
				2106
				2107	unsigned DestSub0 = MRI.createVirtualRegister(DestRC);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	2108	MachineInstr *LoHalf = BuildMI(MBB, MII, DL, InstDesc, DestSub0)
Matt Arsenault	248b7b6	2014-03-24 20:08:09 +0000	[diff] [blame]	2109	.addOperand(SrcReg0Sub0)
				2110	.addOperand(SrcReg1Sub0);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	2111
Matt Arsenault	684dc80	2014-03-24 20:08:13 +0000	[diff] [blame]	2112	MachineOperand SrcReg0Sub1 = buildExtractSubRegOrImm(MII, MRI, Src0, Src0RC,
				2113	AMDGPU::sub1, Src0SubRC);
				2114	MachineOperand SrcReg1Sub1 = buildExtractSubRegOrImm(MII, MRI, Src1, Src1RC,
				2115	AMDGPU::sub1, Src1SubRC);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	2116
Matt Arsenault	684dc80	2014-03-24 20:08:13 +0000	[diff] [blame]	2117	unsigned DestSub1 = MRI.createVirtualRegister(DestSubRC);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	2118	MachineInstr *HiHalf = BuildMI(MBB, MII, DL, InstDesc, DestSub1)
Matt Arsenault	248b7b6	2014-03-24 20:08:09 +0000	[diff] [blame]	2119	.addOperand(SrcReg0Sub1)
				2120	.addOperand(SrcReg1Sub1);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	2121
Matt Arsenault	684dc80	2014-03-24 20:08:13 +0000	[diff] [blame]	2122	unsigned FullDestReg = MRI.createVirtualRegister(DestRC);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	2123	BuildMI(MBB, MII, DL, get(TargetOpcode::REG_SEQUENCE), FullDestReg)
				2124	.addReg(DestSub0)
				2125	.addImm(AMDGPU::sub0)
				2126	.addReg(DestSub1)
				2127	.addImm(AMDGPU::sub1);
				2128
				2129	MRI.replaceRegWith(Dest.getReg(), FullDestReg);
				2130
				2131	// Try to legalize the operands in case we need to swap the order to keep it
				2132	// valid.
				2133	Worklist.push_back(LoHalf);
				2134	Worklist.push_back(HiHalf);
				2135	}
				2136
Matt Arsenault	8333e43	2014-06-10 19:18:24 +0000	[diff] [blame]	2137	void SIInstrInfo::splitScalar64BitBCNT(SmallVectorImpl<MachineInstr *> &Worklist,
				2138	MachineInstr *Inst) const {
				2139	MachineBasicBlock &MBB = *Inst->getParent();
				2140	MachineRegisterInfo &MRI = MBB.getParent()->getRegInfo();
				2141
				2142	MachineBasicBlock::iterator MII = Inst;
				2143	DebugLoc DL = Inst->getDebugLoc();
				2144
				2145	MachineOperand &Dest = Inst->getOperand(0);
				2146	MachineOperand &Src = Inst->getOperand(1);
				2147
				2148	const MCInstrDesc &InstDesc = get(AMDGPU::V_BCNT_U32_B32_e32);
				2149	const TargetRegisterClass *SrcRC = Src.isReg() ?
				2150	MRI.getRegClass(Src.getReg()) :
				2151	&AMDGPU::SGPR_32RegClass;
				2152
				2153	unsigned MidReg = MRI.createVirtualRegister(&AMDGPU::VGPR_32RegClass);
				2154	unsigned ResultReg = MRI.createVirtualRegister(&AMDGPU::VGPR_32RegClass);
				2155
				2156	const TargetRegisterClass *SrcSubRC = RI.getSubRegClass(SrcRC, AMDGPU::sub0);
				2157
				2158	MachineOperand SrcRegSub0 = buildExtractSubRegOrImm(MII, MRI, Src, SrcRC,
				2159	AMDGPU::sub0, SrcSubRC);
				2160	MachineOperand SrcRegSub1 = buildExtractSubRegOrImm(MII, MRI, Src, SrcRC,
				2161	AMDGPU::sub1, SrcSubRC);
				2162
				2163	MachineInstr *First = BuildMI(MBB, MII, DL, InstDesc, MidReg)
				2164	.addOperand(SrcRegSub0)
				2165	.addImm(0);
				2166
				2167	MachineInstr *Second = BuildMI(MBB, MII, DL, InstDesc, ResultReg)
				2168	.addOperand(SrcRegSub1)
				2169	.addReg(MidReg);
				2170
				2171	MRI.replaceRegWith(Dest.getReg(), ResultReg);
				2172
				2173	Worklist.push_back(First);
				2174	Worklist.push_back(Second);
				2175	}
				2176
Matt Arsenault	9481221	2014-11-14 18:18:16 +0000	[diff] [blame]	2177	void SIInstrInfo::splitScalar64BitBFE(SmallVectorImpl<MachineInstr *> &Worklist,
				2178	MachineInstr *Inst) const {
				2179	MachineBasicBlock &MBB = *Inst->getParent();
				2180	MachineRegisterInfo &MRI = MBB.getParent()->getRegInfo();
				2181	MachineBasicBlock::iterator MII = Inst;
				2182	DebugLoc DL = Inst->getDebugLoc();
				2183
				2184	MachineOperand &Dest = Inst->getOperand(0);
				2185	uint32_t Imm = Inst->getOperand(2).getImm();
				2186	uint32_t Offset = Imm & 0x3f; // Extract bits [5:0].
				2187	uint32_t BitWidth = (Imm & 0x7f0000) >> 16; // Extract bits [22:16].
				2188
Matt Arsenault	6ad3426	2014-11-14 18:40:49 +0000	[diff] [blame]	2189	(void) Offset;
				2190
Matt Arsenault	9481221	2014-11-14 18:18:16 +0000	[diff] [blame]	2191	// Only sext_inreg cases handled.
				2192	assert(Inst->getOpcode() == AMDGPU::S_BFE_I64 &&
				2193	BitWidth <= 32 &&
				2194	Offset == 0 &&
				2195	"Not implemented");
				2196
				2197	if (BitWidth < 32) {
				2198	unsigned MidRegLo = MRI.createVirtualRegister(&AMDGPU::VGPR_32RegClass);
				2199	unsigned MidRegHi = MRI.createVirtualRegister(&AMDGPU::VGPR_32RegClass);
				2200	unsigned ResultReg = MRI.createVirtualRegister(&AMDGPU::VReg_64RegClass);
				2201
				2202	BuildMI(MBB, MII, DL, get(AMDGPU::V_BFE_I32), MidRegLo)
				2203	.addReg(Inst->getOperand(1).getReg(), 0, AMDGPU::sub0)
				2204	.addImm(0)
				2205	.addImm(BitWidth);
				2206
				2207	BuildMI(MBB, MII, DL, get(AMDGPU::V_ASHRREV_I32_e32), MidRegHi)
				2208	.addImm(31)
				2209	.addReg(MidRegLo);
				2210
				2211	BuildMI(MBB, MII, DL, get(TargetOpcode::REG_SEQUENCE), ResultReg)
				2212	.addReg(MidRegLo)
				2213	.addImm(AMDGPU::sub0)
				2214	.addReg(MidRegHi)
				2215	.addImm(AMDGPU::sub1);
				2216
				2217	MRI.replaceRegWith(Dest.getReg(), ResultReg);
				2218	return;
				2219	}
				2220
				2221	MachineOperand &Src = Inst->getOperand(1);
				2222	unsigned TmpReg = MRI.createVirtualRegister(&AMDGPU::VGPR_32RegClass);
				2223	unsigned ResultReg = MRI.createVirtualRegister(&AMDGPU::VReg_64RegClass);
				2224
				2225	BuildMI(MBB, MII, DL, get(AMDGPU::V_ASHRREV_I32_e64), TmpReg)
				2226	.addImm(31)
				2227	.addReg(Src.getReg(), 0, AMDGPU::sub0);
				2228
				2229	BuildMI(MBB, MII, DL, get(TargetOpcode::REG_SEQUENCE), ResultReg)
				2230	.addReg(Src.getReg(), 0, AMDGPU::sub0)
				2231	.addImm(AMDGPU::sub0)
				2232	.addReg(TmpReg)
				2233	.addImm(AMDGPU::sub1);
				2234
				2235	MRI.replaceRegWith(Dest.getReg(), ResultReg);
				2236	}
				2237
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	2238	void SIInstrInfo::addDescImplicitUseDef(const MCInstrDesc &NewDesc,
				2239	MachineInstr *Inst) const {
				2240	// Add the implict and explicit register definitions.
				2241	if (NewDesc.ImplicitUses) {
				2242	for (unsigned i = 0; NewDesc.ImplicitUses[i]; ++i) {
				2243	unsigned Reg = NewDesc.ImplicitUses[i];
				2244	Inst->addOperand(MachineOperand::CreateReg(Reg, false, true));
				2245	}
				2246	}
				2247
				2248	if (NewDesc.ImplicitDefs) {
				2249	for (unsigned i = 0; NewDesc.ImplicitDefs[i]; ++i) {
				2250	unsigned Reg = NewDesc.ImplicitDefs[i];
				2251	Inst->addOperand(MachineOperand::CreateReg(Reg, true, true));
				2252	}
				2253	}
				2254	}
				2255
Matt Arsenault	ee522bf	2014-09-26 17:55:06 +0000	[diff] [blame]	2256	unsigned SIInstrInfo::findUsedSGPR(const MachineInstr *MI,
				2257	int OpIndices[3]) const {
				2258	const MCInstrDesc &Desc = get(MI->getOpcode());
				2259
				2260	// Find the one SGPR operand we are allowed to use.
				2261	unsigned SGPRReg = AMDGPU::NoRegister;
				2262
				2263	// First we need to consider the instruction's operand requirements before
				2264	// legalizing. Some operands are required to be SGPRs, such as implicit uses
				2265	// of VCC, but we are still bound by the constant bus requirement to only use
				2266	// one.
				2267	//
				2268	// If the operand's class is an SGPR, we can never move it.
				2269
				2270	for (const MachineOperand &MO : MI->implicit_operands()) {
				2271	// We only care about reads.
				2272	if (MO.isDef())
				2273	continue;
				2274
				2275	if (MO.getReg() == AMDGPU::VCC)
				2276	return AMDGPU::VCC;
				2277
				2278	if (MO.getReg() == AMDGPU::FLAT_SCR)
				2279	return AMDGPU::FLAT_SCR;
				2280	}
				2281
				2282	unsigned UsedSGPRs[3] = { AMDGPU::NoRegister };
				2283	const MachineRegisterInfo &MRI = MI->getParent()->getParent()->getRegInfo();
				2284
				2285	for (unsigned i = 0; i < 3; ++i) {
				2286	int Idx = OpIndices[i];
				2287	if (Idx == -1)
				2288	break;
				2289
				2290	const MachineOperand &MO = MI->getOperand(Idx);
				2291	if (RI.isSGPRClassID(Desc.OpInfo[Idx].RegClass))
				2292	SGPRReg = MO.getReg();
				2293
				2294	if (MO.isReg() && RI.isSGPRClass(MRI.getRegClass(MO.getReg())))
				2295	UsedSGPRs[i] = MO.getReg();
				2296	}
				2297
				2298	if (SGPRReg != AMDGPU::NoRegister)
				2299	return SGPRReg;
				2300
				2301	// We don't have a required SGPR operand, so we have a bit more freedom in
				2302	// selecting operands to move.
				2303
				2304	// Try to select the most used SGPR. If an SGPR is equal to one of the
				2305	// others, we choose that.
				2306	//
				2307	// e.g.
				2308	// V_FMA_F32 v0, s0, s0, s0 -> No moves
				2309	// V_FMA_F32 v0, s0, s1, s0 -> Move s1
				2310
				2311	if (UsedSGPRs[0] != AMDGPU::NoRegister) {
				2312	if (UsedSGPRs[0] == UsedSGPRs[1] \|\| UsedSGPRs[0] == UsedSGPRs[2])
				2313	SGPRReg = UsedSGPRs[0];
				2314	}
				2315
				2316	if (SGPRReg == AMDGPU::NoRegister && UsedSGPRs[1] != AMDGPU::NoRegister) {
				2317	if (UsedSGPRs[1] == UsedSGPRs[2])
				2318	SGPRReg = UsedSGPRs[1];
				2319	}
				2320
				2321	return SGPRReg;
				2322	}
				2323
Tom Stellard	f3b2a1e	2013-02-06 17:32:29 +0000	[diff] [blame]	2324	MachineInstrBuilder SIInstrInfo::buildIndirectWrite(
				2325	MachineBasicBlock *MBB,
				2326	MachineBasicBlock::iterator I,
				2327	unsigned ValueReg,
				2328	unsigned Address, unsigned OffsetReg) const {
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	2329	const DebugLoc &DL = MBB->findDebugLoc(I);
				2330	unsigned IndirectBaseReg = AMDGPU::VReg_32RegClass.getRegister(
				2331	getIndirectIndexBegin(*MBB->getParent()));
				2332
				2333	return BuildMI(*MBB, I, DL, get(AMDGPU::SI_INDIRECT_DST_V1))
				2334	.addReg(IndirectBaseReg, RegState::Define)
				2335	.addOperand(I->getOperand(0))
				2336	.addReg(IndirectBaseReg)
				2337	.addReg(OffsetReg)
				2338	.addImm(0)
				2339	.addReg(ValueReg);
Tom Stellard	f3b2a1e	2013-02-06 17:32:29 +0000	[diff] [blame]	2340	}
				2341
				2342	MachineInstrBuilder SIInstrInfo::buildIndirectRead(
				2343	MachineBasicBlock *MBB,
				2344	MachineBasicBlock::iterator I,
				2345	unsigned ValueReg,
				2346	unsigned Address, unsigned OffsetReg) const {
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	2347	const DebugLoc &DL = MBB->findDebugLoc(I);
				2348	unsigned IndirectBaseReg = AMDGPU::VReg_32RegClass.getRegister(
				2349	getIndirectIndexBegin(*MBB->getParent()));
				2350
				2351	return BuildMI(*MBB, I, DL, get(AMDGPU::SI_INDIRECT_SRC))
				2352	.addOperand(I->getOperand(0))
				2353	.addOperand(I->getOperand(1))
				2354	.addReg(IndirectBaseReg)
				2355	.addReg(OffsetReg)
				2356	.addImm(0);
				2357
				2358	}
				2359
				2360	void SIInstrInfo::reserveIndirectRegisters(BitVector &Reserved,
				2361	const MachineFunction &MF) const {
				2362	int End = getIndirectIndexEnd(MF);
				2363	int Begin = getIndirectIndexBegin(MF);
				2364
				2365	if (End == -1)
				2366	return;
				2367
				2368
				2369	for (int Index = Begin; Index <= End; ++Index)
				2370	Reserved.set(AMDGPU::VReg_32RegClass.getRegister(Index));
				2371
Tom Stellard	415ef6d	2013-11-13 23:58:51 +0000	[diff] [blame]	2372	for (int Index = std::max(0, Begin - 1); Index <= End; ++Index)
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	2373	Reserved.set(AMDGPU::VReg_64RegClass.getRegister(Index));
				2374
Tom Stellard	415ef6d	2013-11-13 23:58:51 +0000	[diff] [blame]	2375	for (int Index = std::max(0, Begin - 2); Index <= End; ++Index)
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	2376	Reserved.set(AMDGPU::VReg_96RegClass.getRegister(Index));
				2377
Tom Stellard	415ef6d	2013-11-13 23:58:51 +0000	[diff] [blame]	2378	for (int Index = std::max(0, Begin - 3); Index <= End; ++Index)
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	2379	Reserved.set(AMDGPU::VReg_128RegClass.getRegister(Index));
				2380
Tom Stellard	415ef6d	2013-11-13 23:58:51 +0000	[diff] [blame]	2381	for (int Index = std::max(0, Begin - 7); Index <= End; ++Index)
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	2382	Reserved.set(AMDGPU::VReg_256RegClass.getRegister(Index));
				2383
Tom Stellard	415ef6d	2013-11-13 23:58:51 +0000	[diff] [blame]	2384	for (int Index = std::max(0, Begin - 15); Index <= End; ++Index)
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	2385	Reserved.set(AMDGPU::VReg_512RegClass.getRegister(Index));
Tom Stellard	f3b2a1e	2013-02-06 17:32:29 +0000	[diff] [blame]	2386	}
Tom Stellard	1aaad69	2014-07-21 16:55:33 +0000	[diff] [blame]	2387
Tom Stellard	6407e1e	2014-08-01 00:32:33 +0000	[diff] [blame]	2388	MachineOperand *SIInstrInfo::getNamedOperand(MachineInstr &MI,
Matt Arsenault	ace5b76	2014-10-17 18:00:43 +0000	[diff] [blame]	2389	unsigned OperandName) const {
Tom Stellard	1aaad69	2014-07-21 16:55:33 +0000	[diff] [blame]	2390	int Idx = AMDGPU::getNamedOperandIdx(MI.getOpcode(), OperandName);
				2391	if (Idx == -1)
				2392	return nullptr;
				2393
				2394	return &MI.getOperand(Idx);
				2395	}