Blame - llvm/lib/Target/R600/SIInstrInfo.cpp - toolchain/llvm-project

blob: b103ceff103d13d259d31bdcf12d5081b10d1579 [file] [log] [blame]

Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	1	//===-- SIInstrInfo.cpp - SI Instruction Information ---------------------===//
				2	//
				3	// The LLVM Compiler Infrastructure
				4	//
				5	// This file is distributed under the University of Illinois Open Source
				6	// License. See LICENSE.TXT for details.
				7	//
				8	//===----------------------------------------------------------------------===//
				9	//
				10	/// \file
				11	/// \brief SI Implementation of TargetInstrInfo.
				12	//
				13	//===----------------------------------------------------------------------===//
				14
				15
				16	#include "SIInstrInfo.h"
				17	#include "AMDGPUTargetMachine.h"
Tom Stellard	16a9a20	2013-08-14 23:24:17 +0000	[diff] [blame]	18	#include "SIDefines.h"
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	19	#include "SIMachineFunctionInfo.h"
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	20	#include "llvm/CodeGen/MachineFrameInfo.h"
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	21	#include "llvm/CodeGen/MachineInstrBuilder.h"
				22	#include "llvm/CodeGen/MachineRegisterInfo.h"
Tom Stellard	4e07b1d	2014-06-10 21:20:41 +0000	[diff] [blame]	23	#include "llvm/IR/Function.h"
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	24	#include "llvm/MC/MCInstrDesc.h"
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	25
				26	using namespace llvm;
				27
Tom Stellard	2e59a45	2014-06-13 01:32:00 +0000	[diff] [blame]	28	SIInstrInfo::SIInstrInfo(const AMDGPUSubtarget &st)
				29	: AMDGPUInstrInfo(st),
				30	RI(st) { }
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	31
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	32	//===----------------------------------------------------------------------===//
				33	// TargetInstrInfo callbacks
				34	//===----------------------------------------------------------------------===//
				35
Matt Arsenault	c10853f	2014-08-06 00:29:43 +0000	[diff] [blame]	36	static unsigned getNumOperandsNoGlue(SDNode *Node) {
				37	unsigned N = Node->getNumOperands();
				38	while (N && Node->getOperand(N - 1).getValueType() == MVT::Glue)
				39	--N;
				40	return N;
				41	}
				42
				43	static SDValue findChainOperand(SDNode *Load) {
				44	SDValue LastOp = Load->getOperand(getNumOperandsNoGlue(Load) - 1);
				45	assert(LastOp.getValueType() == MVT::Other && "Chain missing from load node");
				46	return LastOp;
				47	}
				48
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	49	/// \brief Returns true if both nodes have the same value for the given
				50	/// operand \p Op, or if both nodes do not have this operand.
				51	static bool nodesHaveSameOperandValue(SDNode N0, SDNode N1, unsigned OpName) {
				52	unsigned Opc0 = N0->getMachineOpcode();
				53	unsigned Opc1 = N1->getMachineOpcode();
				54
				55	int Op0Idx = AMDGPU::getNamedOperandIdx(Opc0, OpName);
				56	int Op1Idx = AMDGPU::getNamedOperandIdx(Opc1, OpName);
				57
				58	if (Op0Idx == -1 && Op1Idx == -1)
				59	return true;
				60
				61
				62	if ((Op0Idx == -1 && Op1Idx != -1) \|\|
				63	(Op1Idx == -1 && Op0Idx != -1))
				64	return false;
				65
				66	// getNamedOperandIdx returns the index for the MachineInstr's operands,
				67	// which includes the result as the first operand. We are indexing into the
				68	// MachineSDNode's operands, so we need to skip the result operand to get
				69	// the real index.
				70	--Op0Idx;
				71	--Op1Idx;
				72
Tom Stellard	b8b8413	2014-09-03 15:22:39 +0000	[diff] [blame]	73	return N0->getOperand(Op0Idx) == N1->getOperand(Op1Idx);
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	74	}
				75
Matt Arsenault	c10853f	2014-08-06 00:29:43 +0000	[diff] [blame]	76	bool SIInstrInfo::areLoadsFromSameBasePtr(SDNode Load0, SDNode Load1,
				77	int64_t &Offset0,
				78	int64_t &Offset1) const {
				79	if (!Load0->isMachineOpcode() \|\| !Load1->isMachineOpcode())
				80	return false;
				81
				82	unsigned Opc0 = Load0->getMachineOpcode();
				83	unsigned Opc1 = Load1->getMachineOpcode();
				84
				85	// Make sure both are actually loads.
				86	if (!get(Opc0).mayLoad() \|\| !get(Opc1).mayLoad())
				87	return false;
				88
				89	if (isDS(Opc0) && isDS(Opc1)) {
				90	assert(getNumOperandsNoGlue(Load0) == getNumOperandsNoGlue(Load1));
				91
				92	// TODO: Also shouldn't see read2st
				93	assert(Opc0 != AMDGPU::DS_READ2_B32 &&
				94	Opc0 != AMDGPU::DS_READ2_B64 &&
				95	Opc1 != AMDGPU::DS_READ2_B32 &&
				96	Opc1 != AMDGPU::DS_READ2_B64);
				97
				98	// Check base reg.
				99	if (Load0->getOperand(1) != Load1->getOperand(1))
				100	return false;
				101
				102	// Check chain.
				103	if (findChainOperand(Load0) != findChainOperand(Load1))
				104	return false;
				105
				106	Offset0 = cast<ConstantSDNode>(Load0->getOperand(2))->getZExtValue();
				107	Offset1 = cast<ConstantSDNode>(Load1->getOperand(2))->getZExtValue();
				108	return true;
				109	}
				110
				111	if (isSMRD(Opc0) && isSMRD(Opc1)) {
				112	assert(getNumOperandsNoGlue(Load0) == getNumOperandsNoGlue(Load1));
				113
				114	// Check base reg.
				115	if (Load0->getOperand(0) != Load1->getOperand(0))
				116	return false;
				117
				118	// Check chain.
				119	if (findChainOperand(Load0) != findChainOperand(Load1))
				120	return false;
				121
				122	Offset0 = cast<ConstantSDNode>(Load0->getOperand(1))->getZExtValue();
				123	Offset1 = cast<ConstantSDNode>(Load1->getOperand(1))->getZExtValue();
				124	return true;
				125	}
				126
				127	// MUBUF and MTBUF can access the same addresses.
				128	if ((isMUBUF(Opc0) \|\| isMTBUF(Opc0)) && (isMUBUF(Opc1) \|\| isMTBUF(Opc1))) {
Matt Arsenault	c10853f	2014-08-06 00:29:43 +0000	[diff] [blame]	129
				130	// MUBUF and MTBUF have vaddr at different indices.
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	131	if (!nodesHaveSameOperandValue(Load0, Load1, AMDGPU::OpName::soffset) \|\|
				132	findChainOperand(Load0) != findChainOperand(Load1) \|\|
				133	!nodesHaveSameOperandValue(Load0, Load1, AMDGPU::OpName::vaddr) \|\|
Tom Stellard	b8b8413	2014-09-03 15:22:39 +0000	[diff] [blame]	134	!nodesHaveSameOperandValue(Load0, Load1, AMDGPU::OpName::srsrc))
Matt Arsenault	c10853f	2014-08-06 00:29:43 +0000	[diff] [blame]	135	return false;
				136
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	137	int OffIdx0 = AMDGPU::getNamedOperandIdx(Opc0, AMDGPU::OpName::offset);
				138	int OffIdx1 = AMDGPU::getNamedOperandIdx(Opc1, AMDGPU::OpName::offset);
				139
				140	if (OffIdx0 == -1 \|\| OffIdx1 == -1)
				141	return false;
				142
				143	// getNamedOperandIdx returns the index for MachineInstrs. Since they
				144	// inlcude the output in the operand list, but SDNodes don't, we need to
				145	// subtract the index by one.
				146	--OffIdx0;
				147	--OffIdx1;
				148
				149	SDValue Off0 = Load0->getOperand(OffIdx0);
				150	SDValue Off1 = Load1->getOperand(OffIdx1);
				151
				152	// The offset might be a FrameIndexSDNode.
				153	if (!isa<ConstantSDNode>(Off0) \|\| !isa<ConstantSDNode>(Off1))
				154	return false;
				155
				156	Offset0 = cast<ConstantSDNode>(Off0)->getZExtValue();
				157	Offset1 = cast<ConstantSDNode>(Off1)->getZExtValue();
Matt Arsenault	c10853f	2014-08-06 00:29:43 +0000	[diff] [blame]	158	return true;
				159	}
				160
				161	return false;
				162	}
				163
Matt Arsenault	2e99112	2014-09-10 23:26:16 +0000	[diff] [blame^]	164	static bool isStride64(unsigned Opc) {
				165	switch (Opc) {
				166	case AMDGPU::DS_READ2ST64_B32:
				167	case AMDGPU::DS_READ2ST64_B64:
				168	case AMDGPU::DS_WRITE2ST64_B32:
				169	case AMDGPU::DS_WRITE2ST64_B64:
				170	return true;
				171	default:
				172	return false;
				173	}
				174	}
				175
Matt Arsenault	1acc72f	2014-07-29 21:34:55 +0000	[diff] [blame]	176	bool SIInstrInfo::getLdStBaseRegImmOfs(MachineInstr *LdSt,
				177	unsigned &BaseReg, unsigned &Offset,
				178	const TargetRegisterInfo *TRI) const {
				179	unsigned Opc = LdSt->getOpcode();
				180	if (isDS(Opc)) {
Matt Arsenault	1acc72f	2014-07-29 21:34:55 +0000	[diff] [blame]	181	const MachineOperand OffsetImm = getNamedOperand(LdSt,
				182	AMDGPU::OpName::offset);
Matt Arsenault	7eb0a10	2014-07-30 01:01:10 +0000	[diff] [blame]	183	if (OffsetImm) {
				184	// Normal, single offset LDS instruction.
				185	const MachineOperand AddrReg = getNamedOperand(LdSt,
				186	AMDGPU::OpName::addr);
Matt Arsenault	1acc72f	2014-07-29 21:34:55 +0000	[diff] [blame]	187
Matt Arsenault	7eb0a10	2014-07-30 01:01:10 +0000	[diff] [blame]	188	BaseReg = AddrReg->getReg();
				189	Offset = OffsetImm->getImm();
				190	return true;
Matt Arsenault	1acc72f	2014-07-29 21:34:55 +0000	[diff] [blame]	191	}
				192
Matt Arsenault	7eb0a10	2014-07-30 01:01:10 +0000	[diff] [blame]	193	// The 2 offset instructions use offset0 and offset1 instead. We can treat
				194	// these as a load with a single offset if the 2 offsets are consecutive. We
				195	// will use this for some partially aligned loads.
				196	const MachineOperand Offset0Imm = getNamedOperand(LdSt,
				197	AMDGPU::OpName::offset0);
				198	const MachineOperand Offset1Imm = getNamedOperand(LdSt,
				199	AMDGPU::OpName::offset1);
Matt Arsenault	1acc72f	2014-07-29 21:34:55 +0000	[diff] [blame]	200
Matt Arsenault	7eb0a10	2014-07-30 01:01:10 +0000	[diff] [blame]	201	uint8_t Offset0 = Offset0Imm->getImm();
				202	uint8_t Offset1 = Offset1Imm->getImm();
				203	assert(Offset1 > Offset0);
				204
				205	if (Offset1 - Offset0 == 1) {
				206	// Each of these offsets is in element sized units, so we need to convert
				207	// to bytes of the individual reads.
				208
				209	unsigned EltSize;
				210	if (LdSt->mayLoad())
				211	EltSize = getOpRegClass(*LdSt, 0)->getSize() / 2;
				212	else {
				213	assert(LdSt->mayStore());
				214	int Data0Idx = AMDGPU::getNamedOperandIdx(Opc, AMDGPU::OpName::data0);
				215	EltSize = getOpRegClass(*LdSt, Data0Idx)->getSize();
				216	}
				217
Matt Arsenault	2e99112	2014-09-10 23:26:16 +0000	[diff] [blame^]	218	if (isStride64(Opc))
				219	EltSize *= 64;
				220
Matt Arsenault	7eb0a10	2014-07-30 01:01:10 +0000	[diff] [blame]	221	const MachineOperand AddrReg = getNamedOperand(LdSt,
				222	AMDGPU::OpName::addr);
				223	BaseReg = AddrReg->getReg();
				224	Offset = EltSize * Offset0;
				225	return true;
				226	}
				227
				228	return false;
Matt Arsenault	1acc72f	2014-07-29 21:34:55 +0000	[diff] [blame]	229	}
				230
				231	if (isMUBUF(Opc) \|\| isMTBUF(Opc)) {
				232	if (AMDGPU::getNamedOperandIdx(Opc, AMDGPU::OpName::soffset) != -1)
				233	return false;
				234
				235	const MachineOperand AddrReg = getNamedOperand(LdSt,
				236	AMDGPU::OpName::vaddr);
				237	if (!AddrReg)
				238	return false;
				239
				240	const MachineOperand OffsetImm = getNamedOperand(LdSt,
				241	AMDGPU::OpName::offset);
				242	BaseReg = AddrReg->getReg();
				243	Offset = OffsetImm->getImm();
				244	return true;
				245	}
				246
				247	if (isSMRD(Opc)) {
				248	const MachineOperand OffsetImm = getNamedOperand(LdSt,
				249	AMDGPU::OpName::offset);
				250	if (!OffsetImm)
				251	return false;
				252
				253	const MachineOperand SBaseReg = getNamedOperand(LdSt,
				254	AMDGPU::OpName::sbase);
				255	BaseReg = SBaseReg->getReg();
				256	Offset = OffsetImm->getImm();
				257	return true;
				258	}
				259
				260	return false;
				261	}
				262
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	263	void
				264	SIInstrInfo::copyPhysReg(MachineBasicBlock &MBB,
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	265	MachineBasicBlock::iterator MI, DebugLoc DL,
				266	unsigned DestReg, unsigned SrcReg,
				267	bool KillSrc) const {
				268
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	269	// If we are trying to copy to or from SCC, there is a bug somewhere else in
				270	// the backend. While it may be theoretically possible to do this, it should
				271	// never be necessary.
				272	assert(DestReg != AMDGPU::SCC && SrcReg != AMDGPU::SCC);
				273
Craig Topper	0afd0ab	2013-07-15 06:39:13 +0000	[diff] [blame]	274	static const int16_t Sub0_15[] = {
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	275	AMDGPU::sub0, AMDGPU::sub1, AMDGPU::sub2, AMDGPU::sub3,
				276	AMDGPU::sub4, AMDGPU::sub5, AMDGPU::sub6, AMDGPU::sub7,
				277	AMDGPU::sub8, AMDGPU::sub9, AMDGPU::sub10, AMDGPU::sub11,
				278	AMDGPU::sub12, AMDGPU::sub13, AMDGPU::sub14, AMDGPU::sub15, 0
				279	};
				280
Craig Topper	0afd0ab	2013-07-15 06:39:13 +0000	[diff] [blame]	281	static const int16_t Sub0_7[] = {
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	282	AMDGPU::sub0, AMDGPU::sub1, AMDGPU::sub2, AMDGPU::sub3,
				283	AMDGPU::sub4, AMDGPU::sub5, AMDGPU::sub6, AMDGPU::sub7, 0
				284	};
				285
Craig Topper	0afd0ab	2013-07-15 06:39:13 +0000	[diff] [blame]	286	static const int16_t Sub0_3[] = {
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	287	AMDGPU::sub0, AMDGPU::sub1, AMDGPU::sub2, AMDGPU::sub3, 0
				288	};
				289
Craig Topper	0afd0ab	2013-07-15 06:39:13 +0000	[diff] [blame]	290	static const int16_t Sub0_2[] = {
Christian Konig	8b1ed28	2013-04-10 08:39:16 +0000	[diff] [blame]	291	AMDGPU::sub0, AMDGPU::sub1, AMDGPU::sub2, 0
				292	};
				293
Craig Topper	0afd0ab	2013-07-15 06:39:13 +0000	[diff] [blame]	294	static const int16_t Sub0_1[] = {
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	295	AMDGPU::sub0, AMDGPU::sub1, 0
				296	};
				297
				298	unsigned Opcode;
				299	const int16_t *SubIndices;
				300
Christian Konig	082c661	2013-03-26 14:04:12 +0000	[diff] [blame]	301	if (AMDGPU::M0 == DestReg) {
				302	// Check if M0 isn't already set to this value
				303	for (MachineBasicBlock::reverse_iterator E = MBB.rend(),
				304	I = MachineBasicBlock::reverse_iterator(MI); I != E; ++I) {
				305
				306	if (!I->definesRegister(AMDGPU::M0))
				307	continue;
				308
				309	unsigned Opc = I->getOpcode();
				310	if (Opc != TargetOpcode::COPY && Opc != AMDGPU::S_MOV_B32)
				311	break;
				312
				313	if (!I->readsRegister(SrcReg))
				314	break;
				315
				316	// The copy isn't necessary
				317	return;
				318	}
				319	}
				320
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	321	if (AMDGPU::SReg_32RegClass.contains(DestReg)) {
				322	assert(AMDGPU::SReg_32RegClass.contains(SrcReg));
				323	BuildMI(MBB, MI, DL, get(AMDGPU::S_MOV_B32), DestReg)
				324	.addReg(SrcReg, getKillRegState(KillSrc));
				325	return;
				326
Tom Stellard	aac1889	2013-02-07 19:39:43 +0000	[diff] [blame]	327	} else if (AMDGPU::SReg_64RegClass.contains(DestReg)) {
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	328	assert(AMDGPU::SReg_64RegClass.contains(SrcReg));
				329	BuildMI(MBB, MI, DL, get(AMDGPU::S_MOV_B64), DestReg)
				330	.addReg(SrcReg, getKillRegState(KillSrc));
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	331	return;
				332
				333	} else if (AMDGPU::SReg_128RegClass.contains(DestReg)) {
				334	assert(AMDGPU::SReg_128RegClass.contains(SrcReg));
				335	Opcode = AMDGPU::S_MOV_B32;
				336	SubIndices = Sub0_3;
				337
				338	} else if (AMDGPU::SReg_256RegClass.contains(DestReg)) {
				339	assert(AMDGPU::SReg_256RegClass.contains(SrcReg));
				340	Opcode = AMDGPU::S_MOV_B32;
				341	SubIndices = Sub0_7;
				342
				343	} else if (AMDGPU::SReg_512RegClass.contains(DestReg)) {
				344	assert(AMDGPU::SReg_512RegClass.contains(SrcReg));
				345	Opcode = AMDGPU::S_MOV_B32;
				346	SubIndices = Sub0_15;
				347
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	348	} else if (AMDGPU::VReg_32RegClass.contains(DestReg)) {
				349	assert(AMDGPU::VReg_32RegClass.contains(SrcReg) \|\|
NAKAMURA Takumi	4bb85f9	2013-10-28 04:07:23 +0000	[diff] [blame]	350	AMDGPU::SReg_32RegClass.contains(SrcReg));
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	351	BuildMI(MBB, MI, DL, get(AMDGPU::V_MOV_B32_e32), DestReg)
				352	.addReg(SrcReg, getKillRegState(KillSrc));
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	353	return;
				354
				355	} else if (AMDGPU::VReg_64RegClass.contains(DestReg)) {
				356	assert(AMDGPU::VReg_64RegClass.contains(SrcReg) \|\|
NAKAMURA Takumi	4bb85f9	2013-10-28 04:07:23 +0000	[diff] [blame]	357	AMDGPU::SReg_64RegClass.contains(SrcReg));
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	358	Opcode = AMDGPU::V_MOV_B32_e32;
				359	SubIndices = Sub0_1;
				360
Christian Konig	8b1ed28	2013-04-10 08:39:16 +0000	[diff] [blame]	361	} else if (AMDGPU::VReg_96RegClass.contains(DestReg)) {
				362	assert(AMDGPU::VReg_96RegClass.contains(SrcReg));
				363	Opcode = AMDGPU::V_MOV_B32_e32;
				364	SubIndices = Sub0_2;
				365
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	366	} else if (AMDGPU::VReg_128RegClass.contains(DestReg)) {
				367	assert(AMDGPU::VReg_128RegClass.contains(SrcReg) \|\|
NAKAMURA Takumi	4bb85f9	2013-10-28 04:07:23 +0000	[diff] [blame]	368	AMDGPU::SReg_128RegClass.contains(SrcReg));
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	369	Opcode = AMDGPU::V_MOV_B32_e32;
				370	SubIndices = Sub0_3;
				371
				372	} else if (AMDGPU::VReg_256RegClass.contains(DestReg)) {
				373	assert(AMDGPU::VReg_256RegClass.contains(SrcReg) \|\|
NAKAMURA Takumi	4bb85f9	2013-10-28 04:07:23 +0000	[diff] [blame]	374	AMDGPU::SReg_256RegClass.contains(SrcReg));
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	375	Opcode = AMDGPU::V_MOV_B32_e32;
				376	SubIndices = Sub0_7;
				377
				378	} else if (AMDGPU::VReg_512RegClass.contains(DestReg)) {
				379	assert(AMDGPU::VReg_512RegClass.contains(SrcReg) \|\|
NAKAMURA Takumi	4bb85f9	2013-10-28 04:07:23 +0000	[diff] [blame]	380	AMDGPU::SReg_512RegClass.contains(SrcReg));
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	381	Opcode = AMDGPU::V_MOV_B32_e32;
				382	SubIndices = Sub0_15;
				383
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	384	} else {
Christian Konig	d0e3da1	2013-03-01 09:46:27 +0000	[diff] [blame]	385	llvm_unreachable("Can't copy register!");
				386	}
				387
				388	while (unsigned SubIdx = *SubIndices++) {
				389	MachineInstrBuilder Builder = BuildMI(MBB, MI, DL,
				390	get(Opcode), RI.getSubReg(DestReg, SubIdx));
				391
				392	Builder.addReg(RI.getSubReg(SrcReg, SubIdx), getKillRegState(KillSrc));
				393
				394	if (*SubIndices)
				395	Builder.addReg(DestReg, RegState::Define \| RegState::Implicit);
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	396	}
				397	}
				398
Christian Konig	3c14580	2013-03-27 09:12:59 +0000	[diff] [blame]	399	unsigned SIInstrInfo::commuteOpcode(unsigned Opcode) const {
Christian Konig	3c14580	2013-03-27 09:12:59 +0000	[diff] [blame]	400	int NewOpc;
				401
				402	// Try to map original to commuted opcode
				403	if ((NewOpc = AMDGPU::getCommuteRev(Opcode)) != -1)
				404	return NewOpc;
				405
				406	// Try to map commuted to original opcode
				407	if ((NewOpc = AMDGPU::getCommuteOrig(Opcode)) != -1)
				408	return NewOpc;
				409
				410	return Opcode;
				411	}
				412
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	413	void SIInstrInfo::storeRegToStackSlot(MachineBasicBlock &MBB,
				414	MachineBasicBlock::iterator MI,
				415	unsigned SrcReg, bool isKill,
				416	int FrameIndex,
				417	const TargetRegisterClass *RC,
				418	const TargetRegisterInfo *TRI) const {
Tom Stellard	4e07b1d	2014-06-10 21:20:41 +0000	[diff] [blame]	419	MachineFunction *MF = MBB.getParent();
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	420	MachineFrameInfo *FrameInfo = MF->getFrameInfo();
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	421	DebugLoc DL = MBB.findDebugLoc(MI);
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	422
Tom Stellard	4e07b1d	2014-06-10 21:20:41 +0000	[diff] [blame]	423	if (RI.hasVGPRs(RC)) {
				424	LLVMContext &Ctx = MF->getFunction()->getContext();
				425	Ctx.emitError("SIInstrInfo::storeRegToStackSlot - Can't spill VGPR!");
				426	BuildMI(MBB, MI, DL, get(AMDGPU::V_MOV_B32_e32), AMDGPU::VGPR0)
				427	.addReg(SrcReg);
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	428	} else if (RI.isSGPRClass(RC)) {
				429	// We are only allowed to create one new instruction when spilling
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	430	// registers, so we need to use pseudo instruction for spilling
				431	// SGPRs.
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	432	unsigned Opcode;
				433	switch (RC->getSize() * 8) {
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	434	case 32: Opcode = AMDGPU::SI_SPILL_S32_SAVE; break;
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	435	case 64: Opcode = AMDGPU::SI_SPILL_S64_SAVE; break;
				436	case 128: Opcode = AMDGPU::SI_SPILL_S128_SAVE; break;
				437	case 256: Opcode = AMDGPU::SI_SPILL_S256_SAVE; break;
				438	case 512: Opcode = AMDGPU::SI_SPILL_S512_SAVE; break;
				439	default: llvm_unreachable("Cannot spill register class");
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	440	}
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	441
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	442	FrameInfo->setObjectAlignment(FrameIndex, 4);
				443	BuildMI(MBB, MI, DL, get(Opcode))
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	444	.addReg(SrcReg)
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	445	.addFrameIndex(FrameIndex);
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	446	} else {
				447	llvm_unreachable("VGPR spilling not supported");
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	448	}
				449	}
				450
				451	void SIInstrInfo::loadRegFromStackSlot(MachineBasicBlock &MBB,
				452	MachineBasicBlock::iterator MI,
				453	unsigned DestReg, int FrameIndex,
				454	const TargetRegisterClass *RC,
				455	const TargetRegisterInfo *TRI) const {
Tom Stellard	4e07b1d	2014-06-10 21:20:41 +0000	[diff] [blame]	456	MachineFunction *MF = MBB.getParent();
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	457	MachineFrameInfo *FrameInfo = MF->getFrameInfo();
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	458	DebugLoc DL = MBB.findDebugLoc(MI);
Tom Stellard	4e07b1d	2014-06-10 21:20:41 +0000	[diff] [blame]	459
				460	if (RI.hasVGPRs(RC)) {
				461	LLVMContext &Ctx = MF->getFunction()->getContext();
				462	Ctx.emitError("SIInstrInfo::loadRegToStackSlot - Can't retrieve spilled VGPR!");
				463	BuildMI(MBB, MI, DL, get(AMDGPU::V_MOV_B32_e32), DestReg)
				464	.addImm(0);
				465	} else if (RI.isSGPRClass(RC)){
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	466	unsigned Opcode;
				467	switch(RC->getSize() * 8) {
Tom Stellard	060ae39	2014-06-10 21:20:38 +0000	[diff] [blame]	468	case 32: Opcode = AMDGPU::SI_SPILL_S32_RESTORE; break;
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	469	case 64: Opcode = AMDGPU::SI_SPILL_S64_RESTORE; break;
				470	case 128: Opcode = AMDGPU::SI_SPILL_S128_RESTORE; break;
				471	case 256: Opcode = AMDGPU::SI_SPILL_S256_RESTORE; break;
				472	case 512: Opcode = AMDGPU::SI_SPILL_S512_RESTORE; break;
				473	default: llvm_unreachable("Cannot spill register class");
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	474	}
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	475
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	476	FrameInfo->setObjectAlignment(FrameIndex, 4);
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	477	BuildMI(MBB, MI, DL, get(Opcode), DestReg)
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	478	.addFrameIndex(FrameIndex);
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	479	} else {
				480	llvm_unreachable("VGPR spilling not supported");
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	481	}
				482	}
				483
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	484	void SIInstrInfo::insertNOPs(MachineBasicBlock::iterator MI,
				485	int Count) const {
				486	while (Count > 0) {
				487	int Arg;
				488	if (Count >= 8)
				489	Arg = 7;
				490	else
				491	Arg = Count - 1;
				492	Count -= 8;
				493	BuildMI(*MI->getParent(), MI, MI->getDebugLoc(), get(AMDGPU::S_NOP))
				494	.addImm(Arg);
				495	}
				496	}
				497
				498	bool SIInstrInfo::expandPostRAPseudo(MachineBasicBlock::iterator MI) const {
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	499	MachineBasicBlock &MBB = *MI->getParent();
				500	DebugLoc DL = MBB.findDebugLoc(MI);
				501	switch (MI->getOpcode()) {
				502	default: return AMDGPUInstrInfo::expandPostRAPseudo(MI);
				503
Tom Stellard	067c815	2014-07-21 14:01:14 +0000	[diff] [blame]	504	case AMDGPU::SI_CONSTDATA_PTR: {
				505	unsigned Reg = MI->getOperand(0).getReg();
				506	unsigned RegLo = RI.getSubReg(Reg, AMDGPU::sub0);
				507	unsigned RegHi = RI.getSubReg(Reg, AMDGPU::sub1);
				508
				509	BuildMI(MBB, MI, DL, get(AMDGPU::S_GETPC_B64), Reg);
				510
				511	// Add 32-bit offset from this instruction to the start of the constant data.
Tom Stellard	80942a1	2014-09-05 14:07:59 +0000	[diff] [blame]	512	BuildMI(MBB, MI, DL, get(AMDGPU::S_ADD_U32), RegLo)
Tom Stellard	067c815	2014-07-21 14:01:14 +0000	[diff] [blame]	513	.addReg(RegLo)
				514	.addTargetIndex(AMDGPU::TI_CONSTDATA_START)
				515	.addReg(AMDGPU::SCC, RegState::Define \| RegState::Implicit);
				516	BuildMI(MBB, MI, DL, get(AMDGPU::S_ADDC_U32), RegHi)
				517	.addReg(RegHi)
				518	.addImm(0)
				519	.addReg(AMDGPU::SCC, RegState::Define \| RegState::Implicit)
				520	.addReg(AMDGPU::SCC, RegState::Implicit);
				521	MI->eraseFromParent();
				522	break;
				523	}
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	524	}
				525	return true;
				526	}
				527
Christian Konig	76edd4f	2013-02-26 17:52:29 +0000	[diff] [blame]	528	MachineInstr SIInstrInfo::commuteInstruction(MachineInstr MI,
				529	bool NewMI) const {
				530
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	531	if (MI->getNumOperands() < 3 \|\| !MI->getOperand(1).isReg())
Craig Topper	062a2ba	2014-04-25 05:30:21 +0000	[diff] [blame]	532	return nullptr;
Christian Konig	76edd4f	2013-02-26 17:52:29 +0000	[diff] [blame]	533
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	534	// Make sure it s legal to commute operands for VOP2.
				535	if (isVOP2(MI->getOpcode()) &&
				536	(!isOperandLegal(MI, 1, &MI->getOperand(2)) \|\|
				537	!isOperandLegal(MI, 2, &MI->getOperand(1))))
				538	return nullptr;
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	539
				540	if (!MI->getOperand(2).isReg()) {
				541	// XXX: Commute instructions with FPImm operands
				542	if (NewMI \|\| MI->getOperand(2).isFPImm() \|\|
				543	(!isVOP2(MI->getOpcode()) && !isVOP3(MI->getOpcode()))) {
Craig Topper	062a2ba	2014-04-25 05:30:21 +0000	[diff] [blame]	544	return nullptr;
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	545	}
				546
Tom Stellard	b4a313a	2014-08-01 00:32:39 +0000	[diff] [blame]	547	// XXX: Commute VOP3 instructions with abs and neg set .
				548	const MachineOperand Abs = getNamedOperand(MI, AMDGPU::OpName::abs);
				549	const MachineOperand Neg = getNamedOperand(MI, AMDGPU::OpName::neg);
				550	const MachineOperand Src0Mods = getNamedOperand(MI,
				551	AMDGPU::OpName::src0_modifiers);
				552	const MachineOperand Src1Mods = getNamedOperand(MI,
				553	AMDGPU::OpName::src1_modifiers);
				554	const MachineOperand Src2Mods = getNamedOperand(MI,
				555	AMDGPU::OpName::src2_modifiers);
				556
				557	if ((Abs && Abs->getImm()) \|\| (Neg && Neg->getImm()) \|\|
				558	(Src0Mods && Src0Mods->getImm()) \|\| (Src1Mods && Src1Mods->getImm()) \|\|
				559	(Src2Mods && Src2Mods->getImm()))
Craig Topper	062a2ba	2014-04-25 05:30:21 +0000	[diff] [blame]	560	return nullptr;
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	561
				562	unsigned Reg = MI->getOperand(1).getReg();
Andrew Trick	e339828	2013-12-17 04:50:45 +0000	[diff] [blame]	563	unsigned SubReg = MI->getOperand(1).getSubReg();
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	564	MI->getOperand(1).ChangeToImmediate(MI->getOperand(2).getImm());
				565	MI->getOperand(2).ChangeToRegister(Reg, false);
Andrew Trick	e339828	2013-12-17 04:50:45 +0000	[diff] [blame]	566	MI->getOperand(2).setSubReg(SubReg);
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	567	} else {
				568	MI = TargetInstrInfo::commuteInstruction(MI, NewMI);
				569	}
Christian Konig	3c14580	2013-03-27 09:12:59 +0000	[diff] [blame]	570
				571	if (MI)
				572	MI->setDesc(get(commuteOpcode(MI->getOpcode())));
				573
				574	return MI;
Christian Konig	76edd4f	2013-02-26 17:52:29 +0000	[diff] [blame]	575	}
				576
Tom Stellard	26a3b67	2013-10-22 18:19:10 +0000	[diff] [blame]	577	MachineInstr SIInstrInfo::buildMovInstr(MachineBasicBlock MBB,
				578	MachineBasicBlock::iterator I,
				579	unsigned DstReg,
				580	unsigned SrcReg) const {
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	581	return BuildMI(*MBB, I, MBB->findDebugLoc(I), get(AMDGPU::V_MOV_B32_e32),
				582	DstReg) .addReg(SrcReg);
Tom Stellard	26a3b67	2013-10-22 18:19:10 +0000	[diff] [blame]	583	}
				584
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	585	bool SIInstrInfo::isMov(unsigned Opcode) const {
				586	switch(Opcode) {
				587	default: return false;
				588	case AMDGPU::S_MOV_B32:
				589	case AMDGPU::S_MOV_B64:
				590	case AMDGPU::V_MOV_B32_e32:
				591	case AMDGPU::V_MOV_B32_e64:
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	592	return true;
				593	}
				594	}
				595
				596	bool
				597	SIInstrInfo::isSafeToMoveRegClassDefs(const TargetRegisterClass *RC) const {
				598	return RC != &AMDGPU::EXECRegRegClass;
				599	}
Tom Stellard	f3b2a1e	2013-02-06 17:32:29 +0000	[diff] [blame]	600
Tom Stellard	30f5941	2014-03-31 14:01:56 +0000	[diff] [blame]	601	bool
				602	SIInstrInfo::isTriviallyReMaterializable(const MachineInstr *MI,
				603	AliasAnalysis *AA) const {
				604	switch(MI->getOpcode()) {
				605	default: return AMDGPUInstrInfo::isTriviallyReMaterializable(MI, AA);
				606	case AMDGPU::S_MOV_B32:
				607	case AMDGPU::S_MOV_B64:
				608	case AMDGPU::V_MOV_B32_e32:
				609	return MI->getOperand(1).isImm();
				610	}
				611	}
				612
Tom Stellard	5d7aaae	2014-02-10 16:58:30 +0000	[diff] [blame]	613	namespace llvm {
				614	namespace AMDGPU {
				615	// Helper function generated by tablegen. We are wrapping this with
Matt Arsenault	57e74d2	2014-07-29 00:02:40 +0000	[diff] [blame]	616	// an SIInstrInfo function that returns bool rather than int.
Tom Stellard	5d7aaae	2014-02-10 16:58:30 +0000	[diff] [blame]	617	int isDS(uint16_t Opcode);
				618	}
				619	}
				620
				621	bool SIInstrInfo::isDS(uint16_t Opcode) const {
				622	return ::AMDGPU::isDS(Opcode) != -1;
				623	}
				624
Matt Arsenault	b9f46ee	2014-07-28 17:59:38 +0000	[diff] [blame]	625	bool SIInstrInfo::isMIMG(uint16_t Opcode) const {
Tom Stellard	16a9a20	2013-08-14 23:24:17 +0000	[diff] [blame]	626	return get(Opcode).TSFlags & SIInstrFlags::MIMG;
				627	}
				628
Matt Arsenault	b9f46ee	2014-07-28 17:59:38 +0000	[diff] [blame]	629	bool SIInstrInfo::isSMRD(uint16_t Opcode) const {
Michel Danzer	20680b1	2013-08-16 16:19:24 +0000	[diff] [blame]	630	return get(Opcode).TSFlags & SIInstrFlags::SMRD;
				631	}
				632
Matt Arsenault	e2fabd3	2014-07-29 18:51:56 +0000	[diff] [blame]	633	bool SIInstrInfo::isMUBUF(uint16_t Opcode) const {
				634	return get(Opcode).TSFlags & SIInstrFlags::MUBUF;
				635	}
				636
				637	bool SIInstrInfo::isMTBUF(uint16_t Opcode) const {
				638	return get(Opcode).TSFlags & SIInstrFlags::MTBUF;
				639	}
				640
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	641	bool SIInstrInfo::isVOP1(uint16_t Opcode) const {
				642	return get(Opcode).TSFlags & SIInstrFlags::VOP1;
				643	}
				644
				645	bool SIInstrInfo::isVOP2(uint16_t Opcode) const {
				646	return get(Opcode).TSFlags & SIInstrFlags::VOP2;
				647	}
				648
				649	bool SIInstrInfo::isVOP3(uint16_t Opcode) const {
				650	return get(Opcode).TSFlags & SIInstrFlags::VOP3;
				651	}
				652
				653	bool SIInstrInfo::isVOPC(uint16_t Opcode) const {
				654	return get(Opcode).TSFlags & SIInstrFlags::VOPC;
				655	}
				656
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	657	bool SIInstrInfo::isSALUInstr(const MachineInstr &MI) const {
				658	return get(MI.getOpcode()).TSFlags & SIInstrFlags::SALU;
				659	}
				660
Matt Arsenault	d7bdcc4	2014-03-31 19:54:27 +0000	[diff] [blame]	661	bool SIInstrInfo::isInlineConstant(const APInt &Imm) const {
				662	int32_t Val = Imm.getSExtValue();
				663	if (Val >= -16 && Val <= 64)
				664	return true;
Tom Stellard	d008446	2014-03-17 17:03:52 +0000	[diff] [blame]	665
				666	// The actual type of the operand does not seem to matter as long
				667	// as the bits match one of the inline immediate values. For example:
				668	//
				669	// -nan has the hexadecimal encoding of 0xfffffffe which is -2 in decimal,
				670	// so it is a legal inline immediate.
				671	//
				672	// 1065353216 has the hexadecimal encoding 0x3f800000 which is 1.0f in
				673	// floating-point, so it is a legal inline immediate.
Matt Arsenault	d7bdcc4	2014-03-31 19:54:27 +0000	[diff] [blame]	674
				675	return (APInt::floatToBits(0.0f) == Imm) \|\|
				676	(APInt::floatToBits(1.0f) == Imm) \|\|
				677	(APInt::floatToBits(-1.0f) == Imm) \|\|
				678	(APInt::floatToBits(0.5f) == Imm) \|\|
				679	(APInt::floatToBits(-0.5f) == Imm) \|\|
				680	(APInt::floatToBits(2.0f) == Imm) \|\|
				681	(APInt::floatToBits(-2.0f) == Imm) \|\|
				682	(APInt::floatToBits(4.0f) == Imm) \|\|
				683	(APInt::floatToBits(-4.0f) == Imm);
				684	}
				685
				686	bool SIInstrInfo::isInlineConstant(const MachineOperand &MO) const {
				687	if (MO.isImm())
				688	return isInlineConstant(APInt(32, MO.getImm(), true));
				689
				690	if (MO.isFPImm()) {
				691	APFloat FpImm = MO.getFPImm()->getValueAPF();
				692	return isInlineConstant(FpImm.bitcastToAPInt());
				693	}
				694
				695	return false;
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	696	}
				697
				698	bool SIInstrInfo::isLiteralConstant(const MachineOperand &MO) const {
				699	return (MO.isImm() \|\| MO.isFPImm()) && !isInlineConstant(MO);
				700	}
				701
Matt Arsenault	becb140	2014-06-23 18:28:31 +0000	[diff] [blame]	702	static bool compareMachineOp(const MachineOperand &Op0,
				703	const MachineOperand &Op1) {
				704	if (Op0.getType() != Op1.getType())
				705	return false;
				706
				707	switch (Op0.getType()) {
				708	case MachineOperand::MO_Register:
				709	return Op0.getReg() == Op1.getReg();
				710	case MachineOperand::MO_Immediate:
				711	return Op0.getImm() == Op1.getImm();
				712	case MachineOperand::MO_FPImmediate:
				713	return Op0.getFPImm() == Op1.getFPImm();
				714	default:
				715	llvm_unreachable("Didn't expect to be comparing these operand types");
				716	}
				717	}
				718
Tom Stellard	b02094e	2014-07-21 15:45:01 +0000	[diff] [blame]	719	bool SIInstrInfo::isImmOperandLegal(const MachineInstr *MI, unsigned OpNo,
				720	const MachineOperand &MO) const {
				721	const MCOperandInfo &OpInfo = get(MI->getOpcode()).OpInfo[OpNo];
				722
				723	assert(MO.isImm() \|\| MO.isFPImm());
				724
				725	if (OpInfo.OperandType == MCOI::OPERAND_IMMEDIATE)
				726	return true;
				727
				728	if (OpInfo.RegClass < 0)
				729	return false;
				730
				731	return RI.regClassCanUseImmediate(OpInfo.RegClass);
				732	}
				733
Matt Arsenault	b2baffa	2014-08-15 17:49:05 +0000	[diff] [blame]	734	bool SIInstrInfo::canFoldOffset(unsigned OffsetSize, unsigned AS) {
				735	switch (AS) {
				736	case AMDGPUAS::GLOBAL_ADDRESS: {
				737	// MUBUF instructions a 12-bit offset in bytes.
				738	return isUInt<12>(OffsetSize);
				739	}
				740	case AMDGPUAS::CONSTANT_ADDRESS: {
				741	// SMRD instructions have an 8-bit offset in dwords.
				742	return (OffsetSize % 4 == 0) && isUInt<8>(OffsetSize / 4);
				743	}
				744	case AMDGPUAS::LOCAL_ADDRESS:
				745	case AMDGPUAS::REGION_ADDRESS: {
				746	// The single offset versions have a 16-bit offset in bytes.
				747	return isUInt<16>(OffsetSize);
				748	}
				749	case AMDGPUAS::PRIVATE_ADDRESS:
				750	// Indirect register addressing does not use any offsets.
				751	default:
				752	return 0;
				753	}
				754	}
				755
Tom Stellard	86d12eb	2014-08-01 00:32:28 +0000	[diff] [blame]	756	bool SIInstrInfo::hasVALU32BitEncoding(unsigned Opcode) const {
				757	return AMDGPU::getVOPe32(Opcode) != -1;
				758	}
				759
Tom Stellard	b4a313a	2014-08-01 00:32:39 +0000	[diff] [blame]	760	bool SIInstrInfo::hasModifiers(unsigned Opcode) const {
				761	// The src0_modifier operand is present on all instructions
				762	// that have modifiers.
				763
				764	return AMDGPU::getNamedOperandIdx(Opcode,
				765	AMDGPU::OpName::src0_modifiers) != -1;
				766	}
				767
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	768	bool SIInstrInfo::verifyInstruction(const MachineInstr *MI,
				769	StringRef &ErrInfo) const {
				770	uint16_t Opcode = MI->getOpcode();
				771	int Src0Idx = AMDGPU::getNamedOperandIdx(Opcode, AMDGPU::OpName::src0);
				772	int Src1Idx = AMDGPU::getNamedOperandIdx(Opcode, AMDGPU::OpName::src1);
				773	int Src2Idx = AMDGPU::getNamedOperandIdx(Opcode, AMDGPU::OpName::src2);
				774
Tom Stellard	ca700e4	2014-03-17 17:03:49 +0000	[diff] [blame]	775	// Make sure the number of operands is correct.
				776	const MCInstrDesc &Desc = get(Opcode);
				777	if (!Desc.isVariadic() &&
				778	Desc.getNumOperands() != MI->getNumExplicitOperands()) {
				779	ErrInfo = "Instruction has wrong number of operands.";
				780	return false;
				781	}
				782
				783	// Make sure the register classes are correct
Tom Stellard	b4a313a	2014-08-01 00:32:39 +0000	[diff] [blame]	784	for (int i = 0, e = Desc.getNumOperands(); i != e; ++i) {
Tom Stellard	ca700e4	2014-03-17 17:03:49 +0000	[diff] [blame]	785	switch (Desc.OpInfo[i].OperandType) {
Tom Stellard	a305f93	2014-07-02 20:53:44 +0000	[diff] [blame]	786	case MCOI::OPERAND_REGISTER: {
				787	int RegClass = Desc.OpInfo[i].RegClass;
				788	if (!RI.regClassCanUseImmediate(RegClass) &&
				789	(MI->getOperand(i).isImm() \|\| MI->getOperand(i).isFPImm())) {
Tom Stellard	b4a313a	2014-08-01 00:32:39 +0000	[diff] [blame]	790	// Handle some special cases:
				791	// Src0 can of VOP1, VOP2, VOPC can be an immediate no matter what
				792	// the register class.
				793	if (i != Src0Idx \|\| (!isVOP1(Opcode) && !isVOP2(Opcode) &&
				794	!isVOPC(Opcode))) {
				795	ErrInfo = "Expected register, but got immediate";
				796	return false;
				797	}
Tom Stellard	a305f93	2014-07-02 20:53:44 +0000	[diff] [blame]	798	}
				799	}
Tom Stellard	ca700e4	2014-03-17 17:03:49 +0000	[diff] [blame]	800	break;
				801	case MCOI::OPERAND_IMMEDIATE:
Tom Stellard	b02094e	2014-07-21 15:45:01 +0000	[diff] [blame]	802	// Check if this operand is an immediate.
				803	// FrameIndex operands will be replaced by immediates, so they are
				804	// allowed.
				805	if (!MI->getOperand(i).isImm() && !MI->getOperand(i).isFPImm() &&
				806	!MI->getOperand(i).isFI()) {
Tom Stellard	ca700e4	2014-03-17 17:03:49 +0000	[diff] [blame]	807	ErrInfo = "Expected immediate, but got non-immediate";
				808	return false;
				809	}
				810	// Fall-through
				811	default:
				812	continue;
				813	}
				814
				815	if (!MI->getOperand(i).isReg())
				816	continue;
				817
				818	int RegClass = Desc.OpInfo[i].RegClass;
				819	if (RegClass != -1) {
				820	unsigned Reg = MI->getOperand(i).getReg();
				821	if (TargetRegisterInfo::isVirtualRegister(Reg))
				822	continue;
				823
				824	const TargetRegisterClass *RC = RI.getRegClass(RegClass);
				825	if (!RC->contains(Reg)) {
				826	ErrInfo = "Operand has incorrect register class.";
				827	return false;
				828	}
				829	}
				830	}
				831
				832
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	833	// Verify VOP*
				834	if (isVOP1(Opcode) \|\| isVOP2(Opcode) \|\| isVOP3(Opcode) \|\| isVOPC(Opcode)) {
				835	unsigned ConstantBusCount = 0;
				836	unsigned SGPRUsed = AMDGPU::NoRegister;
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	837	for (int i = 0, e = MI->getNumOperands(); i != e; ++i) {
				838	const MachineOperand &MO = MI->getOperand(i);
				839	if (MO.isReg() && MO.isUse() &&
				840	!TargetRegisterInfo::isVirtualRegister(MO.getReg())) {
				841
				842	// EXEC register uses the constant bus.
				843	if (!MO.isImplicit() && MO.getReg() == AMDGPU::EXEC)
				844	++ConstantBusCount;
				845
				846	// SGPRs use the constant bus
				847	if (MO.getReg() == AMDGPU::M0 \|\| MO.getReg() == AMDGPU::VCC \|\|
				848	(!MO.isImplicit() &&
				849	(AMDGPU::SGPR_32RegClass.contains(MO.getReg()) \|\|
				850	AMDGPU::SGPR_64RegClass.contains(MO.getReg())))) {
				851	if (SGPRUsed != MO.getReg()) {
				852	++ConstantBusCount;
				853	SGPRUsed = MO.getReg();
				854	}
				855	}
				856	}
				857	// Literal constants use the constant bus.
				858	if (isLiteralConstant(MO))
				859	++ConstantBusCount;
				860	}
				861	if (ConstantBusCount > 1) {
				862	ErrInfo = "VOP* instruction uses the constant bus more than once";
				863	return false;
				864	}
				865	}
				866
				867	// Verify SRC1 for VOP2 and VOPC
				868	if (Src1Idx != -1 && (isVOP2(Opcode) \|\| isVOPC(Opcode))) {
				869	const MachineOperand &Src1 = MI->getOperand(Src1Idx);
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	870	if (Src1.isImm() \|\| Src1.isFPImm()) {
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	871	ErrInfo = "VOP[2C] src1 cannot be an immediate.";
				872	return false;
				873	}
				874	}
				875
				876	// Verify VOP3
				877	if (isVOP3(Opcode)) {
				878	if (Src0Idx != -1 && isLiteralConstant(MI->getOperand(Src0Idx))) {
				879	ErrInfo = "VOP3 src0 cannot be a literal constant.";
				880	return false;
				881	}
				882	if (Src1Idx != -1 && isLiteralConstant(MI->getOperand(Src1Idx))) {
				883	ErrInfo = "VOP3 src1 cannot be a literal constant.";
				884	return false;
				885	}
				886	if (Src2Idx != -1 && isLiteralConstant(MI->getOperand(Src2Idx))) {
				887	ErrInfo = "VOP3 src2 cannot be a literal constant.";
				888	return false;
				889	}
				890	}
Matt Arsenault	becb140	2014-06-23 18:28:31 +0000	[diff] [blame]	891
				892	// Verify misc. restrictions on specific instructions.
				893	if (Desc.getOpcode() == AMDGPU::V_DIV_SCALE_F32 \|\|
				894	Desc.getOpcode() == AMDGPU::V_DIV_SCALE_F64) {
				895	MI->dump();
				896
				897	const MachineOperand &Src0 = MI->getOperand(2);
				898	const MachineOperand &Src1 = MI->getOperand(3);
				899	const MachineOperand &Src2 = MI->getOperand(4);
				900	if (Src0.isReg() && Src1.isReg() && Src2.isReg()) {
				901	if (!compareMachineOp(Src0, Src1) &&
				902	!compareMachineOp(Src0, Src2)) {
				903	ErrInfo = "v_div_scale_{f32\|f64} require src0 = src1 or src2";
				904	return false;
				905	}
				906	}
				907	}
				908
Tom Stellard	93fabce	2013-10-10 17:11:55 +0000	[diff] [blame]	909	return true;
				910	}
				911
Matt Arsenault	f14032a	2013-11-15 22:02:28 +0000	[diff] [blame]	912	unsigned SIInstrInfo::getVALUOp(const MachineInstr &MI) {
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	913	switch (MI.getOpcode()) {
				914	default: return AMDGPU::INSTRUCTION_LIST_END;
				915	case AMDGPU::REG_SEQUENCE: return AMDGPU::REG_SEQUENCE;
				916	case AMDGPU::COPY: return AMDGPU::COPY;
				917	case AMDGPU::PHI: return AMDGPU::PHI;
Tom Stellard	204e61b	2014-04-07 19:45:45 +0000	[diff] [blame]	918	case AMDGPU::INSERT_SUBREG: return AMDGPU::INSERT_SUBREG;
Tom Stellard	e038720	2014-03-21 15:51:54 +0000	[diff] [blame]	919	case AMDGPU::S_MOV_B32:
				920	return MI.getOperand(1).isReg() ?
Tom Stellard	8c12fd9	2014-03-24 16:12:34 +0000	[diff] [blame]	921	AMDGPU::COPY : AMDGPU::V_MOV_B32_e32;
Tom Stellard	80942a1	2014-09-05 14:07:59 +0000	[diff] [blame]	922	case AMDGPU::S_ADD_I32:
				923	case AMDGPU::S_ADD_U32: return AMDGPU::V_ADD_I32_e32;
Matt Arsenault	43b8e4e	2013-11-18 20:09:29 +0000	[diff] [blame]	924	case AMDGPU::S_ADDC_U32: return AMDGPU::V_ADDC_U32_e32;
Tom Stellard	80942a1	2014-09-05 14:07:59 +0000	[diff] [blame]	925	case AMDGPU::S_SUB_I32:
				926	case AMDGPU::S_SUB_U32: return AMDGPU::V_SUB_I32_e32;
Matt Arsenault	43b8e4e	2013-11-18 20:09:29 +0000	[diff] [blame]	927	case AMDGPU::S_SUBB_U32: return AMDGPU::V_SUBB_U32_e32;
Matt Arsenault	869cd07	2014-09-03 23:24:35 +0000	[diff] [blame]	928	case AMDGPU::S_MUL_I32: return AMDGPU::V_MUL_LO_I32;
Matt Arsenault	8e2581b	2014-03-21 18:01:18 +0000	[diff] [blame]	929	case AMDGPU::S_AND_B32: return AMDGPU::V_AND_B32_e32;
				930	case AMDGPU::S_OR_B32: return AMDGPU::V_OR_B32_e32;
				931	case AMDGPU::S_XOR_B32: return AMDGPU::V_XOR_B32_e32;
				932	case AMDGPU::S_MIN_I32: return AMDGPU::V_MIN_I32_e32;
				933	case AMDGPU::S_MIN_U32: return AMDGPU::V_MIN_U32_e32;
				934	case AMDGPU::S_MAX_I32: return AMDGPU::V_MAX_I32_e32;
				935	case AMDGPU::S_MAX_U32: return AMDGPU::V_MAX_U32_e32;
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	936	case AMDGPU::S_ASHR_I32: return AMDGPU::V_ASHR_I32_e32;
				937	case AMDGPU::S_ASHR_I64: return AMDGPU::V_ASHR_I64;
				938	case AMDGPU::S_LSHL_B32: return AMDGPU::V_LSHL_B32_e32;
				939	case AMDGPU::S_LSHL_B64: return AMDGPU::V_LSHL_B64;
				940	case AMDGPU::S_LSHR_B32: return AMDGPU::V_LSHR_B32_e32;
				941	case AMDGPU::S_LSHR_B64: return AMDGPU::V_LSHR_B64;
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	942	case AMDGPU::S_SEXT_I32_I8: return AMDGPU::V_BFE_I32;
				943	case AMDGPU::S_SEXT_I32_I16: return AMDGPU::V_BFE_I32;
Matt Arsenault	78b8670	2014-04-18 05:19:26 +0000	[diff] [blame]	944	case AMDGPU::S_BFE_U32: return AMDGPU::V_BFE_U32;
				945	case AMDGPU::S_BFE_I32: return AMDGPU::V_BFE_I32;
Matt Arsenault	43160e7	2014-06-18 17:13:57 +0000	[diff] [blame]	946	case AMDGPU::S_BREV_B32: return AMDGPU::V_BFREV_B32_e32;
Matt Arsenault	2c33562	2014-04-09 07:16:16 +0000	[diff] [blame]	947	case AMDGPU::S_NOT_B32: return AMDGPU::V_NOT_B32_e32;
Matt Arsenault	689f325	2014-06-09 16:36:31 +0000	[diff] [blame]	948	case AMDGPU::S_NOT_B64: return AMDGPU::V_NOT_B32_e32;
Matt Arsenault	0cb92e1	2014-04-11 19:25:18 +0000	[diff] [blame]	949	case AMDGPU::S_CMP_EQ_I32: return AMDGPU::V_CMP_EQ_I32_e32;
				950	case AMDGPU::S_CMP_LG_I32: return AMDGPU::V_CMP_NE_I32_e32;
				951	case AMDGPU::S_CMP_GT_I32: return AMDGPU::V_CMP_GT_I32_e32;
				952	case AMDGPU::S_CMP_GE_I32: return AMDGPU::V_CMP_GE_I32_e32;
				953	case AMDGPU::S_CMP_LT_I32: return AMDGPU::V_CMP_LT_I32_e32;
				954	case AMDGPU::S_CMP_LE_I32: return AMDGPU::V_CMP_LE_I32_e32;
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	955	case AMDGPU::S_LOAD_DWORD_IMM:
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	956	case AMDGPU::S_LOAD_DWORD_SGPR: return AMDGPU::BUFFER_LOAD_DWORD_ADDR64;
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	957	case AMDGPU::S_LOAD_DWORDX2_IMM:
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	958	case AMDGPU::S_LOAD_DWORDX2_SGPR: return AMDGPU::BUFFER_LOAD_DWORDX2_ADDR64;
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	959	case AMDGPU::S_LOAD_DWORDX4_IMM:
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	960	case AMDGPU::S_LOAD_DWORDX4_SGPR: return AMDGPU::BUFFER_LOAD_DWORDX4_ADDR64;
Matt Arsenault	b5b5110	2014-06-10 19:18:21 +0000	[diff] [blame]	961	case AMDGPU::S_BCNT1_I32_B32: return AMDGPU::V_BCNT_U32_B32_e32;
Matt Arsenault	295b86e	2014-06-17 17:36:27 +0000	[diff] [blame]	962	case AMDGPU::S_FF1_I32_B32: return AMDGPU::V_FFBL_B32_e32;
Matt Arsenault	8579601	2014-06-17 17:36:24 +0000	[diff] [blame]	963	case AMDGPU::S_FLBIT_I32_B32: return AMDGPU::V_FFBH_U32_e32;
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	964	}
				965	}
				966
				967	bool SIInstrInfo::isSALUOpSupportedOnVALU(const MachineInstr &MI) const {
				968	return getVALUOp(MI) != AMDGPU::INSTRUCTION_LIST_END;
				969	}
				970
				971	const TargetRegisterClass *SIInstrInfo::getOpRegClass(const MachineInstr &MI,
				972	unsigned OpNo) const {
				973	const MachineRegisterInfo &MRI = MI.getParent()->getParent()->getRegInfo();
				974	const MCInstrDesc &Desc = get(MI.getOpcode());
				975	if (MI.isVariadic() \|\| OpNo >= Desc.getNumOperands() \|\|
				976	Desc.OpInfo[OpNo].RegClass == -1)
				977	return MRI.getRegClass(MI.getOperand(OpNo).getReg());
				978
				979	unsigned RCID = Desc.OpInfo[OpNo].RegClass;
				980	return RI.getRegClass(RCID);
				981	}
				982
				983	bool SIInstrInfo::canReadVGPR(const MachineInstr &MI, unsigned OpNo) const {
				984	switch (MI.getOpcode()) {
				985	case AMDGPU::COPY:
				986	case AMDGPU::REG_SEQUENCE:
Tom Stellard	4f3b04d	2014-04-17 21:00:07 +0000	[diff] [blame]	987	case AMDGPU::PHI:
Tom Stellard	a568738	2014-05-15 14:41:55 +0000	[diff] [blame]	988	case AMDGPU::INSERT_SUBREG:
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	989	return RI.hasVGPRs(getOpRegClass(MI, 0));
				990	default:
				991	return RI.hasVGPRs(getOpRegClass(MI, OpNo));
				992	}
				993	}
				994
				995	void SIInstrInfo::legalizeOpWithMove(MachineInstr *MI, unsigned OpIdx) const {
				996	MachineBasicBlock::iterator I = MI;
				997	MachineOperand &MO = MI->getOperand(OpIdx);
				998	MachineRegisterInfo &MRI = MI->getParent()->getParent()->getRegInfo();
				999	unsigned RCID = get(MI->getOpcode()).OpInfo[OpIdx].RegClass;
				1000	const TargetRegisterClass *RC = RI.getRegClass(RCID);
				1001	unsigned Opcode = AMDGPU::V_MOV_B32_e32;
				1002	if (MO.isReg()) {
				1003	Opcode = AMDGPU::COPY;
				1004	} else if (RI.isSGPRClass(RC)) {
Matt Arsenault	671a005	2013-11-14 10:08:50 +0000	[diff] [blame]	1005	Opcode = AMDGPU::S_MOV_B32;
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1006	}
				1007
Matt Arsenault	3a4d86a	2013-11-18 20:09:55 +0000	[diff] [blame]	1008	const TargetRegisterClass *VRC = RI.getEquivalentVGPRClass(RC);
Tom Stellard	0c93c9e	2014-09-05 14:08:01 +0000	[diff] [blame]	1009	if (RI.getCommonSubClass(&AMDGPU::VReg_64RegClass, VRC)) {
				1010	VRC = &AMDGPU::VReg_64RegClass;
				1011	} else {
				1012	VRC = &AMDGPU::VReg_32RegClass;
				1013	}
Matt Arsenault	3a4d86a	2013-11-18 20:09:55 +0000	[diff] [blame]	1014	unsigned Reg = MRI.createVirtualRegister(VRC);
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1015	BuildMI(*MI->getParent(), I, MI->getParent()->findDebugLoc(I), get(Opcode),
				1016	Reg).addOperand(MO);
				1017	MO.ChangeToRegister(Reg, false);
				1018	}
				1019
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1020	unsigned SIInstrInfo::buildExtractSubReg(MachineBasicBlock::iterator MI,
				1021	MachineRegisterInfo &MRI,
				1022	MachineOperand &SuperReg,
				1023	const TargetRegisterClass *SuperRC,
				1024	unsigned SubIdx,
				1025	const TargetRegisterClass *SubRC)
				1026	const {
				1027	assert(SuperReg.isReg());
				1028
				1029	unsigned NewSuperReg = MRI.createVirtualRegister(SuperRC);
				1030	unsigned SubReg = MRI.createVirtualRegister(SubRC);
				1031
				1032	// Just in case the super register is itself a sub-register, copy it to a new
Matt Arsenault	08d8494	2014-06-03 23:06:13 +0000	[diff] [blame]	1033	// value so we don't need to worry about merging its subreg index with the
				1034	// SubIdx passed to this function. The register coalescer should be able to
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1035	// eliminate this extra copy.
				1036	BuildMI(*MI->getParent(), MI, MI->getDebugLoc(), get(TargetOpcode::COPY),
				1037	NewSuperReg)
				1038	.addOperand(SuperReg);
				1039
				1040	BuildMI(*MI->getParent(), MI, MI->getDebugLoc(), get(TargetOpcode::COPY),
				1041	SubReg)
				1042	.addReg(NewSuperReg, 0, SubIdx);
				1043	return SubReg;
				1044	}
				1045
Matt Arsenault	248b7b6	2014-03-24 20:08:09 +0000	[diff] [blame]	1046	MachineOperand SIInstrInfo::buildExtractSubRegOrImm(
				1047	MachineBasicBlock::iterator MII,
				1048	MachineRegisterInfo &MRI,
				1049	MachineOperand &Op,
				1050	const TargetRegisterClass *SuperRC,
				1051	unsigned SubIdx,
				1052	const TargetRegisterClass *SubRC) const {
				1053	if (Op.isImm()) {
				1054	// XXX - Is there a better way to do this?
				1055	if (SubIdx == AMDGPU::sub0)
				1056	return MachineOperand::CreateImm(Op.getImm() & 0xFFFFFFFF);
				1057	if (SubIdx == AMDGPU::sub1)
				1058	return MachineOperand::CreateImm(Op.getImm() >> 32);
				1059
				1060	llvm_unreachable("Unhandled register index for immediate");
				1061	}
				1062
				1063	unsigned SubReg = buildExtractSubReg(MII, MRI, Op, SuperRC,
				1064	SubIdx, SubRC);
				1065	return MachineOperand::CreateReg(SubReg, false);
				1066	}
				1067
Matt Arsenault	bd99580	2014-03-24 18:26:52 +0000	[diff] [blame]	1068	unsigned SIInstrInfo::split64BitImm(SmallVectorImpl<MachineInstr *> &Worklist,
				1069	MachineBasicBlock::iterator MI,
				1070	MachineRegisterInfo &MRI,
				1071	const TargetRegisterClass *RC,
				1072	const MachineOperand &Op) const {
				1073	MachineBasicBlock *MBB = MI->getParent();
				1074	DebugLoc DL = MI->getDebugLoc();
				1075	unsigned LoDst = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
				1076	unsigned HiDst = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
				1077	unsigned Dst = MRI.createVirtualRegister(RC);
				1078
				1079	MachineInstr Lo = BuildMI(MBB, MI, DL, get(AMDGPU::S_MOV_B32),
				1080	LoDst)
				1081	.addImm(Op.getImm() & 0xFFFFFFFF);
				1082	MachineInstr Hi = BuildMI(MBB, MI, DL, get(AMDGPU::S_MOV_B32),
				1083	HiDst)
				1084	.addImm(Op.getImm() >> 32);
				1085
				1086	BuildMI(*MBB, MI, DL, get(TargetOpcode::REG_SEQUENCE), Dst)
				1087	.addReg(LoDst)
				1088	.addImm(AMDGPU::sub0)
				1089	.addReg(HiDst)
				1090	.addImm(AMDGPU::sub1);
				1091
				1092	Worklist.push_back(Lo);
				1093	Worklist.push_back(Hi);
				1094
				1095	return Dst;
				1096	}
				1097
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1098	bool SIInstrInfo::isOperandLegal(const MachineInstr *MI, unsigned OpIdx,
				1099	const MachineOperand *MO) const {
				1100	const MachineRegisterInfo &MRI = MI->getParent()->getParent()->getRegInfo();
				1101	const MCInstrDesc &InstDesc = get(MI->getOpcode());
				1102	const MCOperandInfo &OpInfo = InstDesc.OpInfo[OpIdx];
				1103	const TargetRegisterClass *DefinedRC =
				1104	OpInfo.RegClass != -1 ? RI.getRegClass(OpInfo.RegClass) : nullptr;
				1105	if (!MO)
				1106	MO = &MI->getOperand(OpIdx);
				1107
				1108	if (MO->isReg()) {
				1109	assert(DefinedRC);
				1110	const TargetRegisterClass *RC = MRI.getRegClass(MO->getReg());
				1111	return RI.getCommonSubClass(RC, RI.getRegClass(OpInfo.RegClass));
				1112	}
				1113
				1114
				1115	// Handle non-register types that are treated like immediates.
				1116	assert(MO->isImm() \|\| MO->isFPImm() \|\| MO->isTargetIndex() \|\| MO->isFI());
				1117
				1118	if (!DefinedRC)
				1119	// This opperand expects an immediate
				1120	return true;
				1121
				1122	return RI.regClassCanUseImmediate(DefinedRC);
				1123	}
				1124
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1125	void SIInstrInfo::legalizeOperands(MachineInstr *MI) const {
				1126	MachineRegisterInfo &MRI = MI->getParent()->getParent()->getRegInfo();
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1127
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1128	int Src0Idx = AMDGPU::getNamedOperandIdx(MI->getOpcode(),
				1129	AMDGPU::OpName::src0);
				1130	int Src1Idx = AMDGPU::getNamedOperandIdx(MI->getOpcode(),
				1131	AMDGPU::OpName::src1);
				1132	int Src2Idx = AMDGPU::getNamedOperandIdx(MI->getOpcode(),
				1133	AMDGPU::OpName::src2);
				1134
				1135	// Legalize VOP2
				1136	if (isVOP2(MI->getOpcode()) && Src1Idx != -1) {
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1137	// Legalize src0
				1138	if (!isOperandLegal(MI, Src0Idx))
Matt Arsenault	08f7e37	2013-11-18 20:09:50 +0000	[diff] [blame]	1139	legalizeOpWithMove(MI, Src0Idx);
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1140
				1141	// Legalize src1
				1142	if (isOperandLegal(MI, Src1Idx))
Matt Arsenault	08f7e37	2013-11-18 20:09:50 +0000	[diff] [blame]	1143	return;
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1144
				1145	// Usually src0 of VOP2 instructions allow more types of inputs
				1146	// than src1, so try to commute the instruction to decrease our
				1147	// chances of having to insert a MOV instruction to legalize src1.
				1148	if (MI->isCommutable()) {
				1149	if (commuteInstruction(MI))
				1150	// If we are successful in commuting, then we know MI is legal, so
				1151	// we are done.
				1152	return;
Matt Arsenault	08f7e37	2013-11-18 20:09:50 +0000	[diff] [blame]	1153	}
				1154
Tom Stellard	0e975cf	2014-08-01 00:32:35 +0000	[diff] [blame]	1155	legalizeOpWithMove(MI, Src1Idx);
				1156	return;
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1157	}
				1158
Matt Arsenault	08f7e37	2013-11-18 20:09:50 +0000	[diff] [blame]	1159	// XXX - Do any VOP3 instructions read VCC?
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1160	// Legalize VOP3
				1161	if (isVOP3(MI->getOpcode())) {
				1162	int VOP3Idx[3] = {Src0Idx, Src1Idx, Src2Idx};
				1163	unsigned SGPRReg = AMDGPU::NoRegister;
				1164	for (unsigned i = 0; i < 3; ++i) {
				1165	int Idx = VOP3Idx[i];
				1166	if (Idx == -1)
				1167	continue;
				1168	MachineOperand &MO = MI->getOperand(Idx);
				1169
				1170	if (MO.isReg()) {
				1171	if (!RI.isSGPRClass(MRI.getRegClass(MO.getReg())))
				1172	continue; // VGPRs are legal
				1173
Matt Arsenault	f0b1e3a	2013-11-18 20:09:21 +0000	[diff] [blame]	1174	assert(MO.getReg() != AMDGPU::SCC && "SCC operand to VOP3 instruction");
				1175
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1176	if (SGPRReg == AMDGPU::NoRegister \|\| SGPRReg == MO.getReg()) {
				1177	SGPRReg = MO.getReg();
				1178	// We can use one SGPR in each VOP3 instruction.
				1179	continue;
				1180	}
				1181	} else if (!isLiteralConstant(MO)) {
				1182	// If it is not a register and not a literal constant, then it must be
				1183	// an inline constant which is always legal.
				1184	continue;
				1185	}
				1186	// If we make it this far, then the operand is not legal and we must
				1187	// legalize it.
				1188	legalizeOpWithMove(MI, Idx);
				1189	}
				1190	}
				1191
Tom Stellard	4f3b04d	2014-04-17 21:00:07 +0000	[diff] [blame]	1192	// Legalize REG_SEQUENCE and PHI
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1193	// The register class of the operands much be the same type as the register
				1194	// class of the output.
Tom Stellard	4f3b04d	2014-04-17 21:00:07 +0000	[diff] [blame]	1195	if (MI->getOpcode() == AMDGPU::REG_SEQUENCE \|\|
				1196	MI->getOpcode() == AMDGPU::PHI) {
Craig Topper	062a2ba	2014-04-25 05:30:21 +0000	[diff] [blame]	1197	const TargetRegisterClass RC = nullptr, SRC = nullptr, *VRC = nullptr;
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1198	for (unsigned i = 1, e = MI->getNumOperands(); i != e; i+=2) {
				1199	if (!MI->getOperand(i).isReg() \|\|
				1200	!TargetRegisterInfo::isVirtualRegister(MI->getOperand(i).getReg()))
				1201	continue;
				1202	const TargetRegisterClass *OpRC =
				1203	MRI.getRegClass(MI->getOperand(i).getReg());
				1204	if (RI.hasVGPRs(OpRC)) {
				1205	VRC = OpRC;
				1206	} else {
				1207	SRC = OpRC;
				1208	}
				1209	}
				1210
				1211	// If any of the operands are VGPR registers, then they all most be
				1212	// otherwise we will create illegal VGPR->SGPR copies when legalizing
				1213	// them.
				1214	if (VRC \|\| !RI.isSGPRClass(getOpRegClass(*MI, 0))) {
				1215	if (!VRC) {
				1216	assert(SRC);
				1217	VRC = RI.getEquivalentVGPRClass(SRC);
				1218	}
				1219	RC = VRC;
				1220	} else {
				1221	RC = SRC;
				1222	}
				1223
				1224	// Update all the operands so they have the same type.
				1225	for (unsigned i = 1, e = MI->getNumOperands(); i != e; i+=2) {
				1226	if (!MI->getOperand(i).isReg() \|\|
				1227	!TargetRegisterInfo::isVirtualRegister(MI->getOperand(i).getReg()))
				1228	continue;
				1229	unsigned DstReg = MRI.createVirtualRegister(RC);
Tom Stellard	4f3b04d	2014-04-17 21:00:07 +0000	[diff] [blame]	1230	MachineBasicBlock *InsertBB;
				1231	MachineBasicBlock::iterator Insert;
				1232	if (MI->getOpcode() == AMDGPU::REG_SEQUENCE) {
				1233	InsertBB = MI->getParent();
				1234	Insert = MI;
				1235	} else {
				1236	// MI is a PHI instruction.
				1237	InsertBB = MI->getOperand(i + 1).getMBB();
				1238	Insert = InsertBB->getFirstTerminator();
				1239	}
				1240	BuildMI(*InsertBB, Insert, MI->getDebugLoc(),
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1241	get(AMDGPU::COPY), DstReg)
				1242	.addOperand(MI->getOperand(i));
				1243	MI->getOperand(i).setReg(DstReg);
				1244	}
				1245	}
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1246
Tom Stellard	a568738	2014-05-15 14:41:55 +0000	[diff] [blame]	1247	// Legalize INSERT_SUBREG
				1248	// src0 must have the same register class as dst
				1249	if (MI->getOpcode() == AMDGPU::INSERT_SUBREG) {
				1250	unsigned Dst = MI->getOperand(0).getReg();
				1251	unsigned Src0 = MI->getOperand(1).getReg();
				1252	const TargetRegisterClass *DstRC = MRI.getRegClass(Dst);
				1253	const TargetRegisterClass *Src0RC = MRI.getRegClass(Src0);
				1254	if (DstRC != Src0RC) {
				1255	MachineBasicBlock &MBB = *MI->getParent();
				1256	unsigned NewSrc0 = MRI.createVirtualRegister(DstRC);
				1257	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::COPY), NewSrc0)
				1258	.addReg(Src0);
				1259	MI->getOperand(1).setReg(NewSrc0);
				1260	}
				1261	return;
				1262	}
				1263
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1264	// Legalize MUBUF* instructions
				1265	// FIXME: If we start using the non-addr64 instructions for compute, we
				1266	// may need to legalize them here.
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1267	int SRsrcIdx =
				1268	AMDGPU::getNamedOperandIdx(MI->getOpcode(), AMDGPU::OpName::srsrc);
				1269	if (SRsrcIdx != -1) {
				1270	// We have an MUBUF instruction
				1271	MachineOperand *SRsrc = &MI->getOperand(SRsrcIdx);
				1272	unsigned SRsrcRC = get(MI->getOpcode()).OpInfo[SRsrcIdx].RegClass;
				1273	if (RI.getCommonSubClass(MRI.getRegClass(SRsrc->getReg()),
				1274	RI.getRegClass(SRsrcRC))) {
				1275	// The operands are legal.
				1276	// FIXME: We may need to legalize operands besided srsrc.
				1277	return;
				1278	}
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1279
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1280	MachineBasicBlock &MBB = *MI->getParent();
				1281	// Extract the the ptr from the resource descriptor.
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1282
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1283	// SRsrcPtrLo = srsrc:sub0
				1284	unsigned SRsrcPtrLo = buildExtractSubReg(MI, MRI, *SRsrc,
				1285	&AMDGPU::VReg_128RegClass, AMDGPU::sub0, &AMDGPU::VReg_32RegClass);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1286
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1287	// SRsrcPtrHi = srsrc:sub1
				1288	unsigned SRsrcPtrHi = buildExtractSubReg(MI, MRI, *SRsrc,
				1289	&AMDGPU::VReg_128RegClass, AMDGPU::sub1, &AMDGPU::VReg_32RegClass);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1290
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1291	// Create an empty resource descriptor
				1292	unsigned Zero64 = MRI.createVirtualRegister(&AMDGPU::SReg_64RegClass);
				1293	unsigned SRsrcFormatLo = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
				1294	unsigned SRsrcFormatHi = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
				1295	unsigned NewSRsrc = MRI.createVirtualRegister(&AMDGPU::SReg_128RegClass);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1296
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1297	// Zero64 = 0
				1298	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B64),
				1299	Zero64)
				1300	.addImm(0);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1301
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1302	// SRsrcFormatLo = RSRC_DATA_FORMAT{31-0}
				1303	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32),
				1304	SRsrcFormatLo)
				1305	.addImm(AMDGPU::RSRC_DATA_FORMAT & 0xFFFFFFFF);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1306
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1307	// SRsrcFormatHi = RSRC_DATA_FORMAT{63-32}
				1308	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32),
				1309	SRsrcFormatHi)
				1310	.addImm(AMDGPU::RSRC_DATA_FORMAT >> 32);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1311
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1312	// NewSRsrc = {Zero64, SRsrcFormat}
				1313	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::REG_SEQUENCE),
				1314	NewSRsrc)
				1315	.addReg(Zero64)
				1316	.addImm(AMDGPU::sub0_sub1)
				1317	.addReg(SRsrcFormatLo)
				1318	.addImm(AMDGPU::sub2)
				1319	.addReg(SRsrcFormatHi)
				1320	.addImm(AMDGPU::sub3);
				1321
				1322	MachineOperand VAddr = getNamedOperand(MI, AMDGPU::OpName::vaddr);
				1323	unsigned NewVAddr = MRI.createVirtualRegister(&AMDGPU::VReg_64RegClass);
				1324	unsigned NewVAddrLo;
				1325	unsigned NewVAddrHi;
				1326	if (VAddr) {
				1327	// This is already an ADDR64 instruction so we need to add the pointer
				1328	// extracted from the resource descriptor to the current value of VAddr.
				1329	NewVAddrLo = MRI.createVirtualRegister(&AMDGPU::VReg_32RegClass);
				1330	NewVAddrHi = MRI.createVirtualRegister(&AMDGPU::VReg_32RegClass);
				1331
				1332	// NewVaddrLo = SRsrcPtrLo + VAddr:sub0
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1333	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::V_ADD_I32_e32),
				1334	NewVAddrLo)
				1335	.addReg(SRsrcPtrLo)
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1336	.addReg(VAddr->getReg(), 0, AMDGPU::sub0)
				1337	.addReg(AMDGPU::VCC, RegState::ImplicitDefine);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1338
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1339	// NewVaddrHi = SRsrcPtrHi + VAddr:sub1
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1340	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::V_ADDC_U32_e32),
				1341	NewVAddrHi)
				1342	.addReg(SRsrcPtrHi)
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1343	.addReg(VAddr->getReg(), 0, AMDGPU::sub1)
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1344	.addReg(AMDGPU::VCC, RegState::ImplicitDefine)
				1345	.addReg(AMDGPU::VCC, RegState::Implicit);
				1346
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1347	} else {
				1348	// This instructions is the _OFFSET variant, so we need to convert it to
				1349	// ADDR64.
				1350	MachineOperand VData = getNamedOperand(MI, AMDGPU::OpName::vdata);
				1351	MachineOperand Offset = getNamedOperand(MI, AMDGPU::OpName::offset);
				1352	MachineOperand SOffset = getNamedOperand(MI, AMDGPU::OpName::soffset);
				1353	assert(SOffset->isImm() && SOffset->getImm() == 0 && "Legalizing MUBUF "
				1354	"with non-zero soffset is not implemented");
NAKAMURA Takumi	5f79ee5	2014-08-11 23:03:38 +0000	[diff] [blame]	1355	(void)SOffset;
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1356
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1357	// Create the new instruction.
				1358	unsigned Addr64Opcode = AMDGPU::getAddr64Inst(MI->getOpcode());
				1359	MachineInstr *Addr64 =
				1360	BuildMI(MBB, MI, MI->getDebugLoc(), get(Addr64Opcode))
				1361	.addOperand(*VData)
				1362	.addOperand(*SRsrc)
				1363	.addReg(AMDGPU::NoRegister) // Dummy value for vaddr.
				1364	// This will be replaced later
				1365	// with the new value of vaddr.
				1366	.addOperand(*Offset);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1367
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1368	MI->removeFromParent();
				1369	MI = Addr64;
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1370
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1371	NewVAddrLo = SRsrcPtrLo;
				1372	NewVAddrHi = SRsrcPtrHi;
				1373	VAddr = getNamedOperand(*MI, AMDGPU::OpName::vaddr);
				1374	SRsrc = getNamedOperand(*MI, AMDGPU::OpName::srsrc);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1375	}
Tom Stellard	155bbb7	2014-08-11 22:18:17 +0000	[diff] [blame]	1376
				1377	// NewVaddr = {NewVaddrHi, NewVaddrLo}
				1378	BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::REG_SEQUENCE),
				1379	NewVAddr)
				1380	.addReg(NewVAddrLo)
				1381	.addImm(AMDGPU::sub0)
				1382	.addReg(NewVAddrHi)
				1383	.addImm(AMDGPU::sub1);
				1384
				1385
				1386	// Update the instruction to use NewVaddr
				1387	VAddr->setReg(NewVAddr);
				1388	// Update the instruction to use NewSRsrc
				1389	SRsrc->setReg(NewSRsrc);
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1390	}
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1391	}
				1392
Tom Stellard	745f2ed	2014-08-21 20:41:00 +0000	[diff] [blame]	1393	void SIInstrInfo::splitSMRD(MachineInstr *MI,
				1394	const TargetRegisterClass *HalfRC,
				1395	unsigned HalfImmOp, unsigned HalfSGPROp,
				1396	MachineInstr &Lo, MachineInstr &Hi) const {
				1397
				1398	DebugLoc DL = MI->getDebugLoc();
				1399	MachineBasicBlock *MBB = MI->getParent();
				1400	MachineRegisterInfo &MRI = MBB->getParent()->getRegInfo();
				1401	unsigned RegLo = MRI.createVirtualRegister(HalfRC);
				1402	unsigned RegHi = MRI.createVirtualRegister(HalfRC);
				1403	unsigned HalfSize = HalfRC->getSize();
				1404	const MachineOperand *OffOp =
				1405	getNamedOperand(*MI, AMDGPU::OpName::offset);
				1406	const MachineOperand SBase = getNamedOperand(MI, AMDGPU::OpName::sbase);
				1407
				1408	if (OffOp) {
				1409	// Handle the _IMM variant
				1410	unsigned LoOffset = OffOp->getImm();
				1411	unsigned HiOffset = LoOffset + (HalfSize / 4);
				1412	Lo = BuildMI(*MBB, MI, DL, get(HalfImmOp), RegLo)
				1413	.addOperand(*SBase)
				1414	.addImm(LoOffset);
				1415
				1416	if (!isUInt<8>(HiOffset)) {
				1417	unsigned OffsetSGPR =
				1418	MRI.createVirtualRegister(&AMDGPU::SReg_32RegClass);
				1419	BuildMI(*MBB, MI, DL, get(AMDGPU::S_MOV_B32), OffsetSGPR)
				1420	.addImm(HiOffset << 2); // The immediate offset is in dwords,
				1421	// but offset in register is in bytes.
				1422	Hi = BuildMI(*MBB, MI, DL, get(HalfSGPROp), RegHi)
				1423	.addOperand(*SBase)
				1424	.addReg(OffsetSGPR);
				1425	} else {
				1426	Hi = BuildMI(*MBB, MI, DL, get(HalfImmOp), RegHi)
				1427	.addOperand(*SBase)
				1428	.addImm(HiOffset);
				1429	}
				1430	} else {
				1431	// Handle the _SGPR variant
				1432	MachineOperand SOff = getNamedOperand(MI, AMDGPU::OpName::soff);
				1433	Lo = BuildMI(*MBB, MI, DL, get(HalfSGPROp), RegLo)
				1434	.addOperand(*SBase)
				1435	.addOperand(*SOff);
				1436	unsigned OffsetSGPR = MRI.createVirtualRegister(&AMDGPU::SReg_32RegClass);
				1437	BuildMI(*MBB, MI, DL, get(AMDGPU::S_ADD_I32), OffsetSGPR)
				1438	.addOperand(*SOff)
				1439	.addImm(HalfSize);
				1440	Hi = BuildMI(*MBB, MI, DL, get(HalfSGPROp))
				1441	.addOperand(*SBase)
				1442	.addReg(OffsetSGPR);
				1443	}
				1444
				1445	unsigned SubLo, SubHi;
				1446	switch (HalfSize) {
				1447	case 4:
				1448	SubLo = AMDGPU::sub0;
				1449	SubHi = AMDGPU::sub1;
				1450	break;
				1451	case 8:
				1452	SubLo = AMDGPU::sub0_sub1;
				1453	SubHi = AMDGPU::sub2_sub3;
				1454	break;
				1455	case 16:
				1456	SubLo = AMDGPU::sub0_sub1_sub2_sub3;
				1457	SubHi = AMDGPU::sub4_sub5_sub6_sub7;
				1458	break;
				1459	case 32:
				1460	SubLo = AMDGPU::sub0_sub1_sub2_sub3_sub4_sub5_sub6_sub7;
				1461	SubHi = AMDGPU::sub8_sub9_sub10_sub11_sub12_sub13_sub14_sub15;
				1462	break;
				1463	default:
				1464	llvm_unreachable("Unhandled HalfSize");
				1465	}
				1466
				1467	BuildMI(*MBB, MI, DL, get(AMDGPU::REG_SEQUENCE))
				1468	.addOperand(MI->getOperand(0))
				1469	.addReg(RegLo)
				1470	.addImm(SubLo)
				1471	.addReg(RegHi)
				1472	.addImm(SubHi);
				1473	}
				1474
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1475	void SIInstrInfo::moveSMRDToVALU(MachineInstr *MI, MachineRegisterInfo &MRI) const {
				1476	MachineBasicBlock *MBB = MI->getParent();
				1477	switch (MI->getOpcode()) {
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1478	case AMDGPU::S_LOAD_DWORD_IMM:
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1479	case AMDGPU::S_LOAD_DWORD_SGPR:
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1480	case AMDGPU::S_LOAD_DWORDX2_IMM:
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1481	case AMDGPU::S_LOAD_DWORDX2_SGPR:
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1482	case AMDGPU::S_LOAD_DWORDX4_IMM:
Tom Stellard	745f2ed	2014-08-21 20:41:00 +0000	[diff] [blame]	1483	case AMDGPU::S_LOAD_DWORDX4_SGPR: {
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1484	unsigned NewOpcode = getVALUOp(*MI);
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1485	unsigned RegOffset;
				1486	unsigned ImmOffset;
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1487
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1488	if (MI->getOperand(2).isReg()) {
				1489	RegOffset = MI->getOperand(2).getReg();
				1490	ImmOffset = 0;
				1491	} else {
				1492	assert(MI->getOperand(2).isImm());
				1493	// SMRD instructions take a dword offsets and MUBUF instructions
				1494	// take a byte offset.
				1495	ImmOffset = MI->getOperand(2).getImm() << 2;
				1496	RegOffset = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
				1497	if (isUInt<12>(ImmOffset)) {
				1498	BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32),
				1499	RegOffset)
				1500	.addImm(0);
				1501	} else {
				1502	BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32),
				1503	RegOffset)
				1504	.addImm(ImmOffset);
				1505	ImmOffset = 0;
				1506	}
				1507	}
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1508
				1509	unsigned SRsrc = MRI.createVirtualRegister(&AMDGPU::SReg_128RegClass);
Tom Stellard	4c00b52	2014-05-09 16:42:22 +0000	[diff] [blame]	1510	unsigned DWord0 = RegOffset;
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1511	unsigned DWord1 = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
				1512	unsigned DWord2 = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
				1513	unsigned DWord3 = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);
				1514
				1515	BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32), DWord1)
				1516	.addImm(0);
				1517	BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32), DWord2)
				1518	.addImm(AMDGPU::RSRC_DATA_FORMAT & 0xFFFFFFFF);
				1519	BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32), DWord3)
				1520	.addImm(AMDGPU::RSRC_DATA_FORMAT >> 32);
				1521	BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::REG_SEQUENCE), SRsrc)
				1522	.addReg(DWord0)
				1523	.addImm(AMDGPU::sub0)
				1524	.addReg(DWord1)
				1525	.addImm(AMDGPU::sub1)
				1526	.addReg(DWord2)
				1527	.addImm(AMDGPU::sub2)
				1528	.addReg(DWord3)
				1529	.addImm(AMDGPU::sub3);
Tom Stellard	745f2ed	2014-08-21 20:41:00 +0000	[diff] [blame]	1530	MI->setDesc(get(NewOpcode));
				1531	if (MI->getOperand(2).isReg()) {
				1532	MI->getOperand(2).setReg(MI->getOperand(1).getReg());
				1533	} else {
				1534	MI->getOperand(2).ChangeToRegister(MI->getOperand(1).getReg(), false);
				1535	}
				1536	MI->getOperand(1).setReg(SRsrc);
				1537	MI->addOperand(*MBB->getParent(), MachineOperand::CreateImm(ImmOffset));
				1538
				1539	const TargetRegisterClass *NewDstRC =
				1540	RI.getRegClass(get(NewOpcode).OpInfo[0].RegClass);
				1541
				1542	unsigned DstReg = MI->getOperand(0).getReg();
				1543	unsigned NewDstReg = MRI.createVirtualRegister(NewDstRC);
				1544	MRI.replaceRegWith(DstReg, NewDstReg);
				1545	break;
				1546	}
				1547	case AMDGPU::S_LOAD_DWORDX8_IMM:
				1548	case AMDGPU::S_LOAD_DWORDX8_SGPR: {
				1549	MachineInstr Lo, Hi;
				1550	splitSMRD(MI, &AMDGPU::SReg_128RegClass, AMDGPU::S_LOAD_DWORDX4_IMM,
				1551	AMDGPU::S_LOAD_DWORDX4_SGPR, Lo, Hi);
				1552	MI->eraseFromParent();
				1553	moveSMRDToVALU(Lo, MRI);
				1554	moveSMRDToVALU(Hi, MRI);
				1555	break;
				1556	}
				1557
				1558	case AMDGPU::S_LOAD_DWORDX16_IMM:
				1559	case AMDGPU::S_LOAD_DWORDX16_SGPR: {
				1560	MachineInstr Lo, Hi;
				1561	splitSMRD(MI, &AMDGPU::SReg_256RegClass, AMDGPU::S_LOAD_DWORDX8_IMM,
				1562	AMDGPU::S_LOAD_DWORDX8_SGPR, Lo, Hi);
				1563	MI->eraseFromParent();
				1564	moveSMRDToVALU(Lo, MRI);
				1565	moveSMRDToVALU(Hi, MRI);
				1566	break;
				1567	}
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1568	}
				1569	}
				1570
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1571	void SIInstrInfo::moveToVALU(MachineInstr &TopInst) const {
				1572	SmallVector<MachineInstr *, 128> Worklist;
				1573	Worklist.push_back(&TopInst);
				1574
				1575	while (!Worklist.empty()) {
				1576	MachineInstr *Inst = Worklist.pop_back_val();
Tom Stellard	e038720	2014-03-21 15:51:54 +0000	[diff] [blame]	1577	MachineBasicBlock *MBB = Inst->getParent();
				1578	MachineRegisterInfo &MRI = MBB->getParent()->getRegInfo();
				1579
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	1580	unsigned Opcode = Inst->getOpcode();
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1581	unsigned NewOpcode = getVALUOp(*Inst);
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	1582
Tom Stellard	e038720	2014-03-21 15:51:54 +0000	[diff] [blame]	1583	// Handle some special cases
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	1584	switch (Opcode) {
Tom Stellard	0c354f2	2014-04-30 15:31:29 +0000	[diff] [blame]	1585	default:
				1586	if (isSMRD(Inst->getOpcode())) {
				1587	moveSMRDToVALU(Inst, MRI);
				1588	}
				1589	break;
Matt Arsenault	bd99580	2014-03-24 18:26:52 +0000	[diff] [blame]	1590	case AMDGPU::S_MOV_B64: {
				1591	DebugLoc DL = Inst->getDebugLoc();
Tom Stellard	e038720	2014-03-21 15:51:54 +0000	[diff] [blame]	1592
Matt Arsenault	bd99580	2014-03-24 18:26:52 +0000	[diff] [blame]	1593	// If the source operand is a register we can replace this with a
				1594	// copy.
				1595	if (Inst->getOperand(1).isReg()) {
				1596	MachineInstr Copy = BuildMI(MBB, Inst, DL, get(TargetOpcode::COPY))
				1597	.addOperand(Inst->getOperand(0))
				1598	.addOperand(Inst->getOperand(1));
				1599	Worklist.push_back(Copy);
				1600	} else {
				1601	// Otherwise, we need to split this into two movs, because there is
				1602	// no 64-bit VALU move instruction.
				1603	unsigned Reg = Inst->getOperand(0).getReg();
				1604	unsigned Dst = split64BitImm(Worklist,
				1605	Inst,
				1606	MRI,
				1607	MRI.getRegClass(Reg),
				1608	Inst->getOperand(1));
				1609	MRI.replaceRegWith(Reg, Dst);
Tom Stellard	e038720	2014-03-21 15:51:54 +0000	[diff] [blame]	1610	}
Matt Arsenault	bd99580	2014-03-24 18:26:52 +0000	[diff] [blame]	1611	Inst->eraseFromParent();
				1612	continue;
				1613	}
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1614	case AMDGPU::S_AND_B64:
Matt Arsenault	689f325	2014-06-09 16:36:31 +0000	[diff] [blame]	1615	splitScalar64BitBinaryOp(Worklist, Inst, AMDGPU::S_AND_B32);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1616	Inst->eraseFromParent();
				1617	continue;
				1618
				1619	case AMDGPU::S_OR_B64:
Matt Arsenault	689f325	2014-06-09 16:36:31 +0000	[diff] [blame]	1620	splitScalar64BitBinaryOp(Worklist, Inst, AMDGPU::S_OR_B32);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1621	Inst->eraseFromParent();
				1622	continue;
				1623
				1624	case AMDGPU::S_XOR_B64:
Matt Arsenault	689f325	2014-06-09 16:36:31 +0000	[diff] [blame]	1625	splitScalar64BitBinaryOp(Worklist, Inst, AMDGPU::S_XOR_B32);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1626	Inst->eraseFromParent();
				1627	continue;
				1628
				1629	case AMDGPU::S_NOT_B64:
Matt Arsenault	689f325	2014-06-09 16:36:31 +0000	[diff] [blame]	1630	splitScalar64BitUnaryOp(Worklist, Inst, AMDGPU::S_NOT_B32);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1631	Inst->eraseFromParent();
				1632	continue;
				1633
Matt Arsenault	8333e43	2014-06-10 19:18:24 +0000	[diff] [blame]	1634	case AMDGPU::S_BCNT1_I32_B64:
				1635	splitScalar64BitBCNT(Worklist, Inst);
				1636	Inst->eraseFromParent();
				1637	continue;
				1638
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1639	case AMDGPU::S_BFE_U64:
				1640	case AMDGPU::S_BFE_I64:
				1641	case AMDGPU::S_BFM_B64:
				1642	llvm_unreachable("Moving this op to VALU not implemented");
Tom Stellard	e038720	2014-03-21 15:51:54 +0000	[diff] [blame]	1643	}
				1644
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1645	if (NewOpcode == AMDGPU::INSTRUCTION_LIST_END) {
				1646	// We cannot move this instruction to the VALU, so we should try to
				1647	// legalize its operands instead.
				1648	legalizeOperands(Inst);
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1649	continue;
Tom Stellard	1583409	2014-03-21 15:51:57 +0000	[diff] [blame]	1650	}
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1651
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1652	// Use the new VALU Opcode.
				1653	const MCInstrDesc &NewDesc = get(NewOpcode);
				1654	Inst->setDesc(NewDesc);
				1655
Matt Arsenault	f0b1e3a	2013-11-18 20:09:21 +0000	[diff] [blame]	1656	// Remove any references to SCC. Vector instructions can't read from it, and
				1657	// We're just about to add the implicit use / defs of VCC, and we don't want
				1658	// both.
				1659	for (unsigned i = Inst->getNumOperands() - 1; i > 0; --i) {
				1660	MachineOperand &Op = Inst->getOperand(i);
				1661	if (Op.isReg() && Op.getReg() == AMDGPU::SCC)
				1662	Inst->RemoveOperand(i);
				1663	}
				1664
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	1665	if (Opcode == AMDGPU::S_SEXT_I32_I8 \|\| Opcode == AMDGPU::S_SEXT_I32_I16) {
				1666	// We are converting these to a BFE, so we need to add the missing
				1667	// operands for the size and offset.
				1668	unsigned Size = (Opcode == AMDGPU::S_SEXT_I32_I8) ? 8 : 16;
				1669	Inst->addOperand(MachineOperand::CreateImm(0));
				1670	Inst->addOperand(MachineOperand::CreateImm(Size));
				1671
Matt Arsenault	b5b5110	2014-06-10 19:18:21 +0000	[diff] [blame]	1672	} else if (Opcode == AMDGPU::S_BCNT1_I32_B32) {
				1673	// The VALU version adds the second operand to the result, so insert an
				1674	// extra 0 operand.
				1675	Inst->addOperand(MachineOperand::CreateImm(0));
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1676	}
				1677
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	1678	addDescImplicitUseDef(NewDesc, Inst);
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1679
Matt Arsenault	78b8670	2014-04-18 05:19:26 +0000	[diff] [blame]	1680	if (Opcode == AMDGPU::S_BFE_I32 \|\| Opcode == AMDGPU::S_BFE_U32) {
				1681	const MachineOperand &OffsetWidthOp = Inst->getOperand(2);
				1682	// If we need to move this to VGPRs, we need to unpack the second operand
				1683	// back into the 2 separate ones for bit offset and width.
				1684	assert(OffsetWidthOp.isImm() &&
				1685	"Scalar BFE is only implemented for constant width and offset");
				1686	uint32_t Imm = OffsetWidthOp.getImm();
				1687
				1688	uint32_t Offset = Imm & 0x3f; // Extract bits [5:0].
				1689	uint32_t BitWidth = (Imm & 0x7f0000) >> 16; // Extract bits [22:16].
Matt Arsenault	78b8670	2014-04-18 05:19:26 +0000	[diff] [blame]	1690	Inst->RemoveOperand(2); // Remove old immediate.
				1691	Inst->addOperand(MachineOperand::CreateImm(Offset));
Vincent Lejeune	94af31f	2014-05-10 19:18:33 +0000	[diff] [blame]	1692	Inst->addOperand(MachineOperand::CreateImm(BitWidth));
Matt Arsenault	78b8670	2014-04-18 05:19:26 +0000	[diff] [blame]	1693	}
				1694
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1695	// Update the destination register class.
Tom Stellard	e1a2445	2014-04-17 21:00:01 +0000	[diff] [blame]	1696
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1697	const TargetRegisterClass NewDstRC = getOpRegClass(Inst, 0);
				1698
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	1699	switch (Opcode) {
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1700	// For target instructions, getOpRegClass just returns the virtual
				1701	// register class associated with the operand, so we need to find an
				1702	// equivalent VGPR register class in order to move the instruction to the
				1703	// VALU.
				1704	case AMDGPU::COPY:
				1705	case AMDGPU::PHI:
				1706	case AMDGPU::REG_SEQUENCE:
Tom Stellard	204e61b	2014-04-07 19:45:45 +0000	[diff] [blame]	1707	case AMDGPU::INSERT_SUBREG:
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1708	if (RI.hasVGPRs(NewDstRC))
				1709	continue;
				1710	NewDstRC = RI.getEquivalentVGPRClass(NewDstRC);
				1711	if (!NewDstRC)
				1712	continue;
				1713	break;
				1714	default:
				1715	break;
				1716	}
				1717
				1718	unsigned DstReg = Inst->getOperand(0).getReg();
				1719	unsigned NewDstReg = MRI.createVirtualRegister(NewDstRC);
				1720	MRI.replaceRegWith(DstReg, NewDstReg);
				1721
Tom Stellard	e1a2445	2014-04-17 21:00:01 +0000	[diff] [blame]	1722	// Legalize the operands
				1723	legalizeOperands(Inst);
				1724
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1725	for (MachineRegisterInfo::use_iterator I = MRI.use_begin(NewDstReg),
				1726	E = MRI.use_end(); I != E; ++I) {
Owen Anderson	16c6bf4	2014-03-13 23:12:04 +0000	[diff] [blame]	1727	MachineInstr &UseMI = *I->getParent();
Tom Stellard	8216602	2013-11-13 23:36:37 +0000	[diff] [blame]	1728	if (!canReadVGPR(UseMI, I.getOperandNo())) {
				1729	Worklist.push_back(&UseMI);
				1730	}
				1731	}
				1732	}
				1733	}
				1734
Tom Stellard	f3b2a1e	2013-02-06 17:32:29 +0000	[diff] [blame]	1735	//===----------------------------------------------------------------------===//
				1736	// Indirect addressing callbacks
				1737	//===----------------------------------------------------------------------===//
				1738
				1739	unsigned SIInstrInfo::calculateIndirectAddress(unsigned RegIndex,
				1740	unsigned Channel) const {
				1741	assert(Channel == 0);
				1742	return RegIndex;
				1743	}
				1744
Tom Stellard	26a3b67	2013-10-22 18:19:10 +0000	[diff] [blame]	1745	const TargetRegisterClass *SIInstrInfo::getIndirectAddrRegClass() const {
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	1746	return &AMDGPU::VReg_32RegClass;
Tom Stellard	f3b2a1e	2013-02-06 17:32:29 +0000	[diff] [blame]	1747	}
				1748
Matt Arsenault	689f325	2014-06-09 16:36:31 +0000	[diff] [blame]	1749	void SIInstrInfo::splitScalar64BitUnaryOp(
				1750	SmallVectorImpl<MachineInstr *> &Worklist,
				1751	MachineInstr *Inst,
				1752	unsigned Opcode) const {
				1753	MachineBasicBlock &MBB = *Inst->getParent();
				1754	MachineRegisterInfo &MRI = MBB.getParent()->getRegInfo();
				1755
				1756	MachineOperand &Dest = Inst->getOperand(0);
				1757	MachineOperand &Src0 = Inst->getOperand(1);
				1758	DebugLoc DL = Inst->getDebugLoc();
				1759
				1760	MachineBasicBlock::iterator MII = Inst;
				1761
				1762	const MCInstrDesc &InstDesc = get(Opcode);
				1763	const TargetRegisterClass *Src0RC = Src0.isReg() ?
				1764	MRI.getRegClass(Src0.getReg()) :
				1765	&AMDGPU::SGPR_32RegClass;
				1766
				1767	const TargetRegisterClass *Src0SubRC = RI.getSubRegClass(Src0RC, AMDGPU::sub0);
				1768
				1769	MachineOperand SrcReg0Sub0 = buildExtractSubRegOrImm(MII, MRI, Src0, Src0RC,
				1770	AMDGPU::sub0, Src0SubRC);
				1771
				1772	const TargetRegisterClass *DestRC = MRI.getRegClass(Dest.getReg());
				1773	const TargetRegisterClass *DestSubRC = RI.getSubRegClass(DestRC, AMDGPU::sub0);
				1774
				1775	unsigned DestSub0 = MRI.createVirtualRegister(DestRC);
				1776	MachineInstr *LoHalf = BuildMI(MBB, MII, DL, InstDesc, DestSub0)
				1777	.addOperand(SrcReg0Sub0);
				1778
				1779	MachineOperand SrcReg0Sub1 = buildExtractSubRegOrImm(MII, MRI, Src0, Src0RC,
				1780	AMDGPU::sub1, Src0SubRC);
				1781
				1782	unsigned DestSub1 = MRI.createVirtualRegister(DestSubRC);
				1783	MachineInstr *HiHalf = BuildMI(MBB, MII, DL, InstDesc, DestSub1)
				1784	.addOperand(SrcReg0Sub1);
				1785
				1786	unsigned FullDestReg = MRI.createVirtualRegister(DestRC);
				1787	BuildMI(MBB, MII, DL, get(TargetOpcode::REG_SEQUENCE), FullDestReg)
				1788	.addReg(DestSub0)
				1789	.addImm(AMDGPU::sub0)
				1790	.addReg(DestSub1)
				1791	.addImm(AMDGPU::sub1);
				1792
				1793	MRI.replaceRegWith(Dest.getReg(), FullDestReg);
				1794
				1795	// Try to legalize the operands in case we need to swap the order to keep it
				1796	// valid.
				1797	Worklist.push_back(LoHalf);
				1798	Worklist.push_back(HiHalf);
				1799	}
				1800
				1801	void SIInstrInfo::splitScalar64BitBinaryOp(
				1802	SmallVectorImpl<MachineInstr *> &Worklist,
				1803	MachineInstr *Inst,
				1804	unsigned Opcode) const {
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1805	MachineBasicBlock &MBB = *Inst->getParent();
				1806	MachineRegisterInfo &MRI = MBB.getParent()->getRegInfo();
				1807
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1808	MachineOperand &Dest = Inst->getOperand(0);
				1809	MachineOperand &Src0 = Inst->getOperand(1);
				1810	MachineOperand &Src1 = Inst->getOperand(2);
				1811	DebugLoc DL = Inst->getDebugLoc();
				1812
				1813	MachineBasicBlock::iterator MII = Inst;
				1814
				1815	const MCInstrDesc &InstDesc = get(Opcode);
Matt Arsenault	684dc80	2014-03-24 20:08:13 +0000	[diff] [blame]	1816	const TargetRegisterClass *Src0RC = Src0.isReg() ?
				1817	MRI.getRegClass(Src0.getReg()) :
				1818	&AMDGPU::SGPR_32RegClass;
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1819
Matt Arsenault	684dc80	2014-03-24 20:08:13 +0000	[diff] [blame]	1820	const TargetRegisterClass *Src0SubRC = RI.getSubRegClass(Src0RC, AMDGPU::sub0);
				1821	const TargetRegisterClass *Src1RC = Src1.isReg() ?
				1822	MRI.getRegClass(Src1.getReg()) :
				1823	&AMDGPU::SGPR_32RegClass;
				1824
				1825	const TargetRegisterClass *Src1SubRC = RI.getSubRegClass(Src1RC, AMDGPU::sub0);
				1826
				1827	MachineOperand SrcReg0Sub0 = buildExtractSubRegOrImm(MII, MRI, Src0, Src0RC,
				1828	AMDGPU::sub0, Src0SubRC);
				1829	MachineOperand SrcReg1Sub0 = buildExtractSubRegOrImm(MII, MRI, Src1, Src1RC,
				1830	AMDGPU::sub0, Src1SubRC);
				1831
				1832	const TargetRegisterClass *DestRC = MRI.getRegClass(Dest.getReg());
				1833	const TargetRegisterClass *DestSubRC = RI.getSubRegClass(DestRC, AMDGPU::sub0);
				1834
				1835	unsigned DestSub0 = MRI.createVirtualRegister(DestRC);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1836	MachineInstr *LoHalf = BuildMI(MBB, MII, DL, InstDesc, DestSub0)
Matt Arsenault	248b7b6	2014-03-24 20:08:09 +0000	[diff] [blame]	1837	.addOperand(SrcReg0Sub0)
				1838	.addOperand(SrcReg1Sub0);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1839
Matt Arsenault	684dc80	2014-03-24 20:08:13 +0000	[diff] [blame]	1840	MachineOperand SrcReg0Sub1 = buildExtractSubRegOrImm(MII, MRI, Src0, Src0RC,
				1841	AMDGPU::sub1, Src0SubRC);
				1842	MachineOperand SrcReg1Sub1 = buildExtractSubRegOrImm(MII, MRI, Src1, Src1RC,
				1843	AMDGPU::sub1, Src1SubRC);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1844
Matt Arsenault	684dc80	2014-03-24 20:08:13 +0000	[diff] [blame]	1845	unsigned DestSub1 = MRI.createVirtualRegister(DestSubRC);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1846	MachineInstr *HiHalf = BuildMI(MBB, MII, DL, InstDesc, DestSub1)
Matt Arsenault	248b7b6	2014-03-24 20:08:09 +0000	[diff] [blame]	1847	.addOperand(SrcReg0Sub1)
				1848	.addOperand(SrcReg1Sub1);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1849
Matt Arsenault	684dc80	2014-03-24 20:08:13 +0000	[diff] [blame]	1850	unsigned FullDestReg = MRI.createVirtualRegister(DestRC);
Matt Arsenault	f35182c	2014-03-24 20:08:05 +0000	[diff] [blame]	1851	BuildMI(MBB, MII, DL, get(TargetOpcode::REG_SEQUENCE), FullDestReg)
				1852	.addReg(DestSub0)
				1853	.addImm(AMDGPU::sub0)
				1854	.addReg(DestSub1)
				1855	.addImm(AMDGPU::sub1);
				1856
				1857	MRI.replaceRegWith(Dest.getReg(), FullDestReg);
				1858
				1859	// Try to legalize the operands in case we need to swap the order to keep it
				1860	// valid.
				1861	Worklist.push_back(LoHalf);
				1862	Worklist.push_back(HiHalf);
				1863	}
				1864
Matt Arsenault	8333e43	2014-06-10 19:18:24 +0000	[diff] [blame]	1865	void SIInstrInfo::splitScalar64BitBCNT(SmallVectorImpl<MachineInstr *> &Worklist,
				1866	MachineInstr *Inst) const {
				1867	MachineBasicBlock &MBB = *Inst->getParent();
				1868	MachineRegisterInfo &MRI = MBB.getParent()->getRegInfo();
				1869
				1870	MachineBasicBlock::iterator MII = Inst;
				1871	DebugLoc DL = Inst->getDebugLoc();
				1872
				1873	MachineOperand &Dest = Inst->getOperand(0);
				1874	MachineOperand &Src = Inst->getOperand(1);
				1875
				1876	const MCInstrDesc &InstDesc = get(AMDGPU::V_BCNT_U32_B32_e32);
				1877	const TargetRegisterClass *SrcRC = Src.isReg() ?
				1878	MRI.getRegClass(Src.getReg()) :
				1879	&AMDGPU::SGPR_32RegClass;
				1880
				1881	unsigned MidReg = MRI.createVirtualRegister(&AMDGPU::VGPR_32RegClass);
				1882	unsigned ResultReg = MRI.createVirtualRegister(&AMDGPU::VGPR_32RegClass);
				1883
				1884	const TargetRegisterClass *SrcSubRC = RI.getSubRegClass(SrcRC, AMDGPU::sub0);
				1885
				1886	MachineOperand SrcRegSub0 = buildExtractSubRegOrImm(MII, MRI, Src, SrcRC,
				1887	AMDGPU::sub0, SrcSubRC);
				1888	MachineOperand SrcRegSub1 = buildExtractSubRegOrImm(MII, MRI, Src, SrcRC,
				1889	AMDGPU::sub1, SrcSubRC);
				1890
				1891	MachineInstr *First = BuildMI(MBB, MII, DL, InstDesc, MidReg)
				1892	.addOperand(SrcRegSub0)
				1893	.addImm(0);
				1894
				1895	MachineInstr *Second = BuildMI(MBB, MII, DL, InstDesc, ResultReg)
				1896	.addOperand(SrcRegSub1)
				1897	.addReg(MidReg);
				1898
				1899	MRI.replaceRegWith(Dest.getReg(), ResultReg);
				1900
				1901	Worklist.push_back(First);
				1902	Worklist.push_back(Second);
				1903	}
				1904
Matt Arsenault	27cc958	2014-04-18 01:53:18 +0000	[diff] [blame]	1905	void SIInstrInfo::addDescImplicitUseDef(const MCInstrDesc &NewDesc,
				1906	MachineInstr *Inst) const {
				1907	// Add the implict and explicit register definitions.
				1908	if (NewDesc.ImplicitUses) {
				1909	for (unsigned i = 0; NewDesc.ImplicitUses[i]; ++i) {
				1910	unsigned Reg = NewDesc.ImplicitUses[i];
				1911	Inst->addOperand(MachineOperand::CreateReg(Reg, false, true));
				1912	}
				1913	}
				1914
				1915	if (NewDesc.ImplicitDefs) {
				1916	for (unsigned i = 0; NewDesc.ImplicitDefs[i]; ++i) {
				1917	unsigned Reg = NewDesc.ImplicitDefs[i];
				1918	Inst->addOperand(MachineOperand::CreateReg(Reg, true, true));
				1919	}
				1920	}
				1921	}
				1922
Tom Stellard	f3b2a1e	2013-02-06 17:32:29 +0000	[diff] [blame]	1923	MachineInstrBuilder SIInstrInfo::buildIndirectWrite(
				1924	MachineBasicBlock *MBB,
				1925	MachineBasicBlock::iterator I,
				1926	unsigned ValueReg,
				1927	unsigned Address, unsigned OffsetReg) const {
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	1928	const DebugLoc &DL = MBB->findDebugLoc(I);
				1929	unsigned IndirectBaseReg = AMDGPU::VReg_32RegClass.getRegister(
				1930	getIndirectIndexBegin(*MBB->getParent()));
				1931
				1932	return BuildMI(*MBB, I, DL, get(AMDGPU::SI_INDIRECT_DST_V1))
				1933	.addReg(IndirectBaseReg, RegState::Define)
				1934	.addOperand(I->getOperand(0))
				1935	.addReg(IndirectBaseReg)
				1936	.addReg(OffsetReg)
				1937	.addImm(0)
				1938	.addReg(ValueReg);
Tom Stellard	f3b2a1e	2013-02-06 17:32:29 +0000	[diff] [blame]	1939	}
				1940
				1941	MachineInstrBuilder SIInstrInfo::buildIndirectRead(
				1942	MachineBasicBlock *MBB,
				1943	MachineBasicBlock::iterator I,
				1944	unsigned ValueReg,
				1945	unsigned Address, unsigned OffsetReg) const {
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	1946	const DebugLoc &DL = MBB->findDebugLoc(I);
				1947	unsigned IndirectBaseReg = AMDGPU::VReg_32RegClass.getRegister(
				1948	getIndirectIndexBegin(*MBB->getParent()));
				1949
				1950	return BuildMI(*MBB, I, DL, get(AMDGPU::SI_INDIRECT_SRC))
				1951	.addOperand(I->getOperand(0))
				1952	.addOperand(I->getOperand(1))
				1953	.addReg(IndirectBaseReg)
				1954	.addReg(OffsetReg)
				1955	.addImm(0);
				1956
				1957	}
				1958
				1959	void SIInstrInfo::reserveIndirectRegisters(BitVector &Reserved,
				1960	const MachineFunction &MF) const {
				1961	int End = getIndirectIndexEnd(MF);
				1962	int Begin = getIndirectIndexBegin(MF);
				1963
				1964	if (End == -1)
				1965	return;
				1966
				1967
				1968	for (int Index = Begin; Index <= End; ++Index)
				1969	Reserved.set(AMDGPU::VReg_32RegClass.getRegister(Index));
				1970
Tom Stellard	415ef6d	2013-11-13 23:58:51 +0000	[diff] [blame]	1971	for (int Index = std::max(0, Begin - 1); Index <= End; ++Index)
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	1972	Reserved.set(AMDGPU::VReg_64RegClass.getRegister(Index));
				1973
Tom Stellard	415ef6d	2013-11-13 23:58:51 +0000	[diff] [blame]	1974	for (int Index = std::max(0, Begin - 2); Index <= End; ++Index)
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	1975	Reserved.set(AMDGPU::VReg_96RegClass.getRegister(Index));
				1976
Tom Stellard	415ef6d	2013-11-13 23:58:51 +0000	[diff] [blame]	1977	for (int Index = std::max(0, Begin - 3); Index <= End; ++Index)
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	1978	Reserved.set(AMDGPU::VReg_128RegClass.getRegister(Index));
				1979
Tom Stellard	415ef6d	2013-11-13 23:58:51 +0000	[diff] [blame]	1980	for (int Index = std::max(0, Begin - 7); Index <= End; ++Index)
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	1981	Reserved.set(AMDGPU::VReg_256RegClass.getRegister(Index));
				1982
Tom Stellard	415ef6d	2013-11-13 23:58:51 +0000	[diff] [blame]	1983	for (int Index = std::max(0, Begin - 15); Index <= End; ++Index)
Tom Stellard	81d871d	2013-11-13 23:36:50 +0000	[diff] [blame]	1984	Reserved.set(AMDGPU::VReg_512RegClass.getRegister(Index));
Tom Stellard	f3b2a1e	2013-02-06 17:32:29 +0000	[diff] [blame]	1985	}
Tom Stellard	1aaad69	2014-07-21 16:55:33 +0000	[diff] [blame]	1986
Tom Stellard	6407e1e	2014-08-01 00:32:33 +0000	[diff] [blame]	1987	MachineOperand *SIInstrInfo::getNamedOperand(MachineInstr &MI,
Tom Stellard	1aaad69	2014-07-21 16:55:33 +0000	[diff] [blame]	1988	unsigned OperandName) const {
				1989	int Idx = AMDGPU::getNamedOperandIdx(MI.getOpcode(), OperandName);
				1990	if (Idx == -1)
				1991	return nullptr;
				1992
				1993	return &MI.getOperand(Idx);
				1994	}