Blame - llvm/lib/Target/AMDGPU/SIFrameLowering.cpp - toolchain/llvm-project

blob: d0a69eafc58ecad588e896111da6c9ce660a7c1e [file] [log] [blame]

Matt Arsenault	0c90e95	2015-11-06 18:17:45 +0000	[diff] [blame]	1	//===----------------------- SIFrameLowering.cpp --------------------------===//
				2	//
				3	// The LLVM Compiler Infrastructure
				4	//
				5	// This file is distributed under the University of Illinois Open Source
				6	// License. See LICENSE.TXT for details.
				7	//
				8	//==-----------------------------------------------------------------------===//
				9
				10	#include "SIFrameLowering.h"
Matt Arsenault	0e3d389	2015-11-30 21:15:53 +0000	[diff] [blame]	11	#include "SIInstrInfo.h"
				12	#include "SIMachineFunctionInfo.h"
Matt Arsenault	0c90e95	2015-11-06 18:17:45 +0000	[diff] [blame]	13	#include "SIRegisterInfo.h"
Matt Arsenault	43e92fe	2016-06-24 06:30:11 +0000	[diff] [blame]	14	#include "AMDGPUSubtarget.h"
				15
Matt Arsenault	0c90e95	2015-11-06 18:17:45 +0000	[diff] [blame]	16	#include "llvm/CodeGen/MachineFrameInfo.h"
				17	#include "llvm/CodeGen/MachineFunction.h"
Matt Arsenault	0e3d389	2015-11-30 21:15:53 +0000	[diff] [blame]	18	#include "llvm/CodeGen/MachineInstrBuilder.h"
Matt Arsenault	0c90e95	2015-11-06 18:17:45 +0000	[diff] [blame]	19	#include "llvm/CodeGen/RegisterScavenging.h"
				20
				21	using namespace llvm;
				22
Matt Arsenault	0e3d389	2015-11-30 21:15:53 +0000	[diff] [blame]	23
Konstantin Zhuravlyov	1d65026	2016-09-06 20:22:28 +0000	[diff] [blame]	24	static ArrayRef<MCPhysReg> getAllSGPR128(const MachineFunction &MF,
				25	const SIRegisterInfo *TRI) {
Matt Arsenault	ab3429c	2016-05-18 15:19:50 +0000	[diff] [blame]	26	return makeArrayRef(AMDGPU::SGPR_128RegClass.begin(),
Konstantin Zhuravlyov	1d65026	2016-09-06 20:22:28 +0000	[diff] [blame]	27	TRI->getMaxNumSGPRs(MF) / 4);
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	28	}
				29
Konstantin Zhuravlyov	1d65026	2016-09-06 20:22:28 +0000	[diff] [blame]	30	static ArrayRef<MCPhysReg> getAllSGPRs(const MachineFunction &MF,
				31	const SIRegisterInfo *TRI) {
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	32	return makeArrayRef(AMDGPU::SGPR_32RegClass.begin(),
Konstantin Zhuravlyov	1d65026	2016-09-06 20:22:28 +0000	[diff] [blame]	33	TRI->getMaxNumSGPRs(MF));
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	34	}
				35
Matt Arsenault	57bc432	2016-08-31 21:52:21 +0000	[diff] [blame]	36	void SIFrameLowering::emitFlatScratchInit(const SIInstrInfo *TII,
				37	const SIRegisterInfo* TRI,
				38	MachineFunction &MF,
				39	MachineBasicBlock &MBB) const {
				40	// We don't need this if we only have spills since there is no user facing
				41	// scratch.
				42
				43	// TODO: If we know we don't have flat instructions earlier, we can omit
				44	// this from the input registers.
				45	//
				46	// TODO: We only need to know if we access scratch space through a flat
				47	// pointer. Because we only detect if flat instructions are used at all,
				48	// this will be used more often than necessary on VI.
				49
				50	// Debug location must be unknown since the first debug location is used to
				51	// determine the end of the prologue.
				52	DebugLoc DL;
				53	MachineBasicBlock::iterator I = MBB.begin();
				54
				55	unsigned FlatScratchInitReg
				56	= TRI->getPreloadedValue(MF, SIRegisterInfo::FLAT_SCRATCH_INIT);
				57
				58	MachineRegisterInfo &MRI = MF.getRegInfo();
				59	MRI.addLiveIn(FlatScratchInitReg);
				60	MBB.addLiveIn(FlatScratchInitReg);
				61
				62	// Copy the size in bytes.
				63	unsigned FlatScrInitHi = TRI->getSubReg(FlatScratchInitReg, AMDGPU::sub1);
Matt Arsenault	1d21517	2016-08-31 21:52:25 +0000	[diff] [blame]	64	BuildMI(MBB, I, DL, TII->get(AMDGPU::COPY), AMDGPU::FLAT_SCR_LO)
Matt Arsenault	57bc432	2016-08-31 21:52:21 +0000	[diff] [blame]	65	.addReg(FlatScrInitHi, RegState::Kill);
				66
				67	unsigned FlatScrInitLo = TRI->getSubReg(FlatScratchInitReg, AMDGPU::sub0);
				68
				69	const SIMachineFunctionInfo *MFI = MF.getInfo<SIMachineFunctionInfo>();
				70	unsigned ScratchWaveOffsetReg = MFI->getScratchWaveOffsetReg();
				71
Matt Arsenault	57bc432	2016-08-31 21:52:21 +0000	[diff] [blame]	72	// Add wave offset in bytes to private base offset.
				73	// See comment in AMDKernelCodeT.h for enable_sgpr_flat_scratch_init.
				74	BuildMI(MBB, I, DL, TII->get(AMDGPU::S_ADD_U32), FlatScrInitLo)
				75	.addReg(FlatScrInitLo)
				76	.addReg(ScratchWaveOffsetReg);
				77
				78	// Convert offset to 256-byte units.
				79	BuildMI(MBB, I, DL, TII->get(AMDGPU::S_LSHR_B32), AMDGPU::FLAT_SCR_HI)
				80	.addReg(FlatScrInitLo, RegState::Kill)
				81	.addImm(8);
				82	}
				83
				84	unsigned SIFrameLowering::getReservedPrivateSegmentBufferReg(
				85	const SISubtarget &ST,
				86	const SIInstrInfo *TII,
				87	const SIRegisterInfo *TRI,
				88	SIMachineFunctionInfo *MFI,
				89	MachineFunction &MF) const {
				90
				91	// We need to insert initialization of the scratch resource descriptor.
				92	unsigned ScratchRsrcReg = MFI->getScratchRSrcReg();
Matt Arsenault	08906a3	2016-10-28 19:43:31 +0000	[diff] [blame]	93	if (ScratchRsrcReg == AMDGPU::NoRegister)
				94	return AMDGPU::NoRegister;
Matt Arsenault	57bc432	2016-08-31 21:52:21 +0000	[diff] [blame]	95
				96	if (ST.hasSGPRInitBug() \|\|
				97	ScratchRsrcReg != TRI->reservedPrivateSegmentBufferReg(MF))
				98	return ScratchRsrcReg;
				99
				100	// We reserved the last registers for this. Shift it down to the end of those
				101	// which were actually used.
				102	//
				103	// FIXME: It might be safer to use a pseudoregister before replacement.
				104
				105	// FIXME: We should be able to eliminate unused input registers. We only
				106	// cannot do this for the resources required for scratch access. For now we
				107	// skip over user SGPRs and may leave unused holes.
				108
				109	// We find the resource first because it has an alignment requirement.
				110
				111	MachineRegisterInfo &MRI = MF.getRegInfo();
				112
Matt Arsenault	08906a3	2016-10-28 19:43:31 +0000	[diff] [blame]	113	unsigned NumPreloaded = (MFI->getNumPreloadedSGPRs() + 3) / 4;
				114	ArrayRef<MCPhysReg> AllSGPR128s = getAllSGPR128(MF, TRI);
				115	AllSGPR128s = AllSGPR128s.slice(std::min(static_cast<unsigned>(AllSGPR128s.size()), NumPreloaded));
				116
Matt Arsenault	57bc432	2016-08-31 21:52:21 +0000	[diff] [blame]	117	// Skip the last 2 elements because the last one is reserved for VCC, and
				118	// this is the 2nd to last element already.
Matt Arsenault	08906a3	2016-10-28 19:43:31 +0000	[diff] [blame]	119	for (MCPhysReg Reg : AllSGPR128s) {
Matt Arsenault	57bc432	2016-08-31 21:52:21 +0000	[diff] [blame]	120	// Pick the first unallocated one. Make sure we don't clobber the other
				121	// reserved input we needed.
Matt Arsenault	08906a3	2016-10-28 19:43:31 +0000	[diff] [blame]	122	if (!MRI.isPhysRegUsed(Reg) && MRI.isAllocatable(Reg)) {
				123	//assert(MRI.isAllocatable(Reg));
Matt Arsenault	57bc432	2016-08-31 21:52:21 +0000	[diff] [blame]	124	MRI.replaceRegWith(ScratchRsrcReg, Reg);
				125	MFI->setScratchRSrcReg(Reg);
				126	return Reg;
				127	}
				128	}
				129
				130	return ScratchRsrcReg;
				131	}
				132
				133	unsigned SIFrameLowering::getReservedPrivateSegmentWaveByteOffsetReg(
				134	const SISubtarget &ST,
				135	const SIInstrInfo *TII,
				136	const SIRegisterInfo *TRI,
				137	SIMachineFunctionInfo *MFI,
				138	MachineFunction &MF) const {
				139	unsigned ScratchWaveOffsetReg = MFI->getScratchWaveOffsetReg();
				140	if (ST.hasSGPRInitBug() \|\|
				141	ScratchWaveOffsetReg != TRI->reservedPrivateSegmentWaveByteOffsetReg(MF))
				142	return ScratchWaveOffsetReg;
				143
				144	unsigned ScratchRsrcReg = MFI->getScratchRSrcReg();
				145	MachineRegisterInfo &MRI = MF.getRegInfo();
Matt Arsenault	08906a3	2016-10-28 19:43:31 +0000	[diff] [blame]	146
Matt Arsenault	57bc432	2016-08-31 21:52:21 +0000	[diff] [blame]	147	unsigned NumPreloaded = MFI->getNumPreloadedSGPRs();
				148
Matt Arsenault	08906a3	2016-10-28 19:43:31 +0000	[diff] [blame]	149	ArrayRef<MCPhysReg> AllSGPRs = getAllSGPRs(MF, TRI);
				150	if (NumPreloaded > AllSGPRs.size())
				151	return ScratchWaveOffsetReg;
				152
				153	AllSGPRs = AllSGPRs.slice(NumPreloaded);
				154
Matt Arsenault	57bc432	2016-08-31 21:52:21 +0000	[diff] [blame]	155	// We need to drop register from the end of the list that we cannot use
				156	// for the scratch wave offset.
				157	// + 2 s102 and s103 do not exist on VI.
				158	// + 2 for vcc
				159	// + 2 for xnack_mask
				160	// + 2 for flat_scratch
				161	// + 4 for registers reserved for scratch resource register
				162	// + 1 for register reserved for scratch wave offset. (By exluding this
				163	// register from the list to consider, it means that when this
				164	// register is being used for the scratch wave offset and there
				165	// are no other free SGPRs, then the value will stay in this register.
				166	// ----
				167	// 13
Matt Arsenault	08906a3	2016-10-28 19:43:31 +0000	[diff] [blame]	168	if (AllSGPRs.size() < 13)
				169	return ScratchWaveOffsetReg;
				170
				171	for (MCPhysReg Reg : AllSGPRs.drop_back(13)) {
Matt Arsenault	57bc432	2016-08-31 21:52:21 +0000	[diff] [blame]	172	// Pick the first unallocated SGPR. Be careful not to pick an alias of the
				173	// scratch descriptor, since we haven’t added its uses yet.
				174	if (!MRI.isPhysRegUsed(Reg)) {
				175	if (!MRI.isAllocatable(Reg) \|\|
				176	TRI->isSubRegisterEq(ScratchRsrcReg, Reg))
				177	continue;
				178
				179	MRI.replaceRegWith(ScratchWaveOffsetReg, Reg);
				180	MFI->setScratchWaveOffsetReg(Reg);
				181	return Reg;
				182	}
				183	}
				184
				185	return ScratchWaveOffsetReg;
				186	}
				187
Matt Arsenault	0e3d389	2015-11-30 21:15:53 +0000	[diff] [blame]	188	void SIFrameLowering::emitPrologue(MachineFunction &MF,
				189	MachineBasicBlock &MBB) const {
Konstantin Zhuravlyov	f2f3d14	2016-06-25 03:11:28 +0000	[diff] [blame]	190	// Emit debugger prologue if "amdgpu-debugger-emit-prologue" attribute was
				191	// specified.
				192	const SISubtarget &ST = MF.getSubtarget<SISubtarget>();
				193	if (ST.debuggerEmitPrologue())
				194	emitDebuggerPrologue(MF, MBB);
				195
Matt Arsenault	0e3d389	2015-11-30 21:15:53 +0000	[diff] [blame]	196	assert(&MF.front() == &MBB && "Shrink-wrapping not yet supported");
				197
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	198	SIMachineFunctionInfo *MFI = MF.getInfo<SIMachineFunctionInfo>();
Matt Arsenault	0e3d389	2015-11-30 21:15:53 +0000	[diff] [blame]	199
				200	// If we only have SGPR spills, we won't actually be using scratch memory
				201	// since these spill to VGPRs.
				202	//
				203	// FIXME: We should be cleaning up these unused SGPR spill frame indices
				204	// somewhere.
Matt Arsenault	0e3d389	2015-11-30 21:15:53 +0000	[diff] [blame]	205
Matt Arsenault	43e92fe	2016-06-24 06:30:11 +0000	[diff] [blame]	206	const SIInstrInfo *TII = ST.getInstrInfo();
Matt Arsenault	0e3d389	2015-11-30 21:15:53 +0000	[diff] [blame]	207	const SIRegisterInfo *TRI = &TII->getRegisterInfo();
Matt Arsenault	296b849	2016-02-12 06:31:30 +0000	[diff] [blame]	208	MachineRegisterInfo &MRI = MF.getRegInfo();
Matt Arsenault	57bc432	2016-08-31 21:52:21 +0000	[diff] [blame]	209
				210	unsigned ScratchRsrcReg
				211	= getReservedPrivateSegmentBufferReg(ST, TII, TRI, MFI, MF);
				212	unsigned ScratchWaveOffsetReg
				213	= getReservedPrivateSegmentWaveByteOffsetReg(ST, TII, TRI, MFI, MF);
Matt Arsenault	08906a3	2016-10-28 19:43:31 +0000	[diff] [blame]	214
				215	if (ScratchRsrcReg == AMDGPU::NoRegister) {
				216	assert(ScratchWaveOffsetReg == AMDGPU::NoRegister);
				217	return;
				218	}
				219
Matt Arsenault	57bc432	2016-08-31 21:52:21 +0000	[diff] [blame]	220	assert(!TRI->isSubRegister(ScratchRsrcReg, ScratchWaveOffsetReg));
				221
Matt Arsenault	08906a3	2016-10-28 19:43:31 +0000	[diff] [blame]	222	// We need to do the replacement of the private segment buffer and wave offset
				223	// register even if there are no stack objects. There could be stores to undef
				224	// or a constant without an associated object.
				225
				226	// FIXME: We still have implicit uses on SGPR spill instructions in case they
				227	// need to spill to vector memory. It's likely that will not happen, but at
				228	// this point it appears we need the setup. This part of the prolog should be
				229	// emitted after frame indices are eliminated.
				230
				231	if (MF.getFrameInfo().hasStackObjects() && MFI->hasFlatScratchInit())
Matt Arsenault	57bc432	2016-08-31 21:52:21 +0000	[diff] [blame]	232	emitFlatScratchInit(TII, TRI, MF, MBB);
Matt Arsenault	0e3d389	2015-11-30 21:15:53 +0000	[diff] [blame]	233
				234	// We need to insert initialization of the scratch resource descriptor.
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	235	unsigned PreloadedScratchWaveOffsetReg = TRI->getPreloadedValue(
				236	MF, SIRegisterInfo::PRIVATE_SEGMENT_WAVE_BYTE_OFFSET);
				237
Matt Arsenault	08906a3	2016-10-28 19:43:31 +0000	[diff] [blame]	238
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	239	unsigned PreloadedPrivateBufferReg = AMDGPU::NoRegister;
Tom Stellard	0b76fc4c	2016-09-16 21:34:26 +0000	[diff] [blame]	240	if (ST.isAmdCodeObjectV2()) {
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	241	PreloadedPrivateBufferReg = TRI->getPreloadedValue(
				242	MF, SIRegisterInfo::PRIVATE_SEGMENT_BUFFER);
				243	}
				244
Matt Arsenault	08906a3	2016-10-28 19:43:31 +0000	[diff] [blame]	245	bool OffsetRegUsed = !MRI.use_empty(ScratchWaveOffsetReg);
				246	bool ResourceRegUsed = !MRI.use_empty(ScratchRsrcReg);
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	247
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	248	// We added live-ins during argument lowering, but since they were not used
				249	// they were deleted. We're adding the uses now, so add them back.
Matt Arsenault	08906a3	2016-10-28 19:43:31 +0000	[diff] [blame]	250	if (OffsetRegUsed) {
				251	assert(PreloadedScratchWaveOffsetReg != AMDGPU::NoRegister &&
				252	"scratch wave offset input is required");
				253	MRI.addLiveIn(PreloadedScratchWaveOffsetReg);
				254	MBB.addLiveIn(PreloadedScratchWaveOffsetReg);
				255	}
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	256
Matt Arsenault	08906a3	2016-10-28 19:43:31 +0000	[diff] [blame]	257	if (ResourceRegUsed && PreloadedPrivateBufferReg != AMDGPU::NoRegister) {
				258	assert(ST.isAmdCodeObjectV2());
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	259	MRI.addLiveIn(PreloadedPrivateBufferReg);
				260	MBB.addLiveIn(PreloadedPrivateBufferReg);
				261	}
				262
Matt Arsenault	57bc432	2016-08-31 21:52:21 +0000	[diff] [blame]	263	// Make the register selected live throughout the function.
				264	for (MachineBasicBlock &OtherBB : MF) {
				265	if (&OtherBB == &MBB)
				266	continue;
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	267
Matt Arsenault	08906a3	2016-10-28 19:43:31 +0000	[diff] [blame]	268	if (OffsetRegUsed)
				269	OtherBB.addLiveIn(ScratchWaveOffsetReg);
				270
				271	if (ResourceRegUsed)
				272	OtherBB.addLiveIn(ScratchRsrcReg);
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	273	}
				274
Matt Arsenault	0e3d389	2015-11-30 21:15:53 +0000	[diff] [blame]	275	DebugLoc DL;
Matt Arsenault	57bc432	2016-08-31 21:52:21 +0000	[diff] [blame]	276	MachineBasicBlock::iterator I = MBB.begin();
Matt Arsenault	0e3d389	2015-11-30 21:15:53 +0000	[diff] [blame]	277
Matt Arsenault	08906a3	2016-10-28 19:43:31 +0000	[diff] [blame]	278	// If we reserved the original input registers, we don't need to copy to the
				279	// reserved registers.
				280
				281	bool CopyBuffer = ResourceRegUsed &&
				282	PreloadedPrivateBufferReg != AMDGPU::NoRegister &&
				283	ScratchRsrcReg != PreloadedPrivateBufferReg;
				284
				285	// This needs to be careful of the copying order to avoid overwriting one of
				286	// the input registers before it's been copied to it's final
				287	// destination. Usually the offset should be copied first.
				288	bool CopyBufferFirst = TRI->isSubRegisterEq(PreloadedPrivateBufferReg,
				289	ScratchWaveOffsetReg);
				290	if (CopyBuffer && CopyBufferFirst) {
				291	BuildMI(MBB, I, DL, TII->get(AMDGPU::COPY), ScratchRsrcReg)
				292	.addReg(PreloadedPrivateBufferReg, RegState::Kill);
				293	}
				294
				295	if (OffsetRegUsed &&
				296	PreloadedScratchWaveOffsetReg != ScratchWaveOffsetReg) {
Matt Arsenault	1d21517	2016-08-31 21:52:25 +0000	[diff] [blame]	297	BuildMI(MBB, I, DL, TII->get(AMDGPU::COPY), ScratchWaveOffsetReg)
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	298	.addReg(PreloadedScratchWaveOffsetReg, RegState::Kill);
				299	}
Matt Arsenault	0e3d389	2015-11-30 21:15:53 +0000	[diff] [blame]	300
Matt Arsenault	08906a3	2016-10-28 19:43:31 +0000	[diff] [blame]	301	if (CopyBuffer && !CopyBufferFirst) {
Matt Arsenault	1d21517	2016-08-31 21:52:25 +0000	[diff] [blame]	302	BuildMI(MBB, I, DL, TII->get(AMDGPU::COPY), ScratchRsrcReg)
				303	.addReg(PreloadedPrivateBufferReg, RegState::Kill);
Matt Arsenault	08906a3	2016-10-28 19:43:31 +0000	[diff] [blame]	304	}
				305
				306	if (ResourceRegUsed && PreloadedPrivateBufferReg == AMDGPU::NoRegister) {
				307	assert(!ST.isAmdCodeObjectV2());
Matt Arsenault	1d21517	2016-08-31 21:52:25 +0000	[diff] [blame]	308	const MCInstrDesc &SMovB32 = TII->get(AMDGPU::S_MOV_B32);
				309
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	310	unsigned Rsrc0 = TRI->getSubReg(ScratchRsrcReg, AMDGPU::sub0);
				311	unsigned Rsrc1 = TRI->getSubReg(ScratchRsrcReg, AMDGPU::sub1);
				312	unsigned Rsrc2 = TRI->getSubReg(ScratchRsrcReg, AMDGPU::sub2);
				313	unsigned Rsrc3 = TRI->getSubReg(ScratchRsrcReg, AMDGPU::sub3);
				314
				315	// Use relocations to get the pointer, and setup the other bits manually.
				316	uint64_t Rsrc23 = TII->getScratchRsrcWords23();
				317	BuildMI(MBB, I, DL, SMovB32, Rsrc0)
				318	.addExternalSymbol("SCRATCH_RSRC_DWORD0")
				319	.addReg(ScratchRsrcReg, RegState::ImplicitDefine);
				320
				321	BuildMI(MBB, I, DL, SMovB32, Rsrc1)
				322	.addExternalSymbol("SCRATCH_RSRC_DWORD1")
				323	.addReg(ScratchRsrcReg, RegState::ImplicitDefine);
				324
				325	BuildMI(MBB, I, DL, SMovB32, Rsrc2)
				326	.addImm(Rsrc23 & 0xffffffff)
				327	.addReg(ScratchRsrcReg, RegState::ImplicitDefine);
				328
				329	BuildMI(MBB, I, DL, SMovB32, Rsrc3)
				330	.addImm(Rsrc23 >> 32)
				331	.addReg(ScratchRsrcReg, RegState::ImplicitDefine);
				332	}
Matt Arsenault	0e3d389	2015-11-30 21:15:53 +0000	[diff] [blame]	333	}
				334
Matt Arsenault	43e92fe	2016-06-24 06:30:11 +0000	[diff] [blame]	335	void SIFrameLowering::emitEpilogue(MachineFunction &MF,
				336	MachineBasicBlock &MBB) const {
				337
				338	}
				339
Matt Arsenault	0c90e95	2015-11-06 18:17:45 +0000	[diff] [blame]	340	void SIFrameLowering::processFunctionBeforeFrameFinalized(
				341	MachineFunction &MF,
				342	RegScavenger *RS) const {
Matthias Braun	941a705	2016-07-28 18:40:00 +0000	[diff] [blame]	343	MachineFrameInfo &MFI = MF.getFrameInfo();
Matt Arsenault	0e3d389	2015-11-30 21:15:53 +0000	[diff] [blame]	344
Matthias Braun	941a705	2016-07-28 18:40:00 +0000	[diff] [blame]	345	if (!MFI.hasStackObjects())
Matt Arsenault	0e3d389	2015-11-30 21:15:53 +0000	[diff] [blame]	346	return;
				347
Matthias Braun	941a705	2016-07-28 18:40:00 +0000	[diff] [blame]	348	bool MayNeedScavengingEmergencySlot = MFI.hasStackObjects();
Matt Arsenault	0c90e95	2015-11-06 18:17:45 +0000	[diff] [blame]	349
				350	assert((RS \|\| !MayNeedScavengingEmergencySlot) &&
				351	"RegScavenger required if spilling");
				352
				353	if (MayNeedScavengingEmergencySlot) {
Matt Arsenault	b920e99	2016-08-10 19:11:36 +0000	[diff] [blame]	354	int ScavengeFI = MFI.CreateStackObject(
Matt Arsenault	0c90e95	2015-11-06 18:17:45 +0000	[diff] [blame]	355	AMDGPU::SGPR_32RegClass.getSize(),
Matt Arsenault	b920e99	2016-08-10 19:11:36 +0000	[diff] [blame]	356	AMDGPU::SGPR_32RegClass.getAlignment(), false);
Matt Arsenault	0c90e95	2015-11-06 18:17:45 +0000	[diff] [blame]	357	RS->addScavengingFrameIndex(ScavengeFI);
				358	}
				359	}
Konstantin Zhuravlyov	f2f3d14	2016-06-25 03:11:28 +0000	[diff] [blame]	360
				361	void SIFrameLowering::emitDebuggerPrologue(MachineFunction &MF,
				362	MachineBasicBlock &MBB) const {
				363	const SISubtarget &ST = MF.getSubtarget<SISubtarget>();
				364	const SIInstrInfo *TII = ST.getInstrInfo();
				365	const SIRegisterInfo *TRI = &TII->getRegisterInfo();
				366	const SIMachineFunctionInfo *MFI = MF.getInfo<SIMachineFunctionInfo>();
				367
				368	MachineBasicBlock::iterator I = MBB.begin();
				369	DebugLoc DL;
				370
				371	// For each dimension:
				372	for (unsigned i = 0; i < 3; ++i) {
				373	// Get work group ID SGPR, and make it live-in again.
				374	unsigned WorkGroupIDSGPR = MFI->getWorkGroupIDSGPR(i);
				375	MF.getRegInfo().addLiveIn(WorkGroupIDSGPR);
				376	MBB.addLiveIn(WorkGroupIDSGPR);
				377
				378	// Since SGPRs are spilled into VGPRs, copy work group ID SGPR to VGPR in
				379	// order to spill it to scratch.
				380	unsigned WorkGroupIDVGPR =
				381	MF.getRegInfo().createVirtualRegister(&AMDGPU::VGPR_32RegClass);
				382	BuildMI(MBB, I, DL, TII->get(AMDGPU::V_MOV_B32_e32), WorkGroupIDVGPR)
				383	.addReg(WorkGroupIDSGPR);
				384
				385	// Spill work group ID.
				386	int WorkGroupIDObjectIdx = MFI->getDebuggerWorkGroupIDStackObjectIndex(i);
				387	TII->storeRegToStackSlot(MBB, I, WorkGroupIDVGPR, false,
				388	WorkGroupIDObjectIdx, &AMDGPU::VGPR_32RegClass, TRI);
				389
				390	// Get work item ID VGPR, and make it live-in again.
				391	unsigned WorkItemIDVGPR = MFI->getWorkItemIDVGPR(i);
				392	MF.getRegInfo().addLiveIn(WorkItemIDVGPR);
				393	MBB.addLiveIn(WorkItemIDVGPR);
				394
				395	// Spill work item ID.
				396	int WorkItemIDObjectIdx = MFI->getDebuggerWorkItemIDStackObjectIndex(i);
				397	TII->storeRegToStackSlot(MBB, I, WorkItemIDVGPR, false,
				398	WorkItemIDObjectIdx, &AMDGPU::VGPR_32RegClass, TRI);
				399	}
				400	}