Blame - llvm/lib/Target/AMDGPU/SIMachineFunctionInfo.cpp - toolchain/llvm-project

blob: 18b197ddb7ae7c04aaf76e5982cb413bafc014ea [file] [log] [blame]

Matt Arsenault	8d4b0ed	2016-06-23 20:00:34 +0000	[diff] [blame]	1	//===-- SIMachineFunctionInfo.cpp -------- SI Machine Function Info -------===//
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	2	//
				3	// The LLVM Compiler Infrastructure
				4	//
				5	// This file is distributed under the University of Illinois Open Source
				6	// License. See LICENSE.TXT for details.
				7	//
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	8	//===----------------------------------------------------------------------===//
				9
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	10	#include "SIMachineFunctionInfo.h"
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	11	#include "AMDGPUSubtarget.h"
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	12	#include "SIInstrInfo.h"
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	13	#include "llvm/CodeGen/MachineFrameInfo.h"
NAKAMURA Takumi	f619b50	2016-06-27 10:26:36 +0000	[diff] [blame]	14	#include "llvm/CodeGen/MachineInstrBuilder.h"
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	15	#include "llvm/CodeGen/MachineRegisterInfo.h"
Tom Stellard	eba6107	2014-05-02 15:41:42 +0000	[diff] [blame]	16	#include "llvm/IR/Function.h"
				17	#include "llvm/IR/LLVMContext.h"
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	18
				19	#define MAX_LANES 64
Tom Stellard	75aadc2	2012-12-11 21:25:42 +0000	[diff] [blame]	20
				21	using namespace llvm;
				22
				23	SIMachineFunctionInfo::SIMachineFunctionInfo(const MachineFunction &MF)
Vincent Lejeune	ace6f73	2013-04-01 21:47:53 +0000	[diff] [blame]	24	: AMDGPUMachineFunction(MF),
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	25	TIDReg(AMDGPU::NoRegister),
Matt Arsenault	49affb8	2015-11-25 20:55:12 +0000	[diff] [blame]	26	ScratchRSrcReg(AMDGPU::NoRegister),
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	27	ScratchWaveOffsetReg(AMDGPU::NoRegister),
Matt Arsenault	1c0ae39	2017-04-24 18:05:16 +0000	[diff] [blame]	28	FrameOffsetReg(AMDGPU::NoRegister),
				29	StackPtrOffsetReg(AMDGPU::NoRegister),
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	30	PrivateSegmentBufferUserSGPR(AMDGPU::NoRegister),
				31	DispatchPtrUserSGPR(AMDGPU::NoRegister),
				32	QueuePtrUserSGPR(AMDGPU::NoRegister),
				33	KernargSegmentPtrUserSGPR(AMDGPU::NoRegister),
				34	DispatchIDUserSGPR(AMDGPU::NoRegister),
				35	FlatScratchInitUserSGPR(AMDGPU::NoRegister),
				36	PrivateSegmentSizeUserSGPR(AMDGPU::NoRegister),
				37	GridWorkGroupCountXUserSGPR(AMDGPU::NoRegister),
				38	GridWorkGroupCountYUserSGPR(AMDGPU::NoRegister),
				39	GridWorkGroupCountZUserSGPR(AMDGPU::NoRegister),
				40	WorkGroupIDXSystemSGPR(AMDGPU::NoRegister),
				41	WorkGroupIDYSystemSGPR(AMDGPU::NoRegister),
				42	WorkGroupIDZSystemSGPR(AMDGPU::NoRegister),
				43	WorkGroupInfoSystemSGPR(AMDGPU::NoRegister),
				44	PrivateSegmentWaveByteOffsetSystemSGPR(AMDGPU::NoRegister),
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	45	PSInputAddr(0),
Matt Arsenault	e622dc3	2017-04-11 22:29:24 +0000	[diff] [blame]	46	PSInputEnable(0),
Marek Olsak	8e9cc63	2016-01-13 17:23:09 +0000	[diff] [blame]	47	ReturnsVoid(true),
Konstantin Zhuravlyov	1d65026	2016-09-06 20:22:28 +0000	[diff] [blame]	48	FlatWorkGroupSizes(0, 0),
				49	WavesPerEU(0, 0),
NAKAMURA Takumi	5cbd41e	2016-06-27 10:26:43 +0000	[diff] [blame]	50	DebuggerWorkGroupIDStackObjectIndices({{0, 0, 0}}),
				51	DebuggerWorkItemIDStackObjectIndices({{0, 0, 0}}),
Marek Olsak	fccabaf	2016-01-13 11:45:36 +0000	[diff] [blame]	52	LDSWaveSpillSize(0),
Tom Stellard	9646890	2014-09-24 01:33:17 +0000	[diff] [blame]	53	NumUserSGPRs(0),
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	54	NumSystemSGPRs(0),
Matt Arsenault	49affb8	2015-11-25 20:55:12 +0000	[diff] [blame]	55	HasSpilledSGPRs(false),
				56	HasSpilledVGPRs(false),
Matt Arsenault	296b849	2016-02-12 06:31:30 +0000	[diff] [blame]	57	HasNonSpillStackObjects(false),
Marek Olsak	0532c19	2016-07-13 17:35:15 +0000	[diff] [blame]	58	NumSpilledSGPRs(0),
				59	NumSpilledVGPRs(0),
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	60	PrivateSegmentBuffer(false),
Matt Arsenault	49affb8	2015-11-25 20:55:12 +0000	[diff] [blame]	61	DispatchPtr(false),
				62	QueuePtr(false),
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	63	KernargSegmentPtr(false),
Matt Arsenault	8d718dc	2016-07-22 17:01:30 +0000	[diff] [blame]	64	DispatchID(false),
Matt Arsenault	49affb8	2015-11-25 20:55:12 +0000	[diff] [blame]	65	FlatScratchInit(false),
				66	GridWorkgroupCountX(false),
				67	GridWorkgroupCountY(false),
				68	GridWorkgroupCountZ(false),
Tom Stellard	f110f8f	2016-04-14 16:27:03 +0000	[diff] [blame]	69	WorkGroupIDX(false),
Matt Arsenault	49affb8	2015-11-25 20:55:12 +0000	[diff] [blame]	70	WorkGroupIDY(false),
				71	WorkGroupIDZ(false),
				72	WorkGroupInfo(false),
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	73	PrivateSegmentWaveByteOffset(false),
Tom Stellard	f110f8f	2016-04-14 16:27:03 +0000	[diff] [blame]	74	WorkItemIDX(false),
Matt Arsenault	49affb8	2015-11-25 20:55:12 +0000	[diff] [blame]	75	WorkItemIDY(false),
Tom Stellard	2f3f985	2017-01-25 01:25:13 +0000	[diff] [blame]	76	WorkItemIDZ(false),
				77	PrivateMemoryInputPtr(false) {
Matt Arsenault	43e92fe	2016-06-24 06:30:11 +0000	[diff] [blame]	78	const SISubtarget &ST = MF.getSubtarget<SISubtarget>();
Matt Arsenault	49affb8	2015-11-25 20:55:12 +0000	[diff] [blame]	79	const Function *F = MF.getFunction();
Matt Arsenault	efa9f4b	2017-04-11 22:29:28 +0000	[diff] [blame]	80	FlatWorkGroupSizes = ST.getFlatWorkGroupSizes(*F);
				81	WavesPerEU = ST.getWavesPerEU(*F);
Matt Arsenault	49affb8	2015-11-25 20:55:12 +0000	[diff] [blame]	82
Matt Arsenault	2b1f9aa	2017-05-17 21:56:25 +0000	[diff] [blame^]	83	if (!isEntryFunction()) {
				84	// Non-entry functions have no special inputs for now, other registers
				85	// required for scratch access.
				86	ScratchRSrcReg = AMDGPU::SGPR0_SGPR1_SGPR2_SGPR3;
				87	ScratchWaveOffsetReg = AMDGPU::SGPR4;
				88	FrameOffsetReg = AMDGPU::SGPR5;
				89	return;
				90	}
Marek Olsak	fccabaf	2016-01-13 11:45:36 +0000	[diff] [blame]	91
Matt Arsenault	efa9f4b	2017-04-11 22:29:28 +0000	[diff] [blame]	92	CallingConv::ID CC = F->getCallingConv();
Matt Arsenault	2b1f9aa	2017-05-17 21:56:25 +0000	[diff] [blame^]	93	if (CC == CallingConv::AMDGPU_KERNEL \|\| CC == CallingConv::SPIR_KERNEL) {
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	94	KernargSegmentPtr = true;
Tom Stellard	f110f8f	2016-04-14 16:27:03 +0000	[diff] [blame]	95	WorkGroupIDX = true;
				96	WorkItemIDX = true;
Matt Arsenault	2b1f9aa	2017-05-17 21:56:25 +0000	[diff] [blame^]	97	} else if (CC == CallingConv::AMDGPU_PS) {
				98	PSInputAddr = AMDGPU::getInitialPSInputAddr(*F);
Tom Stellard	f110f8f	2016-04-14 16:27:03 +0000	[diff] [blame]	99	}
Matt Arsenault	49affb8	2015-11-25 20:55:12 +0000	[diff] [blame]	100
Matt Arsenault	efa9f4b	2017-04-11 22:29:28 +0000	[diff] [blame]	101	if (ST.debuggerEmitPrologue()) {
				102	// Enable everything.
Matt Arsenault	49affb8	2015-11-25 20:55:12 +0000	[diff] [blame]	103	WorkGroupIDY = true;
Matt Arsenault	49affb8	2015-11-25 20:55:12 +0000	[diff] [blame]	104	WorkGroupIDZ = true;
Matt Arsenault	49affb8	2015-11-25 20:55:12 +0000	[diff] [blame]	105	WorkItemIDY = true;
Matt Arsenault	49affb8	2015-11-25 20:55:12 +0000	[diff] [blame]	106	WorkItemIDZ = true;
Matt Arsenault	efa9f4b	2017-04-11 22:29:28 +0000	[diff] [blame]	107	} else {
				108	if (F->hasFnAttribute("amdgpu-work-group-id-y"))
				109	WorkGroupIDY = true;
				110
				111	if (F->hasFnAttribute("amdgpu-work-group-id-z"))
				112	WorkGroupIDZ = true;
				113
				114	if (F->hasFnAttribute("amdgpu-work-item-id-y"))
				115	WorkItemIDY = true;
				116
				117	if (F->hasFnAttribute("amdgpu-work-item-id-z"))
				118	WorkItemIDZ = true;
				119	}
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	120
Matt Arsenault	296b849	2016-02-12 06:31:30 +0000	[diff] [blame]	121	// X, XY, and XYZ are the only supported combinations, so make sure Y is
				122	// enabled if Z is.
				123	if (WorkItemIDZ)
				124	WorkItemIDY = true;
				125
Matt Arsenault	efa9f4b	2017-04-11 22:29:28 +0000	[diff] [blame]	126	const MachineFrameInfo &FrameInfo = MF.getFrameInfo();
Nicolai Haehnle	df3a20c	2016-04-06 19:40:20 +0000	[diff] [blame]	127	bool MaySpill = ST.isVGPRSpillingEnabled(*F);
Matt Arsenault	2b1f9aa	2017-05-17 21:56:25 +0000	[diff] [blame^]	128	bool HasStackObjects = FrameInfo.hasStackObjects() \|\| FrameInfo.hasCalls();
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	129
Marek Olsak	584d2c0	2017-05-04 22:25:20 +0000	[diff] [blame]	130	if (HasStackObjects \|\| MaySpill) {
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	131	PrivateSegmentWaveByteOffset = true;
				132
Marek Olsak	584d2c0	2017-05-04 22:25:20 +0000	[diff] [blame]	133	// HS and GS always have the scratch wave offset in SGPR5 on GFX9.
				134	if (ST.getGeneration() >= AMDGPUSubtarget::GFX9 &&
				135	(CC == CallingConv::AMDGPU_HS \|\| CC == CallingConv::AMDGPU_GS))
				136	PrivateSegmentWaveByteOffsetSystemSGPR = AMDGPU::SGPR5;
				137	}
				138
Tom Stellard	2f3f985	2017-01-25 01:25:13 +0000	[diff] [blame]	139	if (ST.isAmdCodeObjectV2(MF)) {
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	140	if (HasStackObjects \|\| MaySpill)
				141	PrivateSegmentBuffer = true;
				142
				143	if (F->hasFnAttribute("amdgpu-dispatch-ptr"))
				144	DispatchPtr = true;
Matt Arsenault	48ab526	2016-04-25 19:27:18 +0000	[diff] [blame]	145
				146	if (F->hasFnAttribute("amdgpu-queue-ptr"))
				147	QueuePtr = true;
Matt Arsenault	8d718dc	2016-07-22 17:01:30 +0000	[diff] [blame]	148
				149	if (F->hasFnAttribute("amdgpu-dispatch-id"))
				150	DispatchID = true;
Tom Stellard	2f3f985	2017-01-25 01:25:13 +0000	[diff] [blame]	151	} else if (ST.isMesaGfxShader(MF)) {
				152	if (HasStackObjects \|\| MaySpill)
				153	PrivateMemoryInputPtr = true;
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	154	}
				155
Matt Arsenault	296b849	2016-02-12 06:31:30 +0000	[diff] [blame]	156	// We don't need to worry about accessing spills with flat instructions.
				157	// TODO: On VI where we must use flat for global, we should be able to omit
				158	// this if it is never used for generic access.
Matt Arsenault	efa9f4b	2017-04-11 22:29:28 +0000	[diff] [blame]	159	if (HasStackObjects && ST.hasFlatAddressSpace() && ST.isAmdHsaOS())
Matt Arsenault	296b849	2016-02-12 06:31:30 +0000	[diff] [blame]	160	FlatScratchInit = true;
Matt Arsenault	49affb8	2015-11-25 20:55:12 +0000	[diff] [blame]	161	}
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	162
Matt Arsenault	26f8f3d	2015-11-30 21:16:03 +0000	[diff] [blame]	163	unsigned SIMachineFunctionInfo::addPrivateSegmentBuffer(
				164	const SIRegisterInfo &TRI) {
				165	PrivateSegmentBufferUserSGPR = TRI.getMatchingSuperReg(
				166	getNextUserSGPR(), AMDGPU::sub0, &AMDGPU::SReg_128RegClass);
				167	NumUserSGPRs += 4;
				168	return PrivateSegmentBufferUserSGPR;
				169	}
				170
				171	unsigned SIMachineFunctionInfo::addDispatchPtr(const SIRegisterInfo &TRI) {
				172	DispatchPtrUserSGPR = TRI.getMatchingSuperReg(
				173	getNextUserSGPR(), AMDGPU::sub0, &AMDGPU::SReg_64RegClass);
				174	NumUserSGPRs += 2;
				175	return DispatchPtrUserSGPR;
				176	}
				177
				178	unsigned SIMachineFunctionInfo::addQueuePtr(const SIRegisterInfo &TRI) {
				179	QueuePtrUserSGPR = TRI.getMatchingSuperReg(
				180	getNextUserSGPR(), AMDGPU::sub0, &AMDGPU::SReg_64RegClass);
				181	NumUserSGPRs += 2;
				182	return QueuePtrUserSGPR;
				183	}
				184
				185	unsigned SIMachineFunctionInfo::addKernargSegmentPtr(const SIRegisterInfo &TRI) {
				186	KernargSegmentPtrUserSGPR = TRI.getMatchingSuperReg(
				187	getNextUserSGPR(), AMDGPU::sub0, &AMDGPU::SReg_64RegClass);
				188	NumUserSGPRs += 2;
				189	return KernargSegmentPtrUserSGPR;
Matt Arsenault	0e3d389	2015-11-30 21:15:53 +0000	[diff] [blame]	190	}
				191
Matt Arsenault	8d718dc	2016-07-22 17:01:30 +0000	[diff] [blame]	192	unsigned SIMachineFunctionInfo::addDispatchID(const SIRegisterInfo &TRI) {
				193	DispatchIDUserSGPR = TRI.getMatchingSuperReg(
				194	getNextUserSGPR(), AMDGPU::sub0, &AMDGPU::SReg_64RegClass);
				195	NumUserSGPRs += 2;
				196	return DispatchIDUserSGPR;
				197	}
				198
Matt Arsenault	296b849	2016-02-12 06:31:30 +0000	[diff] [blame]	199	unsigned SIMachineFunctionInfo::addFlatScratchInit(const SIRegisterInfo &TRI) {
				200	FlatScratchInitUserSGPR = TRI.getMatchingSuperReg(
				201	getNextUserSGPR(), AMDGPU::sub0, &AMDGPU::SReg_64RegClass);
				202	NumUserSGPRs += 2;
				203	return FlatScratchInitUserSGPR;
				204	}
				205
Tom Stellard	2f3f985	2017-01-25 01:25:13 +0000	[diff] [blame]	206	unsigned SIMachineFunctionInfo::addPrivateMemoryPtr(const SIRegisterInfo &TRI) {
				207	PrivateMemoryPtrUserSGPR = TRI.getMatchingSuperReg(
				208	getNextUserSGPR(), AMDGPU::sub0, &AMDGPU::SReg_64RegClass);
				209	NumUserSGPRs += 2;
				210	return PrivateMemoryPtrUserSGPR;
				211	}
				212
Matt Arsenault	e0bf7d0	2017-02-21 19:12:08 +0000	[diff] [blame]	213	/// Reserve a slice of a VGPR to support spilling for FrameIndex \p FI.
				214	bool SIMachineFunctionInfo::allocateSGPRSpillToVGPR(MachineFunction &MF,
				215	int FI) {
				216	std::vector<SpilledReg> &SpillLanes = SGPRToVGPRSpills[FI];
Matt Arsenault	8d4b0ed	2016-06-23 20:00:34 +0000	[diff] [blame]	217
Matt Arsenault	e0bf7d0	2017-02-21 19:12:08 +0000	[diff] [blame]	218	// This has already been allocated.
				219	if (!SpillLanes.empty())
				220	return true;
				221
				222	const SISubtarget &ST = MF.getSubtarget<SISubtarget>();
Matt Arsenault	43e92fe	2016-06-24 06:30:11 +0000	[diff] [blame]	223	const SIRegisterInfo *TRI = ST.getRegisterInfo();
Matt Arsenault	e0bf7d0	2017-02-21 19:12:08 +0000	[diff] [blame]	224	MachineFrameInfo &FrameInfo = MF.getFrameInfo();
				225	MachineRegisterInfo &MRI = MF.getRegInfo();
				226	unsigned WaveSize = ST.getWavefrontSize();
Matt Arsenault	43e92fe	2016-06-24 06:30:11 +0000	[diff] [blame]	227
Matt Arsenault	e0bf7d0	2017-02-21 19:12:08 +0000	[diff] [blame]	228	unsigned Size = FrameInfo.getObjectSize(FI);
				229	assert(Size >= 4 && Size <= 64 && "invalid sgpr spill size");
				230	assert(TRI->spillSGPRToVGPR() && "not spilling SGPRs to VGPRs");
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	231
Matt Arsenault	e0bf7d0	2017-02-21 19:12:08 +0000	[diff] [blame]	232	int NumLanes = Size / 4;
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	233
Matt Arsenault	e0bf7d0	2017-02-21 19:12:08 +0000	[diff] [blame]	234	// Make sure to handle the case where a wide SGPR spill may span between two
				235	// VGPRs.
				236	for (int I = 0; I < NumLanes; ++I, ++NumVGPRSpillLanes) {
				237	unsigned LaneVGPR;
				238	unsigned VGPRIndex = (NumVGPRSpillLanes % WaveSize);
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	239
Matt Arsenault	e0bf7d0	2017-02-21 19:12:08 +0000	[diff] [blame]	240	if (VGPRIndex == 0) {
				241	LaneVGPR = TRI->findUnusedRegister(MRI, &AMDGPU::VGPR_32RegClass, MF);
				242	if (LaneVGPR == AMDGPU::NoRegister) {
				243	// We have no VGPRs left for spilling SGPRs. Reset because we won't
				244	// partially spill the SGPR to VGPRs.
				245	SGPRToVGPRSpills.erase(FI);
				246	NumVGPRSpillLanes -= I;
				247	return false;
				248	}
Nicolai Haehnle	e705aad	2016-01-04 15:50:01 +0000	[diff] [blame]	249
Matt Arsenault	e0bf7d0	2017-02-21 19:12:08 +0000	[diff] [blame]	250	SpillVGPRs.push_back(LaneVGPR);
Nicolai Haehnle	e705aad	2016-01-04 15:50:01 +0000	[diff] [blame]	251
Matt Arsenault	e0bf7d0	2017-02-21 19:12:08 +0000	[diff] [blame]	252	// Add this register as live-in to all blocks to avoid machine verifer
				253	// complaining about use of an undefined physical register.
				254	for (MachineBasicBlock &BB : MF)
				255	BB.addLiveIn(LaneVGPR);
				256	} else {
				257	LaneVGPR = SpillVGPRs.back();
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	258	}
Matt Arsenault	e0bf7d0	2017-02-21 19:12:08 +0000	[diff] [blame]	259
				260	SpillLanes.push_back(SpilledReg(LaneVGPR, VGPRIndex));
Tom Stellard	c5cf2f0	2014-08-21 20:40:54 +0000	[diff] [blame]	261	}
				262
Matt Arsenault	e0bf7d0	2017-02-21 19:12:08 +0000	[diff] [blame]	263	return true;
				264	}
				265
				266	void SIMachineFunctionInfo::removeSGPRToVGPRFrameIndices(MachineFrameInfo &MFI) {
				267	for (auto &R : SGPRToVGPRSpills)
				268	MFI.RemoveStackObject(R.first);
Tom Stellard	c149dc0	2013-11-27 21:23:35 +0000	[diff] [blame]	269	}