Blame - llvm/lib/Target/R600/AMDGPUISelLowering.cpp - toolchain/llvm-project

2012-12-11 21:25:42 +0000

[diff] [blame]

1

//===-- AMDGPUISelLowering.cpp - AMDGPU Common DAG lowering functions -----===//

2

//

3

// The LLVM Compiler Infrastructure

4

//

5

// This file is distributed under the University of Illinois Open Source

6

// License. See LICENSE.TXT for details.

7

//

8

//===----------------------------------------------------------------------===//

9

//

10

/// \file

11

/// \brief This is the parent TargetLowering class for hardware code gen

12

/// targets.

13

//

14

//===----------------------------------------------------------------------===//

15

16

#include "AMDGPUISelLowering.h"

Tom Stellard

ed882c2

2013-06-03 17:40:11 +0000

[diff] [blame]

17

#include "AMDGPU.h"

Tom Stellard

2013-11-13 23:36:50 +0000

[diff] [blame]

18

#include "AMDGPUFrameLowering.h"

Christian Konig

2013-03-07 09:03:52 +0000

[diff] [blame]

19

#include "AMDGPURegisterInfo.h"

Christian Konig

2013-03-07 09:03:52 +0000

[diff] [blame]

20

#include "AMDGPUSubtarget.h"

Benjamin Kramer

d78bb46

2013-05-23 17:10:37 +0000

[diff] [blame]

21

#include "AMDILIntrinsicInfo.h"

Tom Stellard

acfeebf

2013-07-23 01:48:05 +0000

[diff] [blame]

22

#include "R600MachineFunctionInfo.h"

Tom Stellard

ed882c2

2013-06-03 17:40:11 +0000

[diff] [blame]

23

#include "SIMachineFunctionInfo.h"

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

24

#include "llvm/Analysis/ValueTracking.h"

Christian Konig

2013-03-07 09:03:52 +0000

[diff] [blame]

25

#include "llvm/CodeGen/CallingConvLower.h"

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

26

#include "llvm/CodeGen/MachineFunction.h"

27

#include "llvm/CodeGen/MachineRegisterInfo.h"

28

#include "llvm/CodeGen/SelectionDAG.h"

29

#include "llvm/CodeGen/TargetLoweringObjectFileImpl.h"

Tom Stellard

2013-06-28 15:47:08 +0000

[diff] [blame]

30

#include "llvm/IR/DataLayout.h"

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

31

32

using namespace llvm;

Tom Stellard

2013-10-23 00:44:32 +0000

[diff] [blame]

33

static bool allocateStack(unsigned ValNo, MVT ValVT, MVT LocVT,

34

CCValAssign::LocInfo LocInfo,

35

ISD::ArgFlagsTy ArgFlags, CCState &State) {

Matt Arsenault

52226f9

2013-12-14 18:21:59 +0000

[diff] [blame]

36

unsigned Offset = State.AllocateStack(ValVT.getStoreSize(),

37

ArgFlags.getOrigAlign());

38

State.addLoc(CCValAssign::getMem(ValNo, ValVT, Offset, LocVT, LocInfo));

Tom Stellard

2013-10-23 00:44:32 +0000

[diff] [blame]

39

40

return true;

41

}

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

42

Christian Konig

2013-03-07 09:03:52 +0000

[diff] [blame]

43

#include "AMDGPUGenCallingConv.inc"

44

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

45

AMDGPUTargetLowering::AMDGPUTargetLowering(TargetMachine &TM) :

46

TargetLowering(TM, new TargetLoweringObjectFileELF()) {

47

Matt Arsenault

41e2f2b

2014-02-24 21:01:28 +0000

[diff] [blame]

48

Subtarget = &TM.getSubtarget<AMDGPUSubtarget>();

49

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

50

// Initialize target lowering borrowed from AMDIL

51

InitAMDILLowering();

52

53

// We need to custom lower some of the intrinsics

54

setOperationAction(ISD::INTRINSIC_WO_CHAIN, MVT::Other, Custom);

55

56

// Library functions. These default to Expand, but we have instructions

57

// for them.

58

setOperationAction(ISD::FCEIL, MVT::f32, Legal);

59

setOperationAction(ISD::FEXP2, MVT::f32, Legal);

60

setOperationAction(ISD::FPOW, MVT::f32, Legal);

61

setOperationAction(ISD::FLOG2, MVT::f32, Legal);

62

setOperationAction(ISD::FABS, MVT::f32, Legal);

63

setOperationAction(ISD::FFLOOR, MVT::f32, Legal);

64

setOperationAction(ISD::FRINT, MVT::f32, Legal);

Tom Stellard

4d566b2

2013-11-27 21:23:20 +0000

[diff] [blame]

65

setOperationAction(ISD::FROUND, MVT::f32, Legal);

Tom Stellard

eddfa69

2013-12-20 05:11:55 +0000

[diff] [blame]

66

setOperationAction(ISD::FTRUNC, MVT::f32, Legal);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

67

Tom Stellard

5643c4a

2013-05-20 15:02:19 +0000

[diff] [blame]

68

// The hardware supports ROTR, but not ROTL

69

setOperationAction(ISD::ROTL, MVT::i32, Expand);

70

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

71

// Lower floating point store/load to integer store/load to reduce the number

72

// of patterns in tablegen.

73

setOperationAction(ISD::STORE, MVT::f32, Promote);

74

AddPromotedToType(ISD::STORE, MVT::f32, MVT::i32);

75

Tom Stellard

ed2f614

2013-07-18 21:43:42 +0000

[diff] [blame]

76

setOperationAction(ISD::STORE, MVT::v2f32, Promote);

77

AddPromotedToType(ISD::STORE, MVT::v2f32, MVT::v2i32);

78

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

79

setOperationAction(ISD::STORE, MVT::v4f32, Promote);

80

AddPromotedToType(ISD::STORE, MVT::v4f32, MVT::v4i32);

81

Tom Stellard

2013-10-23 00:44:32 +0000

[diff] [blame]

82

setOperationAction(ISD::STORE, MVT::v8f32, Promote);

83

AddPromotedToType(ISD::STORE, MVT::v8f32, MVT::v8i32);

84

85

setOperationAction(ISD::STORE, MVT::v16f32, Promote);

86

AddPromotedToType(ISD::STORE, MVT::v16f32, MVT::v16i32);

87

Tom Stellard

7512c08

2013-07-12 18:14:56 +0000

[diff] [blame]

88

setOperationAction(ISD::STORE, MVT::f64, Promote);

89

AddPromotedToType(ISD::STORE, MVT::f64, MVT::i64);

90

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

91

// Custom lowering of vector stores is required for local address space

92

// stores.

93

setOperationAction(ISD::STORE, MVT::v4i32, Custom);

94

// XXX: Native v2i32 local address space stores are possible, but not

95

// currently implemented.

96

setOperationAction(ISD::STORE, MVT::v2i32, Custom);

97

Tom Stellard

fbab827

2013-08-16 01:12:11 +0000

[diff] [blame]

98

setTruncStoreAction(MVT::v2i32, MVT::v2i16, Custom);

99

setTruncStoreAction(MVT::v2i32, MVT::v2i8, Custom);

100

setTruncStoreAction(MVT::v4i32, MVT::v4i8, Custom);

Matt Arsenault

e389dd5

2014-03-12 18:45:52 +0000

[diff] [blame]

101

Tom Stellard

fbab827

2013-08-16 01:12:11 +0000

[diff] [blame]

102

// XXX: This can be change to Custom, once ExpandVectorStores can

103

// handle 64-bit stores.

104

setTruncStoreAction(MVT::v4i32, MVT::v4i16, Expand);

105

Matt Arsenault

e389dd5

2014-03-12 18:45:52 +0000

[diff] [blame]

106

setTruncStoreAction(MVT::i64, MVT::i1, Expand);

107

setTruncStoreAction(MVT::v2i64, MVT::v2i1, Expand);

108

setTruncStoreAction(MVT::v4i64, MVT::v4i1, Expand);

109

110

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

111

setOperationAction(ISD::LOAD, MVT::f32, Promote);

112

AddPromotedToType(ISD::LOAD, MVT::f32, MVT::i32);

113

Tom Stellard

adf732c

2013-07-18 21:43:48 +0000

[diff] [blame]

114

setOperationAction(ISD::LOAD, MVT::v2f32, Promote);

115

AddPromotedToType(ISD::LOAD, MVT::v2f32, MVT::v2i32);

116

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

117

setOperationAction(ISD::LOAD, MVT::v4f32, Promote);

118

AddPromotedToType(ISD::LOAD, MVT::v4f32, MVT::v4i32);

119

Tom Stellard

2013-10-23 00:44:32 +0000

[diff] [blame]

120

setOperationAction(ISD::LOAD, MVT::v8f32, Promote);

121

AddPromotedToType(ISD::LOAD, MVT::v8f32, MVT::v8i32);

122

123

setOperationAction(ISD::LOAD, MVT::v16f32, Promote);

124

AddPromotedToType(ISD::LOAD, MVT::v16f32, MVT::v16i32);

125

Tom Stellard

7512c08

2013-07-12 18:14:56 +0000

[diff] [blame]

126

setOperationAction(ISD::LOAD, MVT::f64, Promote);

127

AddPromotedToType(ISD::LOAD, MVT::f64, MVT::i64);

128

Tom Stellard

2013-08-14 23:25:00 +0000

[diff] [blame]

129

setOperationAction(ISD::CONCAT_VECTORS, MVT::v4i32, Custom);

130

setOperationAction(ISD::CONCAT_VECTORS, MVT::v4f32, Custom);

Tom Stellard

967bf58

2014-02-13 23:34:15 +0000

[diff] [blame]

131

setOperationAction(ISD::CONCAT_VECTORS, MVT::v8i32, Custom);

132

setOperationAction(ISD::CONCAT_VECTORS, MVT::v8f32, Custom);

Tom Stellard

2013-08-14 23:25:00 +0000

[diff] [blame]

133

setOperationAction(ISD::EXTRACT_SUBVECTOR, MVT::v2f32, Custom);

Tom Stellard

967bf58

2014-02-13 23:34:15 +0000

[diff] [blame]

134

setOperationAction(ISD::EXTRACT_SUBVECTOR, MVT::v2i32, Custom);

135

setOperationAction(ISD::EXTRACT_SUBVECTOR, MVT::v4f32, Custom);

136

setOperationAction(ISD::EXTRACT_SUBVECTOR, MVT::v4i32, Custom);

137

setOperationAction(ISD::EXTRACT_SUBVECTOR, MVT::v8f32, Custom);

138

setOperationAction(ISD::EXTRACT_SUBVECTOR, MVT::v8i32, Custom);

Tom Stellard

0344cdf

2013-08-01 15:23:42 +0000

[diff] [blame]

139

Tom Stellard

b03edec

2013-08-16 01:12:16 +0000

[diff] [blame]

140

setLoadExtAction(ISD::EXTLOAD, MVT::v2i8, Expand);

141

setLoadExtAction(ISD::SEXTLOAD, MVT::v2i8, Expand);

142

setLoadExtAction(ISD::ZEXTLOAD, MVT::v2i8, Expand);

143

setLoadExtAction(ISD::EXTLOAD, MVT::v4i8, Expand);

144

setLoadExtAction(ISD::SEXTLOAD, MVT::v4i8, Expand);

145

setLoadExtAction(ISD::ZEXTLOAD, MVT::v4i8, Expand);

146

setLoadExtAction(ISD::EXTLOAD, MVT::v2i16, Expand);

147

setLoadExtAction(ISD::SEXTLOAD, MVT::v2i16, Expand);

148

setLoadExtAction(ISD::ZEXTLOAD, MVT::v2i16, Expand);

149

setLoadExtAction(ISD::EXTLOAD, MVT::v4i16, Expand);

150

setLoadExtAction(ISD::SEXTLOAD, MVT::v4i16, Expand);

151

setLoadExtAction(ISD::ZEXTLOAD, MVT::v4i16, Expand);

152

Tom Stellard

aeb4564

2014-02-04 17:18:43 +0000

[diff] [blame]

153

setOperationAction(ISD::BR_CC, MVT::i1, Expand);

154

Tom Stellard

beed74a

2013-07-23 01:47:46 +0000

[diff] [blame]

155

setOperationAction(ISD::FNEG, MVT::v2f32, Expand);

156

setOperationAction(ISD::FNEG, MVT::v4f32, Expand);

157

Tom Stellard

c947d8c

2013-10-30 17:22:05 +0000

[diff] [blame]

158

setOperationAction(ISD::UINT_TO_FP, MVT::i64, Custom);

159

Christian Konig

70a5032

2013-03-27 09:12:51 +0000

[diff] [blame]

160

setOperationAction(ISD::MUL, MVT::i64, Expand);

161

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

162

setOperationAction(ISD::UDIV, MVT::i32, Expand);

163

setOperationAction(ISD::UDIVREM, MVT::i32, Custom);

164

setOperationAction(ISD::UREM, MVT::i32, Expand);

Tom Stellard

67ae476

2013-07-18 21:43:35 +0000

[diff] [blame]

165

setOperationAction(ISD::VSELECT, MVT::v2f32, Expand);

166

setOperationAction(ISD::VSELECT, MVT::v4f32, Expand);

Aaron Watry

2013-06-25 13:55:57 +0000

[diff] [blame]

167

Tom Stellard

2013-08-21 22:14:17 +0000

[diff] [blame]

168

static const MVT::SimpleValueType IntTypes[] = {

169

MVT::v2i32, MVT::v4i32

Aaron Watry

2013-06-25 13:55:57 +0000

[diff] [blame]

170

};

Tom Stellard

2013-08-16 23:51:24 +0000

[diff] [blame]

171

const size_t NumIntTypes = array_lengthof(IntTypes);

Aaron Watry

2013-06-25 13:55:57 +0000

[diff] [blame]

172

Tom Stellard

2013-08-16 23:51:24 +0000

[diff] [blame]

173

for (unsigned int x = 0; x < NumIntTypes; ++x) {

Tom Stellard

2013-08-21 22:14:17 +0000

[diff] [blame]

174

MVT::SimpleValueType VT = IntTypes[x];

Aaron Watry

2013-06-25 13:55:57 +0000

[diff] [blame]

175

//Expand the following operations for the current type by default

176

setOperationAction(ISD::ADD, VT, Expand);

177

setOperationAction(ISD::AND, VT, Expand);

Tom Stellard

aa313d0

2013-07-30 14:31:03 +0000

[diff] [blame]

178

setOperationAction(ISD::FP_TO_SINT, VT, Expand);

179

setOperationAction(ISD::FP_TO_UINT, VT, Expand);

Aaron Watry

2013-06-25 13:55:57 +0000

[diff] [blame]

180

setOperationAction(ISD::MUL, VT, Expand);

181

setOperationAction(ISD::OR, VT, Expand);

182

setOperationAction(ISD::SHL, VT, Expand);

Tom Stellard

aa313d0

2013-07-30 14:31:03 +0000

[diff] [blame]

183

setOperationAction(ISD::SINT_TO_FP, VT, Expand);

Aaron Watry

2013-06-25 13:55:57 +0000

[diff] [blame]

184

setOperationAction(ISD::SRL, VT, Expand);

185

setOperationAction(ISD::SRA, VT, Expand);

186

setOperationAction(ISD::SUB, VT, Expand);

187

setOperationAction(ISD::UDIV, VT, Expand);

Tom Stellard

aa313d0

2013-07-30 14:31:03 +0000

[diff] [blame]

188

setOperationAction(ISD::UINT_TO_FP, VT, Expand);

Aaron Watry

2013-06-25 13:55:57 +0000

[diff] [blame]

189

setOperationAction(ISD::UREM, VT, Expand);

Matt Arsenault

9fe669c

2014-03-06 17:34:03 +0000

[diff] [blame]

190

setOperationAction(ISD::SELECT, VT, Expand);

Tom Stellard

67ae476

2013-07-18 21:43:35 +0000

[diff] [blame]

191

setOperationAction(ISD::VSELECT, VT, Expand);

Aaron Watry

2013-06-25 13:55:57 +0000

[diff] [blame]

192

setOperationAction(ISD::XOR, VT, Expand);

193

}

Tom Stellard

2013-08-16 23:51:24 +0000

[diff] [blame]

194

Tom Stellard

2013-08-21 22:14:17 +0000

[diff] [blame]

195

static const MVT::SimpleValueType FloatTypes[] = {

196

MVT::v2f32, MVT::v4f32

Tom Stellard

2013-08-16 23:51:24 +0000

[diff] [blame]

197

};

198

const size_t NumFloatTypes = array_lengthof(FloatTypes);

199

200

for (unsigned int x = 0; x < NumFloatTypes; ++x) {

Tom Stellard

2013-08-21 22:14:17 +0000

[diff] [blame]

201

MVT::SimpleValueType VT = FloatTypes[x];

Tom Stellard

175e7a8

2013-11-27 21:23:39 +0000

[diff] [blame]

202

setOperationAction(ISD::FABS, VT, Expand);

Tom Stellard

2013-08-16 23:51:24 +0000

[diff] [blame]

203

setOperationAction(ISD::FADD, VT, Expand);

204

setOperationAction(ISD::FDIV, VT, Expand);

Tom Stellard

bfebd1f

2014-02-04 17:18:37 +0000

[diff] [blame]

205

setOperationAction(ISD::FPOW, VT, Expand);

Tom Stellard

ad3aff2

2013-08-16 23:51:29 +0000

[diff] [blame]

206

setOperationAction(ISD::FFLOOR, VT, Expand);

Tom Stellard

eddfa69

2013-12-20 05:11:55 +0000

[diff] [blame]

207

setOperationAction(ISD::FTRUNC, VT, Expand);

Tom Stellard

2013-08-16 23:51:24 +0000

[diff] [blame]

208

setOperationAction(ISD::FMUL, VT, Expand);

Tom Stellard

b249b75

2013-08-16 23:51:33 +0000

[diff] [blame]

209

setOperationAction(ISD::FRINT, VT, Expand);

Tom Stellard

e118b8b

2013-10-29 16:37:20 +0000

[diff] [blame]

210

setOperationAction(ISD::FSQRT, VT, Expand);

Tom Stellard

2013-08-16 23:51:24 +0000

[diff] [blame]

211

setOperationAction(ISD::FSUB, VT, Expand);

Matt Arsenault

9fe669c

2014-03-06 17:34:03 +0000

[diff] [blame]

212

setOperationAction(ISD::SELECT, VT, Expand);

Tom Stellard

2013-08-16 23:51:24 +0000

[diff] [blame]

213

}

Matt Arsenault

2014-03-17 18:58:11 +0000

[diff] [blame]

214

Tom Stellard

2014-04-07 19:45:41 +0000

[diff] [blame]

215

setTargetDAGCombine(ISD::MUL);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

216

}

217

Tom Stellard

28d06de

2013-08-05 22:22:07 +0000

[diff] [blame]

218

//===----------------------------------------------------------------------===//

219

// Target Information

220

//===----------------------------------------------------------------------===//

221

222

MVT AMDGPUTargetLowering::getVectorIdxTy() const {

return MVT::i32;

}

Matt Arsenault

2013-11-15 04:42:23 +0000

[diff] [blame]

226

bool AMDGPUTargetLowering::isLoadBitCastBeneficial(EVT LoadTy,

227

EVT CastTy) const {

228

if (LoadTy.getSizeInBits() != CastTy.getSizeInBits())

229

return true;

230

231

unsigned LScalarSize = LoadTy.getScalarType().getSizeInBits();

232

unsigned CastScalarSize = CastTy.getScalarType().getSizeInBits();

233

234

return ((LScalarSize <= CastScalarSize) ||

235

(CastScalarSize >= 32) ||

236

(LScalarSize < 32));

237

}

Tom Stellard

28d06de

2013-08-05 22:22:07 +0000

[diff] [blame]

238

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

239

//===---------------------------------------------------------------------===//

Tom Stellard

c54731a

2013-07-23 23:55:03 +0000

[diff] [blame]

240

// Target Properties

241

//===---------------------------------------------------------------------===//

242

243

bool AMDGPUTargetLowering::isFAbsFree(EVT VT) const {

244

assert(VT.isFloatingPoint());

245

return VT == MVT::f32;

246

}

247

248

bool AMDGPUTargetLowering::isFNegFree(EVT VT) const {

249

assert(VT.isFloatingPoint());

250

return VT == MVT::f32;

251

}

252

Benjamin Kramer

53f9df4

2014-02-12 10:17:54 +0000

[diff] [blame]

253

bool AMDGPUTargetLowering::isTruncateFree(EVT Source, EVT Dest) const {

Matt Arsenault

0cdcd96

2014-02-10 19:57:42 +0000

[diff] [blame]

254

// Truncate is just accessing a subregister.

Benjamin Kramer

53f9df4

2014-02-12 10:17:54 +0000

[diff] [blame]

255

return Dest.bitsLT(Source) && (Dest.getSizeInBits() % 32 == 0);

256

}

257

258

bool AMDGPUTargetLowering::isTruncateFree(Type *Source, Type *Dest) const {

259

// Truncate is just accessing a subregister.

260

return Dest->getPrimitiveSizeInBits() < Source->getPrimitiveSizeInBits() &&

261

(Dest->getPrimitiveSizeInBits() % 32 == 0);

Matt Arsenault

0cdcd96

2014-02-10 19:57:42 +0000

[diff] [blame]

262

}

263

Matt Arsenault

b517c81

2014-03-27 17:23:31 +0000

[diff] [blame]

264

bool AMDGPUTargetLowering::isZExtFree(Type *Src, Type *Dest) const {

265

const DataLayout *DL = getDataLayout();

266

unsigned SrcSize = DL->getTypeSizeInBits(Src->getScalarType());

267

unsigned DestSize = DL->getTypeSizeInBits(Dest->getScalarType());

268

269

return SrcSize == 32 && DestSize == 64;

270

}

271

272

bool AMDGPUTargetLowering::isZExtFree(EVT Src, EVT Dest) const {

273

// Any register load of a 64-bit value really requires 2 32-bit moves. For all

274

// practical purposes, the extra mov 0 to load a 64-bit is free. As used,

275

// this will enable reducing 64-bit operations the 32-bit, which is always

276

// good.

277

return Src == MVT::i32 && Dest == MVT::i64;

278

}

279

Matt Arsenault

a7f1e0c

2014-03-24 19:43:31 +0000

[diff] [blame]

280

bool AMDGPUTargetLowering::isNarrowingProfitable(EVT SrcVT, EVT DestVT) const {

281

// There aren't really 64-bit registers, but pairs of 32-bit ones and only a

282

// limited number of native 64-bit operations. Shrinking an operation to fit

283

// in a single 32-bit register should always be helpful. As currently used,

284

// this is much less general than the name suggests, and is only used in

285

// places trying to reduce the sizes of loads. Shrinking loads to < 32-bits is

286

// not profitable, and may actually be harmful.

287

return SrcVT.getSizeInBits() > 32 && DestVT.getSizeInBits() == 32;

288

}

289

Tom Stellard

c54731a

2013-07-23 23:55:03 +0000

[diff] [blame]

290

//===---------------------------------------------------------------------===//

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

291

// TargetLowering Callbacks

292

//===---------------------------------------------------------------------===//

293

Christian Konig

2013-03-07 09:03:52 +0000

[diff] [blame]

294

void AMDGPUTargetLowering::AnalyzeFormalArguments(CCState &State,

295

const SmallVectorImpl<ISD::InputArg> &Ins) const {

296

297

State.AnalyzeFormalArguments(Ins, CC_AMDGPU);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

298

}

299

300

SDValue AMDGPUTargetLowering::LowerReturn(

301

SDValue Chain,

302

CallingConv::ID CallConv,

303

bool isVarArg,

304

const SmallVectorImpl<ISD::OutputArg> &Outs,

305

const SmallVectorImpl<SDValue> &OutVals,

Andrew Trick

2013-05-25 02:42:55 +0000

[diff] [blame]

306

SDLoc DL, SelectionDAG &DAG) const {

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

307

return DAG.getNode(AMDGPUISD::RET_FLAG, DL, MVT::Other, Chain);

308

}

309

310

//===---------------------------------------------------------------------===//

311

// Target specific lowering

312

//===---------------------------------------------------------------------===//

313

314

SDValue AMDGPUTargetLowering::LowerOperation(SDValue Op, SelectionDAG &DAG)

315

const {

316

switch (Op.getOpcode()) {

317

default:

318

Op.getNode()->dump();

Matt Arsenault

eaa3a7e

2013-12-10 21:37:42 +0000

[diff] [blame]

319

llvm_unreachable("Custom lowering code for this"

320

"instruction is not implemented yet!");

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

321

break;

322

// AMDIL DAG lowering

323

case ISD::SDIV: return LowerSDIV(Op, DAG);

324

case ISD::SREM: return LowerSREM(Op, DAG);

325

case ISD::SIGN_EXTEND_INREG: return LowerSIGN_EXTEND_INREG(Op, DAG);

326

case ISD::BRCOND: return LowerBRCOND(Op, DAG);

327

// AMDGPU DAG lowering

Tom Stellard

2013-08-14 23:25:00 +0000

[diff] [blame]

328

case ISD::CONCAT_VECTORS: return LowerCONCAT_VECTORS(Op, DAG);

329

case ISD::EXTRACT_SUBVECTOR: return LowerEXTRACT_SUBVECTOR(Op, DAG);

Tom Stellard

2013-11-13 23:36:50 +0000

[diff] [blame]

330

case ISD::FrameIndex: return LowerFrameIndex(Op, DAG);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

331

case ISD::INTRINSIC_WO_CHAIN: return LowerINTRINSIC_WO_CHAIN(Op, DAG);

332

case ISD::UDIVREM: return LowerUDIVREM(Op, DAG);

Tom Stellard

c947d8c

2013-10-30 17:22:05 +0000

[diff] [blame]

333

case ISD::UINT_TO_FP: return LowerUINT_TO_FP(Op, DAG);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

}

return Op;

}

Matt Arsenault

2014-03-27 17:23:24 +0000

[diff] [blame]

338

void AMDGPUTargetLowering::ReplaceNodeResults(SDNode *N,

339

SmallVectorImpl<SDValue> &Results,

340

SelectionDAG &DAG) const {

341

switch (N->getOpcode()) {

342

case ISD::SIGN_EXTEND_INREG:

343

// Different parts of legalization seem to interpret which type of

344

// sign_extend_inreg is the one to check for custom lowering. The extended

345

// from type is what really matters, but some places check for custom

346

// lowering of the result type. This results in trying to use

347

// ReplaceNodeResults to sext_in_reg to an illegal type, so we'll just do

348

// nothing here and let the illegal result integer be handled normally.

return;

default:

return;

}

}

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

356

SDValue AMDGPUTargetLowering::LowerConstantInitializer(const Constant* Init,

357

const GlobalValue *GV,

358

const SDValue &InitPtr,

359

SDValue Chain,

360

SelectionDAG &DAG) const {

361

const DataLayout *TD = getTargetMachine().getDataLayout();

362

SDLoc DL(InitPtr);

363

if (const ConstantInt *CI = dyn_cast<ConstantInt>(Init)) {

364

EVT VT = EVT::getEVT(CI->getType());

365

PointerType *PtrTy = PointerType::get(CI->getType(), 0);

366

return DAG.getStore(Chain, DL, DAG.getConstant(*CI, VT), InitPtr,

367

MachinePointerInfo(UndefValue::get(PtrTy)), false, false,

368

TD->getPrefTypeAlignment(CI->getType()));

369

} else if (const ConstantFP *CFP = dyn_cast<ConstantFP>(Init)) {

370

EVT VT = EVT::getEVT(CFP->getType());

371

PointerType *PtrTy = PointerType::get(CFP->getType(), 0);

372

return DAG.getStore(Chain, DL, DAG.getConstantFP(*CFP, VT), InitPtr,

373

MachinePointerInfo(UndefValue::get(PtrTy)), false, false,

374

TD->getPrefTypeAlignment(CFP->getType()));

375

} else if (Init->getType()->isAggregateType()) {

376

EVT PtrVT = InitPtr.getValueType();

377

unsigned NumElements = Init->getType()->getArrayNumElements();

378

SmallVector<SDValue, 8> Chains;

379

for (unsigned i = 0; i < NumElements; ++i) {

380

SDValue Offset = DAG.getConstant(i * TD->getTypeAllocSize(

381

Init->getType()->getArrayElementType()), PtrVT);

382

SDValue Ptr = DAG.getNode(ISD::ADD, DL, PtrVT, InitPtr, Offset);

383

Chains.push_back(LowerConstantInitializer(Init->getAggregateElement(i),

384

GV, Ptr, Chain, DAG));

385

}

Matt Arsenault

2014-04-07 16:44:24 +0000

[diff] [blame]

386

return DAG.getNode(ISD::TokenFactor, DL, MVT::Other,

387

Chains.data(), Chains.size());

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

388

} else {

389

Init->dump();

390

llvm_unreachable("Unhandled constant initializer");

}

}

Tom Stellard

2013-06-28 15:47:08 +0000

[diff] [blame]

394

SDValue AMDGPUTargetLowering::LowerGlobalAddress(AMDGPUMachineFunction* MFI,

395

SDValue Op,

396

SelectionDAG &DAG) const {

397

398

const DataLayout *TD = getTargetMachine().getDataLayout();

399

GlobalAddressSDNode *G = cast<GlobalAddressSDNode>(Op);

Tom Stellard

2013-06-28 15:47:08 +0000

[diff] [blame]

400

const GlobalValue *GV = G->getGlobal();

Tom Stellard

2013-06-28 15:47:08 +0000

[diff] [blame]

401

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

402

switch (G->getAddressSpace()) {

403

default: llvm_unreachable("Global Address lowering not implemented for this "

404

"address space");

405

case AMDGPUAS::LOCAL_ADDRESS: {

406

// XXX: What does the value of G->getOffset() mean?

407

assert(G->getOffset() == 0 &&

408

"Do not know what to do with an non-zero offset");

Tom Stellard

2013-06-28 15:47:08 +0000

[diff] [blame]

409

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

410

unsigned Offset;

411

if (MFI->LocalMemoryObjects.count(GV) == 0) {

412

uint64_t Size = TD->getTypeAllocSize(GV->getType()->getElementType());

413

Offset = MFI->LDSSize;

414

MFI->LocalMemoryObjects[GV] = Offset;

415

// XXX: Account for alignment?

416

MFI->LDSSize += Size;

417

} else {

418

Offset = MFI->LocalMemoryObjects[GV];

419

}

420

421

return DAG.getConstant(Offset, getPointerTy(G->getAddressSpace()));

422

}

423

case AMDGPUAS::CONSTANT_ADDRESS: {

424

MachineFrameInfo *FrameInfo = DAG.getMachineFunction().getFrameInfo();

425

Type *EltType = GV->getType()->getElementType();

426

unsigned Size = TD->getTypeAllocSize(EltType);

427

unsigned Alignment = TD->getPrefTypeAlignment(EltType);

428

429

const GlobalVariable *Var = dyn_cast<GlobalVariable>(GV);

430

const Constant *Init = Var->getInitializer();

431

int FI = FrameInfo->CreateStackObject(Size, Alignment, false);

432

SDValue InitPtr = DAG.getFrameIndex(FI,

433

getPointerTy(AMDGPUAS::PRIVATE_ADDRESS));

434

SmallVector<SDNode*, 8> WorkList;

435

436

for (SDNode::use_iterator I = DAG.getEntryNode()->use_begin(),

437

E = DAG.getEntryNode()->use_end(); I != E; ++I) {

438

if (I->getOpcode() != AMDGPUISD::REGISTER_LOAD && I->getOpcode() != ISD::LOAD)

439

continue;

440

WorkList.push_back(*I);

441

}

442

SDValue Chain = LowerConstantInitializer(Init, GV, InitPtr, DAG.getEntryNode(), DAG);

443

for (SmallVector<SDNode*, 8>::iterator I = WorkList.begin(),

444

E = WorkList.end(); I != E; ++I) {

445

SmallVector<SDValue, 8> Ops;

446

Ops.push_back(Chain);

447

for (unsigned i = 1; i < (*I)->getNumOperands(); ++i) {

448

Ops.push_back((*I)->getOperand(i));

449

}

Matt Arsenault

2014-04-07 16:44:24 +0000

[diff] [blame]

450

DAG.UpdateNodeOperands(*I, Ops.data(), Ops.size());

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

451

}

452

return DAG.getZExtOrTrunc(InitPtr, SDLoc(Op),

453

getPointerTy(AMDGPUAS::CONSTANT_ADDRESS));

454

}

455

}

Tom Stellard

2013-06-28 15:47:08 +0000

[diff] [blame]

456

}

457

Tom Stellard

2013-08-14 23:25:00 +0000

[diff] [blame]

458

SDValue AMDGPUTargetLowering::LowerCONCAT_VECTORS(SDValue Op,

459

SelectionDAG &DAG) const {

460

SmallVector<SDValue, 8> Args;

461

SDValue A = Op.getOperand(0);

462

SDValue B = Op.getOperand(1);

463

Matt Arsenault

9ec3cf2

2014-04-11 17:47:30 +0000

[diff] [blame]

464

DAG.ExtractVectorElements(A, Args);

465

DAG.ExtractVectorElements(B, Args);

Tom Stellard

2013-08-14 23:25:00 +0000

[diff] [blame]

466

467

return DAG.getNode(ISD::BUILD_VECTOR, SDLoc(Op), Op.getValueType(),

Matt Arsenault

2014-04-07 16:44:24 +0000

[diff] [blame]

468

Args.data(), Args.size());

Tom Stellard

2013-08-14 23:25:00 +0000

[diff] [blame]

469

}

470

471

SDValue AMDGPUTargetLowering::LowerEXTRACT_SUBVECTOR(SDValue Op,

472

SelectionDAG &DAG) const {

473

474

SmallVector<SDValue, 8> Args;

Tom Stellard

2013-08-14 23:25:00 +0000

[diff] [blame]

475

unsigned Start = cast<ConstantSDNode>(Op.getOperand(1))->getZExtValue();

Matt Arsenault

9ec3cf2

2014-04-11 17:47:30 +0000

[diff] [blame]

476

EVT VT = Op.getValueType();

477

DAG.ExtractVectorElements(Op.getOperand(0), Args, Start,

478

VT.getVectorNumElements());

Tom Stellard

2013-08-14 23:25:00 +0000

[diff] [blame]

479

480

return DAG.getNode(ISD::BUILD_VECTOR, SDLoc(Op), Op.getValueType(),

Matt Arsenault

2014-04-07 16:44:24 +0000

[diff] [blame]

481

Args.data(), Args.size());

Tom Stellard

2013-08-14 23:25:00 +0000

[diff] [blame]

482

}

483

Tom Stellard

2013-11-13 23:36:50 +0000

[diff] [blame]

484

SDValue AMDGPUTargetLowering::LowerFrameIndex(SDValue Op,

485

SelectionDAG &DAG) const {

486

487

MachineFunction &MF = DAG.getMachineFunction();

488

const AMDGPUFrameLowering *TFL =

489

static_cast<const AMDGPUFrameLowering*>(getTargetMachine().getFrameLowering());

490

491

FrameIndexSDNode *FIN = dyn_cast<FrameIndexSDNode>(Op);

492

assert(FIN);

493

494

unsigned FrameIndex = FIN->getIndex();

495

unsigned Offset = TFL->getFrameIndexOffset(MF, FrameIndex);

496

return DAG.getConstant(Offset * 4 * TFL->getStackWidth(MF),

497

Op.getValueType());

498

}

Tom Stellard

2013-08-14 23:25:00 +0000

[diff] [blame]

499

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

500

SDValue AMDGPUTargetLowering::LowerINTRINSIC_WO_CHAIN(SDValue Op,

501

SelectionDAG &DAG) const {

502

unsigned IntrinsicID = cast<ConstantSDNode>(Op.getOperand(0))->getZExtValue();

Andrew Trick

2013-05-25 02:42:55 +0000

[diff] [blame]

503

SDLoc DL(Op);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

504

EVT VT = Op.getValueType();

505

506

switch (IntrinsicID) {

507

default: return Op;

508

case AMDGPUIntrinsic::AMDIL_abs:

509

return LowerIntrinsicIABS(Op, DAG);

510

case AMDGPUIntrinsic::AMDIL_exp:

511

return DAG.getNode(ISD::FEXP2, DL, VT, Op.getOperand(1));

512

case AMDGPUIntrinsic::AMDGPU_lrp:

513

return LowerIntrinsicLRP(Op, DAG);

514

case AMDGPUIntrinsic::AMDIL_fraction:

515

return DAG.getNode(AMDGPUISD::FRACT, DL, VT, Op.getOperand(1));

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

516

case AMDGPUIntrinsic::AMDIL_max:

517

return DAG.getNode(AMDGPUISD::FMAX, DL, VT, Op.getOperand(1),

518

Op.getOperand(2));

519

case AMDGPUIntrinsic::AMDGPU_imax:

520

return DAG.getNode(AMDGPUISD::SMAX, DL, VT, Op.getOperand(1),

521

Op.getOperand(2));

522

case AMDGPUIntrinsic::AMDGPU_umax:

523

return DAG.getNode(AMDGPUISD::UMAX, DL, VT, Op.getOperand(1),

524

Op.getOperand(2));

525

case AMDGPUIntrinsic::AMDIL_min:

526

return DAG.getNode(AMDGPUISD::FMIN, DL, VT, Op.getOperand(1),

527

Op.getOperand(2));

528

case AMDGPUIntrinsic::AMDGPU_imin:

529

return DAG.getNode(AMDGPUISD::SMIN, DL, VT, Op.getOperand(1),

530

Op.getOperand(2));

531

case AMDGPUIntrinsic::AMDGPU_umin:

532

return DAG.getNode(AMDGPUISD::UMIN, DL, VT, Op.getOperand(1),

533

Op.getOperand(2));

Matt Arsenault

4c53717

2014-03-31 18:21:18 +0000

[diff] [blame]

534

535

case AMDGPUIntrinsic::AMDGPU_bfe_i32:

536

return DAG.getNode(AMDGPUISD::BFE_I32, DL, VT,

Op.getOperand(1),

Op.getOperand(2),

Op.getOperand(3));

case AMDGPUIntrinsic::AMDGPU_bfe_u32:

542

return DAG.getNode(AMDGPUISD::BFE_U32, DL, VT,

Op.getOperand(1),

Op.getOperand(2),

Op.getOperand(3));

case AMDGPUIntrinsic::AMDGPU_bfi:

548

return DAG.getNode(AMDGPUISD::BFI, DL, VT,

Op.getOperand(1),

Op.getOperand(2),

Op.getOperand(3));

case AMDGPUIntrinsic::AMDGPU_bfm:

554

return DAG.getNode(AMDGPUISD::BFM, DL, VT,

Op.getOperand(1),

Op.getOperand(2));

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

558

case AMDGPUIntrinsic::AMDIL_round_nearest:

559

return DAG.getNode(ISD::FRINT, DL, VT, Op.getOperand(1));

}

}

///IABS(a) = SMAX(sub(0, a), a)

564

SDValue AMDGPUTargetLowering::LowerIntrinsicIABS(SDValue Op,

565

SelectionDAG &DAG) const {

566

Andrew Trick

2013-05-25 02:42:55 +0000

[diff] [blame]

567

SDLoc DL(Op);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

568

EVT VT = Op.getValueType();

569

SDValue Neg = DAG.getNode(ISD::SUB, DL, VT, DAG.getConstant(0, VT),

570

Op.getOperand(1));

571

572

return DAG.getNode(AMDGPUISD::SMAX, DL, VT, Neg, Op.getOperand(1));

573

}

574

575

/// Linear Interpolation

576

/// LRP(a, b, c) = muladd(a, b, (1 - a) * c)

577

SDValue AMDGPUTargetLowering::LowerIntrinsicLRP(SDValue Op,

578

SelectionDAG &DAG) const {

Andrew Trick

2013-05-25 02:42:55 +0000

[diff] [blame]

579

SDLoc DL(Op);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

580

EVT VT = Op.getValueType();

581

SDValue OneSubA = DAG.getNode(ISD::FSUB, DL, VT,

582

DAG.getConstantFP(1.0f, MVT::f32),

583

Op.getOperand(1));

584

SDValue OneSubAC = DAG.getNode(ISD::FMUL, DL, VT, OneSubA,

585

Op.getOperand(3));

Vincent Lejeune

1ce13f5

2013-02-18 14:11:28 +0000

[diff] [blame]

586

return DAG.getNode(ISD::FADD, DL, VT,

587

DAG.getNode(ISD::FMUL, DL, VT, Op.getOperand(1), Op.getOperand(2)),

588

OneSubAC);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

589

}

590

591

/// \brief Generate Min/Max node

592

SDValue AMDGPUTargetLowering::LowerMinMax(SDValue Op,

593

SelectionDAG &DAG) const {

Andrew Trick

2013-05-25 02:42:55 +0000

[diff] [blame]

594

SDLoc DL(Op);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

595

EVT VT = Op.getValueType();

596

597

SDValue LHS = Op.getOperand(0);

598

SDValue RHS = Op.getOperand(1);

599

SDValue True = Op.getOperand(2);

600

SDValue False = Op.getOperand(3);

601

SDValue CC = Op.getOperand(4);

602

603

if (VT != MVT::f32 ||

604

!((LHS == True && RHS == False) || (LHS == False && RHS == True))) {

return SDValue();

}

ISD::CondCode CCOpcode = cast<CondCodeSDNode>(CC)->get();

switch (CCOpcode) {

case ISD::SETOEQ:

case ISD::SETONE:

case ISD::SETUNE:

case ISD::SETNE:

case ISD::SETUEQ:

case ISD::SETEQ:

case ISD::SETFALSE:

case ISD::SETFALSE2:

case ISD::SETTRUE:

case ISD::SETTRUE2:

case ISD::SETUO:

case ISD::SETO:

Matt Arsenault

eaa3a7e

2013-12-10 21:37:42 +0000

[diff] [blame]

622

llvm_unreachable("Operation should already be optimised!");

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

case ISD::SETULE:

case ISD::SETULT:

case ISD::SETOLE:

case ISD::SETOLT:

case ISD::SETLE:

case ISD::SETLT: {

if (LHS == True)

return DAG.getNode(AMDGPUISD::FMIN, DL, VT, LHS, RHS);

631

else

632

return DAG.getNode(AMDGPUISD::FMAX, DL, VT, LHS, RHS);

}

case ISD::SETGT:

case ISD::SETGE:

case ISD::SETUGE:

case ISD::SETOGE:

case ISD::SETUGT:

case ISD::SETOGT: {

if (LHS == True)

return DAG.getNode(AMDGPUISD::FMAX, DL, VT, LHS, RHS);

642

else

643

return DAG.getNode(AMDGPUISD::FMIN, DL, VT, LHS, RHS);

644

}

645

case ISD::SETCC_INVALID:

Matt Arsenault

eaa3a7e

2013-12-10 21:37:42 +0000

[diff] [blame]

646

llvm_unreachable("Invalid setcc condcode!");

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

}

return Op;

}

Tom Stellard

2013-08-26 15:06:04 +0000

[diff] [blame]

651

SDValue AMDGPUTargetLowering::SplitVectorLoad(const SDValue &Op,

652

SelectionDAG &DAG) const {

653

LoadSDNode *Load = dyn_cast<LoadSDNode>(Op);

654

EVT MemEltVT = Load->getMemoryVT().getVectorElementType();

655

EVT EltVT = Op.getValueType().getVectorElementType();

656

EVT PtrVT = Load->getBasePtr().getValueType();

657

unsigned NumElts = Load->getMemoryVT().getVectorNumElements();

658

SmallVector<SDValue, 8> Loads;

659

SDLoc SL(Op);

660

661

for (unsigned i = 0, e = NumElts; i != e; ++i) {

662

SDValue Ptr = DAG.getNode(ISD::ADD, SL, PtrVT, Load->getBasePtr(),

663

DAG.getConstant(i * (MemEltVT.getSizeInBits() / 8), PtrVT));

664

Loads.push_back(DAG.getExtLoad(Load->getExtensionType(), SL, EltVT,

665

Load->getChain(), Ptr,

666

MachinePointerInfo(Load->getMemOperand()->getValue()),

667

MemEltVT, Load->isVolatile(), Load->isNonTemporal(),

668

Load->getAlignment()));

669

}

Matt Arsenault

9504d2f

2014-03-11 00:01:31 +0000

[diff] [blame]

670

return DAG.getNode(ISD::BUILD_VECTOR, SL, Op.getValueType(),

671

Loads.data(), Loads.size());

Tom Stellard

35bb18c

2013-08-26 15:06:04 +0000

[diff] [blame]

672

}

673

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

674

SDValue AMDGPUTargetLowering::MergeVectorStore(const SDValue &Op,

675

SelectionDAG &DAG) const {

676

StoreSDNode *Store = dyn_cast<StoreSDNode>(Op);

677

EVT MemVT = Store->getMemoryVT();

678

unsigned MemBits = MemVT.getSizeInBits();

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

679

Matt Arsenault

ca6dcfc

2014-03-05 21:47:22 +0000

[diff] [blame]

680

// Byte stores are really expensive, so if possible, try to pack 32-bit vector

681

// truncating store into an i32 store.

682

// XXX: We could also handle optimize other vector bitwidths.

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

683

if (!MemVT.isVector() || MemBits > 32) {

return SDValue();

}

SDLoc DL(Op);

Matt Arsenault

2014-04-22 04:11:14 +0000

[diff] [blame]

688

SDValue Value = Store->getValue();

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

689

EVT VT = Value.getValueType();

Matt Arsenault

2014-04-22 04:11:14 +0000

[diff] [blame]

690

EVT ElemVT = VT.getVectorElementType();

691

SDValue Ptr = Store->getBasePtr();

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

692

EVT MemEltVT = MemVT.getVectorElementType();

693

unsigned MemEltBits = MemEltVT.getSizeInBits();

694

unsigned MemNumElements = MemVT.getVectorNumElements();

Matt Arsenault

2014-04-22 04:11:14 +0000

[diff] [blame]

695

unsigned PackedSize = MemVT.getStoreSizeInBits();

696

SDValue Mask = DAG.getConstant((1 << MemEltBits) - 1, MVT::i32);

697

698

assert(Value.getValueType().getScalarSizeInBits() >= 32);

Matt Arsenault

0211714

2014-03-11 01:38:53 +0000

[diff] [blame]

699

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

700

SDValue PackedValue;

701

for (unsigned i = 0; i < MemNumElements; ++i) {

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

702

SDValue Elt = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, DL, ElemVT, Value,

703

DAG.getConstant(i, MVT::i32));

Matt Arsenault

2014-04-22 04:11:14 +0000

[diff] [blame]

704

Elt = DAG.getZExtOrTrunc(Elt, DL, MVT::i32);

705

Elt = DAG.getNode(ISD::AND, DL, MVT::i32, Elt, Mask); // getZeroExtendInReg

706

707

SDValue Shift = DAG.getConstant(MemEltBits * i, MVT::i32);

708

Elt = DAG.getNode(ISD::SHL, DL, MVT::i32, Elt, Shift);

709

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

710

if (i == 0) {

711

PackedValue = Elt;

712

} else {

Matt Arsenault

2014-04-22 04:11:14 +0000

[diff] [blame]

713

PackedValue = DAG.getNode(ISD::OR, DL, MVT::i32, PackedValue, Elt);

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

714

}

715

}

Matt Arsenault

2014-04-22 04:11:14 +0000

[diff] [blame]

716

717

if (PackedSize < 32) {

718

EVT PackedVT = EVT::getIntegerVT(*DAG.getContext(), PackedSize);

719

return DAG.getTruncStore(Store->getChain(), DL, PackedValue, Ptr,

720

Store->getMemOperand()->getPointerInfo(),

721

PackedVT,

722

Store->isNonTemporal(), Store->isVolatile(),

723

Store->getAlignment());

724

}

725

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

726

return DAG.getStore(Store->getChain(), DL, PackedValue, Ptr,

Matt Arsenault

2014-04-22 04:11:14 +0000

[diff] [blame]

727

Store->getMemOperand()->getPointerInfo(),

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

728

Store->isVolatile(), Store->isNonTemporal(),

729

Store->getAlignment());

730

}

731

732

SDValue AMDGPUTargetLowering::SplitVectorStore(SDValue Op,

733

SelectionDAG &DAG) const {

734

StoreSDNode *Store = cast<StoreSDNode>(Op);

735

EVT MemEltVT = Store->getMemoryVT().getVectorElementType();

736

EVT EltVT = Store->getValue().getValueType().getVectorElementType();

737

EVT PtrVT = Store->getBasePtr().getValueType();

738

unsigned NumElts = Store->getMemoryVT().getVectorNumElements();

739

SDLoc SL(Op);

740

741

SmallVector<SDValue, 8> Chains;

742

743

for (unsigned i = 0, e = NumElts; i != e; ++i) {

744

SDValue Val = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, SL, EltVT,

745

Store->getValue(), DAG.getConstant(i, MVT::i32));

746

SDValue Ptr = DAG.getNode(ISD::ADD, SL, PtrVT,

747

Store->getBasePtr(),

748

DAG.getConstant(i * (MemEltVT.getSizeInBits() / 8),

749

PtrVT));

Tom Stellard

f3d166a

2013-08-26 15:05:49 +0000

[diff] [blame]

750

Chains.push_back(DAG.getTruncStore(Store->getChain(), SL, Val, Ptr,

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

751

MachinePointerInfo(Store->getMemOperand()->getValue()),

Tom Stellard

f3d166a

2013-08-26 15:05:49 +0000

[diff] [blame]

752

MemEltVT, Store->isVolatile(), Store->isNonTemporal(),

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

753

Store->getAlignment()));

754

}

Matt Arsenault

2014-04-07 16:44:24 +0000

[diff] [blame]

755

return DAG.getNode(ISD::TokenFactor, SL, MVT::Other, Chains.data(), NumElts);

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

756

}

757

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

758

SDValue AMDGPUTargetLowering::LowerLOAD(SDValue Op, SelectionDAG &DAG) const {

759

SDLoc DL(Op);

760

LoadSDNode *Load = cast<LoadSDNode>(Op);

761

ISD::LoadExtType ExtType = Load->getExtensionType();

Matt Arsenault

f9a995d

2014-03-06 17:34:12 +0000

[diff] [blame]

762

EVT VT = Op.getValueType();

763

EVT MemVT = Load->getMemoryVT();

764

765

if (ExtType != ISD::NON_EXTLOAD && !VT.isVector() && VT.getSizeInBits() > 32) {

766

// We can do the extload to 32-bits, and then need to separately extend to

767

// 64-bits.

768

769

SDValue ExtLoad32 = DAG.getExtLoad(ExtType, DL, MVT::i32,

Load->getChain(),

Load->getBasePtr(),

MemVT,

Load->getMemOperand());

774

return DAG.getNode(ISD::getExtForLoadExtType(ExtType), DL, VT, ExtLoad32);

775

}

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

776

Matt Arsenault

470acd8

2014-04-15 22:28:39 +0000

[diff] [blame]

777

if (ExtType == ISD::NON_EXTLOAD && VT.getSizeInBits() < 32) {

778

assert(VT == MVT::i1 && "Only i1 non-extloads expected");

779

// FIXME: Copied from PPC

780

// First, load into 32 bits, then truncate to 1 bit.

781

782

SDValue Chain = Load->getChain();

783

SDValue BasePtr = Load->getBasePtr();

784

MachineMemOperand *MMO = Load->getMemOperand();

785

786

SDValue NewLD = DAG.getExtLoad(ISD::EXTLOAD, DL, MVT::i32, Chain,

787

BasePtr, MVT::i8, MMO);

788

return DAG.getNode(ISD::TRUNCATE, DL, VT, NewLD);

789

}

790

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

791

// Lower loads constant address space global variable loads

792

if (Load->getAddressSpace() == AMDGPUAS::CONSTANT_ADDRESS &&

Nick Lewycky

aad475b

2014-04-15 07:22:52 +0000

[diff] [blame]

793

isa<GlobalVariable>(

794

GetUnderlyingObject(Load->getMemOperand()->getValue()))) {

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

795

796

SDValue Ptr = DAG.getZExtOrTrunc(Load->getBasePtr(), DL,

797

getPointerTy(AMDGPUAS::PRIVATE_ADDRESS));

798

Ptr = DAG.getNode(ISD::SRL, DL, MVT::i32, Ptr,

799

DAG.getConstant(2, MVT::i32));

800

return DAG.getNode(AMDGPUISD::REGISTER_LOAD, DL, Op.getValueType(),

801

Load->getChain(), Ptr,

802

DAG.getTargetConstant(0, MVT::i32), Op.getOperand(2));

803

}

804

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

805

if (Load->getAddressSpace() != AMDGPUAS::PRIVATE_ADDRESS ||

806

ExtType == ISD::NON_EXTLOAD || Load->getMemoryVT().bitsGE(MVT::i32))

return SDValue();

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

810

SDValue Ptr = DAG.getNode(ISD::SRL, DL, MVT::i32, Load->getBasePtr(),

811

DAG.getConstant(2, MVT::i32));

812

SDValue Ret = DAG.getNode(AMDGPUISD::REGISTER_LOAD, DL, Op.getValueType(),

813

Load->getChain(), Ptr,

814

DAG.getTargetConstant(0, MVT::i32),

815

Op.getOperand(2));

816

SDValue ByteIdx = DAG.getNode(ISD::AND, DL, MVT::i32,

817

Load->getBasePtr(),

818

DAG.getConstant(0x3, MVT::i32));

819

SDValue ShiftAmt = DAG.getNode(ISD::SHL, DL, MVT::i32, ByteIdx,

820

DAG.getConstant(3, MVT::i32));

Matt Arsenault

2014-03-15 00:08:22 +0000

[diff] [blame]

821

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

822

Ret = DAG.getNode(ISD::SRL, DL, MVT::i32, Ret, ShiftAmt);

Matt Arsenault

2014-03-15 00:08:22 +0000

[diff] [blame]

823

824

EVT MemEltVT = MemVT.getScalarType();

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

825

if (ExtType == ISD::SEXTLOAD) {

Matt Arsenault

2014-03-15 00:08:22 +0000

[diff] [blame]

826

SDValue MemEltVTNode = DAG.getValueType(MemEltVT);

827

return DAG.getNode(ISD::SIGN_EXTEND_INREG, DL, MVT::i32, Ret, MemEltVTNode);

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

828

}

829

Matt Arsenault

2014-03-15 00:08:22 +0000

[diff] [blame]

830

return DAG.getZeroExtendInReg(Ret, DL, MemEltVT);

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

831

}

832

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

833

SDValue AMDGPUTargetLowering::LowerSTORE(SDValue Op, SelectionDAG &DAG) const {

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

834

SDLoc DL(Op);

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

835

SDValue Result = AMDGPUTargetLowering::MergeVectorStore(Op, DAG);

836

if (Result.getNode()) {

return Result;

}

StoreSDNode *Store = cast<StoreSDNode>(Op);

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

841

SDValue Chain = Store->getChain();

Tom Stellard

2013-11-13 23:36:50 +0000

[diff] [blame]

842

if ((Store->getAddressSpace() == AMDGPUAS::LOCAL_ADDRESS ||

843

Store->getAddressSpace() == AMDGPUAS::PRIVATE_ADDRESS) &&

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

844

Store->getValue().getValueType().isVector()) {

845

return SplitVectorStore(Op, DAG);

846

}

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

847

Matt Arsenault

2014-03-15 00:08:22 +0000

[diff] [blame]

848

EVT MemVT = Store->getMemoryVT();

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

849

if (Store->getAddressSpace() == AMDGPUAS::PRIVATE_ADDRESS &&

Matt Arsenault

2014-03-15 00:08:22 +0000

[diff] [blame]

850

MemVT.bitsLT(MVT::i32)) {

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

851

unsigned Mask = 0;

852

if (Store->getMemoryVT() == MVT::i8) {

853

Mask = 0xff;

854

} else if (Store->getMemoryVT() == MVT::i16) {

855

Mask = 0xffff;

856

}

Matt Arsenault

2014-03-15 00:08:26 +0000

[diff] [blame]

857

SDValue BasePtr = Store->getBasePtr();

858

SDValue Ptr = DAG.getNode(ISD::SRL, DL, MVT::i32, BasePtr,

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

859

DAG.getConstant(2, MVT::i32));

860

SDValue Dst = DAG.getNode(AMDGPUISD::REGISTER_LOAD, DL, MVT::i32,

861

Chain, Ptr, DAG.getTargetConstant(0, MVT::i32));

Matt Arsenault

2014-03-15 00:08:26 +0000

[diff] [blame]

862

863

SDValue ByteIdx = DAG.getNode(ISD::AND, DL, MVT::i32, BasePtr,

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

864

DAG.getConstant(0x3, MVT::i32));

Matt Arsenault

2014-03-15 00:08:26 +0000

[diff] [blame]

865

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

866

SDValue ShiftAmt = DAG.getNode(ISD::SHL, DL, MVT::i32, ByteIdx,

867

DAG.getConstant(3, MVT::i32));

Matt Arsenault

2014-03-15 00:08:26 +0000

[diff] [blame]

868

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

869

SDValue SExtValue = DAG.getNode(ISD::SIGN_EXTEND, DL, MVT::i32,

870

Store->getValue());

Matt Arsenault

2014-03-15 00:08:22 +0000

[diff] [blame]

871

872

SDValue MaskedValue = DAG.getZeroExtendInReg(SExtValue, DL, MemVT);

873

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

874

SDValue ShiftedValue = DAG.getNode(ISD::SHL, DL, MVT::i32,

875

MaskedValue, ShiftAmt);

Matt Arsenault

2014-03-15 00:08:22 +0000

[diff] [blame]

876

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

877

SDValue DstMask = DAG.getNode(ISD::SHL, DL, MVT::i32, DAG.getConstant(Mask, MVT::i32),

878

ShiftAmt);

879

DstMask = DAG.getNode(ISD::XOR, DL, MVT::i32, DstMask,

880

DAG.getConstant(0xffffffff, MVT::i32));

881

Dst = DAG.getNode(ISD::AND, DL, MVT::i32, Dst, DstMask);

882

883

SDValue Value = DAG.getNode(ISD::OR, DL, MVT::i32, Dst, ShiftedValue);

884

return DAG.getNode(AMDGPUISD::REGISTER_STORE, DL, MVT::Other,

885

Chain, Value, Ptr, DAG.getTargetConstant(0, MVT::i32));

886

}

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

887

return SDValue();

888

}

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

889

890

SDValue AMDGPUTargetLowering::LowerUDIVREM(SDValue Op,

891

SelectionDAG &DAG) const {

Andrew Trick

2013-05-25 02:42:55 +0000

[diff] [blame]

892

SDLoc DL(Op);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

893

EVT VT = Op.getValueType();

894

895

SDValue Num = Op.getOperand(0);

896

SDValue Den = Op.getOperand(1);

897

898

SmallVector<SDValue, 8> Results;

899

900

// RCP = URECIP(Den) = 2^32 / Den + e

901

// e is rounding error.

902

SDValue RCP = DAG.getNode(AMDGPUISD::URECIP, DL, VT, Den);

903

904

// RCP_LO = umulo(RCP, Den) */

905

SDValue RCP_LO = DAG.getNode(ISD::UMULO, DL, VT, RCP, Den);

906

907

// RCP_HI = mulhu (RCP, Den) */

908

SDValue RCP_HI = DAG.getNode(ISD::MULHU, DL, VT, RCP, Den);

909

910

// NEG_RCP_LO = -RCP_LO

911

SDValue NEG_RCP_LO = DAG.getNode(ISD::SUB, DL, VT, DAG.getConstant(0, VT),

912

RCP_LO);

913

914

// ABS_RCP_LO = (RCP_HI == 0 ? NEG_RCP_LO : RCP_LO)

915

SDValue ABS_RCP_LO = DAG.getSelectCC(DL, RCP_HI, DAG.getConstant(0, VT),

916

NEG_RCP_LO, RCP_LO,

917

ISD::SETEQ);

918

// Calculate the rounding error from the URECIP instruction

919

// E = mulhu(ABS_RCP_LO, RCP)

920

SDValue E = DAG.getNode(ISD::MULHU, DL, VT, ABS_RCP_LO, RCP);

921

922

// RCP_A_E = RCP + E

923

SDValue RCP_A_E = DAG.getNode(ISD::ADD, DL, VT, RCP, E);

924

925

// RCP_S_E = RCP - E

926

SDValue RCP_S_E = DAG.getNode(ISD::SUB, DL, VT, RCP, E);

927

928

// Tmp0 = (RCP_HI == 0 ? RCP_A_E : RCP_SUB_E)

929

SDValue Tmp0 = DAG.getSelectCC(DL, RCP_HI, DAG.getConstant(0, VT),

930

RCP_A_E, RCP_S_E,

931

ISD::SETEQ);

932

// Quotient = mulhu(Tmp0, Num)

933

SDValue Quotient = DAG.getNode(ISD::MULHU, DL, VT, Tmp0, Num);

934

935

// Num_S_Remainder = Quotient * Den

936

SDValue Num_S_Remainder = DAG.getNode(ISD::UMULO, DL, VT, Quotient, Den);

937

938

// Remainder = Num - Num_S_Remainder

939

SDValue Remainder = DAG.getNode(ISD::SUB, DL, VT, Num, Num_S_Remainder);

940

941

// Remainder_GE_Den = (Remainder >= Den ? -1 : 0)

942

SDValue Remainder_GE_Den = DAG.getSelectCC(DL, Remainder, Den,

943

DAG.getConstant(-1, VT),

944

DAG.getConstant(0, VT),

Vincent Lejeune

4f3751f

2013-11-06 17:36:04 +0000

[diff] [blame]

945

ISD::SETUGE);

946

// Remainder_GE_Zero = (Num >= Num_S_Remainder ? -1 : 0)

947

SDValue Remainder_GE_Zero = DAG.getSelectCC(DL, Num,

948

Num_S_Remainder,

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

949

DAG.getConstant(-1, VT),

950

DAG.getConstant(0, VT),

Vincent Lejeune

4f3751f

2013-11-06 17:36:04 +0000

[diff] [blame]

951

ISD::SETUGE);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

952

// Tmp1 = Remainder_GE_Den & Remainder_GE_Zero

953

SDValue Tmp1 = DAG.getNode(ISD::AND, DL, VT, Remainder_GE_Den,

954

Remainder_GE_Zero);

955

956

// Calculate Division result:

957

958

// Quotient_A_One = Quotient + 1

959

SDValue Quotient_A_One = DAG.getNode(ISD::ADD, DL, VT, Quotient,

960

DAG.getConstant(1, VT));

961

962

// Quotient_S_One = Quotient - 1

963

SDValue Quotient_S_One = DAG.getNode(ISD::SUB, DL, VT, Quotient,

964

DAG.getConstant(1, VT));

965

966

// Div = (Tmp1 == 0 ? Quotient : Quotient_A_One)

967

SDValue Div = DAG.getSelectCC(DL, Tmp1, DAG.getConstant(0, VT),

968

Quotient, Quotient_A_One, ISD::SETEQ);

969

970

// Div = (Remainder_GE_Zero == 0 ? Quotient_S_One : Div)

971

Div = DAG.getSelectCC(DL, Remainder_GE_Zero, DAG.getConstant(0, VT),

972

Quotient_S_One, Div, ISD::SETEQ);

973

974

// Calculate Rem result:

975

976

// Remainder_S_Den = Remainder - Den

977

SDValue Remainder_S_Den = DAG.getNode(ISD::SUB, DL, VT, Remainder, Den);

978

979

// Remainder_A_Den = Remainder + Den

980

SDValue Remainder_A_Den = DAG.getNode(ISD::ADD, DL, VT, Remainder, Den);

981

982

// Rem = (Tmp1 == 0 ? Remainder : Remainder_S_Den)

983

SDValue Rem = DAG.getSelectCC(DL, Tmp1, DAG.getConstant(0, VT),

984

Remainder, Remainder_S_Den, ISD::SETEQ);

985

986

// Rem = (Remainder_GE_Zero == 0 ? Remainder_A_Den : Rem)

987

Rem = DAG.getSelectCC(DL, Remainder_GE_Zero, DAG.getConstant(0, VT),

988

Remainder_A_Den, Rem, ISD::SETEQ);

Matt Arsenault

2014-04-07 16:44:24 +0000

[diff] [blame]

SDValue Ops[2] = {

Div,

Rem

};

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

993

return DAG.getMergeValues(Ops, 2, DL);

994

}

995

Tom Stellard

c947d8c

2013-10-30 17:22:05 +0000

[diff] [blame]

996

SDValue AMDGPUTargetLowering::LowerUINT_TO_FP(SDValue Op,

997

SelectionDAG &DAG) const {

998

SDValue S0 = Op.getOperand(0);

999

SDLoc DL(Op);

1000

if (Op.getValueType() != MVT::f32 || S0.getValueType() != MVT::i64)

1001

return SDValue();

1002

1003

// f32 uint_to_fp i64

1004

SDValue Lo = DAG.getNode(ISD::EXTRACT_ELEMENT, DL, MVT::i32, S0,

1005

DAG.getConstant(0, MVT::i32));

1006

SDValue FloatLo = DAG.getNode(ISD::UINT_TO_FP, DL, MVT::f32, Lo);

1007

SDValue Hi = DAG.getNode(ISD::EXTRACT_ELEMENT, DL, MVT::i32, S0,

1008

DAG.getConstant(1, MVT::i32));

1009

SDValue FloatHi = DAG.getNode(ISD::UINT_TO_FP, DL, MVT::f32, Hi);

1010

FloatHi = DAG.getNode(ISD::FMUL, DL, MVT::f32, FloatHi,

1011

DAG.getConstantFP(4294967296.0f, MVT::f32)); // 2^32

1012

return DAG.getNode(ISD::FADD, DL, MVT::f32, FloatLo, FloatHi);

1013

1014

}

Tom Stellard

fbab827

2013-08-16 01:12:11 +0000

[diff] [blame]

1015

Matt Arsenault

2014-03-17 18:58:11 +0000

[diff] [blame]

1016

SDValue AMDGPUTargetLowering::ExpandSIGN_EXTEND_INREG(SDValue Op,

1017

unsigned BitsDiff,

1018

SelectionDAG &DAG) const {

1019

MVT VT = Op.getSimpleValueType();

1020

SDLoc DL(Op);

1021

SDValue Shift = DAG.getConstant(BitsDiff, VT);

1022

// Shift left by 'Shift' bits.

1023

SDValue Shl = DAG.getNode(ISD::SHL, DL, VT, Op.getOperand(0), Shift);

1024

// Signed shift Right by 'Shift' bits.

1025

return DAG.getNode(ISD::SRA, DL, VT, Shl, Shift);

1026

}

1027

1028

SDValue AMDGPUTargetLowering::LowerSIGN_EXTEND_INREG(SDValue Op,

1029

SelectionDAG &DAG) const {

1030

EVT ExtraVT = cast<VTSDNode>(Op.getOperand(1))->getVT();

1031

MVT VT = Op.getSimpleValueType();

1032

MVT ScalarVT = VT.getScalarType();

1033

Matt Arsenault

2014-04-22 03:49:30 +0000

[diff] [blame]

1034

if (!VT.isVector())

1035

return SDValue();

Matt Arsenault

2014-03-17 18:58:11 +0000

[diff] [blame]

1036

1037

SDValue Src = Op.getOperand(0);

Matt Arsenault

2014-04-22 03:49:30 +0000

[diff] [blame]

1038

SDLoc DL(Op);

Matt Arsenault

2014-03-17 18:58:11 +0000

[diff] [blame]

1039

Matt Arsenault

2014-04-22 03:49:30 +0000

[diff] [blame]

1040

// TODO: Don't scalarize on Evergreen?

1041

unsigned NElts = VT.getVectorNumElements();

1042

SmallVector<SDValue, 8> Args;

1043

DAG.ExtractVectorElements(Src, Args, 0, NElts);

Matt Arsenault

2014-03-17 18:58:11 +0000

[diff] [blame]

1044

Matt Arsenault

2014-04-22 03:49:30 +0000

[diff] [blame]

1045

SDValue VTOp = DAG.getValueType(ExtraVT.getScalarType());

1046

for (unsigned I = 0; I < NElts; ++I)

1047

Args[I] = DAG.getNode(ISD::SIGN_EXTEND_INREG, DL, ScalarVT, Args[I], VTOp);

Matt Arsenault

2014-03-17 18:58:11 +0000

[diff] [blame]

1048

Matt Arsenault

2014-04-22 03:49:30 +0000

[diff] [blame]

1049

return DAG.getNode(ISD::BUILD_VECTOR, DL, VT, Args.data(), Args.size());

Matt Arsenault

2014-03-17 18:58:11 +0000

[diff] [blame]

1050

}

1051

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1052

//===----------------------------------------------------------------------===//

Tom Stellard

2014-04-07 19:45:41 +0000

[diff] [blame]

1053

// Custom DAG optimizations

1054

//===----------------------------------------------------------------------===//

1055

1056

static bool isU24(SDValue Op, SelectionDAG &DAG) {

1057

APInt KnownZero, KnownOne;

1058

EVT VT = Op.getValueType();

1059

DAG.ComputeMaskedBits(Op, KnownZero, KnownOne);

1060

1061

return (VT.getSizeInBits() - KnownZero.countLeadingOnes()) <= 24;

1062

}

1063

1064

static bool isI24(SDValue Op, SelectionDAG &DAG) {

1065

EVT VT = Op.getValueType();

1066

1067

// In order for this to be a signed 24-bit value, bit 23, must

1068

// be a sign bit.

1069

return VT.getSizeInBits() >= 24 && // Types less than 24-bit should be treated

1070

// as unsigned 24-bit values.

1071

(VT.getSizeInBits() - DAG.ComputeNumSignBits(Op)) < 24;

1072

}

1073

1074

static void simplifyI24(SDValue Op, TargetLowering::DAGCombinerInfo &DCI) {

1075

1076

SelectionDAG &DAG = DCI.DAG;

1077

const TargetLowering &TLI = DAG.getTargetLoweringInfo();

1078

EVT VT = Op.getValueType();

1079

1080

APInt Demanded = APInt::getLowBitsSet(VT.getSizeInBits(), 24);

1081

APInt KnownZero, KnownOne;

1082

TargetLowering::TargetLoweringOpt TLO(DAG, true, true);

1083

if (TLI.SimplifyDemandedBits(Op, Demanded, KnownZero, KnownOne, TLO))

1084

DCI.CommitTargetLoweringOpt(TLO);

1085

}

1086

1087

SDValue AMDGPUTargetLowering::PerformDAGCombine(SDNode *N,

1088

DAGCombinerInfo &DCI) const {

1089

SelectionDAG &DAG = DCI.DAG;

1090

SDLoc DL(N);

1091

1092

switch(N->getOpcode()) {

1093

default: break;

1094

case ISD::MUL: {

1095

EVT VT = N->getValueType(0);

1096

SDValue N0 = N->getOperand(0);

1097

SDValue N1 = N->getOperand(1);

1098

SDValue Mul;

1099

1100

// FIXME: Add support for 24-bit multiply with 64-bit output on SI.

1101

if (VT.isVector() || VT.getSizeInBits() > 32)

1102

break;

1103

1104

if (Subtarget->hasMulU24() && isU24(N0, DAG) && isU24(N1, DAG)) {

1105

N0 = DAG.getZExtOrTrunc(N0, DL, MVT::i32);

1106

N1 = DAG.getZExtOrTrunc(N1, DL, MVT::i32);

1107

Mul = DAG.getNode(AMDGPUISD::MUL_U24, DL, MVT::i32, N0, N1);

1108

} else if (Subtarget->hasMulI24() && isI24(N0, DAG) && isI24(N1, DAG)) {

1109

N0 = DAG.getSExtOrTrunc(N0, DL, MVT::i32);

1110

N1 = DAG.getSExtOrTrunc(N1, DL, MVT::i32);

1111

Mul = DAG.getNode(AMDGPUISD::MUL_I24, DL, MVT::i32, N0, N1);

} else {

break;

}

Tom Stellard

2014-04-17 21:00:13 +0000

[diff] [blame]

1116

// We need to use sext even for MUL_U24, because MUL_U24 is used

1117

// for signed multiply of 8 and 16-bit types.

Tom Stellard

2014-04-07 19:45:41 +0000

[diff] [blame]

1118

SDValue Reg = DAG.getSExtOrTrunc(Mul, DL, VT);

return Reg;

}

case AMDGPUISD::MUL_I24:

1123

case AMDGPUISD::MUL_U24: {

1124

SDValue N0 = N->getOperand(0);

1125

SDValue N1 = N->getOperand(1);

1126

simplifyI24(N0, DCI);

1127

simplifyI24(N1, DCI);

return SDValue();

}

}

return SDValue();

}

//===----------------------------------------------------------------------===//

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1135

// Helper functions

1136

//===----------------------------------------------------------------------===//

1137

Tom Stellard

2013-10-23 00:44:32 +0000

[diff] [blame]

1138

void AMDGPUTargetLowering::getOriginalFunctionArgs(

1139

SelectionDAG &DAG,

1140

const Function *F,

1141

const SmallVectorImpl<ISD::InputArg> &Ins,

1142

SmallVectorImpl<ISD::InputArg> &OrigIns) const {

1143

1144

for (unsigned i = 0, e = Ins.size(); i < e; ++i) {

1145

if (Ins[i].ArgVT == Ins[i].VT) {

1146

OrigIns.push_back(Ins[i]);

continue;

}

EVT VT;

if (Ins[i].ArgVT.isVector() && !Ins[i].VT.isVector()) {

1152

// Vector has been split into scalars.

1153

VT = Ins[i].ArgVT.getVectorElementType();

1154

} else if (Ins[i].VT.isVector() && Ins[i].ArgVT.isVector() &&

1155

Ins[i].ArgVT.getVectorElementType() !=

1156

Ins[i].VT.getVectorElementType()) {

1157

// Vector elements have been promoted

1158

VT = Ins[i].ArgVT;

1159

} else {

1160

// Vector has been spilt into smaller vectors.

VT = Ins[i].VT;

}

ISD::InputArg Arg(Ins[i].Flags, VT, VT, Ins[i].Used,

1165

Ins[i].OrigArgIndex, Ins[i].PartOffset);

1166

OrigIns.push_back(Arg);

}

}

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1170

bool AMDGPUTargetLowering::isHWTrueValue(SDValue Op) const {

1171

if (ConstantFPSDNode * CFP = dyn_cast<ConstantFPSDNode>(Op)) {

1172

return CFP->isExactlyValue(1.0);

1173

}

1174

if (ConstantSDNode *C = dyn_cast<ConstantSDNode>(Op)) {

1175

return C->isAllOnesValue();

}

return false;

}

bool AMDGPUTargetLowering::isHWFalseValue(SDValue Op) const {

1181

if (ConstantFPSDNode * CFP = dyn_cast<ConstantFPSDNode>(Op)) {

1182

return CFP->getValueAPF().isZero();

1183

}

1184

if (ConstantSDNode *C = dyn_cast<ConstantSDNode>(Op)) {

1185

return C->isNullValue();

}

return false;

}

SDValue AMDGPUTargetLowering::CreateLiveInRegister(SelectionDAG &DAG,

1191

const TargetRegisterClass *RC,

1192

unsigned Reg, EVT VT) const {

1193

MachineFunction &MF = DAG.getMachineFunction();

1194

MachineRegisterInfo &MRI = MF.getRegInfo();

1195

unsigned VirtualRegister;

1196

if (!MRI.isLiveIn(Reg)) {

1197

VirtualRegister = MRI.createVirtualRegister(RC);

1198

MRI.addLiveIn(Reg, VirtualRegister);

1199

} else {

1200

VirtualRegister = MRI.getLiveInVirtReg(Reg);

1201

}

1202

return DAG.getRegister(VirtualRegister, VT);

1203

}

1204

1205

#define NODE_NAME_CASE(node) case AMDGPUISD::node: return #node;

1206

1207

const char* AMDGPUTargetLowering::getTargetNodeName(unsigned Opcode) const {

1208

switch (Opcode) {

1209

default: return 0;

1210

// AMDIL DAG nodes

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1211

NODE_NAME_CASE(CALL);

1212

NODE_NAME_CASE(UMUL);

1213

NODE_NAME_CASE(DIV_INF);

1214

NODE_NAME_CASE(RET_FLAG);

1215

NODE_NAME_CASE(BRANCH_COND);

1216

1217

// AMDGPU DAG nodes

1218

NODE_NAME_CASE(DWORDADDR)

1219

NODE_NAME_CASE(FRACT)

NODE_NAME_CASE(FMAX)

NODE_NAME_CASE(SMAX)

NODE_NAME_CASE(UMAX)

NODE_NAME_CASE(FMIN)

NODE_NAME_CASE(SMIN)

NODE_NAME_CASE(UMIN)

Matt Arsenault

2014-03-17 18:58:11 +0000

[diff] [blame]

1226

NODE_NAME_CASE(BFE_U32)

1227

NODE_NAME_CASE(BFE_I32)

Matt Arsenault

b345836

2014-03-31 18:21:13 +0000

[diff] [blame]

1228

NODE_NAME_CASE(BFI)

1229

NODE_NAME_CASE(BFM)

Tom Stellard

2014-04-07 19:45:41 +0000

[diff] [blame]

1230

NODE_NAME_CASE(MUL_U24)

1231

NODE_NAME_CASE(MUL_I24)

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1232

NODE_NAME_CASE(URECIP)

Matt Arsenault

21a3faa

2014-02-24 21:01:21 +0000

[diff] [blame]

1233

NODE_NAME_CASE(DOT4)

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1234

NODE_NAME_CASE(EXPORT)

Tom Stellard

ff62c35

2013-01-23 02:09:03 +0000

[diff] [blame]

1235

NODE_NAME_CASE(CONST_ADDRESS)

Tom Stellard

f3b2a1e

2013-02-06 17:32:29 +0000

[diff] [blame]

1236

NODE_NAME_CASE(REGISTER_LOAD)

1237

NODE_NAME_CASE(REGISTER_STORE)

Tom Stellard

9fa1791

2013-08-14 23:24:45 +0000

[diff] [blame]

1238

NODE_NAME_CASE(LOAD_CONSTANT)

1239

NODE_NAME_CASE(LOAD_INPUT)

1240

NODE_NAME_CASE(SAMPLE)

1241

NODE_NAME_CASE(SAMPLEB)

1242

NODE_NAME_CASE(SAMPLED)

1243

NODE_NAME_CASE(SAMPLEL)

Tom Stellard

d3ee8c1

2013-08-16 01:12:06 +0000

[diff] [blame]

1244

NODE_NAME_CASE(STORE_MSKOR)

Tom Stellard

afcf12f

2013-09-12 02:55:14 +0000

[diff] [blame]

1245

NODE_NAME_CASE(TBUFFER_STORE_FORMAT)

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1246

}

1247

}

Matt Arsenault

2014-03-25 18:18:27 +0000

[diff] [blame]

1248

Matt Arsenault

378bf9c

2014-03-31 19:35:33 +0000

[diff] [blame]

1249

static void computeMaskedBitsForMinMax(const SDValue Op0,

const SDValue Op1,

APInt &KnownZero,

APInt &KnownOne,

const SelectionDAG &DAG,

1254

unsigned Depth) {

1255

APInt Op0Zero, Op0One;

1256

APInt Op1Zero, Op1One;

1257

DAG.ComputeMaskedBits(Op0, Op0Zero, Op0One, Depth);

1258

DAG.ComputeMaskedBits(Op1, Op1Zero, Op1One, Depth);

1259

1260

KnownZero = Op0Zero & Op1Zero;

1261

KnownOne = Op0One & Op1One;

1262

}

1263

Matt Arsenault

2014-03-25 18:18:27 +0000

[diff] [blame]

1264

void AMDGPUTargetLowering::computeMaskedBitsForTargetNode(

const SDValue Op,

APInt &KnownZero,

APInt &KnownOne,

const SelectionDAG &DAG,

1269

unsigned Depth) const {

Matt Arsenault

378bf9c

2014-03-31 19:35:33 +0000

[diff] [blame]

1270

Matt Arsenault

2014-03-25 18:18:27 +0000

[diff] [blame]

1271

KnownZero = KnownOne = APInt(KnownOne.getBitWidth(), 0); // Don't know anything.

Matt Arsenault

378bf9c

2014-03-31 19:35:33 +0000

[diff] [blame]

1272

unsigned Opc = Op.getOpcode();

1273

switch (Opc) {

1274

case ISD::INTRINSIC_WO_CHAIN: {

1275

// FIXME: The intrinsic should just use the node.

1276

switch (cast<ConstantSDNode>(Op.getOperand(0))->getZExtValue()) {

1277

case AMDGPUIntrinsic::AMDGPU_imax:

1278

case AMDGPUIntrinsic::AMDGPU_umax:

1279

case AMDGPUIntrinsic::AMDGPU_imin:

1280

case AMDGPUIntrinsic::AMDGPU_umin:

1281

computeMaskedBitsForMinMax(Op.getOperand(1), Op.getOperand(2),

1282

KnownZero, KnownOne, DAG, Depth);

break;

default:

break;

}

break;

}

case AMDGPUISD::SMAX:

1291

case AMDGPUISD::UMAX:

1292

case AMDGPUISD::SMIN:

1293

case AMDGPUISD::UMIN:

1294

computeMaskedBitsForMinMax(Op.getOperand(0), Op.getOperand(1),

1295

KnownZero, KnownOne, DAG, Depth);

break;

default:

break;

}

Matt Arsenault