Blame - llvm/lib/Target/R600/AMDGPUISelLowering.cpp - toolchain/llvm-project

2012-12-11 21:25:42 +0000

[diff] [blame]

1

//===-- AMDGPUISelLowering.cpp - AMDGPU Common DAG lowering functions -----===//

2

//

3

// The LLVM Compiler Infrastructure

4

//

5

// This file is distributed under the University of Illinois Open Source

6

// License. See LICENSE.TXT for details.

7

//

8

//===----------------------------------------------------------------------===//

9

//

10

/// \file

11

/// \brief This is the parent TargetLowering class for hardware code gen

12

/// targets.

13

//

14

//===----------------------------------------------------------------------===//

15

16

#include "AMDGPUISelLowering.h"

Tom Stellard

ed882c2

2013-06-03 17:40:11 +0000

[diff] [blame]

17

#include "AMDGPU.h"

Tom Stellard

2013-11-13 23:36:50 +0000

[diff] [blame]

18

#include "AMDGPUFrameLowering.h"

Matt Arsenault

c791f39

2014-06-23 18:00:31 +0000

[diff] [blame]

19

#include "AMDGPUIntrinsicInfo.h"

Christian Konig

2013-03-07 09:03:52 +0000

[diff] [blame]

20

#include "AMDGPURegisterInfo.h"

Christian Konig

2013-03-07 09:03:52 +0000

[diff] [blame]

21

#include "AMDGPUSubtarget.h"

Tom Stellard

acfeebf

2013-07-23 01:48:05 +0000

[diff] [blame]

22

#include "R600MachineFunctionInfo.h"

Tom Stellard

ed882c2

2013-06-03 17:40:11 +0000

[diff] [blame]

23

#include "SIMachineFunctionInfo.h"

Christian Konig

2013-03-07 09:03:52 +0000

[diff] [blame]

24

#include "llvm/CodeGen/CallingConvLower.h"

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

25

#include "llvm/CodeGen/MachineFunction.h"

26

#include "llvm/CodeGen/MachineRegisterInfo.h"

27

#include "llvm/CodeGen/SelectionDAG.h"

28

#include "llvm/CodeGen/TargetLoweringObjectFileImpl.h"

Tom Stellard

2013-06-28 15:47:08 +0000

[diff] [blame]

29

#include "llvm/IR/DataLayout.h"

Matt Arsenault

2014-04-22 16:42:00 +0000

[diff] [blame]

30

#include "llvm/IR/DiagnosticInfo.h"

31

#include "llvm/IR/DiagnosticPrinter.h"

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

32

33

using namespace llvm;

Matt Arsenault

2014-04-22 16:42:00 +0000

[diff] [blame]

namespace {

/// Diagnostic information for unimplemented or unsupported feature reporting.

38

class DiagnosticInfoUnsupported : public DiagnosticInfo {

39

private:

40

const Twine &Description;

const Function &Fn;

static int KindID;

static int getKindID() {

46

if (KindID == 0)

47

KindID = llvm::getNextAvailablePluginDiagnosticKind();

return KindID;

}

public:

DiagnosticInfoUnsupported(const Function &Fn, const Twine &Desc,

53

DiagnosticSeverity Severity = DS_Error)

54

: DiagnosticInfo(getKindID(), Severity),

Description(Desc),

Fn(Fn) { }

const Function &getFunction() const { return Fn; }

59

const Twine &getDescription() const { return Description; }

60

61

void print(DiagnosticPrinter &DP) const override {

62

DP << "unsupported " << getDescription() << " in " << Fn.getName();

63

}

64

65

static bool classof(const DiagnosticInfo *DI) {

66

return DI->getKind() == getKindID();

}

};

int DiagnosticInfoUnsupported::KindID = 0;

}

Tom Stellard

2013-10-23 00:44:32 +0000

[diff] [blame]

74

static bool allocateStack(unsigned ValNo, MVT ValVT, MVT LocVT,

75

CCValAssign::LocInfo LocInfo,

76

ISD::ArgFlagsTy ArgFlags, CCState &State) {

Matt Arsenault

52226f9

2013-12-14 18:21:59 +0000

[diff] [blame]

77

unsigned Offset = State.AllocateStack(ValVT.getStoreSize(),

78

ArgFlags.getOrigAlign());

79

State.addLoc(CCValAssign::getMem(ValNo, ValVT, Offset, LocVT, LocInfo));

Tom Stellard

2013-10-23 00:44:32 +0000

[diff] [blame]

80

81

return true;

82

}

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

83

Christian Konig

2013-03-07 09:03:52 +0000

[diff] [blame]

84

#include "AMDGPUGenCallingConv.inc"

85

Matt Arsenault

c9df794

2014-06-11 03:29:54 +0000

[diff] [blame]

86

// Find a larger type to do a load / store of a vector with.

87

EVT AMDGPUTargetLowering::getEquivalentMemType(LLVMContext &Ctx, EVT VT) {

88

unsigned StoreSize = VT.getStoreSizeInBits();

89

if (StoreSize <= 32)

90

return EVT::getIntegerVT(Ctx, StoreSize);

91

92

assert(StoreSize % 32 == 0 && "Store size not a multiple of 32");

93

return EVT::getVectorVT(Ctx, MVT::i32, StoreSize / 32);

94

}

95

96

// Type for a vector that will be loaded to.

97

EVT AMDGPUTargetLowering::getEquivalentLoadRegType(LLVMContext &Ctx, EVT VT) {

98

unsigned StoreSize = VT.getStoreSizeInBits();

99

if (StoreSize <= 32)

100

return EVT::getIntegerVT(Ctx, 32);

101

102

return EVT::getVectorVT(Ctx, MVT::i32, StoreSize / 32);

103

}

104

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

105

AMDGPUTargetLowering::AMDGPUTargetLowering(TargetMachine &TM) :

Aditya Nandakumar

3053155

2014-11-13 21:29:21 +0000

[diff] [blame]

106

TargetLowering(TM) {

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

107

Matt Arsenault

41e2f2b

2014-02-24 21:01:28 +0000

[diff] [blame]

108

Subtarget = &TM.getSubtarget<AMDGPUSubtarget>();

109

Matt Arsenault

2014-06-23 18:00:44 +0000

[diff] [blame]

110

setOperationAction(ISD::Constant, MVT::i32, Legal);

111

setOperationAction(ISD::Constant, MVT::i64, Legal);

112

setOperationAction(ISD::ConstantFP, MVT::f32, Legal);

113

setOperationAction(ISD::ConstantFP, MVT::f64, Legal);

114

115

setOperationAction(ISD::BR_JT, MVT::Other, Expand);

116

setOperationAction(ISD::BRIND, MVT::Other, Expand);

117

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

118

// We need to custom lower some of the intrinsics

119

setOperationAction(ISD::INTRINSIC_WO_CHAIN, MVT::Other, Custom);

120

121

// Library functions. These default to Expand, but we have instructions

122

// for them.

123

setOperationAction(ISD::FCEIL, MVT::f32, Legal);

124

setOperationAction(ISD::FEXP2, MVT::f32, Legal);

125

setOperationAction(ISD::FPOW, MVT::f32, Legal);

126

setOperationAction(ISD::FLOG2, MVT::f32, Legal);

127

setOperationAction(ISD::FABS, MVT::f32, Legal);

128

setOperationAction(ISD::FFLOOR, MVT::f32, Legal);

129

setOperationAction(ISD::FRINT, MVT::f32, Legal);

Tom Stellard

eddfa69

2013-12-20 05:11:55 +0000

[diff] [blame]

130

setOperationAction(ISD::FTRUNC, MVT::f32, Legal);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

131

Matt Arsenault

2015-01-21 18:18:25 +0000

[diff] [blame]

132

setOperationAction(ISD::FROUND, MVT::f32, Custom);

133

setOperationAction(ISD::FROUND, MVT::f64, Custom);

134

Matt Arsenault

2014-09-10 21:44:27 +0000

[diff] [blame]

135

setOperationAction(ISD::FREM, MVT::f32, Custom);

136

setOperationAction(ISD::FREM, MVT::f64, Custom);

137

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

138

// Lower floating point store/load to integer store/load to reduce the number

139

// of patterns in tablegen.

140

setOperationAction(ISD::STORE, MVT::f32, Promote);

141

AddPromotedToType(ISD::STORE, MVT::f32, MVT::i32);

142

Tom Stellard

ed2f614

2013-07-18 21:43:42 +0000

[diff] [blame]

143

setOperationAction(ISD::STORE, MVT::v2f32, Promote);

144

AddPromotedToType(ISD::STORE, MVT::v2f32, MVT::v2i32);

145

Tom Stellard

9b3816b

2014-06-24 23:33:04 +0000

[diff] [blame]

146

setOperationAction(ISD::STORE, MVT::i64, Promote);

147

AddPromotedToType(ISD::STORE, MVT::i64, MVT::v2i32);

148

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

149

setOperationAction(ISD::STORE, MVT::v4f32, Promote);

150

AddPromotedToType(ISD::STORE, MVT::v4f32, MVT::v4i32);

151

Tom Stellard

2013-10-23 00:44:32 +0000

[diff] [blame]

152

setOperationAction(ISD::STORE, MVT::v8f32, Promote);

153

AddPromotedToType(ISD::STORE, MVT::v8f32, MVT::v8i32);

154

155

setOperationAction(ISD::STORE, MVT::v16f32, Promote);

156

AddPromotedToType(ISD::STORE, MVT::v16f32, MVT::v16i32);

157

Tom Stellard

7512c08

2013-07-12 18:14:56 +0000

[diff] [blame]

158

setOperationAction(ISD::STORE, MVT::f64, Promote);

159

AddPromotedToType(ISD::STORE, MVT::f64, MVT::i64);

160

Matt Arsenault

e8a076a

2014-05-08 18:01:56 +0000

[diff] [blame]

161

setOperationAction(ISD::STORE, MVT::v2f64, Promote);

162

AddPromotedToType(ISD::STORE, MVT::v2f64, MVT::v2i64);

163

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

164

// Custom lowering of vector stores is required for local address space

165

// stores.

166

setOperationAction(ISD::STORE, MVT::v4i32, Custom);

167

// XXX: Native v2i32 local address space stores are possible, but not

168

// currently implemented.

169

setOperationAction(ISD::STORE, MVT::v2i32, Custom);

170

Tom Stellard

fbab827

2013-08-16 01:12:11 +0000

[diff] [blame]

171

setTruncStoreAction(MVT::v2i32, MVT::v2i16, Custom);

172

setTruncStoreAction(MVT::v2i32, MVT::v2i8, Custom);

173

setTruncStoreAction(MVT::v4i32, MVT::v4i8, Custom);

Matt Arsenault

e389dd5

2014-03-12 18:45:52 +0000

[diff] [blame]

174

Tom Stellard

fbab827

2013-08-16 01:12:11 +0000

[diff] [blame]

175

// XXX: This can be change to Custom, once ExpandVectorStores can

176

// handle 64-bit stores.

177

setTruncStoreAction(MVT::v4i32, MVT::v4i16, Expand);

178

Tom Stellard

605e116

2014-05-02 15:41:46 +0000

[diff] [blame]

179

setTruncStoreAction(MVT::i64, MVT::i16, Expand);

180

setTruncStoreAction(MVT::i64, MVT::i8, Expand);

Matt Arsenault

e389dd5

2014-03-12 18:45:52 +0000

[diff] [blame]

181

setTruncStoreAction(MVT::i64, MVT::i1, Expand);

182

setTruncStoreAction(MVT::v2i64, MVT::v2i1, Expand);

183

setTruncStoreAction(MVT::v4i64, MVT::v4i1, Expand);

184

185

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

186

setOperationAction(ISD::LOAD, MVT::f32, Promote);

187

AddPromotedToType(ISD::LOAD, MVT::f32, MVT::i32);

188

Tom Stellard

adf732c

2013-07-18 21:43:48 +0000

[diff] [blame]

189

setOperationAction(ISD::LOAD, MVT::v2f32, Promote);

190

AddPromotedToType(ISD::LOAD, MVT::v2f32, MVT::v2i32);

191

Tom Stellard

10ae6a0

2014-07-02 20:53:54 +0000

[diff] [blame]

192

setOperationAction(ISD::LOAD, MVT::i64, Promote);

193

AddPromotedToType(ISD::LOAD, MVT::i64, MVT::v2i32);

194

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

195

setOperationAction(ISD::LOAD, MVT::v4f32, Promote);

196

AddPromotedToType(ISD::LOAD, MVT::v4f32, MVT::v4i32);

197

Tom Stellard

2013-10-23 00:44:32 +0000

[diff] [blame]

198

setOperationAction(ISD::LOAD, MVT::v8f32, Promote);

199

AddPromotedToType(ISD::LOAD, MVT::v8f32, MVT::v8i32);

200

201

setOperationAction(ISD::LOAD, MVT::v16f32, Promote);

202

AddPromotedToType(ISD::LOAD, MVT::v16f32, MVT::v16i32);

203

Tom Stellard

7512c08

2013-07-12 18:14:56 +0000

[diff] [blame]

204

setOperationAction(ISD::LOAD, MVT::f64, Promote);

205

AddPromotedToType(ISD::LOAD, MVT::f64, MVT::i64);

206

Matt Arsenault

e8a076a

2014-05-08 18:01:56 +0000

[diff] [blame]

207

setOperationAction(ISD::LOAD, MVT::v2f64, Promote);

208

AddPromotedToType(ISD::LOAD, MVT::v2f64, MVT::v2i64);

209

Tom Stellard

2013-08-14 23:25:00 +0000

[diff] [blame]

210

setOperationAction(ISD::CONCAT_VECTORS, MVT::v4i32, Custom);

211

setOperationAction(ISD::CONCAT_VECTORS, MVT::v4f32, Custom);

Tom Stellard

967bf58

2014-02-13 23:34:15 +0000

[diff] [blame]

212

setOperationAction(ISD::CONCAT_VECTORS, MVT::v8i32, Custom);

213

setOperationAction(ISD::CONCAT_VECTORS, MVT::v8f32, Custom);

Tom Stellard

2013-08-14 23:25:00 +0000

[diff] [blame]

214

setOperationAction(ISD::EXTRACT_SUBVECTOR, MVT::v2f32, Custom);

Tom Stellard

967bf58

2014-02-13 23:34:15 +0000

[diff] [blame]

215

setOperationAction(ISD::EXTRACT_SUBVECTOR, MVT::v2i32, Custom);

216

setOperationAction(ISD::EXTRACT_SUBVECTOR, MVT::v4f32, Custom);

217

setOperationAction(ISD::EXTRACT_SUBVECTOR, MVT::v4i32, Custom);

218

setOperationAction(ISD::EXTRACT_SUBVECTOR, MVT::v8f32, Custom);

219

setOperationAction(ISD::EXTRACT_SUBVECTOR, MVT::v8i32, Custom);

Tom Stellard

0344cdf

2013-08-01 15:23:42 +0000

[diff] [blame]

220

Matt Arsenault

bd22342

2015-01-14 01:35:17 +0000

[diff] [blame]

221

// There are no 64-bit extloads. These should be done as a 32-bit extload and

222

// an extension to 64-bit.

223

for (MVT VT : MVT::integer_valuetypes()) {

224

setLoadExtAction(ISD::EXTLOAD, MVT::i64, VT, Expand);

225

setLoadExtAction(ISD::SEXTLOAD, MVT::i64, VT, Expand);

226

setLoadExtAction(ISD::ZEXTLOAD, MVT::i64, VT, Expand);

227

}

228

Ahmed Bougacha

2b6917b

2015-01-08 00:51:32 +0000

[diff] [blame]

229

for (MVT VT : MVT::integer_vector_valuetypes()) {

230

setLoadExtAction(ISD::EXTLOAD, VT, MVT::v2i8, Expand);

231

setLoadExtAction(ISD::SEXTLOAD, VT, MVT::v2i8, Expand);

232

setLoadExtAction(ISD::ZEXTLOAD, VT, MVT::v2i8, Expand);

233

setLoadExtAction(ISD::EXTLOAD, VT, MVT::v4i8, Expand);

234

setLoadExtAction(ISD::SEXTLOAD, VT, MVT::v4i8, Expand);

235

setLoadExtAction(ISD::ZEXTLOAD, VT, MVT::v4i8, Expand);

236

setLoadExtAction(ISD::EXTLOAD, VT, MVT::v2i16, Expand);

237

setLoadExtAction(ISD::SEXTLOAD, VT, MVT::v2i16, Expand);

238

setLoadExtAction(ISD::ZEXTLOAD, VT, MVT::v2i16, Expand);

239

setLoadExtAction(ISD::EXTLOAD, VT, MVT::v4i16, Expand);

240

setLoadExtAction(ISD::SEXTLOAD, VT, MVT::v4i16, Expand);

241

setLoadExtAction(ISD::ZEXTLOAD, VT, MVT::v4i16, Expand);

242

}

Tom Stellard

b03edec

2013-08-16 01:12:16 +0000

[diff] [blame]

243

Tom Stellard

aeb4564

2014-02-04 17:18:43 +0000

[diff] [blame]

244

setOperationAction(ISD::BR_CC, MVT::i1, Expand);

245

Matt Arsenault

2014-06-18 17:05:26 +0000

[diff] [blame]

246

if (Subtarget->getGeneration() < AMDGPUSubtarget::SEA_ISLANDS) {

Matt Arsenault

2014-06-18 17:05:30 +0000

[diff] [blame]

247

setOperationAction(ISD::FCEIL, MVT::f64, Custom);

248

setOperationAction(ISD::FTRUNC, MVT::f64, Custom);

Matt Arsenault

2014-06-18 17:05:26 +0000

[diff] [blame]

249

setOperationAction(ISD::FRINT, MVT::f64, Custom);

Matt Arsenault

2014-06-18 17:05:30 +0000

[diff] [blame]

250

setOperationAction(ISD::FFLOOR, MVT::f64, Custom);

Matt Arsenault

2014-06-18 17:05:26 +0000

[diff] [blame]

251

}

252

Matt Arsenault

6e43965

2014-06-10 19:00:20 +0000

[diff] [blame]

253

if (!Subtarget->hasBFI()) {

254

// fcopysign can be done in a single instruction with BFI.

255

setOperationAction(ISD::FCOPYSIGN, MVT::f32, Expand);

256

setOperationAction(ISD::FCOPYSIGN, MVT::f64, Expand);

257

}

258

Tim Northover

f861de3

2014-07-18 08:43:24 +0000

[diff] [blame]

259

setOperationAction(ISD::FP16_TO_FP, MVT::f64, Expand);

260

Ahmed Bougacha

2b6917b

2015-01-08 00:51:32 +0000

[diff] [blame]

261

setLoadExtAction(ISD::EXTLOAD, MVT::f32, MVT::f16, Expand);

262

setLoadExtAction(ISD::EXTLOAD, MVT::f64, MVT::f16, Expand);

Tim Northover

00fdbbb

2014-07-18 13:01:37 +0000

[diff] [blame]

263

setTruncStoreAction(MVT::f32, MVT::f16, Expand);

264

setTruncStoreAction(MVT::f64, MVT::f16, Expand);

265

Matt Arsenault

2014-06-13 17:20:53 +0000

[diff] [blame]

266

const MVT ScalarIntVTs[] = { MVT::i32, MVT::i64 };

267

for (MVT VT : ScalarIntVTs) {

Matt Arsenault

2014-06-15 21:08:58 +0000

[diff] [blame]

268

setOperationAction(ISD::SREM, VT, Expand);

Jan Vesely

2014-08-12 17:31:17 +0000

[diff] [blame]

269

setOperationAction(ISD::SDIV, VT, Expand);

Matt Arsenault

2014-06-15 21:08:58 +0000

[diff] [blame]

270

Matt Arsenault

2014-06-13 17:20:53 +0000

[diff] [blame]

271

// GPU does not have divrem function for signed or unsigned.

Jan Vesely

2014-06-22 21:43:00 +0000

[diff] [blame]

272

setOperationAction(ISD::SDIVREM, VT, Custom);

Matt Arsenault

2014-06-15 21:08:58 +0000

[diff] [blame]

273

setOperationAction(ISD::UDIVREM, VT, Custom);

Matt Arsenault

2014-06-13 17:20:53 +0000

[diff] [blame]

274

275

// GPU does not have [S|U]MUL_LOHI functions as a single instruction.

276

setOperationAction(ISD::SMUL_LOHI, VT, Expand);

277

setOperationAction(ISD::UMUL_LOHI, VT, Expand);

278

279

setOperationAction(ISD::BSWAP, VT, Expand);

280

setOperationAction(ISD::CTTZ, VT, Expand);

281

setOperationAction(ISD::CTLZ, VT, Expand);

282

}

283

Matt Arsenault

6042506

2014-06-10 19:18:28 +0000

[diff] [blame]

284

if (!Subtarget->hasBCNT(32))

285

setOperationAction(ISD::CTPOP, MVT::i32, Expand);

286

287

if (!Subtarget->hasBCNT(64))

288

setOperationAction(ISD::CTPOP, MVT::i64, Expand);

289

Matt Arsenault

2014-06-15 21:08:58 +0000

[diff] [blame]

290

// The hardware supports 32-bit ROTR, but not ROTL.

291

setOperationAction(ISD::ROTL, MVT::i32, Expand);

292

setOperationAction(ISD::ROTL, MVT::i64, Expand);

293

setOperationAction(ISD::ROTR, MVT::i64, Expand);

294

295

setOperationAction(ISD::MUL, MVT::i64, Expand);

296

setOperationAction(ISD::MULHU, MVT::i64, Expand);

297

setOperationAction(ISD::MULHS, MVT::i64, Expand);

Matt Arsenault

2014-06-15 21:08:58 +0000

[diff] [blame]

298

setOperationAction(ISD::UDIV, MVT::i32, Expand);

299

setOperationAction(ISD::UREM, MVT::i32, Expand);

300

setOperationAction(ISD::UINT_TO_FP, MVT::i64, Custom);

Matt Arsenault

2014-10-03 23:54:41 +0000

[diff] [blame]

301

setOperationAction(ISD::SINT_TO_FP, MVT::i64, Custom);

Matt Arsenault

c996175

2014-10-03 23:54:56 +0000

[diff] [blame]

302

setOperationAction(ISD::FP_TO_SINT, MVT::i64, Custom);

303

setOperationAction(ISD::FP_TO_UINT, MVT::i64, Custom);

Matt Arsenault

2014-06-15 21:08:58 +0000

[diff] [blame]

304

setOperationAction(ISD::SELECT_CC, MVT::i64, Expand);

Matt Arsenault

2014-06-10 19:18:21 +0000

[diff] [blame]

305

Jan Vesely

6ddb8dd

2014-07-15 15:51:09 +0000

[diff] [blame]

306

if (!Subtarget->hasFFBH())

307

setOperationAction(ISD::CTLZ_ZERO_UNDEF, MVT::i32, Expand);

308

309

if (!Subtarget->hasFFBL())

310

setOperationAction(ISD::CTTZ_ZERO_UNDEF, MVT::i32, Expand);

311

Matt Arsenault

2014-06-13 17:20:53 +0000

[diff] [blame]

312

static const MVT::SimpleValueType VectorIntTypes[] = {

Tom Stellard

f6d8023

2013-08-21 22:14:17 +0000

[diff] [blame]

313

MVT::v2i32, MVT::v4i32

Aaron Watry

2013-06-25 13:55:57 +0000

[diff] [blame]

314

};

Aaron Watry

2013-06-25 13:55:57 +0000

[diff] [blame]

315

Matt Arsenault

2014-06-13 17:20:53 +0000

[diff] [blame]

316

for (MVT VT : VectorIntTypes) {

Matt Arsenault

2014-06-10 19:18:21 +0000

[diff] [blame]

317

// Expand the following operations for the current type by default.

Aaron Watry

2013-06-25 13:55:57 +0000

[diff] [blame]

318

setOperationAction(ISD::ADD, VT, Expand);

319

setOperationAction(ISD::AND, VT, Expand);

Tom Stellard

aa313d0

2013-07-30 14:31:03 +0000

[diff] [blame]

320

setOperationAction(ISD::FP_TO_SINT, VT, Expand);

321

setOperationAction(ISD::FP_TO_UINT, VT, Expand);

Aaron Watry

2013-06-25 13:55:57 +0000

[diff] [blame]

322

setOperationAction(ISD::MUL, VT, Expand);

323

setOperationAction(ISD::OR, VT, Expand);

324

setOperationAction(ISD::SHL, VT, Expand);

Aaron Watry

2013-06-25 13:55:57 +0000

[diff] [blame]

325

setOperationAction(ISD::SRA, VT, Expand);

Matt Arsenault

825fb0b

2014-06-13 04:00:30 +0000

[diff] [blame]

326

setOperationAction(ISD::SRL, VT, Expand);

327

setOperationAction(ISD::ROTL, VT, Expand);

328

setOperationAction(ISD::ROTR, VT, Expand);

Aaron Watry

2013-06-25 13:55:57 +0000

[diff] [blame]

329

setOperationAction(ISD::SUB, VT, Expand);

Matt Arsenault

825fb0b

2014-06-13 04:00:30 +0000

[diff] [blame]

330

setOperationAction(ISD::SINT_TO_FP, VT, Expand);

Tom Stellard

aa313d0

2013-07-30 14:31:03 +0000

[diff] [blame]

331

setOperationAction(ISD::UINT_TO_FP, VT, Expand);

Jan Vesely

2014-06-22 21:43:00 +0000

[diff] [blame]

332

setOperationAction(ISD::SDIV, VT, Expand);

Matt Arsenault

2014-06-15 21:08:58 +0000

[diff] [blame]

333

setOperationAction(ISD::UDIV, VT, Expand);

Matt Arsenault

2014-06-13 17:20:53 +0000

[diff] [blame]

334

setOperationAction(ISD::SREM, VT, Expand);

Aaron Watry

2013-06-25 13:55:57 +0000

[diff] [blame]

335

setOperationAction(ISD::UREM, VT, Expand);

Matt Arsenault

2014-06-13 17:20:53 +0000

[diff] [blame]

336

setOperationAction(ISD::SMUL_LOHI, VT, Expand);

337

setOperationAction(ISD::UMUL_LOHI, VT, Expand);

Jan Vesely

2014-06-22 21:43:00 +0000

[diff] [blame]

338

setOperationAction(ISD::SDIVREM, VT, Custom);

Matt Arsenault

2014-06-15 21:08:58 +0000

[diff] [blame]

339

setOperationAction(ISD::UDIVREM, VT, Custom);

Matt Arsenault

c4d3d3a

2014-06-23 18:00:49 +0000

[diff] [blame]

340

setOperationAction(ISD::ADDC, VT, Expand);

341

setOperationAction(ISD::SUBC, VT, Expand);

342

setOperationAction(ISD::ADDE, VT, Expand);

343

setOperationAction(ISD::SUBE, VT, Expand);

Matt Arsenault

9fe669c

2014-03-06 17:34:03 +0000

[diff] [blame]

344

setOperationAction(ISD::SELECT, VT, Expand);

Tom Stellard

67ae476

2013-07-18 21:43:35 +0000

[diff] [blame]

345

setOperationAction(ISD::VSELECT, VT, Expand);

Matt Arsenault

2014-06-23 18:00:44 +0000

[diff] [blame]

346

setOperationAction(ISD::SELECT_CC, VT, Expand);

Aaron Watry

2013-06-25 13:55:57 +0000

[diff] [blame]

347

setOperationAction(ISD::XOR, VT, Expand);

Matt Arsenault

13ccc8f

2014-06-09 16:20:25 +0000

[diff] [blame]

348

setOperationAction(ISD::BSWAP, VT, Expand);

Matt Arsenault

2014-06-10 19:18:21 +0000

[diff] [blame]

349

setOperationAction(ISD::CTPOP, VT, Expand);

350

setOperationAction(ISD::CTTZ, VT, Expand);

Matt Arsenault

8579601

2014-06-17 17:36:24 +0000

[diff] [blame]

351

setOperationAction(ISD::CTTZ_ZERO_UNDEF, VT, Expand);

Matt Arsenault

2014-06-10 19:18:21 +0000

[diff] [blame]

352

setOperationAction(ISD::CTLZ, VT, Expand);

Matt Arsenault

8579601

2014-06-17 17:36:24 +0000

[diff] [blame]

353

setOperationAction(ISD::CTLZ_ZERO_UNDEF, VT, Expand);

Matt Arsenault

2014-06-23 18:00:44 +0000

[diff] [blame]

354

setOperationAction(ISD::VECTOR_SHUFFLE, VT, Expand);

Aaron Watry

2013-06-25 13:55:57 +0000

[diff] [blame]

355

}

Tom Stellard

2013-08-16 23:51:24 +0000

[diff] [blame]

356

Matt Arsenault

2014-06-13 17:20:53 +0000

[diff] [blame]

357

static const MVT::SimpleValueType FloatVectorTypes[] = {

Tom Stellard

f6d8023

2013-08-21 22:14:17 +0000

[diff] [blame]

358

MVT::v2f32, MVT::v4f32

Tom Stellard

2013-08-16 23:51:24 +0000

[diff] [blame]

359

};

Tom Stellard

2013-08-16 23:51:24 +0000

[diff] [blame]

360

Matt Arsenault

2014-06-13 17:20:53 +0000

[diff] [blame]

361

for (MVT VT : FloatVectorTypes) {

Tom Stellard

175e7a8

2013-11-27 21:23:39 +0000

[diff] [blame]

362

setOperationAction(ISD::FABS, VT, Expand);

Matt Arsenault

7c93690

2014-10-21 23:01:01 +0000

[diff] [blame]

363

setOperationAction(ISD::FMINNUM, VT, Expand);

364

setOperationAction(ISD::FMAXNUM, VT, Expand);

Tom Stellard

2013-08-16 23:51:24 +0000

[diff] [blame]

365

setOperationAction(ISD::FADD, VT, Expand);

Jan Vesely

85f0dbc

2014-06-18 17:57:29 +0000

[diff] [blame]

366

setOperationAction(ISD::FCEIL, VT, Expand);

Tom Stellard

3dbf1f8

2014-05-02 15:41:47 +0000

[diff] [blame]

367

setOperationAction(ISD::FCOS, VT, Expand);

Tom Stellard

2013-08-16 23:51:24 +0000

[diff] [blame]

368

setOperationAction(ISD::FDIV, VT, Expand);

Tom Stellard

5222a88

2014-06-20 17:06:05 +0000

[diff] [blame]

369

setOperationAction(ISD::FEXP2, VT, Expand);

Tom Stellard

a79e9f0

2014-06-20 17:06:07 +0000

[diff] [blame]

370

setOperationAction(ISD::FLOG2, VT, Expand);

Matt Arsenault

2014-09-10 21:44:27 +0000

[diff] [blame]

371

setOperationAction(ISD::FREM, VT, Expand);

Tom Stellard

bfebd1f

2014-02-04 17:18:37 +0000

[diff] [blame]

372

setOperationAction(ISD::FPOW, VT, Expand);

Tom Stellard

ad3aff2

2013-08-16 23:51:29 +0000

[diff] [blame]

373

setOperationAction(ISD::FFLOOR, VT, Expand);

Tom Stellard

eddfa69

2013-12-20 05:11:55 +0000

[diff] [blame]

374

setOperationAction(ISD::FTRUNC, VT, Expand);

Tom Stellard

2013-08-16 23:51:24 +0000

[diff] [blame]

375

setOperationAction(ISD::FMUL, VT, Expand);

Matt Arsenault

c6f8fdb

2014-06-26 01:28:05 +0000

[diff] [blame]

376

setOperationAction(ISD::FMA, VT, Expand);

Tom Stellard

b249b75

2013-08-16 23:51:33 +0000

[diff] [blame]

377

setOperationAction(ISD::FRINT, VT, Expand);

Matt Arsenault

2014-06-18 22:03:45 +0000

[diff] [blame]

378

setOperationAction(ISD::FNEARBYINT, VT, Expand);

Tom Stellard

e118b8b

2013-10-29 16:37:20 +0000

[diff] [blame]

379

setOperationAction(ISD::FSQRT, VT, Expand);

Tom Stellard

3dbf1f8

2014-05-02 15:41:47 +0000

[diff] [blame]

380

setOperationAction(ISD::FSIN, VT, Expand);

Tom Stellard

2013-08-16 23:51:24 +0000

[diff] [blame]

381

setOperationAction(ISD::FSUB, VT, Expand);

Matt Arsenault

616a8e4

2014-06-01 07:38:21 +0000

[diff] [blame]

382

setOperationAction(ISD::FNEG, VT, Expand);

Matt Arsenault

9fe669c

2014-03-06 17:34:03 +0000

[diff] [blame]

383

setOperationAction(ISD::SELECT, VT, Expand);

Matt Arsenault

616a8e4

2014-06-01 07:38:21 +0000

[diff] [blame]

384

setOperationAction(ISD::VSELECT, VT, Expand);

Matt Arsenault

2014-06-23 18:00:44 +0000

[diff] [blame]

385

setOperationAction(ISD::SELECT_CC, VT, Expand);

Matt Arsenault

6e43965

2014-06-10 19:00:20 +0000

[diff] [blame]

386

setOperationAction(ISD::FCOPYSIGN, VT, Expand);

Matt Arsenault

2014-06-23 18:00:44 +0000

[diff] [blame]

387

setOperationAction(ISD::VECTOR_SHUFFLE, VT, Expand);

Tom Stellard

2013-08-16 23:51:24 +0000

[diff] [blame]

388

}

Matt Arsenault

2014-03-17 18:58:11 +0000

[diff] [blame]

389

Matt Arsenault

2014-06-18 22:03:45 +0000

[diff] [blame]

390

setOperationAction(ISD::FNEARBYINT, MVT::f32, Custom);

391

setOperationAction(ISD::FNEARBYINT, MVT::f64, Custom);

392

Tom Stellard

2014-04-07 19:45:41 +0000

[diff] [blame]

393

setTargetDAGCombine(ISD::MUL);

Matt Arsenault

2014-11-13 23:03:09 +0000

[diff] [blame]

394

setTargetDAGCombine(ISD::SELECT);

Tom Stellard

afa8b53

2014-05-09 16:42:16 +0000

[diff] [blame]

395

setTargetDAGCombine(ISD::SELECT_CC);

Matt Arsenault

2014-07-15 02:06:31 +0000

[diff] [blame]

396

setTargetDAGCombine(ISD::STORE);

Matt Arsenault

2014-06-13 17:20:53 +0000

[diff] [blame]

397

Matt Arsenault

fcdddf9

2014-11-26 21:23:15 +0000

[diff] [blame]

398

setBooleanContents(ZeroOrNegativeOneBooleanContent);

399

setBooleanVectorContents(ZeroOrNegativeOneBooleanContent);

400

Matt Arsenault

2014-06-13 17:20:53 +0000

[diff] [blame]

401

setSchedulingPreference(Sched::RegPressure);

402

setJumpIsExpensive(true);

403

Matt Arsenault

996a0ef

2014-08-09 03:46:58 +0000

[diff] [blame]

404

// SI at least has hardware support for floating point exceptions, but no way

405

// of using or handling them is implemented. They are also optional in OpenCL

406

// (Section 7.3)

407

setHasFloatingPointExceptions(false);

408

Matt Arsenault

d5f91fd

2014-06-23 18:00:52 +0000

[diff] [blame]

409

setSelectIsExpensive(false);

410

PredictableSelectIsExpensive = false;

411

Matt Arsenault

cf9a9a1

2014-06-15 19:48:16 +0000

[diff] [blame]

412

// There are no integer divide instructions, and these expand to a pretty

413

// large sequence of instructions.

414

setIntDivIsCheap(false);

Sanjay Patel

2cdea4c

2014-08-21 22:31:48 +0000

[diff] [blame]

415

setPow2SDivIsCheap(false);

Matt Arsenault

bf0db91

2015-01-13 20:53:23 +0000

[diff] [blame]

416

setFsqrtIsCheap(true);

Matt Arsenault

cf9a9a1

2014-06-15 19:48:16 +0000

[diff] [blame]

417

Matt Arsenault

2014-06-13 17:20:53 +0000

[diff] [blame]

418

// FIXME: Need to really handle these.

419

MaxStoresPerMemcpy = 4096;

420

MaxStoresPerMemmove = 4096;

421

MaxStoresPerMemset = 4096;

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

422

}

423

Tom Stellard

28d06de

2013-08-05 22:22:07 +0000

[diff] [blame]

424

//===----------------------------------------------------------------------===//

425

// Target Information

426

//===----------------------------------------------------------------------===//

427

428

MVT AMDGPUTargetLowering::getVectorIdxTy() const {

return MVT::i32;

}

Matt Arsenault

2014-06-23 18:00:52 +0000

[diff] [blame]

432

bool AMDGPUTargetLowering::isSelectSupported(SelectSupportKind SelType) const {

return true;

}

Matt Arsenault

2014-06-15 20:23:38 +0000

[diff] [blame]

436

// The backend supports 32 and 64 bit floating point immediates.

437

// FIXME: Why are we reporting vectors of FP immediates as legal?

438

bool AMDGPUTargetLowering::isFPImmLegal(const APFloat &Imm, EVT VT) const {

439

EVT ScalarVT = VT.getScalarType();

Matt Arsenault

2a60de5

2014-06-15 21:22:52 +0000

[diff] [blame]

440

return (ScalarVT == MVT::f32 || ScalarVT == MVT::f64);

Matt Arsenault

14d4645

2014-06-15 20:23:38 +0000

[diff] [blame]

441

}

442

443

// We don't want to shrink f64 / f32 constants.

444

bool AMDGPUTargetLowering::ShouldShrinkFPConstant(EVT VT) const {

445

EVT ScalarVT = VT.getScalarType();

446

return (ScalarVT != MVT::f32 && ScalarVT != MVT::f64);

447

}

448

Matt Arsenault

810cb62

2014-12-12 00:00:24 +0000

[diff] [blame]

449

bool AMDGPUTargetLowering::shouldReduceLoadWidth(SDNode *N,

ISD::LoadExtType,

EVT NewVT) const {

unsigned NewSize = NewVT.getStoreSizeInBits();

454

455

// If we are reducing to a 32-bit load, this is always better.

if (NewSize == 32)

return true;

EVT OldVT = N->getValueType(0);

460

unsigned OldSize = OldVT.getStoreSizeInBits();

461

462

// Don't produce extloads from sub 32-bit types. SI doesn't have scalar

463

// extloads, so doing one requires using a buffer_load. In cases where we

464

// still couldn't use a scalar load, using the wider load shouldn't really

465

// hurt anything.

466

467

// If the old size already had to be an extload, there's no harm in continuing

468

// to reduce the width.

469

return (OldSize < 32);

470

}

471

Matt Arsenault

c5559bb

2013-11-15 04:42:23 +0000

[diff] [blame]

472

bool AMDGPUTargetLowering::isLoadBitCastBeneficial(EVT LoadTy,

473

EVT CastTy) const {

474

if (LoadTy.getSizeInBits() != CastTy.getSizeInBits())

475

return true;

476

477

unsigned LScalarSize = LoadTy.getScalarType().getSizeInBits();

478

unsigned CastScalarSize = CastTy.getScalarType().getSizeInBits();

479

480

return ((LScalarSize <= CastScalarSize) ||

481

(CastScalarSize >= 32) ||

482

(LScalarSize < 32));

483

}

Tom Stellard

28d06de

2013-08-05 22:22:07 +0000

[diff] [blame]

484

Matt Arsenault

b56d843

2015-01-13 19:46:48 +0000

[diff] [blame]

485

// SI+ has instructions for cttz / ctlz for 32-bit values. This is probably also

486

// profitable with the expansion for 64-bit since it's generally good to

487

// speculate things.

488

// FIXME: These should really have the size as a parameter.

489

bool AMDGPUTargetLowering::isCheapToSpeculateCttz() const {

return true;

}

bool AMDGPUTargetLowering::isCheapToSpeculateCtlz() const {

return true;

}

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

497

//===---------------------------------------------------------------------===//

Tom Stellard

2013-07-23 23:55:03 +0000

[diff] [blame]

498

// Target Properties

499

//===---------------------------------------------------------------------===//

500

501

bool AMDGPUTargetLowering::isFAbsFree(EVT VT) const {

502

assert(VT.isFloatingPoint());

Matt Arsenault

a147438

2014-08-15 18:42:15 +0000

[diff] [blame]

503

return VT == MVT::f32 || VT == MVT::f64;

Tom Stellard

2013-07-23 23:55:03 +0000

[diff] [blame]

504

}

505

506

bool AMDGPUTargetLowering::isFNegFree(EVT VT) const {

507

assert(VT.isFloatingPoint());

Matt Arsenault

13623d0

2014-08-15 18:42:18 +0000

[diff] [blame]

508

return VT == MVT::f32 || VT == MVT::f64;

Tom Stellard

2013-07-23 23:55:03 +0000

[diff] [blame]

509

}

510

Benjamin Kramer

53f9df4

2014-02-12 10:17:54 +0000

[diff] [blame]

511

bool AMDGPUTargetLowering::isTruncateFree(EVT Source, EVT Dest) const {

Matt Arsenault

0cdcd96

2014-02-10 19:57:42 +0000

[diff] [blame]

512

// Truncate is just accessing a subregister.

Benjamin Kramer

53f9df4

2014-02-12 10:17:54 +0000

[diff] [blame]

513

return Dest.bitsLT(Source) && (Dest.getSizeInBits() % 32 == 0);

514

}

515

516

bool AMDGPUTargetLowering::isTruncateFree(Type *Source, Type *Dest) const {

517

// Truncate is just accessing a subregister.

518

return Dest->getPrimitiveSizeInBits() < Source->getPrimitiveSizeInBits() &&

519

(Dest->getPrimitiveSizeInBits() % 32 == 0);

Matt Arsenault

0cdcd96

2014-02-10 19:57:42 +0000

[diff] [blame]

520

}

521

Matt Arsenault

b517c81

2014-03-27 17:23:31 +0000

[diff] [blame]

522

bool AMDGPUTargetLowering::isZExtFree(Type *Src, Type *Dest) const {

523

const DataLayout *DL = getDataLayout();

524

unsigned SrcSize = DL->getTypeSizeInBits(Src->getScalarType());

525

unsigned DestSize = DL->getTypeSizeInBits(Dest->getScalarType());

526

527

return SrcSize == 32 && DestSize == 64;

528

}

529

530

bool AMDGPUTargetLowering::isZExtFree(EVT Src, EVT Dest) const {

531

// Any register load of a 64-bit value really requires 2 32-bit moves. For all

532

// practical purposes, the extra mov 0 to load a 64-bit is free. As used,

533

// this will enable reducing 64-bit operations the 32-bit, which is always

534

// good.

535

return Src == MVT::i32 && Dest == MVT::i64;

536

}

537

Aaron Ballman

3c81e46

2014-06-26 13:45:47 +0000

[diff] [blame]

538

bool AMDGPUTargetLowering::isZExtFree(SDValue Val, EVT VT2) const {

539

return isZExtFree(Val.getValueType(), VT2);

540

}

541

Matt Arsenault

a7f1e0c

2014-03-24 19:43:31 +0000

[diff] [blame]

542

bool AMDGPUTargetLowering::isNarrowingProfitable(EVT SrcVT, EVT DestVT) const {

543

// There aren't really 64-bit registers, but pairs of 32-bit ones and only a

544

// limited number of native 64-bit operations. Shrinking an operation to fit

545

// in a single 32-bit register should always be helpful. As currently used,

546

// this is much less general than the name suggests, and is only used in

547

// places trying to reduce the sizes of loads. Shrinking loads to < 32-bits is

548

// not profitable, and may actually be harmful.

549

return SrcVT.getSizeInBits() > 32 && DestVT.getSizeInBits() == 32;

550

}

551

Tom Stellard

2013-07-23 23:55:03 +0000

[diff] [blame]

552

//===---------------------------------------------------------------------===//

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

553

// TargetLowering Callbacks

554

//===---------------------------------------------------------------------===//

555

Christian Konig

2013-03-07 09:03:52 +0000

[diff] [blame]

556

void AMDGPUTargetLowering::AnalyzeFormalArguments(CCState &State,

557

const SmallVectorImpl<ISD::InputArg> &Ins) const {

558

559

State.AnalyzeFormalArguments(Ins, CC_AMDGPU);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

560

}

561

562

SDValue AMDGPUTargetLowering::LowerReturn(

563

SDValue Chain,

564

CallingConv::ID CallConv,

565

bool isVarArg,

566

const SmallVectorImpl<ISD::OutputArg> &Outs,

567

const SmallVectorImpl<SDValue> &OutVals,

Andrew Trick

2013-05-25 02:42:55 +0000

[diff] [blame]

568

SDLoc DL, SelectionDAG &DAG) const {

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

569

return DAG.getNode(AMDGPUISD::RET_FLAG, DL, MVT::Other, Chain);

570

}

571

572

//===---------------------------------------------------------------------===//

573

// Target specific lowering

574

//===---------------------------------------------------------------------===//

575

Matt Arsenault

2014-04-22 16:42:00 +0000

[diff] [blame]

576

SDValue AMDGPUTargetLowering::LowerCall(CallLoweringInfo &CLI,

577

SmallVectorImpl<SDValue> &InVals) const {

578

SDValue Callee = CLI.Callee;

579

SelectionDAG &DAG = CLI.DAG;

580

581

const Function &Fn = *DAG.getMachineFunction().getFunction();

582

583

StringRef FuncName("<unknown>");

584

Matt Arsenault

de1c3410

2014-04-25 22:22:01 +0000

[diff] [blame]

585

if (const ExternalSymbolSDNode *G = dyn_cast<ExternalSymbolSDNode>(Callee))

586

FuncName = G->getSymbol();

587

else if (const GlobalAddressSDNode *G = dyn_cast<GlobalAddressSDNode>(Callee))

Matt Arsenault

2014-04-22 16:42:00 +0000

[diff] [blame]

588

FuncName = G->getGlobal()->getName();

589

590

DiagnosticInfoUnsupported NoCalls(Fn, "call to function " + FuncName);

591

DAG.getContext()->diagnose(NoCalls);

return SDValue();

}

Matt Arsenault

2014-06-15 20:23:38 +0000

[diff] [blame]

595

SDValue AMDGPUTargetLowering::LowerOperation(SDValue Op,

596

SelectionDAG &DAG) const {

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

597

switch (Op.getOpcode()) {

598

default:

599

Op.getNode()->dump();

Matt Arsenault

eaa3a7e

2013-12-10 21:37:42 +0000

[diff] [blame]

600

llvm_unreachable("Custom lowering code for this"

601

"instruction is not implemented yet!");

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

602

break;

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

603

case ISD::SIGN_EXTEND_INREG: return LowerSIGN_EXTEND_INREG(Op, DAG);

Tom Stellard

2013-08-14 23:25:00 +0000

[diff] [blame]

604

case ISD::CONCAT_VECTORS: return LowerCONCAT_VECTORS(Op, DAG);

605

case ISD::EXTRACT_SUBVECTOR: return LowerEXTRACT_SUBVECTOR(Op, DAG);

Tom Stellard

2013-11-13 23:36:50 +0000

[diff] [blame]

606

case ISD::FrameIndex: return LowerFrameIndex(Op, DAG);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

607

case ISD::INTRINSIC_WO_CHAIN: return LowerINTRINSIC_WO_CHAIN(Op, DAG);

608

case ISD::UDIVREM: return LowerUDIVREM(Op, DAG);

Jan Vesely

2014-06-22 21:43:00 +0000

[diff] [blame]

609

case ISD::SDIVREM: return LowerSDIVREM(Op, DAG);

Matt Arsenault

2014-09-10 21:44:27 +0000

[diff] [blame]

610

case ISD::FREM: return LowerFREM(Op, DAG);

Matt Arsenault

2014-06-18 17:05:30 +0000

[diff] [blame]

611

case ISD::FCEIL: return LowerFCEIL(Op, DAG);

612

case ISD::FTRUNC: return LowerFTRUNC(Op, DAG);

Matt Arsenault

2014-06-18 17:05:26 +0000

[diff] [blame]

613

case ISD::FRINT: return LowerFRINT(Op, DAG);

Matt Arsenault

2014-06-18 22:03:45 +0000

[diff] [blame]

614

case ISD::FNEARBYINT: return LowerFNEARBYINT(Op, DAG);

Matt Arsenault

2015-01-21 18:18:25 +0000

[diff] [blame]

615

case ISD::FROUND: return LowerFROUND(Op, DAG);

Matt Arsenault

2014-06-18 17:05:30 +0000

[diff] [blame]

616

case ISD::FFLOOR: return LowerFFLOOR(Op, DAG);

Matt Arsenault

2014-10-03 23:54:41 +0000

[diff] [blame]

617

case ISD::SINT_TO_FP: return LowerSINT_TO_FP(Op, DAG);

Tom Stellard

2013-10-30 17:22:05 +0000

[diff] [blame]

618

case ISD::UINT_TO_FP: return LowerUINT_TO_FP(Op, DAG);

Matt Arsenault

c996175

2014-10-03 23:54:56 +0000

[diff] [blame]

619

case ISD::FP_TO_SINT: return LowerFP_TO_SINT(Op, DAG);

620

case ISD::FP_TO_UINT: return LowerFP_TO_UINT(Op, DAG);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

}

return Op;

}

Matt Arsenault

2014-03-27 17:23:24 +0000

[diff] [blame]

625

void AMDGPUTargetLowering::ReplaceNodeResults(SDNode *N,

626

SmallVectorImpl<SDValue> &Results,

627

SelectionDAG &DAG) const {

628

switch (N->getOpcode()) {

629

case ISD::SIGN_EXTEND_INREG:

630

// Different parts of legalization seem to interpret which type of

631

// sign_extend_inreg is the one to check for custom lowering. The extended

632

// from type is what really matters, but some places check for custom

633

// lowering of the result type. This results in trying to use

634

// ReplaceNodeResults to sext_in_reg to an illegal type, so we'll just do

635

// nothing here and let the illegal result integer be handled normally.

636

return;

Matt Arsenault

961ca43

2014-06-27 02:33:47 +0000

[diff] [blame]

637

case ISD::LOAD: {

638

SDNode *Node = LowerLOAD(SDValue(N, 0), DAG).getNode();

Matt Arsenault

c324b95

2014-07-02 17:44:53 +0000

[diff] [blame]

if (!Node)

return;

Matt Arsenault

2014-06-27 02:33:47 +0000

[diff] [blame]

642

Results.push_back(SDValue(Node, 0));

643

Results.push_back(SDValue(Node, 1));

644

// XXX: LLVM seems not to replace Chain Value inside CustomWidenLowerNode

645

// function

646

DAG.ReplaceAllUsesOfValueWith(SDValue(N,1), SDValue(Node, 1));

647

return;

648

}

649

case ISD::STORE: {

Matt Arsenault

c324b95

2014-07-02 17:44:53 +0000

[diff] [blame]

650

SDValue Lowered = LowerSTORE(SDValue(N, 0), DAG);

651

if (Lowered.getNode())

652

Results.push_back(Lowered);

Matt Arsenault

961ca43

2014-06-27 02:33:47 +0000

[diff] [blame]

653

return;

654

}

Matt Arsenault

d125d74

2014-03-27 17:23:24 +0000

[diff] [blame]

default:

return;

}

}

Matt Arsenault

2014-05-21 22:59:17 +0000

[diff] [blame]

660

// FIXME: This implements accesses to initialized globals in the constant

661

// address space by copying them to private and accessing that. It does not

662

// properly handle illegal types or vectors. The private vector loads are not

663

// scalarized, and the illegal scalars hit an assertion. This technique will not

664

// work well with large initializers, and this should eventually be

665

// removed. Initialized globals should be placed into a data section that the

666

// runtime will load into a buffer before the kernel is executed. Uses of the

667

// global need to be replaced with a pointer loaded from an implicit kernel

668

// argument into this buffer holding the copy of the data, which will remove the

669

// need for any of this.

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

670

SDValue AMDGPUTargetLowering::LowerConstantInitializer(const Constant* Init,

671

const GlobalValue *GV,

672

const SDValue &InitPtr,

673

SDValue Chain,

674

SelectionDAG &DAG) const {

Eric Christopher

d913448

2014-08-04 21:25:23 +0000

[diff] [blame]

675

const DataLayout *TD = getTargetMachine().getSubtargetImpl()->getDataLayout();

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

676

SDLoc DL(InitPtr);

Matt Arsenault

41aa27c

2014-06-14 04:26:01 +0000

[diff] [blame]

677

Type *InitTy = Init->getType();

678

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

679

if (const ConstantInt *CI = dyn_cast<ConstantInt>(Init)) {

Matt Arsenault

41aa27c

2014-06-14 04:26:01 +0000

[diff] [blame]

680

EVT VT = EVT::getEVT(InitTy);

681

PointerType *PtrTy = PointerType::get(InitTy, AMDGPUAS::PRIVATE_ADDRESS);

682

return DAG.getStore(Chain, DL, DAG.getConstant(*CI, VT), InitPtr,

683

MachinePointerInfo(UndefValue::get(PtrTy)), false, false,

684

TD->getPrefTypeAlignment(InitTy));

Matt Arsenault

2014-05-11 21:24:41 +0000

[diff] [blame]

685

}

686

687

if (const ConstantFP *CFP = dyn_cast<ConstantFP>(Init)) {

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

688

EVT VT = EVT::getEVT(CFP->getType());

689

PointerType *PtrTy = PointerType::get(CFP->getType(), 0);

690

return DAG.getStore(Chain, DL, DAG.getConstantFP(*CFP, VT), InitPtr,

691

MachinePointerInfo(UndefValue::get(PtrTy)), false, false,

692

TD->getPrefTypeAlignment(CFP->getType()));

Matt Arsenault

2014-05-11 21:24:41 +0000

[diff] [blame]

693

}

694

Matt Arsenault

2014-05-21 22:42:42 +0000

[diff] [blame]

695

if (StructType *ST = dyn_cast<StructType>(InitTy)) {

696

const StructLayout *SL = TD->getStructLayout(ST);

697

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

698

EVT PtrVT = InitPtr.getValueType();

Matt Arsenault

2014-05-21 22:42:42 +0000

[diff] [blame]

699

SmallVector<SDValue, 8> Chains;

700

701

for (unsigned I = 0, N = ST->getNumElements(); I != N; ++I) {

702

SDValue Offset = DAG.getConstant(SL->getElementOffset(I), PtrVT);

703

SDValue Ptr = DAG.getNode(ISD::ADD, DL, PtrVT, InitPtr, Offset);

704

705

Constant *Elt = Init->getAggregateElement(I);

706

Chains.push_back(LowerConstantInitializer(Elt, GV, Ptr, Chain, DAG));

707

}

708

709

return DAG.getNode(ISD::TokenFactor, DL, MVT::Other, Chains);

710

}

711

712

if (SequentialType *SeqTy = dyn_cast<SequentialType>(InitTy)) {

713

EVT PtrVT = InitPtr.getValueType();

714

715

unsigned NumElements;

716

if (ArrayType *AT = dyn_cast<ArrayType>(SeqTy))

717

NumElements = AT->getNumElements();

718

else if (VectorType *VT = dyn_cast<VectorType>(SeqTy))

719

NumElements = VT->getNumElements();

720

else

721

llvm_unreachable("Unexpected type");

722

723

unsigned EltSize = TD->getTypeAllocSize(SeqTy->getElementType());

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

724

SmallVector<SDValue, 8> Chains;

725

for (unsigned i = 0; i < NumElements; ++i) {

Matt Arsenault

2014-05-21 22:42:42 +0000

[diff] [blame]

726

SDValue Offset = DAG.getConstant(i * EltSize, PtrVT);

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

727

SDValue Ptr = DAG.getNode(ISD::ADD, DL, PtrVT, InitPtr, Offset);

Matt Arsenault

2014-05-21 22:42:42 +0000

[diff] [blame]

728

729

Constant *Elt = Init->getAggregateElement(i);

730

Chains.push_back(LowerConstantInitializer(Elt, GV, Ptr, Chain, DAG));

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

731

}

Matt Arsenault

2014-05-11 21:24:41 +0000

[diff] [blame]

732

Craig Topper

2014-04-26 18:35:24 +0000

[diff] [blame]

733

return DAG.getNode(ISD::TokenFactor, DL, MVT::Other, Chains);

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

734

}

Matt Arsenault

2014-05-11 21:24:41 +0000

[diff] [blame]

735

Matt Arsenault

2014-06-14 04:26:05 +0000

[diff] [blame]

736

if (isa<UndefValue>(Init)) {

737

EVT VT = EVT::getEVT(InitTy);

738

PointerType *PtrTy = PointerType::get(InitTy, AMDGPUAS::PRIVATE_ADDRESS);

739

return DAG.getStore(Chain, DL, DAG.getUNDEF(VT), InitPtr,

740

MachinePointerInfo(UndefValue::get(PtrTy)), false, false,

741

TD->getPrefTypeAlignment(InitTy));

742

}

743

Matt Arsenault

2014-05-11 21:24:41 +0000

[diff] [blame]

744

Init->dump();

745

llvm_unreachable("Unhandled constant initializer");

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

746

}

747

Matt Arsenault

cc8d3b8

2014-11-13 19:56:13 +0000

[diff] [blame]

748

static bool hasDefinedInitializer(const GlobalValue *GV) {

749

const GlobalVariable *GVar = dyn_cast<GlobalVariable>(GV);

750

if (!GVar || !GVar->hasInitializer())

751

return false;

752

753

if (isa<UndefValue>(GVar->getInitializer()))

return false;

return true;

}

Tom Stellard

2013-06-28 15:47:08 +0000

[diff] [blame]

759

SDValue AMDGPUTargetLowering::LowerGlobalAddress(AMDGPUMachineFunction* MFI,

760

SDValue Op,

761

SelectionDAG &DAG) const {

762

Eric Christopher

d913448

2014-08-04 21:25:23 +0000

[diff] [blame]

763

const DataLayout *TD = getTargetMachine().getSubtargetImpl()->getDataLayout();

Tom Stellard

2013-06-28 15:47:08 +0000

[diff] [blame]

764

GlobalAddressSDNode *G = cast<GlobalAddressSDNode>(Op);

Tom Stellard

2013-06-28 15:47:08 +0000

[diff] [blame]

765

const GlobalValue *GV = G->getGlobal();

Tom Stellard

2013-06-28 15:47:08 +0000

[diff] [blame]

766

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

767

switch (G->getAddressSpace()) {

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

768

case AMDGPUAS::LOCAL_ADDRESS: {

769

// XXX: What does the value of G->getOffset() mean?

770

assert(G->getOffset() == 0 &&

771

"Do not know what to do with an non-zero offset");

Tom Stellard

2013-06-28 15:47:08 +0000

[diff] [blame]

772

Matt Arsenault

cc8d3b8

2014-11-13 19:56:13 +0000

[diff] [blame]

773

// TODO: We could emit code to handle the initialization somewhere.

774

if (hasDefinedInitializer(GV))

775

break;

776

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

777

unsigned Offset;

778

if (MFI->LocalMemoryObjects.count(GV) == 0) {

779

uint64_t Size = TD->getTypeAllocSize(GV->getType()->getElementType());

780

Offset = MFI->LDSSize;

781

MFI->LocalMemoryObjects[GV] = Offset;

782

// XXX: Account for alignment?

783

MFI->LDSSize += Size;

784

} else {

785

Offset = MFI->LocalMemoryObjects[GV];

786

}

787

Matt Arsenault

329eda3

2014-08-04 16:55:35 +0000

[diff] [blame]

788

return DAG.getConstant(Offset, getPointerTy(AMDGPUAS::LOCAL_ADDRESS));

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

789

}

790

case AMDGPUAS::CONSTANT_ADDRESS: {

791

MachineFrameInfo *FrameInfo = DAG.getMachineFunction().getFrameInfo();

792

Type *EltType = GV->getType()->getElementType();

793

unsigned Size = TD->getTypeAllocSize(EltType);

794

unsigned Alignment = TD->getPrefTypeAlignment(EltType);

795

Matt Arsenault

2014-06-14 04:26:05 +0000

[diff] [blame]

796

MVT PrivPtrVT = getPointerTy(AMDGPUAS::PRIVATE_ADDRESS);

797

MVT ConstPtrVT = getPointerTy(AMDGPUAS::CONSTANT_ADDRESS);

798

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

799

int FI = FrameInfo->CreateStackObject(Size, Alignment, false);

Matt Arsenault

2014-06-14 04:26:05 +0000

[diff] [blame]

800

SDValue InitPtr = DAG.getFrameIndex(FI, PrivPtrVT);

801

802

const GlobalVariable *Var = cast<GlobalVariable>(GV);

803

if (!Var->hasInitializer()) {

804

// This has no use, but bugpoint will hit it.

805

return DAG.getZExtOrTrunc(InitPtr, SDLoc(Op), ConstPtrVT);

806

}

807

808

const Constant *Init = Var->getInitializer();

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

809

SmallVector<SDNode*, 8> WorkList;

810

811

for (SDNode::use_iterator I = DAG.getEntryNode()->use_begin(),

812

E = DAG.getEntryNode()->use_end(); I != E; ++I) {

813

if (I->getOpcode() != AMDGPUISD::REGISTER_LOAD && I->getOpcode() != ISD::LOAD)

814

continue;

815

WorkList.push_back(*I);

816

}

817

SDValue Chain = LowerConstantInitializer(Init, GV, InitPtr, DAG.getEntryNode(), DAG);

818

for (SmallVector<SDNode*, 8>::iterator I = WorkList.begin(),

819

E = WorkList.end(); I != E; ++I) {

820

SmallVector<SDValue, 8> Ops;

821

Ops.push_back(Chain);

822

for (unsigned i = 1; i < (*I)->getNumOperands(); ++i) {

823

Ops.push_back((*I)->getOperand(i));

824

}

Craig Topper

8c0b4d0

2014-04-28 05:57:50 +0000

[diff] [blame]

825

DAG.UpdateNodeOperands(*I, Ops);

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

826

}

Matt Arsenault

2014-06-14 04:26:05 +0000

[diff] [blame]

827

return DAG.getZExtOrTrunc(InitPtr, SDLoc(Op), ConstPtrVT);

Tom Stellard

2014-01-22 19:24:21 +0000

[diff] [blame]

828

}

829

}

Matt Arsenault

cc8d3b8

2014-11-13 19:56:13 +0000

[diff] [blame]

830

831

const Function &Fn = *DAG.getMachineFunction().getFunction();

832

DiagnosticInfoUnsupported BadInit(Fn,

833

"initializer for address space");

834

DAG.getContext()->diagnose(BadInit);

835

return SDValue();

Tom Stellard

2013-06-28 15:47:08 +0000

[diff] [blame]

836

}

837

Tom Stellard

2013-08-14 23:25:00 +0000

[diff] [blame]

838

SDValue AMDGPUTargetLowering::LowerCONCAT_VECTORS(SDValue Op,

839

SelectionDAG &DAG) const {

840

SmallVector<SDValue, 8> Args;

841

SDValue A = Op.getOperand(0);

842

SDValue B = Op.getOperand(1);

843

Matt Arsenault

9ec3cf2

2014-04-11 17:47:30 +0000

[diff] [blame]

844

DAG.ExtractVectorElements(A, Args);

845

DAG.ExtractVectorElements(B, Args);

Tom Stellard

2013-08-14 23:25:00 +0000

[diff] [blame]

846

Craig Topper

2014-04-26 18:35:24 +0000

[diff] [blame]

847

return DAG.getNode(ISD::BUILD_VECTOR, SDLoc(Op), Op.getValueType(), Args);

Tom Stellard

2013-08-14 23:25:00 +0000

[diff] [blame]

848

}

849

850

SDValue AMDGPUTargetLowering::LowerEXTRACT_SUBVECTOR(SDValue Op,

851

SelectionDAG &DAG) const {

852

853

SmallVector<SDValue, 8> Args;

Tom Stellard

2013-08-14 23:25:00 +0000

[diff] [blame]

854

unsigned Start = cast<ConstantSDNode>(Op.getOperand(1))->getZExtValue();

Matt Arsenault

9ec3cf2

2014-04-11 17:47:30 +0000

[diff] [blame]

855

EVT VT = Op.getValueType();

856

DAG.ExtractVectorElements(Op.getOperand(0), Args, Start,

857

VT.getVectorNumElements());

Tom Stellard

2013-08-14 23:25:00 +0000

[diff] [blame]

858

Craig Topper

2014-04-26 18:35:24 +0000

[diff] [blame]

859

return DAG.getNode(ISD::BUILD_VECTOR, SDLoc(Op), Op.getValueType(), Args);

Tom Stellard

2013-08-14 23:25:00 +0000

[diff] [blame]

860

}

861

Tom Stellard

2013-11-13 23:36:50 +0000

[diff] [blame]

862

SDValue AMDGPUTargetLowering::LowerFrameIndex(SDValue Op,

863

SelectionDAG &DAG) const {

864

865

MachineFunction &MF = DAG.getMachineFunction();

Eric Christopher

d913448

2014-08-04 21:25:23 +0000

[diff] [blame]

866

const AMDGPUFrameLowering *TFL = static_cast<const AMDGPUFrameLowering *>(

867

getTargetMachine().getSubtargetImpl()->getFrameLowering());

Tom Stellard

2013-11-13 23:36:50 +0000

[diff] [blame]

868

Matt Arsenault

10da3b2

2014-06-11 03:30:06 +0000

[diff] [blame]

869

FrameIndexSDNode *FIN = cast<FrameIndexSDNode>(Op);

Tom Stellard

2013-11-13 23:36:50 +0000

[diff] [blame]

870

871

unsigned FrameIndex = FIN->getIndex();

872

unsigned Offset = TFL->getFrameIndexOffset(MF, FrameIndex);

873

return DAG.getConstant(Offset * 4 * TFL->getStackWidth(MF),

874

Op.getValueType());

875

}

Tom Stellard

2013-08-14 23:25:00 +0000

[diff] [blame]

876

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

877

SDValue AMDGPUTargetLowering::LowerINTRINSIC_WO_CHAIN(SDValue Op,

878

SelectionDAG &DAG) const {

879

unsigned IntrinsicID = cast<ConstantSDNode>(Op.getOperand(0))->getZExtValue();

Andrew Trick

2013-05-25 02:42:55 +0000

[diff] [blame]

880

SDLoc DL(Op);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

881

EVT VT = Op.getValueType();

882

883

switch (IntrinsicID) {

884

default: return Op;

Matt Arsenault

2014-06-12 21:15:44 +0000

[diff] [blame]

885

case AMDGPUIntrinsic::AMDGPU_abs:

886

case AMDGPUIntrinsic::AMDIL_abs: // Legacy name.

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

887

return LowerIntrinsicIABS(Op, DAG);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

888

case AMDGPUIntrinsic::AMDGPU_lrp:

889

return LowerIntrinsicLRP(Op, DAG);

Matt Arsenault

2014-06-12 21:15:44 +0000

[diff] [blame]

890

case AMDGPUIntrinsic::AMDGPU_fract:

891

case AMDGPUIntrinsic::AMDIL_fraction: // Legacy name.

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

892

return DAG.getNode(AMDGPUISD::FRACT, DL, VT, Op.getOperand(1));

Matt Arsenault

2014-06-12 21:15:44 +0000

[diff] [blame]

893

894

case AMDGPUIntrinsic::AMDGPU_clamp:

895

case AMDGPUIntrinsic::AMDIL_clamp: // Legacy name.

896

return DAG.getNode(AMDGPUISD::CLAMP, DL, VT,

897

Op.getOperand(1), Op.getOperand(2), Op.getOperand(3));

898

Matt Arsenault

f2b0aeb

2014-06-23 18:28:28 +0000

[diff] [blame]

899

case Intrinsic::AMDGPU_div_scale: {

900

// 3rd parameter required to be a constant.

901

const ConstantSDNode *Param = dyn_cast<ConstantSDNode>(Op.getOperand(3));

902

if (!Param)

903

return DAG.getUNDEF(VT);

904

905

// Translate to the operands expected by the machine instruction. The

906

// first parameter must be the same as the first instruction.

907

SDValue Numerator = Op.getOperand(1);

908

SDValue Denominator = Op.getOperand(2);

Matt Arsenault

a276c3e

2014-09-26 17:55:09 +0000

[diff] [blame]

909

910

// Note this order is opposite of the machine instruction's operations,

911

// which is s0.f = Quotient, s1.f = Denominator, s2.f = Numerator. The

912

// intrinsic has the numerator as the first operand to match a normal

913

// division operation.

914

Matt Arsenault

f2b0aeb

2014-06-23 18:28:28 +0000

[diff] [blame]

915

SDValue Src0 = Param->isAllOnesValue() ? Numerator : Denominator;

916

Chandler Carruth

3de980d

2014-07-25 09:19:23 +0000

[diff] [blame]

917

return DAG.getNode(AMDGPUISD::DIV_SCALE, DL, Op->getVTList(), Src0,

918

Denominator, Numerator);

Matt Arsenault

f2b0aeb

2014-06-23 18:28:28 +0000

[diff] [blame]

919

}

Matt Arsenault

2014-06-19 01:19:19 +0000

[diff] [blame]

920

921

case Intrinsic::AMDGPU_div_fmas:

Matt Arsenault

75c658e

2014-10-21 22:20:55 +0000

[diff] [blame]

922

// FIXME: Dropping bool parameter. Work is needed to support the implicit

923

// read from VCC.

Matt Arsenault

2014-06-19 01:19:19 +0000

[diff] [blame]

924

return DAG.getNode(AMDGPUISD::DIV_FMAS, DL, VT,

925

Op.getOperand(1), Op.getOperand(2), Op.getOperand(3));

926

927

case Intrinsic::AMDGPU_div_fixup:

928

return DAG.getNode(AMDGPUISD::DIV_FIXUP, DL, VT,

929

Op.getOperand(1), Op.getOperand(2), Op.getOperand(3));

930

931

case Intrinsic::AMDGPU_trig_preop:

932

return DAG.getNode(AMDGPUISD::TRIG_PREOP, DL, VT,

933

Op.getOperand(1), Op.getOperand(2));

934

935

case Intrinsic::AMDGPU_rcp:

936

return DAG.getNode(AMDGPUISD::RCP, DL, VT, Op.getOperand(1));

937

938

case Intrinsic::AMDGPU_rsq:

939

return DAG.getNode(AMDGPUISD::RSQ, DL, VT, Op.getOperand(1));

940

Matt Arsenault

257d48d

2014-06-24 22:13:39 +0000

[diff] [blame]

941

case AMDGPUIntrinsic::AMDGPU_legacy_rsq:

942

return DAG.getNode(AMDGPUISD::RSQ_LEGACY, DL, VT, Op.getOperand(1));

943

944

case Intrinsic::AMDGPU_rsq_clamped:

Marek Olsak

be04780

2014-12-07 12:19:03 +0000

[diff] [blame]

945

if (Subtarget->getGeneration() >= AMDGPUSubtarget::VOLCANIC_ISLANDS) {

946

Type *Type = VT.getTypeForEVT(*DAG.getContext());

947

APFloat Max = APFloat::getLargest(Type->getFltSemantics());

948

APFloat Min = APFloat::getLargest(Type->getFltSemantics(), true);

949

950

SDValue Rsq = DAG.getNode(AMDGPUISD::RSQ, DL, VT, Op.getOperand(1));

951

SDValue Tmp = DAG.getNode(ISD::FMINNUM, DL, VT, Rsq,

952

DAG.getConstantFP(Max, VT));

953

return DAG.getNode(ISD::FMAXNUM, DL, VT, Tmp,

954

DAG.getConstantFP(Min, VT));

955

} else {

956

return DAG.getNode(AMDGPUISD::RSQ_CLAMPED, DL, VT, Op.getOperand(1));

957

}

Matt Arsenault

257d48d

2014-06-24 22:13:39 +0000

[diff] [blame]

958

Matt Arsenault

2e7cc48

2014-08-15 17:30:25 +0000

[diff] [blame]

959

case Intrinsic::AMDGPU_ldexp:

960

return DAG.getNode(AMDGPUISD::LDEXP, DL, VT, Op.getOperand(1),

961

Op.getOperand(2));

962

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

963

case AMDGPUIntrinsic::AMDGPU_imax:

964

return DAG.getNode(AMDGPUISD::SMAX, DL, VT, Op.getOperand(1),

965

Op.getOperand(2));

966

case AMDGPUIntrinsic::AMDGPU_umax:

967

return DAG.getNode(AMDGPUISD::UMAX, DL, VT, Op.getOperand(1),

968

Op.getOperand(2));

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

969

case AMDGPUIntrinsic::AMDGPU_imin:

970

return DAG.getNode(AMDGPUISD::SMIN, DL, VT, Op.getOperand(1),

971

Op.getOperand(2));

972

case AMDGPUIntrinsic::AMDGPU_umin:

973

return DAG.getNode(AMDGPUISD::UMIN, DL, VT, Op.getOperand(1),

974

Op.getOperand(2));

Matt Arsenault

4c53717

2014-03-31 18:21:18 +0000

[diff] [blame]

975

Matt Arsenault

62b1737

2014-05-12 17:49:57 +0000

[diff] [blame]

976

case AMDGPUIntrinsic::AMDGPU_umul24:

977

return DAG.getNode(AMDGPUISD::MUL_U24, DL, VT,

978

Op.getOperand(1), Op.getOperand(2));

979

980

case AMDGPUIntrinsic::AMDGPU_imul24:

981

return DAG.getNode(AMDGPUISD::MUL_I24, DL, VT,

982

Op.getOperand(1), Op.getOperand(2));

983

Matt Arsenault

eb26020

2014-05-22 18:00:15 +0000

[diff] [blame]

984

case AMDGPUIntrinsic::AMDGPU_umad24:

985

return DAG.getNode(AMDGPUISD::MAD_U24, DL, VT,

986

Op.getOperand(1), Op.getOperand(2), Op.getOperand(3));

987

988

case AMDGPUIntrinsic::AMDGPU_imad24:

989

return DAG.getNode(AMDGPUISD::MAD_I24, DL, VT,

990

Op.getOperand(1), Op.getOperand(2), Op.getOperand(3));

991

Matt Arsenault

364a674

2014-06-11 17:50:44 +0000

[diff] [blame]

992

case AMDGPUIntrinsic::AMDGPU_cvt_f32_ubyte0:

993

return DAG.getNode(AMDGPUISD::CVT_F32_UBYTE0, DL, VT, Op.getOperand(1));

994

995

case AMDGPUIntrinsic::AMDGPU_cvt_f32_ubyte1:

996

return DAG.getNode(AMDGPUISD::CVT_F32_UBYTE1, DL, VT, Op.getOperand(1));

997

998

case AMDGPUIntrinsic::AMDGPU_cvt_f32_ubyte2:

999

return DAG.getNode(AMDGPUISD::CVT_F32_UBYTE2, DL, VT, Op.getOperand(1));

1000

1001

case AMDGPUIntrinsic::AMDGPU_cvt_f32_ubyte3:

1002

return DAG.getNode(AMDGPUISD::CVT_F32_UBYTE3, DL, VT, Op.getOperand(1));

1003

Matt Arsenault

4c53717

2014-03-31 18:21:18 +0000

[diff] [blame]

1004

case AMDGPUIntrinsic::AMDGPU_bfe_i32:

1005

return DAG.getNode(AMDGPUISD::BFE_I32, DL, VT,

Op.getOperand(1),

Op.getOperand(2),

Op.getOperand(3));

case AMDGPUIntrinsic::AMDGPU_bfe_u32:

1011

return DAG.getNode(AMDGPUISD::BFE_U32, DL, VT,

Op.getOperand(1),

Op.getOperand(2),

Op.getOperand(3));

case AMDGPUIntrinsic::AMDGPU_bfi:

1017

return DAG.getNode(AMDGPUISD::BFI, DL, VT,

Op.getOperand(1),

Op.getOperand(2),

Op.getOperand(3));

case AMDGPUIntrinsic::AMDGPU_bfm:

1023

return DAG.getNode(AMDGPUISD::BFM, DL, VT,

Op.getOperand(1),

Op.getOperand(2));

Matt Arsenault

2014-06-18 17:13:57 +0000

[diff] [blame]

1027

case AMDGPUIntrinsic::AMDGPU_brev:

1028

return DAG.getNode(AMDGPUISD::BREV, DL, VT, Op.getOperand(1));

1029

Matt Arsenault

4831ce5

2015-01-06 23:00:37 +0000

[diff] [blame]

1030

case Intrinsic::AMDGPU_class:

1031

return DAG.getNode(AMDGPUISD::FP_CLASS, DL, VT,

1032

Op.getOperand(1), Op.getOperand(2));

1033

Matt Arsenault

2014-06-12 21:15:44 +0000

[diff] [blame]

1034

case AMDGPUIntrinsic::AMDIL_exp: // Legacy name.

1035

return DAG.getNode(ISD::FEXP2, DL, VT, Op.getOperand(1));

1036

1037

case AMDGPUIntrinsic::AMDIL_round_nearest: // Legacy name.

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1038

return DAG.getNode(ISD::FRINT, DL, VT, Op.getOperand(1));

Tom Stellard

e9219e0

2014-07-02 20:53:57 +0000

[diff] [blame]

1039

case AMDGPUIntrinsic::AMDGPU_trunc: // Legacy name.

Tom Stellard

9c603eb

2014-06-20 17:06:09 +0000

[diff] [blame]

1040

return DAG.getNode(ISD::FTRUNC, DL, VT, Op.getOperand(1));

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

}

}

///IABS(a) = SMAX(sub(0, a), a)

1045

SDValue AMDGPUTargetLowering::LowerIntrinsicIABS(SDValue Op,

Matt Arsenault

2014-05-11 21:24:41 +0000

[diff] [blame]

1046

SelectionDAG &DAG) const {

Andrew Trick

2013-05-25 02:42:55 +0000

[diff] [blame]

1047

SDLoc DL(Op);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1048

EVT VT = Op.getValueType();

1049

SDValue Neg = DAG.getNode(ISD::SUB, DL, VT, DAG.getConstant(0, VT),

1050

Op.getOperand(1));

1051

1052

return DAG.getNode(AMDGPUISD::SMAX, DL, VT, Neg, Op.getOperand(1));

1053

}

1054

1055

/// Linear Interpolation

1056

/// LRP(a, b, c) = muladd(a, b, (1 - a) * c)

1057

SDValue AMDGPUTargetLowering::LowerIntrinsicLRP(SDValue Op,

Matt Arsenault

2014-05-11 21:24:41 +0000

[diff] [blame]

1058

SelectionDAG &DAG) const {

Andrew Trick

2013-05-25 02:42:55 +0000

[diff] [blame]

1059

SDLoc DL(Op);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1060

EVT VT = Op.getValueType();

1061

SDValue OneSubA = DAG.getNode(ISD::FSUB, DL, VT,

1062

DAG.getConstantFP(1.0f, MVT::f32),

1063

Op.getOperand(1));

1064

SDValue OneSubAC = DAG.getNode(ISD::FMUL, DL, VT, OneSubA,

1065

Op.getOperand(3));

Vincent Lejeune

1ce13f5

2013-02-18 14:11:28 +0000

[diff] [blame]

1066

return DAG.getNode(ISD::FADD, DL, VT,

1067

DAG.getNode(ISD::FMUL, DL, VT, Op.getOperand(1), Op.getOperand(2)),

1068

OneSubAC);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1069

}

1070

1071

/// \brief Generate Min/Max node

Matt Arsenault

2014-12-12 02:30:37 +0000

[diff] [blame]

1072

SDValue AMDGPUTargetLowering::CombineFMinMaxLegacy(SDLoc DL,

EVT VT,

SDValue LHS,

SDValue RHS,

SDValue True,

SDValue False,

SDValue CC,

DAGCombinerInfo &DCI) const {

1080

if (Subtarget->getGeneration() >= AMDGPUSubtarget::VOLCANIC_ISLANDS)

1081

return SDValue();

1082

Matt Arsenault

2014-11-13 23:03:09 +0000

[diff] [blame]

1083

if (!(LHS == True && RHS == False) && !(LHS == False && RHS == True))

1084

return SDValue();

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1085

Matt Arsenault

2014-12-12 02:30:37 +0000

[diff] [blame]

1086

SelectionDAG &DAG = DCI.DAG;

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1087

ISD::CondCode CCOpcode = cast<CondCodeSDNode>(CC)->get();

switch (CCOpcode) {

case ISD::SETOEQ:

case ISD::SETONE:

case ISD::SETUNE:

case ISD::SETNE:

case ISD::SETUEQ:

case ISD::SETEQ:

case ISD::SETFALSE:

case ISD::SETFALSE2:

case ISD::SETTRUE:

case ISD::SETTRUE2:

case ISD::SETUO:

case ISD::SETO:

Matt Arsenault

2014-11-13 23:03:09 +0000

[diff] [blame]

1101

break;

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1102

case ISD::SETULE:

Matt Arsenault

2014-12-12 02:30:37 +0000

[diff] [blame]

1103

case ISD::SETULT: {

Matt Arsenault

2014-12-12 02:30:37 +0000

[diff] [blame]

1104

if (LHS == True)

1105

return DAG.getNode(AMDGPUISD::FMIN_LEGACY, DL, VT, RHS, LHS);

1106

return DAG.getNode(AMDGPUISD::FMAX_LEGACY, DL, VT, LHS, RHS);

1107

}

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

case ISD::SETOLE:

case ISD::SETOLT:

case ISD::SETLE:

case ISD::SETLT: {

Matt Arsenault

2014-12-12 02:30:37 +0000

[diff] [blame]

1112

// Ordered. Assume ordered for undefined.

1113

1114

// Only do this after legalization to avoid interfering with other combines

1115

// which might occur.

1116

if (DCI.getDAGCombineLevel() < AfterLegalizeDAG &&

1117

!DCI.isCalledByLegalizer())

1118

return SDValue();

Marek Olsak

be04780

2014-12-07 12:19:03 +0000

[diff] [blame]

1119

Matt Arsenault

36094d7

2014-11-15 05:02:57 +0000

[diff] [blame]

1120

// We need to permute the operands to get the correct NaN behavior. The

1121

// selected operand is the second one based on the failing compare with NaN,

1122

// so permute it based on the compare type the hardware uses.

1123

if (LHS == True)

Matt Arsenault

2014-12-12 02:30:37 +0000

[diff] [blame]

1124

return DAG.getNode(AMDGPUISD::FMIN_LEGACY, DL, VT, LHS, RHS);

1125

return DAG.getNode(AMDGPUISD::FMAX_LEGACY, DL, VT, RHS, LHS);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1126

}

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1127

case ISD::SETUGE:

Matt Arsenault

2014-12-12 02:30:37 +0000

[diff] [blame]

1128

case ISD::SETUGT: {

Matt Arsenault

36094d7

2014-11-15 05:02:57 +0000

[diff] [blame]

1129

if (LHS == True)

1130

return DAG.getNode(AMDGPUISD::FMAX_LEGACY, DL, VT, RHS, LHS);

1131

return DAG.getNode(AMDGPUISD::FMIN_LEGACY, DL, VT, LHS, RHS);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1132

}

Matt Arsenault

2014-12-12 02:30:37 +0000

[diff] [blame]

case ISD::SETGT:

case ISD::SETGE:

case ISD::SETOGE:

case ISD::SETOGT: {

if (DCI.getDAGCombineLevel() < AfterLegalizeDAG &&

1138

!DCI.isCalledByLegalizer())

return SDValue();

if (LHS == True)

return DAG.getNode(AMDGPUISD::FMAX_LEGACY, DL, VT, LHS, RHS);

1143

return DAG.getNode(AMDGPUISD::FMIN_LEGACY, DL, VT, RHS, LHS);

1144

}

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1145

case ISD::SETCC_INVALID:

Matt Arsenault

eaa3a7e

2013-12-10 21:37:42 +0000

[diff] [blame]

1146

llvm_unreachable("Invalid setcc condcode!");

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1147

}

Tom Stellard

afa8b53

2014-05-09 16:42:16 +0000

[diff] [blame]

1148

return SDValue();

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1149

}

1150

Matt Arsenault

d28a7fd

2014-11-14 18:30:06 +0000

[diff] [blame]

1151

/// \brief Generate Min/Max node

1152

SDValue AMDGPUTargetLowering::CombineIMinMax(SDLoc DL,

EVT VT,

SDValue LHS,

SDValue RHS,

SDValue True,

SDValue False,

SDValue CC,

SelectionDAG &DAG) const {

1160

if (!(LHS == True && RHS == False) && !(LHS == False && RHS == True))

1161

return SDValue();

1162

1163

ISD::CondCode CCOpcode = cast<CondCodeSDNode>(CC)->get();

switch (CCOpcode) {

case ISD::SETULE:

case ISD::SETULT: {

unsigned Opc = (LHS == True) ? AMDGPUISD::UMIN : AMDGPUISD::UMAX;

1168

return DAG.getNode(Opc, DL, VT, LHS, RHS);

}

case ISD::SETLE:

case ISD::SETLT: {

unsigned Opc = (LHS == True) ? AMDGPUISD::SMIN : AMDGPUISD::SMAX;

1173

return DAG.getNode(Opc, DL, VT, LHS, RHS);

}

case ISD::SETGT:

case ISD::SETGE: {

unsigned Opc = (LHS == True) ? AMDGPUISD::SMAX : AMDGPUISD::SMIN;

1178

return DAG.getNode(Opc, DL, VT, LHS, RHS);

}

case ISD::SETUGE:

case ISD::SETUGT: {

unsigned Opc = (LHS == True) ? AMDGPUISD::UMAX : AMDGPUISD::UMIN;

1183

return DAG.getNode(Opc, DL, VT, LHS, RHS);

}

default:

return SDValue();

}

}

Matt Arsenault

2014-07-24 17:10:35 +0000

[diff] [blame]

1190

SDValue AMDGPUTargetLowering::ScalarizeVectorLoad(const SDValue Op,

1191

SelectionDAG &DAG) const {

1192

LoadSDNode *Load = cast<LoadSDNode>(Op);

1193

EVT MemVT = Load->getMemoryVT();

1194

EVT MemEltVT = MemVT.getVectorElementType();

1195

Matt Arsenault

2014-07-07 18:34:45 +0000

[diff] [blame]

1196

EVT LoadVT = Op.getValueType();

Matt Arsenault

2014-07-24 17:10:35 +0000

[diff] [blame]

1197

EVT EltVT = LoadVT.getVectorElementType();

Tom Stellard

2013-08-26 15:06:04 +0000

[diff] [blame]

1198

EVT PtrVT = Load->getBasePtr().getValueType();

Matt Arsenault

2014-07-07 18:34:45 +0000

[diff] [blame]

1199

Tom Stellard

2013-08-26 15:06:04 +0000

[diff] [blame]

1200

unsigned NumElts = Load->getMemoryVT().getVectorNumElements();

1201

SmallVector<SDValue, 8> Loads;

Matt Arsenault

2014-07-07 18:34:45 +0000

[diff] [blame]

1202

SmallVector<SDValue, 8> Chains;

1203

Tom Stellard

2013-08-26 15:06:04 +0000

[diff] [blame]

1204

SDLoc SL(Op);

Matt Arsenault

2014-07-24 17:10:35 +0000

[diff] [blame]

1205

unsigned MemEltSize = MemEltVT.getStoreSize();

1206

MachinePointerInfo SrcValue(Load->getMemOperand()->getValue());

Tom Stellard

2013-08-26 15:06:04 +0000

[diff] [blame]

1207

Matt Arsenault

2014-07-24 17:10:35 +0000

[diff] [blame]

1208

for (unsigned i = 0; i < NumElts; ++i) {

Tom Stellard

2013-08-26 15:06:04 +0000

[diff] [blame]

1209

SDValue Ptr = DAG.getNode(ISD::ADD, SL, PtrVT, Load->getBasePtr(),

Matt Arsenault

2014-07-24 17:10:35 +0000

[diff] [blame]

1210

DAG.getConstant(i * MemEltSize, PtrVT));

Matt Arsenault

2014-07-07 18:34:45 +0000

[diff] [blame]

1211

1212

SDValue NewLoad

1213

= DAG.getExtLoad(Load->getExtensionType(), SL, EltVT,

1214

Load->getChain(), Ptr,

Matt Arsenault

2014-07-24 17:10:35 +0000

[diff] [blame]

1215

SrcValue.getWithOffset(i * MemEltSize),

Matt Arsenault

2014-07-07 18:34:45 +0000

[diff] [blame]

1216

MemEltVT, Load->isVolatile(), Load->isNonTemporal(),

Louis Gerbarg

67474e3

2014-07-31 21:45:05 +0000

[diff] [blame]

1217

Load->isInvariant(), Load->getAlignment());

Matt Arsenault

2014-07-07 18:34:45 +0000

[diff] [blame]

1218

Loads.push_back(NewLoad.getValue(0));

1219

Chains.push_back(NewLoad.getValue(1));

Tom Stellard

2013-08-26 15:06:04 +0000

[diff] [blame]

1220

}

Matt Arsenault

2014-07-07 18:34:45 +0000

[diff] [blame]

1221

1222

SDValue Ops[] = {

1223

DAG.getNode(ISD::BUILD_VECTOR, SL, LoadVT, Loads),

1224

DAG.getNode(ISD::TokenFactor, SL, MVT::Other, Chains)

1225

};

1226

1227

return DAG.getMergeValues(Ops, SL);

Tom Stellard

2013-08-26 15:06:04 +0000

[diff] [blame]

1228

}

1229

Matt Arsenault

2014-07-24 17:10:35 +0000

[diff] [blame]

1230

SDValue AMDGPUTargetLowering::SplitVectorLoad(const SDValue Op,

1231

SelectionDAG &DAG) const {

1232

EVT VT = Op.getValueType();

1233

1234

// If this is a 2 element vector, we really want to scalarize and not create

1235

// weird 1 element vectors.

1236

if (VT.getVectorNumElements() == 2)

1237

return ScalarizeVectorLoad(Op, DAG);

1238

1239

LoadSDNode *Load = cast<LoadSDNode>(Op);

1240

SDValue BasePtr = Load->getBasePtr();

1241

EVT PtrVT = BasePtr.getValueType();

1242

EVT MemVT = Load->getMemoryVT();

1243

SDLoc SL(Op);

1244

MachinePointerInfo SrcValue(Load->getMemOperand()->getValue());

1245

1246

EVT LoVT, HiVT;

1247

EVT LoMemVT, HiMemVT;

1248

SDValue Lo, Hi;

1249

1250

std::tie(LoVT, HiVT) = DAG.GetSplitDestVTs(VT);

1251

std::tie(LoMemVT, HiMemVT) = DAG.GetSplitDestVTs(MemVT);

1252

std::tie(Lo, Hi) = DAG.SplitVector(Op, SL, LoVT, HiVT);

1253

SDValue LoLoad

1254

= DAG.getExtLoad(Load->getExtensionType(), SL, LoVT,

1255

Load->getChain(), BasePtr,

1256

SrcValue,

1257

LoMemVT, Load->isVolatile(), Load->isNonTemporal(),

Louis Gerbarg

67474e3

2014-07-31 21:45:05 +0000

[diff] [blame]

1258

Load->isInvariant(), Load->getAlignment());

Matt Arsenault

2014-07-24 17:10:35 +0000

[diff] [blame]

1259

1260

SDValue HiPtr = DAG.getNode(ISD::ADD, SL, PtrVT, BasePtr,

1261

DAG.getConstant(LoMemVT.getStoreSize(), PtrVT));

1262

1263

SDValue HiLoad

1264

= DAG.getExtLoad(Load->getExtensionType(), SL, HiVT,

1265

Load->getChain(), HiPtr,

1266

SrcValue.getWithOffset(LoMemVT.getStoreSize()),

1267

HiMemVT, Load->isVolatile(), Load->isNonTemporal(),

Louis Gerbarg

67474e3

2014-07-31 21:45:05 +0000

[diff] [blame]

1268

Load->isInvariant(), Load->getAlignment());

Matt Arsenault

2014-07-24 17:10:35 +0000

[diff] [blame]

1269

1270

SDValue Ops[] = {

1271

DAG.getNode(ISD::CONCAT_VECTORS, SL, VT, LoLoad, HiLoad),

1272

DAG.getNode(ISD::TokenFactor, SL, MVT::Other,

1273

LoLoad.getValue(1), HiLoad.getValue(1))

1274

};

1275

1276

return DAG.getMergeValues(Ops, SL);

1277

}

1278

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

1279

SDValue AMDGPUTargetLowering::MergeVectorStore(const SDValue &Op,

1280

SelectionDAG &DAG) const {

Matt Arsenault

10da3b2

2014-06-11 03:30:06 +0000

[diff] [blame]

1281

StoreSDNode *Store = cast<StoreSDNode>(Op);

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

1282

EVT MemVT = Store->getMemoryVT();

1283

unsigned MemBits = MemVT.getSizeInBits();

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1284

Matt Arsenault

ca6dcfc

2014-03-05 21:47:22 +0000

[diff] [blame]

1285

// Byte stores are really expensive, so if possible, try to pack 32-bit vector

1286

// truncating store into an i32 store.

1287

// XXX: We could also handle optimize other vector bitwidths.

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

1288

if (!MemVT.isVector() || MemBits > 32) {

return SDValue();

}

SDLoc DL(Op);

Matt Arsenault

2014-04-22 04:11:14 +0000

[diff] [blame]

1293

SDValue Value = Store->getValue();

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

1294

EVT VT = Value.getValueType();

Matt Arsenault

2014-04-22 04:11:14 +0000

[diff] [blame]

1295

EVT ElemVT = VT.getVectorElementType();

1296

SDValue Ptr = Store->getBasePtr();

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

1297

EVT MemEltVT = MemVT.getVectorElementType();

1298

unsigned MemEltBits = MemEltVT.getSizeInBits();

1299

unsigned MemNumElements = MemVT.getVectorNumElements();

Matt Arsenault

2014-04-22 04:11:14 +0000

[diff] [blame]

1300

unsigned PackedSize = MemVT.getStoreSizeInBits();

1301

SDValue Mask = DAG.getConstant((1 << MemEltBits) - 1, MVT::i32);

1302

1303

assert(Value.getValueType().getScalarSizeInBits() >= 32);

Matt Arsenault

0211714

2014-03-11 01:38:53 +0000

[diff] [blame]

1304

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

1305

SDValue PackedValue;

1306

for (unsigned i = 0; i < MemNumElements; ++i) {

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

1307

SDValue Elt = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, DL, ElemVT, Value,

1308

DAG.getConstant(i, MVT::i32));

Matt Arsenault

2014-04-22 04:11:14 +0000

[diff] [blame]

1309

Elt = DAG.getZExtOrTrunc(Elt, DL, MVT::i32);

1310

Elt = DAG.getNode(ISD::AND, DL, MVT::i32, Elt, Mask); // getZeroExtendInReg

1311

1312

SDValue Shift = DAG.getConstant(MemEltBits * i, MVT::i32);

1313

Elt = DAG.getNode(ISD::SHL, DL, MVT::i32, Elt, Shift);

1314

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

1315

if (i == 0) {

1316

PackedValue = Elt;

1317

} else {

Matt Arsenault

2014-04-22 04:11:14 +0000

[diff] [blame]

1318

PackedValue = DAG.getNode(ISD::OR, DL, MVT::i32, PackedValue, Elt);

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

1319

}

1320

}

Matt Arsenault

2014-04-22 04:11:14 +0000

[diff] [blame]

1321

1322

if (PackedSize < 32) {

1323

EVT PackedVT = EVT::getIntegerVT(*DAG.getContext(), PackedSize);

1324

return DAG.getTruncStore(Store->getChain(), DL, PackedValue, Ptr,

1325

Store->getMemOperand()->getPointerInfo(),

1326

PackedVT,

1327

Store->isNonTemporal(), Store->isVolatile(),

1328

Store->getAlignment());

1329

}

1330

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

1331

return DAG.getStore(Store->getChain(), DL, PackedValue, Ptr,

Matt Arsenault

2014-04-22 04:11:14 +0000

[diff] [blame]

1332

Store->getMemOperand()->getPointerInfo(),

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

1333

Store->isVolatile(), Store->isNonTemporal(),

1334

Store->getAlignment());

1335

}

1336

Matt Arsenault

2014-07-24 17:10:35 +0000

[diff] [blame]

1337

SDValue AMDGPUTargetLowering::ScalarizeVectorStore(SDValue Op,

1338

SelectionDAG &DAG) const {

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

1339

StoreSDNode *Store = cast<StoreSDNode>(Op);

1340

EVT MemEltVT = Store->getMemoryVT().getVectorElementType();

1341

EVT EltVT = Store->getValue().getValueType().getVectorElementType();

1342

EVT PtrVT = Store->getBasePtr().getValueType();

1343

unsigned NumElts = Store->getMemoryVT().getVectorNumElements();

1344

SDLoc SL(Op);

1345

1346

SmallVector<SDValue, 8> Chains;

1347

Matt Arsenault

2014-07-24 17:10:35 +0000

[diff] [blame]

1348

unsigned EltSize = MemEltVT.getStoreSize();

1349

MachinePointerInfo SrcValue(Store->getMemOperand()->getValue());

1350

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

1351

for (unsigned i = 0, e = NumElts; i != e; ++i) {

1352

SDValue Val = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, SL, EltVT,

Matt Arsenault

2014-07-24 17:10:35 +0000

[diff] [blame]

1353

Store->getValue(),

1354

DAG.getConstant(i, MVT::i32));

1355

1356

SDValue Offset = DAG.getConstant(i * MemEltVT.getStoreSize(), PtrVT);

1357

SDValue Ptr = DAG.getNode(ISD::ADD, SL, PtrVT, Store->getBasePtr(), Offset);

1358

SDValue NewStore =

1359

DAG.getTruncStore(Store->getChain(), SL, Val, Ptr,

1360

SrcValue.getWithOffset(i * EltSize),

1361

MemEltVT, Store->isNonTemporal(), Store->isVolatile(),

1362

Store->getAlignment());

1363

Chains.push_back(NewStore);

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

1364

}

Matt Arsenault

2014-07-24 17:10:35 +0000

[diff] [blame]

1365

Craig Topper

2014-04-26 18:35:24 +0000

[diff] [blame]

1366

return DAG.getNode(ISD::TokenFactor, SL, MVT::Other, Chains);

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

1367

}

1368

Matt Arsenault

2014-07-24 17:10:35 +0000

[diff] [blame]

1369

SDValue AMDGPUTargetLowering::SplitVectorStore(SDValue Op,

1370

SelectionDAG &DAG) const {

1371

StoreSDNode *Store = cast<StoreSDNode>(Op);

1372

SDValue Val = Store->getValue();

1373

EVT VT = Val.getValueType();

1374

1375

// If this is a 2 element vector, we really want to scalarize and not create

1376

// weird 1 element vectors.

1377

if (VT.getVectorNumElements() == 2)

1378

return ScalarizeVectorStore(Op, DAG);

1379

1380

EVT MemVT = Store->getMemoryVT();

1381

SDValue Chain = Store->getChain();

1382

SDValue BasePtr = Store->getBasePtr();

SDLoc SL(Op);

EVT LoVT, HiVT;

EVT LoMemVT, HiMemVT;

1387

SDValue Lo, Hi;

1388

1389

std::tie(LoVT, HiVT) = DAG.GetSplitDestVTs(VT);

1390

std::tie(LoMemVT, HiMemVT) = DAG.GetSplitDestVTs(MemVT);

1391

std::tie(Lo, Hi) = DAG.SplitVector(Val, SL, LoVT, HiVT);

1392

1393

EVT PtrVT = BasePtr.getValueType();

1394

SDValue HiPtr = DAG.getNode(ISD::ADD, SL, PtrVT, BasePtr,

1395

DAG.getConstant(LoMemVT.getStoreSize(), PtrVT));

1396

1397

MachinePointerInfo SrcValue(Store->getMemOperand()->getValue());

1398

SDValue LoStore

1399

= DAG.getTruncStore(Chain, SL, Lo,

BasePtr,

SrcValue,

LoMemVT,

Store->isNonTemporal(),

1404

Store->isVolatile(),

1405

Store->getAlignment());

1406

SDValue HiStore

1407

= DAG.getTruncStore(Chain, SL, Hi,

1408

HiPtr,

1409

SrcValue.getWithOffset(LoMemVT.getStoreSize()),

1410

HiMemVT,

1411

Store->isNonTemporal(),

1412

Store->isVolatile(),

1413

Store->getAlignment());

1414

1415

return DAG.getNode(ISD::TokenFactor, SL, MVT::Other, LoStore, HiStore);

}

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

1419

SDValue AMDGPUTargetLowering::LowerLOAD(SDValue Op, SelectionDAG &DAG) const {

1420

SDLoc DL(Op);

1421

LoadSDNode *Load = cast<LoadSDNode>(Op);

1422

ISD::LoadExtType ExtType = Load->getExtensionType();

Matt Arsenault

f9a995d

2014-03-06 17:34:12 +0000

[diff] [blame]

1423

EVT VT = Op.getValueType();

1424

EVT MemVT = Load->getMemoryVT();

1425

Matt Arsenault

470acd8

2014-04-15 22:28:39 +0000

[diff] [blame]

1426

if (ExtType == ISD::NON_EXTLOAD && VT.getSizeInBits() < 32) {

1427

assert(VT == MVT::i1 && "Only i1 non-extloads expected");

1428

// FIXME: Copied from PPC

1429

// First, load into 32 bits, then truncate to 1 bit.

1430

1431

SDValue Chain = Load->getChain();

1432

SDValue BasePtr = Load->getBasePtr();

1433

MachineMemOperand *MMO = Load->getMemOperand();

1434

1435

SDValue NewLD = DAG.getExtLoad(ISD::EXTLOAD, DL, MVT::i32, Chain,

1436

BasePtr, MVT::i8, MMO);

Matt Arsenault

2014-07-07 18:34:45 +0000

[diff] [blame]

1437

1438

SDValue Ops[] = {

1439

DAG.getNode(ISD::TRUNCATE, DL, VT, NewLD),

NewLD.getValue(1)

};

return DAG.getMergeValues(Ops, DL);

Matt Arsenault

470acd8

2014-04-15 22:28:39 +0000

[diff] [blame]

1444

}

1445

Tom Stellard

b37f797

2014-08-05 14:40:52 +0000

[diff] [blame]

1446

if (Subtarget->getGeneration() >= AMDGPUSubtarget::SOUTHERN_ISLANDS ||

1447

Load->getAddressSpace() != AMDGPUAS::PRIVATE_ADDRESS ||

Tom Stellard

4973a13

2014-08-01 21:55:50 +0000

[diff] [blame]

1448

ExtType == ISD::NON_EXTLOAD || Load->getMemoryVT().bitsGE(MVT::i32))

return SDValue();

SDValue Ptr = DAG.getNode(ISD::SRL, DL, MVT::i32, Load->getBasePtr(),

1453

DAG.getConstant(2, MVT::i32));

1454

SDValue Ret = DAG.getNode(AMDGPUISD::REGISTER_LOAD, DL, Op.getValueType(),

1455

Load->getChain(), Ptr,

1456

DAG.getTargetConstant(0, MVT::i32),

1457

Op.getOperand(2));

1458

SDValue ByteIdx = DAG.getNode(ISD::AND, DL, MVT::i32,

1459

Load->getBasePtr(),

1460

DAG.getConstant(0x3, MVT::i32));

1461

SDValue ShiftAmt = DAG.getNode(ISD::SHL, DL, MVT::i32, ByteIdx,

1462

DAG.getConstant(3, MVT::i32));

1463

1464

Ret = DAG.getNode(ISD::SRL, DL, MVT::i32, Ret, ShiftAmt);

1465

1466

EVT MemEltVT = MemVT.getScalarType();

1467

if (ExtType == ISD::SEXTLOAD) {

1468

SDValue MemEltVTNode = DAG.getValueType(MemEltVT);

1469

1470

SDValue Ops[] = {

1471

DAG.getNode(ISD::SIGN_EXTEND_INREG, DL, MVT::i32, Ret, MemEltVTNode),

Load->getChain()

};

return DAG.getMergeValues(Ops, DL);

}

SDValue Ops[] = {

DAG.getZeroExtendInReg(Ret, DL, MemEltVT),

Load->getChain()

};

return DAG.getMergeValues(Ops, DL);

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

1484

}

1485

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

1486

SDValue AMDGPUTargetLowering::LowerSTORE(SDValue Op, SelectionDAG &DAG) const {

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

1487

SDLoc DL(Op);

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

1488

SDValue Result = AMDGPUTargetLowering::MergeVectorStore(Op, DAG);

1489

if (Result.getNode()) {

return Result;

}

StoreSDNode *Store = cast<StoreSDNode>(Op);

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

1494

SDValue Chain = Store->getChain();

Tom Stellard

2013-11-13 23:36:50 +0000

[diff] [blame]

1495

if ((Store->getAddressSpace() == AMDGPUAS::LOCAL_ADDRESS ||

1496

Store->getAddressSpace() == AMDGPUAS::PRIVATE_ADDRESS) &&

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

1497

Store->getValue().getValueType().isVector()) {

Matt Arsenault

2014-07-24 17:10:35 +0000

[diff] [blame]

1498

return ScalarizeVectorStore(Op, DAG);

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

1499

}

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

1500

Matt Arsenault

2014-03-15 00:08:22 +0000

[diff] [blame]

1501

EVT MemVT = Store->getMemoryVT();

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

1502

if (Store->getAddressSpace() == AMDGPUAS::PRIVATE_ADDRESS &&

Matt Arsenault

2014-03-15 00:08:22 +0000

[diff] [blame]

1503

MemVT.bitsLT(MVT::i32)) {

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

1504

unsigned Mask = 0;

1505

if (Store->getMemoryVT() == MVT::i8) {

1506

Mask = 0xff;

1507

} else if (Store->getMemoryVT() == MVT::i16) {

1508

Mask = 0xffff;

1509

}

Matt Arsenault

2014-03-15 00:08:26 +0000

[diff] [blame]

1510

SDValue BasePtr = Store->getBasePtr();

1511

SDValue Ptr = DAG.getNode(ISD::SRL, DL, MVT::i32, BasePtr,

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

1512

DAG.getConstant(2, MVT::i32));

1513

SDValue Dst = DAG.getNode(AMDGPUISD::REGISTER_LOAD, DL, MVT::i32,

1514

Chain, Ptr, DAG.getTargetConstant(0, MVT::i32));

Matt Arsenault

2014-03-15 00:08:26 +0000

[diff] [blame]

1515

1516

SDValue ByteIdx = DAG.getNode(ISD::AND, DL, MVT::i32, BasePtr,

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

1517

DAG.getConstant(0x3, MVT::i32));

Matt Arsenault

2014-03-15 00:08:26 +0000

[diff] [blame]

1518

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

1519

SDValue ShiftAmt = DAG.getNode(ISD::SHL, DL, MVT::i32, ByteIdx,

1520

DAG.getConstant(3, MVT::i32));

Matt Arsenault

2014-03-15 00:08:26 +0000

[diff] [blame]

1521

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

1522

SDValue SExtValue = DAG.getNode(ISD::SIGN_EXTEND, DL, MVT::i32,

1523

Store->getValue());

Matt Arsenault

2014-03-15 00:08:22 +0000

[diff] [blame]

1524

1525

SDValue MaskedValue = DAG.getZeroExtendInReg(SExtValue, DL, MemVT);

1526

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

1527

SDValue ShiftedValue = DAG.getNode(ISD::SHL, DL, MVT::i32,

1528

MaskedValue, ShiftAmt);

Matt Arsenault

2014-03-15 00:08:22 +0000

[diff] [blame]

1529

Tom Stellard

2014-01-22 19:24:14 +0000

[diff] [blame]

1530

SDValue DstMask = DAG.getNode(ISD::SHL, DL, MVT::i32, DAG.getConstant(Mask, MVT::i32),

1531

ShiftAmt);

1532

DstMask = DAG.getNode(ISD::XOR, DL, MVT::i32, DstMask,

1533

DAG.getConstant(0xffffffff, MVT::i32));

1534

Dst = DAG.getNode(ISD::AND, DL, MVT::i32, Dst, DstMask);

1535

1536

SDValue Value = DAG.getNode(ISD::OR, DL, MVT::i32, Dst, ShiftedValue);

1537

return DAG.getNode(AMDGPUISD::REGISTER_STORE, DL, MVT::Other,

1538

Chain, Value, Ptr, DAG.getTargetConstant(0, MVT::i32));

1539

}

Tom Stellard

2013-08-26 15:05:44 +0000

[diff] [blame]

1540

return SDValue();

1541

}

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1542

Matt Arsenault

2014-07-24 06:59:20 +0000

[diff] [blame]

1543

// This is a shortcut for integer division because we have fast i32<->f32

1544

// conversions, and fast f32 reciprocal instructions. The fractional part of a

1545

// float is enough to accurately represent up to a 24-bit integer.

Jan Vesely

2014-08-12 17:31:20 +0000

[diff] [blame]

1546

SDValue AMDGPUTargetLowering::LowerDIVREM24(SDValue Op, SelectionDAG &DAG, bool sign) const {

Matt Arsenault

2014-06-15 20:08:02 +0000

[diff] [blame]

1547

SDLoc DL(Op);

Matt Arsenault

2014-07-24 06:59:20 +0000

[diff] [blame]

1548

EVT VT = Op.getValueType();

Matt Arsenault

2014-06-15 20:08:02 +0000

[diff] [blame]

1549

SDValue LHS = Op.getOperand(0);

1550

SDValue RHS = Op.getOperand(1);

Matt Arsenault

2014-07-24 06:59:20 +0000

[diff] [blame]

1551

MVT IntVT = MVT::i32;

1552

MVT FltVT = MVT::f32;

1553

Jan Vesely

2014-08-12 17:31:20 +0000

[diff] [blame]

1554

ISD::NodeType ToFp = sign ? ISD::SINT_TO_FP : ISD::UINT_TO_FP;

1555

ISD::NodeType ToInt = sign ? ISD::FP_TO_SINT : ISD::FP_TO_UINT;

1556

Matt Arsenault

2014-07-24 06:59:20 +0000

[diff] [blame]

1557

if (VT.isVector()) {

1558

unsigned NElts = VT.getVectorNumElements();

1559

IntVT = MVT::getVectorVT(MVT::i32, NElts);

1560

FltVT = MVT::getVectorVT(MVT::f32, NElts);

Matt Arsenault

2014-06-15 20:08:02 +0000

[diff] [blame]

1561

}

Matt Arsenault

2014-07-24 06:59:20 +0000

[diff] [blame]

1562

1563

unsigned BitSize = VT.getScalarType().getSizeInBits();

1564

Jan Vesely

2014-08-12 17:31:20 +0000

[diff] [blame]

1565

SDValue jq = DAG.getConstant(1, IntVT);

Matt Arsenault

2014-06-15 20:08:02 +0000

[diff] [blame]

1566

Jan Vesely

2014-08-12 17:31:20 +0000

[diff] [blame]

1567

if (sign) {

1568

// char|short jq = ia ^ ib;

1569

jq = DAG.getNode(ISD::XOR, DL, VT, LHS, RHS);

Matt Arsenault

2014-06-15 20:08:02 +0000

[diff] [blame]

1570

Jan Vesely

2014-08-12 17:31:20 +0000

[diff] [blame]

1571

// jq = jq >> (bitsize - 2)

1572

jq = DAG.getNode(ISD::SRA, DL, VT, jq, DAG.getConstant(BitSize - 2, VT));

Matt Arsenault

2014-06-15 20:08:02 +0000

[diff] [blame]

1573

Jan Vesely

2014-08-12 17:31:20 +0000

[diff] [blame]

1574

// jq = jq | 0x1

1575

jq = DAG.getNode(ISD::OR, DL, VT, jq, DAG.getConstant(1, VT));

1576

1577

// jq = (int)jq

1578

jq = DAG.getSExtOrTrunc(jq, DL, IntVT);

1579

}

Matt Arsenault

2014-06-15 20:08:02 +0000

[diff] [blame]

1580

1581

// int ia = (int)LHS;

Jan Vesely

2014-08-12 17:31:20 +0000

[diff] [blame]

1582

SDValue ia = sign ?

1583

DAG.getSExtOrTrunc(LHS, DL, IntVT) : DAG.getZExtOrTrunc(LHS, DL, IntVT);

Matt Arsenault

2014-06-15 20:08:02 +0000

[diff] [blame]

1584

1585

// int ib, (int)RHS;

Jan Vesely

2014-08-12 17:31:20 +0000

[diff] [blame]

1586

SDValue ib = sign ?

1587

DAG.getSExtOrTrunc(RHS, DL, IntVT) : DAG.getZExtOrTrunc(RHS, DL, IntVT);

Matt Arsenault

2014-06-15 20:08:02 +0000

[diff] [blame]

1588

1589

// float fa = (float)ia;

Jan Vesely

2014-08-12 17:31:20 +0000

[diff] [blame]

1590

SDValue fa = DAG.getNode(ToFp, DL, FltVT, ia);

Matt Arsenault

2014-06-15 20:08:02 +0000

[diff] [blame]

1591

1592

// float fb = (float)ib;

Jan Vesely

2014-08-12 17:31:20 +0000

[diff] [blame]

1593

SDValue fb = DAG.getNode(ToFp, DL, FltVT, ib);

Matt Arsenault

2014-06-15 20:08:02 +0000

[diff] [blame]

1594

1595

// float fq = native_divide(fa, fb);

Matt Arsenault

2014-07-24 06:59:20 +0000

[diff] [blame]

1596

SDValue fq = DAG.getNode(ISD::FMUL, DL, FltVT,

1597

fa, DAG.getNode(AMDGPUISD::RCP, DL, FltVT, fb));

Matt Arsenault

2014-06-15 20:08:02 +0000

[diff] [blame]

1598

1599

// fq = trunc(fq);

Matt Arsenault

2014-07-24 06:59:20 +0000

[diff] [blame]

1600

fq = DAG.getNode(ISD::FTRUNC, DL, FltVT, fq);

Matt Arsenault

2014-06-15 20:08:02 +0000

[diff] [blame]

1601

1602

// float fqneg = -fq;

Matt Arsenault

2014-07-24 06:59:20 +0000

[diff] [blame]

1603

SDValue fqneg = DAG.getNode(ISD::FNEG, DL, FltVT, fq);

Matt Arsenault

2014-06-15 20:08:02 +0000

[diff] [blame]

1604

1605

// float fr = mad(fqneg, fb, fa);

Matt Arsenault

2014-07-24 06:59:20 +0000

[diff] [blame]

1606

SDValue fr = DAG.getNode(ISD::FADD, DL, FltVT,

1607

DAG.getNode(ISD::FMUL, DL, FltVT, fqneg, fb), fa);

Matt Arsenault

2014-06-15 20:08:02 +0000

[diff] [blame]

1608

1609

// int iq = (int)fq;

Jan Vesely

2014-08-12 17:31:20 +0000

[diff] [blame]

1610

SDValue iq = DAG.getNode(ToInt, DL, IntVT, fq);

Matt Arsenault

2014-06-15 20:08:02 +0000

[diff] [blame]

1611

1612

// fr = fabs(fr);

Matt Arsenault

2014-07-24 06:59:20 +0000

[diff] [blame]

1613

fr = DAG.getNode(ISD::FABS, DL, FltVT, fr);

Matt Arsenault

2014-06-15 20:08:02 +0000

[diff] [blame]

1614

1615

// fb = fabs(fb);

Matt Arsenault

2014-07-24 06:59:20 +0000

[diff] [blame]

1616

fb = DAG.getNode(ISD::FABS, DL, FltVT, fb);

1617

1618

EVT SetCCVT = getSetCCResultType(*DAG.getContext(), VT);

Matt Arsenault

2014-06-15 20:08:02 +0000

[diff] [blame]

1619

1620

// int cv = fr >= fb;

Matt Arsenault

2014-07-24 06:59:20 +0000

[diff] [blame]

1621

SDValue cv = DAG.getSetCC(DL, SetCCVT, fr, fb, ISD::SETOGE);

1622

Matt Arsenault

2014-06-15 20:08:02 +0000

[diff] [blame]

1623

// jq = (cv ? jq : 0);

Matt Arsenault

2014-07-24 06:59:20 +0000

[diff] [blame]

1624

jq = DAG.getNode(ISD::SELECT, DL, VT, cv, jq, DAG.getConstant(0, VT));

1625

Jan Vesely

2014-08-12 17:31:20 +0000

[diff] [blame]

1626

// dst = trunc/extend to legal type

1627

iq = sign ? DAG.getSExtOrTrunc(iq, DL, VT) : DAG.getZExtOrTrunc(iq, DL, VT);

Jan Vesely

2014-08-12 17:31:17 +0000

[diff] [blame]

1628

Jan Vesely

2014-08-12 17:31:20 +0000

[diff] [blame]

1629

// dst = iq + jq;

Jan Vesely

2014-08-12 17:31:17 +0000

[diff] [blame]

1630

SDValue Div = DAG.getNode(ISD::ADD, DL, VT, iq, jq);

1631

Jan Vesely

2014-08-12 17:31:20 +0000

[diff] [blame]

1632

// Rem needs compensation, it's easier to recompute it

Jan Vesely

2014-08-12 17:31:17 +0000

[diff] [blame]

1633

SDValue Rem = DAG.getNode(ISD::MUL, DL, VT, Div, RHS);

1634

Rem = DAG.getNode(ISD::SUB, DL, VT, LHS, Rem);

SDValue Res[2] = {

Div,

Rem

};

return DAG.getMergeValues(Res, DL);

Matt Arsenault

2014-06-15 20:08:02 +0000

[diff] [blame]

1641

}

1642

Tom Stellard

2014-11-15 01:07:53 +0000

[diff] [blame]

1643

void AMDGPUTargetLowering::LowerUDIVREM64(SDValue Op,

1644

SelectionDAG &DAG,

1645

SmallVectorImpl<SDValue> &Results) const {

1646

assert(Op.getValueType() == MVT::i64);

1647

1648

SDLoc DL(Op);

1649

EVT VT = Op.getValueType();

1650

EVT HalfVT = VT.getHalfSizedIntegerVT(*DAG.getContext());

1651

1652

SDValue one = DAG.getConstant(1, HalfVT);

1653

SDValue zero = DAG.getConstant(0, HalfVT);

1654

1655

//HiLo split

1656

SDValue LHS = Op.getOperand(0);

1657

SDValue LHS_Lo = DAG.getNode(ISD::EXTRACT_ELEMENT, DL, HalfVT, LHS, zero);

1658

SDValue LHS_Hi = DAG.getNode(ISD::EXTRACT_ELEMENT, DL, HalfVT, LHS, one);

1659

1660

SDValue RHS = Op.getOperand(1);

1661

SDValue RHS_Lo = DAG.getNode(ISD::EXTRACT_ELEMENT, DL, HalfVT, RHS, zero);

1662

SDValue RHS_Hi = DAG.getNode(ISD::EXTRACT_ELEMENT, DL, HalfVT, RHS, one);

1663

1664

// Get Speculative values

1665

SDValue DIV_Part = DAG.getNode(ISD::UDIV, DL, HalfVT, LHS_Hi, RHS_Lo);

1666

SDValue REM_Part = DAG.getNode(ISD::UREM, DL, HalfVT, LHS_Hi, RHS_Lo);

1667

Tom Stellard

2014-11-15 01:07:53 +0000

[diff] [blame]

1668

SDValue REM_Lo = DAG.getSelectCC(DL, RHS_Hi, zero, REM_Part, LHS_Hi, ISD::SETEQ);

Jan Vesely

2015-01-22 23:42:39 +0000

[diff] [blame^]

1669

SDValue REM = DAG.getNode(ISD::BUILD_PAIR, DL, VT, REM_Lo, zero);

Tom Stellard

2014-11-15 01:07:53 +0000

[diff] [blame]

1670

1671

SDValue DIV_Hi = DAG.getSelectCC(DL, RHS_Hi, zero, DIV_Part, zero, ISD::SETEQ);

1672

SDValue DIV_Lo = zero;

1673

1674

const unsigned halfBitWidth = HalfVT.getSizeInBits();

1675

1676

for (unsigned i = 0; i < halfBitWidth; ++i) {

Jan Vesely

2015-01-22 23:42:39 +0000

[diff] [blame^]

1677

const unsigned bitPos = halfBitWidth - i - 1;

1678

SDValue POS = DAG.getConstant(bitPos, HalfVT);

1679

// Get value of high bit

1680

// TODO: Remove the BFE part when the optimization is fixed

Tom Stellard

2014-11-15 01:07:53 +0000

[diff] [blame]

1681

SDValue HBit;

1682

if (halfBitWidth == 32 && Subtarget->hasBFE()) {

1683

HBit = DAG.getNode(AMDGPUISD::BFE_U32, DL, HalfVT, LHS_Lo, POS, one);

1684

} else {

1685

HBit = DAG.getNode(ISD::SRL, DL, HalfVT, LHS_Lo, POS);

1686

HBit = DAG.getNode(ISD::AND, DL, HalfVT, HBit, one);

1687

}

Jan Vesely

2015-01-22 23:42:39 +0000

[diff] [blame^]

1688

HBit = DAG.getNode(ISD::ZERO_EXTEND, DL, VT, HBit);

Tom Stellard

2014-11-15 01:07:53 +0000

[diff] [blame]

1689

Jan Vesely

2015-01-22 23:42:39 +0000

[diff] [blame^]

1690

// Shift

1691

REM = DAG.getNode(ISD::SHL, DL, VT, REM, DAG.getConstant(1, VT));

1692

// Add LHS high bit

1693

REM = DAG.getNode(ISD::OR, DL, VT, REM, HBit);

Tom Stellard

2014-11-15 01:07:53 +0000

[diff] [blame]

1694

Jan Vesely

2015-01-22 23:42:39 +0000

[diff] [blame^]

1695

SDValue BIT = DAG.getConstant(1 << bitPos, HalfVT);

Tom Stellard

83171b3

2014-11-15 01:07:57 +0000

[diff] [blame]

1696

SDValue realBIT = DAG.getSelectCC(DL, REM, RHS, BIT, zero, ISD::SETUGE);

Tom Stellard

2014-11-15 01:07:53 +0000

[diff] [blame]

1697

1698

DIV_Lo = DAG.getNode(ISD::OR, DL, HalfVT, DIV_Lo, realBIT);

1699

1700

// Update REM

Tom Stellard

2014-11-15 01:07:53 +0000

[diff] [blame]

1701

SDValue REM_sub = DAG.getNode(ISD::SUB, DL, VT, REM, RHS);

Tom Stellard

83171b3

2014-11-15 01:07:57 +0000

[diff] [blame]

1702

REM = DAG.getSelectCC(DL, REM, RHS, REM_sub, REM, ISD::SETUGE);

Tom Stellard

2014-11-15 01:07:53 +0000

[diff] [blame]

1703

}

1704

Tom Stellard

2014-11-15 01:07:53 +0000

[diff] [blame]

1705

SDValue DIV = DAG.getNode(ISD::BUILD_PAIR, DL, VT, DIV_Lo, DIV_Hi);

1706

Results.push_back(DIV);

1707

Results.push_back(REM);

1708

}

1709

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1710

SDValue AMDGPUTargetLowering::LowerUDIVREM(SDValue Op,

Matt Arsenault

2014-05-11 21:24:41 +0000

[diff] [blame]

1711

SelectionDAG &DAG) const {

Andrew Trick

2013-05-25 02:42:55 +0000

[diff] [blame]

1712

SDLoc DL(Op);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1713

EVT VT = Op.getValueType();

1714

Tom Stellard

2014-11-15 01:07:53 +0000

[diff] [blame]

1715

if (VT == MVT::i64) {

1716

SmallVector<SDValue, 2> Results;

1717

LowerUDIVREM64(Op, DAG, Results);

1718

return DAG.getMergeValues(Results, DL);

1719

}

1720

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1721

SDValue Num = Op.getOperand(0);

1722

SDValue Den = Op.getOperand(1);

1723

Jan Vesely

2014-08-12 17:31:20 +0000

[diff] [blame]

1724

if (VT == MVT::i32) {

1725

if (DAG.MaskedValueIsZero(Op.getOperand(0), APInt(32, 0xff << 24)) &&

1726

DAG.MaskedValueIsZero(Op.getOperand(1), APInt(32, 0xff << 24))) {

1727

// TODO: We technically could do this for i64, but shouldn't that just be

1728

// handled by something generally reducing 64-bit division on 32-bit

1729

// values to 32-bit?

1730

return LowerDIVREM24(Op, DAG, false);

}

}

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1734

// RCP = URECIP(Den) = 2^32 / Den + e

1735

// e is rounding error.

1736

SDValue RCP = DAG.getNode(AMDGPUISD::URECIP, DL, VT, Den);

1737

Tom Stellard

4349b19

2014-09-22 15:35:30 +0000

[diff] [blame]

1738

// RCP_LO = mul(RCP, Den) */

1739

SDValue RCP_LO = DAG.getNode(ISD::MUL, DL, VT, RCP, Den);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1740

1741

// RCP_HI = mulhu (RCP, Den) */

1742

SDValue RCP_HI = DAG.getNode(ISD::MULHU, DL, VT, RCP, Den);

1743

1744

// NEG_RCP_LO = -RCP_LO

1745

SDValue NEG_RCP_LO = DAG.getNode(ISD::SUB, DL, VT, DAG.getConstant(0, VT),

1746

RCP_LO);

1747

1748

// ABS_RCP_LO = (RCP_HI == 0 ? NEG_RCP_LO : RCP_LO)

1749

SDValue ABS_RCP_LO = DAG.getSelectCC(DL, RCP_HI, DAG.getConstant(0, VT),

1750

NEG_RCP_LO, RCP_LO,

1751

ISD::SETEQ);

1752

// Calculate the rounding error from the URECIP instruction

1753

// E = mulhu(ABS_RCP_LO, RCP)

1754

SDValue E = DAG.getNode(ISD::MULHU, DL, VT, ABS_RCP_LO, RCP);

1755

1756

// RCP_A_E = RCP + E

1757

SDValue RCP_A_E = DAG.getNode(ISD::ADD, DL, VT, RCP, E);

1758

1759

// RCP_S_E = RCP - E

1760

SDValue RCP_S_E = DAG.getNode(ISD::SUB, DL, VT, RCP, E);

1761

1762

// Tmp0 = (RCP_HI == 0 ? RCP_A_E : RCP_SUB_E)

1763

SDValue Tmp0 = DAG.getSelectCC(DL, RCP_HI, DAG.getConstant(0, VT),

1764

RCP_A_E, RCP_S_E,

1765

ISD::SETEQ);

1766

// Quotient = mulhu(Tmp0, Num)

1767

SDValue Quotient = DAG.getNode(ISD::MULHU, DL, VT, Tmp0, Num);

1768

1769

// Num_S_Remainder = Quotient * Den

Tom Stellard

4349b19

2014-09-22 15:35:30 +0000

[diff] [blame]

1770

SDValue Num_S_Remainder = DAG.getNode(ISD::MUL, DL, VT, Quotient, Den);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1771

1772

// Remainder = Num - Num_S_Remainder

1773

SDValue Remainder = DAG.getNode(ISD::SUB, DL, VT, Num, Num_S_Remainder);

1774

1775

// Remainder_GE_Den = (Remainder >= Den ? -1 : 0)

1776

SDValue Remainder_GE_Den = DAG.getSelectCC(DL, Remainder, Den,

1777

DAG.getConstant(-1, VT),

1778

DAG.getConstant(0, VT),

Vincent Lejeune

4f3751f

2013-11-06 17:36:04 +0000

[diff] [blame]

1779

ISD::SETUGE);

1780

// Remainder_GE_Zero = (Num >= Num_S_Remainder ? -1 : 0)

1781

SDValue Remainder_GE_Zero = DAG.getSelectCC(DL, Num,

1782

Num_S_Remainder,

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1783

DAG.getConstant(-1, VT),

1784

DAG.getConstant(0, VT),

Vincent Lejeune

4f3751f

2013-11-06 17:36:04 +0000

[diff] [blame]

1785

ISD::SETUGE);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1786

// Tmp1 = Remainder_GE_Den & Remainder_GE_Zero

1787

SDValue Tmp1 = DAG.getNode(ISD::AND, DL, VT, Remainder_GE_Den,

1788

Remainder_GE_Zero);

1789

1790

// Calculate Division result:

1791

1792

// Quotient_A_One = Quotient + 1

1793

SDValue Quotient_A_One = DAG.getNode(ISD::ADD, DL, VT, Quotient,

1794

DAG.getConstant(1, VT));

1795

1796

// Quotient_S_One = Quotient - 1

1797

SDValue Quotient_S_One = DAG.getNode(ISD::SUB, DL, VT, Quotient,

1798

DAG.getConstant(1, VT));

1799

1800

// Div = (Tmp1 == 0 ? Quotient : Quotient_A_One)

1801

SDValue Div = DAG.getSelectCC(DL, Tmp1, DAG.getConstant(0, VT),

1802

Quotient, Quotient_A_One, ISD::SETEQ);

1803

1804

// Div = (Remainder_GE_Zero == 0 ? Quotient_S_One : Div)

1805

Div = DAG.getSelectCC(DL, Remainder_GE_Zero, DAG.getConstant(0, VT),

1806

Quotient_S_One, Div, ISD::SETEQ);

1807

1808

// Calculate Rem result:

1809

1810

// Remainder_S_Den = Remainder - Den

1811

SDValue Remainder_S_Den = DAG.getNode(ISD::SUB, DL, VT, Remainder, Den);

1812

1813

// Remainder_A_Den = Remainder + Den

1814

SDValue Remainder_A_Den = DAG.getNode(ISD::ADD, DL, VT, Remainder, Den);

1815

1816

// Rem = (Tmp1 == 0 ? Remainder : Remainder_S_Den)

1817

SDValue Rem = DAG.getSelectCC(DL, Tmp1, DAG.getConstant(0, VT),

1818

Remainder, Remainder_S_Den, ISD::SETEQ);

1819

1820

// Rem = (Remainder_GE_Zero == 0 ? Remainder_A_Den : Rem)

1821

Rem = DAG.getSelectCC(DL, Remainder_GE_Zero, DAG.getConstant(0, VT),

1822

Remainder_A_Den, Rem, ISD::SETEQ);

Matt Arsenault

7939acd

2014-04-07 16:44:24 +0000

[diff] [blame]

SDValue Ops[2] = {

Div,

Rem

};

Craig Topper

64941d9

2014-04-27 19:20:57 +0000

[diff] [blame]

1827

return DAG.getMergeValues(Ops, DL);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

1828

}

1829

Jan Vesely

2014-06-22 21:43:00 +0000

[diff] [blame]

1830

SDValue AMDGPUTargetLowering::LowerSDIVREM(SDValue Op,

1831

SelectionDAG &DAG) const {

1832

SDLoc DL(Op);

1833

EVT VT = Op.getValueType();

1834

Jan Vesely

2014-06-22 21:43:00 +0000

[diff] [blame]

1835

SDValue LHS = Op.getOperand(0);

1836

SDValue RHS = Op.getOperand(1);

1837

Jan Vesely

2014-08-12 17:31:17 +0000

[diff] [blame]

1838

if (VT == MVT::i32) {

1839

if (DAG.ComputeNumSignBits(Op.getOperand(0)) > 8 &&

1840

DAG.ComputeNumSignBits(Op.getOperand(1)) > 8) {

1841

// TODO: We technically could do this for i64, but shouldn't that just be

1842

// handled by something generally reducing 64-bit division on 32-bit

1843

// values to 32-bit?

Jan Vesely

2014-08-12 17:31:20 +0000

[diff] [blame]

1844

return LowerDIVREM24(Op, DAG, true);

Jan Vesely

2014-08-12 17:31:17 +0000

[diff] [blame]

}

}

SDValue Zero = DAG.getConstant(0, VT);

1849

SDValue NegOne = DAG.getConstant(-1, VT);

1850

Jan Vesely

2014-06-22 21:43:00 +0000

[diff] [blame]

1851

SDValue LHSign = DAG.getSelectCC(DL, LHS, Zero, NegOne, Zero, ISD::SETLT);

1852

SDValue RHSign = DAG.getSelectCC(DL, RHS, Zero, NegOne, Zero, ISD::SETLT);

1853

SDValue DSign = DAG.getNode(ISD::XOR, DL, VT, LHSign, RHSign);

1854

SDValue RSign = LHSign; // Remainder sign is the same as LHS

1855

1856

LHS = DAG.getNode(ISD::ADD, DL, VT, LHS, LHSign);

1857

RHS = DAG.getNode(ISD::ADD, DL, VT, RHS, RHSign);

1858

1859

LHS = DAG.getNode(ISD::XOR, DL, VT, LHS, LHSign);

1860

RHS = DAG.getNode(ISD::XOR, DL, VT, RHS, RHSign);

1861

1862

SDValue Div = DAG.getNode(ISD::UDIVREM, DL, DAG.getVTList(VT, VT), LHS, RHS);

1863

SDValue Rem = Div.getValue(1);

1864

1865

Div = DAG.getNode(ISD::XOR, DL, VT, Div, DSign);

1866

Rem = DAG.getNode(ISD::XOR, DL, VT, Rem, RSign);

1867

1868

Div = DAG.getNode(ISD::SUB, DL, VT, Div, DSign);

1869

Rem = DAG.getNode(ISD::SUB, DL, VT, Rem, RSign);

SDValue Res[2] = {

Div,

Rem

};

return DAG.getMergeValues(Res, DL);

1876

}

1877

Matt Arsenault

2014-09-10 21:44:27 +0000

[diff] [blame]

1878

// (frem x, y) -> (fsub x, (fmul (ftrunc (fdiv x, y)), y))

1879

SDValue AMDGPUTargetLowering::LowerFREM(SDValue Op, SelectionDAG &DAG) const {

1880

SDLoc SL(Op);

1881

EVT VT = Op.getValueType();

1882

SDValue X = Op.getOperand(0);

1883

SDValue Y = Op.getOperand(1);

1884

1885

SDValue Div = DAG.getNode(ISD::FDIV, SL, VT, X, Y);

1886

SDValue Floor = DAG.getNode(ISD::FTRUNC, SL, VT, Div);

1887

SDValue Mul = DAG.getNode(ISD::FMUL, SL, VT, Floor, Y);

1888

1889

return DAG.getNode(ISD::FSUB, SL, VT, X, Mul);

1890

}

1891

Matt Arsenault

2014-06-18 17:05:30 +0000

[diff] [blame]

1892

SDValue AMDGPUTargetLowering::LowerFCEIL(SDValue Op, SelectionDAG &DAG) const {

1893

SDLoc SL(Op);

1894

SDValue Src = Op.getOperand(0);

1895

1896

// result = trunc(src)

1897

// if (src > 0.0 && src != result)

1898

// result += 1.0

1899

1900

SDValue Trunc = DAG.getNode(ISD::FTRUNC, SL, MVT::f64, Src);

1901

1902

const SDValue Zero = DAG.getConstantFP(0.0, MVT::f64);

1903

const SDValue One = DAG.getConstantFP(1.0, MVT::f64);

1904

1905

EVT SetCCVT = getSetCCResultType(*DAG.getContext(), MVT::f64);

1906

1907

SDValue Lt0 = DAG.getSetCC(SL, SetCCVT, Src, Zero, ISD::SETOGT);

1908

SDValue NeTrunc = DAG.getSetCC(SL, SetCCVT, Src, Trunc, ISD::SETONE);

1909

SDValue And = DAG.getNode(ISD::AND, SL, SetCCVT, Lt0, NeTrunc);

1910

1911

SDValue Add = DAG.getNode(ISD::SELECT, SL, MVT::f64, And, One, Zero);

1912

return DAG.getNode(ISD::FADD, SL, MVT::f64, Trunc, Add);

1913

}

1914

Matt Arsenault

2015-01-21 18:18:25 +0000

[diff] [blame]

1915

static SDValue extractF64Exponent(SDValue Hi, SDLoc SL, SelectionDAG &DAG) {

1916

const unsigned FractBits = 52;

1917

const unsigned ExpBits = 11;

1918

1919

SDValue ExpPart = DAG.getNode(AMDGPUISD::BFE_U32, SL, MVT::i32,

1920

Hi,

1921

DAG.getConstant(FractBits - 32, MVT::i32),

1922

DAG.getConstant(ExpBits, MVT::i32));

1923

SDValue Exp = DAG.getNode(ISD::SUB, SL, MVT::i32, ExpPart,

1924

DAG.getConstant(1023, MVT::i32));

return Exp;

}

Matt Arsenault

2014-06-18 17:05:30 +0000

[diff] [blame]

1929

SDValue AMDGPUTargetLowering::LowerFTRUNC(SDValue Op, SelectionDAG &DAG) const {

1930

SDLoc SL(Op);

1931

SDValue Src = Op.getOperand(0);

1932

1933

assert(Op.getValueType() == MVT::f64);

1934

1935

const SDValue Zero = DAG.getConstant(0, MVT::i32);

1936

const SDValue One = DAG.getConstant(1, MVT::i32);

1937

1938

SDValue VecSrc = DAG.getNode(ISD::BITCAST, SL, MVT::v2i32, Src);

1939

1940

// Extract the upper half, since this is where we will find the sign and

1941

// exponent.

1942

SDValue Hi = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, SL, MVT::i32, VecSrc, One);

1943

Matt Arsenault

2015-01-21 18:18:25 +0000

[diff] [blame]

1944

SDValue Exp = extractF64Exponent(Hi, SL, DAG);

Matt Arsenault

2014-06-18 17:05:30 +0000

[diff] [blame]

1945

Matt Arsenault

2015-01-21 18:18:25 +0000

[diff] [blame]

1946

const unsigned FractBits = 52;

Matt Arsenault

2014-06-18 17:05:30 +0000

[diff] [blame]

1947

1948

// Extract the sign bit.

Matt Arsenault

2b0fa43

2014-06-18 22:11:03 +0000

[diff] [blame]

1949

const SDValue SignBitMask = DAG.getConstant(UINT32_C(1) << 31, MVT::i32);

Matt Arsenault

2014-06-18 17:05:30 +0000

[diff] [blame]

1950

SDValue SignBit = DAG.getNode(ISD::AND, SL, MVT::i32, Hi, SignBitMask);

1951

1952

// Extend back to to 64-bits.

1953

SDValue SignBit64 = DAG.getNode(ISD::BUILD_VECTOR, SL, MVT::v2i32,

1954

Zero, SignBit);

1955

SignBit64 = DAG.getNode(ISD::BITCAST, SL, MVT::i64, SignBit64);

1956

1957

SDValue BcInt = DAG.getNode(ISD::BITCAST, SL, MVT::i64, Src);

Matt Arsenault

2b0fa43

2014-06-18 22:11:03 +0000

[diff] [blame]

1958

const SDValue FractMask

1959

= DAG.getConstant((UINT64_C(1) << FractBits) - 1, MVT::i64);

Matt Arsenault

2014-06-18 17:05:30 +0000

[diff] [blame]

1960

1961

SDValue Shr = DAG.getNode(ISD::SRA, SL, MVT::i64, FractMask, Exp);

1962

SDValue Not = DAG.getNOT(SL, Shr, MVT::i64);

1963

SDValue Tmp0 = DAG.getNode(ISD::AND, SL, MVT::i64, BcInt, Not);

1964

1965

EVT SetCCVT = getSetCCResultType(*DAG.getContext(), MVT::i32);

1966

1967

const SDValue FiftyOne = DAG.getConstant(FractBits - 1, MVT::i32);

1968

1969

SDValue ExpLt0 = DAG.getSetCC(SL, SetCCVT, Exp, Zero, ISD::SETLT);

1970

SDValue ExpGt51 = DAG.getSetCC(SL, SetCCVT, Exp, FiftyOne, ISD::SETGT);

1971

1972

SDValue Tmp1 = DAG.getNode(ISD::SELECT, SL, MVT::i64, ExpLt0, SignBit64, Tmp0);

1973

SDValue Tmp2 = DAG.getNode(ISD::SELECT, SL, MVT::i64, ExpGt51, BcInt, Tmp1);

1974

1975

return DAG.getNode(ISD::BITCAST, SL, MVT::f64, Tmp2);

1976

}

1977

Matt Arsenault

2014-06-18 17:05:26 +0000

[diff] [blame]

1978

SDValue AMDGPUTargetLowering::LowerFRINT(SDValue Op, SelectionDAG &DAG) const {

1979

SDLoc SL(Op);

1980

SDValue Src = Op.getOperand(0);

1981

1982

assert(Op.getValueType() == MVT::f64);

1983

Matt Arsenault

d22626f

2014-06-18 17:45:58 +0000

[diff] [blame]

1984

APFloat C1Val(APFloat::IEEEdouble, "0x1.0p+52");

1985

SDValue C1 = DAG.getConstantFP(C1Val, MVT::f64);

Matt Arsenault

2014-06-18 17:05:26 +0000

[diff] [blame]

1986

SDValue CopySign = DAG.getNode(ISD::FCOPYSIGN, SL, MVT::f64, C1, Src);

1987

1988

SDValue Tmp1 = DAG.getNode(ISD::FADD, SL, MVT::f64, Src, CopySign);

1989

SDValue Tmp2 = DAG.getNode(ISD::FSUB, SL, MVT::f64, Tmp1, CopySign);

1990

1991

SDValue Fabs = DAG.getNode(ISD::FABS, SL, MVT::f64, Src);

Matt Arsenault

d22626f

2014-06-18 17:45:58 +0000

[diff] [blame]

1992

1993

APFloat C2Val(APFloat::IEEEdouble, "0x1.fffffffffffffp+51");

1994

SDValue C2 = DAG.getConstantFP(C2Val, MVT::f64);

Matt Arsenault

2014-06-18 17:05:26 +0000

[diff] [blame]

1995

1996

EVT SetCCVT = getSetCCResultType(*DAG.getContext(), MVT::f64);

1997

SDValue Cond = DAG.getSetCC(SL, SetCCVT, Fabs, C2, ISD::SETOGT);

1998

1999

return DAG.getSelect(SL, MVT::f64, Cond, Src, Tmp2);

2000

}

2001

Matt Arsenault

2014-06-18 22:03:45 +0000

[diff] [blame]

2002

SDValue AMDGPUTargetLowering::LowerFNEARBYINT(SDValue Op, SelectionDAG &DAG) const {

2003

// FNEARBYINT and FRINT are the same, except in their handling of FP

2004

// exceptions. Those aren't really meaningful for us, and OpenCL only has

2005

// rint, so just treat them as equivalent.

2006

return DAG.getNode(ISD::FRINT, SDLoc(Op), Op.getValueType(), Op.getOperand(0));

2007

}

2008

Matt Arsenault

2015-01-21 18:18:25 +0000

[diff] [blame]

2009

// XXX - May require not supporting f32 denormals?

2010

SDValue AMDGPUTargetLowering::LowerFROUND32(SDValue Op, SelectionDAG &DAG) const {

2011

SDLoc SL(Op);

2012

SDValue X = Op.getOperand(0);

2013

2014

SDValue T = DAG.getNode(ISD::FTRUNC, SL, MVT::f32, X);

2015

2016

SDValue Diff = DAG.getNode(ISD::FSUB, SL, MVT::f32, X, T);

2017

2018

SDValue AbsDiff = DAG.getNode(ISD::FABS, SL, MVT::f32, Diff);

2019

2020

const SDValue Zero = DAG.getConstantFP(0.0, MVT::f32);

2021

const SDValue One = DAG.getConstantFP(1.0, MVT::f32);

2022

const SDValue Half = DAG.getConstantFP(0.5, MVT::f32);

2023

2024

SDValue SignOne = DAG.getNode(ISD::FCOPYSIGN, SL, MVT::f32, One, X);

2025

2026

EVT SetCCVT = getSetCCResultType(*DAG.getContext(), MVT::f32);

2027

2028

SDValue Cmp = DAG.getSetCC(SL, SetCCVT, AbsDiff, Half, ISD::SETOGE);

2029

2030

SDValue Sel = DAG.getNode(ISD::SELECT, SL, MVT::f32, Cmp, SignOne, Zero);

2031

2032

return DAG.getNode(ISD::FADD, SL, MVT::f32, T, Sel);

2033

}

2034

2035

SDValue AMDGPUTargetLowering::LowerFROUND64(SDValue Op, SelectionDAG &DAG) const {

2036

SDLoc SL(Op);

2037

SDValue X = Op.getOperand(0);

2038

2039

SDValue L = DAG.getNode(ISD::BITCAST, SL, MVT::i64, X);

2040

2041

const SDValue Zero = DAG.getConstant(0, MVT::i32);

2042

const SDValue One = DAG.getConstant(1, MVT::i32);

2043

const SDValue NegOne = DAG.getConstant(-1, MVT::i32);

2044

const SDValue FiftyOne = DAG.getConstant(51, MVT::i32);

2045

EVT SetCCVT = getSetCCResultType(*DAG.getContext(), MVT::i32);

2046

2047

2048

SDValue BC = DAG.getNode(ISD::BITCAST, SL, MVT::v2i32, X);

2049

2050

SDValue Hi = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, SL, MVT::i32, BC, One);

2051

2052

SDValue Exp = extractF64Exponent(Hi, SL, DAG);

2053

2054

const SDValue Mask = DAG.getConstant(INT64_C(0x000fffffffffffff), MVT::i64);

2055

2056

SDValue M = DAG.getNode(ISD::SRA, SL, MVT::i64, Mask, Exp);

2057

SDValue D = DAG.getNode(ISD::SRA, SL, MVT::i64,

2058

DAG.getConstant(INT64_C(0x0008000000000000), MVT::i64),

2059

Exp);

2060

2061

SDValue Tmp0 = DAG.getNode(ISD::AND, SL, MVT::i64, L, M);

2062

SDValue Tmp1 = DAG.getSetCC(SL, SetCCVT,

2063

DAG.getConstant(0, MVT::i64), Tmp0,

2064

ISD::SETNE);

2065

2066

SDValue Tmp2 = DAG.getNode(ISD::SELECT, SL, MVT::i64, Tmp1,

2067

D, DAG.getConstant(0, MVT::i64));

2068

SDValue K = DAG.getNode(ISD::ADD, SL, MVT::i64, L, Tmp2);

2069

2070

K = DAG.getNode(ISD::AND, SL, MVT::i64, K, DAG.getNOT(SL, M, MVT::i64));

2071

K = DAG.getNode(ISD::BITCAST, SL, MVT::f64, K);

2072

2073

SDValue ExpLt0 = DAG.getSetCC(SL, SetCCVT, Exp, Zero, ISD::SETLT);

2074

SDValue ExpGt51 = DAG.getSetCC(SL, SetCCVT, Exp, FiftyOne, ISD::SETGT);

2075

SDValue ExpEqNegOne = DAG.getSetCC(SL, SetCCVT, NegOne, Exp, ISD::SETEQ);

2076

2077

SDValue Mag = DAG.getNode(ISD::SELECT, SL, MVT::f64,

2078

ExpEqNegOne,

2079

DAG.getConstantFP(1.0, MVT::f64),

2080

DAG.getConstantFP(0.0, MVT::f64));

2081

2082

SDValue S = DAG.getNode(ISD::FCOPYSIGN, SL, MVT::f64, Mag, X);

2083

2084

K = DAG.getNode(ISD::SELECT, SL, MVT::f64, ExpLt0, S, K);

2085

K = DAG.getNode(ISD::SELECT, SL, MVT::f64, ExpGt51, X, K);

return K;

}

SDValue AMDGPUTargetLowering::LowerFROUND(SDValue Op, SelectionDAG &DAG) const {

2091

EVT VT = Op.getValueType();

2092

2093

if (VT == MVT::f32)

2094

return LowerFROUND32(Op, DAG);

2095

2096

if (VT == MVT::f64)

2097

return LowerFROUND64(Op, DAG);

2098

2099

llvm_unreachable("unhandled type");

2100

}

2101

Matt Arsenault

2014-06-18 17:05:30 +0000

[diff] [blame]

2102

SDValue AMDGPUTargetLowering::LowerFFLOOR(SDValue Op, SelectionDAG &DAG) const {

2103

SDLoc SL(Op);

2104

SDValue Src = Op.getOperand(0);

2105

2106

// result = trunc(src);

2107

// if (src < 0.0 && src != result)

2108

// result += -1.0.

2109

2110

SDValue Trunc = DAG.getNode(ISD::FTRUNC, SL, MVT::f64, Src);

2111

2112

const SDValue Zero = DAG.getConstantFP(0.0, MVT::f64);

2113

const SDValue NegOne = DAG.getConstantFP(-1.0, MVT::f64);

2114

2115

EVT SetCCVT = getSetCCResultType(*DAG.getContext(), MVT::f64);

2116

2117

SDValue Lt0 = DAG.getSetCC(SL, SetCCVT, Src, Zero, ISD::SETOLT);

2118

SDValue NeTrunc = DAG.getSetCC(SL, SetCCVT, Src, Trunc, ISD::SETONE);

2119

SDValue And = DAG.getNode(ISD::AND, SL, SetCCVT, Lt0, NeTrunc);

2120

2121

SDValue Add = DAG.getNode(ISD::SELECT, SL, MVT::f64, And, NegOne, Zero);

2122

return DAG.getNode(ISD::FADD, SL, MVT::f64, Trunc, Add);

2123

}

2124

Matt Arsenault

2014-10-03 23:54:41 +0000

[diff] [blame]

2125

SDValue AMDGPUTargetLowering::LowerINT_TO_FP64(SDValue Op, SelectionDAG &DAG,

2126

bool Signed) const {

2127

SDLoc SL(Op);

2128

SDValue Src = Op.getOperand(0);

2129

2130

SDValue BC = DAG.getNode(ISD::BITCAST, SL, MVT::v2i32, Src);

2131

2132

SDValue Lo = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, SL, MVT::i32, BC,

2133

DAG.getConstant(0, MVT::i32));

2134

SDValue Hi = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, SL, MVT::i32, BC,

2135

DAG.getConstant(1, MVT::i32));

2136

2137

SDValue CvtHi = DAG.getNode(Signed ? ISD::SINT_TO_FP : ISD::UINT_TO_FP,

2138

SL, MVT::f64, Hi);

2139

2140

SDValue CvtLo = DAG.getNode(ISD::UINT_TO_FP, SL, MVT::f64, Lo);

2141

2142

SDValue LdExp = DAG.getNode(AMDGPUISD::LDEXP, SL, MVT::f64, CvtHi,

2143

DAG.getConstant(32, MVT::i32));

2144

2145

return DAG.getNode(ISD::FADD, SL, MVT::f64, LdExp, CvtLo);

2146

}

2147

Tom Stellard

2013-10-30 17:22:05 +0000

[diff] [blame]

2148

SDValue AMDGPUTargetLowering::LowerUINT_TO_FP(SDValue Op,

2149

SelectionDAG &DAG) const {

2150

SDValue S0 = Op.getOperand(0);

Matt Arsenault

2014-10-03 23:54:41 +0000

[diff] [blame]

2151

if (S0.getValueType() != MVT::i64)

Tom Stellard

2013-10-30 17:22:05 +0000

[diff] [blame]

2152

return SDValue();

2153

Matt Arsenault

2014-10-03 23:54:41 +0000

[diff] [blame]

2154

EVT DestVT = Op.getValueType();

2155

if (DestVT == MVT::f64)

2156

return LowerINT_TO_FP64(Op, DAG, false);

2157

2158

assert(DestVT == MVT::f32);

SDLoc DL(Op);

Tom Stellard

2013-10-30 17:22:05 +0000

[diff] [blame]

2162

// f32 uint_to_fp i64

2163

SDValue Lo = DAG.getNode(ISD::EXTRACT_ELEMENT, DL, MVT::i32, S0,

2164

DAG.getConstant(0, MVT::i32));

2165

SDValue FloatLo = DAG.getNode(ISD::UINT_TO_FP, DL, MVT::f32, Lo);

2166

SDValue Hi = DAG.getNode(ISD::EXTRACT_ELEMENT, DL, MVT::i32, S0,

2167

DAG.getConstant(1, MVT::i32));

2168

SDValue FloatHi = DAG.getNode(ISD::UINT_TO_FP, DL, MVT::f32, Hi);

2169

FloatHi = DAG.getNode(ISD::FMUL, DL, MVT::f32, FloatHi,

2170

DAG.getConstantFP(4294967296.0f, MVT::f32)); // 2^32

2171

return DAG.getNode(ISD::FADD, DL, MVT::f32, FloatLo, FloatHi);

Tom Stellard

2013-10-30 17:22:05 +0000

[diff] [blame]

2172

}

Tom Stellard

fbab827

2013-08-16 01:12:11 +0000

[diff] [blame]

2173

Matt Arsenault

2014-10-03 23:54:41 +0000

[diff] [blame]

2174

SDValue AMDGPUTargetLowering::LowerSINT_TO_FP(SDValue Op,

2175

SelectionDAG &DAG) const {

2176

SDValue Src = Op.getOperand(0);

2177

if (Src.getValueType() == MVT::i64 && Op.getValueType() == MVT::f64)

2178

return LowerINT_TO_FP64(Op, DAG, true);

return SDValue();

}

Matt Arsenault

2014-10-03 23:54:56 +0000

[diff] [blame]

2183

SDValue AMDGPUTargetLowering::LowerFP64_TO_INT(SDValue Op, SelectionDAG &DAG,

bool Signed) const {

SDLoc SL(Op);

SDValue Src = Op.getOperand(0);

2188

2189

SDValue Trunc = DAG.getNode(ISD::FTRUNC, SL, MVT::f64, Src);

2190

2191

SDValue K0

2192

= DAG.getConstantFP(BitsToDouble(UINT64_C(0x3df0000000000000)), MVT::f64);

2193

SDValue K1

2194

= DAG.getConstantFP(BitsToDouble(UINT64_C(0xc1f0000000000000)), MVT::f64);

2195

2196

SDValue Mul = DAG.getNode(ISD::FMUL, SL, MVT::f64, Trunc, K0);

2197

2198

SDValue FloorMul = DAG.getNode(ISD::FFLOOR, SL, MVT::f64, Mul);

2199

2200

2201

SDValue Fma = DAG.getNode(ISD::FMA, SL, MVT::f64, FloorMul, K1, Trunc);

2202

2203

SDValue Hi = DAG.getNode(Signed ? ISD::FP_TO_SINT : ISD::FP_TO_UINT, SL,

2204

MVT::i32, FloorMul);

2205

SDValue Lo = DAG.getNode(ISD::FP_TO_UINT, SL, MVT::i32, Fma);

2206

2207

SDValue Result = DAG.getNode(ISD::BUILD_VECTOR, SL, MVT::v2i32, Lo, Hi);

2208

2209

return DAG.getNode(ISD::BITCAST, SL, MVT::i64, Result);

2210

}

2211

2212

SDValue AMDGPUTargetLowering::LowerFP_TO_SINT(SDValue Op,

2213

SelectionDAG &DAG) const {

2214

SDValue Src = Op.getOperand(0);

2215

2216

if (Op.getValueType() == MVT::i64 && Src.getValueType() == MVT::f64)

2217

return LowerFP64_TO_INT(Op, DAG, true);

return SDValue();

}

SDValue AMDGPUTargetLowering::LowerFP_TO_UINT(SDValue Op,

2223

SelectionDAG &DAG) const {

2224

SDValue Src = Op.getOperand(0);

2225

2226

if (Op.getValueType() == MVT::i64 && Src.getValueType() == MVT::f64)

2227

return LowerFP64_TO_INT(Op, DAG, false);

return SDValue();

}

Matt Arsenault

2014-03-17 18:58:11 +0000

[diff] [blame]

2232

SDValue AMDGPUTargetLowering::LowerSIGN_EXTEND_INREG(SDValue Op,

2233

SelectionDAG &DAG) const {

2234

EVT ExtraVT = cast<VTSDNode>(Op.getOperand(1))->getVT();

2235

MVT VT = Op.getSimpleValueType();

2236

MVT ScalarVT = VT.getScalarType();

2237

Matt Arsenault

2014-04-22 03:49:30 +0000

[diff] [blame]

2238

if (!VT.isVector())

2239

return SDValue();

Matt Arsenault

2014-03-17 18:58:11 +0000

[diff] [blame]

2240

2241

SDValue Src = Op.getOperand(0);

Matt Arsenault

2014-04-22 03:49:30 +0000

[diff] [blame]

2242

SDLoc DL(Op);

Matt Arsenault

2014-03-17 18:58:11 +0000

[diff] [blame]

2243

Matt Arsenault

2014-04-22 03:49:30 +0000

[diff] [blame]

2244

// TODO: Don't scalarize on Evergreen?

2245

unsigned NElts = VT.getVectorNumElements();

2246

SmallVector<SDValue, 8> Args;

2247

DAG.ExtractVectorElements(Src, Args, 0, NElts);

Matt Arsenault

2014-03-17 18:58:11 +0000

[diff] [blame]

2248

Matt Arsenault

2014-04-22 03:49:30 +0000

[diff] [blame]

2249

SDValue VTOp = DAG.getValueType(ExtraVT.getScalarType());

2250

for (unsigned I = 0; I < NElts; ++I)

2251

Args[I] = DAG.getNode(ISD::SIGN_EXTEND_INREG, DL, ScalarVT, Args[I], VTOp);

Matt Arsenault

2014-03-17 18:58:11 +0000

[diff] [blame]

2252

Craig Topper

2014-04-26 18:35:24 +0000

[diff] [blame]

2253

return DAG.getNode(ISD::BUILD_VECTOR, DL, VT, Args);

Matt Arsenault

2014-03-17 18:58:11 +0000

[diff] [blame]

2254

}

2255

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

2256

//===----------------------------------------------------------------------===//

Tom Stellard

2014-04-07 19:45:41 +0000

[diff] [blame]

2257

// Custom DAG optimizations

2258

//===----------------------------------------------------------------------===//

2259

2260

static bool isU24(SDValue Op, SelectionDAG &DAG) {

2261

APInt KnownZero, KnownOne;

2262

EVT VT = Op.getValueType();

Jay Foad

2014-05-14 21:14:37 +0000

[diff] [blame]

2263

DAG.computeKnownBits(Op, KnownZero, KnownOne);

Tom Stellard

2014-04-07 19:45:41 +0000

[diff] [blame]

2264

2265

return (VT.getSizeInBits() - KnownZero.countLeadingOnes()) <= 24;

2266

}

2267

2268

static bool isI24(SDValue Op, SelectionDAG &DAG) {

2269

EVT VT = Op.getValueType();

2270

2271

// In order for this to be a signed 24-bit value, bit 23, must

2272

// be a sign bit.

2273

return VT.getSizeInBits() >= 24 && // Types less than 24-bit should be treated

2274

// as unsigned 24-bit values.

2275

(VT.getSizeInBits() - DAG.ComputeNumSignBits(Op)) < 24;

2276

}

2277

2278

static void simplifyI24(SDValue Op, TargetLowering::DAGCombinerInfo &DCI) {

2279

2280

SelectionDAG &DAG = DCI.DAG;

2281

const TargetLowering &TLI = DAG.getTargetLoweringInfo();

2282

EVT VT = Op.getValueType();

2283

2284

APInt Demanded = APInt::getLowBitsSet(VT.getSizeInBits(), 24);

2285

APInt KnownZero, KnownOne;

2286

TargetLowering::TargetLoweringOpt TLO(DAG, true, true);

2287

if (TLI.SimplifyDemandedBits(Op, Demanded, KnownZero, KnownOne, TLO))

2288

DCI.CommitTargetLoweringOpt(TLO);

2289

}

2290

Matt Arsenault

2014-05-22 18:09:07 +0000

[diff] [blame]

2291

template <typename IntTy>

2292

static SDValue constantFoldBFE(SelectionDAG &DAG, IntTy Src0,

2293

uint32_t Offset, uint32_t Width) {

2294

if (Width + Offset < 32) {

Matt Arsenault

46cbc43

2014-09-19 00:42:06 +0000

[diff] [blame]

2295

uint32_t Shl = static_cast<uint32_t>(Src0) << (32 - Offset - Width);

2296

IntTy Result = static_cast<IntTy>(Shl) >> (32 - Width);

Matt Arsenault

2014-05-22 18:09:07 +0000

[diff] [blame]

2297

return DAG.getConstant(Result, MVT::i32);

2298

}

2299

2300

return DAG.getConstant(Src0 >> Offset, MVT::i32);

2301

}

2302

Matt Arsenault

2014-07-15 02:06:31 +0000

[diff] [blame]

2303

static bool usesAllNormalStores(SDNode *LoadVal) {

2304

for (SDNode::use_iterator I = LoadVal->use_begin(); !I.atEnd(); ++I) {

2305

if (!ISD::isNormalStore(*I))

return false;

}

return true;

}

// If we have a copy of an illegal type, replace it with a load / store of an

2313

// equivalently sized legal type. This avoids intermediate bit pack / unpack

2314

// instructions emitted when handling extloads and truncstores. Ideally we could

2315

// recognize the pack / unpack pattern to eliminate it.

2316

SDValue AMDGPUTargetLowering::performStoreCombine(SDNode *N,

2317

DAGCombinerInfo &DCI) const {

2318

if (!DCI.isBeforeLegalize())

2319

return SDValue();

2320

2321

StoreSDNode *SN = cast<StoreSDNode>(N);

2322

SDValue Value = SN->getValue();

2323

EVT VT = Value.getValueType();

2324

Matt Arsenault

28638f1

2014-11-23 02:57:52 +0000

[diff] [blame]

2325

if (isTypeLegal(VT) || SN->isVolatile() ||

2326

!ISD::isNormalLoad(Value.getNode()) || VT.getSizeInBits() < 8)

Matt Arsenault

2014-07-15 02:06:31 +0000

[diff] [blame]

2327

return SDValue();

2328

2329

LoadSDNode *LoadVal = cast<LoadSDNode>(Value);

2330

if (LoadVal->isVolatile() || !usesAllNormalStores(LoadVal))

2331

return SDValue();

2332

2333

EVT MemVT = LoadVal->getMemoryVT();

2334

2335

SDLoc SL(N);

2336

SelectionDAG &DAG = DCI.DAG;

2337

EVT LoadVT = getEquivalentMemType(*DAG.getContext(), MemVT);

2338

2339

SDValue NewLoad = DAG.getLoad(ISD::UNINDEXED, ISD::NON_EXTLOAD,

2340

LoadVT, SL,

2341

LoadVal->getChain(),

2342

LoadVal->getBasePtr(),

2343

LoadVal->getOffset(),

2344

LoadVT,

2345

LoadVal->getMemOperand());

2346

2347

SDValue CastLoad = DAG.getNode(ISD::BITCAST, SL, VT, NewLoad.getValue(0));

2348

DCI.CombineTo(LoadVal, CastLoad, NewLoad.getValue(1), false);

2349

2350

return DAG.getStore(SN->getChain(), SL, NewLoad,

2351

SN->getBasePtr(), SN->getMemOperand());

2352

}

2353

Matt Arsenault

d0e0f0a

2014-06-30 17:55:48 +0000

[diff] [blame]

2354

SDValue AMDGPUTargetLowering::performMulCombine(SDNode *N,

2355

DAGCombinerInfo &DCI) const {

2356

EVT VT = N->getValueType(0);

2357

2358

if (VT.isVector() || VT.getSizeInBits() > 32)

2359

return SDValue();

2360

2361

SelectionDAG &DAG = DCI.DAG;

2362

SDLoc DL(N);

2363

2364

SDValue N0 = N->getOperand(0);

2365

SDValue N1 = N->getOperand(1);

2366

SDValue Mul;

2367

2368

if (Subtarget->hasMulU24() && isU24(N0, DAG) && isU24(N1, DAG)) {

2369

N0 = DAG.getZExtOrTrunc(N0, DL, MVT::i32);

2370

N1 = DAG.getZExtOrTrunc(N1, DL, MVT::i32);

2371

Mul = DAG.getNode(AMDGPUISD::MUL_U24, DL, MVT::i32, N0, N1);

2372

} else if (Subtarget->hasMulI24() && isI24(N0, DAG) && isI24(N1, DAG)) {

2373

N0 = DAG.getSExtOrTrunc(N0, DL, MVT::i32);

2374

N1 = DAG.getSExtOrTrunc(N1, DL, MVT::i32);

2375

Mul = DAG.getNode(AMDGPUISD::MUL_I24, DL, MVT::i32, N0, N1);

} else {

return SDValue();

}

// We need to use sext even for MUL_U24, because MUL_U24 is used

2381

// for signed multiply of 8 and 16-bit types.

2382

return DAG.getSExtOrTrunc(Mul, DL, VT);

2383

}

2384

Tom Stellard

2014-04-07 19:45:41 +0000

[diff] [blame]

2385

SDValue AMDGPUTargetLowering::PerformDAGCombine(SDNode *N,

Matt Arsenault

2014-07-15 02:06:31 +0000

[diff] [blame]

2386

DAGCombinerInfo &DCI) const {

Tom Stellard

2014-04-07 19:45:41 +0000

[diff] [blame]

2387

SelectionDAG &DAG = DCI.DAG;

2388

SDLoc DL(N);

2389

2390

switch(N->getOpcode()) {

2391

default: break;

Matt Arsenault

d0e0f0a

2014-06-30 17:55:48 +0000

[diff] [blame]

2392

case ISD::MUL:

2393

return performMulCombine(N, DCI);

Tom Stellard

2014-04-07 19:45:41 +0000

[diff] [blame]

2394

case AMDGPUISD::MUL_I24:

2395

case AMDGPUISD::MUL_U24: {

2396

SDValue N0 = N->getOperand(0);

2397

SDValue N1 = N->getOperand(1);

2398

simplifyI24(N0, DCI);

2399

simplifyI24(N1, DCI);

2400

return SDValue();

2401

}

Matt Arsenault

2014-11-13 23:03:09 +0000

[diff] [blame]

2402

case ISD::SELECT: {

2403

SDValue Cond = N->getOperand(0);

Matt Arsenault

dc10307

2014-12-19 23:15:30 +0000

[diff] [blame]

2404

if (Cond.getOpcode() == ISD::SETCC && Cond.hasOneUse()) {

Matt Arsenault

2014-11-13 23:03:09 +0000

[diff] [blame]

2405

SDLoc DL(N);

2406

EVT VT = N->getValueType(0);

Matt Arsenault

2014-11-13 23:03:09 +0000

[diff] [blame]

2407

SDValue LHS = Cond.getOperand(0);

2408

SDValue RHS = Cond.getOperand(1);

2409

SDValue CC = Cond.getOperand(2);

2410

2411

SDValue True = N->getOperand(1);

2412

SDValue False = N->getOperand(2);

2413

Matt Arsenault

2014-12-12 02:30:37 +0000

[diff] [blame]

2414

if (VT == MVT::f32)

2415

return CombineFMinMaxLegacy(DL, VT, LHS, RHS, True, False, CC, DCI);

Matt Arsenault

2014-11-13 23:03:09 +0000

[diff] [blame]

2416

Matt Arsenault

d28a7fd

2014-11-14 18:30:06 +0000

[diff] [blame]

2417

// TODO: Implement min / max Evergreen instructions.

2418

if (VT == MVT::i32 &&

2419

Subtarget->getGeneration() >= AMDGPUSubtarget::SOUTHERN_ISLANDS) {

2420

return CombineIMinMax(DL, VT, LHS, RHS, True, False, CC, DAG);

2421

}

Tom Stellard

afa8b53

2014-05-09 16:42:16 +0000

[diff] [blame]

2422

}

Matt Arsenault

2014-11-13 23:03:09 +0000

[diff] [blame]

2423

2424

break;

2425

}

Matt Arsenault

2014-05-22 18:09:07 +0000

[diff] [blame]

2426

case AMDGPUISD::BFE_I32:

2427

case AMDGPUISD::BFE_U32: {

2428

assert(!N->getValueType(0).isVector() &&

2429

"Vector handling of BFE not implemented");

2430

ConstantSDNode *Width = dyn_cast<ConstantSDNode>(N->getOperand(2));

if (!Width)

break;

uint32_t WidthVal = Width->getZExtValue() & 0x1f;

2435

if (WidthVal == 0)

2436

return DAG.getConstant(0, MVT::i32);

2437

2438

ConstantSDNode *Offset = dyn_cast<ConstantSDNode>(N->getOperand(1));

if (!Offset)

break;

SDValue BitsFrom = N->getOperand(0);

2443

uint32_t OffsetVal = Offset->getZExtValue() & 0x1f;

2444

2445

bool Signed = N->getOpcode() == AMDGPUISD::BFE_I32;

2446

2447

if (OffsetVal == 0) {

2448

// This is already sign / zero extended, so try to fold away extra BFEs.

2449

unsigned SignBits = Signed ? (32 - WidthVal + 1) : (32 - WidthVal);

2450

2451

unsigned OpSignBits = DAG.ComputeNumSignBits(BitsFrom);

2452

if (OpSignBits >= SignBits)

2453

return BitsFrom;

Matt Arsenault

05e96f4

2014-05-22 18:09:12 +0000

[diff] [blame]

2454

2455

EVT SmallVT = EVT::getIntegerVT(*DAG.getContext(), WidthVal);

2456

if (Signed) {

2457

// This is a sign_extend_inreg. Replace it to take advantage of existing

2458

// DAG Combines. If not eliminated, we will match back to BFE during

2459

// selection.

2460

2461

// TODO: The sext_inreg of extended types ends, although we can could

2462

// handle them in a single BFE.

2463

return DAG.getNode(ISD::SIGN_EXTEND_INREG, DL, MVT::i32, BitsFrom,

2464

DAG.getValueType(SmallVT));

2465

}

2466

2467

return DAG.getZeroExtendInReg(BitsFrom, DL, SmallVT);

Matt Arsenault

2014-05-22 18:09:07 +0000

[diff] [blame]

2468

}

2469

Matt Arsenault

f179420

2014-10-15 05:07:00 +0000

[diff] [blame]

2470

if (ConstantSDNode *CVal = dyn_cast<ConstantSDNode>(BitsFrom)) {

Matt Arsenault

2014-05-22 18:09:07 +0000

[diff] [blame]

2471

if (Signed) {

2472

return constantFoldBFE<int32_t>(DAG,

Matt Arsenault

46cbc43

2014-09-19 00:42:06 +0000

[diff] [blame]

2473

CVal->getSExtValue(),

Matt Arsenault

2014-05-22 18:09:07 +0000

[diff] [blame]

OffsetVal,

WidthVal);

}

return constantFoldBFE<uint32_t>(DAG,

Matt Arsenault

6462f94

2014-09-18 15:52:26 +0000

[diff] [blame]

2479

CVal->getZExtValue(),

Matt Arsenault

2014-05-22 18:09:07 +0000

[diff] [blame]

OffsetVal,

WidthVal);

}

Matt Arsenault

2014-05-22 18:09:12 +0000

[diff] [blame]

2484

if ((OffsetVal + WidthVal) >= 32) {

2485

SDValue ShiftVal = DAG.getConstant(OffsetVal, MVT::i32);

2486

return DAG.getNode(Signed ? ISD::SRA : ISD::SRL, DL, MVT::i32,

BitsFrom, ShiftVal);

}

Matt Arsenault

2014-10-15 17:58:34 +0000

[diff] [blame]

2490

if (BitsFrom.hasOneUse()) {

Matt Arsenault

6de7af4

2014-10-15 23:37:42 +0000

[diff] [blame]

2491

APInt Demanded = APInt::getBitsSet(32,

2492

OffsetVal,

2493

OffsetVal + WidthVal);

2494

Matt Arsenault

7b68fdf

2014-10-15 17:58:34 +0000

[diff] [blame]

2495

APInt KnownZero, KnownOne;

2496

TargetLowering::TargetLoweringOpt TLO(DAG, !DCI.isBeforeLegalize(),

2497

!DCI.isBeforeLegalizeOps());

2498

const TargetLowering &TLI = DAG.getTargetLoweringInfo();

2499

if (TLO.ShrinkDemandedConstant(BitsFrom, Demanded) ||

2500

TLI.SimplifyDemandedBits(BitsFrom, Demanded,

2501

KnownZero, KnownOne, TLO)) {

2502

DCI.CommitTargetLoweringOpt(TLO);

2503

}

Matt Arsenault

2014-05-22 18:09:07 +0000

[diff] [blame]

}

break;

}

Matt Arsenault

2014-07-15 02:06:31 +0000

[diff] [blame]

2508

2509

case ISD::STORE:

2510

return performStoreCombine(N, DCI);

Tom Stellard

2014-04-07 19:45:41 +0000

[diff] [blame]

}

return SDValue();

}

//===----------------------------------------------------------------------===//

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

2516

// Helper functions

2517

//===----------------------------------------------------------------------===//

2518

Tom Stellard

2013-10-23 00:44:32 +0000

[diff] [blame]

2519

void AMDGPUTargetLowering::getOriginalFunctionArgs(

2520

SelectionDAG &DAG,

2521

const Function *F,

2522

const SmallVectorImpl<ISD::InputArg> &Ins,

2523

SmallVectorImpl<ISD::InputArg> &OrigIns) const {

2524

2525

for (unsigned i = 0, e = Ins.size(); i < e; ++i) {

2526

if (Ins[i].ArgVT == Ins[i].VT) {

2527

OrigIns.push_back(Ins[i]);

continue;

}

EVT VT;

if (Ins[i].ArgVT.isVector() && !Ins[i].VT.isVector()) {

2533

// Vector has been split into scalars.

2534

VT = Ins[i].ArgVT.getVectorElementType();

2535

} else if (Ins[i].VT.isVector() && Ins[i].ArgVT.isVector() &&

2536

Ins[i].ArgVT.getVectorElementType() !=

2537

Ins[i].VT.getVectorElementType()) {

2538

// Vector elements have been promoted

2539

VT = Ins[i].ArgVT;

2540

} else {

2541

// Vector has been spilt into smaller vectors.

VT = Ins[i].VT;

}

ISD::InputArg Arg(Ins[i].Flags, VT, VT, Ins[i].Used,

2546

Ins[i].OrigArgIndex, Ins[i].PartOffset);

2547

OrigIns.push_back(Arg);

}

}

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

2551

bool AMDGPUTargetLowering::isHWTrueValue(SDValue Op) const {

2552

if (ConstantFPSDNode * CFP = dyn_cast<ConstantFPSDNode>(Op)) {

2553

return CFP->isExactlyValue(1.0);

2554

}

2555

if (ConstantSDNode *C = dyn_cast<ConstantSDNode>(Op)) {

2556

return C->isAllOnesValue();

}

return false;

}

bool AMDGPUTargetLowering::isHWFalseValue(SDValue Op) const {

2562

if (ConstantFPSDNode * CFP = dyn_cast<ConstantFPSDNode>(Op)) {

2563

return CFP->getValueAPF().isZero();

2564

}

2565

if (ConstantSDNode *C = dyn_cast<ConstantSDNode>(Op)) {

2566

return C->isNullValue();

}

return false;

}

SDValue AMDGPUTargetLowering::CreateLiveInRegister(SelectionDAG &DAG,

2572

const TargetRegisterClass *RC,

2573

unsigned Reg, EVT VT) const {

2574

MachineFunction &MF = DAG.getMachineFunction();

2575

MachineRegisterInfo &MRI = MF.getRegInfo();

2576

unsigned VirtualRegister;

2577

if (!MRI.isLiveIn(Reg)) {

2578

VirtualRegister = MRI.createVirtualRegister(RC);

2579

MRI.addLiveIn(Reg, VirtualRegister);

2580

} else {

2581

VirtualRegister = MRI.getLiveInVirtReg(Reg);

2582

}

2583

return DAG.getRegister(VirtualRegister, VT);

2584

}

2585

2586

#define NODE_NAME_CASE(node) case AMDGPUISD::node: return #node;

2587

2588

const char* AMDGPUTargetLowering::getTargetNodeName(unsigned Opcode) const {

2589

switch (Opcode) {

Craig Topper

062a2ba

2014-04-25 05:30:21 +0000

[diff] [blame]

2590

default: return nullptr;

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

2591

// AMDIL DAG nodes

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

2592

NODE_NAME_CASE(CALL);

2593

NODE_NAME_CASE(UMUL);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

2594

NODE_NAME_CASE(RET_FLAG);

2595

NODE_NAME_CASE(BRANCH_COND);

2596

2597

// AMDGPU DAG nodes

2598

NODE_NAME_CASE(DWORDADDR)

2599

NODE_NAME_CASE(FRACT)

Matt Arsenault

2014-06-12 21:15:44 +0000

[diff] [blame]

2600

NODE_NAME_CASE(CLAMP)

Matt Arsenault

8675db1

2014-08-29 16:01:14 +0000

[diff] [blame]

2601

NODE_NAME_CASE(MAD)

Matt Arsenault

2014-11-13 23:03:09 +0000

[diff] [blame]

2602

NODE_NAME_CASE(FMAX_LEGACY)

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

2603

NODE_NAME_CASE(SMAX)

2604

NODE_NAME_CASE(UMAX)

Matt Arsenault

2014-11-13 23:03:09 +0000

[diff] [blame]

2605

NODE_NAME_CASE(FMIN_LEGACY)

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

2606

NODE_NAME_CASE(SMIN)

2607

NODE_NAME_CASE(UMIN)

Matt Arsenault

cc3c2b3

2014-11-14 20:08:52 +0000

[diff] [blame]

2608

NODE_NAME_CASE(FMAX3)

2609

NODE_NAME_CASE(SMAX3)

2610

NODE_NAME_CASE(UMAX3)

2611

NODE_NAME_CASE(FMIN3)

2612

NODE_NAME_CASE(SMIN3)

2613

NODE_NAME_CASE(UMIN3)

Matt Arsenault

2014-06-19 01:19:19 +0000

[diff] [blame]

2614

NODE_NAME_CASE(URECIP)

2615

NODE_NAME_CASE(DIV_SCALE)

2616

NODE_NAME_CASE(DIV_FMAS)

2617

NODE_NAME_CASE(DIV_FIXUP)

2618

NODE_NAME_CASE(TRIG_PREOP)

2619

NODE_NAME_CASE(RCP)

2620

NODE_NAME_CASE(RSQ)

Matt Arsenault

257d48d

2014-06-24 22:13:39 +0000

[diff] [blame]

2621

NODE_NAME_CASE(RSQ_LEGACY)

2622

NODE_NAME_CASE(RSQ_CLAMPED)

Matt Arsenault

2e7cc48

2014-08-15 17:30:25 +0000

[diff] [blame]

2623

NODE_NAME_CASE(LDEXP)

Matt Arsenault

4831ce5

2015-01-06 23:00:37 +0000

[diff] [blame]

2624

NODE_NAME_CASE(FP_CLASS)

Matt Arsenault

2014-06-19 01:19:19 +0000

[diff] [blame]

2625

NODE_NAME_CASE(DOT4)

Matt Arsenault

2014-03-17 18:58:11 +0000

[diff] [blame]

2626

NODE_NAME_CASE(BFE_U32)

2627

NODE_NAME_CASE(BFE_I32)

Matt Arsenault

b345836

2014-03-31 18:21:13 +0000

[diff] [blame]

2628

NODE_NAME_CASE(BFI)

2629

NODE_NAME_CASE(BFM)

Matt Arsenault

43160e7

2014-06-18 17:13:57 +0000

[diff] [blame]

2630

NODE_NAME_CASE(BREV)

Tom Stellard

2014-04-07 19:45:41 +0000

[diff] [blame]

2631

NODE_NAME_CASE(MUL_U24)

2632

NODE_NAME_CASE(MUL_I24)

Matt Arsenault

eb26020

2014-05-22 18:00:15 +0000

[diff] [blame]

2633

NODE_NAME_CASE(MAD_U24)

2634

NODE_NAME_CASE(MAD_I24)

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

2635

NODE_NAME_CASE(EXPORT)

Tom Stellard

ff62c35

2013-01-23 02:09:03 +0000

[diff] [blame]

2636

NODE_NAME_CASE(CONST_ADDRESS)

Tom Stellard

f3b2a1e

2013-02-06 17:32:29 +0000

[diff] [blame]

2637

NODE_NAME_CASE(REGISTER_LOAD)

2638

NODE_NAME_CASE(REGISTER_STORE)

Tom Stellard

9fa1791

2013-08-14 23:24:45 +0000

[diff] [blame]

2639

NODE_NAME_CASE(LOAD_CONSTANT)

2640

NODE_NAME_CASE(LOAD_INPUT)

2641

NODE_NAME_CASE(SAMPLE)

2642

NODE_NAME_CASE(SAMPLEB)

2643

NODE_NAME_CASE(SAMPLED)

2644

NODE_NAME_CASE(SAMPLEL)

Matt Arsenault

364a674

2014-06-11 17:50:44 +0000

[diff] [blame]

2645

NODE_NAME_CASE(CVT_F32_UBYTE0)

2646

NODE_NAME_CASE(CVT_F32_UBYTE1)

2647

NODE_NAME_CASE(CVT_F32_UBYTE2)

2648

NODE_NAME_CASE(CVT_F32_UBYTE3)

Tom Stellard

880a80a

2014-06-17 16:53:14 +0000

[diff] [blame]

2649

NODE_NAME_CASE(BUILD_VERTICAL_VECTOR)

Tom Stellard

067c815

2014-07-21 14:01:14 +0000

[diff] [blame]

2650

NODE_NAME_CASE(CONST_DATA_PTR)

Tom Stellard

d3ee8c1

2013-08-16 01:12:06 +0000

[diff] [blame]

2651

NODE_NAME_CASE(STORE_MSKOR)

Tom Stellard

afcf12f

2013-09-12 02:55:14 +0000

[diff] [blame]

2652

NODE_NAME_CASE(TBUFFER_STORE_FORMAT)

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

2653

}

2654

}

Matt Arsenault

2014-03-25 18:18:27 +0000

[diff] [blame]

2655

Matt Arsenault

e93d06a

2015-01-13 20:53:18 +0000

[diff] [blame]

2656

SDValue AMDGPUTargetLowering::getRsqrtEstimate(SDValue Operand,

2657

DAGCombinerInfo &DCI,

2658

unsigned &RefinementSteps,

2659

bool &UseOneConstNR) const {

2660

SelectionDAG &DAG = DCI.DAG;

2661

EVT VT = Operand.getValueType();

2662

2663

if (VT == MVT::f32) {

2664

RefinementSteps = 0;

2665

return DAG.getNode(AMDGPUISD::RSQ, SDLoc(Operand), VT, Operand);

2666

}

2667

2668

// TODO: There is also f64 rsq instruction, but the documentation is less

2669

// clear on its precision.

return SDValue();

}

Matt Arsenault

2015-01-13 20:53:23 +0000

[diff] [blame]

2674

SDValue AMDGPUTargetLowering::getRecipEstimate(SDValue Operand,

2675

DAGCombinerInfo &DCI,

2676

unsigned &RefinementSteps) const {

2677

SelectionDAG &DAG = DCI.DAG;

2678

EVT VT = Operand.getValueType();

2679

2680

if (VT == MVT::f32) {

2681

// Reciprocal, < 1 ulp error.

2682

//

2683

// This reciprocal approximation converges to < 0.5 ulp error with one

2684

// newton rhapson performed with two fused multiple adds (FMAs).

2685

2686

RefinementSteps = 0;

2687

return DAG.getNode(AMDGPUISD::RCP, SDLoc(Operand), VT, Operand);

2688

}

2689

2690

// TODO: There is also f64 rcp instruction, but the documentation is less

2691

// clear on its precision.

return SDValue();

}

Jay Foad

2014-05-14 21:14:37 +0000

[diff] [blame]

2696

static void computeKnownBitsForMinMax(const SDValue Op0,

const SDValue Op1,

APInt &KnownZero,

APInt &KnownOne,

const SelectionDAG &DAG,

2701

unsigned Depth) {

Matt Arsenault

2014-03-31 19:35:33 +0000

[diff] [blame]

2702

APInt Op0Zero, Op0One;

2703

APInt Op1Zero, Op1One;

Jay Foad

2014-05-14 21:14:37 +0000

[diff] [blame]

2704

DAG.computeKnownBits(Op0, Op0Zero, Op0One, Depth);

2705

DAG.computeKnownBits(Op1, Op1Zero, Op1One, Depth);

Matt Arsenault

2014-03-31 19:35:33 +0000

[diff] [blame]

2706

2707

KnownZero = Op0Zero & Op1Zero;

2708

KnownOne = Op0One & Op1One;

2709

}

2710

Jay Foad

2014-05-14 21:14:37 +0000

[diff] [blame]

2711

void AMDGPUTargetLowering::computeKnownBitsForTargetNode(

Matt Arsenault

2014-03-25 18:18:27 +0000

[diff] [blame]

const SDValue Op,

APInt &KnownZero,

APInt &KnownOne,

const SelectionDAG &DAG,

2716

unsigned Depth) const {

Matt Arsenault

2014-03-31 19:35:33 +0000

[diff] [blame]

2717

Matt Arsenault

2014-03-25 18:18:27 +0000

[diff] [blame]

2718

KnownZero = KnownOne = APInt(KnownOne.getBitWidth(), 0); // Don't know anything.

Matt Arsenault

2014-05-22 18:09:00 +0000

[diff] [blame]

2719

2720

APInt KnownZero2;

2721

APInt KnownOne2;

Matt Arsenault

2014-03-31 19:35:33 +0000

[diff] [blame]

2722

unsigned Opc = Op.getOpcode();

Matt Arsenault

2014-05-22 18:09:00 +0000

[diff] [blame]

2723

Matt Arsenault

2014-03-31 19:35:33 +0000

[diff] [blame]

2724

switch (Opc) {

Matt Arsenault

2014-05-22 18:09:00 +0000

[diff] [blame]

2725

default:

2726

break;

Matt Arsenault

2014-03-31 19:35:33 +0000

[diff] [blame]

2727

case ISD::INTRINSIC_WO_CHAIN: {

2728

// FIXME: The intrinsic should just use the node.

2729

switch (cast<ConstantSDNode>(Op.getOperand(0))->getZExtValue()) {

2730

case AMDGPUIntrinsic::AMDGPU_imax:

2731

case AMDGPUIntrinsic::AMDGPU_umax:

2732

case AMDGPUIntrinsic::AMDGPU_imin:

2733

case AMDGPUIntrinsic::AMDGPU_umin:

Jay Foad

2014-05-14 21:14:37 +0000

[diff] [blame]

2734

computeKnownBitsForMinMax(Op.getOperand(1), Op.getOperand(2),

2735

KnownZero, KnownOne, DAG, Depth);

Matt Arsenault

2014-03-31 19:35:33 +0000

[diff] [blame]

break;

default:

break;

}

break;

}

case AMDGPUISD::SMAX:

2744

case AMDGPUISD::UMAX:

2745

case AMDGPUISD::SMIN:

2746

case AMDGPUISD::UMIN:

Jay Foad

2014-05-14 21:14:37 +0000

[diff] [blame]

2747

computeKnownBitsForMinMax(Op.getOperand(0), Op.getOperand(1),

2748

KnownZero, KnownOne, DAG, Depth);

Matt Arsenault

2014-03-31 19:35:33 +0000

[diff] [blame]

2749

break;

Matt Arsenault

2014-05-22 18:09:00 +0000

[diff] [blame]

2750

2751

case AMDGPUISD::BFE_I32:

2752

case AMDGPUISD::BFE_U32: {

2753

ConstantSDNode *CWidth = dyn_cast<ConstantSDNode>(Op.getOperand(2));

if (!CWidth)

return;

unsigned BitWidth = 32;

2758

uint32_t Width = CWidth->getZExtValue() & 0x1f;

Matt Arsenault

2014-05-22 18:09:00 +0000

[diff] [blame]

2759

Matt Arsenault

a3fe7c6

2014-10-16 20:07:40 +0000

[diff] [blame]

2760

if (Opc == AMDGPUISD::BFE_U32)

Matt Arsenault

2014-05-22 18:09:00 +0000

[diff] [blame]

2761

KnownZero = APInt::getHighBitsSet(BitWidth, BitWidth - Width);

2762

Matt Arsenault

2014-03-31 19:35:33 +0000

[diff] [blame]

2763

break;

2764

}

Matt Arsenault

2014-05-22 18:09:00 +0000

[diff] [blame]

2765

}

Matt Arsenault

2014-03-25 18:18:27 +0000

[diff] [blame]

2766

}

Matt Arsenault

bf8694d

2014-05-22 18:09:03 +0000

[diff] [blame]

2767

2768

unsigned AMDGPUTargetLowering::ComputeNumSignBitsForTargetNode(

2769

SDValue Op,

2770

const SelectionDAG &DAG,

2771

unsigned Depth) const {

2772

switch (Op.getOpcode()) {

2773

case AMDGPUISD::BFE_I32: {

2774

ConstantSDNode *Width = dyn_cast<ConstantSDNode>(Op.getOperand(2));

if (!Width)

return 1;

unsigned SignBits = 32 - Width->getZExtValue() + 1;

2779

ConstantSDNode *Offset = dyn_cast<ConstantSDNode>(Op.getOperand(1));

2780

if (!Offset || !Offset->isNullValue())

2781

return SignBits;

2782

2783

// TODO: Could probably figure something out with non-0 offsets.

2784

unsigned Op0SignBits = DAG.ComputeNumSignBits(Op.getOperand(0), Depth + 1);

2785

return std::max(SignBits, Op0SignBits);

2786

}

2787

Matt Arsenault