Blame - llvm/lib/Target/R600/SIInstrInfo.cpp - toolchain/llvm-project

2012-12-11 21:25:42 +0000

[diff] [blame]

1

//===-- SIInstrInfo.cpp - SI Instruction Information ---------------------===//

2

//

3

// The LLVM Compiler Infrastructure

4

//

5

// This file is distributed under the University of Illinois Open Source

6

// License. See LICENSE.TXT for details.

7

//

8

//===----------------------------------------------------------------------===//

9

//

10

/// \file

11

/// \brief SI Implementation of TargetInstrInfo.

12

//

13

//===----------------------------------------------------------------------===//

14

15

16

#include "SIInstrInfo.h"

17

#include "AMDGPUTargetMachine.h"

Tom Stellard

16a9a20

2013-08-14 23:24:17 +0000

[diff] [blame]

18

#include "SIDefines.h"

Tom Stellard

2013-11-27 21:23:35 +0000

[diff] [blame]

19

#include "SIMachineFunctionInfo.h"

Tom Stellard

2014-08-21 20:40:54 +0000

[diff] [blame]

20

#include "llvm/CodeGen/MachineFrameInfo.h"

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

21

#include "llvm/CodeGen/MachineInstrBuilder.h"

22

#include "llvm/CodeGen/MachineRegisterInfo.h"

Tom Stellard

2014-06-10 21:20:41 +0000

[diff] [blame]

23

#include "llvm/IR/Function.h"

Tom Stellard

2014-09-24 01:33:17 +0000

[diff] [blame]

24

#include "llvm/CodeGen/RegisterScavenging.h"

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

25

#include "llvm/MC/MCInstrDesc.h"

Matt Arsenault

c09cc3c

2014-11-19 00:01:31 +0000

[diff] [blame]

26

#include "llvm/Support/Debug.h"

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

27

28

using namespace llvm;

29

Tom Stellard

2e59a45

2014-06-13 01:32:00 +0000

[diff] [blame]

30

SIInstrInfo::SIInstrInfo(const AMDGPUSubtarget &st)

31

: AMDGPUInstrInfo(st),

32

RI(st) { }

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

33

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

34

//===----------------------------------------------------------------------===//

35

// TargetInstrInfo callbacks

36

//===----------------------------------------------------------------------===//

37

Matt Arsenault

2014-08-06 00:29:43 +0000

[diff] [blame]

38

static unsigned getNumOperandsNoGlue(SDNode *Node) {

39

unsigned N = Node->getNumOperands();

40

while (N && Node->getOperand(N - 1).getValueType() == MVT::Glue)

--N;

return N;

}

static SDValue findChainOperand(SDNode *Load) {

46

SDValue LastOp = Load->getOperand(getNumOperandsNoGlue(Load) - 1);

47

assert(LastOp.getValueType() == MVT::Other && "Chain missing from load node");

return LastOp;

}

Tom Stellard

2014-08-11 22:18:17 +0000

[diff] [blame]

51

/// \brief Returns true if both nodes have the same value for the given

52

/// operand \p Op, or if both nodes do not have this operand.

53

static bool nodesHaveSameOperandValue(SDNode *N0, SDNode* N1, unsigned OpName) {

54

unsigned Opc0 = N0->getMachineOpcode();

55

unsigned Opc1 = N1->getMachineOpcode();

56

57

int Op0Idx = AMDGPU::getNamedOperandIdx(Opc0, OpName);

58

int Op1Idx = AMDGPU::getNamedOperandIdx(Opc1, OpName);

59

60

if (Op0Idx == -1 && Op1Idx == -1)

return true;

if ((Op0Idx == -1 && Op1Idx != -1) ||

65

(Op1Idx == -1 && Op0Idx != -1))

66

return false;

67

68

// getNamedOperandIdx returns the index for the MachineInstr's operands,

69

// which includes the result as the first operand. We are indexing into the

70

// MachineSDNode's operands, so we need to skip the result operand to get

// the real index.

--Op0Idx;

--Op1Idx;

Tom Stellard

2014-09-03 15:22:39 +0000

[diff] [blame]

75

return N0->getOperand(Op0Idx) == N1->getOperand(Op1Idx);

Tom Stellard

2014-08-11 22:18:17 +0000

[diff] [blame]

76

}

77

Matt Arsenault

2014-08-06 00:29:43 +0000

[diff] [blame]

78

bool SIInstrInfo::areLoadsFromSameBasePtr(SDNode *Load0, SDNode *Load1,

79

int64_t &Offset0,

80

int64_t &Offset1) const {

81

if (!Load0->isMachineOpcode() || !Load1->isMachineOpcode())

82

return false;

83

84

unsigned Opc0 = Load0->getMachineOpcode();

85

unsigned Opc1 = Load1->getMachineOpcode();

86

87

// Make sure both are actually loads.

88

if (!get(Opc0).mayLoad() || !get(Opc1).mayLoad())

89

return false;

90

91

if (isDS(Opc0) && isDS(Opc1)) {

Tom Stellard

20fa0be

2014-10-07 21:09:20 +0000

[diff] [blame]

92

93

// FIXME: Handle this case:

94

if (getNumOperandsNoGlue(Load0) != getNumOperandsNoGlue(Load1))

95

return false;

Matt Arsenault

2014-08-06 00:29:43 +0000

[diff] [blame]

96

Matt Arsenault

2014-08-06 00:29:43 +0000

[diff] [blame]

97

// Check base reg.

98

if (Load0->getOperand(1) != Load1->getOperand(1))

return false;

// Check chain.

if (findChainOperand(Load0) != findChainOperand(Load1))

103

return false;

104

Matt Arsenault

972c12a

2014-09-17 17:48:32 +0000

[diff] [blame]

105

// Skip read2 / write2 variants for simplicity.

106

// TODO: We should report true if the used offsets are adjacent (excluded

107

// st64 versions).

108

if (AMDGPU::getNamedOperandIdx(Opc0, AMDGPU::OpName::data1) != -1 ||

109

AMDGPU::getNamedOperandIdx(Opc1, AMDGPU::OpName::data1) != -1)

110

return false;

111

Matt Arsenault

2014-08-06 00:29:43 +0000

[diff] [blame]

112

Offset0 = cast<ConstantSDNode>(Load0->getOperand(2))->getZExtValue();

113

Offset1 = cast<ConstantSDNode>(Load1->getOperand(2))->getZExtValue();

return true;

}

if (isSMRD(Opc0) && isSMRD(Opc1)) {

118

assert(getNumOperandsNoGlue(Load0) == getNumOperandsNoGlue(Load1));

119

120

// Check base reg.

121

if (Load0->getOperand(0) != Load1->getOperand(0))

return false;

// Check chain.

if (findChainOperand(Load0) != findChainOperand(Load1))

126

return false;

127

128

Offset0 = cast<ConstantSDNode>(Load0->getOperand(1))->getZExtValue();

129

Offset1 = cast<ConstantSDNode>(Load1->getOperand(1))->getZExtValue();

return true;

}

// MUBUF and MTBUF can access the same addresses.

134

if ((isMUBUF(Opc0) || isMTBUF(Opc0)) && (isMUBUF(Opc1) || isMTBUF(Opc1))) {

Matt Arsenault

2014-08-06 00:29:43 +0000

[diff] [blame]

135

136

// MUBUF and MTBUF have vaddr at different indices.

Tom Stellard

2014-08-11 22:18:17 +0000

[diff] [blame]

137

if (!nodesHaveSameOperandValue(Load0, Load1, AMDGPU::OpName::soffset) ||

138

findChainOperand(Load0) != findChainOperand(Load1) ||

139

!nodesHaveSameOperandValue(Load0, Load1, AMDGPU::OpName::vaddr) ||

Tom Stellard

b8b8413

2014-09-03 15:22:39 +0000

[diff] [blame]

140

!nodesHaveSameOperandValue(Load0, Load1, AMDGPU::OpName::srsrc))

Matt Arsenault

2014-08-06 00:29:43 +0000

[diff] [blame]

141

return false;

142

Tom Stellard

2014-08-11 22:18:17 +0000

[diff] [blame]

143

int OffIdx0 = AMDGPU::getNamedOperandIdx(Opc0, AMDGPU::OpName::offset);

144

int OffIdx1 = AMDGPU::getNamedOperandIdx(Opc1, AMDGPU::OpName::offset);

145

146

if (OffIdx0 == -1 || OffIdx1 == -1)

147

return false;

148

149

// getNamedOperandIdx returns the index for MachineInstrs. Since they

150

// inlcude the output in the operand list, but SDNodes don't, we need to

151

// subtract the index by one.

--OffIdx0;

--OffIdx1;

SDValue Off0 = Load0->getOperand(OffIdx0);

156

SDValue Off1 = Load1->getOperand(OffIdx1);

157

158

// The offset might be a FrameIndexSDNode.

159

if (!isa<ConstantSDNode>(Off0) || !isa<ConstantSDNode>(Off1))

160

return false;

161

162

Offset0 = cast<ConstantSDNode>(Off0)->getZExtValue();

163

Offset1 = cast<ConstantSDNode>(Off1)->getZExtValue();

Matt Arsenault

2014-08-06 00:29:43 +0000

[diff] [blame]

return true;

}

return false;

}

Matt Arsenault

2014-09-10 23:26:16 +0000

[diff] [blame]

170

static bool isStride64(unsigned Opc) {

171

switch (Opc) {

172

case AMDGPU::DS_READ2ST64_B32:

173

case AMDGPU::DS_READ2ST64_B64:

174

case AMDGPU::DS_WRITE2ST64_B32:

175

case AMDGPU::DS_WRITE2ST64_B64:

return true;

default:

return false;

}

}

Matt Arsenault

2014-07-29 21:34:55 +0000

[diff] [blame]

182

bool SIInstrInfo::getLdStBaseRegImmOfs(MachineInstr *LdSt,

183

unsigned &BaseReg, unsigned &Offset,

184

const TargetRegisterInfo *TRI) const {

185

unsigned Opc = LdSt->getOpcode();

186

if (isDS(Opc)) {

Matt Arsenault

2014-07-29 21:34:55 +0000

[diff] [blame]

187

const MachineOperand *OffsetImm = getNamedOperand(*LdSt,

188

AMDGPU::OpName::offset);

Matt Arsenault

2014-07-30 01:01:10 +0000

[diff] [blame]

189

if (OffsetImm) {

190

// Normal, single offset LDS instruction.

191

const MachineOperand *AddrReg = getNamedOperand(*LdSt,

192

AMDGPU::OpName::addr);

Matt Arsenault

2014-07-29 21:34:55 +0000

[diff] [blame]

193

Matt Arsenault

2014-07-30 01:01:10 +0000

[diff] [blame]

194

BaseReg = AddrReg->getReg();

195

Offset = OffsetImm->getImm();

196

return true;

Matt Arsenault

2014-07-29 21:34:55 +0000

[diff] [blame]

197

}

198

Matt Arsenault

2014-07-30 01:01:10 +0000

[diff] [blame]

199

// The 2 offset instructions use offset0 and offset1 instead. We can treat

200

// these as a load with a single offset if the 2 offsets are consecutive. We

201

// will use this for some partially aligned loads.

202

const MachineOperand *Offset0Imm = getNamedOperand(*LdSt,

203

AMDGPU::OpName::offset0);

204

const MachineOperand *Offset1Imm = getNamedOperand(*LdSt,

205

AMDGPU::OpName::offset1);

Matt Arsenault

2014-07-29 21:34:55 +0000

[diff] [blame]

206

Matt Arsenault

2014-07-30 01:01:10 +0000

[diff] [blame]

207

uint8_t Offset0 = Offset0Imm->getImm();

208

uint8_t Offset1 = Offset1Imm->getImm();

209

assert(Offset1 > Offset0);

210

211

if (Offset1 - Offset0 == 1) {

212

// Each of these offsets is in element sized units, so we need to convert

213

// to bytes of the individual reads.

unsigned EltSize;

if (LdSt->mayLoad())

EltSize = getOpRegClass(*LdSt, 0)->getSize() / 2;

218

else {

219

assert(LdSt->mayStore());

220

int Data0Idx = AMDGPU::getNamedOperandIdx(Opc, AMDGPU::OpName::data0);

221

EltSize = getOpRegClass(*LdSt, Data0Idx)->getSize();

222

}

223

Matt Arsenault

2e99112

2014-09-10 23:26:16 +0000

[diff] [blame]

if (isStride64(Opc))

EltSize *= 64;

Matt Arsenault

2014-07-30 01:01:10 +0000

[diff] [blame]

227

const MachineOperand *AddrReg = getNamedOperand(*LdSt,

228

AMDGPU::OpName::addr);

229

BaseReg = AddrReg->getReg();

230

Offset = EltSize * Offset0;

return true;

}

return false;

Matt Arsenault

2014-07-29 21:34:55 +0000

[diff] [blame]

235

}

236

237

if (isMUBUF(Opc) || isMTBUF(Opc)) {

238

if (AMDGPU::getNamedOperandIdx(Opc, AMDGPU::OpName::soffset) != -1)

239

return false;

240

241

const MachineOperand *AddrReg = getNamedOperand(*LdSt,

242

AMDGPU::OpName::vaddr);

if (!AddrReg)

return false;

const MachineOperand *OffsetImm = getNamedOperand(*LdSt,

247

AMDGPU::OpName::offset);

248

BaseReg = AddrReg->getReg();

249

Offset = OffsetImm->getImm();

return true;

}

if (isSMRD(Opc)) {

const MachineOperand *OffsetImm = getNamedOperand(*LdSt,

255

AMDGPU::OpName::offset);

if (!OffsetImm)

return false;

const MachineOperand *SBaseReg = getNamedOperand(*LdSt,

260

AMDGPU::OpName::sbase);

261

BaseReg = SBaseReg->getReg();

262

Offset = OffsetImm->getImm();

return true;

}

return false;

}

Matt Arsenault

2014-09-17 17:48:30 +0000

[diff] [blame]

269

bool SIInstrInfo::shouldClusterLoads(MachineInstr *FirstLdSt,

270

MachineInstr *SecondLdSt,

271

unsigned NumLoads) const {

272

unsigned Opc0 = FirstLdSt->getOpcode();

273

unsigned Opc1 = SecondLdSt->getOpcode();

274

275

// TODO: This needs finer tuning

if (NumLoads > 4)

return false;

if (isDS(Opc0) && isDS(Opc1))

280

return true;

281

282

if (isSMRD(Opc0) && isSMRD(Opc1))

283

return true;

284

285

if ((isMUBUF(Opc0) || isMTBUF(Opc0)) && (isMUBUF(Opc1) || isMTBUF(Opc1)))

return true;

return false;

}

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

291

void

292

SIInstrInfo::copyPhysReg(MachineBasicBlock &MBB,

Christian Konig

2013-03-01 09:46:27 +0000

[diff] [blame]

293

MachineBasicBlock::iterator MI, DebugLoc DL,

294

unsigned DestReg, unsigned SrcReg,

295

bool KillSrc) const {

296

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

297

// If we are trying to copy to or from SCC, there is a bug somewhere else in

298

// the backend. While it may be theoretically possible to do this, it should

299

// never be necessary.

300

assert(DestReg != AMDGPU::SCC && SrcReg != AMDGPU::SCC);

301

Craig Topper

2013-07-15 06:39:13 +0000

[diff] [blame]

302

static const int16_t Sub0_15[] = {

Christian Konig

2013-03-01 09:46:27 +0000

[diff] [blame]

303

AMDGPU::sub0, AMDGPU::sub1, AMDGPU::sub2, AMDGPU::sub3,

304

AMDGPU::sub4, AMDGPU::sub5, AMDGPU::sub6, AMDGPU::sub7,

305

AMDGPU::sub8, AMDGPU::sub9, AMDGPU::sub10, AMDGPU::sub11,

306

AMDGPU::sub12, AMDGPU::sub13, AMDGPU::sub14, AMDGPU::sub15, 0

307

};

308

Craig Topper

2013-07-15 06:39:13 +0000

[diff] [blame]

309

static const int16_t Sub0_7[] = {

Christian Konig

2013-03-01 09:46:27 +0000

[diff] [blame]

310

AMDGPU::sub0, AMDGPU::sub1, AMDGPU::sub2, AMDGPU::sub3,

311

AMDGPU::sub4, AMDGPU::sub5, AMDGPU::sub6, AMDGPU::sub7, 0

312

};

313

Craig Topper

2013-07-15 06:39:13 +0000

[diff] [blame]

314

static const int16_t Sub0_3[] = {

Christian Konig

2013-03-01 09:46:27 +0000

[diff] [blame]

315

AMDGPU::sub0, AMDGPU::sub1, AMDGPU::sub2, AMDGPU::sub3, 0

316

};

317

Craig Topper

2013-07-15 06:39:13 +0000

[diff] [blame]

318

static const int16_t Sub0_2[] = {

Christian Konig

8b1ed28

2013-04-10 08:39:16 +0000

[diff] [blame]

319

AMDGPU::sub0, AMDGPU::sub1, AMDGPU::sub2, 0

320

};

321

Craig Topper

2013-07-15 06:39:13 +0000

[diff] [blame]

322

static const int16_t Sub0_1[] = {

Christian Konig

2013-03-01 09:46:27 +0000

[diff] [blame]

323

AMDGPU::sub0, AMDGPU::sub1, 0

};

unsigned Opcode;

const int16_t *SubIndices;

328

329

if (AMDGPU::SReg_32RegClass.contains(DestReg)) {

330

assert(AMDGPU::SReg_32RegClass.contains(SrcReg));

331

BuildMI(MBB, MI, DL, get(AMDGPU::S_MOV_B32), DestReg)

332

.addReg(SrcReg, getKillRegState(KillSrc));

333

return;

334

Tom Stellard

aac1889

2013-02-07 19:39:43 +0000

[diff] [blame]

335

} else if (AMDGPU::SReg_64RegClass.contains(DestReg)) {

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

336

assert(AMDGPU::SReg_64RegClass.contains(SrcReg));

337

BuildMI(MBB, MI, DL, get(AMDGPU::S_MOV_B64), DestReg)

338

.addReg(SrcReg, getKillRegState(KillSrc));

Christian Konig

2013-03-01 09:46:27 +0000

[diff] [blame]

339

return;

340

341

} else if (AMDGPU::SReg_128RegClass.contains(DestReg)) {

342

assert(AMDGPU::SReg_128RegClass.contains(SrcReg));

343

Opcode = AMDGPU::S_MOV_B32;

344

SubIndices = Sub0_3;

345

346

} else if (AMDGPU::SReg_256RegClass.contains(DestReg)) {

347

assert(AMDGPU::SReg_256RegClass.contains(SrcReg));

348

Opcode = AMDGPU::S_MOV_B32;

349

SubIndices = Sub0_7;

350

351

} else if (AMDGPU::SReg_512RegClass.contains(DestReg)) {

352

assert(AMDGPU::SReg_512RegClass.contains(SrcReg));

353

Opcode = AMDGPU::S_MOV_B32;

354

SubIndices = Sub0_15;

355

Tom Stellard

2015-01-07 20:59:25 +0000

[diff] [blame]

356

} else if (AMDGPU::VGPR_32RegClass.contains(DestReg)) {

357

assert(AMDGPU::VGPR_32RegClass.contains(SrcReg) ||

NAKAMURA Takumi

2013-10-28 04:07:23 +0000

[diff] [blame]

358

AMDGPU::SReg_32RegClass.contains(SrcReg));

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

359

BuildMI(MBB, MI, DL, get(AMDGPU::V_MOV_B32_e32), DestReg)

360

.addReg(SrcReg, getKillRegState(KillSrc));

Christian Konig

2013-03-01 09:46:27 +0000

[diff] [blame]

361

return;

362

363

} else if (AMDGPU::VReg_64RegClass.contains(DestReg)) {

364

assert(AMDGPU::VReg_64RegClass.contains(SrcReg) ||

NAKAMURA Takumi

2013-10-28 04:07:23 +0000

[diff] [blame]

365

AMDGPU::SReg_64RegClass.contains(SrcReg));

Christian Konig

2013-03-01 09:46:27 +0000

[diff] [blame]

366

Opcode = AMDGPU::V_MOV_B32_e32;

367

SubIndices = Sub0_1;

368

Christian Konig

8b1ed28

2013-04-10 08:39:16 +0000

[diff] [blame]

369

} else if (AMDGPU::VReg_96RegClass.contains(DestReg)) {

370

assert(AMDGPU::VReg_96RegClass.contains(SrcReg));

371

Opcode = AMDGPU::V_MOV_B32_e32;

372

SubIndices = Sub0_2;

373

Christian Konig

2013-03-01 09:46:27 +0000

[diff] [blame]

374

} else if (AMDGPU::VReg_128RegClass.contains(DestReg)) {

375

assert(AMDGPU::VReg_128RegClass.contains(SrcReg) ||

NAKAMURA Takumi

2013-10-28 04:07:23 +0000

[diff] [blame]

376

AMDGPU::SReg_128RegClass.contains(SrcReg));

Christian Konig

2013-03-01 09:46:27 +0000

[diff] [blame]

377

Opcode = AMDGPU::V_MOV_B32_e32;

378

SubIndices = Sub0_3;

379

380

} else if (AMDGPU::VReg_256RegClass.contains(DestReg)) {

381

assert(AMDGPU::VReg_256RegClass.contains(SrcReg) ||

NAKAMURA Takumi

2013-10-28 04:07:23 +0000

[diff] [blame]

382

AMDGPU::SReg_256RegClass.contains(SrcReg));

Christian Konig

2013-03-01 09:46:27 +0000

[diff] [blame]

383

Opcode = AMDGPU::V_MOV_B32_e32;

384

SubIndices = Sub0_7;

385

386

} else if (AMDGPU::VReg_512RegClass.contains(DestReg)) {

387

assert(AMDGPU::VReg_512RegClass.contains(SrcReg) ||

NAKAMURA Takumi

2013-10-28 04:07:23 +0000

[diff] [blame]

388

AMDGPU::SReg_512RegClass.contains(SrcReg));

Christian Konig

2013-03-01 09:46:27 +0000

[diff] [blame]

389

Opcode = AMDGPU::V_MOV_B32_e32;

390

SubIndices = Sub0_15;

391

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

392

} else {

Christian Konig

2013-03-01 09:46:27 +0000

[diff] [blame]

393

llvm_unreachable("Can't copy register!");

394

}

395

396

while (unsigned SubIdx = *SubIndices++) {

397

MachineInstrBuilder Builder = BuildMI(MBB, MI, DL,

398

get(Opcode), RI.getSubReg(DestReg, SubIdx));

399

400

Builder.addReg(RI.getSubReg(SrcReg, SubIdx), getKillRegState(KillSrc));

401

402

if (*SubIndices)

403

Builder.addReg(DestReg, RegState::Define | RegState::Implicit);

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

}

}

Christian Konig

2013-03-27 09:12:59 +0000

[diff] [blame]

407

unsigned SIInstrInfo::commuteOpcode(unsigned Opcode) const {

Christian Konig

3c14580

2013-03-27 09:12:59 +0000

[diff] [blame]

408

int NewOpc;

409

410

// Try to map original to commuted opcode

411

if ((NewOpc = AMDGPU::getCommuteRev(Opcode)) != -1)

412

return NewOpc;

413

414

// Try to map commuted to original opcode

415

if ((NewOpc = AMDGPU::getCommuteOrig(Opcode)) != -1)

return NewOpc;

return Opcode;

}

Tom Stellard

2015-01-07 19:56:17 +0000

[diff] [blame]

421

unsigned SIInstrInfo::getMovOpcode(const TargetRegisterClass *DstRC) const {

422

423

if (DstRC->getSize() == 4) {

424

return RI.isSGPRClass(DstRC) ? AMDGPU::S_MOV_B32 : AMDGPU::V_MOV_B32_e32;

425

} else if (DstRC->getSize() == 8 && RI.isSGPRClass(DstRC)) {

426

return AMDGPU::S_MOV_B64;

Tom Stellard

4842c05

2015-01-07 20:27:25 +0000

[diff] [blame]

427

} else if (DstRC->getSize() == 8 && !RI.isSGPRClass(DstRC)) {

428

return AMDGPU::V_MOV_B64_PSEUDO;

Tom Stellard

ef3b864

2015-01-07 19:56:17 +0000

[diff] [blame]

}

return AMDGPU::COPY;

}

Tom Stellard

2013-11-27 21:23:35 +0000

[diff] [blame]

433

void SIInstrInfo::storeRegToStackSlot(MachineBasicBlock &MBB,

434

MachineBasicBlock::iterator MI,

435

unsigned SrcReg, bool isKill,

436

int FrameIndex,

437

const TargetRegisterClass *RC,

438

const TargetRegisterInfo *TRI) const {

Tom Stellard

2014-06-10 21:20:41 +0000

[diff] [blame]

439

MachineFunction *MF = MBB.getParent();

Tom Stellard

2015-01-14 15:42:31 +0000

[diff] [blame]

440

SIMachineFunctionInfo *MFI = MF->getInfo<SIMachineFunctionInfo>();

Tom Stellard

2014-08-21 20:40:54 +0000

[diff] [blame]

441

MachineFrameInfo *FrameInfo = MF->getFrameInfo();

Tom Stellard

2013-11-27 21:23:35 +0000

[diff] [blame]

442

DebugLoc DL = MBB.findDebugLoc(MI);

Tom Stellard

2014-09-24 01:33:17 +0000

[diff] [blame]

443

int Opcode = -1;

Tom Stellard

2013-11-27 21:23:35 +0000

[diff] [blame]

444

Tom Stellard

2014-09-24 01:33:17 +0000

[diff] [blame]

445

if (RI.isSGPRClass(RC)) {

Tom Stellard

2014-05-02 15:41:42 +0000

[diff] [blame]

446

// We are only allowed to create one new instruction when spilling

Tom Stellard

2014-08-21 20:40:54 +0000

[diff] [blame]

447

// registers, so we need to use pseudo instruction for spilling

448

// SGPRs.

Tom Stellard

2014-05-02 15:41:42 +0000

[diff] [blame]

449

switch (RC->getSize() * 8) {

Tom Stellard

2014-09-24 01:33:17 +0000

[diff] [blame]

450

case 32: Opcode = AMDGPU::SI_SPILL_S32_SAVE; break;

451

case 64: Opcode = AMDGPU::SI_SPILL_S64_SAVE; break;

452

case 128: Opcode = AMDGPU::SI_SPILL_S128_SAVE; break;

453

case 256: Opcode = AMDGPU::SI_SPILL_S256_SAVE; break;

454

case 512: Opcode = AMDGPU::SI_SPILL_S512_SAVE; break;

Tom Stellard

2013-11-27 21:23:35 +0000

[diff] [blame]

455

}

Tom Stellard

e99fb65

2015-01-20 19:33:04 +0000

[diff] [blame^]

456

} else if(RI.hasVGPRs(RC) && ST.isVGPRSpillingEnabled(MFI)) {

Tom Stellard

2015-01-14 15:42:31 +0000

[diff] [blame]

457

MFI->setHasSpilledVGPRs();

458

Tom Stellard

2014-09-24 01:33:17 +0000

[diff] [blame]

459

switch(RC->getSize() * 8) {

460

case 32: Opcode = AMDGPU::SI_SPILL_V32_SAVE; break;

461

case 64: Opcode = AMDGPU::SI_SPILL_V64_SAVE; break;

462

case 96: Opcode = AMDGPU::SI_SPILL_V96_SAVE; break;

463

case 128: Opcode = AMDGPU::SI_SPILL_V128_SAVE; break;

464

case 256: Opcode = AMDGPU::SI_SPILL_V256_SAVE; break;

465

case 512: Opcode = AMDGPU::SI_SPILL_V512_SAVE; break;

466

}

467

}

Tom Stellard

2014-05-02 15:41:42 +0000

[diff] [blame]

468

Tom Stellard

2014-09-24 01:33:17 +0000

[diff] [blame]

469

if (Opcode != -1) {

Tom Stellard

2014-08-21 20:40:54 +0000

[diff] [blame]

470

FrameInfo->setObjectAlignment(FrameIndex, 4);

471

BuildMI(MBB, MI, DL, get(Opcode))

Tom Stellard

2014-05-02 15:41:42 +0000

[diff] [blame]

472

.addReg(SrcReg)

Tom Stellard

2015-01-14 15:42:31 +0000

[diff] [blame]

473

.addFrameIndex(FrameIndex)

474

// Place-holder registers, these will be filled in by

475

// SIPrepareScratchRegs.

Tom Stellard

95292bb

2015-01-20 17:49:47 +0000

[diff] [blame]

476

.addReg(AMDGPU::SGPR0_SGPR1_SGPR2_SGPR3, RegState::Undef)

Tom Stellard

2015-01-14 15:42:31 +0000

[diff] [blame]

477

.addReg(AMDGPU::SGPR0, RegState::Undef);

Tom Stellard

2014-05-02 15:41:42 +0000

[diff] [blame]

478

} else {

Tom Stellard

2014-09-24 01:33:17 +0000

[diff] [blame]

479

LLVMContext &Ctx = MF->getFunction()->getContext();

480

Ctx.emitError("SIInstrInfo::storeRegToStackSlot - Do not know how to"

481

" spill register");

Tom Stellard

0febe68

2015-01-14 15:42:34 +0000

[diff] [blame]

482

BuildMI(MBB, MI, DL, get(AMDGPU::KILL))

Tom Stellard

2014-09-24 01:33:17 +0000

[diff] [blame]

483

.addReg(SrcReg);

Tom Stellard

2013-11-27 21:23:35 +0000

[diff] [blame]

}

}

void SIInstrInfo::loadRegFromStackSlot(MachineBasicBlock &MBB,

488

MachineBasicBlock::iterator MI,

489

unsigned DestReg, int FrameIndex,

490

const TargetRegisterClass *RC,

491

const TargetRegisterInfo *TRI) const {

Tom Stellard

2014-06-10 21:20:41 +0000

[diff] [blame]

492

MachineFunction *MF = MBB.getParent();

Tom Stellard

e99fb65

2015-01-20 19:33:04 +0000

[diff] [blame^]

493

const SIMachineFunctionInfo *MFI = MF->getInfo<SIMachineFunctionInfo>();

Tom Stellard

2014-08-21 20:40:54 +0000

[diff] [blame]

494

MachineFrameInfo *FrameInfo = MF->getFrameInfo();

Tom Stellard

2013-11-27 21:23:35 +0000

[diff] [blame]

495

DebugLoc DL = MBB.findDebugLoc(MI);

Tom Stellard

2014-09-24 01:33:17 +0000

[diff] [blame]

496

int Opcode = -1;

Tom Stellard

2014-06-10 21:20:41 +0000

[diff] [blame]

497

Tom Stellard

2014-09-24 01:33:17 +0000

[diff] [blame]

498

if (RI.isSGPRClass(RC)){

Tom Stellard

2014-05-02 15:41:42 +0000

[diff] [blame]

499

switch(RC->getSize() * 8) {

Tom Stellard

2014-09-24 01:33:17 +0000

[diff] [blame]

500

case 32: Opcode = AMDGPU::SI_SPILL_S32_RESTORE; break;

501

case 64: Opcode = AMDGPU::SI_SPILL_S64_RESTORE; break;

502

case 128: Opcode = AMDGPU::SI_SPILL_S128_RESTORE; break;

503

case 256: Opcode = AMDGPU::SI_SPILL_S256_RESTORE; break;

504

case 512: Opcode = AMDGPU::SI_SPILL_S512_RESTORE; break;

Tom Stellard

2013-11-27 21:23:35 +0000

[diff] [blame]

505

}

Tom Stellard

e99fb65

2015-01-20 19:33:04 +0000

[diff] [blame^]

506

} else if(RI.hasVGPRs(RC) && ST.isVGPRSpillingEnabled(MFI)) {

Tom Stellard

2014-09-24 01:33:17 +0000

[diff] [blame]

507

switch(RC->getSize() * 8) {

508

case 32: Opcode = AMDGPU::SI_SPILL_V32_RESTORE; break;

509

case 64: Opcode = AMDGPU::SI_SPILL_V64_RESTORE; break;

510

case 96: Opcode = AMDGPU::SI_SPILL_V96_RESTORE; break;

511

case 128: Opcode = AMDGPU::SI_SPILL_V128_RESTORE; break;

512

case 256: Opcode = AMDGPU::SI_SPILL_V256_RESTORE; break;

513

case 512: Opcode = AMDGPU::SI_SPILL_V512_RESTORE; break;

514

}

515

}

Tom Stellard

2014-05-02 15:41:42 +0000

[diff] [blame]

516

Tom Stellard

2014-09-24 01:33:17 +0000

[diff] [blame]

517

if (Opcode != -1) {

Tom Stellard

2014-08-21 20:40:54 +0000

[diff] [blame]

518

FrameInfo->setObjectAlignment(FrameIndex, 4);

Tom Stellard

2014-05-02 15:41:42 +0000

[diff] [blame]

519

BuildMI(MBB, MI, DL, get(Opcode), DestReg)

Tom Stellard

2015-01-14 15:42:31 +0000

[diff] [blame]

520

.addFrameIndex(FrameIndex)

521

// Place-holder registers, these will be filled in by

522

// SIPrepareScratchRegs.

Tom Stellard

95292bb

2015-01-20 17:49:47 +0000

[diff] [blame]

523

.addReg(AMDGPU::SGPR0_SGPR1_SGPR2_SGPR3, RegState::Undef)

Tom Stellard

2015-01-14 15:42:31 +0000

[diff] [blame]

524

.addReg(AMDGPU::SGPR0, RegState::Undef);

525

Tom Stellard

2014-05-02 15:41:42 +0000

[diff] [blame]

526

} else {

Tom Stellard

2014-09-24 01:33:17 +0000

[diff] [blame]

527

LLVMContext &Ctx = MF->getFunction()->getContext();

528

Ctx.emitError("SIInstrInfo::loadRegFromStackSlot - Do not know how to"

529

" restore register");

Tom Stellard

0febe68

2015-01-14 15:42:34 +0000

[diff] [blame]

530

BuildMI(MBB, MI, DL, get(AMDGPU::IMPLICIT_DEF), DestReg);

Tom Stellard

2013-11-27 21:23:35 +0000

[diff] [blame]

}

}

Tom Stellard

2014-09-24 01:33:17 +0000

[diff] [blame]

534

/// \param @Offset Offset in bytes of the FrameIndex being spilled

535

unsigned SIInstrInfo::calculateLDSSpillAddress(MachineBasicBlock &MBB,

536

MachineBasicBlock::iterator MI,

537

RegScavenger *RS, unsigned TmpReg,

538

unsigned FrameOffset,

539

unsigned Size) const {

540

MachineFunction *MF = MBB.getParent();

541

SIMachineFunctionInfo *MFI = MF->getInfo<SIMachineFunctionInfo>();

542

const AMDGPUSubtarget &ST = MF->getTarget().getSubtarget<AMDGPUSubtarget>();

543

const SIRegisterInfo *TRI =

544

static_cast<const SIRegisterInfo*>(ST.getRegisterInfo());

545

DebugLoc DL = MBB.findDebugLoc(MI);

546

unsigned WorkGroupSize = MFI->getMaximumWorkGroupSize(*MF);

547

unsigned WavefrontSize = ST.getWavefrontSize();

548

549

unsigned TIDReg = MFI->getTIDReg();

550

if (!MFI->hasCalculatedTID()) {

551

MachineBasicBlock &Entry = MBB.getParent()->front();

552

MachineBasicBlock::iterator Insert = Entry.front();

553

DebugLoc DL = Insert->getDebugLoc();

554

Tom Stellard

2015-01-14 15:42:31 +0000

[diff] [blame]

555

TIDReg = RI.findUnusedRegister(MF->getRegInfo(), &AMDGPU::VGPR_32RegClass);

Tom Stellard

2014-09-24 01:33:17 +0000

[diff] [blame]

556

if (TIDReg == AMDGPU::NoRegister)

return TIDReg;

if (MFI->getShaderType() == ShaderType::COMPUTE &&

561

WorkGroupSize > WavefrontSize) {

562

563

unsigned TIDIGXReg = TRI->getPreloadedValue(*MF, SIRegisterInfo::TIDIG_X);

564

unsigned TIDIGYReg = TRI->getPreloadedValue(*MF, SIRegisterInfo::TIDIG_Y);

565

unsigned TIDIGZReg = TRI->getPreloadedValue(*MF, SIRegisterInfo::TIDIG_Z);

566

unsigned InputPtrReg =

567

TRI->getPreloadedValue(*MF, SIRegisterInfo::INPUT_PTR);

568

static const unsigned TIDIGRegs[3] = {

569

TIDIGXReg, TIDIGYReg, TIDIGZReg

570

};

571

for (unsigned Reg : TIDIGRegs) {

572

if (!Entry.isLiveIn(Reg))

573

Entry.addLiveIn(Reg);

574

}

575

576

RS->enterBasicBlock(&Entry);

577

unsigned STmp0 = RS->scavengeRegister(&AMDGPU::SGPR_32RegClass, 0);

578

unsigned STmp1 = RS->scavengeRegister(&AMDGPU::SGPR_32RegClass, 0);

579

BuildMI(Entry, Insert, DL, get(AMDGPU::S_LOAD_DWORD_IMM), STmp0)

580

.addReg(InputPtrReg)

581

.addImm(SI::KernelInputOffsets::NGROUPS_Z);

582

BuildMI(Entry, Insert, DL, get(AMDGPU::S_LOAD_DWORD_IMM), STmp1)

583

.addReg(InputPtrReg)

584

.addImm(SI::KernelInputOffsets::NGROUPS_Y);

585

586

// NGROUPS.X * NGROUPS.Y

587

BuildMI(Entry, Insert, DL, get(AMDGPU::S_MUL_I32), STmp1)

588

.addReg(STmp1)

589

.addReg(STmp0);

590

// (NGROUPS.X * NGROUPS.Y) * TIDIG.X

591

BuildMI(Entry, Insert, DL, get(AMDGPU::V_MUL_U32_U24_e32), TIDReg)

592

.addReg(STmp1)

593

.addReg(TIDIGXReg);

594

// NGROUPS.Z * TIDIG.Y + (NGROUPS.X * NGROPUS.Y * TIDIG.X)

595

BuildMI(Entry, Insert, DL, get(AMDGPU::V_MAD_U32_U24), TIDReg)

.addReg(STmp0)

.addReg(TIDIGYReg)

.addReg(TIDReg);

// (NGROUPS.Z * TIDIG.Y + (NGROUPS.X * NGROPUS.Y * TIDIG.X)) + TIDIG.Z

600

BuildMI(Entry, Insert, DL, get(AMDGPU::V_ADD_I32_e32), TIDReg)

.addReg(TIDReg)

.addReg(TIDIGZReg);

} else {

// Get the wave id

BuildMI(Entry, Insert, DL, get(AMDGPU::V_MBCNT_LO_U32_B32_e64),

TIDReg)

.addImm(-1)

.addImm(0);

Marek Olsak

2015-01-15 18:43:01 +0000

[diff] [blame]

610

BuildMI(Entry, Insert, DL, get(AMDGPU::V_MBCNT_HI_U32_B32_e64),

Tom Stellard

2014-09-24 01:33:17 +0000

[diff] [blame]

TIDReg)

.addImm(-1)

.addReg(TIDReg);

}

BuildMI(Entry, Insert, DL, get(AMDGPU::V_LSHLREV_B32_e32),

TIDReg)

.addImm(2)

.addReg(TIDReg);

MFI->setTIDReg(TIDReg);

621

}

622

623

// Add FrameIndex to LDS offset

624

unsigned LDSOffset = MFI->LDSSize + (FrameOffset * WorkGroupSize);

625

BuildMI(MBB, MI, DL, get(AMDGPU::V_ADD_I32_e32), TmpReg)

.addImm(LDSOffset)

.addReg(TIDReg);

return TmpReg;

}

Tom Stellard

2014-05-02 15:41:42 +0000

[diff] [blame]

632

void SIInstrInfo::insertNOPs(MachineBasicBlock::iterator MI,

int Count) const {

while (Count > 0) {

int Arg;

if (Count >= 8)

Arg = 7;

else

Arg = Count - 1;

Count -= 8;

BuildMI(*MI->getParent(), MI, MI->getDebugLoc(), get(AMDGPU::S_NOP))

.addImm(Arg);

}

}

bool SIInstrInfo::expandPostRAPseudo(MachineBasicBlock::iterator MI) const {

Tom Stellard

2014-05-02 15:41:42 +0000

[diff] [blame]

647

MachineBasicBlock &MBB = *MI->getParent();

648

DebugLoc DL = MBB.findDebugLoc(MI);

649

switch (MI->getOpcode()) {

650

default: return AMDGPUInstrInfo::expandPostRAPseudo(MI);

651

Tom Stellard

067c815

2014-07-21 14:01:14 +0000

[diff] [blame]

652

case AMDGPU::SI_CONSTDATA_PTR: {

653

unsigned Reg = MI->getOperand(0).getReg();

654

unsigned RegLo = RI.getSubReg(Reg, AMDGPU::sub0);

655

unsigned RegHi = RI.getSubReg(Reg, AMDGPU::sub1);

656

657

BuildMI(MBB, MI, DL, get(AMDGPU::S_GETPC_B64), Reg);

658

659

// Add 32-bit offset from this instruction to the start of the constant data.

Tom Stellard

80942a1

2014-09-05 14:07:59 +0000

[diff] [blame]

660

BuildMI(MBB, MI, DL, get(AMDGPU::S_ADD_U32), RegLo)

Tom Stellard

067c815

2014-07-21 14:01:14 +0000

[diff] [blame]

661

.addReg(RegLo)

662

.addTargetIndex(AMDGPU::TI_CONSTDATA_START)

663

.addReg(AMDGPU::SCC, RegState::Define | RegState::Implicit);

664

BuildMI(MBB, MI, DL, get(AMDGPU::S_ADDC_U32), RegHi)

665

.addReg(RegHi)

666

.addImm(0)

667

.addReg(AMDGPU::SCC, RegState::Define | RegState::Implicit)

668

.addReg(AMDGPU::SCC, RegState::Implicit);

669

MI->eraseFromParent();

670

break;

671

}

Tom Stellard

60024a0

2014-09-24 01:33:24 +0000

[diff] [blame]

672

case AMDGPU::SGPR_USE:

673

// This is just a placeholder for register allocation.

674

MI->eraseFromParent();

675

break;

Tom Stellard

4842c05

2015-01-07 20:27:25 +0000

[diff] [blame]

676

677

case AMDGPU::V_MOV_B64_PSEUDO: {

678

unsigned Dst = MI->getOperand(0).getReg();

679

unsigned DstLo = RI.getSubReg(Dst, AMDGPU::sub0);

680

unsigned DstHi = RI.getSubReg(Dst, AMDGPU::sub1);

681

682

const MachineOperand &SrcOp = MI->getOperand(1);

683

// FIXME: Will this work for 64-bit floating point immediates?

684

assert(!SrcOp.isFPImm());

685

if (SrcOp.isImm()) {

686

APInt Imm(64, SrcOp.getImm());

687

BuildMI(MBB, MI, DL, get(AMDGPU::V_MOV_B32_e32), DstLo)

688

.addImm(Imm.getLoBits(32).getZExtValue())

689

.addReg(Dst, RegState::Implicit);

690

BuildMI(MBB, MI, DL, get(AMDGPU::V_MOV_B32_e32), DstHi)

691

.addImm(Imm.getHiBits(32).getZExtValue())

692

.addReg(Dst, RegState::Implicit);

693

} else {

694

assert(SrcOp.isReg());

695

BuildMI(MBB, MI, DL, get(AMDGPU::V_MOV_B32_e32), DstLo)

696

.addReg(RI.getSubReg(SrcOp.getReg(), AMDGPU::sub0))

697

.addReg(Dst, RegState::Implicit);

698

BuildMI(MBB, MI, DL, get(AMDGPU::V_MOV_B32_e32), DstHi)

699

.addReg(RI.getSubReg(SrcOp.getReg(), AMDGPU::sub1))

700

.addReg(Dst, RegState::Implicit);

701

}

702

MI->eraseFromParent();

703

break;

704

}

Tom Stellard

2014-05-02 15:41:42 +0000

[diff] [blame]

}

return true;

}

Christian Konig

2013-02-26 17:52:29 +0000

[diff] [blame]

709

MachineInstr *SIInstrInfo::commuteInstruction(MachineInstr *MI,

710

bool NewMI) const {

Tom Stellard

2015-01-07 22:44:19 +0000

[diff] [blame]

711

Matt Arsenault

aff65fb

2014-09-26 17:54:43 +0000

[diff] [blame]

712

if (MI->getNumOperands() < 3)

Craig Topper

062a2ba

2014-04-25 05:30:21 +0000

[diff] [blame]

713

return nullptr;

Christian Konig

76edd4f

2013-02-26 17:52:29 +0000

[diff] [blame]

714

Matt Arsenault

aff65fb

2014-09-26 17:54:43 +0000

[diff] [blame]

715

int Src0Idx = AMDGPU::getNamedOperandIdx(MI->getOpcode(),

716

AMDGPU::OpName::src0);

717

assert(Src0Idx != -1 && "Should always have src0 operand");

718

Matt Arsenault

2014-10-17 18:00:37 +0000

[diff] [blame]

719

MachineOperand &Src0 = MI->getOperand(Src0Idx);

720

if (!Src0.isReg())

Matt Arsenault

aff65fb

2014-09-26 17:54:43 +0000

[diff] [blame]

721

return nullptr;

722

723

int Src1Idx = AMDGPU::getNamedOperandIdx(MI->getOpcode(),

724

AMDGPU::OpName::src1);

Matt Arsenault

2014-10-17 18:00:37 +0000

[diff] [blame]

725

if (Src1Idx == -1)

Tom Stellard

2014-08-01 00:32:35 +0000

[diff] [blame]

726

return nullptr;

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

727

Matt Arsenault

2014-10-17 18:00:37 +0000

[diff] [blame]

728

MachineOperand &Src1 = MI->getOperand(Src1Idx);

729

Matt Arsenault

933c38d

2014-10-17 18:02:31 +0000

[diff] [blame]

730

// Make sure it's legal to commute operands for VOP2.

Matt Arsenault

2014-10-17 18:00:37 +0000

[diff] [blame]

731

if (isVOP2(MI->getOpcode()) &&

732

(!isOperandLegal(MI, Src0Idx, &Src1) ||

Tom Stellard

2015-01-07 22:44:19 +0000

[diff] [blame]

733

!isOperandLegal(MI, Src1Idx, &Src0))) {

Matt Arsenault

2014-10-17 18:00:37 +0000

[diff] [blame]

734

return nullptr;

Tom Stellard

2015-01-07 22:44:19 +0000

[diff] [blame]

735

}

Matt Arsenault

2014-10-17 18:00:37 +0000

[diff] [blame]

736

737

if (!Src1.isReg()) {

Tom Stellard

2015-01-13 22:59:41 +0000

[diff] [blame]

738

// Allow commuting instructions with Imm operands.

739

if (NewMI || !Src1.isImm() ||

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

740

(!isVOP2(MI->getOpcode()) && !isVOP3(MI->getOpcode()))) {

Craig Topper

062a2ba

2014-04-25 05:30:21 +0000

[diff] [blame]

741

return nullptr;

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

742

}

743

Matt Arsenault

d282ada

2014-10-17 18:00:48 +0000

[diff] [blame]

744

// Be sure to copy the source modifiers to the right place.

745

if (MachineOperand *Src0Mods

746

= getNamedOperand(*MI, AMDGPU::OpName::src0_modifiers)) {

747

MachineOperand *Src1Mods

748

= getNamedOperand(*MI, AMDGPU::OpName::src1_modifiers);

749

750

int Src0ModsVal = Src0Mods->getImm();

751

if (!Src1Mods && Src0ModsVal != 0)

752

return nullptr;

753

754

// XXX - This assert might be a lie. It might be useful to have a neg

755

// modifier with 0.0.

756

int Src1ModsVal = Src1Mods->getImm();

757

assert((Src1ModsVal == 0) && "Not expecting modifiers with immediates");

758

759

Src1Mods->setImm(Src0ModsVal);

760

Src0Mods->setImm(Src1ModsVal);

761

}

762

Matt Arsenault

2014-10-17 18:00:37 +0000

[diff] [blame]

763

unsigned Reg = Src0.getReg();

764

unsigned SubReg = Src0.getSubReg();

Matt Arsenault

6d3cd54

2014-10-17 18:00:39 +0000

[diff] [blame]

765

if (Src1.isImm())

766

Src0.ChangeToImmediate(Src1.getImm());

Matt Arsenault

6d3cd54

2014-10-17 18:00:39 +0000

[diff] [blame]

767

else

768

llvm_unreachable("Should only have immediates");

769

Matt Arsenault

2014-10-17 18:00:37 +0000

[diff] [blame]

770

Src1.ChangeToRegister(Reg, false);

771

Src1.setSubReg(SubReg);

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

772

} else {

773

MI = TargetInstrInfo::commuteInstruction(MI, NewMI);

774

}

Christian Konig

3c14580

2013-03-27 09:12:59 +0000

[diff] [blame]

775

776

if (MI)

777

MI->setDesc(get(commuteOpcode(MI->getOpcode())));

778

779

return MI;

Christian Konig

76edd4f

2013-02-26 17:52:29 +0000

[diff] [blame]

780

}

781

Matt Arsenault

92befe7

2014-09-26 17:54:54 +0000

[diff] [blame]

782

// This needs to be implemented because the source modifiers may be inserted

783

// between the true commutable operands, and the base

784

// TargetInstrInfo::commuteInstruction uses it.

785

bool SIInstrInfo::findCommutedOpIndices(MachineInstr *MI,

786

unsigned &SrcOpIdx1,

787

unsigned &SrcOpIdx2) const {

788

const MCInstrDesc &MCID = MI->getDesc();

789

if (!MCID.isCommutable())

790

return false;

791

792

unsigned Opc = MI->getOpcode();

793

int Src0Idx = AMDGPU::getNamedOperandIdx(Opc, AMDGPU::OpName::src0);

if (Src0Idx == -1)

return false;

// FIXME: Workaround TargetInstrInfo::commuteInstruction asserting on

798

// immediate.

799

if (!MI->getOperand(Src0Idx).isReg())

800

return false;

801

802

int Src1Idx = AMDGPU::getNamedOperandIdx(Opc, AMDGPU::OpName::src1);

if (Src1Idx == -1)

return false;

if (!MI->getOperand(Src1Idx).isReg())

807

return false;

808

Matt Arsenault

ace5b76

2014-10-17 18:00:43 +0000

[diff] [blame]

809

// If any source modifiers are set, the generic instruction commuting won't

810

// understand how to copy the source modifiers.

811

if (hasModifiersSet(*MI, AMDGPU::OpName::src0_modifiers) ||

812

hasModifiersSet(*MI, AMDGPU::OpName::src1_modifiers))

813

return false;

814

Matt Arsenault

92befe7

2014-09-26 17:54:54 +0000

[diff] [blame]

SrcOpIdx1 = Src0Idx;

SrcOpIdx2 = Src1Idx;

return true;

}

Tom Stellard

2013-10-22 18:19:10 +0000

[diff] [blame]

820

MachineInstr *SIInstrInfo::buildMovInstr(MachineBasicBlock *MBB,

821

MachineBasicBlock::iterator I,

822

unsigned DstReg,

823

unsigned SrcReg) const {

Tom Stellard

2013-11-13 23:36:50 +0000

[diff] [blame]

824

return BuildMI(*MBB, I, MBB->findDebugLoc(I), get(AMDGPU::V_MOV_B32_e32),

825

DstReg) .addReg(SrcReg);

Tom Stellard

26a3b67

2013-10-22 18:19:10 +0000

[diff] [blame]

826

}

827

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

828

bool SIInstrInfo::isMov(unsigned Opcode) const {

829

switch(Opcode) {

830

default: return false;

831

case AMDGPU::S_MOV_B32:

832

case AMDGPU::S_MOV_B64:

833

case AMDGPU::V_MOV_B32_e32:

834

case AMDGPU::V_MOV_B32_e64:

Tom Stellard

2012-12-11 21:25:42 +0000

[diff] [blame]

return true;

}

}

bool

SIInstrInfo::isSafeToMoveRegClassDefs(const TargetRegisterClass *RC) const {

841

return RC != &AMDGPU::EXECRegRegClass;

842

}

Tom Stellard

2013-02-06 17:32:29 +0000

[diff] [blame]

843

Tom Stellard

30f5941

2014-03-31 14:01:56 +0000

[diff] [blame]

844

bool

845

SIInstrInfo::isTriviallyReMaterializable(const MachineInstr *MI,

846

AliasAnalysis *AA) const {

847

switch(MI->getOpcode()) {

848

default: return AMDGPUInstrInfo::isTriviallyReMaterializable(MI, AA);

849

case AMDGPU::S_MOV_B32:

850

case AMDGPU::S_MOV_B64:

851

case AMDGPU::V_MOV_B32_e32:

852

return MI->getOperand(1).isImm();

}

}

Matt Arsenault

2014-11-19 00:01:31 +0000

[diff] [blame]

856

static bool offsetsDoNotOverlap(int WidthA, int OffsetA,

857

int WidthB, int OffsetB) {

858

int LowOffset = OffsetA < OffsetB ? OffsetA : OffsetB;

859

int HighOffset = OffsetA < OffsetB ? OffsetB : OffsetA;

860

int LowWidth = (LowOffset == OffsetA) ? WidthA : WidthB;

861

return LowOffset + LowWidth <= HighOffset;

862

}

863

864

bool SIInstrInfo::checkInstOffsetsDoNotOverlap(MachineInstr *MIa,

865

MachineInstr *MIb) const {

866

unsigned BaseReg0, Offset0;

867

unsigned BaseReg1, Offset1;

868

869

if (getLdStBaseRegImmOfs(MIa, BaseReg0, Offset0, &RI) &&

870

getLdStBaseRegImmOfs(MIb, BaseReg1, Offset1, &RI)) {

871

assert(MIa->hasOneMemOperand() && MIb->hasOneMemOperand() &&

872

"read2 / write2 not expected here yet");

873

unsigned Width0 = (*MIa->memoperands_begin())->getSize();

874

unsigned Width1 = (*MIb->memoperands_begin())->getSize();

875

if (BaseReg0 == BaseReg1 &&

876

offsetsDoNotOverlap(Width0, Offset0, Width1, Offset1)) {

return true;

}

}

return false;

}

bool SIInstrInfo::areMemAccessesTriviallyDisjoint(MachineInstr *MIa,

885

MachineInstr *MIb,

886

AliasAnalysis *AA) const {

887

unsigned Opc0 = MIa->getOpcode();

888

unsigned Opc1 = MIb->getOpcode();

889

890

assert(MIa && (MIa->mayLoad() || MIa->mayStore()) &&

891

"MIa must load from or modify a memory location");

892

assert(MIb && (MIb->mayLoad() || MIb->mayStore()) &&

893

"MIb must load from or modify a memory location");

894

895

if (MIa->hasUnmodeledSideEffects() || MIb->hasUnmodeledSideEffects())

896

return false;

897

898

// XXX - Can we relax this between address spaces?

899

if (MIa->hasOrderedMemoryRef() || MIb->hasOrderedMemoryRef())

900

return false;

901

902

// TODO: Should we check the address space from the MachineMemOperand? That

903

// would allow us to distinguish objects we know don't alias based on the

904

// underlying addres space, even if it was lowered to a different one,

905

// e.g. private accesses lowered to use MUBUF instructions on a scratch

// buffer.

if (isDS(Opc0)) {

if (isDS(Opc1))

return checkInstOffsetsDoNotOverlap(MIa, MIb);

910

911

return !isFLAT(Opc1);

912

}

913

914

if (isMUBUF(Opc0) || isMTBUF(Opc0)) {

915

if (isMUBUF(Opc1) || isMTBUF(Opc1))

916

return checkInstOffsetsDoNotOverlap(MIa, MIb);

917

918

return !isFLAT(Opc1) && !isSMRD(Opc1);

}

if (isSMRD(Opc0)) {

if (isSMRD(Opc1))

return checkInstOffsetsDoNotOverlap(MIa, MIb);

924

925

return !isFLAT(Opc1) && !isMUBUF(Opc0) && !isMTBUF(Opc0);

}

if (isFLAT(Opc0)) {

if (isFLAT(Opc1))

return checkInstOffsetsDoNotOverlap(MIa, MIb);

return false;

}

return false;

}

Matt Arsenault

2014-03-31 19:54:27 +0000

[diff] [blame]

938

bool SIInstrInfo::isInlineConstant(const APInt &Imm) const {

Matt Arsenault

2014-12-17 21:04:08 +0000

[diff] [blame]

939

int64_t SVal = Imm.getSExtValue();

940

if (SVal >= -16 && SVal <= 64)

Matt Arsenault

2014-03-31 19:54:27 +0000

[diff] [blame]

941

return true;

Tom Stellard

d008446

2014-03-17 17:03:52 +0000

[diff] [blame]

942

Matt Arsenault

2014-12-17 21:04:08 +0000

[diff] [blame]

943

if (Imm.getBitWidth() == 64) {

944

uint64_t Val = Imm.getZExtValue();

945

return (DoubleToBits(0.0) == Val) ||

946

(DoubleToBits(1.0) == Val) ||

947

(DoubleToBits(-1.0) == Val) ||

948

(DoubleToBits(0.5) == Val) ||

949

(DoubleToBits(-0.5) == Val) ||

950

(DoubleToBits(2.0) == Val) ||

951

(DoubleToBits(-2.0) == Val) ||

952

(DoubleToBits(4.0) == Val) ||

953

(DoubleToBits(-4.0) == Val);

954

}

955

Tom Stellard

d008446

2014-03-17 17:03:52 +0000

[diff] [blame]

956

// The actual type of the operand does not seem to matter as long

957

// as the bits match one of the inline immediate values. For example:

958

//

959

// -nan has the hexadecimal encoding of 0xfffffffe which is -2 in decimal,

960

// so it is a legal inline immediate.

961

//

962

// 1065353216 has the hexadecimal encoding 0x3f800000 which is 1.0f in

963

// floating-point, so it is a legal inline immediate.

Matt Arsenault

2014-12-17 21:04:08 +0000

[diff] [blame]

964

uint32_t Val = Imm.getZExtValue();

Matt Arsenault

2014-03-31 19:54:27 +0000

[diff] [blame]

965

Matt Arsenault

2014-12-17 21:04:08 +0000

[diff] [blame]

966

return (FloatToBits(0.0f) == Val) ||

967

(FloatToBits(1.0f) == Val) ||

968

(FloatToBits(-1.0f) == Val) ||

969

(FloatToBits(0.5f) == Val) ||

970

(FloatToBits(-0.5f) == Val) ||

971

(FloatToBits(2.0f) == Val) ||

972

(FloatToBits(-2.0f) == Val) ||

973

(FloatToBits(4.0f) == Val) ||

974

(FloatToBits(-4.0f) == Val);

Matt Arsenault

2014-03-31 19:54:27 +0000

[diff] [blame]

975

}

976

977

bool SIInstrInfo::isInlineConstant(const MachineOperand &MO) const {

978

if (MO.isImm())

979

return isInlineConstant(APInt(32, MO.getImm(), true));

980

Matt Arsenault

2014-03-31 19:54:27 +0000

[diff] [blame]

981

return false;

Tom Stellard

2013-10-10 17:11:55 +0000

[diff] [blame]

982

}

983

984

bool SIInstrInfo::isLiteralConstant(const MachineOperand &MO) const {

Tom Stellard

2015-01-13 22:59:41 +0000

[diff] [blame]

985

return MO.isImm() && !isInlineConstant(MO);

Tom Stellard

2013-10-10 17:11:55 +0000

[diff] [blame]

986

}

987

Matt Arsenault

2014-06-23 18:28:31 +0000

[diff] [blame]

988

static bool compareMachineOp(const MachineOperand &Op0,

989

const MachineOperand &Op1) {

990

if (Op0.getType() != Op1.getType())

991

return false;

992

993

switch (Op0.getType()) {

994

case MachineOperand::MO_Register:

995

return Op0.getReg() == Op1.getReg();

996

case MachineOperand::MO_Immediate:

997

return Op0.getImm() == Op1.getImm();

Matt Arsenault

2014-06-23 18:28:31 +0000

[diff] [blame]

998

default:

999

llvm_unreachable("Didn't expect to be comparing these operand types");

}

}

Tom Stellard

2014-07-21 15:45:01 +0000

[diff] [blame]

1003

bool SIInstrInfo::isImmOperandLegal(const MachineInstr *MI, unsigned OpNo,

1004

const MachineOperand &MO) const {

1005

const MCOperandInfo &OpInfo = get(MI->getOpcode()).OpInfo[OpNo];

1006

Tom Stellard

2015-01-13 22:59:41 +0000

[diff] [blame]

1007

assert(MO.isImm() || MO.isTargetIndex() || MO.isFI());

Tom Stellard

b02094e

2014-07-21 15:45:01 +0000

[diff] [blame]

1008

1009

if (OpInfo.OperandType == MCOI::OPERAND_IMMEDIATE)

1010

return true;

1011

1012

if (OpInfo.RegClass < 0)

1013

return false;

1014

Tom Stellard

2014-09-23 21:26:25 +0000

[diff] [blame]

1015

if (isLiteralConstant(MO))

Tom Stellard

b655052

2015-01-12 19:33:18 +0000

[diff] [blame]

1016

return RI.opCanUseLiteralConstant(OpInfo.OperandType);

Tom Stellard

2014-09-23 21:26:25 +0000

[diff] [blame]

1017

Tom Stellard

b655052

2015-01-12 19:33:18 +0000

[diff] [blame]

1018

return RI.opCanUseInlineConstant(OpInfo.OperandType);

Tom Stellard

b02094e

2014-07-21 15:45:01 +0000

[diff] [blame]

1019

}

1020

Marek Olsak

2014-12-07 17:17:38 +0000

[diff] [blame]

1021

bool SIInstrInfo::canFoldOffset(unsigned OffsetSize, unsigned AS) const {

Matt Arsenault

b2baffa

2014-08-15 17:49:05 +0000

[diff] [blame]

1022

switch (AS) {

1023

case AMDGPUAS::GLOBAL_ADDRESS: {

1024

// MUBUF instructions a 12-bit offset in bytes.

1025

return isUInt<12>(OffsetSize);

1026

}

1027

case AMDGPUAS::CONSTANT_ADDRESS: {

Marek Olsak

2014-12-07 17:17:38 +0000

[diff] [blame]

1028

// SMRD instructions have an 8-bit offset in dwords on SI and

1029

// a 20-bit offset in bytes on VI.

1030

if (RI.ST.getGeneration() >= AMDGPUSubtarget::VOLCANIC_ISLANDS)

1031

return isUInt<20>(OffsetSize);

1032

else

1033

return (OffsetSize % 4 == 0) && isUInt<8>(OffsetSize / 4);

Matt Arsenault

b2baffa

2014-08-15 17:49:05 +0000

[diff] [blame]

1034

}

1035

case AMDGPUAS::LOCAL_ADDRESS:

1036

case AMDGPUAS::REGION_ADDRESS: {

1037

// The single offset versions have a 16-bit offset in bytes.

1038

return isUInt<16>(OffsetSize);

1039

}

1040

case AMDGPUAS::PRIVATE_ADDRESS:

1041

// Indirect register addressing does not use any offsets.

default:

return 0;

}

}

Tom Stellard

2014-08-01 00:32:28 +0000

[diff] [blame]

1047

bool SIInstrInfo::hasVALU32BitEncoding(unsigned Opcode) const {

Marek Olsak

a93603d

2015-01-15 18:42:51 +0000

[diff] [blame]

1048

int Op32 = AMDGPU::getVOPe32(Opcode);

if (Op32 == -1)

return false;

return pseudoToMCOpcode(Op32) != -1;

Tom Stellard

86d12eb

2014-08-01 00:32:28 +0000

[diff] [blame]

1053

}

1054

Tom Stellard

b4a313a

2014-08-01 00:32:39 +0000

[diff] [blame]

1055

bool SIInstrInfo::hasModifiers(unsigned Opcode) const {

1056

// The src0_modifier operand is present on all instructions

1057

// that have modifiers.

1058

1059

return AMDGPU::getNamedOperandIdx(Opcode,

1060

AMDGPU::OpName::src0_modifiers) != -1;

1061

}

1062

Matt Arsenault

ace5b76

2014-10-17 18:00:43 +0000

[diff] [blame]

1063

bool SIInstrInfo::hasModifiersSet(const MachineInstr &MI,

1064

unsigned OpName) const {

1065

const MachineOperand *Mods = getNamedOperand(MI, OpName);

1066

return Mods && Mods->getImm();

1067

}

1068

Tom Stellard

2014-09-23 21:26:25 +0000

[diff] [blame]

1069

bool SIInstrInfo::usesConstantBus(const MachineRegisterInfo &MRI,

1070

const MachineOperand &MO) const {

1071

// Literal constants use the constant bus.

1072

if (isLiteralConstant(MO))

1073

return true;

1074

1075

if (!MO.isReg() || !MO.isUse())

1076

return false;

1077

1078

if (TargetRegisterInfo::isVirtualRegister(MO.getReg()))

1079

return RI.isSGPRClass(MRI.getRegClass(MO.getReg()));

1080

1081

// FLAT_SCR is just an SGPR pair.

1082

if (!MO.isImplicit() && (MO.getReg() == AMDGPU::FLAT_SCR))

1083

return true;

1084

1085

// EXEC register uses the constant bus.

1086

if (!MO.isImplicit() && MO.getReg() == AMDGPU::EXEC)

1087

return true;

1088

1089

// SGPRs use the constant bus

1090

if (MO.getReg() == AMDGPU::M0 || MO.getReg() == AMDGPU::VCC ||

1091

(!MO.isImplicit() &&

1092

(AMDGPU::SGPR_32RegClass.contains(MO.getReg()) ||

1093

AMDGPU::SGPR_64RegClass.contains(MO.getReg())))) {

return true;

}

return false;

}

Tom Stellard

2013-10-10 17:11:55 +0000

[diff] [blame]

1100

bool SIInstrInfo::verifyInstruction(const MachineInstr *MI,

1101

StringRef &ErrInfo) const {

1102

uint16_t Opcode = MI->getOpcode();

Tom Stellard

2014-09-23 21:26:25 +0000

[diff] [blame]

1103

const MachineRegisterInfo &MRI = MI->getParent()->getParent()->getRegInfo();

Tom Stellard

2013-10-10 17:11:55 +0000

[diff] [blame]

1104

int Src0Idx = AMDGPU::getNamedOperandIdx(Opcode, AMDGPU::OpName::src0);

1105

int Src1Idx = AMDGPU::getNamedOperandIdx(Opcode, AMDGPU::OpName::src1);

1106

int Src2Idx = AMDGPU::getNamedOperandIdx(Opcode, AMDGPU::OpName::src2);

1107

Tom Stellard

ca700e4

2014-03-17 17:03:49 +0000

[diff] [blame]

1108

// Make sure the number of operands is correct.

1109

const MCInstrDesc &Desc = get(Opcode);

1110

if (!Desc.isVariadic() &&

1111

Desc.getNumOperands() != MI->getNumExplicitOperands()) {

1112

ErrInfo = "Instruction has wrong number of operands.";

return false;

}

// Make sure the register classes are correct

Tom Stellard

b4a313a

2014-08-01 00:32:39 +0000

[diff] [blame]

1117

for (int i = 0, e = Desc.getNumOperands(); i != e; ++i) {

Tom Stellard

2015-01-13 22:59:41 +0000

[diff] [blame]

1118

if (MI->getOperand(i).isFPImm()) {

1119

ErrInfo = "FPImm Machine Operands are not supported. ISel should bitcast "

1120

"all fp values to integers.";

return false;

}

Tom Stellard

2014-03-17 17:03:49 +0000

[diff] [blame]

1124

switch (Desc.OpInfo[i].OperandType) {

Tom Stellard

1106b1c

2015-01-20 17:49:41 +0000

[diff] [blame]

1125

case MCOI::OPERAND_REGISTER:

1126

if (MI->getOperand(i).isImm() || MI->getOperand(i).isFPImm()) {

1127

ErrInfo = "Illegal immediate value for operand.";

return false;

}

break;

case AMDGPU::OPERAND_REG_IMM32:

1132

break;

1133

case AMDGPU::OPERAND_REG_INLINE_C:

1134

if (MI->getOperand(i).isImm() && !isInlineConstant(MI->getOperand(i))) {

1135

ErrInfo = "Illegal immediate value for operand.";

1136

return false;

Tom Stellard

a305f93

2014-07-02 20:53:44 +0000

[diff] [blame]

1137

}

Tom Stellard

ca700e4

2014-03-17 17:03:49 +0000

[diff] [blame]

1138

break;

1139

case MCOI::OPERAND_IMMEDIATE:

Tom Stellard

b02094e

2014-07-21 15:45:01 +0000

[diff] [blame]

1140

// Check if this operand is an immediate.

1141

// FrameIndex operands will be replaced by immediates, so they are

1142

// allowed.

Tom Stellard

2015-01-13 22:59:41 +0000

[diff] [blame]

1143

if (!MI->getOperand(i).isImm() && !MI->getOperand(i).isFI()) {

Tom Stellard

ca700e4

2014-03-17 17:03:49 +0000

[diff] [blame]

1144

ErrInfo = "Expected immediate, but got non-immediate";

return false;

}

// Fall-through

default:

continue;

}

if (!MI->getOperand(i).isReg())

1153

continue;

1154

1155

int RegClass = Desc.OpInfo[i].RegClass;

1156

if (RegClass != -1) {

1157

unsigned Reg = MI->getOperand(i).getReg();

1158

if (TargetRegisterInfo::isVirtualRegister(Reg))

1159

continue;

1160

1161

const TargetRegisterClass *RC = RI.getRegClass(RegClass);

1162

if (!RC->contains(Reg)) {

1163

ErrInfo = "Operand has incorrect register class.";

return false;

}

}

}

Tom Stellard

2013-10-10 17:11:55 +0000

[diff] [blame]

1170

// Verify VOP*

1171

if (isVOP1(Opcode) || isVOP2(Opcode) || isVOP3(Opcode) || isVOPC(Opcode)) {

Matt Arsenault

e368cb3

2014-12-11 23:37:32 +0000

[diff] [blame]

1172

// Only look at the true operands. Only a real operand can use the constant

1173

// bus, and we don't want to check pseudo-operands like the source modifier

1174

// flags.

1175

const int OpIndices[] = { Src0Idx, Src1Idx, Src2Idx };

1176

Tom Stellard

2013-10-10 17:11:55 +0000

[diff] [blame]

1177

unsigned ConstantBusCount = 0;

1178

unsigned SGPRUsed = AMDGPU::NoRegister;

Matt Arsenault

e368cb3

2014-12-11 23:37:32 +0000

[diff] [blame]

1179

for (int OpIdx : OpIndices) {

if (OpIdx == -1)

break;

const MachineOperand &MO = MI->getOperand(OpIdx);

Tom Stellard

2014-09-23 21:26:25 +0000

[diff] [blame]

1184

if (usesConstantBus(MRI, MO)) {

1185

if (MO.isReg()) {

1186

if (MO.getReg() != SGPRUsed)

Tom Stellard

2013-10-10 17:11:55 +0000

[diff] [blame]

1187

++ConstantBusCount;

Tom Stellard

2014-09-23 21:26:25 +0000

[diff] [blame]

1188

SGPRUsed = MO.getReg();

1189

} else {

1190

++ConstantBusCount;

Tom Stellard

2013-10-10 17:11:55 +0000

[diff] [blame]

1191

}

1192

}

Tom Stellard

2013-10-10 17:11:55 +0000

[diff] [blame]

1193

}

1194

if (ConstantBusCount > 1) {

1195

ErrInfo = "VOP* instruction uses the constant bus more than once";

return false;

}

}

// Verify SRC1 for VOP2 and VOPC

1201

if (Src1Idx != -1 && (isVOP2(Opcode) || isVOPC(Opcode))) {

1202

const MachineOperand &Src1 = MI->getOperand(Src1Idx);

Tom Stellard

2015-01-13 22:59:41 +0000

[diff] [blame]

1203

if (Src1.isImm()) {

Tom Stellard

2013-10-10 17:11:55 +0000

[diff] [blame]

1204

ErrInfo = "VOP[2C] src1 cannot be an immediate.";

return false;

}

}

// Verify VOP3

if (isVOP3(Opcode)) {

1211

if (Src0Idx != -1 && isLiteralConstant(MI->getOperand(Src0Idx))) {

1212

ErrInfo = "VOP3 src0 cannot be a literal constant.";

1213

return false;

1214

}

1215

if (Src1Idx != -1 && isLiteralConstant(MI->getOperand(Src1Idx))) {

1216

ErrInfo = "VOP3 src1 cannot be a literal constant.";

1217

return false;

1218

}

1219

if (Src2Idx != -1 && isLiteralConstant(MI->getOperand(Src2Idx))) {

1220

ErrInfo = "VOP3 src2 cannot be a literal constant.";

1221

return false;

1222

}

1223

}

Matt Arsenault

2014-06-23 18:28:31 +0000

[diff] [blame]

1224

1225

// Verify misc. restrictions on specific instructions.

1226

if (Desc.getOpcode() == AMDGPU::V_DIV_SCALE_F32 ||

1227

Desc.getOpcode() == AMDGPU::V_DIV_SCALE_F64) {

Matt Arsenault

262407b

2014-09-24 02:17:09 +0000

[diff] [blame]

1228

const MachineOperand &Src0 = MI->getOperand(Src0Idx);

1229

const MachineOperand &Src1 = MI->getOperand(Src1Idx);

1230

const MachineOperand &Src2 = MI->getOperand(Src2Idx);

Matt Arsenault

2014-06-23 18:28:31 +0000

[diff] [blame]

1231

if (Src0.isReg() && Src1.isReg() && Src2.isReg()) {

1232

if (!compareMachineOp(Src0, Src1) &&

1233

!compareMachineOp(Src0, Src2)) {

1234

ErrInfo = "v_div_scale_{f32|f64} require src0 = src1 or src2";

return false;

}

}

}

Tom Stellard

2013-10-10 17:11:55 +0000

[diff] [blame]

return true;

}

Matt Arsenault

2013-11-15 22:02:28 +0000

[diff] [blame]

1243

unsigned SIInstrInfo::getVALUOp(const MachineInstr &MI) {

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

1244

switch (MI.getOpcode()) {

1245

default: return AMDGPU::INSTRUCTION_LIST_END;

1246

case AMDGPU::REG_SEQUENCE: return AMDGPU::REG_SEQUENCE;

1247

case AMDGPU::COPY: return AMDGPU::COPY;

1248

case AMDGPU::PHI: return AMDGPU::PHI;

Tom Stellard

204e61b

2014-04-07 19:45:45 +0000

[diff] [blame]

1249

case AMDGPU::INSERT_SUBREG: return AMDGPU::INSERT_SUBREG;

Tom Stellard

2014-03-21 15:51:54 +0000

[diff] [blame]

1250

case AMDGPU::S_MOV_B32:

1251

return MI.getOperand(1).isReg() ?

Tom Stellard

8c12fd9

2014-03-24 16:12:34 +0000

[diff] [blame]

1252

AMDGPU::COPY : AMDGPU::V_MOV_B32_e32;

Tom Stellard

80942a1

2014-09-05 14:07:59 +0000

[diff] [blame]

1253

case AMDGPU::S_ADD_I32:

1254

case AMDGPU::S_ADD_U32: return AMDGPU::V_ADD_I32_e32;

Matt Arsenault

43b8e4e

2013-11-18 20:09:29 +0000

[diff] [blame]

1255

case AMDGPU::S_ADDC_U32: return AMDGPU::V_ADDC_U32_e32;

Tom Stellard

80942a1

2014-09-05 14:07:59 +0000

[diff] [blame]

1256

case AMDGPU::S_SUB_I32:

1257

case AMDGPU::S_SUB_U32: return AMDGPU::V_SUB_I32_e32;

Matt Arsenault

43b8e4e

2013-11-18 20:09:29 +0000

[diff] [blame]

1258

case AMDGPU::S_SUBB_U32: return AMDGPU::V_SUBB_U32_e32;

Matt Arsenault

869cd07

2014-09-03 23:24:35 +0000

[diff] [blame]

1259

case AMDGPU::S_MUL_I32: return AMDGPU::V_MUL_LO_I32;

Matt Arsenault

8e2581b

2014-03-21 18:01:18 +0000

[diff] [blame]

1260

case AMDGPU::S_AND_B32: return AMDGPU::V_AND_B32_e32;

1261

case AMDGPU::S_OR_B32: return AMDGPU::V_OR_B32_e32;

1262

case AMDGPU::S_XOR_B32: return AMDGPU::V_XOR_B32_e32;

1263

case AMDGPU::S_MIN_I32: return AMDGPU::V_MIN_I32_e32;

1264

case AMDGPU::S_MIN_U32: return AMDGPU::V_MIN_U32_e32;

1265

case AMDGPU::S_MAX_I32: return AMDGPU::V_MAX_I32_e32;

1266

case AMDGPU::S_MAX_U32: return AMDGPU::V_MAX_U32_e32;

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

1267

case AMDGPU::S_ASHR_I32: return AMDGPU::V_ASHR_I32_e32;

1268

case AMDGPU::S_ASHR_I64: return AMDGPU::V_ASHR_I64;

1269

case AMDGPU::S_LSHL_B32: return AMDGPU::V_LSHL_B32_e32;

1270

case AMDGPU::S_LSHL_B64: return AMDGPU::V_LSHL_B64;

1271

case AMDGPU::S_LSHR_B32: return AMDGPU::V_LSHR_B32_e32;

1272

case AMDGPU::S_LSHR_B64: return AMDGPU::V_LSHR_B64;

Matt Arsenault

2014-04-18 01:53:18 +0000

[diff] [blame]

1273

case AMDGPU::S_SEXT_I32_I8: return AMDGPU::V_BFE_I32;

1274

case AMDGPU::S_SEXT_I32_I16: return AMDGPU::V_BFE_I32;

Matt Arsenault

2014-04-18 05:19:26 +0000

[diff] [blame]

1275

case AMDGPU::S_BFE_U32: return AMDGPU::V_BFE_U32;

1276

case AMDGPU::S_BFE_I32: return AMDGPU::V_BFE_I32;

Matt Arsenault

43160e7

2014-06-18 17:13:57 +0000

[diff] [blame]

1277

case AMDGPU::S_BREV_B32: return AMDGPU::V_BFREV_B32_e32;

Matt Arsenault

2c33562

2014-04-09 07:16:16 +0000

[diff] [blame]

1278

case AMDGPU::S_NOT_B32: return AMDGPU::V_NOT_B32_e32;

Matt Arsenault

2014-06-09 16:36:31 +0000

[diff] [blame]

1279

case AMDGPU::S_NOT_B64: return AMDGPU::V_NOT_B32_e32;

Matt Arsenault

0cb92e1

2014-04-11 19:25:18 +0000

[diff] [blame]

1280

case AMDGPU::S_CMP_EQ_I32: return AMDGPU::V_CMP_EQ_I32_e32;

1281

case AMDGPU::S_CMP_LG_I32: return AMDGPU::V_CMP_NE_I32_e32;

1282

case AMDGPU::S_CMP_GT_I32: return AMDGPU::V_CMP_GT_I32_e32;

1283

case AMDGPU::S_CMP_GE_I32: return AMDGPU::V_CMP_GE_I32_e32;

1284

case AMDGPU::S_CMP_LT_I32: return AMDGPU::V_CMP_LT_I32_e32;

1285

case AMDGPU::S_CMP_LE_I32: return AMDGPU::V_CMP_LE_I32_e32;

Tom Stellard

2014-05-09 16:42:22 +0000

[diff] [blame]

1286

case AMDGPU::S_LOAD_DWORD_IMM:

Tom Stellard

2014-04-30 15:31:29 +0000

[diff] [blame]

1287

case AMDGPU::S_LOAD_DWORD_SGPR: return AMDGPU::BUFFER_LOAD_DWORD_ADDR64;

Tom Stellard

2014-05-09 16:42:22 +0000

[diff] [blame]

1288

case AMDGPU::S_LOAD_DWORDX2_IMM:

Tom Stellard

2014-04-30 15:31:29 +0000

[diff] [blame]

1289

case AMDGPU::S_LOAD_DWORDX2_SGPR: return AMDGPU::BUFFER_LOAD_DWORDX2_ADDR64;

Tom Stellard

2014-05-09 16:42:22 +0000

[diff] [blame]

1290

case AMDGPU::S_LOAD_DWORDX4_IMM:

Tom Stellard

2014-04-30 15:31:29 +0000

[diff] [blame]

1291

case AMDGPU::S_LOAD_DWORDX4_SGPR: return AMDGPU::BUFFER_LOAD_DWORDX4_ADDR64;

Marek Olsak

c536850

2015-01-15 18:43:01 +0000

[diff] [blame]

1292

case AMDGPU::S_BCNT1_I32_B32: return AMDGPU::V_BCNT_U32_B32_e64;

Matt Arsenault

295b86e

2014-06-17 17:36:27 +0000

[diff] [blame]

1293

case AMDGPU::S_FF1_I32_B32: return AMDGPU::V_FFBL_B32_e32;

Matt Arsenault

8579601

2014-06-17 17:36:24 +0000

[diff] [blame]

1294

case AMDGPU::S_FLBIT_I32_B32: return AMDGPU::V_FFBH_U32_e32;

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

}

}

bool SIInstrInfo::isSALUOpSupportedOnVALU(const MachineInstr &MI) const {

1299

return getVALUOp(MI) != AMDGPU::INSTRUCTION_LIST_END;

1300

}

1301

1302

const TargetRegisterClass *SIInstrInfo::getOpRegClass(const MachineInstr &MI,

1303

unsigned OpNo) const {

1304

const MachineRegisterInfo &MRI = MI.getParent()->getParent()->getRegInfo();

1305

const MCInstrDesc &Desc = get(MI.getOpcode());

1306

if (MI.isVariadic() || OpNo >= Desc.getNumOperands() ||

Matt Arsenault

102a704

2014-12-11 23:37:34 +0000

[diff] [blame]

1307

Desc.OpInfo[OpNo].RegClass == -1) {

1308

unsigned Reg = MI.getOperand(OpNo).getReg();

1309

1310

if (TargetRegisterInfo::isVirtualRegister(Reg))

1311

return MRI.getRegClass(Reg);

1312

return RI.getRegClass(Reg);

1313

}

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

1314

1315

unsigned RCID = Desc.OpInfo[OpNo].RegClass;

1316

return RI.getRegClass(RCID);

1317

}

1318

1319

bool SIInstrInfo::canReadVGPR(const MachineInstr &MI, unsigned OpNo) const {

1320

switch (MI.getOpcode()) {

1321

case AMDGPU::COPY:

1322

case AMDGPU::REG_SEQUENCE:

Tom Stellard

4f3b04d

2014-04-17 21:00:07 +0000

[diff] [blame]

1323

case AMDGPU::PHI:

Tom Stellard

a568738

2014-05-15 14:41:55 +0000

[diff] [blame]

1324

case AMDGPU::INSERT_SUBREG:

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

1325

return RI.hasVGPRs(getOpRegClass(MI, 0));

1326

default:

1327

return RI.hasVGPRs(getOpRegClass(MI, OpNo));

}

}

void SIInstrInfo::legalizeOpWithMove(MachineInstr *MI, unsigned OpIdx) const {

1332

MachineBasicBlock::iterator I = MI;

Matt Arsenault

2014-10-13 15:47:59 +0000

[diff] [blame]

1333

MachineBasicBlock *MBB = MI->getParent();

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

1334

MachineOperand &MO = MI->getOperand(OpIdx);

Matt Arsenault

2014-10-13 15:47:59 +0000

[diff] [blame]

1335

MachineRegisterInfo &MRI = MBB->getParent()->getRegInfo();

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

1336

unsigned RCID = get(MI->getOpcode()).OpInfo[OpIdx].RegClass;

1337

const TargetRegisterClass *RC = RI.getRegClass(RCID);

1338

unsigned Opcode = AMDGPU::V_MOV_B32_e32;

Matt Arsenault

2014-10-13 15:47:59 +0000

[diff] [blame]

1339

if (MO.isReg())

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

1340

Opcode = AMDGPU::COPY;

Matt Arsenault

2014-10-13 15:47:59 +0000

[diff] [blame]

1341

else if (RI.isSGPRClass(RC))

Matt Arsenault

671a005

2013-11-14 10:08:50 +0000

[diff] [blame]

1342

Opcode = AMDGPU::S_MOV_B32;

Matt Arsenault

2014-10-13 15:47:59 +0000

[diff] [blame]

1343

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

1344

Matt Arsenault

3a4d86a

2013-11-18 20:09:55 +0000

[diff] [blame]

1345

const TargetRegisterClass *VRC = RI.getEquivalentVGPRClass(RC);

Matt Arsenault

2014-10-13 15:47:59 +0000

[diff] [blame]

1346

if (RI.getCommonSubClass(&AMDGPU::VReg_64RegClass, VRC))

Tom Stellard

0c93c9e

2014-09-05 14:08:01 +0000

[diff] [blame]

1347

VRC = &AMDGPU::VReg_64RegClass;

Matt Arsenault

2014-10-13 15:47:59 +0000

[diff] [blame]

1348

else

Tom Stellard

2015-01-07 20:59:25 +0000

[diff] [blame]

1349

VRC = &AMDGPU::VGPR_32RegClass;

Matt Arsenault

2014-10-13 15:47:59 +0000

[diff] [blame]

1350

Matt Arsenault

3a4d86a

2013-11-18 20:09:55 +0000

[diff] [blame]

1351

unsigned Reg = MRI.createVirtualRegister(VRC);

Matt Arsenault

2014-10-13 15:47:59 +0000

[diff] [blame]

1352

DebugLoc DL = MBB->findDebugLoc(I);

1353

BuildMI(*MI->getParent(), I, DL, get(Opcode), Reg)

1354

.addOperand(MO);

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

1355

MO.ChangeToRegister(Reg, false);

1356

}

1357

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

1358

unsigned SIInstrInfo::buildExtractSubReg(MachineBasicBlock::iterator MI,

1359

MachineRegisterInfo &MRI,

1360

MachineOperand &SuperReg,

1361

const TargetRegisterClass *SuperRC,

1362

unsigned SubIdx,

1363

const TargetRegisterClass *SubRC)

1364

const {

1365

assert(SuperReg.isReg());

1366

1367

unsigned NewSuperReg = MRI.createVirtualRegister(SuperRC);

1368

unsigned SubReg = MRI.createVirtualRegister(SubRC);

1369

1370

// Just in case the super register is itself a sub-register, copy it to a new

Matt Arsenault

08d8494

2014-06-03 23:06:13 +0000

[diff] [blame]

1371

// value so we don't need to worry about merging its subreg index with the

1372

// SubIdx passed to this function. The register coalescer should be able to

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

1373

// eliminate this extra copy.

Matt Arsenault

7480a0e

2014-11-17 21:11:37 +0000

[diff] [blame]

1374

MachineBasicBlock *MBB = MI->getParent();

1375

DebugLoc DL = MI->getDebugLoc();

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

1376

Matt Arsenault

7480a0e

2014-11-17 21:11:37 +0000

[diff] [blame]

1377

BuildMI(*MBB, MI, DL, get(TargetOpcode::COPY), NewSuperReg)

1378

.addReg(SuperReg.getReg(), 0, SuperReg.getSubReg());

1379

1380

BuildMI(*MBB, MI, DL, get(TargetOpcode::COPY), SubReg)

1381

.addReg(NewSuperReg, 0, SubIdx);

1382

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

return SubReg;

}

Matt Arsenault

2014-03-24 20:08:09 +0000

[diff] [blame]

1386

MachineOperand SIInstrInfo::buildExtractSubRegOrImm(

1387

MachineBasicBlock::iterator MII,

1388

MachineRegisterInfo &MRI,

1389

MachineOperand &Op,

1390

const TargetRegisterClass *SuperRC,

1391

unsigned SubIdx,

1392

const TargetRegisterClass *SubRC) const {

1393

if (Op.isImm()) {

1394

// XXX - Is there a better way to do this?

1395

if (SubIdx == AMDGPU::sub0)

1396

return MachineOperand::CreateImm(Op.getImm() & 0xFFFFFFFF);

1397

if (SubIdx == AMDGPU::sub1)

1398

return MachineOperand::CreateImm(Op.getImm() >> 32);

1399

1400

llvm_unreachable("Unhandled register index for immediate");

1401

}

1402

1403

unsigned SubReg = buildExtractSubReg(MII, MRI, Op, SuperRC,

1404

SubIdx, SubRC);

1405

return MachineOperand::CreateReg(SubReg, false);

1406

}

1407

Matt Arsenault

2014-03-24 18:26:52 +0000

[diff] [blame]

1408

unsigned SIInstrInfo::split64BitImm(SmallVectorImpl<MachineInstr *> &Worklist,

1409

MachineBasicBlock::iterator MI,

1410

MachineRegisterInfo &MRI,

1411

const TargetRegisterClass *RC,

1412

const MachineOperand &Op) const {

1413

MachineBasicBlock *MBB = MI->getParent();

1414

DebugLoc DL = MI->getDebugLoc();

1415

unsigned LoDst = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);

1416

unsigned HiDst = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);

1417

unsigned Dst = MRI.createVirtualRegister(RC);

1418

1419

MachineInstr *Lo = BuildMI(*MBB, MI, DL, get(AMDGPU::S_MOV_B32),

1420

LoDst)

1421

.addImm(Op.getImm() & 0xFFFFFFFF);

1422

MachineInstr *Hi = BuildMI(*MBB, MI, DL, get(AMDGPU::S_MOV_B32),

1423

HiDst)

1424

.addImm(Op.getImm() >> 32);

1425

1426

BuildMI(*MBB, MI, DL, get(TargetOpcode::REG_SEQUENCE), Dst)

1427

.addReg(LoDst)

1428

.addImm(AMDGPU::sub0)

1429

.addReg(HiDst)

1430

.addImm(AMDGPU::sub1);

1431

1432

Worklist.push_back(Lo);

1433

Worklist.push_back(Hi);

return Dst;

}

Marek Olsak

2014-12-07 12:19:03 +0000

[diff] [blame]

1438

// Change the order of operands from (0, 1, 2) to (0, 2, 1)

1439

void SIInstrInfo::swapOperands(MachineBasicBlock::iterator Inst) const {

1440

assert(Inst->getNumExplicitOperands() == 3);

1441

MachineOperand Op1 = Inst->getOperand(1);

1442

Inst->RemoveOperand(1);

1443

Inst->addOperand(Op1);

1444

}

1445

Tom Stellard

2014-08-01 00:32:35 +0000

[diff] [blame]

1446

bool SIInstrInfo::isOperandLegal(const MachineInstr *MI, unsigned OpIdx,

1447

const MachineOperand *MO) const {

1448

const MachineRegisterInfo &MRI = MI->getParent()->getParent()->getRegInfo();

1449

const MCInstrDesc &InstDesc = get(MI->getOpcode());

1450

const MCOperandInfo &OpInfo = InstDesc.OpInfo[OpIdx];

1451

const TargetRegisterClass *DefinedRC =

1452

OpInfo.RegClass != -1 ? RI.getRegClass(OpInfo.RegClass) : nullptr;

1453

if (!MO)

1454

MO = &MI->getOperand(OpIdx);

1455

Tom Stellard

5352f35

2014-12-19 22:15:37 +0000

[diff] [blame]

1456

if (isVALU(InstDesc.Opcode) && usesConstantBus(MRI, *MO)) {

Aaron Ballman

f086a14

2014-09-24 13:54:56 +0000

[diff] [blame]

1457

unsigned SGPRUsed =

1458

MO->isReg() ? MO->getReg() : (unsigned)AMDGPU::NoRegister;

Tom Stellard

2014-09-23 21:26:25 +0000

[diff] [blame]

1459

for (unsigned i = 0, e = MI->getNumOperands(); i != e; ++i) {

1460

if (i == OpIdx)

1461

continue;

1462

if (usesConstantBus(MRI, MI->getOperand(i)) &&

1463

MI->getOperand(i).isReg() && MI->getOperand(i).getReg() != SGPRUsed) {

return false;

}

}

}

Tom Stellard

2014-08-01 00:32:35 +0000

[diff] [blame]

1469

if (MO->isReg()) {

1470

assert(DefinedRC);

1471

const TargetRegisterClass *RC = MRI.getRegClass(MO->getReg());

Tom Stellard

e0ddfd1

2014-11-19 16:58:49 +0000

[diff] [blame]

1472

1473

// In order to be legal, the common sub-class must be equal to the

1474

// class of the current operand. For example:

1475

//

1476

// v_mov_b32 s0 ; Operand defined as vsrc_32

1477

// ; RI.getCommonSubClass(s0,vsrc_32) = sgpr ; LEGAL

1478

//

1479

// s_sendmsg 0, s0 ; Operand defined as m0reg

1480

// ; RI.getCommonSubClass(s0,m0reg) = m0reg ; NOT LEGAL

Tom Stellard

2015-01-07 22:44:19 +0000

[diff] [blame]

1481

Tom Stellard

e0ddfd1

2014-11-19 16:58:49 +0000

[diff] [blame]

1482

return RI.getCommonSubClass(RC, RI.getRegClass(OpInfo.RegClass)) == RC;

Tom Stellard

2014-08-01 00:32:35 +0000

[diff] [blame]

}

// Handle non-register types that are treated like immediates.

Tom Stellard

2015-01-13 22:59:41 +0000

[diff] [blame]

1487

assert(MO->isImm() || MO->isTargetIndex() || MO->isFI());

Tom Stellard

2014-08-01 00:32:35 +0000

[diff] [blame]

1488

Matt Arsenault

4364fef

2014-09-23 18:30:57 +0000

[diff] [blame]

1489

if (!DefinedRC) {

1490

// This operand expects an immediate.

Tom Stellard

2014-08-01 00:32:35 +0000

[diff] [blame]

1491

return true;

Matt Arsenault

4364fef

2014-09-23 18:30:57 +0000

[diff] [blame]

1492

}

Tom Stellard

2014-08-01 00:32:35 +0000

[diff] [blame]

1493

Tom Stellard

2014-09-23 21:26:25 +0000

[diff] [blame]

1494

return isImmOperandLegal(MI, OpIdx, *MO);

Tom Stellard

2014-08-01 00:32:35 +0000

[diff] [blame]

1495

}

1496

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

1497

void SIInstrInfo::legalizeOperands(MachineInstr *MI) const {

1498

MachineRegisterInfo &MRI = MI->getParent()->getParent()->getRegInfo();

Tom Stellard

2014-08-01 00:32:35 +0000

[diff] [blame]

1499

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

1500

int Src0Idx = AMDGPU::getNamedOperandIdx(MI->getOpcode(),

1501

AMDGPU::OpName::src0);

1502

int Src1Idx = AMDGPU::getNamedOperandIdx(MI->getOpcode(),

1503

AMDGPU::OpName::src1);

1504

int Src2Idx = AMDGPU::getNamedOperandIdx(MI->getOpcode(),

1505

AMDGPU::OpName::src2);

1506

1507

// Legalize VOP2

1508

if (isVOP2(MI->getOpcode()) && Src1Idx != -1) {

Tom Stellard

2014-08-01 00:32:35 +0000

[diff] [blame]

1509

// Legalize src0

1510

if (!isOperandLegal(MI, Src0Idx))

Matt Arsenault

2013-11-18 20:09:50 +0000

[diff] [blame]

1511

legalizeOpWithMove(MI, Src0Idx);

Tom Stellard

2014-08-01 00:32:35 +0000

[diff] [blame]

1512

1513

// Legalize src1

1514

if (isOperandLegal(MI, Src1Idx))

Matt Arsenault

2013-11-18 20:09:50 +0000

[diff] [blame]

1515

return;

Tom Stellard

2014-08-01 00:32:35 +0000

[diff] [blame]

1516

1517

// Usually src0 of VOP2 instructions allow more types of inputs

1518

// than src1, so try to commute the instruction to decrease our

1519

// chances of having to insert a MOV instruction to legalize src1.

1520

if (MI->isCommutable()) {

1521

if (commuteInstruction(MI))

1522

// If we are successful in commuting, then we know MI is legal, so

1523

// we are done.

1524

return;

Matt Arsenault

2013-11-18 20:09:50 +0000

[diff] [blame]

1525

}

1526

Tom Stellard

2014-08-01 00:32:35 +0000

[diff] [blame]

1527

legalizeOpWithMove(MI, Src1Idx);

1528

return;

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

1529

}

1530

Matt Arsenault

2013-11-18 20:09:50 +0000

[diff] [blame]

1531

// XXX - Do any VOP3 instructions read VCC?

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

1532

// Legalize VOP3

1533

if (isVOP3(MI->getOpcode())) {

Matt Arsenault

5885bef

2014-09-26 17:54:52 +0000

[diff] [blame]

1534

int VOP3Idx[3] = { Src0Idx, Src1Idx, Src2Idx };

1535

Matt Arsenault

6a0919f

2014-09-26 17:55:03 +0000

[diff] [blame]

1536

// Find the one SGPR operand we are allowed to use.

Matt Arsenault

ee522bf

2014-09-26 17:55:06 +0000

[diff] [blame]

1537

unsigned SGPRReg = findUsedSGPR(MI, VOP3Idx);

Matt Arsenault

5885bef

2014-09-26 17:54:52 +0000

[diff] [blame]

1538

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

1539

for (unsigned i = 0; i < 3; ++i) {

1540

int Idx = VOP3Idx[i];

1541

if (Idx == -1)

Matt Arsenault

2dd3129

2014-09-26 17:55:14 +0000

[diff] [blame]

1542

break;

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

1543

MachineOperand &MO = MI->getOperand(Idx);

1544

1545

if (MO.isReg()) {

1546

if (!RI.isSGPRClass(MRI.getRegClass(MO.getReg())))

1547

continue; // VGPRs are legal

1548

Matt Arsenault

f0b1e3a

2013-11-18 20:09:21 +0000

[diff] [blame]

1549

assert(MO.getReg() != AMDGPU::SCC && "SCC operand to VOP3 instruction");

1550

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

1551

if (SGPRReg == AMDGPU::NoRegister || SGPRReg == MO.getReg()) {

1552

SGPRReg = MO.getReg();

1553

// We can use one SGPR in each VOP3 instruction.

1554

continue;

1555

}

1556

} else if (!isLiteralConstant(MO)) {

1557

// If it is not a register and not a literal constant, then it must be

1558

// an inline constant which is always legal.

1559

continue;

1560

}

1561

// If we make it this far, then the operand is not legal and we must

1562

// legalize it.

1563

legalizeOpWithMove(MI, Idx);

}

}

Tom Stellard

2014-04-17 21:00:07 +0000

[diff] [blame]

1567

// Legalize REG_SEQUENCE and PHI

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

1568

// The register class of the operands much be the same type as the register

1569

// class of the output.

Tom Stellard

4f3b04d

2014-04-17 21:00:07 +0000

[diff] [blame]

1570

if (MI->getOpcode() == AMDGPU::REG_SEQUENCE ||

1571

MI->getOpcode() == AMDGPU::PHI) {

Craig Topper

062a2ba

2014-04-25 05:30:21 +0000

[diff] [blame]

1572

const TargetRegisterClass *RC = nullptr, *SRC = nullptr, *VRC = nullptr;

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

1573

for (unsigned i = 1, e = MI->getNumOperands(); i != e; i+=2) {

1574

if (!MI->getOperand(i).isReg() ||

1575

!TargetRegisterInfo::isVirtualRegister(MI->getOperand(i).getReg()))

1576

continue;

1577

const TargetRegisterClass *OpRC =

1578

MRI.getRegClass(MI->getOperand(i).getReg());

1579

if (RI.hasVGPRs(OpRC)) {

VRC = OpRC;

} else {

SRC = OpRC;

}

}

// If any of the operands are VGPR registers, then they all most be

1587

// otherwise we will create illegal VGPR->SGPR copies when legalizing

1588

// them.

1589

if (VRC || !RI.isSGPRClass(getOpRegClass(*MI, 0))) {

1590

if (!VRC) {

1591

assert(SRC);

1592

VRC = RI.getEquivalentVGPRClass(SRC);

}

RC = VRC;

} else {

RC = SRC;

}

// Update all the operands so they have the same type.

1600

for (unsigned i = 1, e = MI->getNumOperands(); i != e; i+=2) {

1601

if (!MI->getOperand(i).isReg() ||

1602

!TargetRegisterInfo::isVirtualRegister(MI->getOperand(i).getReg()))

1603

continue;

1604

unsigned DstReg = MRI.createVirtualRegister(RC);

Tom Stellard

4f3b04d

2014-04-17 21:00:07 +0000

[diff] [blame]

1605

MachineBasicBlock *InsertBB;

1606

MachineBasicBlock::iterator Insert;

1607

if (MI->getOpcode() == AMDGPU::REG_SEQUENCE) {

1608

InsertBB = MI->getParent();

1609

Insert = MI;

1610

} else {

1611

// MI is a PHI instruction.

1612

InsertBB = MI->getOperand(i + 1).getMBB();

1613

Insert = InsertBB->getFirstTerminator();

1614

}

1615

BuildMI(*InsertBB, Insert, MI->getDebugLoc(),

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

1616

get(AMDGPU::COPY), DstReg)

1617

.addOperand(MI->getOperand(i));

1618

MI->getOperand(i).setReg(DstReg);

1619

}

1620

}

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

1621

Tom Stellard

a568738

2014-05-15 14:41:55 +0000

[diff] [blame]

1622

// Legalize INSERT_SUBREG

1623

// src0 must have the same register class as dst

1624

if (MI->getOpcode() == AMDGPU::INSERT_SUBREG) {

1625

unsigned Dst = MI->getOperand(0).getReg();

1626

unsigned Src0 = MI->getOperand(1).getReg();

1627

const TargetRegisterClass *DstRC = MRI.getRegClass(Dst);

1628

const TargetRegisterClass *Src0RC = MRI.getRegClass(Src0);

1629

if (DstRC != Src0RC) {

1630

MachineBasicBlock &MBB = *MI->getParent();

1631

unsigned NewSrc0 = MRI.createVirtualRegister(DstRC);

1632

BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::COPY), NewSrc0)

1633

.addReg(Src0);

1634

MI->getOperand(1).setReg(NewSrc0);

}

return;

}

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

1639

// Legalize MUBUF* instructions

1640

// FIXME: If we start using the non-addr64 instructions for compute, we

1641

// may need to legalize them here.

Tom Stellard

2014-08-11 22:18:17 +0000

[diff] [blame]

1642

int SRsrcIdx =

1643

AMDGPU::getNamedOperandIdx(MI->getOpcode(), AMDGPU::OpName::srsrc);

1644

if (SRsrcIdx != -1) {

1645

// We have an MUBUF instruction

1646

MachineOperand *SRsrc = &MI->getOperand(SRsrcIdx);

1647

unsigned SRsrcRC = get(MI->getOpcode()).OpInfo[SRsrcIdx].RegClass;

1648

if (RI.getCommonSubClass(MRI.getRegClass(SRsrc->getReg()),

1649

RI.getRegClass(SRsrcRC))) {

1650

// The operands are legal.

1651

// FIXME: We may need to legalize operands besided srsrc.

1652

return;

1653

}

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

1654

Tom Stellard

2014-08-11 22:18:17 +0000

[diff] [blame]

1655

MachineBasicBlock &MBB = *MI->getParent();

1656

// Extract the the ptr from the resource descriptor.

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

1657

Tom Stellard

2014-08-11 22:18:17 +0000

[diff] [blame]

1658

// SRsrcPtrLo = srsrc:sub0

1659

unsigned SRsrcPtrLo = buildExtractSubReg(MI, MRI, *SRsrc,

Tom Stellard

2015-01-07 20:59:25 +0000

[diff] [blame]

1660

&AMDGPU::VReg_128RegClass, AMDGPU::sub0, &AMDGPU::VGPR_32RegClass);

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

1661

Tom Stellard

2014-08-11 22:18:17 +0000

[diff] [blame]

1662

// SRsrcPtrHi = srsrc:sub1

1663

unsigned SRsrcPtrHi = buildExtractSubReg(MI, MRI, *SRsrc,

Tom Stellard

2015-01-07 20:59:25 +0000

[diff] [blame]

1664

&AMDGPU::VReg_128RegClass, AMDGPU::sub1, &AMDGPU::VGPR_32RegClass);

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

1665

Tom Stellard

2014-08-11 22:18:17 +0000

[diff] [blame]

1666

// Create an empty resource descriptor

1667

unsigned Zero64 = MRI.createVirtualRegister(&AMDGPU::SReg_64RegClass);

1668

unsigned SRsrcFormatLo = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);

1669

unsigned SRsrcFormatHi = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);

1670

unsigned NewSRsrc = MRI.createVirtualRegister(&AMDGPU::SReg_128RegClass);

Tom Stellard

2014-12-02 17:05:41 +0000

[diff] [blame]

1671

uint64_t RsrcDataFormat = getDefaultRsrcDataFormat();

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

1672

Tom Stellard

2014-08-11 22:18:17 +0000

[diff] [blame]

1673

// Zero64 = 0

1674

BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B64),

1675

Zero64)

1676

.addImm(0);

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

1677

Tom Stellard

2014-08-11 22:18:17 +0000

[diff] [blame]

1678

// SRsrcFormatLo = RSRC_DATA_FORMAT{31-0}

1679

BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32),

1680

SRsrcFormatLo)

Tom Stellard

2014-12-02 17:05:41 +0000

[diff] [blame]

1681

.addImm(RsrcDataFormat & 0xFFFFFFFF);

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

1682

Tom Stellard

2014-08-11 22:18:17 +0000

[diff] [blame]

1683

// SRsrcFormatHi = RSRC_DATA_FORMAT{63-32}

1684

BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32),

1685

SRsrcFormatHi)

Tom Stellard

2014-12-02 17:05:41 +0000

[diff] [blame]

1686

.addImm(RsrcDataFormat >> 32);

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

1687

Tom Stellard

2014-08-11 22:18:17 +0000

[diff] [blame]

1688

// NewSRsrc = {Zero64, SRsrcFormat}

1689

BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::REG_SEQUENCE),

1690

NewSRsrc)

1691

.addReg(Zero64)

1692

.addImm(AMDGPU::sub0_sub1)

1693

.addReg(SRsrcFormatLo)

1694

.addImm(AMDGPU::sub2)

1695

.addReg(SRsrcFormatHi)

1696

.addImm(AMDGPU::sub3);

1697

1698

MachineOperand *VAddr = getNamedOperand(*MI, AMDGPU::OpName::vaddr);

1699

unsigned NewVAddr = MRI.createVirtualRegister(&AMDGPU::VReg_64RegClass);

unsigned NewVAddrLo;

unsigned NewVAddrHi;

if (VAddr) {

// This is already an ADDR64 instruction so we need to add the pointer

1704

// extracted from the resource descriptor to the current value of VAddr.

Tom Stellard

2015-01-07 20:59:25 +0000

[diff] [blame]

1705

NewVAddrLo = MRI.createVirtualRegister(&AMDGPU::VGPR_32RegClass);

1706

NewVAddrHi = MRI.createVirtualRegister(&AMDGPU::VGPR_32RegClass);

Tom Stellard

2014-08-11 22:18:17 +0000

[diff] [blame]

1707

1708

// NewVaddrLo = SRsrcPtrLo + VAddr:sub0

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

1709

BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::V_ADD_I32_e32),

1710

NewVAddrLo)

1711

.addReg(SRsrcPtrLo)

Tom Stellard

2014-08-11 22:18:17 +0000

[diff] [blame]

1712

.addReg(VAddr->getReg(), 0, AMDGPU::sub0)

1713

.addReg(AMDGPU::VCC, RegState::ImplicitDefine);

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

1714

Tom Stellard

2014-08-11 22:18:17 +0000

[diff] [blame]

1715

// NewVaddrHi = SRsrcPtrHi + VAddr:sub1

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

1716

BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::V_ADDC_U32_e32),

1717

NewVAddrHi)

1718

.addReg(SRsrcPtrHi)

Tom Stellard

2014-08-11 22:18:17 +0000

[diff] [blame]

1719

.addReg(VAddr->getReg(), 0, AMDGPU::sub1)

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

1720

.addReg(AMDGPU::VCC, RegState::ImplicitDefine)

1721

.addReg(AMDGPU::VCC, RegState::Implicit);

1722

Tom Stellard

2014-08-11 22:18:17 +0000

[diff] [blame]

1723

} else {

1724

// This instructions is the _OFFSET variant, so we need to convert it to

1725

// ADDR64.

1726

MachineOperand *VData = getNamedOperand(*MI, AMDGPU::OpName::vdata);

1727

MachineOperand *Offset = getNamedOperand(*MI, AMDGPU::OpName::offset);

1728

MachineOperand *SOffset = getNamedOperand(*MI, AMDGPU::OpName::soffset);

1729

assert(SOffset->isImm() && SOffset->getImm() == 0 && "Legalizing MUBUF "

1730

"with non-zero soffset is not implemented");

NAKAMURA Takumi

5f79ee5

2014-08-11 23:03:38 +0000

[diff] [blame]

1731

(void)SOffset;

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

1732

Tom Stellard

2014-08-11 22:18:17 +0000

[diff] [blame]

1733

// Create the new instruction.

1734

unsigned Addr64Opcode = AMDGPU::getAddr64Inst(MI->getOpcode());

1735

MachineInstr *Addr64 =

1736

BuildMI(MBB, MI, MI->getDebugLoc(), get(Addr64Opcode))

1737

.addOperand(*VData)

1738

.addOperand(*SRsrc)

1739

.addReg(AMDGPU::NoRegister) // Dummy value for vaddr.

1740

// This will be replaced later

1741

// with the new value of vaddr.

1742

.addOperand(*Offset);

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

1743

Tom Stellard

2014-08-11 22:18:17 +0000

[diff] [blame]

1744

MI->removeFromParent();

1745

MI = Addr64;

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

1746

Tom Stellard

2014-08-11 22:18:17 +0000

[diff] [blame]

1747

NewVAddrLo = SRsrcPtrLo;

1748

NewVAddrHi = SRsrcPtrHi;

1749

VAddr = getNamedOperand(*MI, AMDGPU::OpName::vaddr);

1750

SRsrc = getNamedOperand(*MI, AMDGPU::OpName::srsrc);

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

1751

}

Tom Stellard

2014-08-11 22:18:17 +0000

[diff] [blame]

1752

1753

// NewVaddr = {NewVaddrHi, NewVaddrLo}

1754

BuildMI(MBB, MI, MI->getDebugLoc(), get(AMDGPU::REG_SEQUENCE),

1755

NewVAddr)

1756

.addReg(NewVAddrLo)

1757

.addImm(AMDGPU::sub0)

1758

.addReg(NewVAddrHi)

1759

.addImm(AMDGPU::sub1);

1760

1761

1762

// Update the instruction to use NewVaddr

1763

VAddr->setReg(NewVAddr);

1764

// Update the instruction to use NewSRsrc

1765

SRsrc->setReg(NewSRsrc);

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

1766

}

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

1767

}

1768

Tom Stellard

2014-08-21 20:41:00 +0000

[diff] [blame]

1769

void SIInstrInfo::splitSMRD(MachineInstr *MI,

1770

const TargetRegisterClass *HalfRC,

1771

unsigned HalfImmOp, unsigned HalfSGPROp,

1772

MachineInstr *&Lo, MachineInstr *&Hi) const {

1773

1774

DebugLoc DL = MI->getDebugLoc();

1775

MachineBasicBlock *MBB = MI->getParent();

1776

MachineRegisterInfo &MRI = MBB->getParent()->getRegInfo();

1777

unsigned RegLo = MRI.createVirtualRegister(HalfRC);

1778

unsigned RegHi = MRI.createVirtualRegister(HalfRC);

1779

unsigned HalfSize = HalfRC->getSize();

1780

const MachineOperand *OffOp =

1781

getNamedOperand(*MI, AMDGPU::OpName::offset);

1782

const MachineOperand *SBase = getNamedOperand(*MI, AMDGPU::OpName::sbase);

1783

Marek Olsak

2014-12-07 17:17:38 +0000

[diff] [blame]

1784

// The SMRD has an 8-bit offset in dwords on SI and a 20-bit offset in bytes

1785

// on VI.

Tom Stellard

2014-08-21 20:41:00 +0000

[diff] [blame]

1786

if (OffOp) {

Marek Olsak

2014-12-07 17:17:38 +0000

[diff] [blame]

1787

bool isVI = RI.ST.getGeneration() >= AMDGPUSubtarget::VOLCANIC_ISLANDS;

1788

unsigned OffScale = isVI ? 1 : 4;

Tom Stellard

2014-08-21 20:41:00 +0000

[diff] [blame]

1789

// Handle the _IMM variant

Marek Olsak

2014-12-07 17:17:38 +0000

[diff] [blame]

1790

unsigned LoOffset = OffOp->getImm() * OffScale;

1791

unsigned HiOffset = LoOffset + HalfSize;

Tom Stellard

2014-08-21 20:41:00 +0000

[diff] [blame]

1792

Lo = BuildMI(*MBB, MI, DL, get(HalfImmOp), RegLo)

1793

.addOperand(*SBase)

Marek Olsak

2014-12-07 17:17:38 +0000

[diff] [blame]

1794

.addImm(LoOffset / OffScale);

Tom Stellard

2014-08-21 20:41:00 +0000

[diff] [blame]

1795

Marek Olsak

2014-12-07 17:17:38 +0000

[diff] [blame]

1796

if (!isUInt<20>(HiOffset) || (!isVI && !isUInt<8>(HiOffset / OffScale))) {

Tom Stellard

2014-08-21 20:41:00 +0000

[diff] [blame]

1797

unsigned OffsetSGPR =

1798

MRI.createVirtualRegister(&AMDGPU::SReg_32RegClass);

1799

BuildMI(*MBB, MI, DL, get(AMDGPU::S_MOV_B32), OffsetSGPR)

Marek Olsak

2014-12-07 17:17:38 +0000

[diff] [blame]

1800

.addImm(HiOffset); // The offset in register is in bytes.

Tom Stellard

2014-08-21 20:41:00 +0000

[diff] [blame]

1801

Hi = BuildMI(*MBB, MI, DL, get(HalfSGPROp), RegHi)

.addOperand(*SBase)

.addReg(OffsetSGPR);

} else {

Hi = BuildMI(*MBB, MI, DL, get(HalfImmOp), RegHi)

1806

.addOperand(*SBase)

Marek Olsak

2014-12-07 17:17:38 +0000

[diff] [blame]

1807

.addImm(HiOffset / OffScale);

Tom Stellard

2014-08-21 20:41:00 +0000

[diff] [blame]

1808

}

1809

} else {

1810

// Handle the _SGPR variant

1811

MachineOperand *SOff = getNamedOperand(*MI, AMDGPU::OpName::soff);

1812

Lo = BuildMI(*MBB, MI, DL, get(HalfSGPROp), RegLo)

1813

.addOperand(*SBase)

1814

.addOperand(*SOff);

1815

unsigned OffsetSGPR = MRI.createVirtualRegister(&AMDGPU::SReg_32RegClass);

1816

BuildMI(*MBB, MI, DL, get(AMDGPU::S_ADD_I32), OffsetSGPR)

1817

.addOperand(*SOff)

1818

.addImm(HalfSize);

1819

Hi = BuildMI(*MBB, MI, DL, get(HalfSGPROp))

.addOperand(*SBase)

.addReg(OffsetSGPR);

}

unsigned SubLo, SubHi;

1825

switch (HalfSize) {

1826

case 4:

1827

SubLo = AMDGPU::sub0;

1828

SubHi = AMDGPU::sub1;

1829

break;

1830

case 8:

1831

SubLo = AMDGPU::sub0_sub1;

1832

SubHi = AMDGPU::sub2_sub3;

1833

break;

1834

case 16:

1835

SubLo = AMDGPU::sub0_sub1_sub2_sub3;

1836

SubHi = AMDGPU::sub4_sub5_sub6_sub7;

1837

break;

1838

case 32:

1839

SubLo = AMDGPU::sub0_sub1_sub2_sub3_sub4_sub5_sub6_sub7;

1840

SubHi = AMDGPU::sub8_sub9_sub10_sub11_sub12_sub13_sub14_sub15;

1841

break;

1842

default:

1843

llvm_unreachable("Unhandled HalfSize");

1844

}

1845

1846

BuildMI(*MBB, MI, DL, get(AMDGPU::REG_SEQUENCE))

1847

.addOperand(MI->getOperand(0))

.addReg(RegLo)

.addImm(SubLo)

.addReg(RegHi)

.addImm(SubHi);

}

Tom Stellard

2014-04-30 15:31:29 +0000

[diff] [blame]

1854

void SIInstrInfo::moveSMRDToVALU(MachineInstr *MI, MachineRegisterInfo &MRI) const {

1855

MachineBasicBlock *MBB = MI->getParent();

1856

switch (MI->getOpcode()) {

Tom Stellard

2014-05-09 16:42:22 +0000

[diff] [blame]

1857

case AMDGPU::S_LOAD_DWORD_IMM:

Tom Stellard

2014-04-30 15:31:29 +0000

[diff] [blame]

1858

case AMDGPU::S_LOAD_DWORD_SGPR:

Tom Stellard

2014-05-09 16:42:22 +0000

[diff] [blame]

1859

case AMDGPU::S_LOAD_DWORDX2_IMM:

Tom Stellard

2014-04-30 15:31:29 +0000

[diff] [blame]

1860

case AMDGPU::S_LOAD_DWORDX2_SGPR:

Tom Stellard

2014-05-09 16:42:22 +0000

[diff] [blame]

1861

case AMDGPU::S_LOAD_DWORDX4_IMM:

Tom Stellard

2014-08-21 20:41:00 +0000

[diff] [blame]

1862

case AMDGPU::S_LOAD_DWORDX4_SGPR: {

Tom Stellard

2014-04-30 15:31:29 +0000

[diff] [blame]

1863

unsigned NewOpcode = getVALUOp(*MI);

Tom Stellard

2014-05-09 16:42:22 +0000

[diff] [blame]

1864

unsigned RegOffset;

1865

unsigned ImmOffset;

Tom Stellard

2014-04-30 15:31:29 +0000

[diff] [blame]

1866

Tom Stellard

2014-05-09 16:42:22 +0000

[diff] [blame]

1867

if (MI->getOperand(2).isReg()) {

1868

RegOffset = MI->getOperand(2).getReg();

1869

ImmOffset = 0;

1870

} else {

1871

assert(MI->getOperand(2).isImm());

Marek Olsak

2014-12-07 17:17:38 +0000

[diff] [blame]

1872

// SMRD instructions take a dword offsets on SI and byte offset on VI

1873

// and MUBUF instructions always take a byte offset.

1874

ImmOffset = MI->getOperand(2).getImm();

1875

if (RI.ST.getGeneration() <= AMDGPUSubtarget::SEA_ISLANDS)

1876

ImmOffset <<= 2;

Tom Stellard

2014-05-09 16:42:22 +0000

[diff] [blame]

1877

RegOffset = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);

Marek Olsak

2014-12-07 17:17:38 +0000

[diff] [blame]

1878

Tom Stellard

2014-05-09 16:42:22 +0000

[diff] [blame]

1879

if (isUInt<12>(ImmOffset)) {

1880

BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32),

RegOffset)

.addImm(0);

} else {

BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32),

RegOffset)

.addImm(ImmOffset);

ImmOffset = 0;

}

}

Tom Stellard

2014-04-30 15:31:29 +0000

[diff] [blame]

1890

1891

unsigned SRsrc = MRI.createVirtualRegister(&AMDGPU::SReg_128RegClass);

Tom Stellard

2014-05-09 16:42:22 +0000

[diff] [blame]

1892

unsigned DWord0 = RegOffset;

Tom Stellard

2014-04-30 15:31:29 +0000

[diff] [blame]

1893

unsigned DWord1 = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);

1894

unsigned DWord2 = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);

1895

unsigned DWord3 = MRI.createVirtualRegister(&AMDGPU::SGPR_32RegClass);

Tom Stellard

2014-12-02 17:05:41 +0000

[diff] [blame]

1896

uint64_t RsrcDataFormat = getDefaultRsrcDataFormat();

Tom Stellard

2014-04-30 15:31:29 +0000

[diff] [blame]

1897

1898

BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32), DWord1)

1899

.addImm(0);

1900

BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32), DWord2)

Tom Stellard

2014-12-02 17:05:41 +0000

[diff] [blame]

1901

.addImm(RsrcDataFormat & 0xFFFFFFFF);

Tom Stellard

2014-04-30 15:31:29 +0000

[diff] [blame]

1902

BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::S_MOV_B32), DWord3)

Tom Stellard

2014-12-02 17:05:41 +0000

[diff] [blame]

1903

.addImm(RsrcDataFormat >> 32);

Tom Stellard

2014-04-30 15:31:29 +0000

[diff] [blame]

1904

BuildMI(*MBB, MI, MI->getDebugLoc(), get(AMDGPU::REG_SEQUENCE), SRsrc)

1905

.addReg(DWord0)

1906

.addImm(AMDGPU::sub0)

1907

.addReg(DWord1)

1908

.addImm(AMDGPU::sub1)

1909

.addReg(DWord2)

1910

.addImm(AMDGPU::sub2)

1911

.addReg(DWord3)

1912

.addImm(AMDGPU::sub3);

Tom Stellard

2014-08-21 20:41:00 +0000

[diff] [blame]

1913

MI->setDesc(get(NewOpcode));

1914

if (MI->getOperand(2).isReg()) {

1915

MI->getOperand(2).setReg(MI->getOperand(1).getReg());

1916

} else {

1917

MI->getOperand(2).ChangeToRegister(MI->getOperand(1).getReg(), false);

1918

}

1919

MI->getOperand(1).setReg(SRsrc);

1920

MI->addOperand(*MBB->getParent(), MachineOperand::CreateImm(ImmOffset));

1921

1922

const TargetRegisterClass *NewDstRC =

1923

RI.getRegClass(get(NewOpcode).OpInfo[0].RegClass);

1924

1925

unsigned DstReg = MI->getOperand(0).getReg();

1926

unsigned NewDstReg = MRI.createVirtualRegister(NewDstRC);

1927

MRI.replaceRegWith(DstReg, NewDstReg);

1928

break;

1929

}

1930

case AMDGPU::S_LOAD_DWORDX8_IMM:

1931

case AMDGPU::S_LOAD_DWORDX8_SGPR: {

1932

MachineInstr *Lo, *Hi;

1933

splitSMRD(MI, &AMDGPU::SReg_128RegClass, AMDGPU::S_LOAD_DWORDX4_IMM,

1934

AMDGPU::S_LOAD_DWORDX4_SGPR, Lo, Hi);

1935

MI->eraseFromParent();

1936

moveSMRDToVALU(Lo, MRI);

1937

moveSMRDToVALU(Hi, MRI);

break;

}

case AMDGPU::S_LOAD_DWORDX16_IMM:

1942

case AMDGPU::S_LOAD_DWORDX16_SGPR: {

1943

MachineInstr *Lo, *Hi;

1944

splitSMRD(MI, &AMDGPU::SReg_256RegClass, AMDGPU::S_LOAD_DWORDX8_IMM,

1945

AMDGPU::S_LOAD_DWORDX8_SGPR, Lo, Hi);

1946

MI->eraseFromParent();

1947

moveSMRDToVALU(Lo, MRI);

1948

moveSMRDToVALU(Hi, MRI);

1949

break;

1950

}

Tom Stellard

2014-04-30 15:31:29 +0000

[diff] [blame]

}

}

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

1954

void SIInstrInfo::moveToVALU(MachineInstr &TopInst) const {

1955

SmallVector<MachineInstr *, 128> Worklist;

1956

Worklist.push_back(&TopInst);

1957

1958

while (!Worklist.empty()) {

1959

MachineInstr *Inst = Worklist.pop_back_val();

Tom Stellard

2014-03-21 15:51:54 +0000

[diff] [blame]

1960

MachineBasicBlock *MBB = Inst->getParent();

1961

MachineRegisterInfo &MRI = MBB->getParent()->getRegInfo();

1962

Matt Arsenault

2014-04-18 01:53:18 +0000

[diff] [blame]

1963

unsigned Opcode = Inst->getOpcode();

Tom Stellard

2014-04-30 15:31:29 +0000

[diff] [blame]

1964

unsigned NewOpcode = getVALUOp(*Inst);

Matt Arsenault

2014-04-18 01:53:18 +0000

[diff] [blame]

1965

Tom Stellard

2014-03-21 15:51:54 +0000

[diff] [blame]

1966

// Handle some special cases

Matt Arsenault

2014-04-18 01:53:18 +0000

[diff] [blame]

1967

switch (Opcode) {

Tom Stellard

2014-04-30 15:31:29 +0000

[diff] [blame]

1968

default:

1969

if (isSMRD(Inst->getOpcode())) {

1970

moveSMRDToVALU(Inst, MRI);

1971

}

1972

break;

Matt Arsenault

2014-03-24 18:26:52 +0000

[diff] [blame]

1973

case AMDGPU::S_MOV_B64: {

1974

DebugLoc DL = Inst->getDebugLoc();

Tom Stellard

2014-03-21 15:51:54 +0000

[diff] [blame]

1975

Matt Arsenault

2014-03-24 18:26:52 +0000

[diff] [blame]

1976

// If the source operand is a register we can replace this with a

1977

// copy.

1978

if (Inst->getOperand(1).isReg()) {

1979

MachineInstr *Copy = BuildMI(*MBB, Inst, DL, get(TargetOpcode::COPY))

1980

.addOperand(Inst->getOperand(0))

1981

.addOperand(Inst->getOperand(1));

1982

Worklist.push_back(Copy);

1983

} else {

1984

// Otherwise, we need to split this into two movs, because there is

1985

// no 64-bit VALU move instruction.

1986

unsigned Reg = Inst->getOperand(0).getReg();

1987

unsigned Dst = split64BitImm(Worklist,

1988

Inst,

1989

MRI,

1990

MRI.getRegClass(Reg),

1991

Inst->getOperand(1));

1992

MRI.replaceRegWith(Reg, Dst);

Tom Stellard

2014-03-21 15:51:54 +0000

[diff] [blame]

1993

}

Matt Arsenault

2014-03-24 18:26:52 +0000

[diff] [blame]

1994

Inst->eraseFromParent();

1995

continue;

1996

}

Matt Arsenault

2014-03-24 20:08:05 +0000

[diff] [blame]

1997

case AMDGPU::S_AND_B64:

Matt Arsenault

2014-06-09 16:36:31 +0000

[diff] [blame]

1998

splitScalar64BitBinaryOp(Worklist, Inst, AMDGPU::S_AND_B32);

Matt Arsenault

2014-03-24 20:08:05 +0000

[diff] [blame]

1999

Inst->eraseFromParent();

2000

continue;

2001

2002

case AMDGPU::S_OR_B64:

Matt Arsenault

2014-06-09 16:36:31 +0000

[diff] [blame]

2003

splitScalar64BitBinaryOp(Worklist, Inst, AMDGPU::S_OR_B32);

Matt Arsenault

2014-03-24 20:08:05 +0000

[diff] [blame]

2004

Inst->eraseFromParent();

2005

continue;

2006

2007

case AMDGPU::S_XOR_B64:

Matt Arsenault

2014-06-09 16:36:31 +0000

[diff] [blame]

2008

splitScalar64BitBinaryOp(Worklist, Inst, AMDGPU::S_XOR_B32);

Matt Arsenault

2014-03-24 20:08:05 +0000

[diff] [blame]

2009

Inst->eraseFromParent();

2010

continue;

2011

2012

case AMDGPU::S_NOT_B64:

Matt Arsenault

2014-06-09 16:36:31 +0000

[diff] [blame]

2013

splitScalar64BitUnaryOp(Worklist, Inst, AMDGPU::S_NOT_B32);

Matt Arsenault

2014-03-24 20:08:05 +0000

[diff] [blame]

2014

Inst->eraseFromParent();

2015

continue;

2016

Matt Arsenault

8333e43

2014-06-10 19:18:24 +0000

[diff] [blame]

2017

case AMDGPU::S_BCNT1_I32_B64:

2018

splitScalar64BitBCNT(Worklist, Inst);

2019

Inst->eraseFromParent();

2020

continue;

2021

Matt Arsenault

9481221

2014-11-14 18:18:16 +0000

[diff] [blame]

2022

case AMDGPU::S_BFE_I64: {

2023

splitScalar64BitBFE(Worklist, Inst);

2024

Inst->eraseFromParent();

continue;

}

Marek Olsak

2014-12-07 12:19:03 +0000

[diff] [blame]

2028

case AMDGPU::S_LSHL_B32:

2029

if (ST.getGeneration() >= AMDGPUSubtarget::VOLCANIC_ISLANDS) {

2030

NewOpcode = AMDGPU::V_LSHLREV_B32_e64;

swapOperands(Inst);

}

break;

case AMDGPU::S_ASHR_I32:

2035

if (ST.getGeneration() >= AMDGPUSubtarget::VOLCANIC_ISLANDS) {

2036

NewOpcode = AMDGPU::V_ASHRREV_I32_e64;

swapOperands(Inst);

}

break;

case AMDGPU::S_LSHR_B32:

2041

if (ST.getGeneration() >= AMDGPUSubtarget::VOLCANIC_ISLANDS) {

2042

NewOpcode = AMDGPU::V_LSHRREV_B32_e64;

swapOperands(Inst);

}

break;

Matt Arsenault

2014-03-24 20:08:05 +0000

[diff] [blame]

2047

case AMDGPU::S_BFE_U64:

Matt Arsenault

2014-03-24 20:08:05 +0000

[diff] [blame]

2048

case AMDGPU::S_BFM_B64:

2049

llvm_unreachable("Moving this op to VALU not implemented");

Tom Stellard

2014-03-21 15:51:54 +0000

[diff] [blame]

2050

}

2051

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

2052

if (NewOpcode == AMDGPU::INSTRUCTION_LIST_END) {

2053

// We cannot move this instruction to the VALU, so we should try to

2054

// legalize its operands instead.

2055

legalizeOperands(Inst);

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

2056

continue;

Tom Stellard

2014-03-21 15:51:57 +0000

[diff] [blame]

2057

}

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

2058

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

2059

// Use the new VALU Opcode.

2060

const MCInstrDesc &NewDesc = get(NewOpcode);

2061

Inst->setDesc(NewDesc);

2062

Matt Arsenault

f0b1e3a

2013-11-18 20:09:21 +0000

[diff] [blame]

2063

// Remove any references to SCC. Vector instructions can't read from it, and

2064

// We're just about to add the implicit use / defs of VCC, and we don't want

2065

// both.

2066

for (unsigned i = Inst->getNumOperands() - 1; i > 0; --i) {

2067

MachineOperand &Op = Inst->getOperand(i);

2068

if (Op.isReg() && Op.getReg() == AMDGPU::SCC)

2069

Inst->RemoveOperand(i);

2070

}

2071

Matt Arsenault

2014-04-18 01:53:18 +0000

[diff] [blame]

2072

if (Opcode == AMDGPU::S_SEXT_I32_I8 || Opcode == AMDGPU::S_SEXT_I32_I16) {

2073

// We are converting these to a BFE, so we need to add the missing

2074

// operands for the size and offset.

2075

unsigned Size = (Opcode == AMDGPU::S_SEXT_I32_I8) ? 8 : 16;

2076

Inst->addOperand(MachineOperand::CreateImm(0));

2077

Inst->addOperand(MachineOperand::CreateImm(Size));

2078

Matt Arsenault

b5b5110

2014-06-10 19:18:21 +0000

[diff] [blame]

2079

} else if (Opcode == AMDGPU::S_BCNT1_I32_B32) {

2080

// The VALU version adds the second operand to the result, so insert an

2081

// extra 0 operand.

2082

Inst->addOperand(MachineOperand::CreateImm(0));

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

2083

}

2084

Matt Arsenault

2014-04-18 01:53:18 +0000

[diff] [blame]

2085

addDescImplicitUseDef(NewDesc, Inst);

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

2086

Matt Arsenault

2014-04-18 05:19:26 +0000

[diff] [blame]

2087

if (Opcode == AMDGPU::S_BFE_I32 || Opcode == AMDGPU::S_BFE_U32) {

2088

const MachineOperand &OffsetWidthOp = Inst->getOperand(2);

2089

// If we need to move this to VGPRs, we need to unpack the second operand

2090

// back into the 2 separate ones for bit offset and width.

2091

assert(OffsetWidthOp.isImm() &&

2092

"Scalar BFE is only implemented for constant width and offset");

2093

uint32_t Imm = OffsetWidthOp.getImm();

2094

2095

uint32_t Offset = Imm & 0x3f; // Extract bits [5:0].

2096

uint32_t BitWidth = (Imm & 0x7f0000) >> 16; // Extract bits [22:16].

Matt Arsenault

2014-04-18 05:19:26 +0000

[diff] [blame]

2097

Inst->RemoveOperand(2); // Remove old immediate.

2098

Inst->addOperand(MachineOperand::CreateImm(Offset));

Vincent Lejeune

94af31f

2014-05-10 19:18:33 +0000

[diff] [blame]

2099

Inst->addOperand(MachineOperand::CreateImm(BitWidth));

Matt Arsenault

2014-04-18 05:19:26 +0000

[diff] [blame]

2100

}

2101

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

2102

// Update the destination register class.

Tom Stellard

e1a2445

2014-04-17 21:00:01 +0000

[diff] [blame]

2103

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

2104

const TargetRegisterClass *NewDstRC = getOpRegClass(*Inst, 0);

2105

Matt Arsenault

2014-04-18 01:53:18 +0000

[diff] [blame]

2106

switch (Opcode) {

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

2107

// For target instructions, getOpRegClass just returns the virtual

2108

// register class associated with the operand, so we need to find an

2109

// equivalent VGPR register class in order to move the instruction to the

// VALU.

case AMDGPU::COPY:

case AMDGPU::PHI:

case AMDGPU::REG_SEQUENCE:

Tom Stellard

204e61b

2014-04-07 19:45:45 +0000

[diff] [blame]

2114

case AMDGPU::INSERT_SUBREG:

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

2115

if (RI.hasVGPRs(NewDstRC))

2116

continue;

2117

NewDstRC = RI.getEquivalentVGPRClass(NewDstRC);

if (!NewDstRC)

continue;

break;

default:

break;

}

unsigned DstReg = Inst->getOperand(0).getReg();

2126

unsigned NewDstReg = MRI.createVirtualRegister(NewDstRC);

2127

MRI.replaceRegWith(DstReg, NewDstReg);

2128

Tom Stellard

e1a2445

2014-04-17 21:00:01 +0000

[diff] [blame]

2129

// Legalize the operands

2130

legalizeOperands(Inst);

2131

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

2132

for (MachineRegisterInfo::use_iterator I = MRI.use_begin(NewDstReg),

2133

E = MRI.use_end(); I != E; ++I) {

Owen Anderson

16c6bf4

2014-03-13 23:12:04 +0000

[diff] [blame]

2134

MachineInstr &UseMI = *I->getParent();

Tom Stellard

2013-11-13 23:36:37 +0000

[diff] [blame]

2135

if (!canReadVGPR(UseMI, I.getOperandNo())) {

2136

Worklist.push_back(&UseMI);

}

}

}

}

Tom Stellard

2013-02-06 17:32:29 +0000

[diff] [blame]

2142

//===----------------------------------------------------------------------===//

2143

// Indirect addressing callbacks

2144

//===----------------------------------------------------------------------===//

2145

2146

unsigned SIInstrInfo::calculateIndirectAddress(unsigned RegIndex,

2147

unsigned Channel) const {

2148

assert(Channel == 0);

return RegIndex;

}

Tom Stellard

2013-10-22 18:19:10 +0000

[diff] [blame]

2152

const TargetRegisterClass *SIInstrInfo::getIndirectAddrRegClass() const {

Tom Stellard

2015-01-07 20:59:25 +0000

[diff] [blame]

2153

return &AMDGPU::VGPR_32RegClass;

Tom Stellard

2013-02-06 17:32:29 +0000

[diff] [blame]

2154

}

2155

Matt Arsenault

2014-06-09 16:36:31 +0000

[diff] [blame]

2156

void SIInstrInfo::splitScalar64BitUnaryOp(

2157

SmallVectorImpl<MachineInstr *> &Worklist,

2158

MachineInstr *Inst,

2159

unsigned Opcode) const {

2160

MachineBasicBlock &MBB = *Inst->getParent();

2161

MachineRegisterInfo &MRI = MBB.getParent()->getRegInfo();

2162

2163

MachineOperand &Dest = Inst->getOperand(0);

2164

MachineOperand &Src0 = Inst->getOperand(1);

2165

DebugLoc DL = Inst->getDebugLoc();

2166

2167

MachineBasicBlock::iterator MII = Inst;

2168

2169

const MCInstrDesc &InstDesc = get(Opcode);

2170

const TargetRegisterClass *Src0RC = Src0.isReg() ?

2171

MRI.getRegClass(Src0.getReg()) :

2172

&AMDGPU::SGPR_32RegClass;

2173

2174

const TargetRegisterClass *Src0SubRC = RI.getSubRegClass(Src0RC, AMDGPU::sub0);

2175

2176

MachineOperand SrcReg0Sub0 = buildExtractSubRegOrImm(MII, MRI, Src0, Src0RC,

2177

AMDGPU::sub0, Src0SubRC);

2178

2179

const TargetRegisterClass *DestRC = MRI.getRegClass(Dest.getReg());

2180

const TargetRegisterClass *DestSubRC = RI.getSubRegClass(DestRC, AMDGPU::sub0);

2181

2182

unsigned DestSub0 = MRI.createVirtualRegister(DestRC);

2183

MachineInstr *LoHalf = BuildMI(MBB, MII, DL, InstDesc, DestSub0)

2184

.addOperand(SrcReg0Sub0);

2185

2186

MachineOperand SrcReg0Sub1 = buildExtractSubRegOrImm(MII, MRI, Src0, Src0RC,

2187

AMDGPU::sub1, Src0SubRC);

2188

2189

unsigned DestSub1 = MRI.createVirtualRegister(DestSubRC);

2190

MachineInstr *HiHalf = BuildMI(MBB, MII, DL, InstDesc, DestSub1)

2191

.addOperand(SrcReg0Sub1);

2192

2193

unsigned FullDestReg = MRI.createVirtualRegister(DestRC);

2194

BuildMI(MBB, MII, DL, get(TargetOpcode::REG_SEQUENCE), FullDestReg)

2195

.addReg(DestSub0)

2196

.addImm(AMDGPU::sub0)

2197

.addReg(DestSub1)

2198

.addImm(AMDGPU::sub1);

2199

2200

MRI.replaceRegWith(Dest.getReg(), FullDestReg);

2201

2202

// Try to legalize the operands in case we need to swap the order to keep it

2203

// valid.

2204

Worklist.push_back(LoHalf);

2205

Worklist.push_back(HiHalf);

2206

}

2207

2208

void SIInstrInfo::splitScalar64BitBinaryOp(

2209

SmallVectorImpl<MachineInstr *> &Worklist,

2210

MachineInstr *Inst,

2211

unsigned Opcode) const {

Matt Arsenault

2014-03-24 20:08:05 +0000

[diff] [blame]

2212

MachineBasicBlock &MBB = *Inst->getParent();

2213

MachineRegisterInfo &MRI = MBB.getParent()->getRegInfo();

2214

Matt Arsenault

2014-03-24 20:08:05 +0000

[diff] [blame]

2215

MachineOperand &Dest = Inst->getOperand(0);

2216

MachineOperand &Src0 = Inst->getOperand(1);

2217

MachineOperand &Src1 = Inst->getOperand(2);

2218

DebugLoc DL = Inst->getDebugLoc();

2219

2220

MachineBasicBlock::iterator MII = Inst;

2221

2222

const MCInstrDesc &InstDesc = get(Opcode);

Matt Arsenault

2014-03-24 20:08:13 +0000

[diff] [blame]

2223

const TargetRegisterClass *Src0RC = Src0.isReg() ?

2224

MRI.getRegClass(Src0.getReg()) :

2225

&AMDGPU::SGPR_32RegClass;

Matt Arsenault

2014-03-24 20:08:05 +0000

[diff] [blame]

2226

Matt Arsenault

2014-03-24 20:08:13 +0000

[diff] [blame]

2227

const TargetRegisterClass *Src0SubRC = RI.getSubRegClass(Src0RC, AMDGPU::sub0);

2228

const TargetRegisterClass *Src1RC = Src1.isReg() ?

2229

MRI.getRegClass(Src1.getReg()) :

2230

&AMDGPU::SGPR_32RegClass;

2231

2232

const TargetRegisterClass *Src1SubRC = RI.getSubRegClass(Src1RC, AMDGPU::sub0);

2233

2234

MachineOperand SrcReg0Sub0 = buildExtractSubRegOrImm(MII, MRI, Src0, Src0RC,

2235

AMDGPU::sub0, Src0SubRC);

2236

MachineOperand SrcReg1Sub0 = buildExtractSubRegOrImm(MII, MRI, Src1, Src1RC,

2237

AMDGPU::sub0, Src1SubRC);

2238

2239

const TargetRegisterClass *DestRC = MRI.getRegClass(Dest.getReg());

2240

const TargetRegisterClass *DestSubRC = RI.getSubRegClass(DestRC, AMDGPU::sub0);

2241

2242

unsigned DestSub0 = MRI.createVirtualRegister(DestRC);

Matt Arsenault

2014-03-24 20:08:05 +0000

[diff] [blame]

2243

MachineInstr *LoHalf = BuildMI(MBB, MII, DL, InstDesc, DestSub0)

Matt Arsenault

248b7b6

2014-03-24 20:08:09 +0000

[diff] [blame]

2244

.addOperand(SrcReg0Sub0)

2245

.addOperand(SrcReg1Sub0);

Matt Arsenault

2014-03-24 20:08:05 +0000

[diff] [blame]

2246

Matt Arsenault

2014-03-24 20:08:13 +0000

[diff] [blame]

2247

MachineOperand SrcReg0Sub1 = buildExtractSubRegOrImm(MII, MRI, Src0, Src0RC,

2248

AMDGPU::sub1, Src0SubRC);

2249

MachineOperand SrcReg1Sub1 = buildExtractSubRegOrImm(MII, MRI, Src1, Src1RC,

2250

AMDGPU::sub1, Src1SubRC);

Matt Arsenault

2014-03-24 20:08:05 +0000

[diff] [blame]

2251

Matt Arsenault

2014-03-24 20:08:13 +0000

[diff] [blame]

2252

unsigned DestSub1 = MRI.createVirtualRegister(DestSubRC);

Matt Arsenault

2014-03-24 20:08:05 +0000

[diff] [blame]

2253

MachineInstr *HiHalf = BuildMI(MBB, MII, DL, InstDesc, DestSub1)

Matt Arsenault

248b7b6

2014-03-24 20:08:09 +0000

[diff] [blame]

2254

.addOperand(SrcReg0Sub1)

2255

.addOperand(SrcReg1Sub1);

Matt Arsenault

2014-03-24 20:08:05 +0000

[diff] [blame]

2256

Matt Arsenault

2014-03-24 20:08:13 +0000

[diff] [blame]

2257

unsigned FullDestReg = MRI.createVirtualRegister(DestRC);

Matt Arsenault

2014-03-24 20:08:05 +0000

[diff] [blame]

2258

BuildMI(MBB, MII, DL, get(TargetOpcode::REG_SEQUENCE), FullDestReg)

2259

.addReg(DestSub0)

2260

.addImm(AMDGPU::sub0)

2261

.addReg(DestSub1)

2262

.addImm(AMDGPU::sub1);

2263

2264

MRI.replaceRegWith(Dest.getReg(), FullDestReg);

2265

2266

// Try to legalize the operands in case we need to swap the order to keep it

2267

// valid.

2268

Worklist.push_back(LoHalf);

2269

Worklist.push_back(HiHalf);

2270

}

2271

Matt Arsenault

8333e43

2014-06-10 19:18:24 +0000

[diff] [blame]

2272

void SIInstrInfo::splitScalar64BitBCNT(SmallVectorImpl<MachineInstr *> &Worklist,

2273

MachineInstr *Inst) const {

2274

MachineBasicBlock &MBB = *Inst->getParent();

2275

MachineRegisterInfo &MRI = MBB.getParent()->getRegInfo();

2276

2277

MachineBasicBlock::iterator MII = Inst;

2278

DebugLoc DL = Inst->getDebugLoc();

2279

2280

MachineOperand &Dest = Inst->getOperand(0);

2281

MachineOperand &Src = Inst->getOperand(1);

2282

Marek Olsak

c536850

2015-01-15 18:43:01 +0000

[diff] [blame]

2283

const MCInstrDesc &InstDesc = get(AMDGPU::V_BCNT_U32_B32_e64);

Matt Arsenault

8333e43

2014-06-10 19:18:24 +0000

[diff] [blame]

2284

const TargetRegisterClass *SrcRC = Src.isReg() ?

2285

MRI.getRegClass(Src.getReg()) :

2286

&AMDGPU::SGPR_32RegClass;

2287

2288

unsigned MidReg = MRI.createVirtualRegister(&AMDGPU::VGPR_32RegClass);

2289

unsigned ResultReg = MRI.createVirtualRegister(&AMDGPU::VGPR_32RegClass);

2290

2291

const TargetRegisterClass *SrcSubRC = RI.getSubRegClass(SrcRC, AMDGPU::sub0);

2292

2293

MachineOperand SrcRegSub0 = buildExtractSubRegOrImm(MII, MRI, Src, SrcRC,

2294

AMDGPU::sub0, SrcSubRC);

2295

MachineOperand SrcRegSub1 = buildExtractSubRegOrImm(MII, MRI, Src, SrcRC,

2296

AMDGPU::sub1, SrcSubRC);

2297

2298

MachineInstr *First = BuildMI(MBB, MII, DL, InstDesc, MidReg)

2299

.addOperand(SrcRegSub0)

2300

.addImm(0);

2301

2302

MachineInstr *Second = BuildMI(MBB, MII, DL, InstDesc, ResultReg)

2303

.addOperand(SrcRegSub1)

2304

.addReg(MidReg);

2305

2306

MRI.replaceRegWith(Dest.getReg(), ResultReg);

2307

2308

Worklist.push_back(First);

2309

Worklist.push_back(Second);

2310

}

2311

Matt Arsenault

9481221

2014-11-14 18:18:16 +0000

[diff] [blame]

2312

void SIInstrInfo::splitScalar64BitBFE(SmallVectorImpl<MachineInstr *> &Worklist,

2313

MachineInstr *Inst) const {

2314

MachineBasicBlock &MBB = *Inst->getParent();

2315

MachineRegisterInfo &MRI = MBB.getParent()->getRegInfo();

2316

MachineBasicBlock::iterator MII = Inst;

2317

DebugLoc DL = Inst->getDebugLoc();

2318

2319

MachineOperand &Dest = Inst->getOperand(0);

2320

uint32_t Imm = Inst->getOperand(2).getImm();

2321

uint32_t Offset = Imm & 0x3f; // Extract bits [5:0].

2322

uint32_t BitWidth = (Imm & 0x7f0000) >> 16; // Extract bits [22:16].

2323

Matt Arsenault

6ad3426

2014-11-14 18:40:49 +0000

[diff] [blame]

2324

(void) Offset;

2325

Matt Arsenault

9481221

2014-11-14 18:18:16 +0000

[diff] [blame]

2326

// Only sext_inreg cases handled.

2327

assert(Inst->getOpcode() == AMDGPU::S_BFE_I64 &&

BitWidth <= 32 &&

Offset == 0 &&

"Not implemented");

if (BitWidth < 32) {

unsigned MidRegLo = MRI.createVirtualRegister(&AMDGPU::VGPR_32RegClass);

2334

unsigned MidRegHi = MRI.createVirtualRegister(&AMDGPU::VGPR_32RegClass);

2335

unsigned ResultReg = MRI.createVirtualRegister(&AMDGPU::VReg_64RegClass);

2336

2337

BuildMI(MBB, MII, DL, get(AMDGPU::V_BFE_I32), MidRegLo)

2338

.addReg(Inst->getOperand(1).getReg(), 0, AMDGPU::sub0)

.addImm(0)

.addImm(BitWidth);

BuildMI(MBB, MII, DL, get(AMDGPU::V_ASHRREV_I32_e32), MidRegHi)

.addImm(31)

.addReg(MidRegLo);

BuildMI(MBB, MII, DL, get(TargetOpcode::REG_SEQUENCE), ResultReg)

2347

.addReg(MidRegLo)

2348

.addImm(AMDGPU::sub0)

2349

.addReg(MidRegHi)

2350

.addImm(AMDGPU::sub1);

2351

2352

MRI.replaceRegWith(Dest.getReg(), ResultReg);

return;

}

MachineOperand &Src = Inst->getOperand(1);

2357

unsigned TmpReg = MRI.createVirtualRegister(&AMDGPU::VGPR_32RegClass);

2358

unsigned ResultReg = MRI.createVirtualRegister(&AMDGPU::VReg_64RegClass);

2359

2360

BuildMI(MBB, MII, DL, get(AMDGPU::V_ASHRREV_I32_e64), TmpReg)

2361

.addImm(31)

2362

.addReg(Src.getReg(), 0, AMDGPU::sub0);

2363

2364

BuildMI(MBB, MII, DL, get(TargetOpcode::REG_SEQUENCE), ResultReg)

2365

.addReg(Src.getReg(), 0, AMDGPU::sub0)

2366

.addImm(AMDGPU::sub0)

2367

.addReg(TmpReg)

2368

.addImm(AMDGPU::sub1);

2369

2370

MRI.replaceRegWith(Dest.getReg(), ResultReg);

2371

}

2372

Matt Arsenault

2014-04-18 01:53:18 +0000

[diff] [blame]

2373

void SIInstrInfo::addDescImplicitUseDef(const MCInstrDesc &NewDesc,

2374

MachineInstr *Inst) const {

2375

// Add the implict and explicit register definitions.

2376

if (NewDesc.ImplicitUses) {

2377

for (unsigned i = 0; NewDesc.ImplicitUses[i]; ++i) {

2378

unsigned Reg = NewDesc.ImplicitUses[i];

2379

Inst->addOperand(MachineOperand::CreateReg(Reg, false, true));

}

}

if (NewDesc.ImplicitDefs) {

2384

for (unsigned i = 0; NewDesc.ImplicitDefs[i]; ++i) {

2385

unsigned Reg = NewDesc.ImplicitDefs[i];

2386

Inst->addOperand(MachineOperand::CreateReg(Reg, true, true));

}

}

}

Matt Arsenault

2014-09-26 17:55:06 +0000

[diff] [blame]

2391

unsigned SIInstrInfo::findUsedSGPR(const MachineInstr *MI,

2392

int OpIndices[3]) const {

2393

const MCInstrDesc &Desc = get(MI->getOpcode());

2394

2395

// Find the one SGPR operand we are allowed to use.

2396

unsigned SGPRReg = AMDGPU::NoRegister;

2397

2398

// First we need to consider the instruction's operand requirements before

2399

// legalizing. Some operands are required to be SGPRs, such as implicit uses

2400

// of VCC, but we are still bound by the constant bus requirement to only use

2401

// one.

2402

//

2403

// If the operand's class is an SGPR, we can never move it.

2404

2405

for (const MachineOperand &MO : MI->implicit_operands()) {

2406

// We only care about reads.

if (MO.isDef())

continue;

if (MO.getReg() == AMDGPU::VCC)

2411

return AMDGPU::VCC;

2412

2413

if (MO.getReg() == AMDGPU::FLAT_SCR)

2414

return AMDGPU::FLAT_SCR;

2415

}

2416

2417

unsigned UsedSGPRs[3] = { AMDGPU::NoRegister };

2418

const MachineRegisterInfo &MRI = MI->getParent()->getParent()->getRegInfo();

2419

2420

for (unsigned i = 0; i < 3; ++i) {

2421

int Idx = OpIndices[i];

if (Idx == -1)

break;

const MachineOperand &MO = MI->getOperand(Idx);

2426

if (RI.isSGPRClassID(Desc.OpInfo[Idx].RegClass))

2427

SGPRReg = MO.getReg();

2428

2429

if (MO.isReg() && RI.isSGPRClass(MRI.getRegClass(MO.getReg())))

2430

UsedSGPRs[i] = MO.getReg();

2431

}

2432

2433

if (SGPRReg != AMDGPU::NoRegister)

2434

return SGPRReg;

2435

2436

// We don't have a required SGPR operand, so we have a bit more freedom in

2437

// selecting operands to move.

2438

2439

// Try to select the most used SGPR. If an SGPR is equal to one of the

2440

// others, we choose that.

2441

//

2442

// e.g.

2443

// V_FMA_F32 v0, s0, s0, s0 -> No moves

2444

// V_FMA_F32 v0, s0, s1, s0 -> Move s1

2445

2446

if (UsedSGPRs[0] != AMDGPU::NoRegister) {

2447

if (UsedSGPRs[0] == UsedSGPRs[1] || UsedSGPRs[0] == UsedSGPRs[2])

2448

SGPRReg = UsedSGPRs[0];

2449

}

2450

2451

if (SGPRReg == AMDGPU::NoRegister && UsedSGPRs[1] != AMDGPU::NoRegister) {

2452

if (UsedSGPRs[1] == UsedSGPRs[2])

2453

SGPRReg = UsedSGPRs[1];

}

return SGPRReg;

}

Tom Stellard

2013-02-06 17:32:29 +0000

[diff] [blame]

2459

MachineInstrBuilder SIInstrInfo::buildIndirectWrite(

2460

MachineBasicBlock *MBB,

2461

MachineBasicBlock::iterator I,

2462

unsigned ValueReg,

2463

unsigned Address, unsigned OffsetReg) const {

Tom Stellard

2013-11-13 23:36:50 +0000

[diff] [blame]

2464

const DebugLoc &DL = MBB->findDebugLoc(I);

Tom Stellard

2015-01-07 20:59:25 +0000

[diff] [blame]

2465

unsigned IndirectBaseReg = AMDGPU::VGPR_32RegClass.getRegister(

Tom Stellard

2013-11-13 23:36:50 +0000

[diff] [blame]

2466

getIndirectIndexBegin(*MBB->getParent()));

2467

2468

return BuildMI(*MBB, I, DL, get(AMDGPU::SI_INDIRECT_DST_V1))

2469

.addReg(IndirectBaseReg, RegState::Define)

2470

.addOperand(I->getOperand(0))

2471

.addReg(IndirectBaseReg)

2472

.addReg(OffsetReg)

2473

.addImm(0)

2474

.addReg(ValueReg);

Tom Stellard

2013-02-06 17:32:29 +0000

[diff] [blame]

2475

}

2476

2477

MachineInstrBuilder SIInstrInfo::buildIndirectRead(

2478

MachineBasicBlock *MBB,

2479

MachineBasicBlock::iterator I,

2480

unsigned ValueReg,

2481

unsigned Address, unsigned OffsetReg) const {

Tom Stellard

2013-11-13 23:36:50 +0000

[diff] [blame]

2482

const DebugLoc &DL = MBB->findDebugLoc(I);

Tom Stellard

2015-01-07 20:59:25 +0000

[diff] [blame]

2483

unsigned IndirectBaseReg = AMDGPU::VGPR_32RegClass.getRegister(

Tom Stellard

2013-11-13 23:36:50 +0000

[diff] [blame]

2484

getIndirectIndexBegin(*MBB->getParent()));

2485

2486

return BuildMI(*MBB, I, DL, get(AMDGPU::SI_INDIRECT_SRC))

2487

.addOperand(I->getOperand(0))

2488

.addOperand(I->getOperand(1))

2489

.addReg(IndirectBaseReg)

.addReg(OffsetReg)

.addImm(0);

}

void SIInstrInfo::reserveIndirectRegisters(BitVector &Reserved,

2496

const MachineFunction &MF) const {

2497

int End = getIndirectIndexEnd(MF);

2498

int Begin = getIndirectIndexBegin(MF);

if (End == -1)

return;

for (int Index = Begin; Index <= End; ++Index)

Tom Stellard

2015-01-07 20:59:25 +0000

[diff] [blame]

2505

Reserved.set(AMDGPU::VGPR_32RegClass.getRegister(Index));

Tom Stellard

2013-11-13 23:36:50 +0000

[diff] [blame]

2506

Tom Stellard

2013-11-13 23:58:51 +0000

[diff] [blame]

2507

for (int Index = std::max(0, Begin - 1); Index <= End; ++Index)

Tom Stellard

2013-11-13 23:36:50 +0000

[diff] [blame]

2508

Reserved.set(AMDGPU::VReg_64RegClass.getRegister(Index));

2509

Tom Stellard

2013-11-13 23:58:51 +0000

[diff] [blame]

2510

for (int Index = std::max(0, Begin - 2); Index <= End; ++Index)

Tom Stellard

2013-11-13 23:36:50 +0000

[diff] [blame]

2511

Reserved.set(AMDGPU::VReg_96RegClass.getRegister(Index));

2512

Tom Stellard

2013-11-13 23:58:51 +0000

[diff] [blame]

2513

for (int Index = std::max(0, Begin - 3); Index <= End; ++Index)

Tom Stellard

2013-11-13 23:36:50 +0000

[diff] [blame]

2514

Reserved.set(AMDGPU::VReg_128RegClass.getRegister(Index));

2515

Tom Stellard

2013-11-13 23:58:51 +0000

[diff] [blame]

2516

for (int Index = std::max(0, Begin - 7); Index <= End; ++Index)

Tom Stellard

2013-11-13 23:36:50 +0000

[diff] [blame]

2517

Reserved.set(AMDGPU::VReg_256RegClass.getRegister(Index));

2518

Tom Stellard

2013-11-13 23:58:51 +0000

[diff] [blame]

2519

for (int Index = std::max(0, Begin - 15); Index <= End; ++Index)

Tom Stellard

2013-11-13 23:36:50 +0000

[diff] [blame]

2520

Reserved.set(AMDGPU::VReg_512RegClass.getRegister(Index));

Tom Stellard

2013-02-06 17:32:29 +0000

[diff] [blame]

2521

}

Tom Stellard

1aaad69

2014-07-21 16:55:33 +0000

[diff] [blame]

2522

Tom Stellard

6407e1e

2014-08-01 00:32:33 +0000

[diff] [blame]

2523

MachineOperand *SIInstrInfo::getNamedOperand(MachineInstr &MI,

Matt Arsenault

ace5b76

2014-10-17 18:00:43 +0000

[diff] [blame]

2524

unsigned OperandName) const {

Tom Stellard

1aaad69

2014-07-21 16:55:33 +0000

[diff] [blame]

2525

int Idx = AMDGPU::getNamedOperandIdx(MI.getOpcode(), OperandName);

if (Idx == -1)

return nullptr;

return &MI.getOperand(Idx);

2530

}

Tom Stellard