Blame - llvm/docs/AMDGPUOperandSyntax.rst - toolchain/llvm-project

2018-12-17 17:38:11 +0000

[diff] [blame]

1

=====================================

2

Syntax of AMDGPU Instruction Operands

3

=====================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

.. contents::

:local:

Conventions

===========

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

11

The following notation is used throughout this document:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

12

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

13

=================== =============================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

14

Notation Description

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

15

=================== =============================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

16

{0..N} Any integer value in the range from 0 to N (inclusive).

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

17

<x> Syntax and meaning of *x* is explained elsewhere.

18

=================== =============================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

19

20

.. _amdgpu_syn_operands:

Operands

========

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

25

.. _amdgpu_synid_v:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

26

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

27

v

28

-

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

29

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

30

Vector registers. There are 256 32-bit vector registers.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

31

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

32

A sequence of *vector* registers may be used to operate with more than 32 bits of data.

33

34

Assembler currently supports sequences of 1, 2, 3, 4, 8 and 16 *vector* registers.

35

36

=================================================== ====================================================================

37

Syntax Description

38

=================================================== ====================================================================

39

**v**\<N> A single 32-bit *vector* register.

40

41

*N* must be a decimal integer number.

42

**v[**\ <N>\ **]** A single 32-bit *vector* register.

43

44

*N* may be specified as an

45

:ref:`integer number<amdgpu_synid_integer_number>`

46

or an :ref:`absolute expression<amdgpu_synid_absolute_expression>`.

47

**v[**\ <N>:<K>\ **]** A sequence of (\ *K-N+1*\ ) *vector* registers.

48

49

*N* and *K* may be specified as

50

:ref:`integer numbers<amdgpu_synid_integer_number>`

51

or :ref:`absolute expressions<amdgpu_synid_absolute_expression>`.

52

**[v**\ <N>, \ **v**\ <N+1>, ... **v**\ <K>\ **]** A sequence of (\ *K-N+1*\ ) *vector* registers.

53

54

Register indices must be specified as decimal integer numbers.

55

=================================================== ====================================================================

56

57

Note. *N* and *K* must satisfy the following conditions:

* *N* <= *K*.

* 0 <= *N* <= 255.

* 0 <= *K* <= 255.

* *K-N+1* must be equal to 1, 2, 3, 4, 8 or 16.

63

64

Examples:

65

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

66

.. parsed-literal::

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

v255

v[0]

v[0:1]

v[1:1]

v[0:3]

v[2*2]

v[1-1:2-1]

[v252]

[v252,v253,v254,v255]

77

Dmitry Preobrazhensky

2019-07-08 16:50:11 +0000

[diff] [blame^]

78

.. _amdgpu_synid_nsa:

79

80

*Image* instructions may use special *NSA* (Non-Sequential Address) syntax for *image addresses*:

81

82

=================================================== ====================================================================

83

Syntax Description

84

=================================================== ====================================================================

85

**[v**\ <A>, \ **v**\ <B>, ... **v**\ <X>\ **]** A sequence of *vector* registers. At least one register

86

must be specified.

87

88

In contrast with standard syntax described above, registers in

89

this sequence are not required to have consecutive indices.

90

Moreover, the same register may appear in the list more than once.

91

=================================================== ====================================================================

92

93

Note. Reqister indices must be in the range 0..255. They must be specified as decimal integer numbers.

Examples:

.. parsed-literal::

[v32,v1,v2]

[v4,v4,v4,v4]

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

.. _amdgpu_synid_s:

s

-

Scalar 32-bit registers. The number of available *scalar* registers depends on GPU:

108

109

======= ============================

110

GPU Number of *scalar* registers

111

======= ============================

112

GFX7 104

113

GFX8 102

114

GFX9 102

Dmitry Preobrazhensky

2019-07-08 16:50:11 +0000

[diff] [blame^]

115

GFX10 106

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

116

======= ============================

117

118

A sequence of *scalar* registers may be used to operate with more than 32 bits of data.

119

Assembler currently supports sequences of 1, 2, 4, 8 and 16 *scalar* registers.

120

121

Pairs of *scalar* registers must be even-aligned (the first register must be even).

122

Sequences of 4 and more *scalar* registers must be quad-aligned.

123

124

======================================================== ====================================================================

125

Syntax Description

126

======================================================== ====================================================================

127

**s**\ <N> A single 32-bit *scalar* register.

128

129

*N* must be a decimal integer number.

130

**s[**\ <N>\ **]** A single 32-bit *scalar* register.

131

132

*N* may be specified as an

133

:ref:`integer number<amdgpu_synid_integer_number>`

134

or an :ref:`absolute expression<amdgpu_synid_absolute_expression>`.

135

**s[**\ <N>:<K>\ **]** A sequence of (\ *K-N+1*\ ) *scalar* registers.

136

137

*N* and *K* may be specified as

138

:ref:`integer numbers<amdgpu_synid_integer_number>`

139

or :ref:`absolute expressions<amdgpu_synid_absolute_expression>`.

140

**[s**\ <N>, \ **s**\ <N+1>, ... **s**\ <K>\ **]** A sequence of (\ *K-N+1*\ ) *scalar* registers.

141

142

Register indices must be specified as decimal integer numbers.

143

======================================================== ====================================================================

144

145

Note. *N* and *K* must satisfy the following conditions:

146

147

* *N* must be properly aligned based on sequence size.

148

* *N* <= *K*.

149

* 0 <= *N* < *SMAX*\ , where *SMAX* is the number of available *scalar* registers.

150

* 0 <= *K* < *SMAX*\ , where *SMAX* is the number of available *scalar* registers.

151

* *K-N+1* must be equal to 1, 2, 4, 8 or 16.

152

153

Examples:

154

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

155

.. parsed-literal::

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

s0

s[0]

s[0:1]

s[1:1]

s[0:3]

s[2*2]

s[1-1:2-1]

[s4]

[s4,s5,s6,s7]

Examples of *scalar* registers with an invalid alignment:

168

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

169

.. parsed-literal::

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

s[1:2]

s[2:5]

.. _amdgpu_synid_trap:

trap

----

A set of trap handler registers:

180

181

* :ref:`ttmp<amdgpu_synid_ttmp>`

182

* :ref:`tba<amdgpu_synid_tba>`

183

* :ref:`tma<amdgpu_synid_tma>`

184

185

.. _amdgpu_synid_ttmp:

ttmp

----

Trap handler temporary scalar registers, 32-bits wide.

191

The number of available *ttmp* registers depends on GPU:

192

193

======= ===========================

194

GPU Number of *ttmp* registers

195

======= ===========================

196

GFX7 12

197

GFX8 12

198

GFX9 16

Dmitry Preobrazhensky

2019-07-08 16:50:11 +0000

[diff] [blame^]

199

GFX10 16

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

200

======= ===========================

201

202

A sequence of *ttmp* registers may be used to operate with more than 32 bits of data.

203

Assembler currently supports sequences of 1, 2, 4, 8 and 16 *ttmp* registers.

204

205

Pairs of *ttmp* registers must be even-aligned (the first register must be even).

206

Sequences of 4 and more *ttmp* registers must be quad-aligned.

207

208

============================================================= ====================================================================

209

Syntax Description

210

============================================================= ====================================================================

211

**ttmp**\ <N> A single 32-bit *ttmp* register.

212

213

*N* must be a decimal integer number.

214

**ttmp[**\ <N>\ **]** A single 32-bit *ttmp* register.

215

216

*N* may be specified as an

217

:ref:`integer number<amdgpu_synid_integer_number>`

218

or an :ref:`absolute expression<amdgpu_synid_absolute_expression>`.

219

**ttmp[**\ <N>:<K>\ **]** A sequence of (\ *K-N+1*\ ) *ttmp* registers.

220

221

*N* and *K* may be specified as

222

:ref:`integer numbers<amdgpu_synid_integer_number>`

223

or :ref:`absolute expressions<amdgpu_synid_absolute_expression>`.

224

**[ttmp**\ <N>, \ **ttmp**\ <N+1>, ... **ttmp**\ <K>\ **]** A sequence of (\ *K-N+1*\ ) *ttmp* registers.

225

226

Register indices must be specified as decimal integer numbers.

227

============================================================= ====================================================================

228

229

Note. *N* and *K* must satisfy the following conditions:

230

231

* *N* must be properly aligned based on sequence size.

232

* *N* <= *K*.

233

* 0 <= *N* < *TMAX*, where *TMAX* is the number of available *ttmp* registers.

234

* 0 <= *K* < *TMAX*, where *TMAX* is the number of available *ttmp* registers.

235

* *K-N+1* must be equal to 1, 2, 4, 8 or 16.

236

237

Examples:

238

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

239

.. parsed-literal::

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

ttmp0

ttmp[0]

ttmp[0:1]

ttmp[1:1]

ttmp[0:3]

ttmp[2*2]

ttmp[1-1:2-1]

[ttmp4]

[ttmp4,ttmp5,ttmp6,ttmp7]

250

251

Examples of *ttmp* registers with an invalid alignment:

252

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

253

.. parsed-literal::

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

ttmp[1:2]

ttmp[2:5]

.. _amdgpu_synid_tba:

tba

---

Trap base address, 64-bits wide. Holds the pointer to the current trap handler program.

264

265

================== ======================================================================= =============

266

Syntax Description Availability

267

================== ======================================================================= =============

268

tba 64-bit *trap base address* register. GFX7, GFX8

269

[tba] 64-bit *trap base address* register (an alternative syntax). GFX7, GFX8

270

[tba_lo,tba_hi] 64-bit *trap base address* register (an alternative syntax). GFX7, GFX8

271

================== ======================================================================= =============

272

273

High and low 32 bits of *trap base address* may be accessed as separate registers:

274

275

================== ======================================================================= =============

276

Syntax Description Availability

277

================== ======================================================================= =============

278

tba_lo Low 32 bits of *trap base address* register. GFX7, GFX8

279

tba_hi High 32 bits of *trap base address* register. GFX7, GFX8

280

[tba_lo] Low 32 bits of *trap base address* register (an alternative syntax). GFX7, GFX8

281

[tba_hi] High 32 bits of *trap base address* register (an alternative syntax). GFX7, GFX8

282

================== ======================================================================= =============

283

Dmitry Preobrazhensky

2019-07-08 16:50:11 +0000

[diff] [blame^]

284

Note that *tba*, *tba_lo* and *tba_hi* are not accessible as assembler registers in GFX9 and GFX10,

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

285

but *tba* is readable/writable with the help of *s_get_reg* and *s_set_reg* instructions.

286

287

.. _amdgpu_synid_tma:

tma

---

Trap memory address, 64-bits wide.

293

294

================= ======================================================================= ==================

295

Syntax Description Availability

296

================= ======================================================================= ==================

297

tma 64-bit *trap memory address* register. GFX7, GFX8

298

[tma] 64-bit *trap memory address* register (an alternative syntax). GFX7, GFX8

299

[tma_lo,tma_hi] 64-bit *trap memory address* register (an alternative syntax). GFX7, GFX8

300

================= ======================================================================= ==================

301

302

High and low 32 bits of *trap memory address* may be accessed as separate registers:

303

304

================= ======================================================================= ==================

305

Syntax Description Availability

306

================= ======================================================================= ==================

307

tma_lo Low 32 bits of *trap memory address* register. GFX7, GFX8

308

tma_hi High 32 bits of *trap memory address* register. GFX7, GFX8

309

[tma_lo] Low 32 bits of *trap memory address* register (an alternative syntax). GFX7, GFX8

310

[tma_hi] High 32 bits of *trap memory address* register (an alternative syntax). GFX7, GFX8

311

================= ======================================================================= ==================

312

Dmitry Preobrazhensky

2019-07-08 16:50:11 +0000

[diff] [blame^]

313

Note that *tma*, *tma_lo* and *tma_hi* are not accessible as assembler registers in GFX9 and GFX10,

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

314

but *tma* is readable/writable with the help of *s_get_reg* and *s_set_reg* instructions.

315

316

.. _amdgpu_synid_flat_scratch:

317

318

flat_scratch

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

319

------------

320

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

321

Flat scratch address, 64-bits wide. Holds the base address of scratch memory.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

322

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

323

================================== ================================================================

324

Syntax Description

325

================================== ================================================================

326

flat_scratch 64-bit *flat scratch* address register.

327

[flat_scratch] 64-bit *flat scratch* address register (an alternative syntax).

328

[flat_scratch_lo,flat_scratch_hi] 64-bit *flat scratch* address register (an alternative syntax).

329

================================== ================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

330

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

331

High and low 32 bits of *flat scratch* address may be accessed as separate registers:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

332

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

333

========================= =========================================================================

334

Syntax Description

335

========================= =========================================================================

336

flat_scratch_lo Low 32 bits of *flat scratch* address register.

337

flat_scratch_hi High 32 bits of *flat scratch* address register.

338

[flat_scratch_lo] Low 32 bits of *flat scratch* address register (an alternative syntax).

339

[flat_scratch_hi] High 32 bits of *flat scratch* address register (an alternative syntax).

340

========================= =========================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

341

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

342

.. _amdgpu_synid_xnack:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

343

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

344

xnack

345

-----

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

346

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

347

Xnack mask, 64-bits wide. Holds a 64-bit mask of which threads

348

received an *XNACK* due to a vector memory operation.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

349

Dmitry Preobrazhensky

2019-07-08 16:50:11 +0000

[diff] [blame^]

350

.. WARNING:: GFX7 does not support *xnack* feature. For availability of this feature in other GPUs, refer :ref:`this table<amdgpu-processors>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

351

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

352

\

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

353

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

354

============================== =====================================================

355

Syntax Description

356

============================== =====================================================

357

xnack_mask 64-bit *xnack mask* register.

358

[xnack_mask] 64-bit *xnack mask* register (an alternative syntax).

359

[xnack_mask_lo,xnack_mask_hi] 64-bit *xnack mask* register (an alternative syntax).

360

============================== =====================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

361

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

362

High and low 32 bits of *xnack mask* may be accessed as separate registers:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

363

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

364

===================== ==============================================================

365

Syntax Description

366

===================== ==============================================================

367

xnack_mask_lo Low 32 bits of *xnack mask* register.

368

xnack_mask_hi High 32 bits of *xnack mask* register.

369

[xnack_mask_lo] Low 32 bits of *xnack mask* register (an alternative syntax).

370

[xnack_mask_hi] High 32 bits of *xnack mask* register (an alternative syntax).

371

===================== ==============================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

372

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

373

.. _amdgpu_synid_vcc:

Dmitry Preobrazhensky

2019-07-08 16:50:11 +0000

[diff] [blame^]

374

.. _amdgpu_synid_vcc_lo:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

375

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

376

vcc

377

---

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

378

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

379

Vector condition code, 64-bits wide. A bit mask with one bit per thread;

380

it holds the result of a vector compare operation.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

381

Dmitry Preobrazhensky

2019-07-08 16:50:11 +0000

[diff] [blame^]

382

Note that GFX10 H/W does not use high 32 bits of *vcc* in *wave32* mode.

383

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

384

================ =========================================================================

385

Syntax Description

386

================ =========================================================================

387

vcc 64-bit *vector condition code* register.

388

[vcc] 64-bit *vector condition code* register (an alternative syntax).

389

[vcc_lo,vcc_hi] 64-bit *vector condition code* register (an alternative syntax).

390

================ =========================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

391

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

392

High and low 32 bits of *vector condition code* may be accessed as separate registers:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

393

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

394

================ =========================================================================

395

Syntax Description

396

================ =========================================================================

397

vcc_lo Low 32 bits of *vector condition code* register.

398

vcc_hi High 32 bits of *vector condition code* register.

399

[vcc_lo] Low 32 bits of *vector condition code* register (an alternative syntax).

400

[vcc_hi] High 32 bits of *vector condition code* register (an alternative syntax).

401

================ =========================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

402

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

403

.. _amdgpu_synid_m0:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

404

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

405

m0

406

--

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

407

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

408

A 32-bit memory register. It has various uses,

409

including register indexing and bounds checking.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

410

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

411

=========== ===================================================

412

Syntax Description

413

=========== ===================================================

414

m0 A 32-bit *memory* register.

415

[m0] A 32-bit *memory* register (an alternative syntax).

416

=========== ===================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

417

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

418

.. _amdgpu_synid_exec:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

419

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

420

exec

421

----

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

422

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

423

Execute mask, 64-bits wide. A bit mask with one bit per thread,

424

which is applied to vector instructions and controls which threads execute

425

and which ignore the instruction.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

426

Dmitry Preobrazhensky

2019-07-08 16:50:11 +0000

[diff] [blame^]

427

Note that GFX10 H/W does not use high 32 bits of *exec* in *wave32* mode.

428

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

429

===================== =================================================================

430

Syntax Description

431

===================== =================================================================

432

exec 64-bit *execute mask* register.

433

[exec] 64-bit *execute mask* register (an alternative syntax).

434

[exec_lo,exec_hi] 64-bit *execute mask* register (an alternative syntax).

435

===================== =================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

436

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

437

High and low 32 bits of *execute mask* may be accessed as separate registers:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

438

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

439

===================== =================================================================

440

Syntax Description

441

===================== =================================================================

442

exec_lo Low 32 bits of *execute mask* register.

443

exec_hi High 32 bits of *execute mask* register.

444

[exec_lo] Low 32 bits of *execute mask* register (an alternative syntax).

445

[exec_hi] High 32 bits of *execute mask* register (an alternative syntax).

446

===================== =================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

447

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

448

.. _amdgpu_synid_vccz:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

449

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

450

vccz

451

----

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

452

Dmitry Preobrazhensky

2019-07-08 16:50:11 +0000

[diff] [blame^]

453

A single bit flag indicating that the :ref:`vcc<amdgpu_synid_vcc>` is all zeros.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

454

Dmitry Preobrazhensky

2019-07-08 16:50:11 +0000

[diff] [blame^]

455

Note. When GFX10 operates in *wave32* mode, this register reflects state of :ref:`vcc_lo<amdgpu_synid_vcc_lo>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

456

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

457

.. _amdgpu_synid_execz:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

458

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

459

execz

460

-----

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

461

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

462

A single bit flag indicating that the :ref:`exec<amdgpu_synid_exec>` is all zeros.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

463

Dmitry Preobrazhensky

2019-07-08 16:50:11 +0000

[diff] [blame^]

464

Note. When GFX10 operates in *wave32* mode, this register reflects state of :ref:`exec_lo<amdgpu_synid_exec>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

465

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

466

.. _amdgpu_synid_scc:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

467

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

468

scc

469

---

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

470

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

471

A single bit flag indicating the result of a scalar compare operation.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

472

Dmitry Preobrazhensky

2019-07-08 16:50:11 +0000

[diff] [blame^]

473

.. _amdgpu_synid_lds_direct:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

474

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

475

lds_direct

476

----------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

477

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

478

A special operand which supplies a 32-bit value

479

fetched from *LDS* memory using :ref:`m0<amdgpu_synid_m0>` as an address.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

480

Dmitry Preobrazhensky

2019-07-08 16:50:11 +0000

[diff] [blame^]

481

.. _amdgpu_synid_null:

null

----

This is a special operand which may be used as a source or a destination.

487

488

When used as a destination, the result of the operation is discarded.

489

490

When used as a source, it supplies zero value.

GFX10 only.

.. WARNING:: Due to a H/W bug, this operand cannot be used with VALU instructions in first generation of GFX10.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

495

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

496

.. _amdgpu_synid_constant:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

497

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

498

constant

499

--------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

500

Dmitry Preobrazhensky

2019-07-08 16:50:11 +0000

[diff] [blame^]

501

A set of integer and floating-point *inline* constants and values:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

502

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

503

* :ref:`iconst<amdgpu_synid_iconst>`

504

* :ref:`fconst<amdgpu_synid_fconst>`

Dmitry Preobrazhensky

2019-07-08 16:50:11 +0000

[diff] [blame^]

505

* :ref:`ival<amdgpu_synid_ival>`

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

506

Dmitry Preobrazhensky

2019-07-08 16:50:11 +0000

[diff] [blame^]

507

In contrast with :ref:`literals<amdgpu_synid_literal>`, these operands are encoded as a part of instruction.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

508

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

509

If a number may be encoded as either

510

a :ref:`literal<amdgpu_synid_literal>` or

Dmitry Preobrazhensky

2019-07-08 16:50:11 +0000

[diff] [blame^]

511

a :ref:`constant<amdgpu_synid_constant>`,

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

512

assembler selects the latter encoding as more efficient.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

513

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

514

.. _amdgpu_synid_iconst:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

515

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

516

iconst

Dmitry Preobrazhensky

2019-07-08 16:50:11 +0000

[diff] [blame^]

517

~~~~~~

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

518

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

519

An :ref:`integer number<amdgpu_synid_integer_number>`

520

encoded as an *inline constant*.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

521

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

522

Only a small fraction of integer numbers may be encoded as *inline constants*.

523

They are enumerated in the table below.

524

Other integer numbers have to be encoded as :ref:`literals<amdgpu_synid_literal>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

525

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

526

Integer *inline constants* are converted to

527

:ref:`expected operand type<amdgpu_syn_instruction_type>`

528

as described :ref:`here<amdgpu_synid_int_const_conv>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

529

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

530

================================== ====================================

531

Value Note

532

================================== ====================================

533

{0..64} Positive integer inline constants.

534

{-16..-1} Negative integer inline constants.

535

================================== ====================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

536

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

537

.. WARNING:: GFX7 does not support inline constants for *f16* operands.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

538

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

539

.. _amdgpu_synid_fconst:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

540

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

541

fconst

Dmitry Preobrazhensky

2019-07-08 16:50:11 +0000

[diff] [blame^]

542

~~~~~~

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

543

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

544

A :ref:`floating-point number<amdgpu_synid_floating-point_number>`

545

encoded as an *inline constant*.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

546

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

547

Only a small fraction of floating-point numbers may be encoded as *inline constants*.

548

They are enumerated in the table below.

549

Other floating-point numbers have to be encoded as :ref:`literals<amdgpu_synid_literal>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

550

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

551

Floating-point *inline constants* are converted to

552

:ref:`expected operand type<amdgpu_syn_instruction_type>`

553

as described :ref:`here<amdgpu_synid_fp_const_conv>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

554

Dmitry Preobrazhensky

6bc26aa

2019-01-18 15:17:17 +0000

[diff] [blame]

555

===================== ===================================================== ==================

556

Value Note Availability

557

===================== ===================================================== ==================

558

0.0 The same as integer constant 0. All GPUs

559

0.5 Floating-point constant 0.5 All GPUs

560

1.0 Floating-point constant 1.0 All GPUs

561

2.0 Floating-point constant 2.0 All GPUs

562

4.0 Floating-point constant 4.0 All GPUs

563

-0.5 Floating-point constant -0.5 All GPUs

564

-1.0 Floating-point constant -1.0 All GPUs

565

-2.0 Floating-point constant -2.0 All GPUs

566

-4.0 Floating-point constant -4.0 All GPUs

Dmitry Preobrazhensky

2019-07-08 16:50:11 +0000

[diff] [blame^]

567

0.1592 1.0/(2.0*pi). Use only for 16-bit operands. GFX8, GFX9, GFX10

568

0.15915494 1.0/(2.0*pi). Use only for 16- and 32-bit operands. GFX8, GFX9, GFX10

569

0.15915494309189532 1.0/(2.0*pi). GFX8, GFX9, GFX10

Dmitry Preobrazhensky

6bc26aa

2019-01-18 15:17:17 +0000

[diff] [blame]

570

===================== ===================================================== ==================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

571

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

572

.. WARNING:: GFX7 does not support inline constants for *f16* operands.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

573

Dmitry Preobrazhensky

2019-07-08 16:50:11 +0000

[diff] [blame^]

574

.. _amdgpu_synid_ival:

ival

~~~~

A symbolic operand encoded as an *inline constant*.

580

These operands provide read-only access to H/W registers.

581

582

======================== ================================================ =============

583

Syntax Note Availability

584

======================== ================================================ =============

585

shared_base Base address of shared memory region. GFX9, GFX10

586

shared_limit Address of the end of shared memory region. GFX9, GFX10

587

private_base Base address of private memory region. GFX9, GFX10

588

private_limit Address of the end of private memory region. GFX9, GFX10

589

pops_exiting_wave_id A dedicated counter for POPS. GFX9, GFX10

590

======================== ================================================ =============

591

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

592

.. _amdgpu_synid_literal:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

593

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

594

literal

595

-------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

596

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

597

A literal is a 64-bit value which is encoded as a separate 32-bit dword in the instruction stream.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

598

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

599

If a number may be encoded as either

600

a :ref:`literal<amdgpu_synid_literal>` or

601

an :ref:`inline constant<amdgpu_synid_constant>`,

602

assembler selects the latter encoding as more efficient.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

603

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

604

Literals may be specified as :ref:`integer numbers<amdgpu_synid_integer_number>`,

605

:ref:`floating-point numbers<amdgpu_synid_floating-point_number>` or

606

:ref:`expressions<amdgpu_synid_expression>`

607

(expressions are currently supported for 32-bit operands only).

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

608

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

609

A 64-bit literal value is converted by assembler

610

to an :ref:`expected operand type<amdgpu_syn_instruction_type>`

611

as described :ref:`here<amdgpu_synid_lit_conv>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

612

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

613

An instruction may use only one literal but several operands may refer the same literal.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

614

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

615

.. _amdgpu_synid_uimm8:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

616

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

617

uimm8

618

-----

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

619

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

620

A 8-bit positive :ref:`integer number<amdgpu_synid_integer_number>`.

621

The value is encoded as part of the opcode so it is free to use.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

622

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

623

.. _amdgpu_synid_uimm32:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

624

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

625

uimm32

626

------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

627

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

628

A 32-bit positive :ref:`integer number<amdgpu_synid_integer_number>`.

629

The value is stored as a separate 32-bit dword in the instruction stream.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

630

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

631

.. _amdgpu_synid_uimm20:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

632

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

633

uimm20

634

------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

635

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

636

A 20-bit positive :ref:`integer number<amdgpu_synid_integer_number>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

637

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

638

.. _amdgpu_synid_uimm21:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

639

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

640

uimm21

641

------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

642

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

643

A 21-bit positive :ref:`integer number<amdgpu_synid_integer_number>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

644

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

645

.. WARNING:: Assembler currently supports 20-bit offsets only. Use :ref:`uimm20<amdgpu_synid_uimm20>` as a replacement.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

646

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

647

.. _amdgpu_synid_simm21:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

648

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

649

simm21

650

------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

651

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

652

A 21-bit :ref:`integer number<amdgpu_synid_integer_number>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

653

Dmitry Preobrazhensky

2019-07-08 16:50:11 +0000

[diff] [blame^]

654

.. WARNING:: Assembler currently supports 20-bit unsigned offsets only. Use :ref:`uimm20<amdgpu_synid_uimm20>` as a replacement.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

655

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

656

.. _amdgpu_synid_off:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

657

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

658

off

659

---

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

660

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

661

A special entity which indicates that the value of this operand is not used.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

662

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

663

================================== ===================================================

664

Syntax Description

665

================================== ===================================================

666

off Indicates an unused operand.

667

================================== ===================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

668

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

669

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

670

.. _amdgpu_synid_number:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

671

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

672

Numbers

673

=======

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

674

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

675

.. _amdgpu_synid_integer_number:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

676

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

677

Integer Numbers

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

678

---------------

679

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

680

Integer numbers are 64 bits wide.

681

They may be specified in binary, octal, hexadecimal and decimal formats:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

682

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

683

============== ====================================

684

Format Syntax

685

============== ====================================

686

Decimal [-]?[1-9][0-9]*

687

Binary [-]?0b[01]+

688

Octal [-]?0[0-7]+

689

Hexadecimal [-]?0x[0-9a-fA-F]+

690

\ [-]?[0x]?[0-9][0-9a-fA-F]*[hH]

691

============== ====================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

692

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

693

Examples:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

694

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

695

.. parsed-literal::

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

696

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

-1234

0b1010

010

0xff

0ffh

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

702

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

703

.. _amdgpu_synid_floating-point_number:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

704

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

705

Floating-Point Numbers

706

----------------------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

707

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

708

All floating-point numbers are handled as double (64 bits wide).

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

709

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

710

Floating-point numbers may be specified in hexadecimal and decimal formats:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

711

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

712

============== ======================================================== ========================================================

713

Format Syntax Note

714

============== ======================================================== ========================================================

715

Decimal [-]?[0-9]*[.][0-9]*([eE][+-]?[0-9]*)? Must include either a decimal separator or an exponent.

716

Hexadecimal [-]0x[0-9a-fA-F]*(.[0-9a-fA-F]*)?[pP][+-]?[0-9a-fA-F]+

717

============== ======================================================== ========================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

718

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

719

Examples:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

720

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

721

.. parsed-literal::

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

722

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

-1.234

234e2

-0x1afp-10

0x.1afp10

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

727

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

728

.. _amdgpu_synid_expression:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

729

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

730

Expressions

731

===========

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

732

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

733

An expression specifies an address or a numeric value.

734

There are two kinds of expressions:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

735

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

736

* :ref:`Absolute<amdgpu_synid_absolute_expression>`.

737

* :ref:`Relocatable<amdgpu_synid_relocatable_expression>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

738

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

739

.. _amdgpu_synid_absolute_expression:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

740

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

741

Absolute Expressions

742

--------------------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

743

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

744

The value of an absolute expression remains the same after program relocation.

745

Absolute expressions must not include unassigned and relocatable values

746

such as labels.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

747

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

748

Examples:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

749

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

750

.. parsed-literal::

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

751

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

752

x = -1

753

y = x + 10

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

754

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

755

.. _amdgpu_synid_relocatable_expression:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

756

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

757

Relocatable Expressions

758

-----------------------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

759

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

760

The value of a relocatable expression depends on program relocation.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

761

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

762

Note that use of relocatable expressions is limited with branch targets

763

and 32-bit :ref:`literals<amdgpu_synid_literal>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

764

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

765

Addition information about relocation may be found :ref:`here<amdgpu-relocation-records>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

766

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

767

Examples:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

768

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

769

.. parsed-literal::

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

770

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

771

y = x + 10 // x is not yet defined. Undefined symbols are assumed to be PC-relative.

772

z = .

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

773

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

774

Expression Data Type

775

--------------------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

776

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

777

Expressions and operands of expressions are interpreted as 64-bit integers.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

778

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

779

Expressions may include 64-bit :ref:`floating-point numbers<amdgpu_synid_floating-point_number>` (double).

780

However these operands are also handled as 64-bit integers

781

using binary representation of specified floating-point numbers.

782

No conversion from floating-point to integer is performed.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

783

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

784

Examples:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

785

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

786

.. parsed-literal::

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

787

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

788

x = 0.1 // x is assigned an integer 4591870180066957722 which is a binary representation of 0.1.

789

y = x + x // y is a sum of two integer values; it is not equal to 0.2!

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

790

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

791

Syntax

792

------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

793

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

794

Expressions are composed of

795

:ref:`symbols<amdgpu_synid_symbol>`,

796

:ref:`integer numbers<amdgpu_synid_integer_number>`,

797

:ref:`floating-point numbers<amdgpu_synid_floating-point_number>`,

798

:ref:`binary operators<amdgpu_synid_expression_bin_op>`,

799

:ref:`unary operators<amdgpu_synid_expression_un_op>` and subexpressions.

Dmitry Preobrazhensky

2018-07-27 14:17:15 +0000

[diff] [blame]

800

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

801

Expressions may also use "." which is a reference to the current PC (program counter).

Dmitry Preobrazhensky

2018-07-27 14:17:15 +0000

[diff] [blame]

802

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

803

The syntax of expressions is shown below::

Dmitry Preobrazhensky

2018-07-27 14:17:15 +0000

[diff] [blame]

804

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

805

expr ::= expr binop expr | primaryexpr ;

Dmitry Preobrazhensky

2018-07-27 14:17:15 +0000

[diff] [blame]

806

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

807

primaryexpr ::= '(' expr ')' | symbol | number | '.' | unop primaryexpr ;

Dmitry Preobrazhensky

2018-07-27 14:17:15 +0000

[diff] [blame]

808

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

binop ::= '&&'

| '||'

| '|'

| '^'

| '&'

| '!'

| '=='

| '!='

| '<>'

| '<'

| '<='

| '>'

| '>='

| '<<'

| '>>'

| '+'

| '-'

| '*'

| '/'

| '%' ;

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

829

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

unop ::= '~'

| '+'

| '-'

| '!' ;

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

834

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

835

.. _amdgpu_synid_expression_bin_op:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

836

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

837

Binary Operators

838

----------------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

839

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

840

Binary operators are described in the following table.

841

They operate on and produce 64-bit integers.

842

Operators with higher priority are performed first.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

843

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

844

========== ========= ===============================================

845

Operator Priority Meaning

846

========== ========= ===============================================

847

\* 5 Integer multiplication.

848

/ 5 Integer division.

849

% 5 Integer signed remainder.

850

\+ 4 Integer addition.

851

\- 4 Integer subtraction.

852

<< 3 Integer shift left.

853

>> 3 Logical shift right.

854

== 2 Equality comparison.

855

!= 2 Inequality comparison.

856

<> 2 Inequality comparison.

857

< 2 Signed less than comparison.

858

<= 2 Signed less than or equal comparison.

859

> 2 Signed greater than comparison.

860

>= 2 Signed greater than or equal comparison.

\| 1 Bitwise or.

^ 1 Bitwise xor.

& 1 Bitwise and.

&& 0 Logical and.

|| 0 Logical or.

========== ========= ===============================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

867

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

868

.. _amdgpu_synid_expression_un_op:

Unary Operators

---------------

Unary operators are described in the following table.

874

They operate on and produce 64-bit integers.

875

876

========== ===============================================

877

Operator Meaning

878

========== ===============================================

879

! Logical negation.

880

~ Bitwise negation.

881

\+ Integer unary plus.

882

\- Integer unary minus.

883

========== ===============================================

884

885

.. _amdgpu_synid_symbol:

Symbols

-------

A symbol is a named 64-bit value, representing a relocatable

891

address or an absolute (non-relocatable) number.

892

893

Symbol names have the following syntax:

894

``[a-zA-Z_.][a-zA-Z0-9_$.@]*``

895

896

The table below provides several examples of syntax used for symbol definition.

897

898

================ ==========================================================

899

Syntax Meaning

900

================ ==========================================================

901

.globl <S> Declares a global symbol S without assigning it a value.

902

.set <S>, <E> Assigns the value of an expression E to a symbol S.

903

<S> = <E> Assigns the value of an expression E to a symbol S.

904

<S>: Declares a label S and assigns it the current PC value.

905

================ ==========================================================

906

907

A symbol may be used before it is declared or assigned;

908

unassigned symbols are assumed to be PC-relative.

909

910

Addition information about symbols may be found :ref:`here<amdgpu-symbols>`.

911

912

.. _amdgpu_synid_conv:

Conversions

===========

This section describes what happens when a 64-bit

918

:ref:`integer number<amdgpu_synid_integer_number>`, a

919

:ref:`floating-point numbers<amdgpu_synid_floating-point_number>` or a

920

:ref:`symbol<amdgpu_synid_symbol>`

921

is used for an operand which has a different type or size.

922

923

Depending on operand kind, this conversion is performed by either assembler or AMDGPU H/W:

924

925

* Values encoded as :ref:`inline constants<amdgpu_synid_constant>` are handled by H/W.

926

* Values encoded as :ref:`literals<amdgpu_synid_literal>` are converted by assembler.

927

928

.. _amdgpu_synid_const_conv:

Inline Constants

----------------

.. _amdgpu_synid_int_const_conv:

934

935

Integer Inline Constants

936

~~~~~~~~~~~~~~~~~~~~~~~~

937

938

Integer :ref:`inline constants<amdgpu_synid_constant>`

939

may be thought of as 64-bit

940

:ref:`integer numbers<amdgpu_synid_integer_number>`;

941

when used as operands they are truncated to the size of

942

:ref:`expected operand type<amdgpu_syn_instruction_type>`.

943

No data type conversions are performed.

944

945

Examples:

946

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

947

.. parsed-literal::

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

// GFX9

v_add_u16 v0, -1, 0 // v0 = 0xFFFF

952

v_add_f16 v0, -1, 0 // v0 = 0xFFFF (NaN)

953

954

v_add_u32 v0, -1, 0 // v0 = 0xFFFFFFFF

955

v_add_f32 v0, -1, 0 // v0 = 0xFFFFFFFF (NaN)

956

957

.. _amdgpu_synid_fp_const_conv:

958

959

Floating-Point Inline Constants

960

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

961

962

Floating-point :ref:`inline constants<amdgpu_synid_constant>`

963

may be thought of as 64-bit

964

:ref:`floating-point numbers<amdgpu_synid_floating-point_number>`;

965

when used as operands they are converted to a floating-point number of

966

:ref:`expected operand size<amdgpu_syn_instruction_type>`.

967

968

Examples:

969

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

970

.. parsed-literal::

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

// GFX9

v_add_f16 v0, 1.0, 0 // v0 = 0x3C00 (1.0)

975

v_add_u16 v0, 1.0, 0 // v0 = 0x3C00

976

977

v_add_f32 v0, 1.0, 0 // v0 = 0x3F800000 (1.0)

978

v_add_u32 v0, 1.0, 0 // v0 = 0x3F800000

979

980

981

.. _amdgpu_synid_lit_conv:

Literals

--------

.. _amdgpu_synid_int_lit_conv:

Integer Literals

~~~~~~~~~~~~~~~~

Integer :ref:`literals<amdgpu_synid_literal>`

992

are specified as 64-bit :ref:`integer numbers<amdgpu_synid_integer_number>`.

993

994

When used as operands they are converted to

995

:ref:`expected operand type<amdgpu_syn_instruction_type>` as described below.

996

997

============== ============== =============== ====================================================================

998

Expected type Condition Result Note

999

============== ============== =============== ====================================================================

Dmitry Preobrazhensky

2018-12-28 11:48:23 +0000

[diff] [blame]

1000

i16, u16, b16 cond(num,16) num.u16 Truncate to 16 bits.

1001

i32, u32, b32 cond(num,32) num.u32 Truncate to 32 bits.

1002

i64 cond(num,32) {-1,num.i32} Truncate to 32 bits and then sign-extend the result to 64 bits.

1003

u64, b64 cond(num,32) { 0,num.u32} Truncate to 32 bits and then zero-extend the result to 64 bits.

1004

f16 cond(num,16) num.u16 Use low 16 bits as an f16 value.

1005

f32 cond(num,32) num.u32 Use low 32 bits as an f32 value.

1006

f64 cond(num,32) {num.u32,0} Use low 32 bits of the number as high 32 bits

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

1007

of the result; low 32 bits of the result are zeroed.

1008

============== ============== =============== ====================================================================

1009

1010

The condition *cond(X,S)* indicates if a 64-bit number *X*

1011

can be converted to a smaller size *S* by truncation of upper bits.

1012

There are two cases when the conversion is possible:

1013

1014

* The truncated bits are all 0.

1015

* The truncated bits are all 1 and the value after truncation has its MSB bit set.

1016

1017

Examples of valid literals:

1018

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

1019

.. parsed-literal::

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

1020

1021

// GFX9

Dmitry Preobrazhensky

2018-12-28 11:48:23 +0000

[diff] [blame]

1022

// Literal value after conversion:

1023

v_add_u16 v0, 0xff00, v0 // 0xff00

1024

v_add_u16 v0, 0xffffffffffffff00, v0 // 0xff00

1025

v_add_u16 v0, -256, v0 // 0xff00

1026

// Literal value after conversion:

1027

s_bfe_i64 s[0:1], 0xffefffff, s3 // 0xffffffffffefffff

1028

s_bfe_u64 s[0:1], 0xffefffff, s3 // 0x00000000ffefffff

1029

v_ceil_f64_e32 v[0:1], 0xffefffff // 0xffefffff00000000 (-1.7976922776554302e308)

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

1030

1031

Examples of invalid literals:

1032

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

1033

.. parsed-literal::

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

1034

1035

// GFX9

1036

Dmitry Preobrazhensky

2018-12-28 11:48:23 +0000

[diff] [blame]

1037

v_add_u16 v0, 0x1ff00, v0 // truncated bits are not all 0 or 1

1038

v_add_u16 v0, 0xffffffffffff00ff, v0 // truncated bits do not match MSB of the result

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

1039

1040

.. _amdgpu_synid_fp_lit_conv:

1041

1042

Floating-Point Literals

1043

~~~~~~~~~~~~~~~~~~~~~~~

1044

1045

Floating-point :ref:`literals<amdgpu_synid_literal>` are specified as 64-bit

1046

:ref:`floating-point numbers<amdgpu_synid_floating-point_number>`.

1047

1048

When used as operands they are converted to

1049

:ref:`expected operand type<amdgpu_syn_instruction_type>` as described below.

1050

1051

============== ============== ================= =================================================================

1052

Expected type Condition Result Note

1053

============== ============== ================= =================================================================

Dmitry Preobrazhensky

2018-12-28 11:48:23 +0000

[diff] [blame]

1054

i16, u16, b16 cond(num,16) f16(num) Convert to f16 and use bits of the result as an integer value.

1055

i32, u32, b32 cond(num,32) f32(num) Convert to f32 and use bits of the result as an integer value.

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

1056

i64, u64, b64 false \- Conversion disabled because of an unclear semantics.

Dmitry Preobrazhensky

2018-12-28 11:48:23 +0000

[diff] [blame]

1057

f16 cond(num,16) f16(num) Convert to f16.

1058

f32 cond(num,32) f32(num) Convert to f32.

1059

f64 true {num.u32.hi,0} Use high 32 bits of the number as high 32 bits of the result;

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

1060

zero-fill low 32 bits of the result.

1061

1062

Note that the result may differ from the original number.

1063

============== ============== ================= =================================================================

1064

1065

The condition *cond(X,S)* indicates if an f64 number *X* can be converted

1066

to a smaller *S*-bit floating-point type without overflow or underflow.

1067

Precision lost is allowed.

1068

1069

Examples of valid literals:

1070

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

1071

.. parsed-literal::

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

// GFX9

v_add_f16 v1, 65500.0, v2

1076

v_add_f32 v1, 65600.0, v2

1077

Dmitry Preobrazhensky

2018-12-28 11:48:23 +0000

[diff] [blame]

1078

// Literal value before conversion: 1.7976931348623157e308 (0x7fefffffffffffff)

1079

// Literal value after conversion: 1.7976922776554302e308 (0x7fefffff00000000)

1080

v_ceil_f64 v[0:1], 1.7976931348623157e308

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

1081

1082

Examples of invalid literals:

1083

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

1084

.. parsed-literal::

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

1085

1086

// GFX9

1087

Dmitry Preobrazhensky

2018-12-28 11:48:23 +0000

[diff] [blame]

1088

v_add_f16 v1, 65600.0, v2 // overflow

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame]

1089

1090

.. _amdgpu_synid_exp_conv:

Expressions

~~~~~~~~~~~

Expressions operate with and result in 64-bit integers.

1096

1097

When used as operands they are truncated to

1098

:ref:`expected operand size<amdgpu_syn_instruction_type>`.

1099

No data type conversions are performed.

1100

1101

Examples:

1102

Dmitry Preobrazhensky

2018-12-17 18:53:10 +0000

[diff] [blame]

1103

.. parsed-literal::

Dmitry Preobrazhensky