Blame - llvm/docs/AMDGPUOperandSyntax.rst - toolchain/llvm-project

2018-12-17 17:38:11 +0000

[diff] [blame^]

1

=====================================

2

Syntax of AMDGPU Instruction Operands

3

=====================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

.. contents::

:local:

Conventions

===========

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

11

The following notation is used throughout this document:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

12

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

13

=================== =============================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

14

Notation Description

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

15

=================== =============================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

16

{0..N} Any integer value in the range from 0 to N (inclusive).

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

17

<x> Syntax and meaning of *x* is explained elsewhere.

18

=================== =============================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

19

20

.. _amdgpu_syn_operands:

Operands

========

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

25

.. _amdgpu_synid_v:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

26

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

27

v

28

-

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

29

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

30

Vector registers. There are 256 32-bit vector registers.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

31

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

32

A sequence of *vector* registers may be used to operate with more than 32 bits of data.

33

34

Assembler currently supports sequences of 1, 2, 3, 4, 8 and 16 *vector* registers.

35

36

=================================================== ====================================================================

37

Syntax Description

38

=================================================== ====================================================================

39

**v**\<N> A single 32-bit *vector* register.

40

41

*N* must be a decimal integer number.

42

**v[**\ <N>\ **]** A single 32-bit *vector* register.

43

44

*N* may be specified as an

45

:ref:`integer number<amdgpu_synid_integer_number>`

46

or an :ref:`absolute expression<amdgpu_synid_absolute_expression>`.

47

**v[**\ <N>:<K>\ **]** A sequence of (\ *K-N+1*\ ) *vector* registers.

48

49

*N* and *K* may be specified as

50

:ref:`integer numbers<amdgpu_synid_integer_number>`

51

or :ref:`absolute expressions<amdgpu_synid_absolute_expression>`.

52

**[v**\ <N>, \ **v**\ <N+1>, ... **v**\ <K>\ **]** A sequence of (\ *K-N+1*\ ) *vector* registers.

53

54

Register indices must be specified as decimal integer numbers.

55

=================================================== ====================================================================

56

57

Note. *N* and *K* must satisfy the following conditions:

* *N* <= *K*.

* 0 <= *N* <= 255.

* 0 <= *K* <= 255.

* *K-N+1* must be equal to 1, 2, 3, 4, 8 or 16.

Examples:

.. code-block:: nasm

v255

v[0]

v[0:1]

v[1:1]

v[0:3]

v[2*2]

v[1-1:2-1]

[v252]

[v252,v253,v254,v255]

.. _amdgpu_synid_s:

s

-

Scalar 32-bit registers. The number of available *scalar* registers depends on GPU:

84

85

======= ============================

86

GPU Number of *scalar* registers

87

======= ============================

GFX7 104

GFX8 102

GFX9 102

======= ============================

92

93

A sequence of *scalar* registers may be used to operate with more than 32 bits of data.

94

Assembler currently supports sequences of 1, 2, 4, 8 and 16 *scalar* registers.

95

96

Pairs of *scalar* registers must be even-aligned (the first register must be even).

97

Sequences of 4 and more *scalar* registers must be quad-aligned.

98

99

======================================================== ====================================================================

100

Syntax Description

101

======================================================== ====================================================================

102

**s**\ <N> A single 32-bit *scalar* register.

103

104

*N* must be a decimal integer number.

105

**s[**\ <N>\ **]** A single 32-bit *scalar* register.

106

107

*N* may be specified as an

108

:ref:`integer number<amdgpu_synid_integer_number>`

109

or an :ref:`absolute expression<amdgpu_synid_absolute_expression>`.

110

**s[**\ <N>:<K>\ **]** A sequence of (\ *K-N+1*\ ) *scalar* registers.

111

112

*N* and *K* may be specified as

113

:ref:`integer numbers<amdgpu_synid_integer_number>`

114

or :ref:`absolute expressions<amdgpu_synid_absolute_expression>`.

115

**[s**\ <N>, \ **s**\ <N+1>, ... **s**\ <K>\ **]** A sequence of (\ *K-N+1*\ ) *scalar* registers.

116

117

Register indices must be specified as decimal integer numbers.

118

======================================================== ====================================================================

119

120

Note. *N* and *K* must satisfy the following conditions:

121

122

* *N* must be properly aligned based on sequence size.

123

* *N* <= *K*.

124

* 0 <= *N* < *SMAX*\ , where *SMAX* is the number of available *scalar* registers.

125

* 0 <= *K* < *SMAX*\ , where *SMAX* is the number of available *scalar* registers.

126

* *K-N+1* must be equal to 1, 2, 4, 8 or 16.

Examples:

.. code-block:: nasm

s0

s[0]

s[0:1]

s[1:1]

s[0:3]

s[2*2]

s[1-1:2-1]

[s4]

[s4,s5,s6,s7]

Examples of *scalar* registers with an invalid alignment:

.. code-block:: nasm

s[1:2]

s[2:5]

.. _amdgpu_synid_trap:

trap

----

A set of trap handler registers:

155

156

* :ref:`ttmp<amdgpu_synid_ttmp>`

157

* :ref:`tba<amdgpu_synid_tba>`

158

* :ref:`tma<amdgpu_synid_tma>`

159

160

.. _amdgpu_synid_ttmp:

ttmp

----

Trap handler temporary scalar registers, 32-bits wide.

166

The number of available *ttmp* registers depends on GPU:

167

168

======= ===========================

169

GPU Number of *ttmp* registers

170

======= ===========================

GFX7 12

GFX8 12

GFX9 16

======= ===========================

175

176

A sequence of *ttmp* registers may be used to operate with more than 32 bits of data.

177

Assembler currently supports sequences of 1, 2, 4, 8 and 16 *ttmp* registers.

178

179

Pairs of *ttmp* registers must be even-aligned (the first register must be even).

180

Sequences of 4 and more *ttmp* registers must be quad-aligned.

181

182

============================================================= ====================================================================

183

Syntax Description

184

============================================================= ====================================================================

185

**ttmp**\ <N> A single 32-bit *ttmp* register.

186

187

*N* must be a decimal integer number.

188

**ttmp[**\ <N>\ **]** A single 32-bit *ttmp* register.

189

190

*N* may be specified as an

191

:ref:`integer number<amdgpu_synid_integer_number>`

192

or an :ref:`absolute expression<amdgpu_synid_absolute_expression>`.

193

**ttmp[**\ <N>:<K>\ **]** A sequence of (\ *K-N+1*\ ) *ttmp* registers.

194

195

*N* and *K* may be specified as

196

:ref:`integer numbers<amdgpu_synid_integer_number>`

197

or :ref:`absolute expressions<amdgpu_synid_absolute_expression>`.

198

**[ttmp**\ <N>, \ **ttmp**\ <N+1>, ... **ttmp**\ <K>\ **]** A sequence of (\ *K-N+1*\ ) *ttmp* registers.

199

200

Register indices must be specified as decimal integer numbers.

201

============================================================= ====================================================================

202

203

Note. *N* and *K* must satisfy the following conditions:

204

205

* *N* must be properly aligned based on sequence size.

206

* *N* <= *K*.

207

* 0 <= *N* < *TMAX*, where *TMAX* is the number of available *ttmp* registers.

208

* 0 <= *K* < *TMAX*, where *TMAX* is the number of available *ttmp* registers.

209

* *K-N+1* must be equal to 1, 2, 4, 8 or 16.

Examples:

.. code-block:: nasm

ttmp0

ttmp[0]

ttmp[0:1]

ttmp[1:1]

ttmp[0:3]

ttmp[2*2]

ttmp[1-1:2-1]

[ttmp4]

[ttmp4,ttmp5,ttmp6,ttmp7]

224

225

Examples of *ttmp* registers with an invalid alignment:

.. code-block:: nasm

ttmp[1:2]

ttmp[2:5]

.. _amdgpu_synid_tba:

tba

---

Trap base address, 64-bits wide. Holds the pointer to the current trap handler program.

238

239

================== ======================================================================= =============

240

Syntax Description Availability

241

================== ======================================================================= =============

242

tba 64-bit *trap base address* register. GFX7, GFX8

243

[tba] 64-bit *trap base address* register (an alternative syntax). GFX7, GFX8

244

[tba_lo,tba_hi] 64-bit *trap base address* register (an alternative syntax). GFX7, GFX8

245

================== ======================================================================= =============

246

247

High and low 32 bits of *trap base address* may be accessed as separate registers:

248

249

================== ======================================================================= =============

250

Syntax Description Availability

251

================== ======================================================================= =============

252

tba_lo Low 32 bits of *trap base address* register. GFX7, GFX8

253

tba_hi High 32 bits of *trap base address* register. GFX7, GFX8

254

[tba_lo] Low 32 bits of *trap base address* register (an alternative syntax). GFX7, GFX8

255

[tba_hi] High 32 bits of *trap base address* register (an alternative syntax). GFX7, GFX8

256

================== ======================================================================= =============

257

258

Note that *tba*, *tba_lo* and *tba_hi* are not accessible as assembler registers in GFX9,

259

but *tba* is readable/writable with the help of *s_get_reg* and *s_set_reg* instructions.

260

261

.. _amdgpu_synid_tma:

tma

---

Trap memory address, 64-bits wide.

267

268

================= ======================================================================= ==================

269

Syntax Description Availability

270

================= ======================================================================= ==================

271

tma 64-bit *trap memory address* register. GFX7, GFX8

272

[tma] 64-bit *trap memory address* register (an alternative syntax). GFX7, GFX8

273

[tma_lo,tma_hi] 64-bit *trap memory address* register (an alternative syntax). GFX7, GFX8

274

================= ======================================================================= ==================

275

276

High and low 32 bits of *trap memory address* may be accessed as separate registers:

277

278

================= ======================================================================= ==================

279

Syntax Description Availability

280

================= ======================================================================= ==================

281

tma_lo Low 32 bits of *trap memory address* register. GFX7, GFX8

282

tma_hi High 32 bits of *trap memory address* register. GFX7, GFX8

283

[tma_lo] Low 32 bits of *trap memory address* register (an alternative syntax). GFX7, GFX8

284

[tma_hi] High 32 bits of *trap memory address* register (an alternative syntax). GFX7, GFX8

285

================= ======================================================================= ==================

286

287

Note that *tma*, *tma_lo* and *tma_hi* are not accessible as assembler registers in GFX9,

288

but *tma* is readable/writable with the help of *s_get_reg* and *s_set_reg* instructions.

289

290

.. _amdgpu_synid_flat_scratch:

291

292

flat_scratch

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

293

------------

294

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

295

Flat scratch address, 64-bits wide. Holds the base address of scratch memory.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

296

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

297

================================== ================================================================

298

Syntax Description

299

================================== ================================================================

300

flat_scratch 64-bit *flat scratch* address register.

301

[flat_scratch] 64-bit *flat scratch* address register (an alternative syntax).

302

[flat_scratch_lo,flat_scratch_hi] 64-bit *flat scratch* address register (an alternative syntax).

303

================================== ================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

304

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

305

High and low 32 bits of *flat scratch* address may be accessed as separate registers:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

306

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

307

========================= =========================================================================

308

Syntax Description

309

========================= =========================================================================

310

flat_scratch_lo Low 32 bits of *flat scratch* address register.

311

flat_scratch_hi High 32 bits of *flat scratch* address register.

312

[flat_scratch_lo] Low 32 bits of *flat scratch* address register (an alternative syntax).

313

[flat_scratch_hi] High 32 bits of *flat scratch* address register (an alternative syntax).

314

========================= =========================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

315

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

316

.. _amdgpu_synid_xnack:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

317

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

318

xnack

319

-----

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

320

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

321

Xnack mask, 64-bits wide. Holds a 64-bit mask of which threads

322

received an *XNACK* due to a vector memory operation.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

323

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

324

.. WARNING:: GFX7 does not support *xnack* feature. Not all GFX8 and GFX9 :ref:`processors<amdgpu-processors>` support *xnack* feature.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

325

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

326

\

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

327

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

328

============================== =====================================================

329

Syntax Description

330

============================== =====================================================

331

xnack_mask 64-bit *xnack mask* register.

332

[xnack_mask] 64-bit *xnack mask* register (an alternative syntax).

333

[xnack_mask_lo,xnack_mask_hi] 64-bit *xnack mask* register (an alternative syntax).

334

============================== =====================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

335

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

336

High and low 32 bits of *xnack mask* may be accessed as separate registers:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

337

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

338

===================== ==============================================================

339

Syntax Description

340

===================== ==============================================================

341

xnack_mask_lo Low 32 bits of *xnack mask* register.

342

xnack_mask_hi High 32 bits of *xnack mask* register.

343

[xnack_mask_lo] Low 32 bits of *xnack mask* register (an alternative syntax).

344

[xnack_mask_hi] High 32 bits of *xnack mask* register (an alternative syntax).

345

===================== ==============================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

346

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

347

.. _amdgpu_synid_vcc:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

348

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

349

vcc

350

---

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

351

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

352

Vector condition code, 64-bits wide. A bit mask with one bit per thread;

353

it holds the result of a vector compare operation.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

354

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

355

================ =========================================================================

356

Syntax Description

357

================ =========================================================================

358

vcc 64-bit *vector condition code* register.

359

[vcc] 64-bit *vector condition code* register (an alternative syntax).

360

[vcc_lo,vcc_hi] 64-bit *vector condition code* register (an alternative syntax).

361

================ =========================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

362

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

363

High and low 32 bits of *vector condition code* may be accessed as separate registers:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

364

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

365

================ =========================================================================

366

Syntax Description

367

================ =========================================================================

368

vcc_lo Low 32 bits of *vector condition code* register.

369

vcc_hi High 32 bits of *vector condition code* register.

370

[vcc_lo] Low 32 bits of *vector condition code* register (an alternative syntax).

371

[vcc_hi] High 32 bits of *vector condition code* register (an alternative syntax).

372

================ =========================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

373

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

374

.. _amdgpu_synid_m0:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

375

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

376

m0

377

--

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

378

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

379

A 32-bit memory register. It has various uses,

380

including register indexing and bounds checking.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

381

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

382

=========== ===================================================

383

Syntax Description

384

=========== ===================================================

385

m0 A 32-bit *memory* register.

386

[m0] A 32-bit *memory* register (an alternative syntax).

387

=========== ===================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

388

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

389

.. _amdgpu_synid_exec:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

390

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

391

exec

392

----

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

393

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

394

Execute mask, 64-bits wide. A bit mask with one bit per thread,

395

which is applied to vector instructions and controls which threads execute

396

and which ignore the instruction.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

397

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

398

===================== =================================================================

399

Syntax Description

400

===================== =================================================================

401

exec 64-bit *execute mask* register.

402

[exec] 64-bit *execute mask* register (an alternative syntax).

403

[exec_lo,exec_hi] 64-bit *execute mask* register (an alternative syntax).

404

===================== =================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

405

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

406

High and low 32 bits of *execute mask* may be accessed as separate registers:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

407

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

408

===================== =================================================================

409

Syntax Description

410

===================== =================================================================

411

exec_lo Low 32 bits of *execute mask* register.

412

exec_hi High 32 bits of *execute mask* register.

413

[exec_lo] Low 32 bits of *execute mask* register (an alternative syntax).

414

[exec_hi] High 32 bits of *execute mask* register (an alternative syntax).

415

===================== =================================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

416

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

417

.. _amdgpu_synid_vccz:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

418

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

419

vccz

420

----

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

421

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

422

A single bit-flag indicating that the :ref:`vcc<amdgpu_synid_vcc>` is all zeros.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

423

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

424

.. WARNING:: This operand is not currently supported by AMDGPU assembler.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

425

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

426

.. _amdgpu_synid_execz:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

427

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

428

execz

429

-----

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

430

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

431

A single bit flag indicating that the :ref:`exec<amdgpu_synid_exec>` is all zeros.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

432

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

433

.. WARNING:: This operand is not currently supported by AMDGPU assembler.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

434

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

435

.. _amdgpu_synid_scc:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

436

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

437

scc

438

---

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

439

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

440

A single bit flag indicating the result of a scalar compare operation.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

441

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

442

.. WARNING:: This operand is not currently supported by AMDGPU assembler.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

443

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

444

.. _amdgpu_synid_ldsdirect:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

445

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

446

lds_direct

447

----------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

448

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

449

A special operand which supplies a 32-bit value

450

fetched from *LDS* memory using :ref:`m0<amdgpu_synid_m0>` as an address.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

451

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

452

.. WARNING:: This operand is not currently supported by AMDGPU assembler.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

453

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

454

.. _amdgpu_synid_constant:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

455

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

456

constant

457

--------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

458

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

459

A set of integer and floating-point *inline constants*:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

460

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

461

* :ref:`iconst<amdgpu_synid_iconst>`

462

* :ref:`fconst<amdgpu_synid_fconst>`

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

463

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

464

These operands are encoded as a part of instruction.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

465

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

466

If a number may be encoded as either

467

a :ref:`literal<amdgpu_synid_literal>` or

468

an :ref:`inline constant<amdgpu_synid_constant>`,

469

assembler selects the latter encoding as more efficient.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

470

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

471

.. _amdgpu_synid_iconst:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

472

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

473

iconst

474

------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

475

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

476

An :ref:`integer number<amdgpu_synid_integer_number>`

477

encoded as an *inline constant*.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

478

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

479

Only a small fraction of integer numbers may be encoded as *inline constants*.

480

They are enumerated in the table below.

481

Other integer numbers have to be encoded as :ref:`literals<amdgpu_synid_literal>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

482

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

483

Integer *inline constants* are converted to

484

:ref:`expected operand type<amdgpu_syn_instruction_type>`

485

as described :ref:`here<amdgpu_synid_int_const_conv>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

486

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

487

================================== ====================================

488

Value Note

489

================================== ====================================

490

{0..64} Positive integer inline constants.

491

{-16..-1} Negative integer inline constants.

492

================================== ====================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

493

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

494

.. WARNING:: GFX7 does not support inline constants for *f16* operands.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

495

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

496

There are also symbolic inline constants which provide read-only access to H/W registers.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

497

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

498

.. WARNING:: These inline constants are not currently supported by AMDGPU assembler.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

499

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

500

\

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

501

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

502

======================== ================================================ =============

503

Syntax Note Availability

504

======================== ================================================ =============

505

shared_base Base address of shared memory region. GFX9

506

shared_limit Address of the end of shared memory region. GFX9

507

private_base Base address of private memory region. GFX9

508

private_limit Address of the end of private memory region. GFX9

509

pops_exiting_wave_id A dedicated counter for POPS. GFX9

510

======================== ================================================ =============

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

511

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

512

.. _amdgpu_synid_fconst:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

513

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

514

fconst

515

------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

516

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

517

A :ref:`floating-point number<amdgpu_synid_floating-point_number>`

518

encoded as an *inline constant*.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

519

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

520

Only a small fraction of floating-point numbers may be encoded as *inline constants*.

521

They are enumerated in the table below.

522

Other floating-point numbers have to be encoded as :ref:`literals<amdgpu_synid_literal>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

523

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

524

Floating-point *inline constants* are converted to

525

:ref:`expected operand type<amdgpu_syn_instruction_type>`

526

as described :ref:`here<amdgpu_synid_fp_const_conv>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

527

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

528

================================== ===================================================== ==================

529

Value Note Availability

530

================================== ===================================================== ==================

531

0.0 The same as integer constant 0. All GPUs

532

0.5 Floating-point constant 0.5 All GPUs

533

1.0 Floating-point constant 1.0 All GPUs

534

2.0 Floating-point constant 2.0 All GPUs

535

4.0 Floating-point constant 4.0 All GPUs

536

-0.5 Floating-point constant -0.5 All GPUs

537

-1.0 Floating-point constant -1.0 All GPUs

538

-2.0 Floating-point constant -2.0 All GPUs

539

-4.0 Floating-point constant -4.0 All GPUs

540

0.1592 1.0/(2.0*pi). Use only for 16-bit operands. GFX8, GFX9

541

0.15915494 1.0/(2.0*pi). Use only for 16- and 32-bit operands. GFX8, GFX9

542

0.159154943091895317852646485335 1.0/(2.0*pi). GFX8, GFX9

543

================================== ===================================================== ==================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

544

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

545

.. WARNING:: GFX7 does not support inline constants for *f16* operands.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

546

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

547

.. _amdgpu_synid_literal:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

548

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

549

literal

550

-------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

551

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

552

A literal is a 64-bit value which is encoded as a separate 32-bit dword in the instruction stream.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

553

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

554

If a number may be encoded as either

555

a :ref:`literal<amdgpu_synid_literal>` or

556

an :ref:`inline constant<amdgpu_synid_constant>`,

557

assembler selects the latter encoding as more efficient.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

558

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

559

Literals may be specified as :ref:`integer numbers<amdgpu_synid_integer_number>`,

560

:ref:`floating-point numbers<amdgpu_synid_floating-point_number>` or

561

:ref:`expressions<amdgpu_synid_expression>`

562

(expressions are currently supported for 32-bit operands only).

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

563

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

564

A 64-bit literal value is converted by assembler

565

to an :ref:`expected operand type<amdgpu_syn_instruction_type>`

566

as described :ref:`here<amdgpu_synid_lit_conv>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

567

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

568

An instruction may use only one literal but several operands may refer the same literal.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

569

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

570

.. _amdgpu_synid_uimm8:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

571

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

572

uimm8

573

-----

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

574

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

575

A 8-bit positive :ref:`integer number<amdgpu_synid_integer_number>`.

576

The value is encoded as part of the opcode so it is free to use.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

577

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

578

.. _amdgpu_synid_uimm32:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

579

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

580

uimm32

581

------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

582

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

583

A 32-bit positive :ref:`integer number<amdgpu_synid_integer_number>`.

584

The value is stored as a separate 32-bit dword in the instruction stream.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

585

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

586

.. _amdgpu_synid_uimm20:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

587

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

588

uimm20

589

------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

590

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

591

A 20-bit positive :ref:`integer number<amdgpu_synid_integer_number>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

592

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

593

.. _amdgpu_synid_uimm21:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

594

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

595

uimm21

596

------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

597

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

598

A 21-bit positive :ref:`integer number<amdgpu_synid_integer_number>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

599

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

600

.. WARNING:: Assembler currently supports 20-bit offsets only. Use :ref:`uimm20<amdgpu_synid_uimm20>` as a replacement.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

601

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

602

.. _amdgpu_synid_simm21:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

603

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

604

simm21

605

------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

606

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

607

A 21-bit :ref:`integer number<amdgpu_synid_integer_number>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

608

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

609

.. WARNING:: Assembler currently supports 20-bit unsigned offsets only .Use :ref:`uimm20<amdgpu_synid_uimm20>` as a replacement.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

610

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

611

.. _amdgpu_synid_off:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

612

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

613

off

614

---

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

615

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

616

A special entity which indicates that the value of this operand is not used.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

617

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

618

================================== ===================================================

619

Syntax Description

620

================================== ===================================================

621

off Indicates an unused operand.

622

================================== ===================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

623

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

624

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

625

.. _amdgpu_synid_number:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

626

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

627

Numbers

628

=======

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

629

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

630

.. _amdgpu_synid_integer_number:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

631

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

632

Integer Numbers

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

633

---------------

634

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

635

Integer numbers are 64 bits wide.

636

They may be specified in binary, octal, hexadecimal and decimal formats:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

637

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

638

============== ====================================

639

Format Syntax

640

============== ====================================

641

Decimal [-]?[1-9][0-9]*

642

Binary [-]?0b[01]+

643

Octal [-]?0[0-7]+

644

Hexadecimal [-]?0x[0-9a-fA-F]+

645

\ [-]?[0x]?[0-9][0-9a-fA-F]*[hH]

646

============== ====================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

647

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

648

Examples:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

649

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

650

.. code-block:: nasm

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

651

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

-1234

0b1010

010

0xff

0ffh

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

657

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

658

.. _amdgpu_synid_floating-point_number:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

659

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

660

Floating-Point Numbers

661

----------------------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

662

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

663

All floating-point numbers are handled as double (64 bits wide).

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

664

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

665

Floating-point numbers may be specified in hexadecimal and decimal formats:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

666

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

667

============== ======================================================== ========================================================

668

Format Syntax Note

669

============== ======================================================== ========================================================

670

Decimal [-]?[0-9]*[.][0-9]*([eE][+-]?[0-9]*)? Must include either a decimal separator or an exponent.

671

Hexadecimal [-]0x[0-9a-fA-F]*(.[0-9a-fA-F]*)?[pP][+-]?[0-9a-fA-F]+

672

============== ======================================================== ========================================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

673

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

674

Examples:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

675

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

676

.. code-block:: nasm

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

677

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

-1.234

234e2

-0x1afp-10

0x.1afp10

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

682

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

683

.. _amdgpu_synid_expression:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

684

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

685

Expressions

686

===========

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

687

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

688

An expression specifies an address or a numeric value.

689

There are two kinds of expressions:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

690

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

691

* :ref:`Absolute<amdgpu_synid_absolute_expression>`.

692

* :ref:`Relocatable<amdgpu_synid_relocatable_expression>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

693

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

694

.. _amdgpu_synid_absolute_expression:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

695

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

696

Absolute Expressions

697

--------------------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

698

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

699

The value of an absolute expression remains the same after program relocation.

700

Absolute expressions must not include unassigned and relocatable values

701

such as labels.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

702

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

703

Examples:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

704

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

705

.. code-block:: nasm

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

706

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

707

x = -1

708

y = x + 10

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

709

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

710

.. _amdgpu_synid_relocatable_expression:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

711

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

712

Relocatable Expressions

713

-----------------------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

714

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

715

The value of a relocatable expression depends on program relocation.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

716

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

717

Note that use of relocatable expressions is limited with branch targets

718

and 32-bit :ref:`literals<amdgpu_synid_literal>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

719

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

720

Addition information about relocation may be found :ref:`here<amdgpu-relocation-records>`.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

721

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

722

Examples:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

723

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

724

.. code-block:: nasm

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

725

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

726

y = x + 10 // x is not yet defined. Undefined symbols are assumed to be PC-relative.

727

z = .

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

728

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

729

Expression Data Type

730

--------------------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

731

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

732

Expressions and operands of expressions are interpreted as 64-bit integers.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

733

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

734

Expressions may include 64-bit :ref:`floating-point numbers<amdgpu_synid_floating-point_number>` (double).

735

However these operands are also handled as 64-bit integers

736

using binary representation of specified floating-point numbers.

737

No conversion from floating-point to integer is performed.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

738

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

739

Examples:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

740

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

741

.. code-block:: nasm

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

742

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

743

x = 0.1 // x is assigned an integer 4591870180066957722 which is a binary representation of 0.1.

744

y = x + x // y is a sum of two integer values; it is not equal to 0.2!

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

745

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

746

Syntax

747

------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

748

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

749

Expressions are composed of

750

:ref:`symbols<amdgpu_synid_symbol>`,

751

:ref:`integer numbers<amdgpu_synid_integer_number>`,

752

:ref:`floating-point numbers<amdgpu_synid_floating-point_number>`,

753

:ref:`binary operators<amdgpu_synid_expression_bin_op>`,

754

:ref:`unary operators<amdgpu_synid_expression_un_op>` and subexpressions.

Dmitry Preobrazhensky

2018-07-27 14:17:15 +0000

[diff] [blame]

755

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

756

Expressions may also use "." which is a reference to the current PC (program counter).

Dmitry Preobrazhensky

2018-07-27 14:17:15 +0000

[diff] [blame]

757

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

758

The syntax of expressions is shown below::

Dmitry Preobrazhensky

2018-07-27 14:17:15 +0000

[diff] [blame]

759

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

760

expr ::= expr binop expr | primaryexpr ;

Dmitry Preobrazhensky

2018-07-27 14:17:15 +0000

[diff] [blame]

761

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

762

primaryexpr ::= '(' expr ')' | symbol | number | '.' | unop primaryexpr ;

Dmitry Preobrazhensky

2018-07-27 14:17:15 +0000

[diff] [blame]

763

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

binop ::= '&&'

| '||'

| '|'

| '^'

| '&'

| '!'

| '=='

| '!='

| '<>'

| '<'

| '<='

| '>'

| '>='

| '<<'

| '>>'

| '+'

| '-'

| '*'

| '/'

| '%' ;

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

784

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

unop ::= '~'

| '+'

| '-'

| '!' ;

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

789

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

790

.. _amdgpu_synid_expression_bin_op:

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

791

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

792

Binary Operators

793

----------------

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

794

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

795

Binary operators are described in the following table.

796

They operate on and produce 64-bit integers.

797

Operators with higher priority are performed first.

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

798

Dmitry Preobrazhensky

2018-12-17 17:38:11 +0000

[diff] [blame^]

799

========== ========= ===============================================

800

Operator Priority Meaning

801

========== ========= ===============================================

802

\* 5 Integer multiplication.

803

/ 5 Integer division.

804

% 5 Integer signed remainder.

805

\+ 4 Integer addition.

806

\- 4 Integer subtraction.

807

<< 3 Integer shift left.

808

>> 3 Logical shift right.

809

== 2 Equality comparison.

810

!= 2 Inequality comparison.

811

<> 2 Inequality comparison.

812

< 2 Signed less than comparison.

813

<= 2 Signed less than or equal comparison.

814

> 2 Signed greater than comparison.

815

>= 2 Signed greater than or equal comparison.

\| 1 Bitwise or.

^ 1 Bitwise xor.

& 1 Bitwise and.

&& 0 Logical and.

|| 0 Logical or.

========== ========= ===============================================

Dmitry Preobrazhensky

2018-03-12 15:55:08 +0000

[diff] [blame]

822

Dmitry Preobrazhensky