Blame - clang/test/CodeGenCUDA/cuda-builtin-vars.cu - toolchain/llvm-project

blob: 834e16d04d67edc9ac682ace75eee1f7b7aa3b2c [file] [log] [blame]

Artem Belevich	4e192df	2015-04-21 22:14:13 +0000	[diff] [blame]	1	// RUN: %clang_cc1 "-triple" "nvptx-nvidia-cuda" -emit-llvm -fcuda-is-device -o - %s \| FileCheck %s
				2
				3	#include "cuda_builtin_vars.h"
				4
				5	// CHECK: define void @_Z6kernelPi(i32* %out)
				6	__attribute__((global))
				7	void kernel(int *out) {
				8	int i = 0;
				9	out[i++] = threadIdx.x; // CHECK: call i32 @llvm.ptx.read.tid.x()
				10	out[i++] = threadIdx.y; // CHECK: call i32 @llvm.ptx.read.tid.y()
				11	out[i++] = threadIdx.z; // CHECK: call i32 @llvm.ptx.read.tid.z()
				12
				13	out[i++] = blockIdx.x; // CHECK: call i32 @llvm.ptx.read.ctaid.x()
				14	out[i++] = blockIdx.y; // CHECK: call i32 @llvm.ptx.read.ctaid.y()
				15	out[i++] = blockIdx.z; // CHECK: call i32 @llvm.ptx.read.ctaid.z()
				16
				17	out[i++] = blockDim.x; // CHECK: call i32 @llvm.ptx.read.ntid.x()
				18	out[i++] = blockDim.y; // CHECK: call i32 @llvm.ptx.read.ntid.y()
				19	out[i++] = blockDim.z; // CHECK: call i32 @llvm.ptx.read.ntid.z()
				20
				21	out[i++] = gridDim.x; // CHECK: call i32 @llvm.ptx.read.nctaid.x()
				22	out[i++] = gridDim.y; // CHECK: call i32 @llvm.ptx.read.nctaid.y()
				23	out[i++] = gridDim.z; // CHECK: call i32 @llvm.ptx.read.nctaid.z()
				24
				25	out[i++] = warpSize; // CHECK: store i32 32,
				26
				27	// CHECK: ret void
				28	}