Blame - llvm/test/CodeGen/AMDGPU/llvm.sin.f16.ll - toolchain/llvm-project

blob: eb1f32c981f88eae786d7a5c203e382812310f4c [file] [log] [blame]

Konstantin Zhuravlyov	f86e4b7	2016-11-13 07:01:11 +0000	[diff] [blame]	1	; RUN: llc -march=amdgcn -verify-machineinstrs < %s \| FileCheck -check-prefix=GCN -check-prefix=SI %s
Matt Arsenault	7aad8fd	2017-01-24 22:02:15 +0000	[diff] [blame]	2	; RUN: llc -march=amdgcn -mcpu=fiji -mattr=-flat-for-global -verify-machineinstrs < %s \| FileCheck -check-prefix=GCN -check-prefix=VI %s
Konstantin Zhuravlyov	f86e4b7	2016-11-13 07:01:11 +0000	[diff] [blame]	3
				4	declare half @llvm.sin.f16(half %a)
				5	declare <2 x half> @llvm.sin.v2f16(<2 x half> %a)
				6
				7	; GCN-LABEL: {{^}}sin_f16
				8	; GCN: buffer_load_ushort v[[A_F16:[0-9]+]]
				9	; GCN: v_cvt_f32_f16_e32 v[[A_F32:[0-9]+]], v[[A_F16]]
Matt Arsenault	972034b	2016-11-15 00:04:33 +0000	[diff] [blame]	10	; GCN: v_mul_f32_e32 v[[M_F32:[0-9]+]], {{0.15915494\|0x3e22f983}}, v[[A_F32]]
Konstantin Zhuravlyov	f86e4b7	2016-11-13 07:01:11 +0000	[diff] [blame]	11	; GCN: v_fract_f32_e32 v[[F_F32:[0-9]+]], v[[M_F32]]
				12	; GCN: v_sin_f32_e32 v[[R_F32:[0-9]+]], v[[F_F32]]
				13	; GCN: v_cvt_f16_f32_e32 v[[R_F16:[0-9]+]], v[[R_F32]]
				14	; GCN: buffer_store_short v[[R_F16]]
				15	; GCN: s_endpgm
Matt Arsenault	3dbeefa	2017-03-21 21:39:51 +0000	[diff] [blame]	16	define amdgpu_kernel void @sin_f16(
Konstantin Zhuravlyov	f86e4b7	2016-11-13 07:01:11 +0000	[diff] [blame]	17	half addrspace(1)* %r,
				18	half addrspace(1)* %a) {
				19	entry:
				20	%a.val = load half, half addrspace(1)* %a
				21	%r.val = call half @llvm.sin.f16(half %a.val)
				22	store half %r.val, half addrspace(1)* %r
				23	ret void
				24	}
				25
				26	; GCN-LABEL: {{^}}sin_v2f16
				27	; GCN: buffer_load_dword v[[A_V2_F16:[0-9]+]]
				28	; SI: v_mov_b32_e32 v[[HALF_PIE:[0-9]+]], 0x3e22f983{{$}}
Sam Kolton	34e2978	2017-04-05 12:00:45 +0000	[diff] [blame^]	29	; SI: v_lshrrev_b32_e32 v[[A_F16_1:[0-9]+]], 16, v[[A_V2_F16]]
Matt Arsenault	86e02ce	2017-03-15 19:04:26 +0000	[diff] [blame]	30	; SI-DAG: v_cvt_f32_f16_e32 v[[A_F32_1:[0-9]+]], v[[A_F16_1]]
				31	; SI-DAG: v_cvt_f32_f16_e32 v[[A_F32_0:[0-9]+]], v[[A_V2_F16]]
Sam Kolton	34e2978	2017-04-05 12:00:45 +0000	[diff] [blame^]	32	; SI-DAG: v_mul_f32_e32 v[[M_F32_0:[0-9]+]], v[[HALF_PIE]], v[[A_F32_0]]
				33	; SI-DAG: v_fract_f32_e32 v[[F_F32_0:[0-9]+]], v[[M_F32_0]]
				34	; SI-DAG: v_mul_f32_e32 v[[M_F32_1:[0-9]+]], v[[HALF_PIE]], v[[A_F32_1]]
				35	; SI-DAG: v_fract_f32_e32 v[[F_F32_1:[0-9]+]], v[[M_F32_1]]
Matt Arsenault	86e02ce	2017-03-15 19:04:26 +0000	[diff] [blame]	36
Matt Arsenault	8edfaee	2017-03-31 19:53:03 +0000	[diff] [blame]	37	; VI-DAG: v_cvt_f32_f16_e32 v[[A_F32_0:[0-9]+]], v[[A_V2_F16]]
Sam Kolton	34e2978	2017-04-05 12:00:45 +0000	[diff] [blame^]	38	; VI-DAG: v_cvt_f32_f16_sdwa v[[A_F32_1:[0-9]+]], v[[A_V2_F16]] dst_sel:DWORD dst_unused:UNUSED_PAD src0_sel:WORD_1
				39	; VI-DAG: v_mul_f32_e32 v[[M_F32_0:[0-9]+]], 0.15915494, v[[A_F32_0]]
				40	; VI-DAG: v_mul_f32_e32 v[[M_F32_1:[0-9]+]], 0.15915494, v[[A_F32_1]]
				41	; VI-DAG: v_fract_f32_e32 v[[F_F32_0:[0-9]+]], v[[M_F32_0]]
				42	; VI-DAG: v_fract_f32_e32 v[[F_F32_1:[0-9]+]], v[[M_F32_1]]
Matt Arsenault	86e02ce	2017-03-15 19:04:26 +0000	[diff] [blame]	43
				44	; GCN-DAG: v_sin_f32_e32 v[[R_F32_0:[0-9]+]], v[[F_F32_0]]
				45	; GCN-DAG: v_sin_f32_e32 v[[R_F32_1:[0-9]+]], v[[F_F32_1]]
				46	; GCN-DAG: v_cvt_f16_f32_e32 v[[R_F16_0:[0-9]+]], v[[R_F32_0]]
Sam Kolton	34e2978	2017-04-05 12:00:45 +0000	[diff] [blame^]	47
				48	; SI-DAG: v_cvt_f16_f32_e32 v[[R_F16_1:[0-9]+]], v[[R_F32_1]]
				49	; SI: v_lshlrev_b32_e32 v[[R_F16_HI:[0-9]+]], 16, v[[R_F16_1]]
				50	; SI: v_or_b32_e32 v[[R_V2_F16:[0-9]+]], v[[R_F16_HI]], v[[R_F16_0]]
				51
				52	; VI-DAG: v_cvt_f16_f32_sdwa v[[R_F16_1:[0-9]+]], v[[R_F32_1]] dst_sel:WORD_1 dst_unused:UNUSED_PAD src0_sel:DWORD
				53	; VI: v_or_b32_e32 v[[R_V2_F16:[0-9]+]], v[[R_F16_1]], v[[R_F16_0]]
				54
Konstantin Zhuravlyov	f86e4b7	2016-11-13 07:01:11 +0000	[diff] [blame]	55	; GCN: buffer_store_dword v[[R_V2_F16]]
				56	; GCN: s_endpgm
Matt Arsenault	3dbeefa	2017-03-21 21:39:51 +0000	[diff] [blame]	57	define amdgpu_kernel void @sin_v2f16(
Konstantin Zhuravlyov	f86e4b7	2016-11-13 07:01:11 +0000	[diff] [blame]	58	<2 x half> addrspace(1)* %r,
				59	<2 x half> addrspace(1)* %a) {
				60	entry:
				61	%a.val = load <2 x half>, <2 x half> addrspace(1)* %a
				62	%r.val = call <2 x half> @llvm.sin.v2f16(<2 x half> %a.val)
				63	store <2 x half> %r.val, <2 x half> addrspace(1)* %r
				64	ret void
				65	}