Blame - llvm/test/CodeGen/AMDGPU/fneg-fabs.f64.ll - toolchain/llvm-project

blob: 45fd0f7461475851fc62ad924004849a8249e2a1 [file] [log] [blame]

Matt Arsenault	bbb47da	2016-09-08 17:19:29 +0000	[diff] [blame]	1	; RUN: llc -march=amdgcn -verify-machineinstrs < %s \| FileCheck -check-prefix=SI -check-prefix=GCN %s
Matt Arsenault	7aad8fd	2017-01-24 22:02:15 +0000	[diff] [blame]	2	; RUN: llc -march=amdgcn -mcpu=tonga -mattr=-flat-for-global -verify-machineinstrs < %s \| FileCheck -check-prefix=VI -check-prefix=GCN %s
Matt Arsenault	13623d0	2014-08-15 18:42:18 +0000	[diff] [blame]	3
				4	; FIXME: Check something here. Currently it seems fabs + fneg aren't
				5	; into 2 modifiers, although theoretically that should work.
				6
Tom Stellard	1f520e5	2016-05-02 17:39:06 +0000	[diff] [blame]	7	; GCN-LABEL: {{^}}fneg_fabs_fadd_f64:
Stanislav Mekhanoshin	56ea488	2017-05-30 16:49:24 +0000	[diff] [blame]	8	; GCN: v_add_f64 {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, -\|v{{\[[0-9]+:[0-9]+\]}}\|
Matt Arsenault	3dbeefa	2017-03-21 21:39:51 +0000	[diff] [blame]	9	define amdgpu_kernel void @fneg_fabs_fadd_f64(double addrspace(1)* %out, double %x, double %y) {
Matt Arsenault	13623d0	2014-08-15 18:42:18 +0000	[diff] [blame]	10	%fabs = call double @llvm.fabs.f64(double %x)
				11	%fsub = fsub double -0.000000e+00, %fabs
				12	%fadd = fadd double %y, %fsub
				13	store double %fadd, double addrspace(1)* %out, align 8
				14	ret void
				15	}
				16
Matt Arsenault	3dbeefa	2017-03-21 21:39:51 +0000	[diff] [blame]	17	define amdgpu_kernel void @v_fneg_fabs_fadd_f64(double addrspace(1)* %out, double addrspace(1)* %xptr, double addrspace(1)* %yptr) {
David Blaikie	a79ac14	2015-02-27 21:17:42 +0000	[diff] [blame]	18	%x = load double, double addrspace(1)* %xptr, align 8
				19	%y = load double, double addrspace(1)* %xptr, align 8
Matt Arsenault	13623d0	2014-08-15 18:42:18 +0000	[diff] [blame]	20	%fabs = call double @llvm.fabs.f64(double %x)
				21	%fsub = fsub double -0.000000e+00, %fabs
				22	%fadd = fadd double %y, %fsub
				23	store double %fadd, double addrspace(1)* %out, align 8
				24	ret void
				25	}
				26
Tom Stellard	1f520e5	2016-05-02 17:39:06 +0000	[diff] [blame]	27	; GCN-LABEL: {{^}}fneg_fabs_fmul_f64:
Stanislav Mekhanoshin	56ea488	2017-05-30 16:49:24 +0000	[diff] [blame]	28	; GCN: v_mul_f64 {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, -\|v{{\[[0-9]+:[0-9]+\]}}\|
Matt Arsenault	3dbeefa	2017-03-21 21:39:51 +0000	[diff] [blame]	29	define amdgpu_kernel void @fneg_fabs_fmul_f64(double addrspace(1)* %out, double %x, double %y) {
Matt Arsenault	13623d0	2014-08-15 18:42:18 +0000	[diff] [blame]	30	%fabs = call double @llvm.fabs.f64(double %x)
				31	%fsub = fsub double -0.000000e+00, %fabs
				32	%fmul = fmul double %y, %fsub
				33	store double %fmul, double addrspace(1)* %out, align 8
				34	ret void
				35	}
				36
Tom Stellard	1f520e5	2016-05-02 17:39:06 +0000	[diff] [blame]	37	; GCN-LABEL: {{^}}fneg_fabs_free_f64:
Matt Arsenault	3dbeefa	2017-03-21 21:39:51 +0000	[diff] [blame]	38	define amdgpu_kernel void @fneg_fabs_free_f64(double addrspace(1)* %out, i64 %in) {
Matt Arsenault	13623d0	2014-08-15 18:42:18 +0000	[diff] [blame]	39	%bc = bitcast i64 %in to double
				40	%fabs = call double @llvm.fabs.f64(double %bc)
				41	%fsub = fsub double -0.000000e+00, %fabs
				42	store double %fsub, double addrspace(1)* %out
				43	ret void
				44	}
				45
Tom Stellard	1f520e5	2016-05-02 17:39:06 +0000	[diff] [blame]	46	; GCN-LABEL: {{^}}fneg_fabs_fn_free_f64:
				47	; GCN: v_bfrev_b32_e32 [[IMMREG:v[0-9]+]], 1{{$}}
				48	; GCN: v_or_b32_e32 v{{[0-9]+}}, s{{[0-9]+}}, [[IMMREG]]
Matt Arsenault	3dbeefa	2017-03-21 21:39:51 +0000	[diff] [blame]	49	define amdgpu_kernel void @fneg_fabs_fn_free_f64(double addrspace(1)* %out, i64 %in) {
Matt Arsenault	13623d0	2014-08-15 18:42:18 +0000	[diff] [blame]	50	%bc = bitcast i64 %in to double
				51	%fabs = call double @fabs(double %bc)
				52	%fsub = fsub double -0.000000e+00, %fabs
				53	store double %fsub, double addrspace(1)* %out
				54	ret void
				55	}
				56
Tom Stellard	1f520e5	2016-05-02 17:39:06 +0000	[diff] [blame]	57	; GCN-LABEL: {{^}}fneg_fabs_f64:
Tom Stellard	1f520e5	2016-05-02 17:39:06 +0000	[diff] [blame]	58	; GCN-DAG: v_bfrev_b32_e32 [[IMMREG:v[0-9]+]], 1{{$}}
Matt Arsenault	8c4a352	2018-06-26 19:10:00 +0000	[diff] [blame]	59	; SI-DAG: s_load_dwordx2 s{{\[}}[[LO_X:[0-9]+]]:[[HI_X:[0-9]+]]{{\]}}, s[{{[0-9]+:[0-9]+}}], 0x13
				60	; VI-DAG: s_load_dwordx2 s{{\[}}[[LO_X:[0-9]+]]:[[HI_X:[0-9]+]]{{\]}}, s[{{[0-9]+:[0-9]+}}], 0x4c
Tom Stellard	1f520e5	2016-05-02 17:39:06 +0000	[diff] [blame]	61	; GCN-DAG: v_or_b32_e32 v[[HI_V:[0-9]+]], s[[HI_X]], [[IMMREG]]
				62	; GCN-DAG: v_mov_b32_e32 v[[LO_V:[0-9]+]], s[[LO_X]]
				63	; GCN: buffer_store_dwordx2 v{{\[}}[[LO_V]]:[[HI_V]]{{\]}}
Matt Arsenault	8c4a352	2018-06-26 19:10:00 +0000	[diff] [blame]	64	define amdgpu_kernel void @fneg_fabs_f64(double addrspace(1)* %out, [8 x i32], double %in) {
Matt Arsenault	13623d0	2014-08-15 18:42:18 +0000	[diff] [blame]	65	%fabs = call double @llvm.fabs.f64(double %in)
				66	%fsub = fsub double -0.000000e+00, %fabs
				67	store double %fsub, double addrspace(1)* %out, align 8
				68	ret void
				69	}
				70
Tom Stellard	1f520e5	2016-05-02 17:39:06 +0000	[diff] [blame]	71	; GCN-LABEL: {{^}}fneg_fabs_v2f64:
				72	; GCN: v_bfrev_b32_e32 [[IMMREG:v[0-9]+]], 1{{$}}
				73	; GCN-NOT: 0x80000000
				74	; GCN: v_or_b32_e32 v{{[0-9]+}}, s{{[0-9]+}}, [[IMMREG]]
				75	; GCN: v_or_b32_e32 v{{[0-9]+}}, s{{[0-9]+}}, [[IMMREG]]
Matt Arsenault	3dbeefa	2017-03-21 21:39:51 +0000	[diff] [blame]	76	define amdgpu_kernel void @fneg_fabs_v2f64(<2 x double> addrspace(1)* %out, <2 x double> %in) {
Matt Arsenault	13623d0	2014-08-15 18:42:18 +0000	[diff] [blame]	77	%fabs = call <2 x double> @llvm.fabs.v2f64(<2 x double> %in)
				78	%fsub = fsub <2 x double> <double -0.000000e+00, double -0.000000e+00>, %fabs
				79	store <2 x double> %fsub, <2 x double> addrspace(1)* %out
				80	ret void
				81	}
				82
Tom Stellard	1f520e5	2016-05-02 17:39:06 +0000	[diff] [blame]	83	; GCN-LABEL: {{^}}fneg_fabs_v4f64:
				84	; GCN: v_bfrev_b32_e32 [[IMMREG:v[0-9]+]], 1{{$}}
				85	; GCN-NOT: 0x80000000
				86	; GCN: v_or_b32_e32 v{{[0-9]+}}, s{{[0-9]+}}, [[IMMREG]]
				87	; GCN: v_or_b32_e32 v{{[0-9]+}}, s{{[0-9]+}}, [[IMMREG]]
				88	; GCN: v_or_b32_e32 v{{[0-9]+}}, s{{[0-9]+}}, [[IMMREG]]
				89	; GCN: v_or_b32_e32 v{{[0-9]+}}, s{{[0-9]+}}, [[IMMREG]]
Matt Arsenault	3dbeefa	2017-03-21 21:39:51 +0000	[diff] [blame]	90	define amdgpu_kernel void @fneg_fabs_v4f64(<4 x double> addrspace(1)* %out, <4 x double> %in) {
Matt Arsenault	13623d0	2014-08-15 18:42:18 +0000	[diff] [blame]	91	%fabs = call <4 x double> @llvm.fabs.v4f64(<4 x double> %in)
				92	%fsub = fsub <4 x double> <double -0.000000e+00, double -0.000000e+00, double -0.000000e+00, double -0.000000e+00>, %fabs
				93	store <4 x double> %fsub, <4 x double> addrspace(1)* %out
				94	ret void
				95	}
				96
				97	declare double @fabs(double) readnone
				98	declare double @llvm.fabs.f64(double) readnone
				99	declare <2 x double> @llvm.fabs.v2f64(<2 x double>) readnone
				100	declare <4 x double> @llvm.fabs.v4f64(<4 x double>) readnone