Blame - llvm/test/CodeGen/AMDGPU/fneg-fabs.ll - toolchain/llvm-project

blob: 0ff5d9652c1047bada4f4b480d4884e52732e92c [file] [log] [blame]

Graham Sellers	b297379	2018-12-07 15:33:21 +0000	[diff] [blame]	1	; RUN: llc -amdgpu-scalarize-global-loads=false -march=amdgcn -verify-machineinstrs < %s \| FileCheck -check-prefix=GCN -check-prefix=SI -check-prefix=FUNC %s
				2	; RUN: llc -amdgpu-scalarize-global-loads=false -march=amdgcn -mcpu=tonga -verify-machineinstrs < %s \| FileCheck -check-prefix=GCN -check-prefix=VI -check-prefix=FUNC %s
Alexander Timofeev	982aee6	2017-07-04 17:32:00 +0000	[diff] [blame]	3	; RUN: llc -amdgpu-scalarize-global-loads=false -march=r600 -mcpu=redwood < %s \| FileCheck -check-prefix=R600 -check-prefix=FUNC %s
Matt Arsenault	4de3244	2014-08-02 02:26:51 +0000	[diff] [blame]	4
Tom Stellard	79243d9	2014-10-01 17:15:17 +0000	[diff] [blame]	5	; FUNC-LABEL: {{^}}fneg_fabs_fadd_f32:
Tom Stellard	326d6ec	2014-11-05 14:50:53 +0000	[diff] [blame]	6	; SI-NOT: and
Matt Arsenault	8c4a352	2018-06-26 19:10:00 +0000	[diff] [blame]	7	; SI: v_sub_f32_e64 {{v[0-9]+}}, {{v[0-9]+}}, \|{{s[0-9]+}}\|
Matt Arsenault	3dbeefa	2017-03-21 21:39:51 +0000	[diff] [blame]	8	define amdgpu_kernel void @fneg_fabs_fadd_f32(float addrspace(1)* %out, float %x, float %y) {
Matt Arsenault	fabf545	2014-08-15 18:42:22 +0000	[diff] [blame]	9	%fabs = call float @llvm.fabs.f32(float %x)
				10	%fsub = fsub float -0.000000e+00, %fabs
				11	%fadd = fadd float %y, %fsub
				12	store float %fadd, float addrspace(1)* %out, align 4
				13	ret void
				14	}
				15
Tom Stellard	79243d9	2014-10-01 17:15:17 +0000	[diff] [blame]	16	; FUNC-LABEL: {{^}}fneg_fabs_fmul_f32:
Tom Stellard	326d6ec	2014-11-05 14:50:53 +0000	[diff] [blame]	17	; SI-NOT: and
Matt Arsenault	8c4a352	2018-06-26 19:10:00 +0000	[diff] [blame]	18	; SI: v_mul_f32_e64 {{v[0-9]+}}, {{v[0-9]+}}, -\|{{s[0-9]+}}\|
Tom Stellard	326d6ec	2014-11-05 14:50:53 +0000	[diff] [blame]	19	; SI-NOT: and
Matt Arsenault	3dbeefa	2017-03-21 21:39:51 +0000	[diff] [blame]	20	define amdgpu_kernel void @fneg_fabs_fmul_f32(float addrspace(1)* %out, float %x, float %y) {
Matt Arsenault	fabf545	2014-08-15 18:42:22 +0000	[diff] [blame]	21	%fabs = call float @llvm.fabs.f32(float %x)
				22	%fsub = fsub float -0.000000e+00, %fabs
				23	%fmul = fmul float %y, %fsub
				24	store float %fmul, float addrspace(1)* %out, align 4
				25	ret void
				26	}
Michel Danzer	624b02a	2014-02-04 07:12:38 +0000	[diff] [blame]	27
				28	; DAGCombiner will transform:
				29	; (fabs (f32 bitcast (i32 a))) => (f32 bitcast (and (i32 a), 0x7FFFFFFF))
				30	; unless isFabsFree returns true
				31
Tom Stellard	79243d9	2014-10-01 17:15:17 +0000	[diff] [blame]	32	; FUNC-LABEL: {{^}}fneg_fabs_free_f32:
Matt Arsenault	4de3244	2014-08-02 02:26:51 +0000	[diff] [blame]	33	; R600-NOT: AND
				34	; R600: \|PV.{{[XYZW]}}\|
				35	; R600: -PV
Michel Danzer	624b02a	2014-02-04 07:12:38 +0000	[diff] [blame]	36
Marek Olsak	74d084f	2015-10-29 15:29:05 +0000	[diff] [blame]	37	; SI: s_or_b32 s{{[0-9]+}}, s{{[0-9]+}}, 0x80000000
Graham Sellers	b297379	2018-12-07 15:33:21 +0000	[diff] [blame]	38	; VI: s_bitset1_b32 s{{[0-9]+}}, 31
Matt Arsenault	3dbeefa	2017-03-21 21:39:51 +0000	[diff] [blame]	39	define amdgpu_kernel void @fneg_fabs_free_f32(float addrspace(1)* %out, i32 %in) {
Matt Arsenault	4de3244	2014-08-02 02:26:51 +0000	[diff] [blame]	40	%bc = bitcast i32 %in to float
				41	%fabs = call float @llvm.fabs.f32(float %bc)
				42	%fsub = fsub float -0.000000e+00, %fabs
				43	store float %fsub, float addrspace(1)* %out
Michel Danzer	624b02a	2014-02-04 07:12:38 +0000	[diff] [blame]	44	ret void
				45	}
				46
Tom Stellard	79243d9	2014-10-01 17:15:17 +0000	[diff] [blame]	47	; FUNC-LABEL: {{^}}fneg_fabs_fn_free_f32:
Matt Arsenault	4de3244	2014-08-02 02:26:51 +0000	[diff] [blame]	48	; R600-NOT: AND
				49	; R600: \|PV.{{[XYZW]}}\|
				50	; R600: -PV
				51
Marek Olsak	74d084f	2015-10-29 15:29:05 +0000	[diff] [blame]	52	; SI: s_or_b32 s{{[0-9]+}}, s{{[0-9]+}}, 0x80000000
Matt Arsenault	3dbeefa	2017-03-21 21:39:51 +0000	[diff] [blame]	53	define amdgpu_kernel void @fneg_fabs_fn_free_f32(float addrspace(1)* %out, i32 %in) {
Matt Arsenault	4de3244	2014-08-02 02:26:51 +0000	[diff] [blame]	54	%bc = bitcast i32 %in to float
				55	%fabs = call float @fabs(float %bc)
				56	%fsub = fsub float -0.000000e+00, %fabs
				57	store float %fsub, float addrspace(1)* %out
Michel Danzer	624b02a	2014-02-04 07:12:38 +0000	[diff] [blame]	58	ret void
				59	}
				60
Tom Stellard	79243d9	2014-10-01 17:15:17 +0000	[diff] [blame]	61	; FUNC-LABEL: {{^}}fneg_fabs_f32:
Marek Olsak	74d084f	2015-10-29 15:29:05 +0000	[diff] [blame]	62	; SI: s_or_b32 s{{[0-9]+}}, s{{[0-9]+}}, 0x80000000
Matt Arsenault	3dbeefa	2017-03-21 21:39:51 +0000	[diff] [blame]	63	define amdgpu_kernel void @fneg_fabs_f32(float addrspace(1)* %out, float %in) {
Matt Arsenault	fabf545	2014-08-15 18:42:22 +0000	[diff] [blame]	64	%fabs = call float @llvm.fabs.f32(float %in)
				65	%fsub = fsub float -0.000000e+00, %fabs
				66	store float %fsub, float addrspace(1)* %out, align 4
				67	ret void
				68	}
				69
Tom Stellard	79243d9	2014-10-01 17:15:17 +0000	[diff] [blame]	70	; FUNC-LABEL: {{^}}v_fneg_fabs_f32:
Tom Stellard	326d6ec	2014-11-05 14:50:53 +0000	[diff] [blame]	71	; SI: v_or_b32_e32 v{{[0-9]+}}, 0x80000000, v{{[0-9]+}}
Matt Arsenault	3dbeefa	2017-03-21 21:39:51 +0000	[diff] [blame]	72	define amdgpu_kernel void @v_fneg_fabs_f32(float addrspace(1)* %out, float addrspace(1)* %in) {
David Blaikie	a79ac14	2015-02-27 21:17:42 +0000	[diff] [blame]	73	%val = load float, float addrspace(1)* %in, align 4
Matt Arsenault	fabf545	2014-08-15 18:42:22 +0000	[diff] [blame]	74	%fabs = call float @llvm.fabs.f32(float %val)
				75	%fsub = fsub float -0.000000e+00, %fabs
				76	store float %fsub, float addrspace(1)* %out, align 4
				77	ret void
				78	}
				79
Tom Stellard	79243d9	2014-10-01 17:15:17 +0000	[diff] [blame]	80	; FUNC-LABEL: {{^}}fneg_fabs_v2f32:
Matt Arsenault	4de3244	2014-08-02 02:26:51 +0000	[diff] [blame]	81	; R600: \|{{(PV\|T[0-9])\.[XYZW]}}\|
				82	; R600: -PV
				83	; R600: \|{{(PV\|T[0-9])\.[XYZW]}}\|
				84	; R600: -PV
				85
Matt Arsenault	124384f	2016-09-09 23:32:53 +0000	[diff] [blame]	86	; FIXME: In this case two uses of the constant should be folded
Matt Arsenault	663ab8c	2016-11-01 23:14:20 +0000	[diff] [blame]	87	; SI: s_brev_b32 [[SIGNBITK:s[0-9]+]], 1{{$}}
Matt Arsenault	124384f	2016-09-09 23:32:53 +0000	[diff] [blame]	88	; SI: v_or_b32_e32 v{{[0-9]+}}, [[SIGNBITK]], v{{[0-9]+}}
				89	; SI: v_or_b32_e32 v{{[0-9]+}}, [[SIGNBITK]], v{{[0-9]+}}
Matt Arsenault	3dbeefa	2017-03-21 21:39:51 +0000	[diff] [blame]	90	define amdgpu_kernel void @fneg_fabs_v2f32(<2 x float> addrspace(1)* %out, <2 x float> %in) {
Matt Arsenault	4de3244	2014-08-02 02:26:51 +0000	[diff] [blame]	91	%fabs = call <2 x float> @llvm.fabs.v2f32(<2 x float> %in)
				92	%fsub = fsub <2 x float> <float -0.000000e+00, float -0.000000e+00>, %fabs
				93	store <2 x float> %fsub, <2 x float> addrspace(1)* %out
Michel Danzer	624b02a	2014-02-04 07:12:38 +0000	[diff] [blame]	94	ret void
				95	}
				96
Tom Stellard	79243d9	2014-10-01 17:15:17 +0000	[diff] [blame]	97	; FUNC-LABEL: {{^}}fneg_fabs_v4f32:
Matt Arsenault	663ab8c	2016-11-01 23:14:20 +0000	[diff] [blame]	98	; SI: s_brev_b32 [[SIGNBITK:s[0-9]+]], 1{{$}}
Matt Arsenault	124384f	2016-09-09 23:32:53 +0000	[diff] [blame]	99	; SI: v_or_b32_e32 v{{[0-9]+}}, [[SIGNBITK]], v{{[0-9]+}}
				100	; SI: v_or_b32_e32 v{{[0-9]+}}, [[SIGNBITK]], v{{[0-9]+}}
				101	; SI: v_or_b32_e32 v{{[0-9]+}}, [[SIGNBITK]], v{{[0-9]+}}
				102	; SI: v_or_b32_e32 v{{[0-9]+}}, [[SIGNBITK]], v{{[0-9]+}}
Matt Arsenault	3dbeefa	2017-03-21 21:39:51 +0000	[diff] [blame]	103	define amdgpu_kernel void @fneg_fabs_v4f32(<4 x float> addrspace(1)* %out, <4 x float> %in) {
Matt Arsenault	4de3244	2014-08-02 02:26:51 +0000	[diff] [blame]	104	%fabs = call <4 x float> @llvm.fabs.v4f32(<4 x float> %in)
				105	%fsub = fsub <4 x float> <float -0.000000e+00, float -0.000000e+00, float -0.000000e+00, float -0.000000e+00>, %fabs
				106	store <4 x float> %fsub, <4 x float> addrspace(1)* %out
				107	ret void
				108	}
				109
				110	declare float @fabs(float) readnone
				111	declare float @llvm.fabs.f32(float) readnone
				112	declare <2 x float> @llvm.fabs.v2f32(<2 x float>) readnone
				113	declare <4 x float> @llvm.fabs.v4f32(<4 x float>) readnone