Blame - llvm/test/CodeGen/R600/fmuladd.ll - toolchain/llvm-project

blob: becc3e441ca0f406e8832cd45c13fce11ce8a2e9 [file] [log] [blame]

Matt Arsenault	02cb0ff	2014-09-29 14:59:34 +0000	[diff] [blame]	1	; RUN: llc -march=r600 -mcpu=SI -verify-machineinstrs < %s \| FileCheck %s
Niels Ole Salscheider	d3a039f	2013-08-10 10:38:54 +0000	[diff] [blame]	2
Matt Arsenault	02cb0ff	2014-09-29 14:59:34 +0000	[diff] [blame]	3	declare float @llvm.fmuladd.f32(float, float, float)
				4	declare double @llvm.fmuladd.f64(double, double, double)
				5	declare i32 @llvm.r600.read.tidig.x() nounwind readnone
				6	declare float @llvm.fabs.f32(float) nounwind readnone
				7
Tom Stellard	79243d9	2014-10-01 17:15:17 +0000	[diff] [blame]	8	; CHECK-LABEL: {{^}}fmuladd_f32:
Tom Stellard	326d6ec	2014-11-05 14:50:53 +0000	[diff] [blame^]	9	; CHECK: v_mad_f32 {{v[0-9]+, v[0-9]+, v[0-9]+, v[0-9]+}}
Niels Ole Salscheider	d3a039f	2013-08-10 10:38:54 +0000	[diff] [blame]	10
				11	define void @fmuladd_f32(float addrspace(1)* %out, float addrspace(1)* %in1,
				12	float addrspace(1)* %in2, float addrspace(1)* %in3) {
				13	%r0 = load float addrspace(1)* %in1
				14	%r1 = load float addrspace(1)* %in2
				15	%r2 = load float addrspace(1)* %in3
				16	%r3 = tail call float @llvm.fmuladd.f32(float %r0, float %r1, float %r2)
				17	store float %r3, float addrspace(1)* %out
				18	ret void
				19	}
				20
Tom Stellard	79243d9	2014-10-01 17:15:17 +0000	[diff] [blame]	21	; CHECK-LABEL: {{^}}fmuladd_f64:
Tom Stellard	326d6ec	2014-11-05 14:50:53 +0000	[diff] [blame^]	22	; CHECK: v_fma_f64 {{v\[[0-9]+:[0-9]+\], v\[[0-9]+:[0-9]+\], v\[[0-9]+:[0-9]+\], v\[[0-9]+:[0-9]+\]}}
Niels Ole Salscheider	d3a039f	2013-08-10 10:38:54 +0000	[diff] [blame]	23
				24	define void @fmuladd_f64(double addrspace(1)* %out, double addrspace(1)* %in1,
				25	double addrspace(1)* %in2, double addrspace(1)* %in3) {
				26	%r0 = load double addrspace(1)* %in1
				27	%r1 = load double addrspace(1)* %in2
				28	%r2 = load double addrspace(1)* %in3
				29	%r3 = tail call double @llvm.fmuladd.f64(double %r0, double %r1, double %r2)
				30	store double %r3, double addrspace(1)* %out
				31	ret void
				32	}
				33
Tom Stellard	79243d9	2014-10-01 17:15:17 +0000	[diff] [blame]	34	; CHECK-LABEL: {{^}}fmuladd_2.0_a_b_f32
Tom Stellard	326d6ec	2014-11-05 14:50:53 +0000	[diff] [blame^]	35	; CHECK-DAG: buffer_load_dword [[R1:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64{{$}}
				36	; CHECK-DAG: buffer_load_dword [[R2:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:0x4
				37	; CHECK: v_mad_f32 [[RESULT:v[0-9]+]], 2.0, [[R1]], [[R2]]
				38	; CHECK: buffer_store_dword [[RESULT]]
Matt Arsenault	02cb0ff	2014-09-29 14:59:34 +0000	[diff] [blame]	39	define void @fmuladd_2.0_a_b_f32(float addrspace(1)* %out, float addrspace(1)* %in) {
				40	%tid = call i32 @llvm.r600.read.tidig.x() nounwind readnone
				41	%gep.0 = getelementptr float addrspace(1)* %out, i32 %tid
				42	%gep.1 = getelementptr float addrspace(1)* %gep.0, i32 1
				43	%gep.out = getelementptr float addrspace(1)* %out, i32 %tid
				44
				45	%r1 = load float addrspace(1)* %gep.0
				46	%r2 = load float addrspace(1)* %gep.1
				47
				48	%r3 = tail call float @llvm.fmuladd.f32(float 2.0, float %r1, float %r2)
				49	store float %r3, float addrspace(1)* %gep.out
				50	ret void
				51	}
				52
Tom Stellard	79243d9	2014-10-01 17:15:17 +0000	[diff] [blame]	53	; CHECK-LABEL: {{^}}fmuladd_a_2.0_b_f32
Tom Stellard	326d6ec	2014-11-05 14:50:53 +0000	[diff] [blame^]	54	; CHECK-DAG: buffer_load_dword [[R1:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64{{$}}
				55	; CHECK-DAG: buffer_load_dword [[R2:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:0x4
				56	; CHECK: v_mad_f32 [[RESULT:v[0-9]+]], 2.0, [[R1]], [[R2]]
				57	; CHECK: buffer_store_dword [[RESULT]]
Matt Arsenault	02cb0ff	2014-09-29 14:59:34 +0000	[diff] [blame]	58	define void @fmuladd_a_2.0_b_f32(float addrspace(1)* %out, float addrspace(1)* %in) {
				59	%tid = call i32 @llvm.r600.read.tidig.x() nounwind readnone
				60	%gep.0 = getelementptr float addrspace(1)* %out, i32 %tid
				61	%gep.1 = getelementptr float addrspace(1)* %gep.0, i32 1
				62	%gep.out = getelementptr float addrspace(1)* %out, i32 %tid
				63
				64	%r1 = load float addrspace(1)* %gep.0
				65	%r2 = load float addrspace(1)* %gep.1
				66
				67	%r3 = tail call float @llvm.fmuladd.f32(float %r1, float 2.0, float %r2)
				68	store float %r3, float addrspace(1)* %gep.out
				69	ret void
				70	}
				71
Tom Stellard	79243d9	2014-10-01 17:15:17 +0000	[diff] [blame]	72	; CHECK-LABEL: {{^}}fadd_a_a_b_f32:
Tom Stellard	326d6ec	2014-11-05 14:50:53 +0000	[diff] [blame^]	73	; CHECK-DAG: buffer_load_dword [[R1:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64{{$}}
				74	; CHECK-DAG: buffer_load_dword [[R2:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:0x4
				75	; CHECK: v_mad_f32 [[RESULT:v[0-9]+]], 2.0, [[R1]], [[R2]]
				76	; CHECK: buffer_store_dword [[RESULT]]
Matt Arsenault	02cb0ff	2014-09-29 14:59:34 +0000	[diff] [blame]	77	define void @fadd_a_a_b_f32(float addrspace(1)* %out,
				78	float addrspace(1)* %in1,
				79	float addrspace(1)* %in2) {
				80	%tid = call i32 @llvm.r600.read.tidig.x() nounwind readnone
				81	%gep.0 = getelementptr float addrspace(1)* %out, i32 %tid
				82	%gep.1 = getelementptr float addrspace(1)* %gep.0, i32 1
				83	%gep.out = getelementptr float addrspace(1)* %out, i32 %tid
				84
				85	%r0 = load float addrspace(1)* %gep.0
				86	%r1 = load float addrspace(1)* %gep.1
				87
				88	%add.0 = fadd float %r0, %r0
				89	%add.1 = fadd float %add.0, %r1
				90	store float %add.1, float addrspace(1)* %out
				91	ret void
				92	}
				93
Tom Stellard	79243d9	2014-10-01 17:15:17 +0000	[diff] [blame]	94	; CHECK-LABEL: {{^}}fadd_b_a_a_f32:
Tom Stellard	326d6ec	2014-11-05 14:50:53 +0000	[diff] [blame^]	95	; CHECK-DAG: buffer_load_dword [[R1:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64{{$}}
				96	; CHECK-DAG: buffer_load_dword [[R2:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:0x4
				97	; CHECK: v_mad_f32 [[RESULT:v[0-9]+]], 2.0, [[R1]], [[R2]]
				98	; CHECK: buffer_store_dword [[RESULT]]
Matt Arsenault	02cb0ff	2014-09-29 14:59:34 +0000	[diff] [blame]	99	define void @fadd_b_a_a_f32(float addrspace(1)* %out,
				100	float addrspace(1)* %in1,
				101	float addrspace(1)* %in2) {
				102	%tid = call i32 @llvm.r600.read.tidig.x() nounwind readnone
				103	%gep.0 = getelementptr float addrspace(1)* %out, i32 %tid
				104	%gep.1 = getelementptr float addrspace(1)* %gep.0, i32 1
				105	%gep.out = getelementptr float addrspace(1)* %out, i32 %tid
				106
				107	%r0 = load float addrspace(1)* %gep.0
				108	%r1 = load float addrspace(1)* %gep.1
				109
				110	%add.0 = fadd float %r0, %r0
				111	%add.1 = fadd float %r1, %add.0
				112	store float %add.1, float addrspace(1)* %out
				113	ret void
				114	}
				115
Tom Stellard	79243d9	2014-10-01 17:15:17 +0000	[diff] [blame]	116	; CHECK-LABEL: {{^}}fmuladd_neg_2.0_a_b_f32
Tom Stellard	326d6ec	2014-11-05 14:50:53 +0000	[diff] [blame^]	117	; CHECK-DAG: buffer_load_dword [[R1:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64{{$}}
				118	; CHECK-DAG: buffer_load_dword [[R2:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:0x4
				119	; CHECK: v_mad_f32 [[RESULT:v[0-9]+]], [[R1]], -2.0, [[R2]]
				120	; CHECK: buffer_store_dword [[RESULT]]
Matt Arsenault	02cb0ff	2014-09-29 14:59:34 +0000	[diff] [blame]	121	define void @fmuladd_neg_2.0_a_b_f32(float addrspace(1)* %out, float addrspace(1)* %in) {
				122	%tid = call i32 @llvm.r600.read.tidig.x() nounwind readnone
				123	%gep.0 = getelementptr float addrspace(1)* %out, i32 %tid
				124	%gep.1 = getelementptr float addrspace(1)* %gep.0, i32 1
				125	%gep.out = getelementptr float addrspace(1)* %out, i32 %tid
				126
				127	%r1 = load float addrspace(1)* %gep.0
				128	%r2 = load float addrspace(1)* %gep.1
				129
				130	%r3 = tail call float @llvm.fmuladd.f32(float -2.0, float %r1, float %r2)
				131	store float %r3, float addrspace(1)* %gep.out
				132	ret void
				133	}
				134
				135
Tom Stellard	79243d9	2014-10-01 17:15:17 +0000	[diff] [blame]	136	; CHECK-LABEL: {{^}}fmuladd_neg_2.0_neg_a_b_f32
Tom Stellard	326d6ec	2014-11-05 14:50:53 +0000	[diff] [blame^]	137	; CHECK-DAG: buffer_load_dword [[R1:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64{{$}}
				138	; CHECK-DAG: buffer_load_dword [[R2:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:0x4
				139	; CHECK: v_mad_f32 [[RESULT:v[0-9]+]], 2.0, [[R1]], [[R2]]
				140	; CHECK: buffer_store_dword [[RESULT]]
Matt Arsenault	02cb0ff	2014-09-29 14:59:34 +0000	[diff] [blame]	141	define void @fmuladd_neg_2.0_neg_a_b_f32(float addrspace(1)* %out, float addrspace(1)* %in) {
				142	%tid = call i32 @llvm.r600.read.tidig.x() nounwind readnone
				143	%gep.0 = getelementptr float addrspace(1)* %out, i32 %tid
				144	%gep.1 = getelementptr float addrspace(1)* %gep.0, i32 1
				145	%gep.out = getelementptr float addrspace(1)* %out, i32 %tid
				146
				147	%r1 = load float addrspace(1)* %gep.0
				148	%r2 = load float addrspace(1)* %gep.1
				149
				150	%r1.fneg = fsub float -0.000000e+00, %r1
				151
				152	%r3 = tail call float @llvm.fmuladd.f32(float -2.0, float %r1.fneg, float %r2)
				153	store float %r3, float addrspace(1)* %gep.out
				154	ret void
				155	}
				156
				157
Tom Stellard	79243d9	2014-10-01 17:15:17 +0000	[diff] [blame]	158	; CHECK-LABEL: {{^}}fmuladd_2.0_neg_a_b_f32
Tom Stellard	326d6ec	2014-11-05 14:50:53 +0000	[diff] [blame^]	159	; CHECK-DAG: buffer_load_dword [[R1:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64{{$}}
				160	; CHECK-DAG: buffer_load_dword [[R2:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:0x4
				161	; CHECK: v_mad_f32 [[RESULT:v[0-9]+]], [[R1]], -2.0, [[R2]]
				162	; CHECK: buffer_store_dword [[RESULT]]
Matt Arsenault	02cb0ff	2014-09-29 14:59:34 +0000	[diff] [blame]	163	define void @fmuladd_2.0_neg_a_b_f32(float addrspace(1)* %out, float addrspace(1)* %in) {
				164	%tid = call i32 @llvm.r600.read.tidig.x() nounwind readnone
				165	%gep.0 = getelementptr float addrspace(1)* %out, i32 %tid
				166	%gep.1 = getelementptr float addrspace(1)* %gep.0, i32 1
				167	%gep.out = getelementptr float addrspace(1)* %out, i32 %tid
				168
				169	%r1 = load float addrspace(1)* %gep.0
				170	%r2 = load float addrspace(1)* %gep.1
				171
				172	%r1.fneg = fsub float -0.000000e+00, %r1
				173
				174	%r3 = tail call float @llvm.fmuladd.f32(float 2.0, float %r1.fneg, float %r2)
				175	store float %r3, float addrspace(1)* %gep.out
				176	ret void
				177	}
Matt Arsenault	3d4233f	2014-09-29 14:59:38 +0000	[diff] [blame]	178
				179
Tom Stellard	79243d9	2014-10-01 17:15:17 +0000	[diff] [blame]	180	; CHECK-LABEL: {{^}}fmuladd_2.0_a_neg_b_f32
Tom Stellard	326d6ec	2014-11-05 14:50:53 +0000	[diff] [blame^]	181	; CHECK-DAG: buffer_load_dword [[R1:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64{{$}}
				182	; CHECK-DAG: buffer_load_dword [[R2:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:0x4
				183	; CHECK: v_mad_f32 [[RESULT:v[0-9]+]], 2.0, [[R1]], -[[R2]]
				184	; CHECK: buffer_store_dword [[RESULT]]
Matt Arsenault	3d4233f	2014-09-29 14:59:38 +0000	[diff] [blame]	185	define void @fmuladd_2.0_a_neg_b_f32(float addrspace(1)* %out, float addrspace(1)* %in) {
				186	%tid = call i32 @llvm.r600.read.tidig.x() nounwind readnone
				187	%gep.0 = getelementptr float addrspace(1)* %out, i32 %tid
				188	%gep.1 = getelementptr float addrspace(1)* %gep.0, i32 1
				189	%gep.out = getelementptr float addrspace(1)* %out, i32 %tid
				190
				191	%r1 = load float addrspace(1)* %gep.0
				192	%r2 = load float addrspace(1)* %gep.1
				193
				194	%r2.fneg = fsub float -0.000000e+00, %r2
				195
				196	%r3 = tail call float @llvm.fmuladd.f32(float 2.0, float %r1, float %r2.fneg)
				197	store float %r3, float addrspace(1)* %gep.out
				198	ret void
				199	}