Blame - llvm/test/CodeGen/R600/fmuladd.ll - toolchain/llvm-project

blob: 6f581f21d9bc87fe099a503046250d892f22d63d [file] [log] [blame]

Matt Arsenault	02cb0ff	2014-09-29 14:59:34 +0000	[diff] [blame^]	1	; RUN: llc -march=r600 -mcpu=SI -verify-machineinstrs < %s \| FileCheck %s
Niels Ole Salscheider	d3a039f	2013-08-10 10:38:54 +0000	[diff] [blame]	2
Matt Arsenault	02cb0ff	2014-09-29 14:59:34 +0000	[diff] [blame^]	3	declare float @llvm.fmuladd.f32(float, float, float)
				4	declare double @llvm.fmuladd.f64(double, double, double)
				5	declare i32 @llvm.r600.read.tidig.x() nounwind readnone
				6	declare float @llvm.fabs.f32(float) nounwind readnone
				7
				8	; CHECK-LABEL: @fmuladd_f32
Matt Arsenault	72b31ee	2013-11-12 02:35:51 +0000	[diff] [blame]	9	; CHECK: V_MAD_F32 {{v[0-9]+, v[0-9]+, v[0-9]+, v[0-9]+}}
Niels Ole Salscheider	d3a039f	2013-08-10 10:38:54 +0000	[diff] [blame]	10
				11	define void @fmuladd_f32(float addrspace(1)* %out, float addrspace(1)* %in1,
				12	float addrspace(1)* %in2, float addrspace(1)* %in3) {
				13	%r0 = load float addrspace(1)* %in1
				14	%r1 = load float addrspace(1)* %in2
				15	%r2 = load float addrspace(1)* %in3
				16	%r3 = tail call float @llvm.fmuladd.f32(float %r0, float %r1, float %r2)
				17	store float %r3, float addrspace(1)* %out
				18	ret void
				19	}
				20
Matt Arsenault	02cb0ff	2014-09-29 14:59:34 +0000	[diff] [blame^]	21	; CHECK-LABEL: @fmuladd_f64
Matt Arsenault	72b31ee	2013-11-12 02:35:51 +0000	[diff] [blame]	22	; CHECK: V_FMA_F64 {{v\[[0-9]+:[0-9]+\], v\[[0-9]+:[0-9]+\], v\[[0-9]+:[0-9]+\], v\[[0-9]+:[0-9]+\]}}
Niels Ole Salscheider	d3a039f	2013-08-10 10:38:54 +0000	[diff] [blame]	23
				24	define void @fmuladd_f64(double addrspace(1)* %out, double addrspace(1)* %in1,
				25	double addrspace(1)* %in2, double addrspace(1)* %in3) {
				26	%r0 = load double addrspace(1)* %in1
				27	%r1 = load double addrspace(1)* %in2
				28	%r2 = load double addrspace(1)* %in3
				29	%r3 = tail call double @llvm.fmuladd.f64(double %r0, double %r1, double %r2)
				30	store double %r3, double addrspace(1)* %out
				31	ret void
				32	}
				33
Matt Arsenault	02cb0ff	2014-09-29 14:59:34 +0000	[diff] [blame^]	34	; CHECK-LABEL: @fmuladd_2.0_a_b_f32
				35	; CHECK-DAG: BUFFER_LOAD_DWORD [[R1:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64{{$}}
				36	; CHECK-DAG: BUFFER_LOAD_DWORD [[R2:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:0x4
				37	; CHECK: V_MAD_F32 [[RESULT:v[0-9]+]], 2.0, [[R1]], [[R2]]
				38	; CHECK: BUFFER_STORE_DWORD [[RESULT]]
				39	define void @fmuladd_2.0_a_b_f32(float addrspace(1)* %out, float addrspace(1)* %in) {
				40	%tid = call i32 @llvm.r600.read.tidig.x() nounwind readnone
				41	%gep.0 = getelementptr float addrspace(1)* %out, i32 %tid
				42	%gep.1 = getelementptr float addrspace(1)* %gep.0, i32 1
				43	%gep.out = getelementptr float addrspace(1)* %out, i32 %tid
				44
				45	%r1 = load float addrspace(1)* %gep.0
				46	%r2 = load float addrspace(1)* %gep.1
				47
				48	%r3 = tail call float @llvm.fmuladd.f32(float 2.0, float %r1, float %r2)
				49	store float %r3, float addrspace(1)* %gep.out
				50	ret void
				51	}
				52
				53	; CHECK-LABEL: @fmuladd_a_2.0_b_f32
				54	; CHECK-DAG: BUFFER_LOAD_DWORD [[R1:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64{{$}}
				55	; CHECK-DAG: BUFFER_LOAD_DWORD [[R2:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:0x4
				56	; CHECK: V_MAD_F32 [[RESULT:v[0-9]+]], 2.0, [[R1]], [[R2]]
				57	; CHECK: BUFFER_STORE_DWORD [[RESULT]]
				58	define void @fmuladd_a_2.0_b_f32(float addrspace(1)* %out, float addrspace(1)* %in) {
				59	%tid = call i32 @llvm.r600.read.tidig.x() nounwind readnone
				60	%gep.0 = getelementptr float addrspace(1)* %out, i32 %tid
				61	%gep.1 = getelementptr float addrspace(1)* %gep.0, i32 1
				62	%gep.out = getelementptr float addrspace(1)* %out, i32 %tid
				63
				64	%r1 = load float addrspace(1)* %gep.0
				65	%r2 = load float addrspace(1)* %gep.1
				66
				67	%r3 = tail call float @llvm.fmuladd.f32(float %r1, float 2.0, float %r2)
				68	store float %r3, float addrspace(1)* %gep.out
				69	ret void
				70	}
				71
				72	; CHECK-LABEL: @fadd_a_a_b_f32
				73	; CHECK-DAG: BUFFER_LOAD_DWORD [[R1:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64{{$}}
				74	; CHECK-DAG: BUFFER_LOAD_DWORD [[R2:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:0x4
				75	; CHECK: V_MAD_F32 [[RESULT:v[0-9]+]], 2.0, [[R1]], [[R2]]
				76	; CHECK: BUFFER_STORE_DWORD [[RESULT]]
				77	define void @fadd_a_a_b_f32(float addrspace(1)* %out,
				78	float addrspace(1)* %in1,
				79	float addrspace(1)* %in2) {
				80	%tid = call i32 @llvm.r600.read.tidig.x() nounwind readnone
				81	%gep.0 = getelementptr float addrspace(1)* %out, i32 %tid
				82	%gep.1 = getelementptr float addrspace(1)* %gep.0, i32 1
				83	%gep.out = getelementptr float addrspace(1)* %out, i32 %tid
				84
				85	%r0 = load float addrspace(1)* %gep.0
				86	%r1 = load float addrspace(1)* %gep.1
				87
				88	%add.0 = fadd float %r0, %r0
				89	%add.1 = fadd float %add.0, %r1
				90	store float %add.1, float addrspace(1)* %out
				91	ret void
				92	}
				93
				94	; CHECK-LABEL: @fadd_b_a_a_f32
				95	; CHECK-DAG: BUFFER_LOAD_DWORD [[R1:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64{{$}}
				96	; CHECK-DAG: BUFFER_LOAD_DWORD [[R2:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:0x4
				97	; CHECK: V_MAD_F32 [[RESULT:v[0-9]+]], 2.0, [[R1]], [[R2]]
				98	; CHECK: BUFFER_STORE_DWORD [[RESULT]]
				99	define void @fadd_b_a_a_f32(float addrspace(1)* %out,
				100	float addrspace(1)* %in1,
				101	float addrspace(1)* %in2) {
				102	%tid = call i32 @llvm.r600.read.tidig.x() nounwind readnone
				103	%gep.0 = getelementptr float addrspace(1)* %out, i32 %tid
				104	%gep.1 = getelementptr float addrspace(1)* %gep.0, i32 1
				105	%gep.out = getelementptr float addrspace(1)* %out, i32 %tid
				106
				107	%r0 = load float addrspace(1)* %gep.0
				108	%r1 = load float addrspace(1)* %gep.1
				109
				110	%add.0 = fadd float %r0, %r0
				111	%add.1 = fadd float %r1, %add.0
				112	store float %add.1, float addrspace(1)* %out
				113	ret void
				114	}
				115
				116	; CHECK-LABEL: @fmuladd_neg_2.0_a_b_f32
				117	; CHECK-DAG: BUFFER_LOAD_DWORD [[R1:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64{{$}}
				118	; CHECK-DAG: BUFFER_LOAD_DWORD [[R2:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:0x4
				119	; CHECK: V_MAD_F32 [[RESULT:v[0-9]+]], [[R1]], -2.0, [[R2]]
				120	; CHECK: BUFFER_STORE_DWORD [[RESULT]]
				121	define void @fmuladd_neg_2.0_a_b_f32(float addrspace(1)* %out, float addrspace(1)* %in) {
				122	%tid = call i32 @llvm.r600.read.tidig.x() nounwind readnone
				123	%gep.0 = getelementptr float addrspace(1)* %out, i32 %tid
				124	%gep.1 = getelementptr float addrspace(1)* %gep.0, i32 1
				125	%gep.out = getelementptr float addrspace(1)* %out, i32 %tid
				126
				127	%r1 = load float addrspace(1)* %gep.0
				128	%r2 = load float addrspace(1)* %gep.1
				129
				130	%r3 = tail call float @llvm.fmuladd.f32(float -2.0, float %r1, float %r2)
				131	store float %r3, float addrspace(1)* %gep.out
				132	ret void
				133	}
				134
				135
				136	; CHECK-LABEL: @fmuladd_neg_2.0_neg_a_b_f32
				137	; CHECK-DAG: BUFFER_LOAD_DWORD [[R1:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64{{$}}
				138	; CHECK-DAG: BUFFER_LOAD_DWORD [[R2:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:0x4
				139	; CHECK: V_MAD_F32 [[RESULT:v[0-9]+]], 2.0, [[R1]], [[R2]]
				140	; CHECK: BUFFER_STORE_DWORD [[RESULT]]
				141	define void @fmuladd_neg_2.0_neg_a_b_f32(float addrspace(1)* %out, float addrspace(1)* %in) {
				142	%tid = call i32 @llvm.r600.read.tidig.x() nounwind readnone
				143	%gep.0 = getelementptr float addrspace(1)* %out, i32 %tid
				144	%gep.1 = getelementptr float addrspace(1)* %gep.0, i32 1
				145	%gep.out = getelementptr float addrspace(1)* %out, i32 %tid
				146
				147	%r1 = load float addrspace(1)* %gep.0
				148	%r2 = load float addrspace(1)* %gep.1
				149
				150	%r1.fneg = fsub float -0.000000e+00, %r1
				151
				152	%r3 = tail call float @llvm.fmuladd.f32(float -2.0, float %r1.fneg, float %r2)
				153	store float %r3, float addrspace(1)* %gep.out
				154	ret void
				155	}
				156
				157
				158	; CHECK-LABEL: @fmuladd_2.0_neg_a_b_f32
				159	; CHECK-DAG: BUFFER_LOAD_DWORD [[R1:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64{{$}}
				160	; CHECK-DAG: BUFFER_LOAD_DWORD [[R2:v[0-9]+]], {{v\[[0-9]+:[0-9]+\]}}, {{s\[[0-9]+:[0-9]+\]}}, 0 addr64 offset:0x4
				161	; CHECK: V_MAD_F32 [[RESULT:v[0-9]+]], [[R1]], -2.0, [[R2]]
				162	; CHECK: BUFFER_STORE_DWORD [[RESULT]]
				163	define void @fmuladd_2.0_neg_a_b_f32(float addrspace(1)* %out, float addrspace(1)* %in) {
				164	%tid = call i32 @llvm.r600.read.tidig.x() nounwind readnone
				165	%gep.0 = getelementptr float addrspace(1)* %out, i32 %tid
				166	%gep.1 = getelementptr float addrspace(1)* %gep.0, i32 1
				167	%gep.out = getelementptr float addrspace(1)* %out, i32 %tid
				168
				169	%r1 = load float addrspace(1)* %gep.0
				170	%r2 = load float addrspace(1)* %gep.1
				171
				172	%r1.fneg = fsub float -0.000000e+00, %r1
				173
				174	%r3 = tail call float @llvm.fmuladd.f32(float 2.0, float %r1.fneg, float %r2)
				175	store float %r3, float addrspace(1)* %gep.out
				176	ret void
				177	}