Blame - llvm/test/CodeGen/R600/mad_int24.ll - toolchain/llvm-project

blob: 60f6e15f2f57e7250add7166ef6d36b88bfaae17 [file] [log] [blame]

Tom Stellard	50122a5	2014-04-07 19:45:41 +0000	[diff] [blame]	1	; RUN: llc < %s -march=r600 -mcpu=redwood \| FileCheck %s --check-prefix=EG --check-prefix=FUNC
				2	; RUN: llc < %s -march=r600 -mcpu=cayman \| FileCheck %s --check-prefix=CM --check-prefix=FUNC
Tom Stellard	49f8bfd	2015-01-06 18:00:21 +0000	[diff] [blame^]	3	; RUN: llc < %s -march=amdgcn -mcpu=SI -verify-machineinstrs \| FileCheck %s --check-prefix=SI --check-prefix=FUNC
Tom Stellard	5263948	2013-07-23 01:48:49 +0000	[diff] [blame]	4
Matt Arsenault	b6e51ff	2014-11-05 19:01:22 +0000	[diff] [blame]	5	declare i32 @llvm.AMDGPU.imul24(i32, i32) nounwind readnone
				6
Tom Stellard	79243d9	2014-10-01 17:15:17 +0000	[diff] [blame]	7	; FUNC-LABEL: {{^}}i32_mad24:
Tom Stellard	5263948	2013-07-23 01:48:49 +0000	[diff] [blame]	8	; Signed 24-bit multiply is not supported on pre-Cayman GPUs.
Tom Stellard	50122a5	2014-04-07 19:45:41 +0000	[diff] [blame]	9	; EG: MULLO_INT
				10	; Make sure we aren't masking the inputs.
				11	; CM-NOT: AND
				12	; CM: MULADD_INT24
Tom Stellard	326d6ec	2014-11-05 14:50:53 +0000	[diff] [blame]	13	; SI-NOT: and
				14	; SI: v_mad_i32_i24
Tom Stellard	5263948	2013-07-23 01:48:49 +0000	[diff] [blame]	15	define void @i32_mad24(i32 addrspace(1)* %out, i32 %a, i32 %b, i32 %c) {
				16	entry:
				17	%0 = shl i32 %a, 8
				18	%a_24 = ashr i32 %0, 8
				19	%1 = shl i32 %b, 8
				20	%b_24 = ashr i32 %1, 8
				21	%2 = mul i32 %a_24, %b_24
				22	%3 = add i32 %2, %c
				23	store i32 %3, i32 addrspace(1)* %out
				24	ret void
				25	}
Matt Arsenault	b6e51ff	2014-11-05 19:01:22 +0000	[diff] [blame]	26
				27	; FUNC-LABEL: @test_imul24
				28	; SI: v_mad_i32_i24
				29	define void @test_imul24(i32 addrspace(1)* %out, i32 %src0, i32 %src1, i32 %src2) nounwind {
				30	%mul = call i32 @llvm.AMDGPU.imul24(i32 %src0, i32 %src1) nounwind readnone
				31	%add = add i32 %mul, %src2
				32	store i32 %add, i32 addrspace(1)* %out, align 4
				33	ret void
				34	}