Blame - llvm/test/CodeGen/X86/combine-add-usat.ll - toolchain/llvm-project

blob: 26fe088f7654dc5ab3420d738e41e148b8c3db2a [file] [log] [blame]

Simon Pilgrim	9961c55	2019-01-13 21:21:46 +0000	[diff] [blame]	1	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				2	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse2 \| FileCheck %s --check-prefixes=CHECK,SSE,SSE2
				3	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 \| FileCheck %s --check-prefixes=CHECK,SSE,SSE41
				4	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 \| FileCheck %s --check-prefixes=CHECK,SSE,SSE42
				5	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx \| FileCheck %s --check-prefixes=CHECK,AVX,AVX1
				6	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefixes=CHECK,AVX,AVX2
				7	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512f \| FileCheck %s --check-prefixes=CHECK,AVX,AVX512,AVX512F
				8	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx512bw \| FileCheck %s --check-prefixes=CHECK,AVX,AVX512,AVX512BW
				9
				10	declare i32 @llvm.uadd.sat.i32 (i32, i32)
				11	declare i64 @llvm.uadd.sat.i64 (i64, i64)
				12	declare <8 x i16> @llvm.uadd.sat.v8i16(<8 x i16>, <8 x i16>)
				13
				14	; fold (uadd_sat c, x) -> (add_ssat x, c)
				15	define i32 @combine_constant_i32(i32 %a0) {
				16	; CHECK-LABEL: combine_constant_i32:
				17	; CHECK: # %bb.0:
				18	; CHECK-NEXT: addl $1, %edi
				19	; CHECK-NEXT: movl $-1, %eax
				20	; CHECK-NEXT: cmovael %edi, %eax
				21	; CHECK-NEXT: retq
				22	%1 = call i32 @llvm.uadd.sat.i32(i32 1, i32 %a0);
				23	ret i32 %1
				24	}
				25
				26	define <8 x i16> @combine_constant_v8i16(<8 x i16> %a0) {
				27	; SSE-LABEL: combine_constant_v8i16:
				28	; SSE: # %bb.0:
				29	; SSE-NEXT: paddusw {{.*}}(%rip), %xmm0
				30	; SSE-NEXT: retq
				31	;
				32	; AVX-LABEL: combine_constant_v8i16:
				33	; AVX: # %bb.0:
				34	; AVX-NEXT: vpaddusw {{.*}}(%rip), %xmm0, %xmm0
				35	; AVX-NEXT: retq
				36	%1 = call <8 x i16> @llvm.uadd.sat.v8i16(<8 x i16> <i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1, i16 1>, <8 x i16> %a0);
				37	ret <8 x i16> %1
				38	}
				39
				40	; fold (uadd_sat c, 0) -> x
				41	define i32 @combine_zero_i32(i32 %a0) {
				42	; CHECK-LABEL: combine_zero_i32:
				43	; CHECK: # %bb.0:
Simon Pilgrim	897d4c6	2019-01-13 21:50:24 +0000	[diff] [blame]	44	; CHECK-NEXT: movl %edi, %eax
Simon Pilgrim	9961c55	2019-01-13 21:21:46 +0000	[diff] [blame]	45	; CHECK-NEXT: retq
				46	%1 = call i32 @llvm.uadd.sat.i32(i32 %a0, i32 0);
				47	ret i32 %1
				48	}
				49
				50	define <8 x i16> @combine_zero_v8i16(<8 x i16> %a0) {
Simon Pilgrim	897d4c6	2019-01-13 21:50:24 +0000	[diff] [blame]	51	; CHECK-LABEL: combine_zero_v8i16:
				52	; CHECK: # %bb.0:
				53	; CHECK-NEXT: retq
Simon Pilgrim	9961c55	2019-01-13 21:21:46 +0000	[diff] [blame]	54	%1 = call <8 x i16> @llvm.uadd.sat.v8i16(<8 x i16> %a0, <8 x i16> zeroinitializer);
				55	ret <8 x i16> %1
				56	}
				57
				58	; fold (uadd_sat x, y) -> (add x, y) iff no overflow
				59	define i32 @combine_no_overflow_i32(i32 %a0, i32 %a1) {
				60	; CHECK-LABEL: combine_no_overflow_i32:
				61	; CHECK: # %bb.0:
Simon Pilgrim	56ba1db	2019-01-13 22:08:26 +0000	[diff] [blame^]	62	; CHECK-NEXT: # kill: def $esi killed $esi def $rsi
				63	; CHECK-NEXT: # kill: def $edi killed $edi def $rdi
Simon Pilgrim	9961c55	2019-01-13 21:21:46 +0000	[diff] [blame]	64	; CHECK-NEXT: shrl $16, %edi
				65	; CHECK-NEXT: shrl $16, %esi
Simon Pilgrim	56ba1db	2019-01-13 22:08:26 +0000	[diff] [blame^]	66	; CHECK-NEXT: leal (%rsi,%rdi), %eax
Simon Pilgrim	9961c55	2019-01-13 21:21:46 +0000	[diff] [blame]	67	; CHECK-NEXT: retq
				68	%1 = lshr i32 %a0, 16
				69	%2 = lshr i32 %a1, 16
				70	%3 = call i32 @llvm.uadd.sat.i32(i32 %1, i32 %2);
				71	ret i32 %3
				72	}
				73
				74	define <8 x i16> @combine_no_overflow_v8i16(<8 x i16> %a0, <8 x i16> %a1) {
				75	; SSE-LABEL: combine_no_overflow_v8i16:
				76	; SSE: # %bb.0:
				77	; SSE-NEXT: psrlw $10, %xmm0
				78	; SSE-NEXT: psrlw $10, %xmm1
Simon Pilgrim	56ba1db	2019-01-13 22:08:26 +0000	[diff] [blame^]	79	; SSE-NEXT: paddw %xmm1, %xmm0
Simon Pilgrim	9961c55	2019-01-13 21:21:46 +0000	[diff] [blame]	80	; SSE-NEXT: retq
				81	;
				82	; AVX-LABEL: combine_no_overflow_v8i16:
				83	; AVX: # %bb.0:
				84	; AVX-NEXT: vpsrlw $10, %xmm0, %xmm0
				85	; AVX-NEXT: vpsrlw $10, %xmm1, %xmm1
Simon Pilgrim	56ba1db	2019-01-13 22:08:26 +0000	[diff] [blame^]	86	; AVX-NEXT: vpaddw %xmm1, %xmm0, %xmm0
Simon Pilgrim	9961c55	2019-01-13 21:21:46 +0000	[diff] [blame]	87	; AVX-NEXT: retq
				88	%1 = lshr <8 x i16> %a0, <i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10>
				89	%2 = lshr <8 x i16> %a1, <i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10>
				90	%3 = call <8 x i16> @llvm.uadd.sat.v8i16(<8 x i16> %1, <8 x i16> %2);
				91	ret <8 x i16> %3
				92	}