Blame - llvm/test/CodeGen/X86/combine-subo.ll - toolchain/llvm-project

blob: 5113c95f9208207e59b50b7629454e44da22ca0a [file] [log] [blame]

Simon Pilgrim	a3d06cc	2019-03-05 14:52:42 +0000	[diff] [blame]	1	; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
				2	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.1 \| FileCheck %s --check-prefix=SSE
				3	; RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+avx2 \| FileCheck %s --check-prefix=AVX
				4
				5	declare {i32, i1} @llvm.ssub.with.overflow.i32(i32, i32) nounwind readnone
				6	declare {i32, i1} @llvm.usub.with.overflow.i32(i32, i32) nounwind readnone
				7
				8	declare {<4 x i32>, <4 x i1>} @llvm.ssub.with.overflow.v4i32(<4 x i32>, <4 x i32>) nounwind readnone
				9	declare {<4 x i32>, <4 x i1>} @llvm.usub.with.overflow.v4i32(<4 x i32>, <4 x i32>) nounwind readnone
				10
				11	; fold (ssub x, 0) -> x
				12	define i32 @combine_ssub_zero(i32 %a0, i32 %a1) {
				13	; SSE-LABEL: combine_ssub_zero:
				14	; SSE: # %bb.0:
				15	; SSE-NEXT: movl %edi, %eax
Simon Pilgrim	a3d06cc	2019-03-05 14:52:42 +0000	[diff] [blame]	16	; SSE-NEXT: retq
				17	;
				18	; AVX-LABEL: combine_ssub_zero:
				19	; AVX: # %bb.0:
				20	; AVX-NEXT: movl %edi, %eax
Simon Pilgrim	a3d06cc	2019-03-05 14:52:42 +0000	[diff] [blame]	21	; AVX-NEXT: retq
				22	%1 = call {i32, i1} @llvm.ssub.with.overflow.i32(i32 %a0, i32 zeroinitializer)
				23	%2 = extractvalue {i32, i1} %1, 0
				24	%3 = extractvalue {i32, i1} %1, 1
				25	%4 = select i1 %3, i32 %a1, i32 %2
				26	ret i32 %4
				27	}
				28
				29	define <4 x i32> @combine_vec_ssub_zero(<4 x i32> %a0, <4 x i32> %a1) {
				30	; SSE-LABEL: combine_vec_ssub_zero:
				31	; SSE: # %bb.0:
Simon Pilgrim	a3d06cc	2019-03-05 14:52:42 +0000	[diff] [blame]	32	; SSE-NEXT: retq
				33	;
				34	; AVX-LABEL: combine_vec_ssub_zero:
				35	; AVX: # %bb.0:
Simon Pilgrim	a3d06cc	2019-03-05 14:52:42 +0000	[diff] [blame]	36	; AVX-NEXT: retq
				37	%1 = call {<4 x i32>, <4 x i1>} @llvm.ssub.with.overflow.v4i32(<4 x i32> %a0, <4 x i32> zeroinitializer)
				38	%2 = extractvalue {<4 x i32>, <4 x i1>} %1, 0
				39	%3 = extractvalue {<4 x i32>, <4 x i1>} %1, 1
				40	%4 = select <4 x i1> %3, <4 x i32> %a1, <4 x i32> %2
				41	ret <4 x i32> %4
				42	}
				43
				44	; fold (usub x, 0) -> x
				45	define i32 @combine_usub_zero(i32 %a0, i32 %a1) {
				46	; SSE-LABEL: combine_usub_zero:
				47	; SSE: # %bb.0:
				48	; SSE-NEXT: movl %edi, %eax
				49	; SSE-NEXT: retq
				50	;
				51	; AVX-LABEL: combine_usub_zero:
				52	; AVX: # %bb.0:
				53	; AVX-NEXT: movl %edi, %eax
				54	; AVX-NEXT: retq
				55	%1 = call {i32, i1} @llvm.usub.with.overflow.i32(i32 %a0, i32 zeroinitializer)
				56	%2 = extractvalue {i32, i1} %1, 0
				57	%3 = extractvalue {i32, i1} %1, 1
				58	%4 = select i1 %3, i32 %a1, i32 %2
				59	ret i32 %4
				60	}
				61
				62	define <4 x i32> @combine_vec_usub_zero(<4 x i32> %a0, <4 x i32> %a1) {
				63	; SSE-LABEL: combine_vec_usub_zero:
				64	; SSE: # %bb.0:
Simon Pilgrim	a3d06cc	2019-03-05 14:52:42 +0000	[diff] [blame]	65	; SSE-NEXT: retq
				66	;
				67	; AVX-LABEL: combine_vec_usub_zero:
				68	; AVX: # %bb.0:
Simon Pilgrim	a3d06cc	2019-03-05 14:52:42 +0000	[diff] [blame]	69	; AVX-NEXT: retq
				70	%1 = call {<4 x i32>, <4 x i1>} @llvm.usub.with.overflow.v4i32(<4 x i32> %a0, <4 x i32> zeroinitializer)
				71	%2 = extractvalue {<4 x i32>, <4 x i1>} %1, 0
				72	%3 = extractvalue {<4 x i32>, <4 x i1>} %1, 1
				73	%4 = select <4 x i1> %3, <4 x i32> %a1, <4 x i32> %2
				74	ret <4 x i32> %4
				75	}
				76
				77	; fold (ssub x, x) -> 0
				78	define i32 @combine_ssub_self(i32 %a0, i32 %a1) {
				79	; SSE-LABEL: combine_ssub_self:
				80	; SSE: # %bb.0:
Simon Pilgrim	1bdc2d1	2019-03-06 14:22:21 +0000	[diff] [blame]	81	; SSE-NEXT: xorl %eax, %eax
Simon Pilgrim	a3d06cc	2019-03-05 14:52:42 +0000	[diff] [blame]	82	; SSE-NEXT: retq
				83	;
				84	; AVX-LABEL: combine_ssub_self:
				85	; AVX: # %bb.0:
Simon Pilgrim	1bdc2d1	2019-03-06 14:22:21 +0000	[diff] [blame]	86	; AVX-NEXT: xorl %eax, %eax
Simon Pilgrim	a3d06cc	2019-03-05 14:52:42 +0000	[diff] [blame]	87	; AVX-NEXT: retq
				88	%1 = call {i32, i1} @llvm.ssub.with.overflow.i32(i32 %a0, i32 %a0)
				89	%2 = extractvalue {i32, i1} %1, 0
				90	%3 = extractvalue {i32, i1} %1, 1
				91	%4 = select i1 %3, i32 %a1, i32 %2
				92	ret i32 %4
				93	}
				94
				95	define <4 x i32> @combine_vec_ssub_self(<4 x i32> %a0, <4 x i32> %a1) {
				96	; SSE-LABEL: combine_vec_ssub_self:
				97	; SSE: # %bb.0:
Simon Pilgrim	1bdc2d1	2019-03-06 14:22:21 +0000	[diff] [blame]	98	; SSE-NEXT: xorps %xmm0, %xmm0
Simon Pilgrim	a3d06cc	2019-03-05 14:52:42 +0000	[diff] [blame]	99	; SSE-NEXT: retq
				100	;
				101	; AVX-LABEL: combine_vec_ssub_self:
				102	; AVX: # %bb.0:
Simon Pilgrim	1bdc2d1	2019-03-06 14:22:21 +0000	[diff] [blame]	103	; AVX-NEXT: vxorps %xmm0, %xmm0, %xmm0
Simon Pilgrim	a3d06cc	2019-03-05 14:52:42 +0000	[diff] [blame]	104	; AVX-NEXT: retq
				105	%1 = call {<4 x i32>, <4 x i1>} @llvm.ssub.with.overflow.v4i32(<4 x i32> %a0, <4 x i32> %a0)
				106	%2 = extractvalue {<4 x i32>, <4 x i1>} %1, 0
				107	%3 = extractvalue {<4 x i32>, <4 x i1>} %1, 1
				108	%4 = select <4 x i1> %3, <4 x i32> %a1, <4 x i32> %2
				109	ret <4 x i32> %4
				110	}
				111
				112	; fold (usub x, x) -> x
				113	define i32 @combine_usub_self(i32 %a0, i32 %a1) {
				114	; SSE-LABEL: combine_usub_self:
				115	; SSE: # %bb.0:
				116	; SSE-NEXT: xorl %eax, %eax
				117	; SSE-NEXT: retq
				118	;
				119	; AVX-LABEL: combine_usub_self:
				120	; AVX: # %bb.0:
				121	; AVX-NEXT: xorl %eax, %eax
				122	; AVX-NEXT: retq
				123	%1 = call {i32, i1} @llvm.usub.with.overflow.i32(i32 %a0, i32 %a0)
				124	%2 = extractvalue {i32, i1} %1, 0
				125	%3 = extractvalue {i32, i1} %1, 1
				126	%4 = select i1 %3, i32 %a1, i32 %2
				127	ret i32 %4
				128	}
				129
				130	define <4 x i32> @combine_vec_usub_self(<4 x i32> %a0, <4 x i32> %a1) {
				131	; SSE-LABEL: combine_vec_usub_self:
				132	; SSE: # %bb.0:
Simon Pilgrim	cdf95f8	2019-03-06 16:11:03 +0000	[diff] [blame]	133	; SSE-NEXT: xorps %xmm0, %xmm0
Simon Pilgrim	a3d06cc	2019-03-05 14:52:42 +0000	[diff] [blame]	134	; SSE-NEXT: retq
				135	;
				136	; AVX-LABEL: combine_vec_usub_self:
				137	; AVX: # %bb.0:
Simon Pilgrim	cdf95f8	2019-03-06 16:11:03 +0000	[diff] [blame]	138	; AVX-NEXT: vxorps %xmm0, %xmm0, %xmm0
Simon Pilgrim	a3d06cc	2019-03-05 14:52:42 +0000	[diff] [blame]	139	; AVX-NEXT: retq
				140	%1 = call {<4 x i32>, <4 x i1>} @llvm.usub.with.overflow.v4i32(<4 x i32> %a0, <4 x i32> %a0)
				141	%2 = extractvalue {<4 x i32>, <4 x i1>} %1, 0
				142	%3 = extractvalue {<4 x i32>, <4 x i1>} %1, 1
				143	%4 = select <4 x i1> %3, <4 x i32> %a1, <4 x i32> %2
				144	ret <4 x i32> %4
				145	}
				146
				147	; fold (usub -1, x) -> (xor x, -1) + no borrow
				148	define i32 @combine_usub_negone(i32 %a0, i32 %a1) {
				149	; SSE-LABEL: combine_usub_negone:
				150	; SSE: # %bb.0:
				151	; SSE-NEXT: movl %edi, %eax
				152	; SSE-NEXT: notl %eax
				153	; SSE-NEXT: retq
				154	;
				155	; AVX-LABEL: combine_usub_negone:
				156	; AVX: # %bb.0:
				157	; AVX-NEXT: movl %edi, %eax
				158	; AVX-NEXT: notl %eax
				159	; AVX-NEXT: retq
				160	%1 = call {i32, i1} @llvm.usub.with.overflow.i32(i32 -1, i32 %a0)
				161	%2 = extractvalue {i32, i1} %1, 0
				162	%3 = extractvalue {i32, i1} %1, 1
				163	%4 = select i1 %3, i32 %a1, i32 %2
				164	ret i32 %4
				165	}
				166
				167	define <4 x i32> @combine_vec_usub_negone(<4 x i32> %a0, <4 x i32> %a1) {
				168	; SSE-LABEL: combine_vec_usub_negone:
				169	; SSE: # %bb.0:
Simon Pilgrim	cdf95f8	2019-03-06 16:11:03 +0000	[diff] [blame]	170	; SSE-NEXT: pcmpeqd %xmm1, %xmm1
				171	; SSE-NEXT: pxor %xmm1, %xmm0
Simon Pilgrim	a3d06cc	2019-03-05 14:52:42 +0000	[diff] [blame]	172	; SSE-NEXT: retq
				173	;
				174	; AVX-LABEL: combine_vec_usub_negone:
				175	; AVX: # %bb.0:
Simon Pilgrim	cdf95f8	2019-03-06 16:11:03 +0000	[diff] [blame]	176	; AVX-NEXT: vpcmpeqd %xmm1, %xmm1, %xmm1
				177	; AVX-NEXT: vpxor %xmm1, %xmm0, %xmm0
Simon Pilgrim	a3d06cc	2019-03-05 14:52:42 +0000	[diff] [blame]	178	; AVX-NEXT: retq
				179	%1 = call {<4 x i32>, <4 x i1>} @llvm.usub.with.overflow.v4i32(<4 x i32> <i32 -1, i32 -1, i32 -1, i32 -1>, <4 x i32> %a0)
				180	%2 = extractvalue {<4 x i32>, <4 x i1>} %1, 0
				181	%3 = extractvalue {<4 x i32>, <4 x i1>} %1, 1
				182	%4 = select <4 x i1> %3, <4 x i32> %a1, <4 x i32> %2
				183	ret <4 x i32> %4
				184	}