Blame - llvm/test/Transforms/LoopVectorize/flags.ll - toolchain/llvm-project

blob: f1b122d667859291a44fc3faa1607dff6dc3c692 [file] [log] [blame]

Sanjay Patel	b653de1	2014-09-10 17:58:16 +0000	[diff] [blame]	1	; RUN: opt < %s -loop-vectorize -force-vector-interleave=1 -force-vector-width=4 -dce -instcombine -S \| FileCheck %s
Nadav Rotem	4cb8cda	2012-10-31 21:40:39 +0000	[diff] [blame]	2
				3	target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64-S128"
Nadav Rotem	4cb8cda	2012-10-31 21:40:39 +0000	[diff] [blame]	4
Stephen Lin	c1c7a13	2013-07-14 01:42:54 +0000	[diff] [blame]	5	;CHECK-LABEL: @flags1(
Nadav Rotem	4cb8cda	2012-10-31 21:40:39 +0000	[diff] [blame]	6	;CHECK: load <4 x i32>
				7	;CHECK: mul nsw <4 x i32>
				8	;CHECK: store <4 x i32>
				9	;CHECK: ret i32
				10	define i32 @flags1(i32 %n, i32* nocapture %A) nounwind uwtable ssp {
				11	%1 = icmp sgt i32 %n, 9
				12	br i1 %1, label %.lr.ph, label %._crit_edge
				13
				14	.lr.ph: ; preds = %0, %.lr.ph
				15	%indvars.iv = phi i64 [ %indvars.iv.next, %.lr.ph ], [ 9, %0 ]
David Blaikie	79e6c74	2015-02-27 19:29:02 +0000	[diff] [blame]	16	%2 = getelementptr inbounds i32, i32* %A, i64 %indvars.iv
David Blaikie	a79ac14	2015-02-27 21:17:42 +0000	[diff] [blame]	17	%3 = load i32, i32* %2, align 4
Nadav Rotem	4cb8cda	2012-10-31 21:40:39 +0000	[diff] [blame]	18	%4 = mul nsw i32 %3, 3
				19	store i32 %4, i32* %2, align 4
				20	%indvars.iv.next = add i64 %indvars.iv, 1
				21	%lftr.wideiv = trunc i64 %indvars.iv.next to i32
				22	%exitcond = icmp eq i32 %lftr.wideiv, %n
				23	br i1 %exitcond, label %._crit_edge, label %.lr.ph
				24
				25	._crit_edge: ; preds = %.lr.ph, %0
				26	ret i32 undef
				27	}
				28
				29
Stephen Lin	c1c7a13	2013-07-14 01:42:54 +0000	[diff] [blame]	30	;CHECK-LABEL: @flags2(
Nadav Rotem	4cb8cda	2012-10-31 21:40:39 +0000	[diff] [blame]	31	;CHECK: load <4 x i32>
				32	;CHECK: mul <4 x i32>
				33	;CHECK: store <4 x i32>
				34	;CHECK: ret i32
				35	define i32 @flags2(i32 %n, i32* nocapture %A) nounwind uwtable ssp {
				36	%1 = icmp sgt i32 %n, 9
				37	br i1 %1, label %.lr.ph, label %._crit_edge
				38
				39	.lr.ph: ; preds = %0, %.lr.ph
				40	%indvars.iv = phi i64 [ %indvars.iv.next, %.lr.ph ], [ 9, %0 ]
David Blaikie	79e6c74	2015-02-27 19:29:02 +0000	[diff] [blame]	41	%2 = getelementptr inbounds i32, i32* %A, i64 %indvars.iv
David Blaikie	a79ac14	2015-02-27 21:17:42 +0000	[diff] [blame]	42	%3 = load i32, i32* %2, align 4
Nadav Rotem	4cb8cda	2012-10-31 21:40:39 +0000	[diff] [blame]	43	%4 = mul i32 %3, 3
				44	store i32 %4, i32* %2, align 4
				45	%indvars.iv.next = add i64 %indvars.iv, 1
				46	%lftr.wideiv = trunc i64 %indvars.iv.next to i32
				47	%exitcond = icmp eq i32 %lftr.wideiv, %n
				48	br i1 %exitcond, label %._crit_edge, label %.lr.ph
				49
				50	._crit_edge: ; preds = %.lr.ph, %0
				51	ret i32 undef
				52	}
Arnold Schwaighofer	ab12363	2014-03-05 21:10:47 +0000	[diff] [blame]	53
				54	; Make sure we copy fast math flags and use them for the final reduction.
				55	; CHECK-LABEL: fast_math
				56	; CHECK: load <4 x float>
				57	; CHECK: fadd fast <4 x float>
				58	; CHECK: br
				59	; CHECK: fadd fast <4 x float>
				60	; CHECK: fadd fast <4 x float>
				61	define float @fast_math(float* noalias %s) {
				62	entry:
				63	br label %for.body
				64
				65	for.body:
				66	%indvars.iv = phi i64 [ 0, %entry ], [ %indvars.iv.next, %for.body ]
				67	%q.04 = phi float [ 0.000000e+00, %entry ], [ %add, %for.body ]
David Blaikie	79e6c74	2015-02-27 19:29:02 +0000	[diff] [blame]	68	%arrayidx = getelementptr inbounds float, float* %s, i64 %indvars.iv
David Blaikie	a79ac14	2015-02-27 21:17:42 +0000	[diff] [blame]	69	%0 = load float, float* %arrayidx, align 4
Arnold Schwaighofer	ab12363	2014-03-05 21:10:47 +0000	[diff] [blame]	70	%add = fadd fast float %q.04, %0
				71	%indvars.iv.next = add nuw nsw i64 %indvars.iv, 1
				72	%exitcond = icmp eq i64 %indvars.iv.next, 256
				73	br i1 %exitcond, label %for.end, label %for.body
				74
				75	for.end:
				76	%add.lcssa = phi float [ %add, %for.body ]
				77	ret float %add.lcssa
				78	}