Blame - polly/test/CodeGen/matmul_vec.ll - toolchain/llvm-project

blob: 14619f2eebf1fc0b02c511e873e69c53c70c7a90 [file] [log] [blame]

Hongbin Zheng	6417255	2012-05-06 10:22:43 +0000	[diff] [blame]	1	; RUN: opt %loadPolly %defaultOpts -polly-import-jscop -polly-import-jscop-dir=%S -polly-codegen %vector-opt -S -dce %s \| FileCheck %s
Tobias Grosser	7580537	2011-04-29 06:27:02 +0000	[diff] [blame]	2
				3	; ModuleID = 'matmul_vec.s'
				4	target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64"
				5	target triple = "x86_64-unknown-linux-gnu"
				6
				7	@A = common global [1024 x [1024 x float]] zeroinitializer, align 16
				8	@B = common global [1024 x [1024 x float]] zeroinitializer, align 16
				9	@C = common global [1024 x [1024 x float]] zeroinitializer, align 16
				10
				11	define void @matmul_vec() nounwind {
				12	; <label>:0
				13	br label %1
				14
				15	; <label>:1 ; preds = %16, %0
				16	%indvar3 = phi i64 [ %indvar.next4, %16 ], [ 0, %0 ]
				17	%exitcond9 = icmp ne i64 %indvar3, 1024
				18	br i1 %exitcond9, label %2, label %17
				19
				20	; <label>:2 ; preds = %1
				21	br label %3
				22
				23	; <label>:3 ; preds = %14, %2
				24	%indvar1 = phi i64 [ %indvar.next2, %14 ], [ 0, %2 ]
				25	%scevgep8 = getelementptr [1024 x [1024 x float]]* @C, i64 0, i64 %indvar3, i64 %indvar1
				26	%exitcond6 = icmp ne i64 %indvar1, 1024
				27	br i1 %exitcond6, label %4, label %15
				28
				29	; <label>:4 ; preds = %3
				30	br label %5
				31
				32	; <label>:5 ; preds = %12, %4
				33	%indvar = phi i64 [ %indvar.next, %12 ], [ 0, %4 ]
				34	%scevgep5 = getelementptr [1024 x [1024 x float]]* @A, i64 0, i64 %indvar, i64 %indvar3
				35	%scevgep = getelementptr [1024 x [1024 x float]]* @B, i64 0, i64 %indvar1, i64 %indvar
				36	%exitcond = icmp ne i64 %indvar, 1024
				37	br i1 %exitcond, label %6, label %13
				38
				39	; <label>:6 ; preds = %5
				40	%7 = load float* %scevgep5, align 4
				41	%8 = load float* %scevgep, align 4
				42	%9 = fmul float %7, %8
				43	%10 = load float* %scevgep8, align 4
				44	%11 = fadd float %10, %9
				45	store float %11, float* %scevgep8, align 4
				46	br label %12
				47
				48	; <label>:12 ; preds = %6
				49	%indvar.next = add i64 %indvar, 1
				50	br label %5
				51
				52	; <label>:13 ; preds = %5
				53	br label %14
				54
				55	; <label>:14 ; preds = %13
				56	%indvar.next2 = add i64 %indvar1, 1
				57	br label %3
				58
				59	; <label>:15 ; preds = %3
				60	br label %16
				61
				62	; <label>:16 ; preds = %15
				63	%indvar.next4 = add i64 %indvar3, 1
				64	br label %1
				65
				66	; <label>:17 ; preds = %1
				67	ret void
				68	}
				69
				70	define i32 @main() nounwind {
				71	call void @matmul_vec()
				72	%1 = load float* getelementptr inbounds ([1024 x [1024 x float]]* @A, i64 0, i64 42, i64 42), align 8
				73	%2 = fptosi float %1 to i32
				74	ret i32 %2
				75	}
				76
				77	; CHECK: load <1 x float>*
				78	; CHECK: shufflevector <1 x float>
				79	; CHECK: load float*
				80	; CHECK: insertelement <4 x float>
				81	; CHECK: load float*
				82	; CHECK: insertelement <4 x float>
				83	; CHECK: load float*
				84	; CHECK: insertelement <4 x float>
				85	; CHECK: load float*
				86	; CHECK: insertelement <4 x float>
				87	; CHECK: fmul <4 x float>
				88	; CHECK: bitcast float*
				89	; CHECK: load <4 x float>*
				90	; CHECK: fadd <4 x float>
				91	; CHECK: bitcast float*
				92	; CHECK: store <4 x float>