Dan Gohman | 3b7ce10 | 2009-09-16 02:01:52 +0000 | [diff] [blame] | 1 | ; RUN: opt < %s -S -instcombine > %t |
| 2 | ; RUN: grep {= getelementptr} %t | count 20 |
| 3 | ; RUN: grep {= phi} %t | count 13 |
| 4 | |
Dan Gohman | e5acc61 | 2009-09-16 16:33:59 +0000 | [diff] [blame] | 5 | ; Don't push the geps through these phis, because they would require |
| 6 | ; two phis each, which burdens the loop with high register pressure. |
Dan Gohman | 3b7ce10 | 2009-09-16 02:01:52 +0000 | [diff] [blame] | 7 | |
| 8 | define void @foo(float* %Ar, float* %Ai, i64 %As, float* %Cr, float* %Ci, i64 %Cs, i64 %n) nounwind { |
| 9 | entry: |
| 10 | %0 = getelementptr inbounds float* %Ar, i64 0 ; <float*> [#uses=1] |
| 11 | %1 = getelementptr inbounds float* %Ai, i64 0 ; <float*> [#uses=1] |
| 12 | %2 = mul i64 %n, %As ; <i64> [#uses=1] |
| 13 | %3 = getelementptr inbounds float* %Ar, i64 %2 ; <float*> [#uses=1] |
| 14 | %4 = mul i64 %n, %As ; <i64> [#uses=1] |
| 15 | %5 = getelementptr inbounds float* %Ai, i64 %4 ; <float*> [#uses=1] |
| 16 | %6 = mul i64 %n, 2 ; <i64> [#uses=1] |
| 17 | %7 = mul i64 %6, %As ; <i64> [#uses=1] |
| 18 | %8 = getelementptr inbounds float* %Ar, i64 %7 ; <float*> [#uses=1] |
| 19 | %9 = mul i64 %n, 2 ; <i64> [#uses=1] |
| 20 | %10 = mul i64 %9, %As ; <i64> [#uses=1] |
| 21 | %11 = getelementptr inbounds float* %Ai, i64 %10 ; <float*> [#uses=1] |
| 22 | %12 = getelementptr inbounds float* %Cr, i64 0 ; <float*> [#uses=1] |
| 23 | %13 = getelementptr inbounds float* %Ci, i64 0 ; <float*> [#uses=1] |
| 24 | %14 = mul i64 %n, %Cs ; <i64> [#uses=1] |
| 25 | %15 = getelementptr inbounds float* %Cr, i64 %14 ; <float*> [#uses=1] |
| 26 | %16 = mul i64 %n, %Cs ; <i64> [#uses=1] |
| 27 | %17 = getelementptr inbounds float* %Ci, i64 %16 ; <float*> [#uses=1] |
| 28 | %18 = mul i64 %n, 2 ; <i64> [#uses=1] |
| 29 | %19 = mul i64 %18, %Cs ; <i64> [#uses=1] |
| 30 | %20 = getelementptr inbounds float* %Cr, i64 %19 ; <float*> [#uses=1] |
| 31 | %21 = mul i64 %n, 2 ; <i64> [#uses=1] |
| 32 | %22 = mul i64 %21, %Cs ; <i64> [#uses=1] |
| 33 | %23 = getelementptr inbounds float* %Ci, i64 %22 ; <float*> [#uses=1] |
| 34 | br label %bb13 |
| 35 | |
| 36 | bb: ; preds = %bb13 |
| 37 | %24 = load float* %A0r.0, align 4 ; <float> [#uses=1] |
| 38 | %25 = load float* %A0i.0, align 4 ; <float> [#uses=1] |
| 39 | %26 = load float* %A1r.0, align 4 ; <float> [#uses=2] |
| 40 | %27 = load float* %A1i.0, align 4 ; <float> [#uses=2] |
| 41 | %28 = load float* %A2r.0, align 4 ; <float> [#uses=2] |
| 42 | %29 = load float* %A2i.0, align 4 ; <float> [#uses=2] |
| 43 | %30 = fadd float %26, %28 ; <float> [#uses=2] |
| 44 | %31 = fadd float %27, %29 ; <float> [#uses=2] |
| 45 | %32 = fsub float %26, %28 ; <float> [#uses=1] |
| 46 | %33 = fsub float %27, %29 ; <float> [#uses=1] |
| 47 | %34 = fadd float %24, %30 ; <float> [#uses=2] |
| 48 | %35 = fadd float %25, %31 ; <float> [#uses=2] |
| 49 | %36 = fmul float %30, -1.500000e+00 ; <float> [#uses=1] |
| 50 | %37 = fmul float %31, -1.500000e+00 ; <float> [#uses=1] |
| 51 | %38 = fadd float %34, %36 ; <float> [#uses=2] |
| 52 | %39 = fadd float %35, %37 ; <float> [#uses=2] |
| 53 | %40 = fmul float %32, 0x3FEBB67AE0000000 ; <float> [#uses=2] |
| 54 | %41 = fmul float %33, 0x3FEBB67AE0000000 ; <float> [#uses=2] |
| 55 | %42 = fadd float %38, %41 ; <float> [#uses=1] |
| 56 | %43 = fsub float %39, %40 ; <float> [#uses=1] |
| 57 | %44 = fsub float %38, %41 ; <float> [#uses=1] |
| 58 | %45 = fadd float %39, %40 ; <float> [#uses=1] |
| 59 | store float %34, float* %C0r.0, align 4 |
| 60 | store float %35, float* %C0i.0, align 4 |
| 61 | store float %42, float* %C1r.0, align 4 |
| 62 | store float %43, float* %C1i.0, align 4 |
| 63 | store float %44, float* %C2r.0, align 4 |
| 64 | store float %45, float* %C2i.0, align 4 |
| 65 | %46 = getelementptr inbounds float* %A0r.0, i64 %As ; <float*> [#uses=1] |
| 66 | %47 = getelementptr inbounds float* %A0i.0, i64 %As ; <float*> [#uses=1] |
| 67 | %48 = getelementptr inbounds float* %A1r.0, i64 %As ; <float*> [#uses=1] |
| 68 | %49 = getelementptr inbounds float* %A1i.0, i64 %As ; <float*> [#uses=1] |
| 69 | %50 = getelementptr inbounds float* %A2r.0, i64 %As ; <float*> [#uses=1] |
| 70 | %51 = getelementptr inbounds float* %A2i.0, i64 %As ; <float*> [#uses=1] |
| 71 | %52 = getelementptr inbounds float* %C0r.0, i64 %Cs ; <float*> [#uses=1] |
| 72 | %53 = getelementptr inbounds float* %C0i.0, i64 %Cs ; <float*> [#uses=1] |
| 73 | %54 = getelementptr inbounds float* %C1r.0, i64 %Cs ; <float*> [#uses=1] |
| 74 | %55 = getelementptr inbounds float* %C1i.0, i64 %Cs ; <float*> [#uses=1] |
| 75 | %56 = getelementptr inbounds float* %C2r.0, i64 %Cs ; <float*> [#uses=1] |
| 76 | %57 = getelementptr inbounds float* %C2i.0, i64 %Cs ; <float*> [#uses=1] |
| 77 | %58 = add nsw i64 %i.0, 1 ; <i64> [#uses=1] |
| 78 | br label %bb13 |
| 79 | |
| 80 | bb13: ; preds = %bb, %entry |
| 81 | %i.0 = phi i64 [ 0, %entry ], [ %58, %bb ] ; <i64> [#uses=2] |
| 82 | %C2i.0 = phi float* [ %23, %entry ], [ %57, %bb ] ; <float*> [#uses=2] |
| 83 | %C2r.0 = phi float* [ %20, %entry ], [ %56, %bb ] ; <float*> [#uses=2] |
| 84 | %C1i.0 = phi float* [ %17, %entry ], [ %55, %bb ] ; <float*> [#uses=2] |
| 85 | %C1r.0 = phi float* [ %15, %entry ], [ %54, %bb ] ; <float*> [#uses=2] |
| 86 | %C0i.0 = phi float* [ %13, %entry ], [ %53, %bb ] ; <float*> [#uses=2] |
| 87 | %C0r.0 = phi float* [ %12, %entry ], [ %52, %bb ] ; <float*> [#uses=2] |
| 88 | %A2i.0 = phi float* [ %11, %entry ], [ %51, %bb ] ; <float*> [#uses=2] |
| 89 | %A2r.0 = phi float* [ %8, %entry ], [ %50, %bb ] ; <float*> [#uses=2] |
| 90 | %A1i.0 = phi float* [ %5, %entry ], [ %49, %bb ] ; <float*> [#uses=2] |
| 91 | %A1r.0 = phi float* [ %3, %entry ], [ %48, %bb ] ; <float*> [#uses=2] |
| 92 | %A0i.0 = phi float* [ %1, %entry ], [ %47, %bb ] ; <float*> [#uses=2] |
| 93 | %A0r.0 = phi float* [ %0, %entry ], [ %46, %bb ] ; <float*> [#uses=2] |
| 94 | %59 = icmp slt i64 %i.0, %n ; <i1> [#uses=1] |
| 95 | br i1 %59, label %bb, label %bb14 |
| 96 | |
| 97 | bb14: ; preds = %bb13 |
| 98 | br label %return |
| 99 | |
| 100 | return: ; preds = %bb14 |
| 101 | ret void |
| 102 | } |