Support generic expansion of ordered vector reduction (PR36732) Without the fast math flags, the llvm.experimental.vector.reduce.fadd/fmul intrinsic expansions must be expanded in order. This patch scalarizes the reduction, applying the accumulator at the start of the sequence: ((((Acc + Scl[0]) + Scl[1]) + Scl[2]) + ) ... + Scl[NumElts-1] Differential Revision: https://reviews.llvm.org/D45366 llvm-svn: 329585

commit: 23c2182c2bfcd145b2c33cf5ca831a7348e6adce [log] [tgz]
author: Simon Pilgrim <llvm-dev@redking.me.uk> Mon Apr 09 15:44:20 2018 +0000
committer: Simon Pilgrim <llvm-dev@redking.me.uk> Mon Apr 09 15:44:20 2018 +0000
tree: 539213fa47e89fc0f31e62c647aceda93c205cb5
parent: bec8a66454882285db4c98311ba430adec2c8dac [diff] [blame]
diff --git a/llvm/lib/Transforms/Utils/LoopUtils.cpp b/llvm/lib/Transforms/Utils/LoopUtils.cpp
index 67e2095..805a003 100644
--- a/llvm/lib/Transforms/Utils/LoopUtils.cpp
+++ b/llvm/lib/Transforms/Utils/LoopUtils.cpp

@@ -1526,6 +1526,38 @@
   return V;
 }
 
+// Helper to generate an ordered reduction.
+Value *
+llvm::getOrderedReduction(IRBuilder<> &Builder, Value *Acc, Value *Src,
+                          unsigned Op,
+                          RecurrenceDescriptor::MinMaxRecurrenceKind MinMaxKind,
+                          ArrayRef<Value *> RedOps) {
+  unsigned VF = Src->getType()->getVectorNumElements();
+
+  // Extract and apply reduction ops in ascending order:
+  // e.g. ((((Acc + Scl[0]) + Scl[1]) + Scl[2]) + ) ... + Scl[VF-1]
+  Value *Result = Acc;
+  for (unsigned ExtractIdx = 0; ExtractIdx != VF; ++ExtractIdx) {
+    Value *Ext =
+        Builder.CreateExtractElement(Src, Builder.getInt32(ExtractIdx));
+
+    if (Op != Instruction::ICmp && Op != Instruction::FCmp) {
+      Result = Builder.CreateBinOp((Instruction::BinaryOps)Op, Result, Ext,
+                                   "bin.rdx");
+    } else {
+      assert(MinMaxKind != RecurrenceDescriptor::MRK_Invalid &&
+             "Invalid min/max");
+      Result = RecurrenceDescriptor::createMinMaxOp(Builder, MinMaxKind, Result,
+                                                    Ext);
+    }
+
+    if (!RedOps.empty())
+      propagateIRFlags(Result, RedOps);
+  }
+
+  return Result;
+}
+
 // Helper to generate a log2 shuffle reduction.
 Value *
 llvm::getShuffleReduction(IRBuilder<> &Builder, Value *Src, unsigned Op,
commit	23c2182c2bfcd145b2c33cf5ca831a7348e6adce	[log] [tgz]
author	Simon Pilgrim <llvm-dev@redking.me.uk>	Mon Apr 09 15:44:20 2018 +0000
committer	Simon Pilgrim <llvm-dev@redking.me.uk>	Mon Apr 09 15:44:20 2018 +0000
tree	539213fa47e89fc0f31e62c647aceda93c205cb5
parent	bec8a66454882285db4c98311ba430adec2c8dac [diff] [blame]