[X86] Enable interleaved memory access by default This lets the loop vectorizer generate interleaved memory accesses on x86. Differential Revision: https://reviews.llvm.org/D25350 llvm-svn: 284779

commit: b2443ed62bcf393693eedb9e789e4198f4e460cd [log] [tgz]
author: Michael Kuperstein <mkuper@google.com> Thu Oct 20 21:04:31 2016 +0000
committer: Michael Kuperstein <mkuper@google.com> Thu Oct 20 21:04:31 2016 +0000
tree: 19fa5386500e9b6a671e8c605e7dd621d736428d
parent: 2b81f42a76a58a23c358f6d72b65385c0073f94f [diff]
diff --git a/llvm/lib/Target/X86/X86TargetTransformInfo.cpp b/llvm/lib/Target/X86/X86TargetTransformInfo.cpp
index e142208..7f6dc2b 100644
--- a/llvm/lib/Target/X86/X86TargetTransformInfo.cpp
+++ b/llvm/lib/Target/X86/X86TargetTransformInfo.cpp

@@ -1767,3 +1767,10 @@
   // correct.
   return (CallerBits & CalleeBits) == CalleeBits;
 }
+
+bool X86TTIImpl::enableInterleavedAccessVectorization() {
+  // TODO: We expect this to be beneficial regardless of arch,
+  // but there are currently some unexplained performance artifacts on Atom.
+  // As a temporary solution, disable on Atom.
+  return !(ST->isAtom() || ST->isSLM());
+}

diff --git a/llvm/lib/Target/X86/X86TargetTransformInfo.h b/llvm/lib/Target/X86/X86TargetTransformInfo.h
index 1985e42..4c25663 100644
--- a/llvm/lib/Target/X86/X86TargetTransformInfo.h
+++ b/llvm/lib/Target/X86/X86TargetTransformInfo.h

@@ -93,6 +93,8 @@
   bool isLegalMaskedScatter(Type *DataType);
   bool areInlineCompatible(const Function *Caller,
                            const Function *Callee) const;
+
+  bool enableInterleavedAccessVectorization();
 private:
   int getGSScalarCost(unsigned Opcode, Type *DataTy, bool VariableMask,
                       unsigned Alignment, unsigned AddressSpace);
commit	b2443ed62bcf393693eedb9e789e4198f4e460cd	[log] [tgz]
author	Michael Kuperstein <mkuper@google.com>	Thu Oct 20 21:04:31 2016 +0000
committer	Michael Kuperstein <mkuper@google.com>	Thu Oct 20 21:04:31 2016 +0000
tree	19fa5386500e9b6a671e8c605e7dd621d736428d
parent	2b81f42a76a58a23c358f6d72b65385c0073f94f [diff]