[X86][AVX1] Account for cost of extract/insert of 256-bit shifts by splat llvm-svn: 303021

commit: de4467b182e37392d028dfd469883ef5f0b275fb [log] [tgz]
author: Simon Pilgrim <llvm-dev@redking.me.uk> Sun May 14 20:02:34 2017 +0000
committer: Simon Pilgrim <llvm-dev@redking.me.uk> Sun May 14 20:02:34 2017 +0000
tree: 1aa9b9434259beee31714c51e34c0a6db08037b9
parent: c27dc9f797d6a351d9e94e745dcf8b728ae9070b [diff] [blame]
diff --git a/llvm/lib/Target/X86/X86TargetTransformInfo.cpp b/llvm/lib/Target/X86/X86TargetTransformInfo.cpp
index fc9fcfc..4ea66d2 100644
--- a/llvm/lib/Target/X86/X86TargetTransformInfo.cpp
+++ b/llvm/lib/Target/X86/X86TargetTransformInfo.cpp

@@ -454,18 +454,18 @@
 
   static const CostTblEntry SSE2UniformShiftCostTable[] = {
     // Uniform splats are cheaper for the following instructions.
-    { ISD::SHL,  MVT::v16i16, 2 }, // psllw.
-    { ISD::SHL,  MVT::v8i32,  2 }, // pslld
-    { ISD::SHL,  MVT::v4i64,  2 }, // psllq.
+    { ISD::SHL,  MVT::v16i16, 2+2 }, // 2*psllw + split.
+    { ISD::SHL,  MVT::v8i32,  2+2 }, // 2*pslld + split.
+    { ISD::SHL,  MVT::v4i64,  2+2 }, // 2*psllq + split.
 
-    { ISD::SRL,  MVT::v16i16, 2 }, // psrlw.
-    { ISD::SRL,  MVT::v8i32,  2 }, // psrld.
-    { ISD::SRL,  MVT::v4i64,  2 }, // psrlq.
+    { ISD::SRL,  MVT::v16i16, 2+2 }, // 2*psrlw + split.
+    { ISD::SRL,  MVT::v8i32,  2+2 }, // 2*psrld + split.
+    { ISD::SRL,  MVT::v4i64,  2+2 }, // 2*psrlq + split.
 
-    { ISD::SRA,  MVT::v16i16, 2 }, // psraw.
-    { ISD::SRA,  MVT::v8i32,  2 }, // psrad.
-    { ISD::SRA,  MVT::v2i64,  4 }, // 2 x psrad + shuffle.
-    { ISD::SRA,  MVT::v4i64,  8 }, // 2 x psrad + shuffle.
+    { ISD::SRA,  MVT::v16i16, 2+2 }, // 2*psraw + split.
+    { ISD::SRA,  MVT::v8i32,  2+2 }, // 2*psrad + split.
+    { ISD::SRA,  MVT::v2i64,    4 }, // 2*psrad + shuffle.
+    { ISD::SRA,  MVT::v4i64,  8+2 }, // 2*(2*psrad + shuffle) + split.
   };
 
   if (ST->hasSSE2() &&
commit	de4467b182e37392d028dfd469883ef5f0b275fb	[log] [tgz]
author	Simon Pilgrim <llvm-dev@redking.me.uk>	Sun May 14 20:02:34 2017 +0000
committer	Simon Pilgrim <llvm-dev@redking.me.uk>	Sun May 14 20:02:34 2017 +0000
tree	1aa9b9434259beee31714c51e34c0a6db08037b9
parent	c27dc9f797d6a351d9e94e745dcf8b728ae9070b [diff] [blame]