[X86][SSE] Increase PMULLD costs to better match hardware Until Skylake, most hardware could only issue a PMULLD op every other cycle llvm-svn: 324823

commit: cb9a02f60e27c834348fd56001ab525235b6edb8 [log] [tgz]
author: Simon Pilgrim <llvm-dev@redking.me.uk> Sat Feb 10 19:27:10 2018 +0000
committer: Simon Pilgrim <llvm-dev@redking.me.uk> Sat Feb 10 19:27:10 2018 +0000
tree: 8f5279b59aaf93a8ada48f1281b11f4c1ce90b39
parent: 9121eb575e321a514fcdfde028d3c05f3735d658 [diff] [blame]
diff --git a/llvm/lib/Target/X86/X86TargetTransformInfo.cpp b/llvm/lib/Target/X86/X86TargetTransformInfo.cpp
index adda349..6a90bc0 100644
--- a/llvm/lib/Target/X86/X86TargetTransformInfo.cpp
+++ b/llvm/lib/Target/X86/X86TargetTransformInfo.cpp

@@ -433,7 +433,9 @@
 
     { ISD::MUL,     MVT::v32i8,     13 }, // extend/pmullw/trunc sequence.
     { ISD::MUL,     MVT::v16i8,      5 }, // extend/pmullw/trunc sequence.
-    { ISD::MUL,     MVT::v16i32,     1 }, // pmulld
+    { ISD::MUL,     MVT::v16i32,     1 }, // pmulld (Skylake from agner.org)
+    { ISD::MUL,     MVT::v8i32,      1 }, // pmulld (Skylake from agner.org)
+    { ISD::MUL,     MVT::v4i32,      1 }, // pmulld (Skylake from agner.org)
     { ISD::MUL,     MVT::v8i64,      8 }, // 3*pmuludq/3*shift/2*add
 
     // Vectorizing division is a bad idea. See the SSE2 table for more comments.
@@ -572,7 +574,7 @@
     { ISD::MUL,  MVT::v32i8,     17 }, // extend/pmullw/trunc sequence.
     { ISD::MUL,  MVT::v16i8,      7 }, // extend/pmullw/trunc sequence.
     { ISD::MUL,  MVT::v16i16,     1 }, // pmullw
-    { ISD::MUL,  MVT::v8i32,      1 }, // pmulld
+    { ISD::MUL,  MVT::v8i32,      2 }, // pmulld (Haswell from agner.org)
     { ISD::MUL,  MVT::v4i64,      8 }, // 3*pmuludq/3*shift/2*add
 
     { ISD::FDIV, MVT::f32,        7 }, // Haswell from http://www.agner.org/
@@ -667,7 +669,7 @@
     { ISD::SRA,  MVT::v4i32,      12 }, // Shift each lane + blend.
     { ISD::SRA,  MVT::v8i32,  2*12+2 }, // Shift each lane + blend + split.
 
-    { ISD::MUL,  MVT::v4i32,       1 }  // pmulld
+    { ISD::MUL,  MVT::v4i32,       2 }  // pmulld (Nehalem from agner.org)
   };
 
   if (ST->hasSSE41())
commit	cb9a02f60e27c834348fd56001ab525235b6edb8	[log] [tgz]
author	Simon Pilgrim <llvm-dev@redking.me.uk>	Sat Feb 10 19:27:10 2018 +0000
committer	Simon Pilgrim <llvm-dev@redking.me.uk>	Sat Feb 10 19:27:10 2018 +0000
tree	8f5279b59aaf93a8ada48f1281b11f4c1ce90b39
parent	9121eb575e321a514fcdfde028d3c05f3735d658 [diff] [blame]