[X86] Use SHLD with both inputs from the same register to implement rotate on Sandy Bridge and later Intel CPUs Summary: Sandy Bridge and later CPUs have better throughput using a SHLD to implement rotate versus the normal rotate instructions. Additionally it saves one uop and avoids a partial flag update dependency. This patch implements this change on any Sandy Bridge or later processor without BMI2 instructions. With BMI2 we will use RORX as we currently do. Reviewers: zvi Reviewed By: zvi Subscribers: llvm-commits Differential Revision: https://reviews.llvm.org/D30181 llvm-svn: 295697

commit: d88389aa7ec50d944c2002392db6b135a54a95c1 [log] [tgz]
author: Craig Topper <craig.topper@gmail.com> Tue Feb 21 06:39:13 2017 +0000
committer: Craig Topper <craig.topper@gmail.com> Tue Feb 21 06:39:13 2017 +0000
tree: 825093c767514d8897c30e2e0f92edde999c2c9e
parent: b4f9625a7bd5601534952b478040e6836e37eb47 [diff] [blame]
diff --git a/llvm/lib/Target/X86/X86Subtarget.cpp b/llvm/lib/Target/X86/X86Subtarget.cpp
index dfe22fa..336db66 100644
--- a/llvm/lib/Target/X86/X86Subtarget.cpp
+++ b/llvm/lib/Target/X86/X86Subtarget.cpp

@@ -302,6 +302,7 @@
   HasFastScalarFSQRT = false;
   HasFastVectorFSQRT = false;
   HasFastLZCNT = false;
+  HasFastSHLDRotate = false;
   HasSlowDivide32 = false;
   HasSlowDivide64 = false;
   PadShortFunctions = false;
commit	d88389aa7ec50d944c2002392db6b135a54a95c1	[log] [tgz]
author	Craig Topper <craig.topper@gmail.com>	Tue Feb 21 06:39:13 2017 +0000
committer	Craig Topper <craig.topper@gmail.com>	Tue Feb 21 06:39:13 2017 +0000
tree	825093c767514d8897c30e2e0f92edde999c2c9e
parent	b4f9625a7bd5601534952b478040e6836e37eb47 [diff] [blame]