AMDGPU: Improve extract_vector_elt reduction combine Handle fmul, fsub and preserve flags. Also really test minnum/maxnum reductions. The existing tests were only checking from minnum/maxnum matched from a fast math compare and select which is not the same. llvm-svn: 339820

commit: a8160737648a51d1de12fcf670591af05d1a1954 [log] [tgz]
author: Matt Arsenault <Matthew.Arsenault@amd.com> Wed Aug 15 21:34:06 2018 +0000
committer: Matt Arsenault <Matthew.Arsenault@amd.com> Wed Aug 15 21:34:06 2018 +0000
tree: e1b6930b2dd72749edd0f363a371024f2a8e6b5a
parent: b3a80e5397d46a50c2ba61b4820a577c17f0198a [diff] [blame]
diff --git a/llvm/lib/Target/AMDGPU/SIISelLowering.cpp b/llvm/lib/Target/AMDGPU/SIISelLowering.cpp
index 4e15fdb..0ae1514 100644
--- a/llvm/lib/Target/AMDGPU/SIISelLowering.cpp
+++ b/llvm/lib/Target/AMDGPU/SIISelLowering.cpp

@@ -7349,18 +7349,24 @@
       return SDValue();
       // TODO: Support other binary operations.
     case ISD::FADD:
+    case ISD::FSUB:
+    case ISD::FMUL:
     case ISD::ADD:
     case ISD::UMIN:
     case ISD::UMAX:
     case ISD::SMIN:
     case ISD::SMAX:
     case ISD::FMAXNUM:
-    case ISD::FMINNUM:
-      return DAG.getNode(Opc, SL, EltVT,
-                         DAG.getNode(ISD::EXTRACT_VECTOR_ELT, SL, EltVT,
-                                     Vec.getOperand(0), Idx),
-                         DAG.getNode(ISD::EXTRACT_VECTOR_ELT, SL, EltVT,
-                                     Vec.getOperand(1), Idx));
+    case ISD::FMINNUM: {
+      SDValue Elt0 = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, SL, EltVT,
+                                 Vec.getOperand(0), Idx);
+      SDValue Elt1 = DAG.getNode(ISD::EXTRACT_VECTOR_ELT, SL, EltVT,
+                                 Vec.getOperand(1), Idx);
+
+      DCI.AddToWorklist(Elt0.getNode());
+      DCI.AddToWorklist(Elt1.getNode());
+      return DAG.getNode(Opc, SL, EltVT, Elt0, Elt1, Vec->getFlags());
+    }
     }
   }
commit	a8160737648a51d1de12fcf670591af05d1a1954	[log] [tgz]
author	Matt Arsenault <Matthew.Arsenault@amd.com>	Wed Aug 15 21:34:06 2018 +0000
committer	Matt Arsenault <Matthew.Arsenault@amd.com>	Wed Aug 15 21:34:06 2018 +0000
tree	e1b6930b2dd72749edd0f363a371024f2a8e6b5a
parent	b3a80e5397d46a50c2ba61b4820a577c17f0198a [diff] [blame]