AMDGPU: Allow f32 types for llvm.amdgcn.s.buffer.load llvm-svn: 348625

commit: ce2e053134ba5d2e890a37886228fd9f6528d2c6 [log] [tgz]
author: Matt Arsenault <Matthew.Arsenault@amd.com> Fri Dec 07 18:41:39 2018 +0000
committer: Matt Arsenault <Matthew.Arsenault@amd.com> Fri Dec 07 18:41:39 2018 +0000
tree: f6f735860419ac84719f98ad82d603b1756c8d23
parent: 99c139f4dc817ca0904cd1a26989fdc38ffdf832 [diff] [blame]
diff --git a/llvm/lib/Target/AMDGPU/SIISelLowering.cpp b/llvm/lib/Target/AMDGPU/SIISelLowering.cpp
index a98183b..ff63c1f 100644
--- a/llvm/lib/Target/AMDGPU/SIISelLowering.cpp
+++ b/llvm/lib/Target/AMDGPU/SIISelLowering.cpp

@@ -4873,12 +4873,13 @@
   SmallVector<SDValue, 4> Loads;
   unsigned NumLoads = 1;
   MVT LoadVT = VT.getSimpleVT();
+  MVT EltVT = LoadVT.isVector() ? LoadVT.getVectorElementType() : LoadVT;
+  unsigned NumElts = LoadVT.isVector() ? LoadVT.getVectorNumElements() : 1;
+  assert((EltVT == MVT::i32 || EltVT == MVT::f32) &&
+         isPowerOf2_32(NumElts));
 
-  assert(LoadVT == MVT::i32 || LoadVT == MVT::v2i32 || LoadVT == MVT::v4i32 ||
-         LoadVT == MVT::v8i32 || LoadVT == MVT::v16i32);
-
-  if (VT == MVT::v8i32 || VT == MVT::v16i32) {
-    NumLoads = VT == MVT::v16i32 ? 4 : 2;
+  if (NumElts == 8 || NumElts == 16) {
+    NumLoads = NumElts == 16 ? 4 : 2;
     LoadVT = MVT::v4i32;
   }
commit	ce2e053134ba5d2e890a37886228fd9f6528d2c6	[log] [tgz]
author	Matt Arsenault <Matthew.Arsenault@amd.com>	Fri Dec 07 18:41:39 2018 +0000
committer	Matt Arsenault <Matthew.Arsenault@amd.com>	Fri Dec 07 18:41:39 2018 +0000
tree	f6f735860419ac84719f98ad82d603b1756c8d23
parent	99c139f4dc817ca0904cd1a26989fdc38ffdf832 [diff] [blame]