AMDGPU: Decompose all values to 32-bit pieces for calling conventions This is the more natural lowering, and presents more opportunities to reduce 64-bit ops to 32-bit. This should also help avoid issues graphics shaders have had with 64-bit values, and simplify argument lowering in globalisel. llvm-svn: 366578

commit: 1022c0dfde51a32c31cb912ccf8256e60debebfd [log] [tgz]
author: Matt Arsenault <Matthew.Arsenault@amd.com> Fri Jul 19 13:57:44 2019 +0000
committer: Matt Arsenault <Matthew.Arsenault@amd.com> Fri Jul 19 13:57:44 2019 +0000
tree: 2b9ac120eff33333517f204fd68c9b81f7e66398
parent: 8bb8915d43fe687237f31014f34fc6f2f79fb5ff [diff] [blame]
diff --git a/llvm/test/CodeGen/AMDGPU/reduce-build-vec-ext-to-ext-build-vec.ll b/llvm/test/CodeGen/AMDGPU/reduce-build-vec-ext-to-ext-build-vec.ll
index 79b817a..02eb400 100644
--- a/llvm/test/CodeGen/AMDGPU/reduce-build-vec-ext-to-ext-build-vec.ll
+++ b/llvm/test/CodeGen/AMDGPU/reduce-build-vec-ext-to-ext-build-vec.ll

@@ -8,9 +8,9 @@
 
 ; GCN-LABEL: {{^}}v2i16_to_i64:
 ; GFX9: s_waitcnt
-; GFX9-NEXT: v_pk_add_u16 v0, v0, v1
-; GFX9-NEXT: v_lshrrev_b32_e32 v1, 16, v0
-; GFX9-NEXT: v_and_b32_e32 v0, 0xffff, v0
+; GFX9-NEXT: v_pk_add_u16 v1, v0, v1
+; GFX9-NEXT: v_and_b32_e32 v0, 0xffff, v1
+; GFX9-NEXT: v_lshrrev_b32_e32 v1, 16, v1
 ; GFX9-NEXT: s_setpc_b64
 define i64 @v2i16_to_i64(<2 x i16> %x, <2 x i16> %y) {
   %x.add = add <2 x i16> %x, %y
commit	1022c0dfde51a32c31cb912ccf8256e60debebfd	[log] [tgz]
author	Matt Arsenault <Matthew.Arsenault@amd.com>	Fri Jul 19 13:57:44 2019 +0000
committer	Matt Arsenault <Matthew.Arsenault@amd.com>	Fri Jul 19 13:57:44 2019 +0000
tree	2b9ac120eff33333517f204fd68c9b81f7e66398
parent	8bb8915d43fe687237f31014f34fc6f2f79fb5ff [diff] [blame]