AMDGPU: Split LDS vector loads If properly aligned this could allow using ds_read_b64. llvm-svn: 253975

commit: ff05da806c1f8986b434c38369c7712d0acff1cb [log] [tgz]
author: Matt Arsenault <Matthew.Arsenault@amd.com> Tue Nov 24 12:18:54 2015 +0000
committer: Matt Arsenault <Matthew.Arsenault@amd.com> Tue Nov 24 12:18:54 2015 +0000
tree: f7d9c7efd0e551dfd1a6cd2dde4695a8ff8cd011
parent: 4d801cd357c74bb7c2a60fedf4030b9fb5b4827f [diff] [blame]
diff --git a/llvm/test/CodeGen/AMDGPU/merge-stores.ll b/llvm/test/CodeGen/AMDGPU/merge-stores.ll
index 73b0925..fec27e7 100644
--- a/llvm/test/CodeGen/AMDGPU/merge-stores.ll
+++ b/llvm/test/CodeGen/AMDGPU/merge-stores.ll

@@ -539,10 +539,15 @@
 }
 
 ; GCN-LABEL: {{^}}merge_local_store_4_constants_i32:
-; GCN: ds_write_b32
-; GCN: ds_write_b32
-; GCN: ds_write_b32
-; GCN: ds_write_b32
+; GCN-DAG: v_mov_b32_e32 [[K2:v[0-9]+]], 0x1c8
+; GCN-DAG: v_mov_b32_e32 [[K3:v[0-9]+]], 0x14d
+; GCN-DAG: ds_write2_b32 v{{[0-9]+}}, [[K2]], [[K3]] offset0:2 offset1:3
+
+; GCN-DAG: v_mov_b32_e32 [[K0:v[0-9]+]], 0x4d2
+; GCN-DAG: v_mov_b32_e32 [[K1:v[0-9]+]], 0x7b
+; GCN-DAG: ds_write2_b32 v{{[0-9]+}}, [[K0]], [[K1]] offset1:1
+
+; GCN: s_endpgm
 define void @merge_local_store_4_constants_i32(i32 addrspace(3)* %out) #0 {
   %out.gep.1 = getelementptr i32, i32 addrspace(3)* %out, i32 1
   %out.gep.2 = getelementptr i32, i32 addrspace(3)* %out, i32 2
commit	ff05da806c1f8986b434c38369c7712d0acff1cb	[log] [tgz]
author	Matt Arsenault <Matthew.Arsenault@amd.com>	Tue Nov 24 12:18:54 2015 +0000
committer	Matt Arsenault <Matthew.Arsenault@amd.com>	Tue Nov 24 12:18:54 2015 +0000
tree	f7d9c7efd0e551dfd1a6cd2dde4695a8ff8cd011
parent	4d801cd357c74bb7c2a60fedf4030b9fb5b4827f [diff] [blame]