AMDGPU: Fix unnecessary ands when packing f16 vectors computeKnownBits didn't handle fp_to_fp16 to report the high bits as 0. ARM maps the generic node to an instruction that does not modify the high bits of the register, so introduce a target node where the high bits are known 0. llvm-svn: 297873

commit: 86e02ce2dcb01b8383d2be39004e65014485d303 [log] [tgz]
author: Matt Arsenault <Matthew.Arsenault@amd.com> Wed Mar 15 19:04:26 2017 +0000
committer: Matt Arsenault <Matthew.Arsenault@amd.com> Wed Mar 15 19:04:26 2017 +0000
tree: d46119f8d4986e8337a6fed841f9ad7263029597
parent: 4069c2bc483b31ba78075a42d939d97d9256e2fb [diff] [blame]
diff --git a/llvm/test/CodeGen/AMDGPU/llvm.floor.f16.ll b/llvm/test/CodeGen/AMDGPU/llvm.floor.f16.ll
index 60dfd73..3a5f86d 100644
--- a/llvm/test/CodeGen/AMDGPU/llvm.floor.f16.ll
+++ b/llvm/test/CodeGen/AMDGPU/llvm.floor.f16.ll

@@ -33,9 +33,8 @@
 ; SI:  v_cvt_f16_f32_e32 v[[R_F16_1:[0-9]+]], v[[R_F32_1]]
 ; VI:  v_floor_f16_e32 v[[R_F16_0:[0-9]+]], v[[A_V2_F16]]
 ; VI:  v_floor_f16_e32 v[[R_F16_1:[0-9]+]], v[[A_F16_1]]
-; GCN: v_and_b32_e32 v[[R_F16_LO:[0-9]+]], 0xffff, v[[R_F16_0]]
 ; GCN: v_lshlrev_b32_e32 v[[R_F16_HI:[0-9]+]], 16, v[[R_F16_1]]
-; GCN: v_or_b32_e32 v[[R_V2_F16:[0-9]+]], v[[R_F16_HI]], v[[R_F16_LO]]
+; GCN: v_or_b32_e32 v[[R_V2_F16:[0-9]+]], v[[R_F16_HI]], v[[R_F16_0]]
 ; GCN: buffer_store_dword v[[R_V2_F16]]
 ; GCN: s_endpgm
 define void @floor_v2f16(
commit	86e02ce2dcb01b8383d2be39004e65014485d303	[log] [tgz]
author	Matt Arsenault <Matthew.Arsenault@amd.com>	Wed Mar 15 19:04:26 2017 +0000
committer	Matt Arsenault <Matthew.Arsenault@amd.com>	Wed Mar 15 19:04:26 2017 +0000
tree	d46119f8d4986e8337a6fed841f9ad7263029597
parent	4069c2bc483b31ba78075a42d939d97d9256e2fb [diff] [blame]