AMDGPU: Generalize matching of v_med3_f32 I think this is safe as long as no inputs are known to ever be nans. Also add an intrinsic for fmed3 to be able to handle all safe math cases. llvm-svn: 293598

commit: f84e5d9a2788d04b3f64e13fdb38c4172017a9c1 [log] [tgz]
author: Matt Arsenault <Matthew.Arsenault@amd.com> Tue Jan 31 03:07:46 2017 +0000
committer: Matt Arsenault <Matthew.Arsenault@amd.com> Tue Jan 31 03:07:46 2017 +0000
tree: bf4c117dcf7fdc1c9aa00bceaaf14e046594d29e
parent: bc332648e8e3ce090c4ace3240809c349673d1a3 [diff] [blame]
diff --git a/llvm/lib/Target/AMDGPU/SIInstructions.td b/llvm/lib/Target/AMDGPU/SIInstructions.td
index 06516b2..2a4b095 100644
--- a/llvm/lib/Target/AMDGPU/SIInstructions.td
+++ b/llvm/lib/Target/AMDGPU/SIInstructions.td

@@ -1125,6 +1125,20 @@
 def : IntMed3Pat<V_MED3_I32, smax, smax_oneuse, smin_oneuse>;
 def : IntMed3Pat<V_MED3_U32, umax, umax_oneuse, umin_oneuse>;
 
+// This matches 16 permutations of
+// max(min(x, y), min(max(x, y), z))
+class FPMed3Pat<ValueType vt,
+                Instruction med3Inst> : Pat<
+  (fmaxnum (fminnum_oneuse (VOP3Mods_nnan vt:$src0, i32:$src0_mods),
+                           (VOP3Mods_nnan vt:$src1, i32:$src1_mods)),
+           (fminnum_oneuse (fmaxnum_oneuse (VOP3Mods_nnan vt:$src0, i32:$src0_mods),
+                                           (VOP3Mods_nnan vt:$src1, i32:$src1_mods)),
+                           (vt (VOP3Mods_nnan vt:$src2, i32:$src2_mods)))),
+  (med3Inst $src0_mods, $src0, $src1_mods, $src1, $src2_mods, $src2, DSTCLAMP.NONE, DSTOMOD.NONE)
+>;
+
+def : FPMed3Pat<f32, V_MED3_F32>;
+
 
 // Undo sub x, c -> add x, -c canonicalization since c is more likely
 // an inline immediate than -c.
commit	f84e5d9a2788d04b3f64e13fdb38c4172017a9c1	[log] [tgz]
author	Matt Arsenault <Matthew.Arsenault@amd.com>	Tue Jan 31 03:07:46 2017 +0000
committer	Matt Arsenault <Matthew.Arsenault@amd.com>	Tue Jan 31 03:07:46 2017 +0000
tree	bf4c117dcf7fdc1c9aa00bceaaf14e046594d29e
parent	bc332648e8e3ce090c4ace3240809c349673d1a3 [diff] [blame]