Blame - lib/Target/PowerPC/PPCInstrAltivec.td - fp2-dev/platform/external/llvm

blob: 4e34d4ef6a8ec07fba5e225e0908934e0420c85a [file] [log] [blame]

Chris Lattner	b22a04d	2006-03-25 07:51:43 +0000	[diff] [blame^]	1	//===- PPCInstrAltivec.td - The PowerPC Altivec Extension --- tablegen --===//
				2	//
				3	// The LLVM Compiler Infrastructure
				4	//
				5	// This file was developed by Chris Lattner and is distributed under
				6	// the University of Illinois Open Source License. See LICENSE.TXT for details.
				7	//
				8	//===----------------------------------------------------------------------===//
				9	//
				10	// This file describes the Altivec extension to the PowerPC instruction set.
				11	//
				12	//===----------------------------------------------------------------------===//
				13
				14	//===----------------------------------------------------------------------===//
				15	// Altivec transformation functions and pattern fragments.
				16	//
				17
				18	// VSPLT_get_imm xform function: convert vector_shuffle mask to VSPLT* imm.
				19	def VSPLT_get_imm : SDNodeXForm<build_vector, [{
				20	return getI32Imm(PPC::getVSPLTImmediate(N));
				21	}]>;
				22
				23	def VSPLT_shuffle_mask : PatLeaf<(build_vector), [{
				24	return PPC::isSplatShuffleMask(N);
				25	}], VSPLT_get_imm>;
				26
				27	def vecimm0 : PatLeaf<(build_vector), [{
				28	return PPC::isZeroVector(N);
				29	}]>;
				30
				31
				32	// VSPLTISB_get_imm xform function: convert build_vector to VSPLTISB imm.
				33	def VSPLTISB_get_imm : SDNodeXForm<build_vector, [{
				34	char Val;
				35	PPC::isVecSplatImm(N, 1, &Val);
				36	return getI32Imm(Val);
				37	}]>;
				38	def vecspltisb : PatLeaf<(build_vector), [{
				39	return PPC::isVecSplatImm(N, 1);
				40	}], VSPLTISB_get_imm>;
				41
				42	// VSPLTISH_get_imm xform function: convert build_vector to VSPLTISH imm.
				43	def VSPLTISH_get_imm : SDNodeXForm<build_vector, [{
				44	char Val;
				45	PPC::isVecSplatImm(N, 2, &Val);
				46	return getI32Imm(Val);
				47	}]>;
				48	def vecspltish : PatLeaf<(build_vector), [{
				49	return PPC::isVecSplatImm(N, 2);
				50	}], VSPLTISH_get_imm>;
				51
				52	// VSPLTISW_get_imm xform function: convert build_vector to VSPLTISW imm.
				53	def VSPLTISW_get_imm : SDNodeXForm<build_vector, [{
				54	char Val;
				55	PPC::isVecSplatImm(N, 4, &Val);
				56	return getI32Imm(Val);
				57	}]>;
				58	def vecspltisw : PatLeaf<(build_vector), [{
				59	return PPC::isVecSplatImm(N, 4);
				60	}], VSPLTISW_get_imm>;
				61
				62
				63
				64	//===----------------------------------------------------------------------===//
				65	// Instruction Definitions.
				66
				67	def IMPLICIT_DEF_VRRC : Pseudo<(ops VRRC:$rD), "; $rD = IMPLICIT_DEF_VRRC",
				68	[(set VRRC:$rD, (v4f32 (undef)))]>;
				69
				70	let isLoad = 1, PPC970_Unit = 2 in { // Loads.
				71	def LVEBX: XForm_1<31, 7, (ops VRRC:$vD, memrr:$src),
				72	"lvebx $vD, $src", LdStGeneral,
				73	[(set VRRC:$vD, (v16i8 (PPClve_x xoaddr:$src)))]>;
				74	def LVEHX: XForm_1<31, 39, (ops VRRC:$vD, memrr:$src),
				75	"lvehx $vD, $src", LdStGeneral,
				76	[(set VRRC:$vD, (v8i16 (PPClve_x xoaddr:$src)))]>;
				77	def LVEWX: XForm_1<31, 71, (ops VRRC:$vD, memrr:$src),
				78	"lvewx $vD, $src", LdStGeneral,
				79	[(set VRRC:$vD, (v4f32 (PPClve_x xoaddr:$src)))]>;
				80	def LVX : XForm_1<31, 103, (ops VRRC:$vD, memrr:$src),
				81	"lvx $vD, $src", LdStGeneral,
				82	[(set VRRC:$vD, (v4f32 (load xoaddr:$src)))]>;
				83	}
				84
				85	def LVSL : XForm_1<31, 6, (ops VRRC:$vD, GPRC:$base, GPRC:$rA),
				86	"lvsl $vD, $base, $rA", LdStGeneral,
				87	[]>, PPC970_Unit_LSU;
				88	def LVSR : XForm_1<31, 38, (ops VRRC:$vD, GPRC:$base, GPRC:$rA),
				89	"lvsl $vD, $base, $rA", LdStGeneral,
				90	[]>, PPC970_Unit_LSU;
				91
				92	let isStore = 1, noResults = 1, PPC970_Unit = 2 in { // Stores.
				93	def STVEBX: XForm_8<31, 135, (ops VRRC:$rS, GPRC:$rA, GPRC:$rB),
				94	"stvebx $rS, $rA, $rB", LdStGeneral,
				95	[]>;
				96	def STVEHX: XForm_8<31, 167, (ops VRRC:$rS, GPRC:$rA, GPRC:$rB),
				97	"stvehx $rS, $rA, $rB", LdStGeneral,
				98	[]>;
				99	def STVEWX: XForm_8<31, 199, (ops VRRC:$rS, GPRC:$rA, GPRC:$rB),
				100	"stvewx $rS, $rA, $rB", LdStGeneral,
				101	[]>;
				102	def STVX : XForm_8<31, 231, (ops VRRC:$rS, memrr:$dst),
				103	"stvx $rS, $dst", LdStGeneral,
				104	[(store (v4f32 VRRC:$rS), xoaddr:$dst)]>;
				105	}
				106
				107	let PPC970_Unit = 5 in { // VALU Operations.
				108	// VA-Form instructions. 3-input AltiVec ops.
				109	def VMADDFP : VAForm_1<46, (ops VRRC:$vD, VRRC:$vA, VRRC:$vC, VRRC:$vB),
				110	"vmaddfp $vD, $vA, $vC, $vB", VecFP,
				111	[(set VRRC:$vD, (fadd (fmul VRRC:$vA, VRRC:$vC),
				112	VRRC:$vB))]>,
				113	Requires<[FPContractions]>;
				114	def VNMSUBFP: VAForm_1<47, (ops VRRC:$vD, VRRC:$vA, VRRC:$vC, VRRC:$vB),
				115	"vnmsubfp $vD, $vA, $vC, $vB", VecFP,
				116	[(set VRRC:$vD, (fneg (fsub (fmul VRRC:$vA, VRRC:$vC),
				117	VRRC:$vB)))]>,
				118	Requires<[FPContractions]>;
				119
				120	def VPERM : VAForm_1<43, (ops VRRC:$vD, VRRC:$vA, VRRC:$vC, VRRC:$vB),
				121	"vperm $vD, $vA, $vB, $vC", VecPerm,
				122	[(set VRRC:$vD,
				123	(PPCvperm (v4f32 VRRC:$vA), VRRC:$vB, VRRC:$vC))]>;
				124
				125
				126	// VX-Form instructions. AltiVec arithmetic ops.
				127	def VADDFP : VXForm_1<10, (ops VRRC:$vD, VRRC:$vA, VRRC:$vB),
				128	"vaddfp $vD, $vA, $vB", VecFP,
				129	[(set VRRC:$vD, (fadd VRRC:$vA, VRRC:$vB))]>;
				130	def VADDUWM : VXForm_1<128, (ops VRRC:$vD, VRRC:$vA, VRRC:$vB),
				131	"vadduwm $vD, $vA, $vB", VecGeneral,
				132	[(set VRRC:$vD, (add (v4i32 VRRC:$vA), VRRC:$vB))]>;
				133	def VCFSX : VXForm_1<842, (ops VRRC:$vD, u5imm:$UIMM, VRRC:$vB),
				134	"vcfsx $vD, $vB, $UIMM", VecFP,
				135	[]>;
				136	def VCFUX : VXForm_1<778, (ops VRRC:$vD, u5imm:$UIMM, VRRC:$vB),
				137	"vcfux $vD, $vB, $UIMM", VecFP,
				138	[]>;
				139	def VCTSXS : VXForm_1<970, (ops VRRC:$vD, u5imm:$UIMM, VRRC:$vB),
				140	"vctsxs $vD, $vB, $UIMM", VecFP,
				141	[]>;
				142	def VCTUXS : VXForm_1<906, (ops VRRC:$vD, u5imm:$UIMM, VRRC:$vB),
				143	"vctuxs $vD, $vB, $UIMM", VecFP,
				144	[]>;
				145	def VEXPTEFP : VXForm_2<394, (ops VRRC:$vD, VRRC:$vB),
				146	"vexptefp $vD, $vB", VecFP,
				147	[]>;
				148	def VLOGEFP : VXForm_2<458, (ops VRRC:$vD, VRRC:$vB),
				149	"vlogefp $vD, $vB", VecFP,
				150	[]>;
				151	def VMAXFP : VXForm_1<1034, (ops VRRC:$vD, VRRC:$vA, VRRC:$vB),
				152	"vmaxfp $vD, $vA, $vB", VecFP,
				153	[]>;
				154	def VMINFP : VXForm_1<1098, (ops VRRC:$vD, VRRC:$vA, VRRC:$vB),
				155	"vminfp $vD, $vA, $vB", VecFP,
				156	[]>;
				157	def VREFP : VXForm_2<266, (ops VRRC:$vD, VRRC:$vB),
				158	"vrefp $vD, $vB", VecFP,
				159	[]>;
				160	def VRFIM : VXForm_2<714, (ops VRRC:$vD, VRRC:$vB),
				161	"vrfim $vD, $vB", VecFP,
				162	[]>;
				163	def VRFIN : VXForm_2<522, (ops VRRC:$vD, VRRC:$vB),
				164	"vrfin $vD, $vB", VecFP,
				165	[]>;
				166	def VRFIP : VXForm_2<650, (ops VRRC:$vD, VRRC:$vB),
				167	"vrfip $vD, $vB", VecFP,
				168	[]>;
				169	def VRFIZ : VXForm_2<586, (ops VRRC:$vD, VRRC:$vB),
				170	"vrfiz $vD, $vB", VecFP,
				171	[]>;
				172	def VRSQRTEFP : VXForm_2<330, (ops VRRC:$vD, VRRC:$vB),
				173	"vrsqrtefp $vD, $vB", VecFP,
				174	[]>;
				175	def VSUBFP : VXForm_1<74, (ops VRRC:$vD, VRRC:$vA, VRRC:$vB),
				176	"vsubfp $vD, $vA, $vB", VecFP,
				177	[(set VRRC:$vD, (fsub VRRC:$vA, VRRC:$vB))]>;
				178	def VOR : VXForm_1<1156, (ops VRRC:$vD, VRRC:$vA, VRRC:$vB),
				179	"vor $vD, $vA, $vB", VecFP,
				180	[]>;
				181	def VXOR : VXForm_1<1220, (ops VRRC:$vD, VRRC:$vA, VRRC:$vB),
				182	"vxor $vD, $vA, $vB", VecFP,
				183	[]>;
				184
				185	def VSPLTB : VXForm_1<524, (ops VRRC:$vD, u5imm:$UIMM, VRRC:$vB),
				186	"vspltb $vD, $vB, $UIMM", VecPerm,
				187	[]>;
				188	def VSPLTH : VXForm_1<588, (ops VRRC:$vD, u5imm:$UIMM, VRRC:$vB),
				189	"vsplth $vD, $vB, $UIMM", VecPerm,
				190	[]>;
				191	def VSPLTW : VXForm_1<652, (ops VRRC:$vD, u5imm:$UIMM, VRRC:$vB),
				192	"vspltw $vD, $vB, $UIMM", VecPerm,
				193	[(set VRRC:$vD, (vector_shuffle (v4f32 VRRC:$vB), (undef),
				194	VSPLT_shuffle_mask:$UIMM))]>;
				195
				196	def VSPLTISB : VXForm_1<780, (ops VRRC:$vD, s5imm:$SIMM),
				197	"vspltisb $vD, $SIMM", VecPerm,
				198	[(set VRRC:$vD, (v4f32 vecspltisb:$SIMM))]>;
				199	def VSPLTISH : VXForm_1<844, (ops VRRC:$vD, s5imm:$SIMM),
				200	"vspltish $vD, $SIMM", VecPerm,
				201	[(set VRRC:$vD, (v4f32 vecspltish:$SIMM))]>;
				202	def VSPLTISW : VXForm_1<908, (ops VRRC:$vD, s5imm:$SIMM),
				203	"vspltisw $vD, $SIMM", VecPerm,
				204	[(set VRRC:$vD, (v4f32 vecspltisw:$SIMM))]>;
				205
				206
				207	// VX-Form Pseudo Instructions
				208
				209	def V_SET0 : VXForm_setzero<1220, (ops VRRC:$vD),
				210	"vxor $vD, $vD, $vD", VecFP,
				211	[(set VRRC:$vD, (v4f32 vecimm0))]>;
				212	}
				213
				214	//===----------------------------------------------------------------------===//
				215	// Additional Altivec Patterns
				216	//
				217
				218	// Undef/Zero.
				219	def : Pat<(v16i8 (undef)), (v16i8 (IMPLICIT_DEF_VRRC))>;
				220	def : Pat<(v8i16 (undef)), (v8i16 (IMPLICIT_DEF_VRRC))>;
				221	def : Pat<(v4i32 (undef)), (v4i32 (IMPLICIT_DEF_VRRC))>;
				222	def : Pat<(v16i8 vecimm0), (v16i8 (V_SET0))>;
				223	def : Pat<(v8i16 vecimm0), (v8i16 (V_SET0))>;
				224	def : Pat<(v4i32 vecimm0), (v4i32 (V_SET0))>;
				225
				226	// Loads.
				227	def : Pat<(v16i8 (load xoaddr:$src)), (v16i8 (LVX xoaddr:$src))>;
				228	def : Pat<(v8i16 (load xoaddr:$src)), (v8i16 (LVX xoaddr:$src))>;
				229	def : Pat<(v4i32 (load xoaddr:$src)), (v4i32 (LVX xoaddr:$src))>;
				230
				231	// Stores.
				232	def : Pat<(store (v16i8 VRRC:$rS), xoaddr:$dst),
				233	(STVX (v16i8 VRRC:$rS), xoaddr:$dst)>;
				234	def : Pat<(store (v8i16 VRRC:$rS), xoaddr:$dst),
				235	(STVX (v8i16 VRRC:$rS), xoaddr:$dst)>;
				236	def : Pat<(store (v4i32 VRRC:$rS), xoaddr:$dst),
				237	(STVX (v4i32 VRRC:$rS), xoaddr:$dst)>;
				238
				239	// Bit conversions.
				240	def : Pat<(v16i8 (bitconvert (v8i16 VRRC:$src))), (v16i8 VRRC:$src)>;
				241	def : Pat<(v16i8 (bitconvert (v4i32 VRRC:$src))), (v16i8 VRRC:$src)>;
				242	def : Pat<(v16i8 (bitconvert (v4f32 VRRC:$src))), (v16i8 VRRC:$src)>;
				243
				244	def : Pat<(v8i16 (bitconvert (v16i8 VRRC:$src))), (v8i16 VRRC:$src)>;
				245	def : Pat<(v8i16 (bitconvert (v4i32 VRRC:$src))), (v8i16 VRRC:$src)>;
				246	def : Pat<(v8i16 (bitconvert (v4f32 VRRC:$src))), (v8i16 VRRC:$src)>;
				247
				248	def : Pat<(v4i32 (bitconvert (v16i8 VRRC:$src))), (v4i32 VRRC:$src)>;
				249	def : Pat<(v4i32 (bitconvert (v8i16 VRRC:$src))), (v4i32 VRRC:$src)>;
				250	def : Pat<(v4i32 (bitconvert (v4f32 VRRC:$src))), (v4i32 VRRC:$src)>;
				251
				252	def : Pat<(v4f32 (bitconvert (v16i8 VRRC:$src))), (v4f32 VRRC:$src)>;
				253	def : Pat<(v4f32 (bitconvert (v8i16 VRRC:$src))), (v4f32 VRRC:$src)>;
				254	def : Pat<(v4f32 (bitconvert (v4i32 VRRC:$src))), (v4f32 VRRC:$src)>;
				255
				256	// Immediate vector formation with vsplti*.
				257	def : Pat<(v16i8 vecspltisb:$invec), (v16i8 (VSPLTISB vecspltisb:$invec))>;
				258	def : Pat<(v16i8 vecspltish:$invec), (v16i8 (VSPLTISH vecspltish:$invec))>;
				259	def : Pat<(v16i8 vecspltisw:$invec), (v16i8 (VSPLTISW vecspltisw:$invec))>;
				260
				261	def : Pat<(v8i16 vecspltisb:$invec), (v8i16 (VSPLTISB vecspltisb:$invec))>;
				262	def : Pat<(v8i16 vecspltish:$invec), (v8i16 (VSPLTISH vecspltish:$invec))>;
				263	def : Pat<(v8i16 vecspltisw:$invec), (v8i16 (VSPLTISW vecspltisw:$invec))>;
				264
				265	def : Pat<(v4i32 vecspltisb:$invec), (v4i32 (VSPLTISB vecspltisb:$invec))>;
				266	def : Pat<(v4i32 vecspltish:$invec), (v4i32 (VSPLTISH vecspltish:$invec))>;
				267	def : Pat<(v4i32 vecspltisw:$invec), (v4i32 (VSPLTISW vecspltisw:$invec))>;
				268
				269
				270
				271	def : Pat<(fmul VRRC:$vA, VRRC:$vB),
				272	(VMADDFP VRRC:$vA, VRRC:$vB, (V_SET0))>;
				273
				274	// Fused multiply add and multiply sub for packed float. These are represented
				275	// separately from the real instructions above, for operations that must have
				276	// the additional precision, such as Newton-Rhapson (used by divide, sqrt)
				277	def : Pat<(PPCvmaddfp VRRC:$A, VRRC:$B, VRRC:$C),
				278	(VMADDFP VRRC:$A, VRRC:$B, VRRC:$C)>;
				279	def : Pat<(PPCvnmsubfp VRRC:$A, VRRC:$B, VRRC:$C),
				280	(VNMSUBFP VRRC:$A, VRRC:$B, VRRC:$C)>;
				281
				282	def : Pat<(int_ppc_altivec_vmaddfp VRRC:$A, VRRC:$B, VRRC:$C),
				283	(VMADDFP VRRC:$A, VRRC:$B, VRRC:$C)>;
				284	def : Pat<(int_ppc_altivec_vnmsubfp VRRC:$A, VRRC:$B, VRRC:$C),
				285	(VNMSUBFP VRRC:$A, VRRC:$B, VRRC:$C)>;
				286
				287	def : Pat<(vector_shuffle (v4i32 VRRC:$vB), (undef), VSPLT_shuffle_mask:$UIMM),
				288	(v4i32 (VSPLTW VSPLT_shuffle_mask:$UIMM, VRRC:$vB))>;
				289
				290	def : Pat<(PPCvperm (v4i32 VRRC:$vA), VRRC:$vB, VRRC:$vC),
				291	(v4i32 (VPERM VRRC:$vA, VRRC:$vB, VRRC:$vC))>;
				292
				293	def : Pat<(v4i32 (PPClve_x xoaddr:$src)),
				294	(v4i32 (LVEWX xoaddr:$src))>;
				295
				296