Blame - llvm/lib/Target/ARM/ARMTargetTransformInfo.cpp - toolchain/llvm-project

blob: 13c5dc61acd9c92621424af2ea48309f8cdea603 [file] [log] [blame]

Chandler Carruth	93dcdc4	2015-01-31 11:17:59 +0000	[diff] [blame]	1	//===-- ARMTargetTransformInfo.cpp - ARM specific TTI ---------------------===//
Chandler Carruth	664e354	2013-01-07 01:37:14 +0000	[diff] [blame]	2	//
				3	// The LLVM Compiler Infrastructure
				4	//
				5	// This file is distributed under the University of Illinois Open Source
				6	// License. See LICENSE.TXT for details.
				7	//
				8	//===----------------------------------------------------------------------===//
Chandler Carruth	664e354	2013-01-07 01:37:14 +0000	[diff] [blame]	9
Chandler Carruth	93dcdc4	2015-01-31 11:17:59 +0000	[diff] [blame]	10	#include "ARMTargetTransformInfo.h"
Chandler Carruth	664e354	2013-01-07 01:37:14 +0000	[diff] [blame]	11	#include "llvm/Support/Debug.h"
Renato Golin	5e9d55e	2013-01-29 23:31:38 +0000	[diff] [blame]	12	#include "llvm/Target/CostTable.h"
Chandler Carruth	8a8cd2b	2014-01-07 11:48:04 +0000	[diff] [blame]	13	#include "llvm/Target/TargetLowering.h"
Chandler Carruth	664e354	2013-01-07 01:37:14 +0000	[diff] [blame]	14	using namespace llvm;
				15
Chandler Carruth	84e68b2	2014-04-22 02:41:26 +0000	[diff] [blame]	16	#define DEBUG_TYPE "armtti"
				17
Chandler Carruth	93205eb	2015-08-05 18:08:10 +0000	[diff] [blame]	18	int ARMTTIImpl::getIntImmCost(const APInt &Imm, Type *Ty) {
Chandler Carruth	664e354	2013-01-07 01:37:14 +0000	[diff] [blame]	19	assert(Ty->isIntegerTy());
				20
Tim Northover	5c02f9a	2016-04-13 23:08:27 +0000	[diff] [blame]	21	unsigned Bits = Ty->getPrimitiveSizeInBits();
Weiming Zhao	5410edd	2016-06-28 22:30:45 +0000	[diff] [blame]	22	if (Bits == 0 \|\| Imm.getActiveBits() >= 64)
Tim Northover	5c02f9a	2016-04-13 23:08:27 +0000	[diff] [blame]	23	return 4;
Chandler Carruth	664e354	2013-01-07 01:37:14 +0000	[diff] [blame]	24
Tim Northover	5c02f9a	2016-04-13 23:08:27 +0000	[diff] [blame]	25	int64_t SImmVal = Imm.getSExtValue();
				26	uint64_t ZImmVal = Imm.getZExtValue();
Chandler Carruth	664e354	2013-01-07 01:37:14 +0000	[diff] [blame]	27	if (!ST->isThumb()) {
				28	if ((SImmVal >= 0 && SImmVal < 65536) \|\|
				29	(ARM_AM::getSOImmVal(ZImmVal) != -1) \|\|
				30	(ARM_AM::getSOImmVal(~ZImmVal) != -1))
				31	return 1;
				32	return ST->hasV6T2Ops() ? 2 : 3;
Duncan P. N. Exon Smith	429d260	2014-03-08 15:15:42 +0000	[diff] [blame]	33	}
				34	if (ST->isThumb2()) {
Chandler Carruth	664e354	2013-01-07 01:37:14 +0000	[diff] [blame]	35	if ((SImmVal >= 0 && SImmVal < 65536) \|\|
				36	(ARM_AM::getT2SOImmVal(ZImmVal) != -1) \|\|
				37	(ARM_AM::getT2SOImmVal(~ZImmVal) != -1))
				38	return 1;
				39	return ST->hasV6T2Ops() ? 2 : 3;
Chandler Carruth	664e354	2013-01-07 01:37:14 +0000	[diff] [blame]	40	}
Duncan P. N. Exon Smith	429d260	2014-03-08 15:15:42 +0000	[diff] [blame]	41	// Thumb1.
				42	if (SImmVal >= 0 && SImmVal < 256)
				43	return 1;
				44	if ((~ZImmVal < 256) \|\| ARM_AM::isThumbImmShiftedVal(ZImmVal))
				45	return 2;
				46	// Load from constantpool.
				47	return 3;
Chandler Carruth	664e354	2013-01-07 01:37:14 +0000	[diff] [blame]	48	}
Renato Golin	5e9d55e	2013-01-29 23:31:38 +0000	[diff] [blame]	49
Sjoerd Meijer	38c2cd0	2016-07-14 07:44:20 +0000	[diff] [blame]	50
				51	// Constants smaller than 256 fit in the immediate field of
				52	// Thumb1 instructions so we return a zero cost and 1 otherwise.
				53	int ARMTTIImpl::getIntImmCodeSizeCost(unsigned Opcode, unsigned Idx,
				54	const APInt &Imm, Type *Ty) {
				55	if (Imm.isNonNegative() && Imm.getLimitedValue() < 256)
				56	return 0;
				57
				58	return 1;
				59	}
				60
Tim Northover	903f81b	2016-04-15 18:17:18 +0000	[diff] [blame]	61	int ARMTTIImpl::getIntImmCost(unsigned Opcode, unsigned Idx, const APInt &Imm,
				62	Type *Ty) {
				63	// Division by a constant can be turned into multiplication, but only if we
				64	// know it's constant. So it's not so much that the immediate is cheap (it's
				65	// not), but that the alternative is worse.
				66	// FIXME: this is probably unneeded with GlobalISel.
				67	if ((Opcode == Instruction::SDiv \|\| Opcode == Instruction::UDiv \|\|
				68	Opcode == Instruction::SRem \|\| Opcode == Instruction::URem) &&
				69	Idx == 1)
				70	return 0;
				71
				72	return getIntImmCost(Imm, Ty);
				73	}
				74
				75
Chandler Carruth	93205eb	2015-08-05 18:08:10 +0000	[diff] [blame]	76	int ARMTTIImpl::getCastInstrCost(unsigned Opcode, Type Dst, Type Src) {
Renato Golin	5e9d55e	2013-01-29 23:31:38 +0000	[diff] [blame]	77	int ISD = TLI->InstructionOpcodeToISD(Opcode);
				78	assert(ISD && "Invalid opcode");
				79
Arnold Schwaighofer	f5284ff	2013-03-15 15:10:47 +0000	[diff] [blame]	80	// Single to/from double precision conversions.
Craig Topper	4b27576	2015-10-28 04:02:12 +0000	[diff] [blame]	81	static const CostTblEntry NEONFltDblTbl[] = {
Arnold Schwaighofer	f5284ff	2013-03-15 15:10:47 +0000	[diff] [blame]	82	// Vector fptrunc/fpext conversions.
				83	{ ISD::FP_ROUND, MVT::v2f64, 2 },
				84	{ ISD::FP_EXTEND, MVT::v2f32, 2 },
				85	{ ISD::FP_EXTEND, MVT::v4f32, 4 }
				86	};
				87
				88	if (Src->isVectorTy() && ST->hasNEON() && (ISD == ISD::FP_ROUND \|\|
				89	ISD == ISD::FP_EXTEND)) {
Chandler Carruth	93205eb	2015-08-05 18:08:10 +0000	[diff] [blame]	90	std::pair<int, MVT> LT = TLI->getTypeLegalizationCost(DL, Src);
Craig Topper	ee0c859	2015-10-27 04:14:24 +0000	[diff] [blame]	91	if (const auto *Entry = CostTableLookup(NEONFltDblTbl, ISD, LT.second))
				92	return LT.first * Entry->Cost;
Arnold Schwaighofer	f5284ff	2013-03-15 15:10:47 +0000	[diff] [blame]	93	}
				94
Mehdi Amini	44ede33	2015-07-09 02:09:04 +0000	[diff] [blame]	95	EVT SrcTy = TLI->getValueType(DL, Src);
				96	EVT DstTy = TLI->getValueType(DL, Dst);
Renato Golin	5e9d55e	2013-01-29 23:31:38 +0000	[diff] [blame]	97
				98	if (!SrcTy.isSimple() \|\| !DstTy.isSimple())
Chandler Carruth	705b185	2015-01-31 03:43:40 +0000	[diff] [blame]	99	return BaseT::getCastInstrCost(Opcode, Dst, Src);
Renato Golin	5e9d55e	2013-01-29 23:31:38 +0000	[diff] [blame]	100
				101	// Some arithmetic, load and store operations have specific instructions
Arnold Schwaighofer	a804bbe	2013-02-05 14:05:55 +0000	[diff] [blame]	102	// to cast up/down their types automatically at no extra cost.
				103	// TODO: Get these tables to know at least what the related operations are.
Craig Topper	4b27576	2015-10-28 04:02:12 +0000	[diff] [blame]	104	static const TypeConversionCostTblEntry NEONVectorConversionTbl[] = {
Renato Golin	5e9d55e	2013-01-29 23:31:38 +0000	[diff] [blame]	105	{ ISD::SIGN_EXTEND, MVT::v4i32, MVT::v4i16, 0 },
				106	{ ISD::ZERO_EXTEND, MVT::v4i32, MVT::v4i16, 0 },
				107	{ ISD::SIGN_EXTEND, MVT::v2i64, MVT::v2i32, 1 },
				108	{ ISD::ZERO_EXTEND, MVT::v2i64, MVT::v2i32, 1 },
				109	{ ISD::TRUNCATE, MVT::v4i32, MVT::v4i64, 0 },
				110	{ ISD::TRUNCATE, MVT::v4i16, MVT::v4i32, 1 },
Arnold Schwaighofer	a804bbe	2013-02-05 14:05:55 +0000	[diff] [blame]	111
Renato Golin	227eb6f	2013-03-19 08:15:38 +0000	[diff] [blame]	112	// The number of vmovl instructions for the extension.
				113	{ ISD::SIGN_EXTEND, MVT::v4i64, MVT::v4i16, 3 },
				114	{ ISD::ZERO_EXTEND, MVT::v4i64, MVT::v4i16, 3 },
				115	{ ISD::SIGN_EXTEND, MVT::v8i32, MVT::v8i8, 3 },
				116	{ ISD::ZERO_EXTEND, MVT::v8i32, MVT::v8i8, 3 },
				117	{ ISD::SIGN_EXTEND, MVT::v8i64, MVT::v8i8, 7 },
				118	{ ISD::ZERO_EXTEND, MVT::v8i64, MVT::v8i8, 7 },
				119	{ ISD::SIGN_EXTEND, MVT::v8i64, MVT::v8i16, 6 },
				120	{ ISD::ZERO_EXTEND, MVT::v8i64, MVT::v8i16, 6 },
				121	{ ISD::SIGN_EXTEND, MVT::v16i32, MVT::v16i8, 6 },
				122	{ ISD::ZERO_EXTEND, MVT::v16i32, MVT::v16i8, 6 },
				123
Jim Grosbach	563983c	2013-04-21 23:47:41 +0000	[diff] [blame]	124	// Operations that we legalize using splitting.
				125	{ ISD::TRUNCATE, MVT::v16i8, MVT::v16i32, 6 },
				126	{ ISD::TRUNCATE, MVT::v8i8, MVT::v8i32, 3 },
Arnold Schwaighofer	90774f3	2013-03-12 21:19:22 +0000	[diff] [blame]	127
Arnold Schwaighofer	a804bbe	2013-02-05 14:05:55 +0000	[diff] [blame]	128	// Vector float <-> i32 conversions.
				129	{ ISD::SINT_TO_FP, MVT::v4f32, MVT::v4i32, 1 },
				130	{ ISD::UINT_TO_FP, MVT::v4f32, MVT::v4i32, 1 },
Arnold Schwaighofer	ae0052f	2013-03-18 22:47:09 +0000	[diff] [blame]	131
				132	{ ISD::SINT_TO_FP, MVT::v2f32, MVT::v2i8, 3 },
				133	{ ISD::UINT_TO_FP, MVT::v2f32, MVT::v2i8, 3 },
				134	{ ISD::SINT_TO_FP, MVT::v2f32, MVT::v2i16, 2 },
				135	{ ISD::UINT_TO_FP, MVT::v2f32, MVT::v2i16, 2 },
				136	{ ISD::SINT_TO_FP, MVT::v2f32, MVT::v2i32, 1 },
				137	{ ISD::UINT_TO_FP, MVT::v2f32, MVT::v2i32, 1 },
				138	{ ISD::SINT_TO_FP, MVT::v4f32, MVT::v4i1, 3 },
				139	{ ISD::UINT_TO_FP, MVT::v4f32, MVT::v4i1, 3 },
				140	{ ISD::SINT_TO_FP, MVT::v4f32, MVT::v4i8, 3 },
				141	{ ISD::UINT_TO_FP, MVT::v4f32, MVT::v4i8, 3 },
				142	{ ISD::SINT_TO_FP, MVT::v4f32, MVT::v4i16, 2 },
				143	{ ISD::UINT_TO_FP, MVT::v4f32, MVT::v4i16, 2 },
				144	{ ISD::SINT_TO_FP, MVT::v8f32, MVT::v8i16, 4 },
				145	{ ISD::UINT_TO_FP, MVT::v8f32, MVT::v8i16, 4 },
				146	{ ISD::SINT_TO_FP, MVT::v8f32, MVT::v8i32, 2 },
				147	{ ISD::UINT_TO_FP, MVT::v8f32, MVT::v8i32, 2 },
				148	{ ISD::SINT_TO_FP, MVT::v16f32, MVT::v16i16, 8 },
				149	{ ISD::UINT_TO_FP, MVT::v16f32, MVT::v16i16, 8 },
				150	{ ISD::SINT_TO_FP, MVT::v16f32, MVT::v16i32, 4 },
				151	{ ISD::UINT_TO_FP, MVT::v16f32, MVT::v16i32, 4 },
				152
Arnold Schwaighofer	a804bbe	2013-02-05 14:05:55 +0000	[diff] [blame]	153	{ ISD::FP_TO_SINT, MVT::v4i32, MVT::v4f32, 1 },
				154	{ ISD::FP_TO_UINT, MVT::v4i32, MVT::v4f32, 1 },
Arnold Schwaighofer	6c9c3a8	2013-03-18 22:47:06 +0000	[diff] [blame]	155	{ ISD::FP_TO_SINT, MVT::v4i8, MVT::v4f32, 3 },
				156	{ ISD::FP_TO_UINT, MVT::v4i8, MVT::v4f32, 3 },
				157	{ ISD::FP_TO_SINT, MVT::v4i16, MVT::v4f32, 2 },
				158	{ ISD::FP_TO_UINT, MVT::v4i16, MVT::v4f32, 2 },
Arnold Schwaighofer	a804bbe	2013-02-05 14:05:55 +0000	[diff] [blame]	159
				160	// Vector double <-> i32 conversions.
				161	{ ISD::SINT_TO_FP, MVT::v2f64, MVT::v2i32, 2 },
				162	{ ISD::UINT_TO_FP, MVT::v2f64, MVT::v2i32, 2 },
Arnold Schwaighofer	ae0052f	2013-03-18 22:47:09 +0000	[diff] [blame]	163
				164	{ ISD::SINT_TO_FP, MVT::v2f64, MVT::v2i8, 4 },
				165	{ ISD::UINT_TO_FP, MVT::v2f64, MVT::v2i8, 4 },
				166	{ ISD::SINT_TO_FP, MVT::v2f64, MVT::v2i16, 3 },
				167	{ ISD::UINT_TO_FP, MVT::v2f64, MVT::v2i16, 3 },
				168	{ ISD::SINT_TO_FP, MVT::v2f64, MVT::v2i32, 2 },
				169	{ ISD::UINT_TO_FP, MVT::v2f64, MVT::v2i32, 2 },
				170
Arnold Schwaighofer	a804bbe	2013-02-05 14:05:55 +0000	[diff] [blame]	171	{ ISD::FP_TO_SINT, MVT::v2i32, MVT::v2f64, 2 },
Arnold Schwaighofer	6c9c3a8	2013-03-18 22:47:06 +0000	[diff] [blame]	172	{ ISD::FP_TO_UINT, MVT::v2i32, MVT::v2f64, 2 },
				173	{ ISD::FP_TO_SINT, MVT::v8i16, MVT::v8f32, 4 },
				174	{ ISD::FP_TO_UINT, MVT::v8i16, MVT::v8f32, 4 },
				175	{ ISD::FP_TO_SINT, MVT::v16i16, MVT::v16f32, 8 },
				176	{ ISD::FP_TO_UINT, MVT::v16i16, MVT::v16f32, 8 }
Renato Golin	5e9d55e	2013-01-29 23:31:38 +0000	[diff] [blame]	177	};
				178
Arnold Schwaighofer	a804bbe	2013-02-05 14:05:55 +0000	[diff] [blame]	179	if (SrcTy.isVector() && ST->hasNEON()) {
Craig Topper	ee0c859	2015-10-27 04:14:24 +0000	[diff] [blame]	180	if (const auto *Entry = ConvertCostTableLookup(NEONVectorConversionTbl, ISD,
				181	DstTy.getSimpleVT(),
				182	SrcTy.getSimpleVT()))
				183	return Entry->Cost;
Renato Golin	5e9d55e	2013-01-29 23:31:38 +0000	[diff] [blame]	184	}
				185
Arnold Schwaighofer	a804bbe	2013-02-05 14:05:55 +0000	[diff] [blame]	186	// Scalar float to integer conversions.
Craig Topper	4b27576	2015-10-28 04:02:12 +0000	[diff] [blame]	187	static const TypeConversionCostTblEntry NEONFloatConversionTbl[] = {
Arnold Schwaighofer	a804bbe	2013-02-05 14:05:55 +0000	[diff] [blame]	188	{ ISD::FP_TO_SINT, MVT::i1, MVT::f32, 2 },
				189	{ ISD::FP_TO_UINT, MVT::i1, MVT::f32, 2 },
				190	{ ISD::FP_TO_SINT, MVT::i1, MVT::f64, 2 },
				191	{ ISD::FP_TO_UINT, MVT::i1, MVT::f64, 2 },
				192	{ ISD::FP_TO_SINT, MVT::i8, MVT::f32, 2 },
				193	{ ISD::FP_TO_UINT, MVT::i8, MVT::f32, 2 },
				194	{ ISD::FP_TO_SINT, MVT::i8, MVT::f64, 2 },
				195	{ ISD::FP_TO_UINT, MVT::i8, MVT::f64, 2 },
				196	{ ISD::FP_TO_SINT, MVT::i16, MVT::f32, 2 },
				197	{ ISD::FP_TO_UINT, MVT::i16, MVT::f32, 2 },
				198	{ ISD::FP_TO_SINT, MVT::i16, MVT::f64, 2 },
				199	{ ISD::FP_TO_UINT, MVT::i16, MVT::f64, 2 },
				200	{ ISD::FP_TO_SINT, MVT::i32, MVT::f32, 2 },
				201	{ ISD::FP_TO_UINT, MVT::i32, MVT::f32, 2 },
				202	{ ISD::FP_TO_SINT, MVT::i32, MVT::f64, 2 },
				203	{ ISD::FP_TO_UINT, MVT::i32, MVT::f64, 2 },
				204	{ ISD::FP_TO_SINT, MVT::i64, MVT::f32, 10 },
				205	{ ISD::FP_TO_UINT, MVT::i64, MVT::f32, 10 },
				206	{ ISD::FP_TO_SINT, MVT::i64, MVT::f64, 10 },
				207	{ ISD::FP_TO_UINT, MVT::i64, MVT::f64, 10 }
				208	};
				209	if (SrcTy.isFloatingPoint() && ST->hasNEON()) {
Craig Topper	ee0c859	2015-10-27 04:14:24 +0000	[diff] [blame]	210	if (const auto *Entry = ConvertCostTableLookup(NEONFloatConversionTbl, ISD,
				211	DstTy.getSimpleVT(),
				212	SrcTy.getSimpleVT()))
				213	return Entry->Cost;
Arnold Schwaighofer	a804bbe	2013-02-05 14:05:55 +0000	[diff] [blame]	214	}
				215
Arnold Schwaighofer	a804bbe	2013-02-05 14:05:55 +0000	[diff] [blame]	216	// Scalar integer to float conversions.
Craig Topper	4b27576	2015-10-28 04:02:12 +0000	[diff] [blame]	217	static const TypeConversionCostTblEntry NEONIntegerConversionTbl[] = {
Arnold Schwaighofer	a804bbe	2013-02-05 14:05:55 +0000	[diff] [blame]	218	{ ISD::SINT_TO_FP, MVT::f32, MVT::i1, 2 },
				219	{ ISD::UINT_TO_FP, MVT::f32, MVT::i1, 2 },
				220	{ ISD::SINT_TO_FP, MVT::f64, MVT::i1, 2 },
				221	{ ISD::UINT_TO_FP, MVT::f64, MVT::i1, 2 },
				222	{ ISD::SINT_TO_FP, MVT::f32, MVT::i8, 2 },
				223	{ ISD::UINT_TO_FP, MVT::f32, MVT::i8, 2 },
				224	{ ISD::SINT_TO_FP, MVT::f64, MVT::i8, 2 },
				225	{ ISD::UINT_TO_FP, MVT::f64, MVT::i8, 2 },
				226	{ ISD::SINT_TO_FP, MVT::f32, MVT::i16, 2 },
				227	{ ISD::UINT_TO_FP, MVT::f32, MVT::i16, 2 },
				228	{ ISD::SINT_TO_FP, MVT::f64, MVT::i16, 2 },
				229	{ ISD::UINT_TO_FP, MVT::f64, MVT::i16, 2 },
				230	{ ISD::SINT_TO_FP, MVT::f32, MVT::i32, 2 },
				231	{ ISD::UINT_TO_FP, MVT::f32, MVT::i32, 2 },
				232	{ ISD::SINT_TO_FP, MVT::f64, MVT::i32, 2 },
				233	{ ISD::UINT_TO_FP, MVT::f64, MVT::i32, 2 },
				234	{ ISD::SINT_TO_FP, MVT::f32, MVT::i64, 10 },
				235	{ ISD::UINT_TO_FP, MVT::f32, MVT::i64, 10 },
				236	{ ISD::SINT_TO_FP, MVT::f64, MVT::i64, 10 },
				237	{ ISD::UINT_TO_FP, MVT::f64, MVT::i64, 10 }
				238	};
				239
				240	if (SrcTy.isInteger() && ST->hasNEON()) {
Craig Topper	ee0c859	2015-10-27 04:14:24 +0000	[diff] [blame]	241	if (const auto *Entry = ConvertCostTableLookup(NEONIntegerConversionTbl,
				242	ISD, DstTy.getSimpleVT(),
				243	SrcTy.getSimpleVT()))
				244	return Entry->Cost;
Arnold Schwaighofer	a804bbe	2013-02-05 14:05:55 +0000	[diff] [blame]	245	}
				246
				247	// Scalar integer conversion costs.
Craig Topper	4b27576	2015-10-28 04:02:12 +0000	[diff] [blame]	248	static const TypeConversionCostTblEntry ARMIntegerConversionTbl[] = {
Arnold Schwaighofer	a804bbe	2013-02-05 14:05:55 +0000	[diff] [blame]	249	// i16 -> i64 requires two dependent operations.
				250	{ ISD::SIGN_EXTEND, MVT::i64, MVT::i16, 2 },
				251
				252	// Truncates on i64 are assumed to be free.
				253	{ ISD::TRUNCATE, MVT::i32, MVT::i64, 0 },
				254	{ ISD::TRUNCATE, MVT::i16, MVT::i64, 0 },
				255	{ ISD::TRUNCATE, MVT::i8, MVT::i64, 0 },
				256	{ ISD::TRUNCATE, MVT::i1, MVT::i64, 0 }
				257	};
				258
				259	if (SrcTy.isInteger()) {
Craig Topper	ee0c859	2015-10-27 04:14:24 +0000	[diff] [blame]	260	if (const auto *Entry = ConvertCostTableLookup(ARMIntegerConversionTbl, ISD,
				261	DstTy.getSimpleVT(),
				262	SrcTy.getSimpleVT()))
				263	return Entry->Cost;
Arnold Schwaighofer	a804bbe	2013-02-05 14:05:55 +0000	[diff] [blame]	264	}
				265
Chandler Carruth	705b185	2015-01-31 03:43:40 +0000	[diff] [blame]	266	return BaseT::getCastInstrCost(Opcode, Dst, Src);
Renato Golin	5e9d55e	2013-01-29 23:31:38 +0000	[diff] [blame]	267	}
Arnold Schwaighofer	98f1012	2013-02-04 02:52:05 +0000	[diff] [blame]	268
Chandler Carruth	93205eb	2015-08-05 18:08:10 +0000	[diff] [blame]	269	int ARMTTIImpl::getVectorInstrCost(unsigned Opcode, Type *ValTy,
				270	unsigned Index) {
Arnold Schwaighofer	594fa2d	2013-02-08 14:50:48 +0000	[diff] [blame]	271	// Penalize inserting into an D-subregister. We end up with a three times
				272	// lower estimated throughput on swift.
Diana Picus	4879b05	2016-07-06 09:22:23 +0000	[diff] [blame]	273	if (ST->hasSlowLoadDSubregister() && Opcode == Instruction::InsertElement &&
				274	ValTy->isVectorTy() && ValTy->getScalarSizeInBits() <= 32)
Arnold Schwaighofer	594fa2d	2013-02-08 14:50:48 +0000	[diff] [blame]	275	return 3;
Arnold Schwaighofer	98f1012	2013-02-04 02:52:05 +0000	[diff] [blame]	276
James Molloy	a9f47b6	2014-09-12 13:29:40 +0000	[diff] [blame]	277	if ((Opcode == Instruction::InsertElement \|\|
Silviu Baranga	d5ac269	2015-08-17 15:57:05 +0000	[diff] [blame]	278	Opcode == Instruction::ExtractElement)) {
				279	// Cross-class copies are expensive on many microarchitectures,
				280	// so assume they are expensive by default.
				281	if (ValTy->getVectorElementType()->isIntegerTy())
				282	return 3;
				283
				284	// Even if it's not a cross class copy, this likely leads to mixing
				285	// of NEON and VFP code and should be therefore penalized.
				286	if (ValTy->isVectorTy() &&
				287	ValTy->getScalarSizeInBits() <= 32)
				288	return std::max(BaseT::getVectorInstrCost(Opcode, ValTy, Index), 2U);
				289	}
James Molloy	a9f47b6	2014-09-12 13:29:40 +0000	[diff] [blame]	290
Chandler Carruth	705b185	2015-01-31 03:43:40 +0000	[diff] [blame]	291	return BaseT::getVectorInstrCost(Opcode, ValTy, Index);
Arnold Schwaighofer	98f1012	2013-02-04 02:52:05 +0000	[diff] [blame]	292	}
Arnold Schwaighofer	213fced	2013-02-07 16:10:15 +0000	[diff] [blame]	293
Chandler Carruth	93205eb	2015-08-05 18:08:10 +0000	[diff] [blame]	294	int ARMTTIImpl::getCmpSelInstrCost(unsigned Opcode, Type ValTy, Type CondTy) {
Arnold Schwaighofer	213fced	2013-02-07 16:10:15 +0000	[diff] [blame]	295
				296	int ISD = TLI->InstructionOpcodeToISD(Opcode);
				297	// On NEON a a vector select gets lowered to vbsl.
				298	if (ST->hasNEON() && ValTy->isVectorTy() && ISD == ISD::SELECT) {
Arnold Schwaighofer	8070b38	2013-03-14 19:17:02 +0000	[diff] [blame]	299	// Lowering of some vector selects is currently far from perfect.
Craig Topper	4b27576	2015-10-28 04:02:12 +0000	[diff] [blame]	300	static const TypeConversionCostTblEntry NEONVectorSelectTbl[] = {
Arnold Schwaighofer	8070b38	2013-03-14 19:17:02 +0000	[diff] [blame]	301	{ ISD::SELECT, MVT::v4i1, MVT::v4i64, 44 + 12 + 1 },
				302	{ ISD::SELECT, MVT::v8i1, MVT::v8i64, 50 },
				303	{ ISD::SELECT, MVT::v16i1, MVT::v16i64, 100 }
				304	};
				305
Mehdi Amini	44ede33	2015-07-09 02:09:04 +0000	[diff] [blame]	306	EVT SelCondTy = TLI->getValueType(DL, CondTy);
				307	EVT SelValTy = TLI->getValueType(DL, ValTy);
Renato Golin	0178a25	2013-08-02 17:10:04 +0000	[diff] [blame]	308	if (SelCondTy.isSimple() && SelValTy.isSimple()) {
Craig Topper	ee0c859	2015-10-27 04:14:24 +0000	[diff] [blame]	309	if (const auto *Entry = ConvertCostTableLookup(NEONVectorSelectTbl, ISD,
				310	SelCondTy.getSimpleVT(),
				311	SelValTy.getSimpleVT()))
				312	return Entry->Cost;
Renato Golin	0178a25	2013-08-02 17:10:04 +0000	[diff] [blame]	313	}
Arnold Schwaighofer	8070b38	2013-03-14 19:17:02 +0000	[diff] [blame]	314
Chandler Carruth	93205eb	2015-08-05 18:08:10 +0000	[diff] [blame]	315	std::pair<int, MVT> LT = TLI->getTypeLegalizationCost(DL, ValTy);
Arnold Schwaighofer	213fced	2013-02-07 16:10:15 +0000	[diff] [blame]	316	return LT.first;
				317	}
				318
Chandler Carruth	705b185	2015-01-31 03:43:40 +0000	[diff] [blame]	319	return BaseT::getCmpSelInstrCost(Opcode, ValTy, CondTy);
Arnold Schwaighofer	213fced	2013-02-07 16:10:15 +0000	[diff] [blame]	320	}
Arnold Schwaighofer	594fa2d	2013-02-08 14:50:48 +0000	[diff] [blame]	321
Chandler Carruth	93205eb	2015-08-05 18:08:10 +0000	[diff] [blame]	322	int ARMTTIImpl::getAddressComputationCost(Type *Ty, bool IsComplex) {
Arnold Schwaighofer	da2b311	2013-07-12 19:16:04 +0000	[diff] [blame]	323	// Address computations in vectorized code with non-consecutive addresses will
				324	// likely result in more instructions compared to scalar code where the
				325	// computation can more often be merged into the index mode. The resulting
				326	// extra micro-ops can significantly decrease throughput.
				327	unsigned NumVectorInstToHideOverhead = 10;
				328
				329	if (Ty->isVectorTy() && IsComplex)
				330	return NumVectorInstToHideOverhead;
				331
Arnold Schwaighofer	594fa2d	2013-02-08 14:50:48 +0000	[diff] [blame]	332	// In many cases the address computation is not merged into the instruction
				333	// addressing mode.
				334	return 1;
				335	}
Arnold Schwaighofer	89aef93	2013-02-12 02:40:39 +0000	[diff] [blame]	336
Chandler Carruth	93205eb	2015-08-05 18:08:10 +0000	[diff] [blame]	337	int ARMTTIImpl::getFPOpCost(Type *Ty) {
Cameron Esfahani	17177d1	2015-02-05 02:09:33 +0000	[diff] [blame]	338	// Use similar logic that's in ARMISelLowering:
				339	// Any ARM CPU with VFP2 has floating point, but Thumb1 didn't have access
				340	// to VFP.
				341
				342	if (ST->hasVFP2() && !ST->isThumb1Only()) {
				343	if (Ty->isFloatTy()) {
				344	return TargetTransformInfo::TCC_Basic;
				345	}
				346
				347	if (Ty->isDoubleTy()) {
				348	return ST->isFPOnlySP() ? TargetTransformInfo::TCC_Expensive :
				349	TargetTransformInfo::TCC_Basic;
				350	}
				351	}
				352
				353	return TargetTransformInfo::TCC_Expensive;
				354	}
				355
Chandler Carruth	93205eb	2015-08-05 18:08:10 +0000	[diff] [blame]	356	int ARMTTIImpl::getShuffleCost(TTI::ShuffleKind Kind, Type *Tp, int Index,
				357	Type *SubTp) {
Karthik Bhat	e03a25d	2014-06-20 04:32:48 +0000	[diff] [blame]	358	// We only handle costs of reverse and alternate shuffles for now.
Chandler Carruth	705b185	2015-01-31 03:43:40 +0000	[diff] [blame]	359	if (Kind != TTI::SK_Reverse && Kind != TTI::SK_Alternate)
				360	return BaseT::getShuffleCost(Kind, Tp, Index, SubTp);
Arnold Schwaighofer	89aef93	2013-02-12 02:40:39 +0000	[diff] [blame]	361
Chandler Carruth	705b185	2015-01-31 03:43:40 +0000	[diff] [blame]	362	if (Kind == TTI::SK_Reverse) {
Craig Topper	4b27576	2015-10-28 04:02:12 +0000	[diff] [blame]	363	static const CostTblEntry NEONShuffleTbl[] = {
Karthik Bhat	e03a25d	2014-06-20 04:32:48 +0000	[diff] [blame]	364	// Reverse shuffle cost one instruction if we are shuffling within a
				365	// double word (vrev) or two if we shuffle a quad word (vrev, vext).
				366	{ISD::VECTOR_SHUFFLE, MVT::v2i32, 1},
				367	{ISD::VECTOR_SHUFFLE, MVT::v2f32, 1},
				368	{ISD::VECTOR_SHUFFLE, MVT::v2i64, 1},
				369	{ISD::VECTOR_SHUFFLE, MVT::v2f64, 1},
Arnold Schwaighofer	89aef93	2013-02-12 02:40:39 +0000	[diff] [blame]	370
Karthik Bhat	e03a25d	2014-06-20 04:32:48 +0000	[diff] [blame]	371	{ISD::VECTOR_SHUFFLE, MVT::v4i32, 2},
				372	{ISD::VECTOR_SHUFFLE, MVT::v4f32, 2},
				373	{ISD::VECTOR_SHUFFLE, MVT::v8i16, 2},
				374	{ISD::VECTOR_SHUFFLE, MVT::v16i8, 2}};
Arnold Schwaighofer	89aef93	2013-02-12 02:40:39 +0000	[diff] [blame]	375
Chandler Carruth	93205eb	2015-08-05 18:08:10 +0000	[diff] [blame]	376	std::pair<int, MVT> LT = TLI->getTypeLegalizationCost(DL, Tp);
Arnold Schwaighofer	89aef93	2013-02-12 02:40:39 +0000	[diff] [blame]	377
Craig Topper	ee0c859	2015-10-27 04:14:24 +0000	[diff] [blame]	378	if (const auto *Entry = CostTableLookup(NEONShuffleTbl, ISD::VECTOR_SHUFFLE,
				379	LT.second))
				380	return LT.first * Entry->Cost;
Arnold Schwaighofer	89aef93	2013-02-12 02:40:39 +0000	[diff] [blame]	381
Craig Topper	ee0c859	2015-10-27 04:14:24 +0000	[diff] [blame]	382	return BaseT::getShuffleCost(Kind, Tp, Index, SubTp);
Karthik Bhat	e03a25d	2014-06-20 04:32:48 +0000	[diff] [blame]	383	}
Chandler Carruth	705b185	2015-01-31 03:43:40 +0000	[diff] [blame]	384	if (Kind == TTI::SK_Alternate) {
Craig Topper	4b27576	2015-10-28 04:02:12 +0000	[diff] [blame]	385	static const CostTblEntry NEONAltShuffleTbl[] = {
Karthik Bhat	e03a25d	2014-06-20 04:32:48 +0000	[diff] [blame]	386	// Alt shuffle cost table for ARM. Cost is the number of instructions
				387	// required to create the shuffled vector.
				388
				389	{ISD::VECTOR_SHUFFLE, MVT::v2f32, 1},
				390	{ISD::VECTOR_SHUFFLE, MVT::v2i64, 1},
				391	{ISD::VECTOR_SHUFFLE, MVT::v2f64, 1},
				392	{ISD::VECTOR_SHUFFLE, MVT::v2i32, 1},
				393
				394	{ISD::VECTOR_SHUFFLE, MVT::v4i32, 2},
				395	{ISD::VECTOR_SHUFFLE, MVT::v4f32, 2},
				396	{ISD::VECTOR_SHUFFLE, MVT::v4i16, 2},
				397
				398	{ISD::VECTOR_SHUFFLE, MVT::v8i16, 16},
				399
				400	{ISD::VECTOR_SHUFFLE, MVT::v16i8, 32}};
				401
Chandler Carruth	93205eb	2015-08-05 18:08:10 +0000	[diff] [blame]	402	std::pair<int, MVT> LT = TLI->getTypeLegalizationCost(DL, Tp);
Craig Topper	ee0c859	2015-10-27 04:14:24 +0000	[diff] [blame]	403	if (const auto *Entry = CostTableLookup(NEONAltShuffleTbl,
				404	ISD::VECTOR_SHUFFLE, LT.second))
				405	return LT.first * Entry->Cost;
				406	return BaseT::getShuffleCost(Kind, Tp, Index, SubTp);
Karthik Bhat	e03a25d	2014-06-20 04:32:48 +0000	[diff] [blame]	407	}
Chandler Carruth	705b185	2015-01-31 03:43:40 +0000	[diff] [blame]	408	return BaseT::getShuffleCost(Kind, Tp, Index, SubTp);
Arnold Schwaighofer	89aef93	2013-02-12 02:40:39 +0000	[diff] [blame]	409	}
Arnold Schwaighofer	9881dcf	2013-04-25 21:16:18 +0000	[diff] [blame]	410
Chandler Carruth	93205eb	2015-08-05 18:08:10 +0000	[diff] [blame]	411	int ARMTTIImpl::getArithmeticInstrCost(
Chandler Carruth	705b185	2015-01-31 03:43:40 +0000	[diff] [blame]	412	unsigned Opcode, Type *Ty, TTI::OperandValueKind Op1Info,
				413	TTI::OperandValueKind Op2Info, TTI::OperandValueProperties Opd1PropInfo,
				414	TTI::OperandValueProperties Opd2PropInfo) {
Arnold Schwaighofer	9881dcf	2013-04-25 21:16:18 +0000	[diff] [blame]	415
				416	int ISDOpcode = TLI->InstructionOpcodeToISD(Opcode);
Chandler Carruth	93205eb	2015-08-05 18:08:10 +0000	[diff] [blame]	417	std::pair<int, MVT> LT = TLI->getTypeLegalizationCost(DL, Ty);
Arnold Schwaighofer	9881dcf	2013-04-25 21:16:18 +0000	[diff] [blame]	418
				419	const unsigned FunctionCallDivCost = 20;
				420	const unsigned ReciprocalDivCost = 10;
Craig Topper	4b27576	2015-10-28 04:02:12 +0000	[diff] [blame]	421	static const CostTblEntry CostTbl[] = {
Arnold Schwaighofer	9881dcf	2013-04-25 21:16:18 +0000	[diff] [blame]	422	// Division.
				423	// These costs are somewhat random. Choose a cost of 20 to indicate that
				424	// vectorizing devision (added function call) is going to be very expensive.
				425	// Double registers types.
				426	{ ISD::SDIV, MVT::v1i64, 1 * FunctionCallDivCost},
				427	{ ISD::UDIV, MVT::v1i64, 1 * FunctionCallDivCost},
				428	{ ISD::SREM, MVT::v1i64, 1 * FunctionCallDivCost},
				429	{ ISD::UREM, MVT::v1i64, 1 * FunctionCallDivCost},
				430	{ ISD::SDIV, MVT::v2i32, 2 * FunctionCallDivCost},
				431	{ ISD::UDIV, MVT::v2i32, 2 * FunctionCallDivCost},
				432	{ ISD::SREM, MVT::v2i32, 2 * FunctionCallDivCost},
				433	{ ISD::UREM, MVT::v2i32, 2 * FunctionCallDivCost},
				434	{ ISD::SDIV, MVT::v4i16, ReciprocalDivCost},
				435	{ ISD::UDIV, MVT::v4i16, ReciprocalDivCost},
				436	{ ISD::SREM, MVT::v4i16, 4 * FunctionCallDivCost},
				437	{ ISD::UREM, MVT::v4i16, 4 * FunctionCallDivCost},
				438	{ ISD::SDIV, MVT::v8i8, ReciprocalDivCost},
				439	{ ISD::UDIV, MVT::v8i8, ReciprocalDivCost},
				440	{ ISD::SREM, MVT::v8i8, 8 * FunctionCallDivCost},
				441	{ ISD::UREM, MVT::v8i8, 8 * FunctionCallDivCost},
				442	// Quad register types.
				443	{ ISD::SDIV, MVT::v2i64, 2 * FunctionCallDivCost},
				444	{ ISD::UDIV, MVT::v2i64, 2 * FunctionCallDivCost},
				445	{ ISD::SREM, MVT::v2i64, 2 * FunctionCallDivCost},
				446	{ ISD::UREM, MVT::v2i64, 2 * FunctionCallDivCost},
				447	{ ISD::SDIV, MVT::v4i32, 4 * FunctionCallDivCost},
				448	{ ISD::UDIV, MVT::v4i32, 4 * FunctionCallDivCost},
				449	{ ISD::SREM, MVT::v4i32, 4 * FunctionCallDivCost},
				450	{ ISD::UREM, MVT::v4i32, 4 * FunctionCallDivCost},
				451	{ ISD::SDIV, MVT::v8i16, 8 * FunctionCallDivCost},
				452	{ ISD::UDIV, MVT::v8i16, 8 * FunctionCallDivCost},
				453	{ ISD::SREM, MVT::v8i16, 8 * FunctionCallDivCost},
				454	{ ISD::UREM, MVT::v8i16, 8 * FunctionCallDivCost},
				455	{ ISD::SDIV, MVT::v16i8, 16 * FunctionCallDivCost},
				456	{ ISD::UDIV, MVT::v16i8, 16 * FunctionCallDivCost},
				457	{ ISD::SREM, MVT::v16i8, 16 * FunctionCallDivCost},
				458	{ ISD::UREM, MVT::v16i8, 16 * FunctionCallDivCost},
				459	// Multiplication.
				460	};
				461
Arnold Schwaighofer	9881dcf	2013-04-25 21:16:18 +0000	[diff] [blame]	462	if (ST->hasNEON())
Craig Topper	ee0c859	2015-10-27 04:14:24 +0000	[diff] [blame]	463	if (const auto *Entry = CostTableLookup(CostTbl, ISDOpcode, LT.second))
				464	return LT.first * Entry->Cost;
Arnold Schwaighofer	9881dcf	2013-04-25 21:16:18 +0000	[diff] [blame]	465
Chandler Carruth	93205eb	2015-08-05 18:08:10 +0000	[diff] [blame]	466	int Cost = BaseT::getArithmeticInstrCost(Opcode, Ty, Op1Info, Op2Info,
				467	Opd1PropInfo, Opd2PropInfo);
Arnold Schwaighofer	9881dcf	2013-04-25 21:16:18 +0000	[diff] [blame]	468
Arnold Schwaighofer	77af0f6	2013-10-29 01:33:53 +0000	[diff] [blame]	469	// This is somewhat of a hack. The problem that we are facing is that SROA
				470	// creates a sequence of shift, and, or instructions to construct values.
				471	// These sequences are recognized by the ISel and have zero-cost. Not so for
				472	// the vectorized code. Because we have support for v2i64 but not i64 those
Alp Toker	cb40291	2014-01-24 17:20:08 +0000	[diff] [blame]	473	// sequences look particularly beneficial to vectorize.
Arnold Schwaighofer	77af0f6	2013-10-29 01:33:53 +0000	[diff] [blame]	474	// To work around this we increase the cost of v2i64 operations to make them
				475	// seem less beneficial.
				476	if (LT.second == MVT::v2i64 &&
				477	Op2Info == TargetTransformInfo::OK_UniformConstantValue)
				478	Cost += 4;
				479
				480	return Cost;
Arnold Schwaighofer	9881dcf	2013-04-25 21:16:18 +0000	[diff] [blame]	481	}
				482
Chandler Carruth	93205eb	2015-08-05 18:08:10 +0000	[diff] [blame]	483	int ARMTTIImpl::getMemoryOpCost(unsigned Opcode, Type *Src, unsigned Alignment,
				484	unsigned AddressSpace) {
				485	std::pair<int, MVT> LT = TLI->getTypeLegalizationCost(DL, Src);
Arnold Schwaighofer	89ae217	2013-10-29 01:33:57 +0000	[diff] [blame]	486
				487	if (Src->isVectorTy() && Alignment != 16 &&
				488	Src->getVectorElementType()->isDoubleTy()) {
				489	// Unaligned loads/stores are extremely inefficient.
				490	// We need 4 uops for vst.1/vld.1 vs 1uop for vldr/vstr.
				491	return LT.first * 4;
				492	}
				493	return LT.first;
				494	}
Hao Liu	2cd34bb	2015-06-26 02:45:36 +0000	[diff] [blame]	495
Chandler Carruth	93205eb	2015-08-05 18:08:10 +0000	[diff] [blame]	496	int ARMTTIImpl::getInterleavedMemoryOpCost(unsigned Opcode, Type *VecTy,
				497	unsigned Factor,
				498	ArrayRef<unsigned> Indices,
				499	unsigned Alignment,
				500	unsigned AddressSpace) {
Hao Liu	2cd34bb	2015-06-26 02:45:36 +0000	[diff] [blame]	501	assert(Factor >= 2 && "Invalid interleave factor");
				502	assert(isa<VectorType>(VecTy) && "Expect a vector type");
				503
				504	// vldN/vstN doesn't support vector types of i64/f64 element.
Ahmed Bougacha	97564c3	2015-12-09 01:19:50 +0000	[diff] [blame]	505	bool EltIs64Bits = DL.getTypeSizeInBits(VecTy->getScalarType()) == 64;
Hao Liu	2cd34bb	2015-06-26 02:45:36 +0000	[diff] [blame]	506
				507	if (Factor <= TLI->getMaxSupportedInterleaveFactor() && !EltIs64Bits) {
				508	unsigned NumElts = VecTy->getVectorNumElements();
				509	Type *SubVecTy = VectorType::get(VecTy->getScalarType(), NumElts / Factor);
Ahmed Bougacha	97564c3	2015-12-09 01:19:50 +0000	[diff] [blame]	510	unsigned SubVecSize = DL.getTypeSizeInBits(SubVecTy);
Hao Liu	2cd34bb	2015-06-26 02:45:36 +0000	[diff] [blame]	511
				512	// vldN/vstN only support legal vector types of size 64 or 128 in bits.
				513	if (NumElts % Factor == 0 && (SubVecSize == 64 \|\| SubVecSize == 128))
				514	return Factor;
				515	}
				516
				517	return BaseT::getInterleavedMemoryOpCost(Opcode, VecTy, Factor, Indices,
				518	Alignment, AddressSpace);
				519	}