Blame - arch/mips/math-emu/dp_mul.c - kernel/msm-5.4

blob: d3acdedb5b9dd33053d7688af197a4d0e1f2d5de [file] [log] [blame]

Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	1	/* IEEE754 floating point arithmetic
				2	* double precision: common utilities
				3	*/
				4	/*
				5	* MIPS floating point support
				6	* Copyright (C) 1994-2000 Algorithmics Ltd.
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	7	*
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	8	* This program is free software; you can distribute it and/or modify it
				9	* under the terms of the GNU General Public License (Version 2) as
				10	* published by the Free Software Foundation.
				11	*
				12	* This program is distributed in the hope it will be useful, but WITHOUT
				13	* ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
				14	* FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License
				15	* for more details.
				16	*
				17	* You should have received a copy of the GNU General Public License along
				18	* with this program; if not, write to the Free Software Foundation, Inc.,
Ralf Baechle	3f7cac4	2014-04-26 01:49:14 +0200	[diff] [blame]	19	* 51 Franklin St, Fifth Floor, Boston, MA 02110-1301 USA.
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	20	*/
				21
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	22	#include "ieee754dp.h"
				23
Ralf Baechle	2209bcb	2014-04-16 01:31:11 +0200	[diff] [blame]	24	union ieee754dp ieee754dp_mul(union ieee754dp x, union ieee754dp y)
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	25	{
Ralf Baechle	3f7cac4	2014-04-26 01:49:14 +0200	[diff] [blame]	26	int re;
				27	int rs;
				28	u64 rm;
				29	unsigned lxm;
				30	unsigned hxm;
				31	unsigned lym;
				32	unsigned hym;
				33	u64 lrm;
				34	u64 hrm;
				35	u64 t;
				36	u64 at;
				37
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	38	COMPXDP;
				39	COMPYDP;
				40
				41	EXPLODEXDP;
				42	EXPLODEYDP;
				43
Ralf Baechle	9e8bad1	2014-04-19 00:36:32 +0200	[diff] [blame]	44	ieee754_clearcx();
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	45
				46	FLUSHXDP;
				47	FLUSHYDP;
				48
				49	switch (CLPAIR(xc, yc)) {
				50	case CLPAIR(IEEE754_CLASS_SNAN, IEEE754_CLASS_QNAN):
				51	case CLPAIR(IEEE754_CLASS_QNAN, IEEE754_CLASS_SNAN):
				52	case CLPAIR(IEEE754_CLASS_SNAN, IEEE754_CLASS_SNAN):
				53	case CLPAIR(IEEE754_CLASS_ZERO, IEEE754_CLASS_SNAN):
				54	case CLPAIR(IEEE754_CLASS_NORM, IEEE754_CLASS_SNAN):
				55	case CLPAIR(IEEE754_CLASS_DNORM, IEEE754_CLASS_SNAN):
				56	case CLPAIR(IEEE754_CLASS_INF, IEEE754_CLASS_SNAN):
				57	case CLPAIR(IEEE754_CLASS_SNAN, IEEE754_CLASS_ZERO):
				58	case CLPAIR(IEEE754_CLASS_SNAN, IEEE754_CLASS_NORM):
				59	case CLPAIR(IEEE754_CLASS_SNAN, IEEE754_CLASS_DNORM):
				60	case CLPAIR(IEEE754_CLASS_SNAN, IEEE754_CLASS_INF):
Ralf Baechle	9e8bad1	2014-04-19 00:36:32 +0200	[diff] [blame]	61	ieee754_setcx(IEEE754_INVALID_OPERATION);
Ralf Baechle	90efba3	2014-04-25 03:19:57 +0200	[diff] [blame]	62	return ieee754dp_nanxcpt(ieee754dp_indef());
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	63
				64	case CLPAIR(IEEE754_CLASS_ZERO, IEEE754_CLASS_QNAN):
				65	case CLPAIR(IEEE754_CLASS_NORM, IEEE754_CLASS_QNAN):
				66	case CLPAIR(IEEE754_CLASS_DNORM, IEEE754_CLASS_QNAN):
				67	case CLPAIR(IEEE754_CLASS_INF, IEEE754_CLASS_QNAN):
				68	return y;
				69
				70	case CLPAIR(IEEE754_CLASS_QNAN, IEEE754_CLASS_QNAN):
				71	case CLPAIR(IEEE754_CLASS_QNAN, IEEE754_CLASS_ZERO):
				72	case CLPAIR(IEEE754_CLASS_QNAN, IEEE754_CLASS_NORM):
				73	case CLPAIR(IEEE754_CLASS_QNAN, IEEE754_CLASS_DNORM):
				74	case CLPAIR(IEEE754_CLASS_QNAN, IEEE754_CLASS_INF):
				75	return x;
				76
				77
Ralf Baechle	3f7cac4	2014-04-26 01:49:14 +0200	[diff] [blame]	78	/*
				79	* Infinity handling
				80	*/
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	81	case CLPAIR(IEEE754_CLASS_INF, IEEE754_CLASS_ZERO):
				82	case CLPAIR(IEEE754_CLASS_ZERO, IEEE754_CLASS_INF):
Ralf Baechle	9e8bad1	2014-04-19 00:36:32 +0200	[diff] [blame]	83	ieee754_setcx(IEEE754_INVALID_OPERATION);
Ralf Baechle	90efba3	2014-04-25 03:19:57 +0200	[diff] [blame]	84	return ieee754dp_indef();
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	85
				86	case CLPAIR(IEEE754_CLASS_NORM, IEEE754_CLASS_INF):
				87	case CLPAIR(IEEE754_CLASS_DNORM, IEEE754_CLASS_INF):
				88	case CLPAIR(IEEE754_CLASS_INF, IEEE754_CLASS_NORM):
				89	case CLPAIR(IEEE754_CLASS_INF, IEEE754_CLASS_DNORM):
				90	case CLPAIR(IEEE754_CLASS_INF, IEEE754_CLASS_INF):
				91	return ieee754dp_inf(xs ^ ys);
				92
				93	case CLPAIR(IEEE754_CLASS_ZERO, IEEE754_CLASS_ZERO):
				94	case CLPAIR(IEEE754_CLASS_ZERO, IEEE754_CLASS_NORM):
				95	case CLPAIR(IEEE754_CLASS_ZERO, IEEE754_CLASS_DNORM):
				96	case CLPAIR(IEEE754_CLASS_NORM, IEEE754_CLASS_ZERO):
				97	case CLPAIR(IEEE754_CLASS_DNORM, IEEE754_CLASS_ZERO):
				98	return ieee754dp_zero(xs ^ ys);
				99
				100
				101	case CLPAIR(IEEE754_CLASS_DNORM, IEEE754_CLASS_DNORM):
				102	DPDNORMX;
				103
				104	case CLPAIR(IEEE754_CLASS_NORM, IEEE754_CLASS_DNORM):
				105	DPDNORMY;
				106	break;
				107
				108	case CLPAIR(IEEE754_CLASS_DNORM, IEEE754_CLASS_NORM):
				109	DPDNORMX;
				110	break;
				111
				112	case CLPAIR(IEEE754_CLASS_NORM, IEEE754_CLASS_NORM):
				113	break;
				114	}
Lucas De Marchi	25985ed	2011-03-30 22:57:33 -0300	[diff] [blame]	115	/* rm = xm * ym, re = xe+ye basically */
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	116	assert(xm & DP_HIDDEN_BIT);
				117	assert(ym & DP_HIDDEN_BIT);
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	118
Ralf Baechle	3f7cac4	2014-04-26 01:49:14 +0200	[diff] [blame]	119	re = xe + ye;
				120	rs = xs ^ ys;
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	121
Ralf Baechle	3f7cac4	2014-04-26 01:49:14 +0200	[diff] [blame]	122	/* shunt to top of word */
				123	xm <<= 64 - (DP_FBITS + 1);
				124	ym <<= 64 - (DP_FBITS + 1);
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	125
Ralf Baechle	3f7cac4	2014-04-26 01:49:14 +0200	[diff] [blame]	126	/*
				127	* Multiply 32 bits xm, ym to give high 32 bits rm with stickness.
				128	*/
				129
				130	/* 32 * 32 => 64 */
Ralf Baechle	21a151d	2007-10-11 23:46:15 +0100	[diff] [blame]	131	#define DPXMULT(x, y) ((u64)(x) * (u64)y)
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	132
Ralf Baechle	3f7cac4	2014-04-26 01:49:14 +0200	[diff] [blame]	133	lxm = xm;
				134	hxm = xm >> 32;
				135	lym = ym;
				136	hym = ym >> 32;
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	137
Ralf Baechle	3f7cac4	2014-04-26 01:49:14 +0200	[diff] [blame]	138	lrm = DPXMULT(lxm, lym);
				139	hrm = DPXMULT(hxm, hym);
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	140
Ralf Baechle	3f7cac4	2014-04-26 01:49:14 +0200	[diff] [blame]	141	t = DPXMULT(lxm, hym);
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	142
Ralf Baechle	3f7cac4	2014-04-26 01:49:14 +0200	[diff] [blame]	143	at = lrm + (t << 32);
				144	hrm += at < lrm;
				145	lrm = at;
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	146
Ralf Baechle	3f7cac4	2014-04-26 01:49:14 +0200	[diff] [blame]	147	hrm = hrm + (t >> 32);
				148
				149	t = DPXMULT(hxm, lym);
				150
				151	at = lrm + (t << 32);
				152	hrm += at < lrm;
				153	lrm = at;
				154
				155	hrm = hrm + (t >> 32);
				156
				157	rm = hrm \| (lrm != 0);
				158
				159	/*
				160	* Sticky shift down to normal rounding precision.
				161	*/
				162	if ((s64) rm < 0) {
				163	rm = (rm >> (64 - (DP_FBITS + 1 + 3))) \|
				164	((rm << (DP_FBITS + 1 + 3)) != 0);
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	165	re++;
Ralf Baechle	3f7cac4	2014-04-26 01:49:14 +0200	[diff] [blame]	166	} else {
				167	rm = (rm >> (64 - (DP_FBITS + 1 + 3 + 1))) \|
				168	((rm << (DP_FBITS + 1 + 3 + 1)) != 0);
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	169	}
Ralf Baechle	3f7cac4	2014-04-26 01:49:14 +0200	[diff] [blame]	170	assert(rm & (DP_HIDDEN_BIT << 3));
				171
				172	return ieee754dp_format(rs, re, rm);
Linus Torvalds	1da177e	2005-04-16 15:20:36 -0700	[diff] [blame]	173	}