Blame - src/opts/Sk4px_SSE2.h - platform/external/skia

blob: 6ce6dd56980321bbc7ca679e17966a42219c73ae [file] [log] [blame]

mtklein	d2ffd36	2015-05-12 06:11:21 -0700	[diff] [blame]	1	/*
				2	* Copyright 2015 Google Inc.
				3	*
				4	* Use of this source code is governed by a BSD-style license that can be
				5	* found in the LICENSE file.
				6	*/
				7
Mike Klein	c33d614	2018-12-12 08:47:54 -0500	[diff] [blame]	8	namespace { // NOLINT(google-build-namespaces)
mtklein	aa999cb	2015-05-22 17:18:21 -0700	[diff] [blame]	9
Mike Klein	7dfe6d9	2018-12-18 14:53:37 -0500	[diff] [blame]	10	inline Sk4px::Wide Sk4px::widen() const {
mtklein	d2ffd36	2015-05-12 06:11:21 -0700	[diff] [blame]	11	return Sk16h(_mm_unpacklo_epi8(this->fVec, _mm_setzero_si128()),
				12	_mm_unpackhi_epi8(this->fVec, _mm_setzero_si128()));
				13	}
				14
mtklein	082e329	2015-08-12 11:56:43 -0700	[diff] [blame]	15	inline Sk4px::Wide Sk4px::mulWiden(const Sk16b& other) const {
Mike Klein	7dfe6d9	2018-12-18 14:53:37 -0500	[diff] [blame]	16	return this->widen() * Sk4px(other).widen();
mtklein	d2ffd36	2015-05-12 06:11:21 -0700	[diff] [blame]	17	}
				18
mtklein	082e329	2015-08-12 11:56:43 -0700	[diff] [blame]	19	inline Sk4px Sk4px::Wide::addNarrowHi(const Sk16h& other) const {
mtklein	d2ffd36	2015-05-12 06:11:21 -0700	[diff] [blame]	20	Sk4px::Wide r = (*this + other) >> 8;
				21	return Sk4px(_mm_packus_epi16(r.fLo.fVec, r.fHi.fVec));
				22	}
mtklein	8a90edc	2015-05-13 12:19:42 -0700	[diff] [blame]	23
mtklein	cbf4fba	2015-11-17 14:19:52 -0800	[diff] [blame]	24	inline Sk4px Sk4px::Wide::div255() const {
				25	// (x + 127) / 255 == ((x+128) * 257)>>16,
				26	// and _mm_mulhi_epu16 makes the (_ * 257)>>16 part very convenient.
				27	const __m128i _128 = _mm_set1_epi16(128),
				28	_257 = _mm_set1_epi16(257);
				29	return Sk4px(_mm_packus_epi16(_mm_mulhi_epu16(_mm_add_epi16(fLo.fVec, _128), _257),
				30	_mm_mulhi_epu16(_mm_add_epi16(fHi.fVec, _128), _257)));
				31	}
				32
mtklein	8a90edc	2015-05-13 12:19:42 -0700	[diff] [blame]	33	// Load4Alphas and Load2Alphas use possibly-unaligned loads (SkAlpha[] -> uint16_t or uint32_t).
				34	// These are safe on x86, often with no speed penalty.
				35
				36	#if SK_CPU_SSE_LEVEL >= SK_CPU_SSE_LEVEL_SSSE3
mtklein	082e329	2015-08-12 11:56:43 -0700	[diff] [blame]	37	inline Sk4px Sk4px::alphas() const {
mtklein	8a90edc	2015-05-13 12:19:42 -0700	[diff] [blame]	38	static_assert(SK_A32_SHIFT == 24, "Intel's always little-endian.");
				39	__m128i splat = _mm_set_epi8(15,15,15,15, 11,11,11,11, 7,7,7,7, 3,3,3,3);
				40	return Sk16b(_mm_shuffle_epi8(this->fVec, splat));
				41	}
				42
mtklein	082e329	2015-08-12 11:56:43 -0700	[diff] [blame]	43	inline Sk4px Sk4px::Load4Alphas(const SkAlpha a[4]) {
Mike Klein	475c5e9	2018-08-08 10:23:17 -0400	[diff] [blame]	44	uint32_t as;
				45	memcpy(&as, a, 4);
mtklein	8a90edc	2015-05-13 12:19:42 -0700	[diff] [blame]	46	__m128i splat = _mm_set_epi8(3,3,3,3, 2,2,2,2, 1,1,1,1, 0,0,0,0);
				47	return Sk16b(_mm_shuffle_epi8(_mm_cvtsi32_si128(as), splat));
				48	}
				49	#else
mtklein	082e329	2015-08-12 11:56:43 -0700	[diff] [blame]	50	inline Sk4px Sk4px::alphas() const {
mtklein	8a90edc	2015-05-13 12:19:42 -0700	[diff] [blame]	51	static_assert(SK_A32_SHIFT == 24, "Intel's always little-endian.");
mtklein	f769c1f	2015-11-17 12:05:57 -0800	[diff] [blame]	52	// We exploit that A >= rgb for any premul pixel.
				53	__m128i as = fVec; // 3xxx 2xxx 1xxx 0xxx
				54	as = _mm_max_epu8(as, _mm_srli_epi32(as, 8)); // 33xx 22xx 11xx 00xx
				55	as = _mm_max_epu8(as, _mm_srli_epi32(as, 16)); // 3333 2222 1111 0000
mtklein	8a90edc	2015-05-13 12:19:42 -0700	[diff] [blame]	56	return Sk16b(as);
				57	}
				58
mtklein	082e329	2015-08-12 11:56:43 -0700	[diff] [blame]	59	inline Sk4px Sk4px::Load4Alphas(const SkAlpha a[4]) {
Mike Klein	475c5e9	2018-08-08 10:23:17 -0400	[diff] [blame]	60	__m128i as;
				61	memcpy(&as, a, 4); // ____ ____ ____ 3210
				62	as = _mm_unpacklo_epi8 (as, as); // ____ ____ 3322 1100
				63	as = _mm_unpacklo_epi16(as, as); // 3333 2222 1111 0000
mtklein	8a90edc	2015-05-13 12:19:42 -0700	[diff] [blame]	64	return Sk16b(as);
				65	}
				66	#endif
				67
mtklein	082e329	2015-08-12 11:56:43 -0700	[diff] [blame]	68	inline Sk4px Sk4px::Load2Alphas(const SkAlpha a[2]) {
Mike Klein	475c5e9	2018-08-08 10:23:17 -0400	[diff] [blame]	69	uint16_t alphas;
				70	memcpy(&alphas, a, 2);
				71	uint32_t alphas_and_two_zeros = alphas; // Aa -> Aa00
				72
				73	return Load4Alphas((const SkAlpha*)&alphas_and_two_zeros);
mtklein	8a90edc	2015-05-13 12:19:42 -0700	[diff] [blame]	74	}
mtklein	0135a41	2015-05-15 10:36:21 -0700	[diff] [blame]	75
mtklein	082e329	2015-08-12 11:56:43 -0700	[diff] [blame]	76	} // namespace