Blame - include/private/SkVx.h - platform/external/skia

blob: 9d8f773a2e09c3342f53a8a1c27b5541fcf3fee4 [file] [log] [blame]

Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	1	/*
				2	* Copyright 2019 Google Inc.
				3	*
				4	* Use of this source code is governed by a BSD-style license that can be
				5	* found in the LICENSE file.
				6	*/
				7
				8	#ifndef SKVX_DEFINED
				9	#define SKVX_DEFINED
				10
				11	// skvx::Vec<N,T> are SIMD vectors of N T's, a v1.5 successor to SkNx<N,T>.
				12	//
				13	// This time we're leaning a bit less on platform-specific intrinsics and a bit
				14	// more on Clang/GCC vector extensions, but still keeping the option open to
				15	// drop in platform-specific intrinsics, actually more easily than before.
				16	//
				17	// We've also fixed a few of the caveats that used to make SkNx awkward to work
				18	// with across translation units. skvx::Vec<N,T> always has N*sizeof(T) size
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	19	// and alignment and is safe to use across translation units freely.
				20	// Ideally we'd only align to T, but that tanks ARMv7 NEON codegen.
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	21
Mike Klein	7d3b27d	2019-06-07 10:57:58 -0500	[diff] [blame]	22	// Please try to keep this file independent of Skia headers.
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	23	#include <algorithm> // std::min, std::max
Mike Klein	41b995c	2019-02-27 10:24:55 -0600	[diff] [blame]	24	#include <cmath> // std::ceil, std::floor, std::trunc, std::round, std::sqrt, etc.
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	25	#include <cstdint> // intXX_t
				26	#include <cstring> // memcpy()
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	27	#include <initializer_list> // std::initializer_list
				28
Mike Klein	5caf7de	2020-03-12 11:05:46 -0500	[diff] [blame]	29	#if defined(__SSE__) \|\| defined(__AVX__) \|\| defined(__AVX2__)
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	30	#include <immintrin.h>
Mike Klein	7d3b27d	2019-06-07 10:57:58 -0500	[diff] [blame]	31	#elif defined(__ARM_NEON)
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	32	#include <arm_neon.h>
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	33	#elif defined(__wasm_simd128__)
Elliot Evans	fe7e74b	2020-06-30 16:08:44 -0600	[diff] [blame]	34	#include <wasm_simd128.h>
				35	#endif
				36
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	37	// To avoid ODR violations, all methods must be force-inlined...
Mike Klein	21ef0d5	2019-12-17 11:40:14 -0600	[diff] [blame]	38	#if defined(_MSC_VER)
				39	#define SKVX_ALWAYS_INLINE __forceinline
				40	#else
				41	#define SKVX_ALWAYS_INLINE __attribute__((always_inline))
				42	#endif
				43
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	44	// ... and all standalone functions must be static. Please use these helpers:
				45	#define SI static inline
				46	#define SIT template < typename T> SI
				47	#define SIN template <int N > SI
				48	#define SINT template <int N, typename T> SI
Mike Klein	21ef0d5	2019-12-17 11:40:14 -0600	[diff] [blame]	49	#define SINTU template <int N, typename T, typename U, \
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	50	typename=std::enable_if_t<std::is_convertible<U,T>::value>> SI
Mike Klein	41b995c	2019-02-27 10:24:55 -0600	[diff] [blame]	51
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	52	namespace skvx {
				53
				54	// All Vec have the same simple memory layout, the same as `T vec[N]`.
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	55	template <int N, typename T>
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	56	struct alignas(N*sizeof(T)) Vec {
Mike Klein	96e4e53	2019-04-16 11:36:55 -0500	[diff] [blame]	57	static_assert((N & (N-1)) == 0, "N must be a power of 2.");
				58	static_assert(sizeof(T) >= alignof(T), "What kind of crazy T is this?");
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	59
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	60	Vec<N/2,T> lo, hi;
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	61
Mike Klein	4292515	2019-02-06 11:56:58 -0500	[diff] [blame]	62	// Methods belong here in the class declaration of Vec only if:
				63	// - they must be here, like constructors or operator[];
				64	// - they'll definitely never want a specialized implementation.
				65	// Other operations on Vec should be defined outside the type.
				66
Mike Klein	21ef0d5	2019-12-17 11:40:14 -0600	[diff] [blame]	67	SKVX_ALWAYS_INLINE Vec() = default;
Mike Klein	f4438d5	2019-03-14 13:30:42 -0500	[diff] [blame]	68
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	69	template <typename U, typename=std::enable_if_t<std::is_convertible<U,T>::value>>
Mike Klein	21ef0d5	2019-12-17 11:40:14 -0600	[diff] [blame]	70	SKVX_ALWAYS_INLINE
Mike Klein	f4438d5	2019-03-14 13:30:42 -0500	[diff] [blame]	71	Vec(U x) : lo(x), hi(x) {}
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	72
Mike Klein	21ef0d5	2019-12-17 11:40:14 -0600	[diff] [blame]	73	SKVX_ALWAYS_INLINE Vec(std::initializer_list<T> xs) {
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	74	T vals[N] = {0};
				75	memcpy(vals, xs.begin(), std::min(xs.size(), (size_t)N)*sizeof(T));
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	76
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	77	lo = Vec<N/2,T>::Load(vals + 0);
				78	hi = Vec<N/2,T>::Load(vals + N/2);
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	79	}
				80
Mike Klein	21ef0d5	2019-12-17 11:40:14 -0600	[diff] [blame]	81	SKVX_ALWAYS_INLINE T operator[](int i) const { return i < N/2 ? lo[i] : hi[i-N/2]; }
				82	SKVX_ALWAYS_INLINE T& operator[](int i) { return i < N/2 ? lo[i] : hi[i-N/2]; }
Mike Klein	4292515	2019-02-06 11:56:58 -0500	[diff] [blame]	83
Mike Klein	21ef0d5	2019-12-17 11:40:14 -0600	[diff] [blame]	84	SKVX_ALWAYS_INLINE static Vec Load(const void* ptr) {
Mike Klein	4292515	2019-02-06 11:56:58 -0500	[diff] [blame]	85	Vec v;
				86	memcpy(&v, ptr, sizeof(Vec));
				87	return v;
				88	}
Mike Klein	21ef0d5	2019-12-17 11:40:14 -0600	[diff] [blame]	89	SKVX_ALWAYS_INLINE void store(void* ptr) const {
Mike Klein	4292515	2019-02-06 11:56:58 -0500	[diff] [blame]	90	memcpy(ptr, this, sizeof(Vec));
				91	}
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	92	};
				93
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	94	template <typename T>
				95	struct Vec<1,T> {
				96	T val;
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	97
Mike Klein	21ef0d5	2019-12-17 11:40:14 -0600	[diff] [blame]	98	SKVX_ALWAYS_INLINE Vec() = default;
Mike Klein	f4438d5	2019-03-14 13:30:42 -0500	[diff] [blame]	99
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	100	template <typename U, typename=std::enable_if_t<std::is_convertible<U,T>::value>>
Mike Klein	21ef0d5	2019-12-17 11:40:14 -0600	[diff] [blame]	101	SKVX_ALWAYS_INLINE
Mike Klein	f4438d5	2019-03-14 13:30:42 -0500	[diff] [blame]	102	Vec(U x) : val(x) {}
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	103
Mike Klein	21ef0d5	2019-12-17 11:40:14 -0600	[diff] [blame]	104	SKVX_ALWAYS_INLINE Vec(std::initializer_list<T> xs) : val(xs.size() ? *xs.begin() : 0) {}
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	105
Mike Klein	21ef0d5	2019-12-17 11:40:14 -0600	[diff] [blame]	106	SKVX_ALWAYS_INLINE T operator[](int) const { return val; }
				107	SKVX_ALWAYS_INLINE T& operator[](int) { return val; }
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	108
Mike Klein	21ef0d5	2019-12-17 11:40:14 -0600	[diff] [blame]	109	SKVX_ALWAYS_INLINE static Vec Load(const void* ptr) {
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	110	Vec v;
				111	memcpy(&v, ptr, sizeof(Vec));
				112	return v;
				113	}
Mike Klein	21ef0d5	2019-12-17 11:40:14 -0600	[diff] [blame]	114	SKVX_ALWAYS_INLINE void store(void* ptr) const {
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	115	memcpy(ptr, this, sizeof(Vec));
				116	}
				117	};
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	118
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	119	template <typename D, typename S>
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	120	SI D unchecked_bit_pun(const S& s) {
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	121	D d;
				122	memcpy(&d, &s, sizeof(D));
				123	return d;
				124	}
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	125
Mike Klein	5cb47d6	2020-07-10 15:46:46 -0500	[diff] [blame]	126	template <typename D, typename S>
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	127	SI D bit_pun(const S& s) {
Mike Klein	5cb47d6	2020-07-10 15:46:46 -0500	[diff] [blame]	128	static_assert(sizeof(D) == sizeof(S), "");
				129	return unchecked_bit_pun<D>(s);
				130	}
				131
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	132	// Translate from a value type T to its corresponding Mask, the result of a comparison.
Mike Klein	cd9ef73	2019-02-09 13:48:54 -0500	[diff] [blame]	133	template <typename T> struct Mask { using type = T; };
				134	template <> struct Mask<float > { using type = int32_t; };
				135	template <> struct Mask<double> { using type = int64_t; };
				136	template <typename T> using M = typename Mask<T>::type;
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	137
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	138	// Join two Vec<N,T> into one Vec<2N,T>.
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	139	SINT Vec<2*N,T> join(const Vec<N,T>& lo, const Vec<N,T>& hi) {
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	140	Vec<2*N,T> v;
				141	v.lo = lo;
				142	v.hi = hi;
				143	return v;
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	144	}
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	145
				146	// We have two default strategies for implementing most operations:
				147	// 1) lean on Clang/GCC vector extensions when available;
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	148	// 2) recurse to scalar portable implementations when not.
				149	// At the end we can drop in platform-specific implementations that override either default.
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	150
Mike Klein	4292515	2019-02-06 11:56:58 -0500	[diff] [blame]	151	#if !defined(SKNX_NO_SIMD) && (defined(__clang__) \|\| defined(__GNUC__))
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	152
				153	// VExt<N,T> types have the same size as Vec<N,T> and support most operations directly.
				154	// N.B. VExt<N,T> alignment is N*alignof(T), stricter than Vec<N,T>'s alignof(T).
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	155	#if defined(__clang__)
				156	template <int N, typename T>
				157	using VExt = T __attribute__((ext_vector_type(N)));
				158
				159	#elif defined(__GNUC__)
				160	template <int N, typename T>
				161	struct VExtHelper {
				162	typedef T __attribute__((vector_size(N*sizeof(T)))) type;
				163	};
				164
				165	template <int N, typename T>
				166	using VExt = typename VExtHelper<N,T>::type;
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	167
				168	// For some reason some (new!) versions of GCC cannot seem to deduce N in the generic
				169	// to_vec<N,T>() below for N=4 and T=float. This workaround seems to help...
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	170	SI Vec<4,float> to_vec(VExt<4,float> v) { return bit_pun<Vec<4,float>>(v); }
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	171	#endif
				172
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	173	SINT VExt<N,T> to_vext(const Vec<N,T>& v) { return bit_pun<VExt<N,T>>(v); }
				174	SINT Vec <N,T> to_vec(const VExt<N,T>& v) { return bit_pun<Vec <N,T>>(v); }
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	175
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	176	SINT Vec<N,T> operator+(const Vec<N,T>& x, const Vec<N,T>& y) {
				177	return to_vec<N,T>(to_vext(x) + to_vext(y));
				178	}
				179	SINT Vec<N,T> operator-(const Vec<N,T>& x, const Vec<N,T>& y) {
				180	return to_vec<N,T>(to_vext(x) - to_vext(y));
				181	}
				182	SINT Vec<N,T> operator*(const Vec<N,T>& x, const Vec<N,T>& y) {
				183	return to_vec<N,T>(to_vext(x) * to_vext(y));
				184	}
				185	SINT Vec<N,T> operator/(const Vec<N,T>& x, const Vec<N,T>& y) {
				186	return to_vec<N,T>(to_vext(x) / to_vext(y));
				187	}
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	188
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	189	SINT Vec<N,T> operator^(const Vec<N,T>& x, const Vec<N,T>& y) {
				190	return to_vec<N,T>(to_vext(x) ^ to_vext(y));
				191	}
				192	SINT Vec<N,T> operator&(const Vec<N,T>& x, const Vec<N,T>& y) {
				193	return to_vec<N,T>(to_vext(x) & to_vext(y));
				194	}
				195	SINT Vec<N,T> operator\|(const Vec<N,T>& x, const Vec<N,T>& y) {
				196	return to_vec<N,T>(to_vext(x) \| to_vext(y));
				197	}
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	198
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	199	SINT Vec<N,T> operator!(const Vec<N,T>& x) { return to_vec<N,T>(!to_vext(x)); }
				200	SINT Vec<N,T> operator-(const Vec<N,T>& x) { return to_vec<N,T>(-to_vext(x)); }
				201	SINT Vec<N,T> operator~(const Vec<N,T>& x) { return to_vec<N,T>(~to_vext(x)); }
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	202
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	203	SINT Vec<N,T> operator<<(const Vec<N,T>& x, int k) { return to_vec<N,T>(to_vext(x) << k); }
				204	SINT Vec<N,T> operator>>(const Vec<N,T>& x, int k) { return to_vec<N,T>(to_vext(x) >> k); }
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	205
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	206	SINT Vec<N,M<T>> operator==(const Vec<N,T>& x, const Vec<N,T>& y) {
				207	return bit_pun<Vec<N,M<T>>>(to_vext(x) == to_vext(y));
				208	}
				209	SINT Vec<N,M<T>> operator!=(const Vec<N,T>& x, const Vec<N,T>& y) {
				210	return bit_pun<Vec<N,M<T>>>(to_vext(x) != to_vext(y));
				211	}
				212	SINT Vec<N,M<T>> operator<=(const Vec<N,T>& x, const Vec<N,T>& y) {
				213	return bit_pun<Vec<N,M<T>>>(to_vext(x) <= to_vext(y));
				214	}
				215	SINT Vec<N,M<T>> operator>=(const Vec<N,T>& x, const Vec<N,T>& y) {
				216	return bit_pun<Vec<N,M<T>>>(to_vext(x) >= to_vext(y));
				217	}
				218	SINT Vec<N,M<T>> operator< (const Vec<N,T>& x, const Vec<N,T>& y) {
				219	return bit_pun<Vec<N,M<T>>>(to_vext(x) < to_vext(y));
				220	}
				221	SINT Vec<N,M<T>> operator> (const Vec<N,T>& x, const Vec<N,T>& y) {
				222	return bit_pun<Vec<N,M<T>>>(to_vext(x) > to_vext(y));
				223	}
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	224
				225	#else
				226
				227	// Either SKNX_NO_SIMD is defined, or Clang/GCC vector extensions are not available.
				228	// We'll implement things portably, in a way that should be easily autovectorizable.
				229
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	230	// N == 1 scalar implementations.
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	231	SIT Vec<1,T> operator+(const Vec<1,T>& x, const Vec<1,T>& y) { return x.val + y.val; }
				232	SIT Vec<1,T> operator-(const Vec<1,T>& x, const Vec<1,T>& y) { return x.val - y.val; }
				233	SIT Vec<1,T> operator(const Vec<1,T>& x, const Vec<1,T>& y) { return x.val y.val; }
				234	SIT Vec<1,T> operator/(const Vec<1,T>& x, const Vec<1,T>& y) { return x.val / y.val; }
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	235
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	236	SIT Vec<1,T> operator^(const Vec<1,T>& x, const Vec<1,T>& y) { return x.val ^ y.val; }
				237	SIT Vec<1,T> operator&(const Vec<1,T>& x, const Vec<1,T>& y) { return x.val & y.val; }
				238	SIT Vec<1,T> operator\|(const Vec<1,T>& x, const Vec<1,T>& y) { return x.val \| y.val; }
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	239
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	240	SIT Vec<1,T> operator!(const Vec<1,T>& x) { return !x.val; }
				241	SIT Vec<1,T> operator-(const Vec<1,T>& x) { return -x.val; }
				242	SIT Vec<1,T> operator~(const Vec<1,T>& x) { return ~x.val; }
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	243
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	244	SIT Vec<1,T> operator<<(const Vec<1,T>& x, int k) { return x.val << k; }
				245	SIT Vec<1,T> operator>>(const Vec<1,T>& x, int k) { return x.val >> k; }
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	246
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	247	SIT Vec<1,M<T>> operator==(const Vec<1,T>& x, const Vec<1,T>& y) {
				248	return x.val == y.val ? ~0 : 0;
				249	}
				250	SIT Vec<1,M<T>> operator!=(const Vec<1,T>& x, const Vec<1,T>& y) {
				251	return x.val != y.val ? ~0 : 0;
				252	}
				253	SIT Vec<1,M<T>> operator<=(const Vec<1,T>& x, const Vec<1,T>& y) {
				254	return x.val <= y.val ? ~0 : 0;
				255	}
				256	SIT Vec<1,M<T>> operator>=(const Vec<1,T>& x, const Vec<1,T>& y) {
				257	return x.val >= y.val ? ~0 : 0;
				258	}
				259	SIT Vec<1,M<T>> operator< (const Vec<1,T>& x, const Vec<1,T>& y) {
				260	return x.val < y.val ? ~0 : 0;
				261	}
				262	SIT Vec<1,M<T>> operator> (const Vec<1,T>& x, const Vec<1,T>& y) {
				263	return x.val > y.val ? ~0 : 0;
				264	}
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	265
				266	// All default N != 1 implementations just recurse on lo and hi halves.
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	267	SINT Vec<N,T> operator+(const Vec<N,T>& x, const Vec<N,T>& y) {
				268	return join(x.lo + y.lo, x.hi + y.hi);
				269	}
				270	SINT Vec<N,T> operator-(const Vec<N,T>& x, const Vec<N,T>& y) {
				271	return join(x.lo - y.lo, x.hi - y.hi);
				272	}
				273	SINT Vec<N,T> operator*(const Vec<N,T>& x, const Vec<N,T>& y) {
				274	return join(x.lo * y.lo, x.hi * y.hi);
				275	}
				276	SINT Vec<N,T> operator/(const Vec<N,T>& x, const Vec<N,T>& y) {
				277	return join(x.lo / y.lo, x.hi / y.hi);
				278	}
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	279
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	280	SINT Vec<N,T> operator^(const Vec<N,T>& x, const Vec<N,T>& y) {
				281	return join(x.lo ^ y.lo, x.hi ^ y.hi);
				282	}
				283	SINT Vec<N,T> operator&(const Vec<N,T>& x, const Vec<N,T>& y) {
				284	return join(x.lo & y.lo, x.hi & y.hi);
				285	}
				286	SINT Vec<N,T> operator\|(const Vec<N,T>& x, const Vec<N,T>& y) {
				287	return join(x.lo \| y.lo, x.hi \| y.hi);
				288	}
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	289
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	290	SINT Vec<N,T> operator!(const Vec<N,T>& x) { return join(!x.lo, !x.hi); }
				291	SINT Vec<N,T> operator-(const Vec<N,T>& x) { return join(-x.lo, -x.hi); }
				292	SINT Vec<N,T> operator~(const Vec<N,T>& x) { return join(~x.lo, ~x.hi); }
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	293
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	294	SINT Vec<N,T> operator<<(const Vec<N,T>& x, int k) { return join(x.lo << k, x.hi << k); }
				295	SINT Vec<N,T> operator>>(const Vec<N,T>& x, int k) { return join(x.lo >> k, x.hi >> k); }
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	296
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	297	SINT Vec<N,M<T>> operator==(const Vec<N,T>& x, const Vec<N,T>& y) {
				298	return join(x.lo == y.lo, x.hi == y.hi);
				299	}
				300	SINT Vec<N,M<T>> operator!=(const Vec<N,T>& x, const Vec<N,T>& y) {
				301	return join(x.lo != y.lo, x.hi != y.hi);
				302	}
				303	SINT Vec<N,M<T>> operator<=(const Vec<N,T>& x, const Vec<N,T>& y) {
				304	return join(x.lo <= y.lo, x.hi <= y.hi);
				305	}
				306	SINT Vec<N,M<T>> operator>=(const Vec<N,T>& x, const Vec<N,T>& y) {
				307	return join(x.lo >= y.lo, x.hi >= y.hi);
				308	}
				309	SINT Vec<N,M<T>> operator< (const Vec<N,T>& x, const Vec<N,T>& y) {
				310	return join(x.lo < y.lo, x.hi < y.hi);
				311	}
				312	SINT Vec<N,M<T>> operator> (const Vec<N,T>& x, const Vec<N,T>& y) {
				313	return join(x.lo > y.lo, x.hi > y.hi);
				314	}
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	315	#endif
				316
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	317	// Some operations we want are not expressible with Clang/GCC vector
				318	// extensions, so we implement them using the recursive approach.
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	319
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	320	// N == 1 scalar implementations.
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	321	SIT Vec<1,T> if_then_else(const Vec<1,M<T>>& cond, const Vec<1,T>& t, const Vec<1,T>& e) {
Mike Klein	5cb47d6	2020-07-10 15:46:46 -0500	[diff] [blame]	322	// In practice this scalar implementation is unlikely to be used. See if_then_else() below.
				323	return bit_pun<Vec<1,T>>(( cond & bit_pun<Vec<1, M<T>>>(t)) \|
				324	(~cond & bit_pun<Vec<1, M<T>>>(e)) );
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	325	}
				326
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	327	SIT bool any(const Vec<1,T>& x) { return x.val != 0; }
				328	SIT bool all(const Vec<1,T>& x) { return x.val != 0; }
Mike Klein	4292515	2019-02-06 11:56:58 -0500	[diff] [blame]	329
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	330	SIT T min(const Vec<1,T>& x) { return x.val; }
				331	SIT T max(const Vec<1,T>& x) { return x.val; }
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	332
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	333	SIT Vec<1,T> min(const Vec<1,T>& x, const Vec<1,T>& y) { return std::min(x.val, y.val); }
				334	SIT Vec<1,T> max(const Vec<1,T>& x, const Vec<1,T>& y) { return std::max(x.val, y.val); }
Florin Malita	3facc9c	2020-05-04 09:26:15 -0400	[diff] [blame]	335	SIT Vec<1,T> pow(const Vec<1,T>& x, const Vec<1,T>& y) { return std::pow(x.val, y.val); }
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	336
Mike Reed	8520e76	2020-04-30 12:06:23 -0400	[diff] [blame]	337	SIT Vec<1,T> atan(const Vec<1,T>& x) { return std:: atan(x.val); }
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	338	SIT Vec<1,T> ceil(const Vec<1,T>& x) { return std:: ceil(x.val); }
				339	SIT Vec<1,T> floor(const Vec<1,T>& x) { return std::floor(x.val); }
				340	SIT Vec<1,T> trunc(const Vec<1,T>& x) { return std::trunc(x.val); }
				341	SIT Vec<1,T> round(const Vec<1,T>& x) { return std::round(x.val); }
				342	SIT Vec<1,T> sqrt(const Vec<1,T>& x) { return std:: sqrt(x.val); }
				343	SIT Vec<1,T> abs(const Vec<1,T>& x) { return std:: abs(x.val); }
Mike Klein	c216025	2020-04-29 09:56:56 -0500	[diff] [blame]	344	SIT Vec<1,T> sin(const Vec<1,T>& x) { return std:: sin(x.val); }
				345	SIT Vec<1,T> cos(const Vec<1,T>& x) { return std:: cos(x.val); }
				346	SIT Vec<1,T> tan(const Vec<1,T>& x) { return std:: tan(x.val); }
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	347
Mike Klein	5caf7de	2020-03-12 11:05:46 -0500	[diff] [blame]	348	SIT Vec<1,int> lrint(const Vec<1,T>& x) { return (int)std::lrint(x.val); }
				349
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	350	SIT Vec<1,T> rcp(const Vec<1,T>& x) { return 1 / x.val; }
				351	SIT Vec<1,T> rsqrt(const Vec<1,T>& x) { return rcp(sqrt(x)); }
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	352
				353	// All default N != 1 implementations just recurse on lo and hi halves.
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	354	SINT Vec<N,T> if_then_else(const Vec<N,M<T>>& cond, const Vec<N,T>& t, const Vec<N,T>& e) {
Mike Klein	5cb47d6	2020-07-10 15:46:46 -0500	[diff] [blame]	355	// Specializations inline here so they can generalize what types the apply to.
				356	// (This header is used in C++14 contexts, so we have to kind of fake constexpr if.)
				357	#if defined(__AVX__)
Mike Klein	c3ad6a1	2020-09-15 15:26:22 -0500	[diff] [blame^]	358	if /constexpr/ (N*sizeof(T) == 32) {
				359	return unchecked_bit_pun<Vec<N,T>>(_mm256_blendv_epi8(unchecked_bit_pun<__m256i>(e),
				360	unchecked_bit_pun<__m256i>(t),
				361	unchecked_bit_pun<__m256i>(cond)));
Mike Klein	5cb47d6	2020-07-10 15:46:46 -0500	[diff] [blame]	362	}
				363	#endif
				364	#if defined(__SSE4_1__)
Mike Klein	c3ad6a1	2020-09-15 15:26:22 -0500	[diff] [blame^]	365	if /constexpr/ (N*sizeof(T) == 16) {
				366	return unchecked_bit_pun<Vec<N,T>>(_mm_blendv_epi8(unchecked_bit_pun<__m128i>(e),
				367	unchecked_bit_pun<__m128i>(t),
				368	unchecked_bit_pun<__m128i>(cond)));
Mike Klein	5cb47d6	2020-07-10 15:46:46 -0500	[diff] [blame]	369	}
				370	#endif
				371	#if defined(__ARM_NEON)
Mike Klein	c3ad6a1	2020-09-15 15:26:22 -0500	[diff] [blame^]	372	if /constexpr/ (N*sizeof(T) == 16) {
				373	return unchecked_bit_pun<Vec<N,T>>(vbslq_u8(unchecked_bit_pun<uint8x16_t>(cond),
				374	unchecked_bit_pun<uint8x16_t>(t),
				375	unchecked_bit_pun<uint8x16_t>(e)));
Mike Klein	5cb47d6	2020-07-10 15:46:46 -0500	[diff] [blame]	376	}
				377	#endif
				378	// Recurse for large vectors to try to hit the specializations above.
Mike Klein	c3ad6a1	2020-09-15 15:26:22 -0500	[diff] [blame^]	379	if /constexpr/ (N*sizeof(T) > 16) {
Mike Klein	5cb47d6	2020-07-10 15:46:46 -0500	[diff] [blame]	380	return join(if_then_else(cond.lo, t.lo, e.lo),
				381	if_then_else(cond.hi, t.hi, e.hi));
				382	}
				383	// This default can lead to better code than the recursing onto scalars.
				384	return bit_pun<Vec<N,T>>(( cond & bit_pun<Vec<N, M<T>>>(t)) \|
				385	(~cond & bit_pun<Vec<N, M<T>>>(e)) );
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	386	}
				387
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	388	SINT bool any(const Vec<N,T>& x) { return any(x.lo) \|\| any(x.hi); }
				389	SINT bool all(const Vec<N,T>& x) { return all(x.lo) && all(x.hi); }
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	390
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	391	SINT T min(const Vec<N,T>& x) { return std::min(min(x.lo), min(x.hi)); }
				392	SINT T max(const Vec<N,T>& x) { return std::max(max(x.lo), max(x.hi)); }
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	393
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	394	SINT Vec<N,T> min(const Vec<N,T>& x, const Vec<N,T>& y) {
				395	return join(min(x.lo, y.lo), min(x.hi, y.hi));
				396	}
				397	SINT Vec<N,T> max(const Vec<N,T>& x, const Vec<N,T>& y) {
				398	return join(max(x.lo, y.lo), max(x.hi, y.hi));
				399	}
				400	SINT Vec<N,T> pow(const Vec<N,T>& x, const Vec<N,T>& y) {
				401	return join(pow(x.lo, y.lo), pow(x.hi, y.hi));
				402	}
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	403
Mike Reed	8520e76	2020-04-30 12:06:23 -0400	[diff] [blame]	404	SINT Vec<N,T> atan(const Vec<N,T>& x) { return join( atan(x.lo), atan(x.hi)); }
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	405	SINT Vec<N,T> ceil(const Vec<N,T>& x) { return join( ceil(x.lo), ceil(x.hi)); }
				406	SINT Vec<N,T> floor(const Vec<N,T>& x) { return join(floor(x.lo), floor(x.hi)); }
				407	SINT Vec<N,T> trunc(const Vec<N,T>& x) { return join(trunc(x.lo), trunc(x.hi)); }
				408	SINT Vec<N,T> round(const Vec<N,T>& x) { return join(round(x.lo), round(x.hi)); }
				409	SINT Vec<N,T> sqrt(const Vec<N,T>& x) { return join( sqrt(x.lo), sqrt(x.hi)); }
				410	SINT Vec<N,T> abs(const Vec<N,T>& x) { return join( abs(x.lo), abs(x.hi)); }
Mike Klein	c216025	2020-04-29 09:56:56 -0500	[diff] [blame]	411	SINT Vec<N,T> sin(const Vec<N,T>& x) { return join( sin(x.lo), sin(x.hi)); }
				412	SINT Vec<N,T> cos(const Vec<N,T>& x) { return join( cos(x.lo), cos(x.hi)); }
				413	SINT Vec<N,T> tan(const Vec<N,T>& x) { return join( tan(x.lo), tan(x.hi)); }
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	414
Mike Klein	5caf7de	2020-03-12 11:05:46 -0500	[diff] [blame]	415	SINT Vec<N,int> lrint(const Vec<N,T>& x) { return join(lrint(x.lo), lrint(x.hi)); }
				416
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	417	SINT Vec<N,T> rcp(const Vec<N,T>& x) { return join( rcp(x.lo), rcp(x.hi)); }
				418	SINT Vec<N,T> rsqrt(const Vec<N,T>& x) { return join(rsqrt(x.lo), rsqrt(x.hi)); }
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	419
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	420
Mike Klein	4292515	2019-02-06 11:56:58 -0500	[diff] [blame]	421	// Scalar/vector operations just splat the scalar to a vector...
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	422	SINTU Vec<N,T> operator+ (U x, const Vec<N,T>& y) { return Vec<N,T>(x) + y; }
				423	SINTU Vec<N,T> operator- (U x, const Vec<N,T>& y) { return Vec<N,T>(x) - y; }
				424	SINTU Vec<N,T> operator* (U x, const Vec<N,T>& y) { return Vec<N,T>(x) * y; }
				425	SINTU Vec<N,T> operator/ (U x, const Vec<N,T>& y) { return Vec<N,T>(x) / y; }
				426	SINTU Vec<N,T> operator^ (U x, const Vec<N,T>& y) { return Vec<N,T>(x) ^ y; }
				427	SINTU Vec<N,T> operator& (U x, const Vec<N,T>& y) { return Vec<N,T>(x) & y; }
				428	SINTU Vec<N,T> operator\| (U x, const Vec<N,T>& y) { return Vec<N,T>(x) \| y; }
				429	SINTU Vec<N,M<T>> operator==(U x, const Vec<N,T>& y) { return Vec<N,T>(x) == y; }
				430	SINTU Vec<N,M<T>> operator!=(U x, const Vec<N,T>& y) { return Vec<N,T>(x) != y; }
				431	SINTU Vec<N,M<T>> operator<=(U x, const Vec<N,T>& y) { return Vec<N,T>(x) <= y; }
				432	SINTU Vec<N,M<T>> operator>=(U x, const Vec<N,T>& y) { return Vec<N,T>(x) >= y; }
				433	SINTU Vec<N,M<T>> operator< (U x, const Vec<N,T>& y) { return Vec<N,T>(x) < y; }
				434	SINTU Vec<N,M<T>> operator> (U x, const Vec<N,T>& y) { return Vec<N,T>(x) > y; }
				435	SINTU Vec<N,T> min(U x, const Vec<N,T>& y) { return min(Vec<N,T>(x), y); }
				436	SINTU Vec<N,T> max(U x, const Vec<N,T>& y) { return max(Vec<N,T>(x), y); }
Florin Malita	3facc9c	2020-05-04 09:26:15 -0400	[diff] [blame]	437	SINTU Vec<N,T> pow(U x, const Vec<N,T>& y) { return pow(Vec<N,T>(x), y); }
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	438
Mike Klein	4292515	2019-02-06 11:56:58 -0500	[diff] [blame]	439	// ... and same deal for vector/scalar operations.
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	440	SINTU Vec<N,T> operator+ (const Vec<N,T>& x, U y) { return x + Vec<N,T>(y); }
				441	SINTU Vec<N,T> operator- (const Vec<N,T>& x, U y) { return x - Vec<N,T>(y); }
				442	SINTU Vec<N,T> operator* (const Vec<N,T>& x, U y) { return x * Vec<N,T>(y); }
				443	SINTU Vec<N,T> operator/ (const Vec<N,T>& x, U y) { return x / Vec<N,T>(y); }
				444	SINTU Vec<N,T> operator^ (const Vec<N,T>& x, U y) { return x ^ Vec<N,T>(y); }
				445	SINTU Vec<N,T> operator& (const Vec<N,T>& x, U y) { return x & Vec<N,T>(y); }
				446	SINTU Vec<N,T> operator\| (const Vec<N,T>& x, U y) { return x \| Vec<N,T>(y); }
				447	SINTU Vec<N,M<T>> operator==(const Vec<N,T>& x, U y) { return x == Vec<N,T>(y); }
				448	SINTU Vec<N,M<T>> operator!=(const Vec<N,T>& x, U y) { return x != Vec<N,T>(y); }
				449	SINTU Vec<N,M<T>> operator<=(const Vec<N,T>& x, U y) { return x <= Vec<N,T>(y); }
				450	SINTU Vec<N,M<T>> operator>=(const Vec<N,T>& x, U y) { return x >= Vec<N,T>(y); }
				451	SINTU Vec<N,M<T>> operator< (const Vec<N,T>& x, U y) { return x < Vec<N,T>(y); }
				452	SINTU Vec<N,M<T>> operator> (const Vec<N,T>& x, U y) { return x > Vec<N,T>(y); }
				453	SINTU Vec<N,T> min(const Vec<N,T>& x, U y) { return min(x, Vec<N,T>(y)); }
				454	SINTU Vec<N,T> max(const Vec<N,T>& x, U y) { return max(x, Vec<N,T>(y)); }
Florin Malita	3facc9c	2020-05-04 09:26:15 -0400	[diff] [blame]	455	SINTU Vec<N,T> pow(const Vec<N,T>& x, U y) { return pow(x, Vec<N,T>(y)); }
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	456
Mike Klein	4292515	2019-02-06 11:56:58 -0500	[diff] [blame]	457	// The various op= operators, for vectors...
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	458	SINT Vec<N,T>& operator+=(Vec<N,T>& x, const Vec<N,T>& y) { return (x = x + y); }
				459	SINT Vec<N,T>& operator-=(Vec<N,T>& x, const Vec<N,T>& y) { return (x = x - y); }
				460	SINT Vec<N,T>& operator=(Vec<N,T>& x, const Vec<N,T>& y) { return (x = x y); }
				461	SINT Vec<N,T>& operator/=(Vec<N,T>& x, const Vec<N,T>& y) { return (x = x / y); }
				462	SINT Vec<N,T>& operator^=(Vec<N,T>& x, const Vec<N,T>& y) { return (x = x ^ y); }
				463	SINT Vec<N,T>& operator&=(Vec<N,T>& x, const Vec<N,T>& y) { return (x = x & y); }
				464	SINT Vec<N,T>& operator\|=(Vec<N,T>& x, const Vec<N,T>& y) { return (x = x \| y); }
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	465
Mike Klein	4292515	2019-02-06 11:56:58 -0500	[diff] [blame]	466	// ... for scalars...
Mike Klein	f4438d5	2019-03-14 13:30:42 -0500	[diff] [blame]	467	SINTU Vec<N,T>& operator+=(Vec<N,T>& x, U y) { return (x = x + Vec<N,T>(y)); }
				468	SINTU Vec<N,T>& operator-=(Vec<N,T>& x, U y) { return (x = x - Vec<N,T>(y)); }
				469	SINTU Vec<N,T>& operator=(Vec<N,T>& x, U y) { return (x = x Vec<N,T>(y)); }
				470	SINTU Vec<N,T>& operator/=(Vec<N,T>& x, U y) { return (x = x / Vec<N,T>(y)); }
				471	SINTU Vec<N,T>& operator^=(Vec<N,T>& x, U y) { return (x = x ^ Vec<N,T>(y)); }
				472	SINTU Vec<N,T>& operator&=(Vec<N,T>& x, U y) { return (x = x & Vec<N,T>(y)); }
				473	SINTU Vec<N,T>& operator\|=(Vec<N,T>& x, U y) { return (x = x \| Vec<N,T>(y)); }
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	474
Mike Klein	4292515	2019-02-06 11:56:58 -0500	[diff] [blame]	475	// ... and for shifts.
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	476	SINT Vec<N,T>& operator<<=(Vec<N,T>& x, int bits) { return (x = x << bits); }
				477	SINT Vec<N,T>& operator>>=(Vec<N,T>& x, int bits) { return (x = x >> bits); }
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	478
Mike Klein	53a5298	2019-02-06 15:48:12 -0500	[diff] [blame]	479	// cast() Vec<N,S> to Vec<N,D>, as if applying a C-cast to each lane.
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	480	template <typename D, typename S>
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	481	SI Vec<1,D> cast(const Vec<1,S>& src) { return (D)src.val; }
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	482
Mike Klein	4292515	2019-02-06 11:56:58 -0500	[diff] [blame]	483	template <typename D, int N, typename S>
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	484	SI Vec<N,D> cast(const Vec<N,S>& src) {
Mike Klein	4292515	2019-02-06 11:56:58 -0500	[diff] [blame]	485	#if !defined(SKNX_NO_SIMD) && defined(__clang__)
Mike Klein	da7b053	2019-04-10 12:40:31 -0500	[diff] [blame]	486	return to_vec(__builtin_convertvector(to_vext(src), VExt<N,D>));
Mike Klein	4292515	2019-02-06 11:56:58 -0500	[diff] [blame]	487	#else
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	488	return join(cast<D>(src.lo), cast<D>(src.hi));
Mike Klein	4292515	2019-02-06 11:56:58 -0500	[diff] [blame]	489	#endif
				490	}
				491
Mike Klein	53a5298	2019-02-06 15:48:12 -0500	[diff] [blame]	492	// Shuffle values from a vector pretty arbitrarily:
				493	// skvx::Vec<4,float> rgba = {R,G,B,A};
				494	// shuffle<2,1,0,3> (rgba) ~> {B,G,R,A}
				495	// shuffle<2,1> (rgba) ~> {B,G}
				496	// shuffle<2,1,2,1,2,1,2,1>(rgba) ~> {B,G,B,G,B,G,B,G}
				497	// shuffle<3,3,3,3> (rgba) ~> {A,A,A,A}
				498	// The only real restriction is that the output also be a legal N=power-of-two sknx::Vec.
				499	template <int... Ix, int N, typename T>
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	500	SI Vec<sizeof...(Ix),T> shuffle(const Vec<N,T>& x) {
Mike Klein	3bad19c	2019-04-11 14:14:16 -0500	[diff] [blame]	501	#if !defined(SKNX_NO_SIMD) && defined(__clang__)
				502	return to_vec<sizeof...(Ix),T>(__builtin_shufflevector(to_vext(x), to_vext(x), Ix...));
				503	#else
Mike Klein	53a5298	2019-02-06 15:48:12 -0500	[diff] [blame]	504	return { x[Ix]... };
Mike Klein	3bad19c	2019-04-11 14:14:16 -0500	[diff] [blame]	505	#endif
Mike Klein	53a5298	2019-02-06 15:48:12 -0500	[diff] [blame]	506	}
Mike Klein	4292515	2019-02-06 11:56:58 -0500	[diff] [blame]	507
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	508	// fma() delivers a fused mul-add, even if that's really expensive.
				509	SI Vec<1,float> fma(const Vec<1,float>& x, const Vec<1,float>& y, const Vec<1,float>& z) {
Mike Klein	ec37097	2020-03-05 10:15:35 -0600	[diff] [blame]	510	return std::fma(x.val, y.val, z.val);
				511	}
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	512	SIN Vec<N,float> fma(const Vec<N,float>& x, const Vec<N,float>& y, const Vec<N,float>& z) {
Mike Klein	ec37097	2020-03-05 10:15:35 -0600	[diff] [blame]	513	return join(fma(x.lo, y.lo, z.lo),
				514	fma(x.hi, y.hi, z.hi));
				515	}
				516
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	517	SIN Vec<N,float> fract(const Vec<N,float>& x) {
Mike Reed	8520e76	2020-04-30 12:06:23 -0400	[diff] [blame]	518	return x - floor(x);
				519	}
				520
Mike Klein	4d680cd	2020-07-15 09:58:51 -0500	[diff] [blame]	521	// The default cases for to_half/from_half are borrowed from skcms,
				522	// and assume inputs are finite and treat/flush denorm half floats as/to zero.
				523	// Key constants to watch for:
				524	// - a float is 32-bit, 1-8-23 sign-exponent-mantissa, with 127 exponent bias;
				525	// - a half is 16-bit, 1-5-10 sign-exponent-mantissa, with 15 exponent bias.
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	526	SIN Vec<N,uint16_t> to_half_finite_ftz(const Vec<N,float>& x) {
Mike Klein	4d680cd	2020-07-15 09:58:51 -0500	[diff] [blame]	527	Vec<N,uint32_t> sem = bit_pun<Vec<N,uint32_t>>(x),
				528	s = sem & 0x8000'0000,
				529	em = sem ^ s,
				530	is_denorm = em < 0x3880'0000;
				531	return cast<uint16_t>(if_then_else(is_denorm, Vec<N,uint32_t>(0)
				532	, (s>>16) + (em>>13) - ((127-15)<<10)));
				533	}
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	534	SIN Vec<N,float> from_half_finite_ftz(const Vec<N,uint16_t>& x) {
Mike Klein	4d680cd	2020-07-15 09:58:51 -0500	[diff] [blame]	535	Vec<N,uint32_t> wide = cast<uint32_t>(x),
				536	s = wide & 0x8000,
				537	em = wide ^ s;
				538	auto is_denorm = bit_pun<Vec<N,int32_t>>(em < 0x0400);
				539	return if_then_else(is_denorm, Vec<N,float>(0)
				540	, bit_pun<Vec<N,float>>( (s<<16) + (em<<13) + ((127-15)<<23) ));
				541	}
				542
				543	// Like if_then_else(), these N=1 base cases won't actually be used unless explicitly called.
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	544	SI Vec<1,uint16_t> to_half(const Vec<1,float>& x) { return to_half_finite_ftz(x); }
				545	SI Vec<1,float> from_half(const Vec<1,uint16_t>& x) { return from_half_finite_ftz(x); }
Mike Klein	4d680cd	2020-07-15 09:58:51 -0500	[diff] [blame]	546
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	547	SIN Vec<N,uint16_t> to_half(const Vec<N,float>& x) {
Mike Klein	4d680cd	2020-07-15 09:58:51 -0500	[diff] [blame]	548	#if defined(__F16C__)
				549	if /constexpr/ (N == 8) {
				550	return unchecked_bit_pun<Vec<N,uint16_t>>(_mm256_cvtps_ph(unchecked_bit_pun<__m256>(x),
				551	_MM_FROUND_CUR_DIRECTION));
				552	}
				553	#endif
				554	#if defined(__aarch64__)
				555	if /constexpr/ (N == 4) {
				556	return unchecked_bit_pun<Vec<N,uint16_t>>(vcvt_f16_f32(unchecked_bit_pun<float32x4_t>(x)));
				557
				558	}
				559	#endif
				560	if /constexpr/ (N > 4) {
				561	return join(to_half(x.lo),
				562	to_half(x.hi));
				563	}
				564	return to_half_finite_ftz(x);
				565	}
				566
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	567	SIN Vec<N,float> from_half(const Vec<N,uint16_t>& x) {
Mike Klein	4d680cd	2020-07-15 09:58:51 -0500	[diff] [blame]	568	#if defined(__F16C__)
				569	if /constexpr/ (N == 8) {
				570	return unchecked_bit_pun<Vec<N,float>>(_mm256_cvtph_ps(unchecked_bit_pun<__m128i>(x)));
				571	}
				572	#endif
				573	#if defined(__aarch64__)
				574	if /constexpr/ (N == 4) {
Jose Dapena Paz	dc4da5a	2020-07-31 20:04:25 +0200	[diff] [blame]	575	return unchecked_bit_pun<Vec<N,float>>(vcvt_f32_f16(unchecked_bit_pun<float16x4_t>(x)));
Mike Klein	4d680cd	2020-07-15 09:58:51 -0500	[diff] [blame]	576	}
				577	#endif
				578	if /constexpr/ (N > 4) {
				579	return join(from_half(x.lo),
				580	from_half(x.hi));
				581	}
				582	return from_half_finite_ftz(x);
				583	}
				584
Mike Reed	8520e76	2020-04-30 12:06:23 -0400	[diff] [blame]	585
Mike Klein	4b44a0d	2019-04-11 11:52:51 -0500	[diff] [blame]	586	// div255(x) = (x + 127) / 255 is a bit-exact rounding divide-by-255, packing down to 8-bit.
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	587	SIN Vec<N,uint8_t> div255(const Vec<N,uint16_t>& x) {
Mike Klein	4b44a0d	2019-04-11 11:52:51 -0500	[diff] [blame]	588	return cast<uint8_t>( (x+127)/255 );
				589	}
				590
				591	// approx_scale(x,y) approximates div255(cast<uint16_t>(x)*cast<uint16_t>(y)) within a bit,
				592	// and is always perfect when x or y is 0 or 255.
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	593	SIN Vec<N,uint8_t> approx_scale(const Vec<N,uint8_t>& x, const Vec<N,uint8_t>& y) {
Mike Klein	4b44a0d	2019-04-11 11:52:51 -0500	[diff] [blame]	594	// All of (xy+x)/256, (xy+y)/256, and (x*y+255)/256 meet the criteria above.
				595	// We happen to have historically picked (x*y+x)/256.
				596	auto X = cast<uint16_t>(x),
				597	Y = cast<uint16_t>(y);
				598	return cast<uint8_t>( (X*Y+X)/256 );
				599	}
				600
Mike Klein	7d3b27d	2019-06-07 10:57:58 -0500	[diff] [blame]	601	#if !defined(SKNX_NO_SIMD) && defined(__ARM_NEON)
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	602	// With NEON we can do eight u8*u8 -> u16 in one instruction, vmull_u8 (read, mul-long).
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	603	SI Vec<8,uint16_t> mull(const Vec<8,uint8_t>& x,
				604	const Vec<8,uint8_t>& y) {
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	605	return to_vec<8,uint16_t>(vmull_u8(to_vext(x),
				606	to_vext(y)));
				607	}
				608
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	609	SIN std::enable_if_t<(N < 8), Vec<N,uint16_t>> mull(const Vec<N,uint8_t>& x,
				610	const Vec<N,uint8_t>& y) {
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	611	// N < 8 --> double up data until N == 8, returning the part we need.
				612	return mull(join(x,x),
				613	join(y,y)).lo;
				614	}
				615
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	616	SIN std::enable_if_t<(N > 8), Vec<N,uint16_t>> mull(const Vec<N,uint8_t>& x,
				617	const Vec<N,uint8_t>& y) {
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	618	// N > 8 --> usual join(lo,hi) strategy to recurse down to N == 8.
				619	return join(mull(x.lo, y.lo),
				620	mull(x.hi, y.hi));
				621	}
				622	#else
				623	// Nothing special when we don't have NEON... just cast up to 16-bit and multiply.
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	624	SIN Vec<N,uint16_t> mull(const Vec<N,uint8_t>& x,
				625	const Vec<N,uint8_t>& y) {
Mike Klein	9a885b2	2019-04-16 12:07:23 -0500	[diff] [blame]	626	return cast<uint16_t>(x)
				627	* cast<uint16_t>(y);
				628	}
				629	#endif
				630
Mike Klein	41b995c	2019-02-27 10:24:55 -0600	[diff] [blame]	631	#if !defined(SKNX_NO_SIMD)
Mike Klein	7d3b27d	2019-06-07 10:57:58 -0500	[diff] [blame]	632
Mike Klein	41b995c	2019-02-27 10:24:55 -0600	[diff] [blame]	633	// Platform-specific specializations and overloads can now drop in here.
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	634
Mike Klein	5caf7de	2020-03-12 11:05:46 -0500	[diff] [blame]	635	#if defined(__AVX__)
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	636	SI Vec<8,float> sqrt(const Vec<8,float>& x) {
Mike Klein	5caf7de	2020-03-12 11:05:46 -0500	[diff] [blame]	637	return bit_pun<Vec<8,float>>(_mm256_sqrt_ps(bit_pun<__m256>(x)));
				638	}
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	639	SI Vec<8,float> rsqrt(const Vec<8,float>& x) {
Mike Klein	5caf7de	2020-03-12 11:05:46 -0500	[diff] [blame]	640	return bit_pun<Vec<8,float>>(_mm256_rsqrt_ps(bit_pun<__m256>(x)));
				641	}
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	642	SI Vec<8,float> rcp(const Vec<8,float>& x) {
Mike Klein	5caf7de	2020-03-12 11:05:46 -0500	[diff] [blame]	643	return bit_pun<Vec<8,float>>(_mm256_rcp_ps(bit_pun<__m256>(x)));
				644	}
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	645	SI Vec<8,int> lrint(const Vec<8,float>& x) {
Mike Klein	5caf7de	2020-03-12 11:05:46 -0500	[diff] [blame]	646	return bit_pun<Vec<8,int>>(_mm256_cvtps_epi32(bit_pun<__m256>(x)));
				647	}
				648	#endif
				649
Mike Klein	7d3b27d	2019-06-07 10:57:58 -0500	[diff] [blame]	650	#if defined(__SSE__)
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	651	SI Vec<4,float> sqrt(const Vec<4,float>& x) {
Mike Klein	da7b053	2019-04-10 12:40:31 -0500	[diff] [blame]	652	return bit_pun<Vec<4,float>>(_mm_sqrt_ps(bit_pun<__m128>(x)));
				653	}
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	654	SI Vec<4,float> rsqrt(const Vec<4,float>& x) {
Mike Klein	da7b053	2019-04-10 12:40:31 -0500	[diff] [blame]	655	return bit_pun<Vec<4,float>>(_mm_rsqrt_ps(bit_pun<__m128>(x)));
				656	}
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	657	SI Vec<4,float> rcp(const Vec<4,float>& x) {
Mike Klein	da7b053	2019-04-10 12:40:31 -0500	[diff] [blame]	658	return bit_pun<Vec<4,float>>(_mm_rcp_ps(bit_pun<__m128>(x)));
				659	}
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	660	SI Vec<4,int> lrint(const Vec<4,float>& x) {
Mike Klein	5caf7de	2020-03-12 11:05:46 -0500	[diff] [blame]	661	return bit_pun<Vec<4,int>>(_mm_cvtps_epi32(bit_pun<__m128>(x)));
				662	}
Mike Klein	41b995c	2019-02-27 10:24:55 -0600	[diff] [blame]	663
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	664	SI Vec<2,float> sqrt(const Vec<2,float>& x) {
Mike Klein	da7b053	2019-04-10 12:40:31 -0500	[diff] [blame]	665	return shuffle<0,1>( sqrt(shuffle<0,1,0,1>(x)));
				666	}
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	667	SI Vec<2,float> rsqrt(const Vec<2,float>& x) {
Mike Klein	da7b053	2019-04-10 12:40:31 -0500	[diff] [blame]	668	return shuffle<0,1>(rsqrt(shuffle<0,1,0,1>(x)));
				669	}
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	670	SI Vec<2,float> rcp(const Vec<2,float>& x) {
Mike Klein	da7b053	2019-04-10 12:40:31 -0500	[diff] [blame]	671	return shuffle<0,1>( rcp(shuffle<0,1,0,1>(x)));
				672	}
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	673	SI Vec<2,int> lrint(const Vec<2,float>& x) {
Mike Klein	5caf7de	2020-03-12 11:05:46 -0500	[diff] [blame]	674	return shuffle<0,1>(lrint(shuffle<0,1,0,1>(x)));
				675	}
Mike Klein	da7b053	2019-04-10 12:40:31 -0500	[diff] [blame]	676	#endif
Mike Klein	41b995c	2019-02-27 10:24:55 -0600	[diff] [blame]	677
Mike Klein	ec37097	2020-03-05 10:15:35 -0600	[diff] [blame]	678	#if defined(__AVX2__)
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	679	SI Vec<4,float> fma(const Vec<4,float>& x, const Vec<4,float>& y, const Vec<4,float>& z) {
Mike Klein	ec37097	2020-03-05 10:15:35 -0600	[diff] [blame]	680	return bit_pun<Vec<4,float>>(_mm_fmadd_ps(bit_pun<__m128>(x),
				681	bit_pun<__m128>(y),
				682	bit_pun<__m128>(z)));
				683	}
				684
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	685	SI Vec<8,float> fma(const Vec<8,float>& x, const Vec<8,float>& y, const Vec<8,float>& z) {
Mike Klein	ec37097	2020-03-05 10:15:35 -0600	[diff] [blame]	686	return bit_pun<Vec<8,float>>(_mm256_fmadd_ps(bit_pun<__m256>(x),
				687	bit_pun<__m256>(y),
				688	bit_pun<__m256>(z)));
				689	}
				690	#elif defined(__aarch64__)
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	691	SI Vec<4,float> fma(const Vec<4,float>& x, const Vec<4,float>& y, const Vec<4,float>& z) {
Mike Klein	ec37097	2020-03-05 10:15:35 -0600	[diff] [blame]	692	// These instructions tend to work like z += xy, so the order here is z,x,y.
				693	return bit_pun<Vec<4,float>>(vfmaq_f32(bit_pun<float32x4_t>(z),
				694	bit_pun<float32x4_t>(x),
				695	bit_pun<float32x4_t>(y)));
				696	}
				697	#endif
				698
Elliot Evans	fe7e74b	2020-06-30 16:08:44 -0600	[diff] [blame]	699	// WASM SIMD compatible operations which are not automatically compiled to SIMD commands
				700	// by emscripten:
				701	#if defined __wasm_simd128__
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	702	SI Vec<4, float> rcp (const Vec<4, float>& x) { return 1.0f / x; }
				703	SI Vec<2,double> rcp (const Vec<2,double>& x) { return 1.0f / x; }
				704	SI Vec<4, float> rsqrt(const Vec<4, float>& x) { return 1.0f / sqrt(x); }
				705	SI Vec<2,double> rsqrt(const Vec<2,double>& x) { return 1.0f / sqrt(x); }
				706
				707	SI Vec<4,float> min(const Vec<4,float>& x, const Vec<4,float>& y) {
Elliot Evans	fe7e74b	2020-06-30 16:08:44 -0600	[diff] [blame]	708	return to_vec<4,float>(wasm_f32x4_min(to_vext(x), to_vext(y)));
				709	}
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	710	SI Vec<4,float> max(const Vec<4,float>& x, const Vec<4,float>& y) {
Elliot Evans	fe7e74b	2020-06-30 16:08:44 -0600	[diff] [blame]	711	return to_vec<4,float>(wasm_f32x4_max(to_vext(x), to_vext(y)));
				712	}
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	713	SI Vec<4,float> sqrt(const Vec<4,float>& x) {
Elliot Evans	fe7e74b	2020-06-30 16:08:44 -0600	[diff] [blame]	714	return to_vec<4,float>(wasm_f32x4_sqrt(to_vext(x)));
				715	}
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	716	SI Vec<4,float> abs(const Vec<4,float>& x) {
Elliot Evans	fe7e74b	2020-06-30 16:08:44 -0600	[diff] [blame]	717	return to_vec<4,float>(wasm_f32x4_abs(to_vext(x)));
				718	}
Elliot Evans	fe7e74b	2020-06-30 16:08:44 -0600	[diff] [blame]	719
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	720	SI Vec<2,double> min(const Vec<2,double>& x, const Vec<2,double>& y) {
Elliot Evans	fe7e74b	2020-06-30 16:08:44 -0600	[diff] [blame]	721	return to_vec<2,double>(wasm_f64x2_min(to_vext(x), to_vext(y)));
				722	}
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	723	SI Vec<2,double> max(const Vec<2,double>& x, const Vec<2,double>& y) {
Elliot Evans	fe7e74b	2020-06-30 16:08:44 -0600	[diff] [blame]	724	return to_vec<2,double>(wasm_f64x2_max(to_vext(x), to_vext(y)));
				725	}
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	726	SI Vec<2,double> sqrt(const Vec<2,double>& x) {
Elliot Evans	fe7e74b	2020-06-30 16:08:44 -0600	[diff] [blame]	727	return to_vec<2,double>(wasm_f64x2_sqrt(to_vext(x)));
				728	}
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	729	SI Vec<2,double> abs(const Vec<2,double>& x) {
Elliot Evans	fe7e74b	2020-06-30 16:08:44 -0600	[diff] [blame]	730	return to_vec<2,double>(wasm_f64x2_abs(to_vext(x)));
				731	}
Elliot Evans	fe7e74b	2020-06-30 16:08:44 -0600	[diff] [blame]	732
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	733	SI bool any(const Vec<4, int32_t>& x) { return wasm_i32x4_any_true(to_vext(x)); }
				734	SI bool any(const Vec<4,uint32_t>& x) { return wasm_i32x4_any_true(to_vext(x)); }
				735	SI bool all(const Vec<4, int32_t>& x) { return wasm_i32x4_all_true(to_vext(x)); }
				736	SI bool all(const Vec<4,uint32_t>& x) { return wasm_i32x4_all_true(to_vext(x)); }
				737
				738	SI Vec<4,int32_t> min(const Vec<4,int32_t>& x, const Vec<4,int32_t>& y) {
Elliot Evans	fe7e74b	2020-06-30 16:08:44 -0600	[diff] [blame]	739	return to_vec<4,int32_t>(wasm_i32x4_min(to_vext(x), to_vext(y)));
				740	}
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	741	SI Vec<4,int32_t> max(const Vec<4,int32_t>& x, const Vec<4,int32_t>& y) {
Elliot Evans	fe7e74b	2020-06-30 16:08:44 -0600	[diff] [blame]	742	return to_vec<4,int32_t>(wasm_i32x4_max(to_vext(x), to_vext(y)));
				743	}
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	744	SI Vec<4,int32_t> abs(const Vec<4,int32_t>& x) {
Elliot Evans	fe7e74b	2020-06-30 16:08:44 -0600	[diff] [blame]	745	return to_vec<4,int32_t>(wasm_i32x4_abs(to_vext(x)));
				746	}
				747
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	748	SI Vec<4,uint32_t> min(const Vec<4,uint32_t>& x, const Vec<4,uint32_t>& y) {
Elliot Evans	fe7e74b	2020-06-30 16:08:44 -0600	[diff] [blame]	749	return to_vec<4,uint32_t>(wasm_u32x4_min(to_vext(x), to_vext(y)));
				750	}
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	751	SI Vec<4,uint32_t> max(const Vec<4,uint32_t>& x, const Vec<4,uint32_t>& y) {
Elliot Evans	fe7e74b	2020-06-30 16:08:44 -0600	[diff] [blame]	752	return to_vec<4,uint32_t>(wasm_u32x4_max(to_vext(x), to_vext(y)));
				753	}
				754	#endif
				755
Mike Klein	7d3b27d	2019-06-07 10:57:58 -0500	[diff] [blame]	756	#endif // !defined(SKNX_NO_SIMD)
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	757
				758	} // namespace skvx
				759
Mike Klein	f4438d5	2019-03-14 13:30:42 -0500	[diff] [blame]	760	#undef SINTU
Mike Klein	dcfc3ef	2019-02-07 09:49:17 -0500	[diff] [blame]	761	#undef SINT
				762	#undef SIT
Mike Klein	a171109	2020-09-02 09:00:57 -0500	[diff] [blame]	763	#undef SI
Mike Klein	455c747	2019-02-05 13:42:46 -0500	[diff] [blame]	764
				765	#endif//SKVX_DEFINED