SPV: Implement Vulkan 1.1 features and extensions.
diff --git a/Test/hlsl.wavequad.comp b/Test/hlsl.wavequad.comp
new file mode 100644
index 0000000..34e8b78
--- /dev/null
+++ b/Test/hlsl.wavequad.comp
@@ -0,0 +1,153 @@
+struct Types
+{
+ uint4 u;
+ int4 i;
+ float4 f;
+ double4 d;
+};
+
+RWStructuredBuffer<Types> data;
+
+[numthreads(32, 16, 1)]
+void CSMain(uint3 dti : SV_DispatchThreadID)
+{
+ data[dti.x].u = QuadReadLaneAt(data[dti.x].u, 0);
+ data[dti.x].u.x = QuadReadLaneAt(data[dti.x].u.x, 0);
+ data[dti.x].u.xy = QuadReadLaneAt(data[dti.x].u.xy, 0);
+ data[dti.x].u.xyz = QuadReadLaneAt(data[dti.x].u.xyz, 0);
+
+ data[dti.x].i = QuadReadLaneAt(data[dti.x].i, 0);
+ data[dti.x].i.x = QuadReadLaneAt(data[dti.x].i.x, 0);
+ data[dti.x].i.xy = QuadReadLaneAt(data[dti.x].i.xy, 0);
+ data[dti.x].i.xyz = QuadReadLaneAt(data[dti.x].i.xyz, 0);
+
+ data[dti.x].f = QuadReadLaneAt(data[dti.x].f, 0);
+ data[dti.x].f.x = QuadReadLaneAt(data[dti.x].f.x, 0);
+ data[dti.x].f.xy = QuadReadLaneAt(data[dti.x].f.xy, 0);
+ data[dti.x].f.xyz = QuadReadLaneAt(data[dti.x].f.xyz, 0);
+
+ data[dti.x].d = QuadReadLaneAt(data[dti.x].d, 0);
+ data[dti.x].d.x = QuadReadLaneAt(data[dti.x].d.x, 0);
+ data[dti.x].d.xy = QuadReadLaneAt(data[dti.x].d.xy, 0);
+ data[dti.x].d.xyz = QuadReadLaneAt(data[dti.x].d.xyz, 0);
+
+ data[dti.x].u = QuadReadLaneAt(data[dti.x].u, 1);
+ data[dti.x].u.x = QuadReadLaneAt(data[dti.x].u.x, 1);
+ data[dti.x].u.xy = QuadReadLaneAt(data[dti.x].u.xy, 1);
+ data[dti.x].u.xyz = QuadReadLaneAt(data[dti.x].u.xyz, 1);
+
+ data[dti.x].i = QuadReadLaneAt(data[dti.x].i, 1);
+ data[dti.x].i.x = QuadReadLaneAt(data[dti.x].i.x, 1);
+ data[dti.x].i.xy = QuadReadLaneAt(data[dti.x].i.xy, 1);
+ data[dti.x].i.xyz = QuadReadLaneAt(data[dti.x].i.xyz, 1);
+
+ data[dti.x].f = QuadReadLaneAt(data[dti.x].f, 1);
+ data[dti.x].f.x = QuadReadLaneAt(data[dti.x].f.x, 1);
+ data[dti.x].f.xy = QuadReadLaneAt(data[dti.x].f.xy, 1);
+ data[dti.x].f.xyz = QuadReadLaneAt(data[dti.x].f.xyz, 1);
+
+ data[dti.x].d = QuadReadLaneAt(data[dti.x].d, 1);
+ data[dti.x].d.x = QuadReadLaneAt(data[dti.x].d.x, 1);
+ data[dti.x].d.xy = QuadReadLaneAt(data[dti.x].d.xy, 1);
+ data[dti.x].d.xyz = QuadReadLaneAt(data[dti.x].d.xyz, 1);
+
+ data[dti.x].u = QuadReadLaneAt(data[dti.x].u, 2);
+ data[dti.x].u.x = QuadReadLaneAt(data[dti.x].u.x, 2);
+ data[dti.x].u.xy = QuadReadLaneAt(data[dti.x].u.xy, 2);
+ data[dti.x].u.xyz = QuadReadLaneAt(data[dti.x].u.xyz, 2);
+
+ data[dti.x].i = QuadReadLaneAt(data[dti.x].i, 2);
+ data[dti.x].i.x = QuadReadLaneAt(data[dti.x].i.x, 2);
+ data[dti.x].i.xy = QuadReadLaneAt(data[dti.x].i.xy, 2);
+ data[dti.x].i.xyz = QuadReadLaneAt(data[dti.x].i.xyz, 2);
+
+ data[dti.x].f = QuadReadLaneAt(data[dti.x].f, 2);
+ data[dti.x].f.x = QuadReadLaneAt(data[dti.x].f.x, 2);
+ data[dti.x].f.xy = QuadReadLaneAt(data[dti.x].f.xy, 2);
+ data[dti.x].f.xyz = QuadReadLaneAt(data[dti.x].f.xyz, 2);
+
+ data[dti.x].d = QuadReadLaneAt(data[dti.x].d, 2);
+ data[dti.x].d.x = QuadReadLaneAt(data[dti.x].d.x, 2);
+ data[dti.x].d.xy = QuadReadLaneAt(data[dti.x].d.xy, 2);
+ data[dti.x].d.xyz = QuadReadLaneAt(data[dti.x].d.xyz, 2);
+
+ data[dti.x].u = QuadReadLaneAt(data[dti.x].u, 3);
+ data[dti.x].u.x = QuadReadLaneAt(data[dti.x].u.x, 3);
+ data[dti.x].u.xy = QuadReadLaneAt(data[dti.x].u.xy, 3);
+ data[dti.x].u.xyz = QuadReadLaneAt(data[dti.x].u.xyz, 3);
+
+ data[dti.x].i = QuadReadLaneAt(data[dti.x].i, 3);
+ data[dti.x].i.x = QuadReadLaneAt(data[dti.x].i.x, 3);
+ data[dti.x].i.xy = QuadReadLaneAt(data[dti.x].i.xy, 3);
+ data[dti.x].i.xyz = QuadReadLaneAt(data[dti.x].i.xyz, 3);
+
+ data[dti.x].f = QuadReadLaneAt(data[dti.x].f, 3);
+ data[dti.x].f.x = QuadReadLaneAt(data[dti.x].f.x, 3);
+ data[dti.x].f.xy = QuadReadLaneAt(data[dti.x].f.xy, 3);
+ data[dti.x].f.xyz = QuadReadLaneAt(data[dti.x].f.xyz, 3);
+
+ data[dti.x].d = QuadReadLaneAt(data[dti.x].d, 3);
+ data[dti.x].d.x = QuadReadLaneAt(data[dti.x].d.x, 3);
+ data[dti.x].d.xy = QuadReadLaneAt(data[dti.x].d.xy, 3);
+ data[dti.x].d.xyz = QuadReadLaneAt(data[dti.x].d.xyz, 3);
+
+ data[dti.x].u = QuadReadAcrossX(data[dti.x].u);
+ data[dti.x].u.x = QuadReadAcrossX(data[dti.x].u.x);
+ data[dti.x].u.xy = QuadReadAcrossX(data[dti.x].u.xy);
+ data[dti.x].u.xyz = QuadReadAcrossX(data[dti.x].u.xyz);
+
+ data[dti.x].i = QuadReadAcrossX(data[dti.x].i);
+ data[dti.x].i.x = QuadReadAcrossX(data[dti.x].i.x);
+ data[dti.x].i.xy = QuadReadAcrossX(data[dti.x].i.xy);
+ data[dti.x].i.xyz = QuadReadAcrossX(data[dti.x].i.xyz);
+
+ data[dti.x].f = QuadReadAcrossX(data[dti.x].f);
+ data[dti.x].f.x = QuadReadAcrossX(data[dti.x].f.x);
+ data[dti.x].f.xy = QuadReadAcrossX(data[dti.x].f.xy);
+ data[dti.x].f.xyz = QuadReadAcrossX(data[dti.x].f.xyz);
+
+ data[dti.x].d = QuadReadAcrossX(data[dti.x].d);
+ data[dti.x].d.x = QuadReadAcrossX(data[dti.x].d.x);
+ data[dti.x].d.xy = QuadReadAcrossX(data[dti.x].d.xy);
+ data[dti.x].d.xyz = QuadReadAcrossX(data[dti.x].d.xyz);
+
+ data[dti.x].u = QuadReadAcrossY(data[dti.x].u);
+ data[dti.x].u.x = QuadReadAcrossY(data[dti.x].u.x);
+ data[dti.x].u.xy = QuadReadAcrossY(data[dti.x].u.xy);
+ data[dti.x].u.xyz = QuadReadAcrossY(data[dti.x].u.xyz);
+
+ data[dti.x].i = QuadReadAcrossY(data[dti.x].i);
+ data[dti.x].i.x = QuadReadAcrossY(data[dti.x].i.x);
+ data[dti.x].i.xy = QuadReadAcrossY(data[dti.x].i.xy);
+ data[dti.x].i.xyz = QuadReadAcrossY(data[dti.x].i.xyz);
+
+ data[dti.x].f = QuadReadAcrossY(data[dti.x].f);
+ data[dti.x].f.x = QuadReadAcrossY(data[dti.x].f.x);
+ data[dti.x].f.xy = QuadReadAcrossY(data[dti.x].f.xy);
+ data[dti.x].f.xyz = QuadReadAcrossY(data[dti.x].f.xyz);
+
+ data[dti.x].d = QuadReadAcrossY(data[dti.x].d);
+ data[dti.x].d.x = QuadReadAcrossY(data[dti.x].d.x);
+ data[dti.x].d.xy = QuadReadAcrossY(data[dti.x].d.xy);
+ data[dti.x].d.xyz = QuadReadAcrossY(data[dti.x].d.xyz);
+
+ data[dti.x].u = QuadReadAcrossDiagonal(data[dti.x].u);
+ data[dti.x].u.x = QuadReadAcrossDiagonal(data[dti.x].u.x);
+ data[dti.x].u.xy = QuadReadAcrossDiagonal(data[dti.x].u.xy);
+ data[dti.x].u.xyz = QuadReadAcrossDiagonal(data[dti.x].u.xyz);
+
+ data[dti.x].i = QuadReadAcrossDiagonal(data[dti.x].i);
+ data[dti.x].i.x = QuadReadAcrossDiagonal(data[dti.x].i.x);
+ data[dti.x].i.xy = QuadReadAcrossDiagonal(data[dti.x].i.xy);
+ data[dti.x].i.xyz = QuadReadAcrossDiagonal(data[dti.x].i.xyz);
+
+ data[dti.x].f = QuadReadAcrossDiagonal(data[dti.x].f);
+ data[dti.x].f.x = QuadReadAcrossDiagonal(data[dti.x].f.x);
+ data[dti.x].f.xy = QuadReadAcrossDiagonal(data[dti.x].f.xy);
+ data[dti.x].f.xyz = QuadReadAcrossDiagonal(data[dti.x].f.xyz);
+
+ data[dti.x].d = QuadReadAcrossDiagonal(data[dti.x].d);
+ data[dti.x].d.x = QuadReadAcrossDiagonal(data[dti.x].d.x);
+ data[dti.x].d.xy = QuadReadAcrossDiagonal(data[dti.x].d.xy);
+ data[dti.x].d.xyz = QuadReadAcrossDiagonal(data[dti.x].d.xyz);
+}