pass size_t to ptr_and_ix()

dx and dy are already size_t, so no need to demote them to int,
and demoting to int gets dicey in terms of wrap-around.

Change-Id: I98eb31ef7aa35fa2c2aa5be27cdc0b4dc7dfd008
Reviewed-on: https://skia-review.googlesource.com/99500
Reviewed-by: Brian Osman <brianosman@google.com>
Commit-Queue: Mike Klein <mtklein@chromium.org>
diff --git a/src/jumper/SkJumper_generated.S b/src/jumper/SkJumper_generated.S
index 5d55582..a6c8d12 100644
--- a/src/jumper/SkJumper_generated.S
+++ b/src/jumper/SkJumper_generated.S
@@ -116,9 +116,9 @@
   .byte  197,252,88,0                        // vaddps        (%rax),%ymm0,%ymm0
   .byte  98,242,125,40,124,201               // vpbroadcastd  %ecx,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  98,241,116,56,88,13,118,170,3,0     // vaddps        0x3aa76(%rip){1to8},%ymm1,%ymm1        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  98,241,116,56,88,13,166,162,3,0     // vaddps        0x3a2a6(%rip){1to8},%ymm1,%ymm1        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,21,111,170,3,0       // vbroadcastss  0x3aa6f(%rip),%ymm2        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,21,159,162,3,0       // vbroadcastss  0x3a29f(%rip),%ymm2        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,228,87,219                      // vxorps        %ymm3,%ymm3,%ymm3
   .byte  197,220,87,228                      // vxorps        %ymm4,%ymm4,%ymm4
   .byte  197,212,87,237                      // vxorps        %ymm5,%ymm5,%ymm5
@@ -132,16 +132,16 @@
 _sk_dither_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  98,114,125,40,124,194               // vpbroadcastd  %edx,%ymm8
-  .byte  197,61,254,5,237,171,3,0            // vpaddd        0x3abed(%rip),%ymm8,%ymm8        # 3ad20 <_sk_srcover_bgra_8888_sse2_lowp+0x454>
+  .byte  197,61,254,5,45,164,3,0             // vpaddd        0x3a42d(%rip),%ymm8,%ymm8        # 3a560 <_sk_srcover_bgra_8888_sse2_lowp+0x464>
   .byte  98,114,125,40,124,201               // vpbroadcastd  %ecx,%ymm9
   .byte  196,65,53,239,200                   // vpxor         %ymm8,%ymm9,%ymm9
-  .byte  196,98,125,88,21,57,170,3,0         // vpbroadcastd  0x3aa39(%rip),%ymm10        # 3ab80 <_sk_srcover_bgra_8888_sse2_lowp+0x2b4>
+  .byte  196,98,125,88,21,105,162,3,0        // vpbroadcastd  0x3a269(%rip),%ymm10        # 3a3b0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b4>
   .byte  196,65,53,219,218                   // vpand         %ymm10,%ymm9,%ymm11
   .byte  196,193,37,114,243,5                // vpslld        $0x5,%ymm11,%ymm11
   .byte  196,65,61,219,210                   // vpand         %ymm10,%ymm8,%ymm10
   .byte  196,193,45,114,242,4                // vpslld        $0x4,%ymm10,%ymm10
-  .byte  196,98,125,88,37,30,170,3,0         // vpbroadcastd  0x3aa1e(%rip),%ymm12        # 3ab84 <_sk_srcover_bgra_8888_sse2_lowp+0x2b8>
-  .byte  196,98,125,88,45,25,170,3,0         // vpbroadcastd  0x3aa19(%rip),%ymm13        # 3ab88 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
+  .byte  196,98,125,88,37,78,162,3,0         // vpbroadcastd  0x3a24e(%rip),%ymm12        # 3a3b4 <_sk_srcover_bgra_8888_sse2_lowp+0x2b8>
+  .byte  196,98,125,88,45,73,162,3,0         // vpbroadcastd  0x3a249(%rip),%ymm13        # 3a3b8 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
   .byte  196,65,53,219,245                   // vpand         %ymm13,%ymm9,%ymm14
   .byte  196,193,13,114,246,2                // vpslld        $0x2,%ymm14,%ymm14
   .byte  196,65,37,235,222                   // vpor          %ymm14,%ymm11,%ymm11
@@ -156,8 +156,8 @@
   .byte  196,65,61,235,195                   // vpor          %ymm11,%ymm8,%ymm8
   .byte  196,65,61,235,193                   // vpor          %ymm9,%ymm8,%ymm8
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  196,98,125,24,13,203,169,3,0        // vbroadcastss  0x3a9cb(%rip),%ymm9        # 3ab8c <_sk_srcover_bgra_8888_sse2_lowp+0x2c0>
-  .byte  98,114,61,56,168,13,197,169,3,0     // vfmadd213ps   0x3a9c5(%rip){1to8},%ymm8,%ymm9        # 3ab90 <_sk_srcover_bgra_8888_sse2_lowp+0x2c4>
+  .byte  196,98,125,24,13,251,161,3,0        // vbroadcastss  0x3a1fb(%rip),%ymm9        # 3a3bc <_sk_srcover_bgra_8888_sse2_lowp+0x2c0>
+  .byte  98,114,61,56,168,13,245,161,3,0     // vfmadd213ps   0x3a1f5(%rip){1to8},%ymm8,%ymm9        # 3a3c0 <_sk_srcover_bgra_8888_sse2_lowp+0x2c4>
   .byte  196,98,125,24,0                     // vbroadcastss  (%rax),%ymm8
   .byte  196,65,52,89,192                    // vmulps        %ymm8,%ymm9,%ymm8
   .byte  197,188,88,192                      // vaddps        %ymm0,%ymm8,%ymm0
@@ -190,7 +190,7 @@
 FUNCTION(_sk_black_color_skx)
 _sk_black_color_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,82,169,3,0        // vbroadcastss  0x3a952(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,130,161,3,0       // vbroadcastss  0x3a182(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  197,236,87,210                      // vxorps        %ymm2,%ymm2,%ymm2
@@ -201,7 +201,7 @@
 FUNCTION(_sk_white_color_skx)
 _sk_white_color_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,57,169,3,0         // vbroadcastss  0x3a939(%rip),%ymm0        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,5,105,161,3,0        // vbroadcastss  0x3a169(%rip),%ymm0        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,252,40,200                      // vmovaps       %ymm0,%ymm1
   .byte  197,252,40,208                      // vmovaps       %ymm0,%ymm2
   .byte  197,252,40,216                      // vmovaps       %ymm0,%ymm3
@@ -247,7 +247,7 @@
 FUNCTION(_sk_srcatop_skx)
 _sk_srcatop_skx:
   .byte  197,252,89,199                      // vmulps        %ymm7,%ymm0,%ymm0
-  .byte  196,98,125,24,5,216,168,3,0         // vbroadcastss  0x3a8d8(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,8,161,3,0           // vbroadcastss  0x3a108(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  196,226,61,184,196                  // vfmadd231ps   %ymm4,%ymm8,%ymm0
   .byte  197,244,89,207                      // vmulps        %ymm7,%ymm1,%ymm1
@@ -263,7 +263,7 @@
 .globl _sk_dstatop_skx
 FUNCTION(_sk_dstatop_skx)
 _sk_dstatop_skx:
-  .byte  196,98,125,24,5,167,168,3,0         // vbroadcastss  0x3a8a7(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,215,160,3,0         // vbroadcastss  0x3a0d7(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,199                       // vsubps        %ymm7,%ymm8,%ymm8
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
   .byte  196,226,101,184,196                 // vfmadd231ps   %ymm4,%ymm3,%ymm0
@@ -302,7 +302,7 @@
 .globl _sk_srcout_skx
 FUNCTION(_sk_srcout_skx)
 _sk_srcout_skx:
-  .byte  196,98,125,24,5,74,168,3,0          // vbroadcastss  0x3a84a(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,122,160,3,0         // vbroadcastss  0x3a07a(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,199                       // vsubps        %ymm7,%ymm8,%ymm8
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
   .byte  197,188,89,201                      // vmulps        %ymm1,%ymm8,%ymm1
@@ -315,7 +315,7 @@
 .globl _sk_dstout_skx
 FUNCTION(_sk_dstout_skx)
 _sk_dstout_skx:
-  .byte  196,226,125,24,5,41,168,3,0         // vbroadcastss  0x3a829(%rip),%ymm0        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,5,89,160,3,0         // vbroadcastss  0x3a059(%rip),%ymm0        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,252,92,219                      // vsubps        %ymm3,%ymm0,%ymm3
   .byte  197,228,89,196                      // vmulps        %ymm4,%ymm3,%ymm0
   .byte  197,228,89,205                      // vmulps        %ymm5,%ymm3,%ymm1
@@ -328,7 +328,7 @@
 .globl _sk_srcover_skx
 FUNCTION(_sk_srcover_skx)
 _sk_srcover_skx:
-  .byte  196,98,125,24,5,8,168,3,0           // vbroadcastss  0x3a808(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,56,160,3,0          // vbroadcastss  0x3a038(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  196,194,93,184,192                  // vfmadd231ps   %ymm8,%ymm4,%ymm0
   .byte  196,194,85,184,200                  // vfmadd231ps   %ymm8,%ymm5,%ymm1
@@ -341,7 +341,7 @@
 .globl _sk_dstover_skx
 FUNCTION(_sk_dstover_skx)
 _sk_dstover_skx:
-  .byte  196,98,125,24,5,227,167,3,0         // vbroadcastss  0x3a7e3(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,19,160,3,0          // vbroadcastss  0x3a013(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,199                       // vsubps        %ymm7,%ymm8,%ymm8
   .byte  196,226,61,168,196                  // vfmadd213ps   %ymm4,%ymm8,%ymm0
   .byte  196,226,61,168,205                  // vfmadd213ps   %ymm5,%ymm8,%ymm1
@@ -365,7 +365,7 @@
 .globl _sk_multiply_skx
 FUNCTION(_sk_multiply_skx)
 _sk_multiply_skx:
-  .byte  196,98,125,24,5,170,167,3,0         // vbroadcastss  0x3a7aa(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,218,159,3,0         // vbroadcastss  0x39fda(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,207                       // vsubps        %ymm7,%ymm8,%ymm9
   .byte  197,52,89,208                       // vmulps        %ymm0,%ymm9,%ymm10
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -388,7 +388,7 @@
 FUNCTION(_sk_plus__skx)
 _sk_plus__skx:
   .byte  197,252,88,196                      // vaddps        %ymm4,%ymm0,%ymm0
-  .byte  196,98,125,24,5,89,167,3,0          // vbroadcastss  0x3a759(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,137,159,3,0         // vbroadcastss  0x39f89(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  197,244,88,205                      // vaddps        %ymm5,%ymm1,%ymm1
   .byte  196,193,116,93,200                  // vminps        %ymm8,%ymm1,%ymm1
@@ -418,7 +418,7 @@
 .globl _sk_xor__skx
 FUNCTION(_sk_xor__skx)
 _sk_xor__skx:
-  .byte  196,98,125,24,5,4,167,3,0           // vbroadcastss  0x3a704(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,52,159,3,0          // vbroadcastss  0x39f34(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,207                       // vsubps        %ymm7,%ymm8,%ymm9
   .byte  197,180,89,192                      // vmulps        %ymm0,%ymm9,%ymm0
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -452,7 +452,7 @@
   .byte  197,100,89,206                      // vmulps        %ymm6,%ymm3,%ymm9
   .byte  196,193,108,95,209                  // vmaxps        %ymm9,%ymm2,%ymm2
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
-  .byte  196,98,125,24,5,136,166,3,0         // vbroadcastss  0x3a688(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,184,158,3,0         // vbroadcastss  0x39eb8(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  196,194,69,184,216                  // vfmadd231ps   %ymm8,%ymm7,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -477,7 +477,7 @@
   .byte  197,100,89,206                      // vmulps        %ymm6,%ymm3,%ymm9
   .byte  196,193,108,93,209                  // vminps        %ymm9,%ymm2,%ymm2
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
-  .byte  196,98,125,24,5,51,166,3,0          // vbroadcastss  0x3a633(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,99,158,3,0          // vbroadcastss  0x39e63(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  196,194,69,184,216                  // vfmadd231ps   %ymm8,%ymm7,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -505,7 +505,7 @@
   .byte  196,193,108,93,209                  // vminps        %ymm9,%ymm2,%ymm2
   .byte  197,236,88,210                      // vaddps        %ymm2,%ymm2,%ymm2
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
-  .byte  196,98,125,24,5,210,165,3,0         // vbroadcastss  0x3a5d2(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,2,158,3,0           // vbroadcastss  0x39e02(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  196,194,69,184,216                  // vfmadd231ps   %ymm8,%ymm7,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -527,7 +527,7 @@
   .byte  197,236,89,214                      // vmulps        %ymm6,%ymm2,%ymm2
   .byte  197,236,88,210                      // vaddps        %ymm2,%ymm2,%ymm2
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
-  .byte  196,98,125,24,5,140,165,3,0         // vbroadcastss  0x3a58c(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,188,157,3,0         // vbroadcastss  0x39dbc(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  196,194,69,184,216                  // vfmadd231ps   %ymm8,%ymm7,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -539,7 +539,7 @@
 _sk_colorburn_skx:
   .byte  98,241,92,40,194,199,0              // vcmpeqps      %ymm7,%ymm4,%k0
   .byte  98,114,126,40,56,192                // vpmovm2d      %k0,%ymm8
-  .byte  196,98,125,24,13,105,165,3,0        // vbroadcastss  0x3a569(%rip),%ymm9        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,13,153,157,3,0        // vbroadcastss  0x39d99(%rip),%ymm9        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,52,92,215                       // vsubps        %ymm7,%ymm9,%ymm10
   .byte  197,44,89,216                       // vmulps        %ymm0,%ymm10,%ymm11
   .byte  197,36,88,228                       // vaddps        %ymm4,%ymm11,%ymm12
@@ -603,7 +603,7 @@
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  98,209,92,40,194,192,0              // vcmpeqps      %ymm8,%ymm4,%k0
   .byte  98,114,126,40,56,200                // vpmovm2d      %k0,%ymm9
-  .byte  196,98,125,24,21,58,164,3,0         // vbroadcastss  0x3a43a(%rip),%ymm10        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,21,106,156,3,0        // vbroadcastss  0x39c6a(%rip),%ymm10        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,44,92,223                       // vsubps        %ymm7,%ymm10,%ymm11
   .byte  197,36,89,224                       // vmulps        %ymm0,%ymm11,%ymm12
   .byte  98,241,124,40,194,195,0             // vcmpeqps      %ymm3,%ymm0,%k0
@@ -660,7 +660,7 @@
 .globl _sk_hardlight_skx
 FUNCTION(_sk_hardlight_skx)
 _sk_hardlight_skx:
-  .byte  196,98,125,24,5,50,163,3,0          // vbroadcastss  0x3a332(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,98,155,3,0          // vbroadcastss  0x39b62(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,207                       // vsubps        %ymm7,%ymm8,%ymm9
   .byte  197,52,89,208                       // vmulps        %ymm0,%ymm9,%ymm10
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -714,7 +714,7 @@
 .globl _sk_overlay_skx
 FUNCTION(_sk_overlay_skx)
 _sk_overlay_skx:
-  .byte  196,98,125,24,5,78,162,3,0          // vbroadcastss  0x3a24e(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,126,154,3,0         // vbroadcastss  0x39a7e(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,207                       // vsubps        %ymm7,%ymm8,%ymm9
   .byte  197,52,89,208                       // vmulps        %ymm0,%ymm9,%ymm10
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -780,15 +780,15 @@
   .byte  196,65,52,88,217                    // vaddps        %ymm9,%ymm9,%ymm11
   .byte  196,65,36,88,235                    // vaddps        %ymm11,%ymm11,%ymm13
   .byte  197,4,92,243                        // vsubps        %ymm3,%ymm15,%ymm14
-  .byte  196,98,125,24,29,44,161,3,0         // vbroadcastss  0x3a12c(%rip),%ymm11        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,29,92,153,3,0         // vbroadcastss  0x3995c(%rip),%ymm11        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,36,92,225                    // vsubps        %ymm9,%ymm11,%ymm12
   .byte  196,98,13,168,227                   // vfmadd213ps   %ymm3,%ymm14,%ymm12
   .byte  197,156,89,212                      // vmulps        %ymm4,%ymm12,%ymm2
   .byte  196,66,21,168,237                   // vfmadd213ps   %ymm13,%ymm13,%ymm13
-  .byte  98,226,125,40,24,21,39,161,3,0      // vbroadcastss  0x3a127(%rip),%ymm18        # 3ab94 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
+  .byte  98,226,125,40,24,21,87,153,3,0      // vbroadcastss  0x39957(%rip),%ymm18        # 3a3c4 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
   .byte  98,161,52,40,88,202                 // vaddps        %ymm18,%ymm9,%ymm17
   .byte  98,81,116,32,89,229                 // vmulps        %ymm13,%ymm17,%ymm12
-  .byte  98,226,125,40,24,29,21,161,3,0      // vbroadcastss  0x3a115(%rip),%ymm19        # 3ab98 <_sk_srcover_bgra_8888_sse2_lowp+0x2cc>
+  .byte  98,226,125,40,24,29,69,153,3,0      // vbroadcastss  0x39945(%rip),%ymm19        # 3a3c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2cc>
   .byte  98,50,53,40,184,227                 // vfmadd231ps   %ymm19,%ymm9,%ymm12
   .byte  98,194,125,40,78,201                // vrsqrt14ps    %ymm9,%ymm17
   .byte  98,162,125,40,76,201                // vrcp14ps      %ymm17,%ymm17
@@ -910,11 +910,11 @@
   .byte  196,65,28,89,219                    // vmulps        %ymm11,%ymm12,%ymm11
   .byte  196,65,36,94,222                    // vdivps        %ymm14,%ymm11,%ymm11
   .byte  196,99,37,74,225,240                // vblendvps     %ymm15,%ymm1,%ymm11,%ymm12
-  .byte  196,98,125,24,45,176,158,3,0        // vbroadcastss  0x39eb0(%rip),%ymm13        # 3ab9c <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
-  .byte  196,98,125,24,53,171,158,3,0        // vbroadcastss  0x39eab(%rip),%ymm14        # 3aba0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
+  .byte  196,98,125,24,45,224,150,3,0        // vbroadcastss  0x396e0(%rip),%ymm13        # 3a3cc <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  .byte  196,98,125,24,53,219,150,3,0        // vbroadcastss  0x396db(%rip),%ymm14        # 3a3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
   .byte  196,65,84,89,254                    // vmulps        %ymm14,%ymm5,%ymm15
   .byte  196,66,93,184,253                   // vfmadd231ps   %ymm13,%ymm4,%ymm15
-  .byte  98,226,125,40,24,5,155,158,3,0      // vbroadcastss  0x39e9b(%rip),%ymm16        # 3aba4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
+  .byte  98,226,125,40,24,5,203,150,3,0      // vbroadcastss  0x396cb(%rip),%ymm16        # 3a3d4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
   .byte  98,50,77,40,184,248                 // vfmadd231ps   %ymm16,%ymm6,%ymm15
   .byte  196,65,44,89,222                    // vmulps        %ymm14,%ymm10,%ymm11
   .byte  196,66,53,184,221                   // vfmadd231ps   %ymm13,%ymm9,%ymm11
@@ -971,7 +971,7 @@
   .byte  196,65,12,88,219                    // vaddps        %ymm11,%ymm14,%ymm11
   .byte  196,67,45,74,203,144                // vblendvps     %ymm9,%ymm11,%ymm10,%ymm9
   .byte  197,52,95,201                       // vmaxps        %ymm1,%ymm9,%ymm9
-  .byte  196,226,125,24,13,55,157,3,0        // vbroadcastss  0x39d37(%rip),%ymm1        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,13,103,149,3,0       // vbroadcastss  0x39567(%rip),%ymm1        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,116,92,215                      // vsubps        %ymm7,%ymm1,%ymm10
   .byte  197,172,89,192                      // vmulps        %ymm0,%ymm10,%ymm0
   .byte  197,116,92,219                      // vsubps        %ymm3,%ymm1,%ymm11
@@ -1023,11 +1023,11 @@
   .byte  196,65,28,89,219                    // vmulps        %ymm11,%ymm12,%ymm11
   .byte  196,65,36,94,222                    // vdivps        %ymm14,%ymm11,%ymm11
   .byte  196,99,37,74,225,240                // vblendvps     %ymm15,%ymm1,%ymm11,%ymm12
-  .byte  196,98,125,24,45,108,156,3,0        // vbroadcastss  0x39c6c(%rip),%ymm13        # 3ab9c <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
-  .byte  196,98,125,24,53,103,156,3,0        // vbroadcastss  0x39c67(%rip),%ymm14        # 3aba0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
+  .byte  196,98,125,24,45,156,148,3,0        // vbroadcastss  0x3949c(%rip),%ymm13        # 3a3cc <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  .byte  196,98,125,24,53,151,148,3,0        // vbroadcastss  0x39497(%rip),%ymm14        # 3a3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
   .byte  196,65,84,89,254                    // vmulps        %ymm14,%ymm5,%ymm15
   .byte  196,66,93,184,253                   // vfmadd231ps   %ymm13,%ymm4,%ymm15
-  .byte  98,226,125,40,24,5,87,156,3,0       // vbroadcastss  0x39c57(%rip),%ymm16        # 3aba4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
+  .byte  98,226,125,40,24,5,135,148,3,0      // vbroadcastss  0x39487(%rip),%ymm16        # 3a3d4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
   .byte  98,50,77,40,184,248                 // vfmadd231ps   %ymm16,%ymm6,%ymm15
   .byte  196,65,44,89,222                    // vmulps        %ymm14,%ymm10,%ymm11
   .byte  196,66,53,184,221                   // vfmadd231ps   %ymm13,%ymm9,%ymm11
@@ -1084,7 +1084,7 @@
   .byte  196,65,12,88,219                    // vaddps        %ymm11,%ymm14,%ymm11
   .byte  196,67,45,74,203,144                // vblendvps     %ymm9,%ymm11,%ymm10,%ymm9
   .byte  197,52,95,201                       // vmaxps        %ymm1,%ymm9,%ymm9
-  .byte  196,226,125,24,13,243,154,3,0       // vbroadcastss  0x39af3(%rip),%ymm1        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,13,35,147,3,0        // vbroadcastss  0x39323(%rip),%ymm1        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,116,92,215                      // vsubps        %ymm7,%ymm1,%ymm10
   .byte  197,172,89,192                      // vmulps        %ymm0,%ymm10,%ymm0
   .byte  197,116,92,219                      // vsubps        %ymm3,%ymm1,%ymm11
@@ -1108,11 +1108,11 @@
   .byte  197,124,89,199                      // vmulps        %ymm7,%ymm0,%ymm8
   .byte  197,116,89,207                      // vmulps        %ymm7,%ymm1,%ymm9
   .byte  197,108,89,223                      // vmulps        %ymm7,%ymm2,%ymm11
-  .byte  196,98,125,24,37,188,154,3,0        // vbroadcastss  0x39abc(%rip),%ymm12        # 3ab9c <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
-  .byte  196,98,125,24,45,183,154,3,0        // vbroadcastss  0x39ab7(%rip),%ymm13        # 3aba0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
+  .byte  196,98,125,24,37,236,146,3,0        // vbroadcastss  0x392ec(%rip),%ymm12        # 3a3cc <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  .byte  196,98,125,24,45,231,146,3,0        // vbroadcastss  0x392e7(%rip),%ymm13        # 3a3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
   .byte  196,65,84,89,245                    // vmulps        %ymm13,%ymm5,%ymm14
   .byte  196,66,93,184,244                   // vfmadd231ps   %ymm12,%ymm4,%ymm14
-  .byte  196,98,125,24,61,168,154,3,0        // vbroadcastss  0x39aa8(%rip),%ymm15        # 3aba4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
+  .byte  196,98,125,24,61,216,146,3,0        // vbroadcastss  0x392d8(%rip),%ymm15        # 3a3d4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
   .byte  196,66,77,184,247                   // vfmadd231ps   %ymm15,%ymm6,%ymm14
   .byte  196,65,52,89,213                    // vmulps        %ymm13,%ymm9,%ymm10
   .byte  196,66,61,184,212                   // vfmadd231ps   %ymm12,%ymm8,%ymm10
@@ -1170,7 +1170,7 @@
   .byte  196,65,20,88,219                    // vaddps        %ymm11,%ymm13,%ymm11
   .byte  196,67,53,74,203,192                // vblendvps     %ymm12,%ymm11,%ymm9,%ymm9
   .byte  98,49,52,40,95,202                  // vmaxps        %ymm18,%ymm9,%ymm9
-  .byte  196,98,125,24,29,57,153,3,0         // vbroadcastss  0x39939(%rip),%ymm11        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,29,105,145,3,0        // vbroadcastss  0x39169(%rip),%ymm11        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,36,92,231                       // vsubps        %ymm7,%ymm11,%ymm12
   .byte  197,156,89,192                      // vmulps        %ymm0,%ymm12,%ymm0
   .byte  197,36,92,219                       // vsubps        %ymm3,%ymm11,%ymm11
@@ -1194,11 +1194,11 @@
   .byte  197,100,89,196                      // vmulps        %ymm4,%ymm3,%ymm8
   .byte  197,100,89,205                      // vmulps        %ymm5,%ymm3,%ymm9
   .byte  197,100,89,222                      // vmulps        %ymm6,%ymm3,%ymm11
-  .byte  196,98,125,24,37,4,153,3,0          // vbroadcastss  0x39904(%rip),%ymm12        # 3ab9c <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
-  .byte  196,98,125,24,45,255,152,3,0        // vbroadcastss  0x398ff(%rip),%ymm13        # 3aba0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
+  .byte  196,98,125,24,37,52,145,3,0         // vbroadcastss  0x39134(%rip),%ymm12        # 3a3cc <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  .byte  196,98,125,24,45,47,145,3,0         // vbroadcastss  0x3912f(%rip),%ymm13        # 3a3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
   .byte  196,65,116,89,245                   // vmulps        %ymm13,%ymm1,%ymm14
   .byte  196,66,125,184,244                  // vfmadd231ps   %ymm12,%ymm0,%ymm14
-  .byte  196,98,125,24,61,240,152,3,0        // vbroadcastss  0x398f0(%rip),%ymm15        # 3aba4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
+  .byte  196,98,125,24,61,32,145,3,0         // vbroadcastss  0x39120(%rip),%ymm15        # 3a3d4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
   .byte  196,66,109,184,247                  // vfmadd231ps   %ymm15,%ymm2,%ymm14
   .byte  196,65,52,89,213                    // vmulps        %ymm13,%ymm9,%ymm10
   .byte  196,66,61,184,212                   // vfmadd231ps   %ymm12,%ymm8,%ymm10
@@ -1256,7 +1256,7 @@
   .byte  196,65,20,88,219                    // vaddps        %ymm11,%ymm13,%ymm11
   .byte  196,67,53,74,203,192                // vblendvps     %ymm12,%ymm11,%ymm9,%ymm9
   .byte  98,49,52,40,95,202                  // vmaxps        %ymm18,%ymm9,%ymm9
-  .byte  196,98,125,24,29,129,151,3,0        // vbroadcastss  0x39781(%rip),%ymm11        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,29,177,143,3,0        // vbroadcastss  0x38fb1(%rip),%ymm11        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,36,92,231                       // vsubps        %ymm7,%ymm11,%ymm12
   .byte  197,156,89,192                      // vmulps        %ymm0,%ymm12,%ymm0
   .byte  197,36,92,219                       // vsubps        %ymm3,%ymm11,%ymm11
@@ -1278,15 +1278,13 @@
 FUNCTION(_sk_srcover_rgba_8888_skx)
 _sk_srcover_rgba_8888_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,235,0,0,0                    // jne           1546 <_sk_srcover_rgba_8888_skx+0x10b>
-  .byte  196,129,126,111,60,152              // vmovdqu       (%r8,%r11,4),%ymm7
+  .byte  15,133,235,0,0,0                    // jne           1540 <_sk_srcover_rgba_8888_skx+0x105>
+  .byte  196,193,126,111,60,144              // vmovdqu       (%r8,%rdx,4),%ymm7
   .byte  184,17,17,17,17                     // mov           $0x11111111,%eax
   .byte  197,251,146,200                     // kmovd         %eax,%k1
   .byte  98,241,127,169,111,231              // vmovdqu8      %ymm7,%ymm4{%k1}{z}
@@ -1300,9 +1298,9 @@
   .byte  197,252,91,246                      // vcvtdq2ps     %ymm6,%ymm6
   .byte  197,197,114,215,24                  // vpsrld        $0x18,%ymm7,%ymm7
   .byte  197,252,91,255                      // vcvtdq2ps     %ymm7,%ymm7
-  .byte  196,98,125,24,13,211,150,3,0        // vbroadcastss  0x396d3(%rip),%ymm9        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,13,9,143,3,0          // vbroadcastss  0x38f09(%rip),%ymm9        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,52,92,203                       // vsubps        %ymm3,%ymm9,%ymm9
-  .byte  196,98,125,24,21,242,150,3,0        // vbroadcastss  0x396f2(%rip),%ymm10        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,98,125,24,21,40,143,3,0         // vbroadcastss  0x38f28(%rip),%ymm10        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   .byte  196,193,124,89,194                  // vmulps        %ymm10,%ymm0,%ymm0
   .byte  196,194,93,184,193                  // vfmadd231ps   %ymm9,%ymm4,%ymm0
   .byte  196,193,116,89,202                  // vmulps        %ymm10,%ymm1,%ymm1
@@ -1330,95 +1328,95 @@
   .byte  196,65,37,235,192                   // vpor          %ymm8,%ymm11,%ymm8
   .byte  196,65,53,235,192                   // vpor          %ymm8,%ymm9,%ymm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,66                              // jne           157e <_sk_srcover_rgba_8888_skx+0x143>
-  .byte  196,1,126,127,4,152                 // vmovdqu       %ymm8,(%r8,%r11,4)
+  .byte  117,58                              // jne           1570 <_sk_srcover_rgba_8888_skx+0x135>
+  .byte  196,65,126,127,4,144                // vmovdqu       %ymm8,(%r8,%rdx,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,197,239,255                     // vpxor         %ymm7,%ymm7,%ymm7
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,2,255,255,255                // ja            1461 <_sk_srcover_rgba_8888_skx+0x26>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,6,1,0,0                   // lea           0x106(%rip),%r10        # 1670 <_sk_srcover_rgba_8888_skx+0x235>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
-  .byte  255,224                             // jmpq          *%rax
-  .byte  196,129,121,110,60,152              // vmovd         (%r8,%r11,4),%xmm7
-  .byte  233,227,254,255,255                 // jmpq          1461 <_sk_srcover_rgba_8888_skx+0x26>
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,179                             // ja            1542 <_sk_srcover_rgba_8888_skx+0x107>
-  .byte  65,15,182,193                       // movzbl        %r9b,%eax
-  .byte  76,141,13,242,0,0,0                 // lea           0xf2(%rip),%r9        # 168c <_sk_srcover_rgba_8888_skx+0x251>
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  15,135,9,255,255,255                // ja            145b <_sk_srcover_rgba_8888_skx+0x20>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,252,0,0,0                 // lea           0xfc(%rip),%r9        # 1658 <_sk_srcover_rgba_8888_skx+0x21d>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,1,121,126,4,152                 // vmovd         %xmm8,(%r8,%r11,4)
-  .byte  235,151                             // jmp           1542 <_sk_srcover_rgba_8888_skx+0x107>
-  .byte  196,129,121,110,100,152,8           // vmovd         0x8(%r8,%r11,4),%xmm4
+  .byte  196,193,121,110,60,144              // vmovd         (%r8,%rdx,4),%xmm7
+  .byte  233,235,254,255,255                 // jmpq          145b <_sk_srcover_rgba_8888_skx+0x20>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,194                             // ja            153c <_sk_srcover_rgba_8888_skx+0x101>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,240,0,0,0                 // lea           0xf0(%rip),%r9        # 1674 <_sk_srcover_rgba_8888_skx+0x239>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
+  .byte  255,224                             // jmpq          *%rax
+  .byte  196,65,121,126,4,144                // vmovd         %xmm8,(%r8,%rdx,4)
+  .byte  235,167                             // jmp           153c <_sk_srcover_rgba_8888_skx+0x101>
+  .byte  196,193,121,110,100,144,8           // vmovd         0x8(%r8,%rdx,4),%xmm4
   .byte  176,4                               // mov           $0x4,%al
   .byte  197,251,146,200                     // kmovd         %eax,%k1
   .byte  98,242,125,169,137,252              // vpexpandd     %ymm4,%ymm7{%k1}{z}
-  .byte  196,130,121,53,36,152               // vpmovzxdq     (%r8,%r11,4),%xmm4
+  .byte  196,194,121,53,36,144               // vpmovzxdq     (%r8,%rdx,4),%xmm4
   .byte  197,249,112,228,232                 // vpshufd       $0xe8,%xmm4,%xmm4
   .byte  196,227,69,2,252,3                  // vpblendd      $0x3,%ymm4,%ymm7,%ymm7
-  .byte  233,141,254,255,255                 // jmpq          1461 <_sk_srcover_rgba_8888_skx+0x26>
-  .byte  196,129,121,110,100,152,24          // vmovd         0x18(%r8,%r11,4),%xmm4
+  .byte  233,157,254,255,255                 // jmpq          145b <_sk_srcover_rgba_8888_skx+0x20>
+  .byte  196,193,121,110,100,144,24          // vmovd         0x18(%r8,%rdx,4),%xmm4
   .byte  176,64                              // mov           $0x40,%al
   .byte  197,251,146,200                     // kmovd         %eax,%k1
   .byte  98,242,125,169,137,252              // vpexpandd     %ymm4,%ymm7{%k1}{z}
   .byte  196,227,125,57,252,1                // vextracti128  $0x1,%ymm7,%xmm4
-  .byte  196,131,89,34,100,152,20,1          // vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,20,1          // vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,227,69,56,252,1                 // vinserti128   $0x1,%xmm4,%ymm7,%ymm7
   .byte  196,227,125,57,252,1                // vextracti128  $0x1,%ymm7,%xmm4
-  .byte  196,131,89,34,100,152,16,0          // vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,16,0          // vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,227,69,56,252,1                 // vinserti128   $0x1,%xmm4,%ymm7,%ymm7
-  .byte  196,129,122,111,36,152              // vmovdqu       (%r8,%r11,4),%xmm4
+  .byte  196,193,122,111,36,144              // vmovdqu       (%r8,%rdx,4),%xmm4
   .byte  196,227,93,2,255,240                // vpblendd      $0xf0,%ymm7,%ymm4,%ymm7
-  .byte  233,65,254,255,255                  // jmpq          1461 <_sk_srcover_rgba_8888_skx+0x26>
-  .byte  196,3,121,22,68,152,8,2             // vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
+  .byte  233,81,254,255,255                  // jmpq          145b <_sk_srcover_rgba_8888_skx+0x20>
+  .byte  196,67,121,22,68,144,8,2            // vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
   .byte  196,66,121,53,192                   // vpmovzxdq     %xmm8,%xmm8
-  .byte  98,18,126,8,53,4,152                // vpmovqd       %xmm8,(%r8,%r11,4)
-  .byte  233,9,255,255,255                   // jmpq          1542 <_sk_srcover_rgba_8888_skx+0x107>
+  .byte  98,82,126,8,53,4,144                // vpmovqd       %xmm8,(%r8,%rdx,4)
+  .byte  233,25,255,255,255                  // jmpq          153c <_sk_srcover_rgba_8888_skx+0x101>
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,24,2            // vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,24,2           // vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,20,1            // vpextrd       $0x1,%xmm9,0x14(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,20,1           // vpextrd       $0x1,%xmm9,0x14(%r8,%rdx,4)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,1,121,126,76,152,16             // vmovd         %xmm9,0x10(%r8,%r11,4)
-  .byte  196,1,122,127,4,152                 // vmovdqu       %xmm8,(%r8,%r11,4)
-  .byte  233,213,254,255,255                 // jmpq          1542 <_sk_srcover_rgba_8888_skx+0x107>
-  .byte  15,31,0                             // nopl          (%rax)
-  .byte  3,255                               // add           %edi,%edi
-  .byte  255                                 // (bad)
-  .byte  255,78,255                          // decl          -0x1(%rsi)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  59,255                              // cmp           %edi,%edi
-  .byte  255                                 // (bad)
-  .byte  255,159,255,255,255,139             // lcall         *-0x74000001(%rdi)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,119,255                         // pushq         -0x1(%rdi)
-  .byte  255                                 // (bad)
-  .byte  255,100,255,255                     // jmpq          *-0x1(%rdi,%rdi,8)
-  .byte  255,23                              // callq         *(%rdi)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,156,255,255,255,148,255         // lcall         *-0x6b0001(%rdi,%rdi,8)
-  .byte  255                                 // (bad)
-  .byte  255,214                             // callq         *%rsi
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,201                             // dec           %ecx
+  .byte  196,65,121,126,76,144,16            // vmovd         %xmm9,0x10(%r8,%rdx,4)
+  .byte  196,65,122,127,4,144                // vmovdqu       %xmm8,(%r8,%rdx,4)
+  .byte  233,229,254,255,255                 // jmpq          153c <_sk_srcover_rgba_8888_skx+0x101>
+  .byte  144                                 // nop
+  .byte  13,255,255,255,80                   // or            $0x50ffffff,%eax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  187,255,255,255,173                 // mov           $0xadffffff,%ebx
+  .byte  61,255,255,255,161                  // cmp           $0xa1ffffff,%eax
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,141,255,255,255,121             // decl          0x79ffffff(%rbp)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,102,255                         // jmpq          *-0x1(%rsi)
+  .byte  255                                 // (bad)
+  .byte  255,25                              // lcall         *(%rcx)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,158,255,255,255,150             // lcall         *-0x69000001(%rsi)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  216,255                             // fdivr         %st(7),%st
+  .byte  255                                 // (bad)
+  .byte  255,203                             // dec           %ebx
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  189,255,255,255,175                 // mov           $0xafffffff,%ebp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -1428,15 +1426,13 @@
 FUNCTION(_sk_srcover_bgra_8888_skx)
 _sk_srcover_bgra_8888_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,235,0,0,0                    // jne           17b3 <_sk_srcover_bgra_8888_skx+0x10b>
-  .byte  196,129,126,111,60,152              // vmovdqu       (%r8,%r11,4),%ymm7
+  .byte  15,133,235,0,0,0                    // jne           1795 <_sk_srcover_bgra_8888_skx+0x105>
+  .byte  196,193,126,111,60,144              // vmovdqu       (%r8,%rdx,4),%ymm7
   .byte  184,17,17,17,17                     // mov           $0x11111111,%eax
   .byte  197,251,146,200                     // kmovd         %eax,%k1
   .byte  98,241,127,169,111,231              // vmovdqu8      %ymm7,%ymm4{%k1}{z}
@@ -1450,9 +1446,9 @@
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
   .byte  197,197,114,215,24                  // vpsrld        $0x18,%ymm7,%ymm7
   .byte  197,252,91,255                      // vcvtdq2ps     %ymm7,%ymm7
-  .byte  196,98,125,24,13,102,148,3,0        // vbroadcastss  0x39466(%rip),%ymm9        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,13,180,140,3,0        // vbroadcastss  0x38cb4(%rip),%ymm9        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,52,92,203                       // vsubps        %ymm3,%ymm9,%ymm9
-  .byte  196,98,125,24,21,133,148,3,0        // vbroadcastss  0x39485(%rip),%ymm10        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,98,125,24,21,211,140,3,0        // vbroadcastss  0x38cd3(%rip),%ymm10        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   .byte  196,193,124,89,194                  // vmulps        %ymm10,%ymm0,%ymm0
   .byte  196,194,93,184,193                  // vfmadd231ps   %ymm9,%ymm4,%ymm0
   .byte  196,193,116,89,202                  // vmulps        %ymm10,%ymm1,%ymm1
@@ -1480,98 +1476,98 @@
   .byte  196,65,37,235,192                   // vpor          %ymm8,%ymm11,%ymm8
   .byte  196,65,53,235,192                   // vpor          %ymm8,%ymm9,%ymm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,66                              // jne           17eb <_sk_srcover_bgra_8888_skx+0x143>
-  .byte  196,1,126,127,4,152                 // vmovdqu       %ymm8,(%r8,%r11,4)
+  .byte  117,58                              // jne           17c5 <_sk_srcover_bgra_8888_skx+0x135>
+  .byte  196,65,126,127,4,144                // vmovdqu       %ymm8,(%r8,%rdx,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,197,239,255                     // vpxor         %ymm7,%ymm7,%ymm7
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,2,255,255,255                // ja            16ce <_sk_srcover_bgra_8888_skx+0x26>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,5,1,0,0                   // lea           0x105(%rip),%r10        # 18dc <_sk_srcover_bgra_8888_skx+0x234>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
-  .byte  255,224                             // jmpq          *%rax
-  .byte  196,129,121,110,60,152              // vmovd         (%r8,%r11,4),%xmm7
-  .byte  233,227,254,255,255                 // jmpq          16ce <_sk_srcover_bgra_8888_skx+0x26>
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,179                             // ja            17af <_sk_srcover_bgra_8888_skx+0x107>
-  .byte  65,15,182,193                       // movzbl        %r9b,%eax
-  .byte  76,141,13,241,0,0,0                 // lea           0xf1(%rip),%r9        # 18f8 <_sk_srcover_bgra_8888_skx+0x250>
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  15,135,9,255,255,255                // ja            16b0 <_sk_srcover_bgra_8888_skx+0x20>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,251,0,0,0                 // lea           0xfb(%rip),%r9        # 18ac <_sk_srcover_bgra_8888_skx+0x21c>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,1,121,126,4,152                 // vmovd         %xmm8,(%r8,%r11,4)
-  .byte  235,151                             // jmp           17af <_sk_srcover_bgra_8888_skx+0x107>
-  .byte  196,129,121,110,100,152,8           // vmovd         0x8(%r8,%r11,4),%xmm4
+  .byte  196,193,121,110,60,144              // vmovd         (%r8,%rdx,4),%xmm7
+  .byte  233,235,254,255,255                 // jmpq          16b0 <_sk_srcover_bgra_8888_skx+0x20>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,194                             // ja            1791 <_sk_srcover_bgra_8888_skx+0x101>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,239,0,0,0                 // lea           0xef(%rip),%r9        # 18c8 <_sk_srcover_bgra_8888_skx+0x238>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
+  .byte  255,224                             // jmpq          *%rax
+  .byte  196,65,121,126,4,144                // vmovd         %xmm8,(%r8,%rdx,4)
+  .byte  235,167                             // jmp           1791 <_sk_srcover_bgra_8888_skx+0x101>
+  .byte  196,193,121,110,100,144,8           // vmovd         0x8(%r8,%rdx,4),%xmm4
   .byte  176,4                               // mov           $0x4,%al
   .byte  197,251,146,200                     // kmovd         %eax,%k1
   .byte  98,242,125,169,137,252              // vpexpandd     %ymm4,%ymm7{%k1}{z}
-  .byte  196,130,121,53,36,152               // vpmovzxdq     (%r8,%r11,4),%xmm4
+  .byte  196,194,121,53,36,144               // vpmovzxdq     (%r8,%rdx,4),%xmm4
   .byte  197,249,112,228,232                 // vpshufd       $0xe8,%xmm4,%xmm4
   .byte  196,227,69,2,252,3                  // vpblendd      $0x3,%ymm4,%ymm7,%ymm7
-  .byte  233,141,254,255,255                 // jmpq          16ce <_sk_srcover_bgra_8888_skx+0x26>
-  .byte  196,129,121,110,100,152,24          // vmovd         0x18(%r8,%r11,4),%xmm4
+  .byte  233,157,254,255,255                 // jmpq          16b0 <_sk_srcover_bgra_8888_skx+0x20>
+  .byte  196,193,121,110,100,144,24          // vmovd         0x18(%r8,%rdx,4),%xmm4
   .byte  176,64                              // mov           $0x40,%al
   .byte  197,251,146,200                     // kmovd         %eax,%k1
   .byte  98,242,125,169,137,252              // vpexpandd     %ymm4,%ymm7{%k1}{z}
   .byte  196,227,125,57,252,1                // vextracti128  $0x1,%ymm7,%xmm4
-  .byte  196,131,89,34,100,152,20,1          // vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,20,1          // vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,227,69,56,252,1                 // vinserti128   $0x1,%xmm4,%ymm7,%ymm7
   .byte  196,227,125,57,252,1                // vextracti128  $0x1,%ymm7,%xmm4
-  .byte  196,131,89,34,100,152,16,0          // vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,16,0          // vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,227,69,56,252,1                 // vinserti128   $0x1,%xmm4,%ymm7,%ymm7
-  .byte  196,129,122,111,36,152              // vmovdqu       (%r8,%r11,4),%xmm4
+  .byte  196,193,122,111,36,144              // vmovdqu       (%r8,%rdx,4),%xmm4
   .byte  196,227,93,2,255,240                // vpblendd      $0xf0,%ymm7,%ymm4,%ymm7
-  .byte  233,65,254,255,255                  // jmpq          16ce <_sk_srcover_bgra_8888_skx+0x26>
-  .byte  196,3,121,22,68,152,8,2             // vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
+  .byte  233,81,254,255,255                  // jmpq          16b0 <_sk_srcover_bgra_8888_skx+0x20>
+  .byte  196,67,121,22,68,144,8,2            // vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
   .byte  196,66,121,53,192                   // vpmovzxdq     %xmm8,%xmm8
-  .byte  98,18,126,8,53,4,152                // vpmovqd       %xmm8,(%r8,%r11,4)
-  .byte  233,9,255,255,255                   // jmpq          17af <_sk_srcover_bgra_8888_skx+0x107>
+  .byte  98,82,126,8,53,4,144                // vpmovqd       %xmm8,(%r8,%rdx,4)
+  .byte  233,25,255,255,255                  // jmpq          1791 <_sk_srcover_bgra_8888_skx+0x101>
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,24,2            // vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,24,2           // vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,20,1            // vpextrd       $0x1,%xmm9,0x14(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,20,1           // vpextrd       $0x1,%xmm9,0x14(%r8,%rdx,4)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,1,121,126,76,152,16             // vmovd         %xmm9,0x10(%r8,%r11,4)
-  .byte  196,1,122,127,4,152                 // vmovdqu       %xmm8,(%r8,%r11,4)
-  .byte  233,213,254,255,255                 // jmpq          17af <_sk_srcover_bgra_8888_skx+0x107>
-  .byte  102,144                             // xchg          %ax,%ax
-  .byte  4,255                               // add           $0xff,%al
-  .byte  255                                 // (bad)
-  .byte  255,79,255                          // decl          -0x1(%rdi)
+  .byte  196,65,121,126,76,144,16            // vmovd         %xmm9,0x10(%r8,%rdx,4)
+  .byte  196,65,122,127,4,144                // vmovdqu       %xmm8,(%r8,%rdx,4)
+  .byte  233,229,254,255,255                 // jmpq          1791 <_sk_srcover_bgra_8888_skx+0x101>
+  .byte  14                                  // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  60,255                              // cmp           $0xff,%al
+  .byte  255,81,255                          // callq         *-0x1(%rcx)
   .byte  255                                 // (bad)
-  .byte  255,160,255,255,255,140             // jmpq          *-0x73000001(%rax)
+  .byte  255                                 // (bad)
+  .byte  62,255                              // ds            (bad)
+  .byte  255                                 // (bad)
+  .byte  255,162,255,255,255,142             // jmpq          *-0x71000001(%rdx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  120,255                             // js            18f1 <_sk_srcover_bgra_8888_skx+0x249>
+  .byte  122,255                             // jp            18c1 <_sk_srcover_bgra_8888_skx+0x231>
   .byte  255                                 // (bad)
-  .byte  255,101,255                         // jmpq          *-0x1(%rbp)
+  .byte  255,103,255                         // jmpq          *-0x1(%rdi)
   .byte  255                                 // (bad)
-  .byte  255,24                              // lcall         *(%rax)
+  .byte  255,26                              // lcall         *(%rdx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,157,255,255,255,149             // lcall         *-0x6a000001(%rbp)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,215                             // callq         *%rdi
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,202                             // dec           %edx
+  .byte  255,159,255,255,255,151             // lcall         *-0x68000001(%rdi)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  188,255,255,255,174                 // mov           $0xaeffffff,%esp
+  .byte  217,255                             // fcos
+  .byte  255                                 // (bad)
+  .byte  255,204                             // dec           %esp
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  190,255,255,255,176                 // mov           $0xb0ffffff,%esi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -1592,7 +1588,7 @@
 .globl _sk_clamp_1_skx
 FUNCTION(_sk_clamp_1_skx)
 _sk_clamp_1_skx:
-  .byte  196,98,125,24,5,66,146,3,0          // vbroadcastss  0x39242(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,162,138,3,0         // vbroadcastss  0x38aa2(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  196,193,116,93,200                  // vminps        %ymm8,%ymm1,%ymm1
   .byte  196,193,108,93,208                  // vminps        %ymm8,%ymm2,%ymm2
@@ -1604,7 +1600,7 @@
 .globl _sk_clamp_a_skx
 FUNCTION(_sk_clamp_a_skx)
 _sk_clamp_a_skx:
-  .byte  98,241,100,56,93,29,32,146,3,0      // vminps        0x39220(%rip){1to8},%ymm3,%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  98,241,100,56,93,29,128,138,3,0     // vminps        0x38a80(%rip){1to8},%ymm3,%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,252,93,195                      // vminps        %ymm3,%ymm0,%ymm0
   .byte  197,244,93,203                      // vminps        %ymm3,%ymm1,%ymm1
   .byte  197,236,93,211                      // vminps        %ymm3,%ymm2,%ymm2
@@ -1615,7 +1611,7 @@
 .globl _sk_clamp_a_dst_skx
 FUNCTION(_sk_clamp_a_dst_skx)
 _sk_clamp_a_dst_skx:
-  .byte  98,241,68,56,93,61,6,146,3,0        // vminps        0x39206(%rip){1to8},%ymm7,%ymm7        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  98,241,68,56,93,61,102,138,3,0      // vminps        0x38a66(%rip){1to8},%ymm7,%ymm7        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,220,93,231                      // vminps        %ymm7,%ymm4,%ymm4
   .byte  197,212,93,239                      // vminps        %ymm7,%ymm5,%ymm5
   .byte  197,204,93,247                      // vminps        %ymm7,%ymm6,%ymm6
@@ -1647,7 +1643,7 @@
 .globl _sk_invert_skx
 FUNCTION(_sk_invert_skx)
 _sk_invert_skx:
-  .byte  196,98,125,24,5,198,145,3,0         // vbroadcastss  0x391c6(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,38,138,3,0          // vbroadcastss  0x38a26(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,188,92,192                      // vsubps        %ymm0,%ymm8,%ymm0
   .byte  197,188,92,201                      // vsubps        %ymm1,%ymm8,%ymm1
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
@@ -1701,9 +1697,9 @@
 .globl _sk_unpremul_skx
 FUNCTION(_sk_unpremul_skx)
 _sk_unpremul_skx:
-  .byte  196,98,125,24,5,97,145,3,0          // vbroadcastss  0x39161(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,193,137,3,0         // vbroadcastss  0x389c1(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,94,195                       // vdivps        %ymm3,%ymm8,%ymm8
-  .byte  98,241,60,56,194,5,130,145,3,0,1    // vcmpltps      0x39182(%rip){1to8},%ymm8,%k0        # 3abac <_sk_srcover_bgra_8888_sse2_lowp+0x2e0>
+  .byte  98,241,60,56,194,5,226,137,3,0,1    // vcmpltps      0x389e2(%rip){1to8},%ymm8,%k0        # 3a3dc <_sk_srcover_bgra_8888_sse2_lowp+0x2e0>
   .byte  98,114,126,40,56,200                // vpmovm2d      %k0,%ymm9
   .byte  196,65,44,87,210                    // vxorps        %ymm10,%ymm10,%ymm10
   .byte  196,67,45,74,192,144                // vblendvps     %ymm9,%ymm8,%ymm10,%ymm8
@@ -1717,16 +1713,16 @@
 .globl _sk_from_srgb_skx
 FUNCTION(_sk_from_srgb_skx)
 _sk_from_srgb_skx:
-  .byte  196,98,125,24,5,92,145,3,0          // vbroadcastss  0x3915c(%rip),%ymm8        # 3abb0 <_sk_srcover_bgra_8888_sse2_lowp+0x2e4>
+  .byte  196,98,125,24,5,188,137,3,0         // vbroadcastss  0x389bc(%rip),%ymm8        # 3a3e0 <_sk_srcover_bgra_8888_sse2_lowp+0x2e4>
   .byte  196,65,124,89,200                   // vmulps        %ymm8,%ymm0,%ymm9
   .byte  197,124,89,208                      // vmulps        %ymm0,%ymm0,%ymm10
-  .byte  196,98,125,24,29,78,145,3,0         // vbroadcastss  0x3914e(%rip),%ymm11        # 3abb4 <_sk_srcover_bgra_8888_sse2_lowp+0x2e8>
-  .byte  196,98,125,24,37,45,145,3,0         // vbroadcastss  0x3912d(%rip),%ymm12        # 3ab9c <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  .byte  196,98,125,24,29,174,137,3,0        // vbroadcastss  0x389ae(%rip),%ymm11        # 3a3e4 <_sk_srcover_bgra_8888_sse2_lowp+0x2e8>
+  .byte  196,98,125,24,37,141,137,3,0        // vbroadcastss  0x3898d(%rip),%ymm12        # 3a3cc <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
   .byte  196,65,124,40,236                   // vmovaps       %ymm12,%ymm13
   .byte  196,66,125,168,235                  // vfmadd213ps   %ymm11,%ymm0,%ymm13
-  .byte  196,98,125,24,53,54,145,3,0         // vbroadcastss  0x39136(%rip),%ymm14        # 3abb8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ec>
+  .byte  196,98,125,24,53,150,137,3,0        // vbroadcastss  0x38996(%rip),%ymm14        # 3a3e8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ec>
   .byte  196,66,45,168,238                   // vfmadd213ps   %ymm14,%ymm10,%ymm13
-  .byte  196,98,125,24,21,44,145,3,0         // vbroadcastss  0x3912c(%rip),%ymm10        # 3abbc <_sk_srcover_bgra_8888_sse2_lowp+0x2f0>
+  .byte  196,98,125,24,21,140,137,3,0        // vbroadcastss  0x3898c(%rip),%ymm10        # 3a3ec <_sk_srcover_bgra_8888_sse2_lowp+0x2f0>
   .byte  98,209,124,40,194,194,1             // vcmpltps      %ymm10,%ymm0,%k0
   .byte  98,242,126,40,56,192                // vpmovm2d      %k0,%ymm0
   .byte  196,195,21,74,193,0                 // vblendvps     %ymm0,%ymm9,%ymm13,%ymm0
@@ -1752,16 +1748,16 @@
 .globl _sk_from_srgb_dst_skx
 FUNCTION(_sk_from_srgb_dst_skx)
 _sk_from_srgb_dst_skx:
-  .byte  196,98,125,24,5,175,144,3,0         // vbroadcastss  0x390af(%rip),%ymm8        # 3abb0 <_sk_srcover_bgra_8888_sse2_lowp+0x2e4>
+  .byte  196,98,125,24,5,15,137,3,0          // vbroadcastss  0x3890f(%rip),%ymm8        # 3a3e0 <_sk_srcover_bgra_8888_sse2_lowp+0x2e4>
   .byte  196,65,92,89,200                    // vmulps        %ymm8,%ymm4,%ymm9
   .byte  197,92,89,212                       // vmulps        %ymm4,%ymm4,%ymm10
-  .byte  196,98,125,24,29,161,144,3,0        // vbroadcastss  0x390a1(%rip),%ymm11        # 3abb4 <_sk_srcover_bgra_8888_sse2_lowp+0x2e8>
-  .byte  196,98,125,24,37,128,144,3,0        // vbroadcastss  0x39080(%rip),%ymm12        # 3ab9c <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  .byte  196,98,125,24,29,1,137,3,0          // vbroadcastss  0x38901(%rip),%ymm11        # 3a3e4 <_sk_srcover_bgra_8888_sse2_lowp+0x2e8>
+  .byte  196,98,125,24,37,224,136,3,0        // vbroadcastss  0x388e0(%rip),%ymm12        # 3a3cc <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
   .byte  196,65,124,40,236                   // vmovaps       %ymm12,%ymm13
   .byte  196,66,93,168,235                   // vfmadd213ps   %ymm11,%ymm4,%ymm13
-  .byte  196,98,125,24,53,137,144,3,0        // vbroadcastss  0x39089(%rip),%ymm14        # 3abb8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ec>
+  .byte  196,98,125,24,53,233,136,3,0        // vbroadcastss  0x388e9(%rip),%ymm14        # 3a3e8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ec>
   .byte  196,66,45,168,238                   // vfmadd213ps   %ymm14,%ymm10,%ymm13
-  .byte  196,98,125,24,21,127,144,3,0        // vbroadcastss  0x3907f(%rip),%ymm10        # 3abbc <_sk_srcover_bgra_8888_sse2_lowp+0x2f0>
+  .byte  196,98,125,24,21,223,136,3,0        // vbroadcastss  0x388df(%rip),%ymm10        # 3a3ec <_sk_srcover_bgra_8888_sse2_lowp+0x2f0>
   .byte  98,209,92,40,194,194,1              // vcmpltps      %ymm10,%ymm4,%k0
   .byte  98,242,126,40,56,224                // vpmovm2d      %k0,%ymm4
   .byte  196,195,21,74,225,64                // vblendvps     %ymm4,%ymm9,%ymm13,%ymm4
@@ -1788,19 +1784,19 @@
 FUNCTION(_sk_to_srgb_skx)
 _sk_to_srgb_skx:
   .byte  98,114,125,40,78,192                // vrsqrt14ps    %ymm0,%ymm8
-  .byte  196,98,125,24,13,12,144,3,0         // vbroadcastss  0x3900c(%rip),%ymm9        # 3abc0 <_sk_srcover_bgra_8888_sse2_lowp+0x2f4>
+  .byte  196,98,125,24,13,108,136,3,0        // vbroadcastss  0x3886c(%rip),%ymm9        # 3a3f0 <_sk_srcover_bgra_8888_sse2_lowp+0x2f4>
   .byte  196,65,124,89,209                   // vmulps        %ymm9,%ymm0,%ymm10
-  .byte  196,98,125,24,29,2,144,3,0          // vbroadcastss  0x39002(%rip),%ymm11        # 3abc4 <_sk_srcover_bgra_8888_sse2_lowp+0x2f8>
-  .byte  196,98,125,24,37,253,143,3,0        // vbroadcastss  0x38ffd(%rip),%ymm12        # 3abc8 <_sk_srcover_bgra_8888_sse2_lowp+0x2fc>
+  .byte  196,98,125,24,29,98,136,3,0         // vbroadcastss  0x38862(%rip),%ymm11        # 3a3f4 <_sk_srcover_bgra_8888_sse2_lowp+0x2f8>
+  .byte  196,98,125,24,37,93,136,3,0         // vbroadcastss  0x3885d(%rip),%ymm12        # 3a3f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2fc>
   .byte  196,65,124,40,236                   // vmovaps       %ymm12,%ymm13
   .byte  196,66,61,168,235                   // vfmadd213ps   %ymm11,%ymm8,%ymm13
-  .byte  196,98,125,24,53,238,143,3,0        // vbroadcastss  0x38fee(%rip),%ymm14        # 3abcc <_sk_srcover_bgra_8888_sse2_lowp+0x300>
+  .byte  196,98,125,24,53,78,136,3,0         // vbroadcastss  0x3884e(%rip),%ymm14        # 3a3fc <_sk_srcover_bgra_8888_sse2_lowp+0x300>
   .byte  196,66,61,168,238                   // vfmadd213ps   %ymm14,%ymm8,%ymm13
-  .byte  196,98,125,24,61,228,143,3,0        // vbroadcastss  0x38fe4(%rip),%ymm15        # 3abd0 <_sk_srcover_bgra_8888_sse2_lowp+0x304>
+  .byte  196,98,125,24,61,68,136,3,0         // vbroadcastss  0x38844(%rip),%ymm15        # 3a400 <_sk_srcover_bgra_8888_sse2_lowp+0x304>
   .byte  196,65,60,88,199                    // vaddps        %ymm15,%ymm8,%ymm8
   .byte  98,82,125,40,76,192                 // vrcp14ps      %ymm8,%ymm8
   .byte  196,65,20,89,192                    // vmulps        %ymm8,%ymm13,%ymm8
-  .byte  196,98,125,24,45,207,143,3,0        // vbroadcastss  0x38fcf(%rip),%ymm13        # 3abd4 <_sk_srcover_bgra_8888_sse2_lowp+0x308>
+  .byte  196,98,125,24,45,47,136,3,0         // vbroadcastss  0x3882f(%rip),%ymm13        # 3a404 <_sk_srcover_bgra_8888_sse2_lowp+0x308>
   .byte  98,209,124,40,194,197,1             // vcmpltps      %ymm13,%ymm0,%k0
   .byte  98,242,126,40,56,192                // vpmovm2d      %k0,%ymm0
   .byte  196,195,61,74,194,0                 // vblendvps     %ymm0,%ymm10,%ymm8,%ymm0
@@ -1838,7 +1834,7 @@
   .byte  197,116,93,194                      // vminps        %ymm2,%ymm1,%ymm8
   .byte  196,65,124,93,208                   // vminps        %ymm8,%ymm0,%ymm10
   .byte  98,193,52,40,92,194                 // vsubps        %ymm10,%ymm9,%ymm16
-  .byte  196,98,125,24,5,192,142,3,0         // vbroadcastss  0x38ec0(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,32,135,3,0          // vbroadcastss  0x38720(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  98,49,60,40,94,224                  // vdivps        %ymm16,%ymm8,%ymm12
   .byte  98,209,52,40,194,194,0              // vcmpeqps      %ymm10,%ymm9,%k0
   .byte  98,114,126,40,56,192                // vpmovm2d      %k0,%ymm8
@@ -1847,23 +1843,23 @@
   .byte  197,116,92,242                      // vsubps        %ymm2,%ymm1,%ymm14
   .byte  98,241,116,40,194,194,1             // vcmpltps      %ymm2,%ymm1,%k0
   .byte  98,114,126,40,56,248                // vpmovm2d      %k0,%ymm15
-  .byte  196,98,125,24,29,226,142,3,0        // vbroadcastss  0x38ee2(%rip),%ymm11        # 3abd8 <_sk_srcover_bgra_8888_sse2_lowp+0x30c>
+  .byte  196,98,125,24,29,66,135,3,0         // vbroadcastss  0x38742(%rip),%ymm11        # 3a408 <_sk_srcover_bgra_8888_sse2_lowp+0x30c>
   .byte  197,196,87,255                      // vxorps        %ymm7,%ymm7,%ymm7
   .byte  196,67,69,74,219,240                // vblendvps     %ymm15,%ymm11,%ymm7,%ymm11
   .byte  196,66,29,168,243                   // vfmadd213ps   %ymm11,%ymm12,%ymm14
   .byte  98,241,52,40,194,193,0              // vcmpeqps      %ymm1,%ymm9,%k0
   .byte  98,114,126,40,56,216                // vpmovm2d      %k0,%ymm11
   .byte  197,236,92,208                      // vsubps        %ymm0,%ymm2,%ymm2
-  .byte  196,98,125,24,61,189,142,3,0        // vbroadcastss  0x38ebd(%rip),%ymm15        # 3abdc <_sk_srcover_bgra_8888_sse2_lowp+0x310>
+  .byte  196,98,125,24,61,29,135,3,0         // vbroadcastss  0x3871d(%rip),%ymm15        # 3a40c <_sk_srcover_bgra_8888_sse2_lowp+0x310>
   .byte  196,194,29,168,215                  // vfmadd213ps   %ymm15,%ymm12,%ymm2
   .byte  197,252,92,193                      // vsubps        %ymm1,%ymm0,%ymm0
-  .byte  98,242,29,56,168,5,174,142,3,0      // vfmadd213ps   0x38eae(%rip){1to8},%ymm12,%ymm0        # 3abe0 <_sk_srcover_bgra_8888_sse2_lowp+0x314>
+  .byte  98,242,29,56,168,5,14,135,3,0       // vfmadd213ps   0x3870e(%rip){1to8},%ymm12,%ymm0        # 3a410 <_sk_srcover_bgra_8888_sse2_lowp+0x314>
   .byte  196,227,125,74,194,176              // vblendvps     %ymm11,%ymm2,%ymm0,%ymm0
   .byte  196,195,125,74,198,208              // vblendvps     %ymm13,%ymm14,%ymm0,%ymm0
   .byte  196,227,125,74,199,128              // vblendvps     %ymm8,%ymm7,%ymm0,%ymm0
-  .byte  98,241,124,56,89,5,150,142,3,0      // vmulps        0x38e96(%rip){1to8},%ymm0,%ymm0        # 3abe4 <_sk_srcover_bgra_8888_sse2_lowp+0x318>
+  .byte  98,241,124,56,89,5,246,134,3,0      // vmulps        0x386f6(%rip){1to8},%ymm0,%ymm0        # 3a414 <_sk_srcover_bgra_8888_sse2_lowp+0x318>
   .byte  196,193,52,88,202                   // vaddps        %ymm10,%ymm9,%ymm1
-  .byte  196,98,125,24,29,28,142,3,0         // vbroadcastss  0x38e1c(%rip),%ymm11        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,29,124,134,3,0        // vbroadcastss  0x3867c(%rip),%ymm11        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,193,116,89,211                  // vmulps        %ymm11,%ymm1,%ymm2
   .byte  98,241,36,40,194,194,1              // vcmpltps      %ymm2,%ymm11,%k0
   .byte  98,114,126,40,56,216                // vpmovm2d      %k0,%ymm11
@@ -1882,7 +1878,7 @@
 _sk_hsl_to_rgb_skx:
   .byte  98,225,124,40,40,215                // vmovaps       %ymm7,%ymm18
   .byte  98,225,124,40,40,230                // vmovaps       %ymm6,%ymm20
-  .byte  98,226,125,40,24,5,206,141,3,0      // vbroadcastss  0x38dce(%rip),%ymm16        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  98,226,125,40,24,5,46,134,3,0       // vbroadcastss  0x3862e(%rip),%ymm16        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  98,241,124,32,194,194,2             // vcmpleps      %ymm2,%ymm16,%k0
   .byte  98,114,126,40,56,192                // vpmovm2d      %k0,%ymm8
   .byte  197,116,89,202                      // vmulps        %ymm2,%ymm1,%ymm9
@@ -1890,27 +1886,27 @@
   .byte  196,67,53,74,194,128                // vblendvps     %ymm8,%ymm10,%ymm9,%ymm8
   .byte  197,60,88,218                       // vaddps        %ymm2,%ymm8,%ymm11
   .byte  196,65,124,40,203                   // vmovaps       %ymm11,%ymm9
-  .byte  98,114,109,56,186,13,3,142,3,0      // vfmsub231ps   0x38e03(%rip){1to8},%ymm2,%ymm9        # 3abdc <_sk_srcover_bgra_8888_sse2_lowp+0x310>
+  .byte  98,114,109,56,186,13,99,134,3,0     // vfmsub231ps   0x38663(%rip){1to8},%ymm2,%ymm9        # 3a40c <_sk_srcover_bgra_8888_sse2_lowp+0x310>
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  98,209,116,40,194,192,0             // vcmpeqps      %ymm8,%ymm1,%k0
   .byte  98,242,126,40,56,248                // vpmovm2d      %k0,%ymm7
-  .byte  98,241,124,56,88,13,243,141,3,0     // vaddps        0x38df3(%rip){1to8},%ymm0,%ymm1        # 3abe8 <_sk_srcover_bgra_8888_sse2_lowp+0x31c>
+  .byte  98,241,124,56,88,13,83,134,3,0      // vaddps        0x38653(%rip){1to8},%ymm0,%ymm1        # 3a418 <_sk_srcover_bgra_8888_sse2_lowp+0x31c>
   .byte  196,99,125,8,193,1                  // vroundps      $0x1,%ymm1,%ymm8
   .byte  196,193,116,92,200                  // vsubps        %ymm8,%ymm1,%ymm1
-  .byte  98,226,125,40,24,29,226,141,3,0     // vbroadcastss  0x38de2(%rip),%ymm19        # 3abec <_sk_srcover_bgra_8888_sse2_lowp+0x320>
+  .byte  98,226,125,40,24,29,66,134,3,0      // vbroadcastss  0x38642(%rip),%ymm19        # 3a41c <_sk_srcover_bgra_8888_sse2_lowp+0x320>
   .byte  98,241,100,32,194,193,2             // vcmpleps      %ymm1,%ymm19,%k0
   .byte  98,114,126,40,56,192                // vpmovm2d      %k0,%ymm8
   .byte  196,65,36,92,241                    // vsubps        %ymm9,%ymm11,%ymm14
-  .byte  196,98,125,24,61,179,141,3,0        // vbroadcastss  0x38db3(%rip),%ymm15        # 3abd8 <_sk_srcover_bgra_8888_sse2_lowp+0x30c>
+  .byte  196,98,125,24,61,19,134,3,0         // vbroadcastss  0x38613(%rip),%ymm15        # 3a408 <_sk_srcover_bgra_8888_sse2_lowp+0x30c>
   .byte  196,65,116,89,231                   // vmulps        %ymm15,%ymm1,%ymm12
-  .byte  98,226,125,40,24,13,172,141,3,0     // vbroadcastss  0x38dac(%rip),%ymm17        # 3abe0 <_sk_srcover_bgra_8888_sse2_lowp+0x314>
+  .byte  98,226,125,40,24,13,12,134,3,0      // vbroadcastss  0x3860c(%rip),%ymm17        # 3a410 <_sk_srcover_bgra_8888_sse2_lowp+0x314>
   .byte  98,81,116,32,92,212                 // vsubps        %ymm12,%ymm17,%ymm10
   .byte  196,66,13,168,209                   // vfmadd213ps   %ymm9,%ymm14,%ymm10
   .byte  196,67,45,74,193,128                // vblendvps     %ymm8,%ymm9,%ymm10,%ymm8
   .byte  98,241,124,32,194,193,2             // vcmpleps      %ymm1,%ymm16,%k0
   .byte  98,114,126,40,56,208                // vpmovm2d      %k0,%ymm10
   .byte  196,67,37,74,192,160                // vblendvps     %ymm10,%ymm8,%ymm11,%ymm8
-  .byte  196,98,125,24,21,131,141,3,0        // vbroadcastss  0x38d83(%rip),%ymm10        # 3abe4 <_sk_srcover_bgra_8888_sse2_lowp+0x318>
+  .byte  196,98,125,24,21,227,133,3,0        // vbroadcastss  0x385e3(%rip),%ymm10        # 3a414 <_sk_srcover_bgra_8888_sse2_lowp+0x318>
   .byte  98,241,44,40,194,193,2              // vcmpleps      %ymm1,%ymm10,%k0
   .byte  98,242,126,40,56,200                // vpmovm2d      %k0,%ymm1
   .byte  196,66,13,168,225                   // vfmadd213ps   %ymm9,%ymm14,%ymm12
@@ -1932,7 +1928,7 @@
   .byte  196,66,13,168,233                   // vfmadd213ps   %ymm9,%ymm14,%ymm13
   .byte  196,195,21,74,200,16                // vblendvps     %ymm1,%ymm8,%ymm13,%ymm1
   .byte  196,227,117,74,202,112              // vblendvps     %ymm7,%ymm2,%ymm1,%ymm1
-  .byte  98,241,124,56,88,5,9,141,3,0        // vaddps        0x38d09(%rip){1to8},%ymm0,%ymm0        # 3abf0 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  .byte  98,241,124,56,88,5,105,133,3,0      // vaddps        0x38569(%rip){1to8},%ymm0,%ymm0        # 3a420 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
   .byte  196,99,125,8,192,1                  // vroundps      $0x1,%ymm0,%ymm8
   .byte  196,193,124,92,192                  // vsubps        %ymm8,%ymm0,%ymm0
   .byte  98,241,100,32,194,192,2             // vcmpleps      %ymm0,%ymm19,%k0
@@ -1973,76 +1969,73 @@
 FUNCTION(_sk_scale_u8_skx)
 _sk_scale_u8_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,54                              // jne           1fc3 <_sk_scale_u8_skx+0x4e>
-  .byte  196,2,121,48,4,24                   // vpmovzxbw     (%r8,%r11,1),%xmm8
-  .byte  197,57,219,5,117,149,3,0            // vpand         0x39575(%rip),%xmm8,%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  117,54                              // jne           1f8d <_sk_scale_u8_skx+0x48>
+  .byte  196,66,121,48,4,16                  // vpmovzxbw     (%r8,%rdx,1),%xmm8
+  .byte  197,57,219,5,235,141,3,0            // vpand         0x38deb(%rip),%xmm8,%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  196,66,125,51,192                   // vpmovzxwd     %xmm8,%ymm8
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  98,113,60,56,89,5,69,140,3,0        // vmulps        0x38c45(%rip){1to8},%ymm8,%ymm8        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  98,113,60,56,89,5,171,132,3,0       // vmulps        0x384ab(%rip){1to8},%ymm8,%ymm8        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
   .byte  197,188,89,201                      // vmulps        %ymm1,%ymm8,%ymm1
   .byte  197,188,89,210                      // vmulps        %ymm2,%ymm8,%ymm2
   .byte  197,188,89,219                      // vmulps        %ymm3,%ymm8,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,186                             // ja            1f93 <_sk_scale_u8_skx+0x1e>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,140,0,0,0                 // lea           0x8c(%rip),%r10        # 2070 <_sk_scale_u8_skx+0xfb>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,193                             // ja            1f5d <_sk_scale_u8_skx+0x18>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,138,0,0,0                 // lea           0x8a(%rip),%r9        # 2030 <_sk_scale_u8_skx+0xeb>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  235,155                             // jmp           1f93 <_sk_scale_u8_skx+0x1e>
-  .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
+  .byte  235,163                             // jmp           1f5d <_sk_scale_u8_skx+0x18>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  197,57,196,192,2                    // vpinsrw       $0x2,%eax,%xmm8,%xmm8
-  .byte  196,2,121,50,12,24                  // vpmovzxbq     (%r8,%r11,1),%xmm9
+  .byte  196,66,121,50,12,16                 // vpmovzxbq     (%r8,%rdx,1),%xmm9
   .byte  196,65,121,112,201,232              // vpshufd       $0xe8,%xmm9,%xmm9
   .byte  196,65,123,112,201,232              // vpshuflw      $0xe8,%xmm9,%xmm9
   .byte  196,67,57,2,193,1                   // vpblendd      $0x1,%xmm9,%xmm8,%xmm8
-  .byte  233,110,255,255,255                 // jmpq          1f93 <_sk_scale_u8_skx+0x1e>
-  .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
+  .byte  233,118,255,255,255                 // jmpq          1f5d <_sk_scale_u8_skx+0x18>
+  .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  197,57,196,192,6                    // vpinsrw       $0x6,%eax,%xmm8,%xmm8
-  .byte  67,15,182,68,24,5                   // movzbl        0x5(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,5                   // movzbl        0x5(%r8,%rdx,1),%eax
   .byte  197,57,196,192,5                    // vpinsrw       $0x5,%eax,%xmm8,%xmm8
-  .byte  67,15,182,68,24,4                   // movzbl        0x4(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,4                   // movzbl        0x4(%r8,%rdx,1),%eax
   .byte  197,57,196,192,4                    // vpinsrw       $0x4,%eax,%xmm8,%xmm8
-  .byte  196,2,121,49,12,24                  // vpmovzxbd     (%r8,%r11,1),%xmm9
+  .byte  196,66,121,49,12,16                 // vpmovzxbd     (%r8,%rdx,1),%xmm9
   .byte  196,65,123,112,201,232              // vpshuflw      $0xe8,%xmm9,%xmm9
   .byte  196,65,122,112,201,232              // vpshufhw      $0xe8,%xmm9,%xmm9
   .byte  196,65,121,112,201,232              // vpshufd       $0xe8,%xmm9,%xmm9
   .byte  196,67,49,2,192,12                  // vpblendd      $0xc,%xmm8,%xmm9,%xmm8
-  .byte  233,37,255,255,255                  // jmpq          1f93 <_sk_scale_u8_skx+0x1e>
-  .byte  102,144                             // xchg          %ax,%ax
-  .byte  125,255                             // jge           2071 <_sk_scale_u8_skx+0xfc>
+  .byte  233,45,255,255,255                  // jmpq          1f5d <_sk_scale_u8_skx+0x18>
+  .byte  127,255                             // jg            2031 <_sk_scale_u8_skx+0xec>
   .byte  255                                 // (bad)
-  .byte  255,152,255,255,255,136             // lcall         *-0x77000001(%rax)
+  .byte  255,154,255,255,255,138             // lcall         *-0x75000001(%rdx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  219,255                             // (bad)
+  .byte  221,255                             // (bad)
   .byte  255                                 // (bad)
-  .byte  255,208                             // callq         *%rax
+  .byte  255,210                             // callq         *%rdx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,197                             // inc           %ebp
+  .byte  255,199                             // inc           %edi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
-  .byte  181,255                             // mov           $0xff,%ch
+  .byte  183,255                             // mov           $0xff,%bh
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
@@ -2051,25 +2044,23 @@
 FUNCTION(_sk_scale_565_skx)
 _sk_scale_565_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,145,0,0,0                    // jne           213c <_sk_scale_565_skx+0xb0>
-  .byte  196,1,122,111,4,88                  // vmovdqu       (%r8,%r11,2),%xmm8
+  .byte  15,133,145,0,0,0                    // jne           20f6 <_sk_scale_565_skx+0xaa>
+  .byte  196,65,122,111,4,80                 // vmovdqu       (%r8,%rdx,2),%xmm8
   .byte  196,66,125,51,192                   // vpmovzxwd     %xmm8,%ymm8
-  .byte  98,113,61,56,219,13,56,139,3,0      // vpandd        0x38b38(%rip){1to8},%ymm8,%ymm9        # 3abf8 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  .byte  98,113,61,56,219,13,174,131,3,0     // vpandd        0x383ae(%rip){1to8},%ymm8,%ymm9        # 3a428 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
   .byte  196,65,124,91,201                   // vcvtdq2ps     %ymm9,%ymm9
-  .byte  98,113,52,56,89,13,45,139,3,0       // vmulps        0x38b2d(%rip){1to8},%ymm9,%ymm9        # 3abfc <_sk_srcover_bgra_8888_sse2_lowp+0x330>
-  .byte  98,113,61,56,219,21,39,139,3,0      // vpandd        0x38b27(%rip){1to8},%ymm8,%ymm10        # 3ac00 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  .byte  98,113,52,56,89,13,163,131,3,0      // vmulps        0x383a3(%rip){1to8},%ymm9,%ymm9        # 3a42c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  .byte  98,113,61,56,219,21,157,131,3,0     // vpandd        0x3839d(%rip){1to8},%ymm8,%ymm10        # 3a430 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
   .byte  196,65,124,91,210                   // vcvtdq2ps     %ymm10,%ymm10
-  .byte  98,113,44,56,89,21,28,139,3,0       // vmulps        0x38b1c(%rip){1to8},%ymm10,%ymm10        # 3ac04 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
-  .byte  98,113,61,56,219,5,22,139,3,0       // vpandd        0x38b16(%rip){1to8},%ymm8,%ymm8        # 3ac08 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  .byte  98,113,44,56,89,21,146,131,3,0      // vmulps        0x38392(%rip){1to8},%ymm10,%ymm10        # 3a434 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  .byte  98,113,61,56,219,5,140,131,3,0      // vpandd        0x3838c(%rip){1to8},%ymm8,%ymm8        # 3a438 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  98,113,60,56,89,5,11,139,3,0        // vmulps        0x38b0b(%rip){1to8},%ymm8,%ymm8        # 3ac0c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  .byte  98,113,60,56,89,5,129,131,3,0       // vmulps        0x38381(%rip){1to8},%ymm8,%ymm8        # 3a43c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
   .byte  98,241,100,40,194,199,1             // vcmpltps      %ymm7,%ymm3,%k0
   .byte  98,114,126,40,56,216                // vpmovm2d      %k0,%ymm11
   .byte  196,65,44,93,224                    // vminps        %ymm8,%ymm10,%ymm12
@@ -2083,54 +2074,53 @@
   .byte  197,164,89,219                      // vmulps        %ymm3,%ymm11,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,91,255,255,255               // ja            20b1 <_sk_scale_565_skx+0x25>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,131,0,0,0                 // lea           0x83(%rip),%r10        # 21e4 <_sk_scale_565_skx+0x158>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  15,135,98,255,255,255               // ja            206b <_sk_scale_565_skx+0x1f>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,129,0,0,0                 // lea           0x81(%rip),%r9        # 2194 <_sk_scale_565_skx+0x148>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  233,57,255,255,255                  // jmpq          20b1 <_sk_scale_565_skx+0x25>
+  .byte  233,65,255,255,255                  // jmpq          206b <_sk_scale_565_skx+0x1f>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,4,2              // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,2,121,52,12,88                  // vpmovzxwq     (%r8,%r11,2),%xmm9
+  .byte  196,65,57,196,68,80,4,2             // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,66,121,52,12,80                 // vpmovzxwq     (%r8,%rdx,2),%xmm9
   .byte  196,65,121,112,201,232              // vpshufd       $0xe8,%xmm9,%xmm9
   .byte  196,65,123,112,201,232              // vpshuflw      $0xe8,%xmm9,%xmm9
   .byte  196,67,57,2,193,1                   // vpblendd      $0x1,%xmm9,%xmm8,%xmm8
-  .byte  233,15,255,255,255                  // jmpq          20b1 <_sk_scale_565_skx+0x25>
+  .byte  233,23,255,255,255                  // jmpq          206b <_sk_scale_565_skx+0x1f>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,12,6             // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,10,5             // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,8,4              // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,2,121,51,12,88                  // vpmovzxwd     (%r8,%r11,2),%xmm9
+  .byte  196,65,57,196,68,80,12,6            // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,65,57,196,68,80,10,5            // vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,65,57,196,68,80,8,4             // vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,66,121,51,12,80                 // vpmovzxwd     (%r8,%rdx,2),%xmm9
   .byte  196,65,123,112,201,232              // vpshuflw      $0xe8,%xmm9,%xmm9
   .byte  196,65,122,112,201,232              // vpshufhw      $0xe8,%xmm9,%xmm9
   .byte  196,65,121,112,201,132              // vpshufd       $0x84,%xmm9,%xmm9
   .byte  196,65,49,109,192                   // vpunpckhqdq   %xmm8,%xmm9,%xmm8
-  .byte  233,208,254,255,255                 // jmpq          20b1 <_sk_scale_565_skx+0x25>
-  .byte  15,31,0                             // nopl          (%rax)
-  .byte  134,255                             // xchg          %bh,%bh
+  .byte  233,216,254,255,255                 // jmpq          206b <_sk_scale_565_skx+0x1f>
+  .byte  144                                 // nop
+  .byte  136,255                             // mov           %bh,%bh
   .byte  255                                 // (bad)
-  .byte  255,161,255,255,255,148             // jmpq          *-0x6b000001(%rcx)
+  .byte  255,163,255,255,255,150             // jmpq          *-0x69000001(%rbx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  219,255                             // (bad)
+  .byte  221,255                             // (bad)
   .byte  255                                 // (bad)
-  .byte  255,211                             // callq         *%rbx
+  .byte  255,213                             // callq         *%rbp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,203                             // dec           %ebx
+  .byte  255,205                             // dec           %ebp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  190                                 // .byte         0xbe
+  .byte  255,192                             // inc           %eax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -2157,18 +2147,16 @@
 FUNCTION(_sk_lerp_u8_skx)
 _sk_lerp_u8_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,74                              // jne           2291 <_sk_lerp_u8_skx+0x62>
-  .byte  196,2,121,48,4,24                   // vpmovzxbw     (%r8,%r11,1),%xmm8
-  .byte  197,57,219,5,187,146,3,0            // vpand         0x392bb(%rip),%xmm8,%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  117,74                              // jne           223b <_sk_lerp_u8_skx+0x5c>
+  .byte  196,66,121,48,4,16                  // vpmovzxbw     (%r8,%rdx,1),%xmm8
+  .byte  197,57,219,5,81,139,3,0             // vpand         0x38b51(%rip),%xmm8,%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  196,66,125,51,192                   // vpmovzxwd     %xmm8,%ymm8
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  98,113,60,56,89,5,139,137,3,0       // vmulps        0x3898b(%rip){1to8},%ymm8,%ymm8        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  98,113,60,56,89,5,17,130,3,0        // vmulps        0x38211(%rip){1to8},%ymm8,%ymm8        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  197,252,92,196                      // vsubps        %ymm4,%ymm0,%ymm0
   .byte  196,226,61,168,196                  // vfmadd213ps   %ymm4,%ymm8,%ymm0
   .byte  197,244,92,205                      // vsubps        %ymm5,%ymm1,%ymm1
@@ -2179,57 +2167,58 @@
   .byte  196,226,61,168,223                  // vfmadd213ps   %ymm7,%ymm8,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,166                             // ja            224d <_sk_lerp_u8_skx+0x1e>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,138,0,0,0                 // lea           0x8a(%rip),%r10        # 233c <_sk_lerp_u8_skx+0x10d>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,173                             // ja            21f7 <_sk_lerp_u8_skx+0x18>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,140,0,0,0                 // lea           0x8c(%rip),%r9        # 22e0 <_sk_lerp_u8_skx+0x101>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  235,135                             // jmp           224d <_sk_lerp_u8_skx+0x1e>
-  .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
+  .byte  235,143                             // jmp           21f7 <_sk_lerp_u8_skx+0x18>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  197,57,196,192,2                    // vpinsrw       $0x2,%eax,%xmm8,%xmm8
-  .byte  196,2,121,50,12,24                  // vpmovzxbq     (%r8,%r11,1),%xmm9
+  .byte  196,66,121,50,12,16                 // vpmovzxbq     (%r8,%rdx,1),%xmm9
   .byte  196,65,121,112,201,232              // vpshufd       $0xe8,%xmm9,%xmm9
   .byte  196,65,123,112,201,232              // vpshuflw      $0xe8,%xmm9,%xmm9
   .byte  196,67,57,2,193,1                   // vpblendd      $0x1,%xmm9,%xmm8,%xmm8
-  .byte  233,90,255,255,255                  // jmpq          224d <_sk_lerp_u8_skx+0x1e>
-  .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
+  .byte  233,98,255,255,255                  // jmpq          21f7 <_sk_lerp_u8_skx+0x18>
+  .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  197,57,196,192,6                    // vpinsrw       $0x6,%eax,%xmm8,%xmm8
-  .byte  67,15,182,68,24,5                   // movzbl        0x5(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,5                   // movzbl        0x5(%r8,%rdx,1),%eax
   .byte  197,57,196,192,5                    // vpinsrw       $0x5,%eax,%xmm8,%xmm8
-  .byte  67,15,182,68,24,4                   // movzbl        0x4(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,4                   // movzbl        0x4(%r8,%rdx,1),%eax
   .byte  197,57,196,192,4                    // vpinsrw       $0x4,%eax,%xmm8,%xmm8
-  .byte  196,2,121,49,12,24                  // vpmovzxbd     (%r8,%r11,1),%xmm9
+  .byte  196,66,121,49,12,16                 // vpmovzxbd     (%r8,%rdx,1),%xmm9
   .byte  196,65,123,112,201,232              // vpshuflw      $0xe8,%xmm9,%xmm9
   .byte  196,65,122,112,201,232              // vpshufhw      $0xe8,%xmm9,%xmm9
   .byte  196,65,121,112,201,232              // vpshufd       $0xe8,%xmm9,%xmm9
   .byte  196,67,49,2,192,12                  // vpblendd      $0xc,%xmm8,%xmm9,%xmm8
-  .byte  233,17,255,255,255                  // jmpq          224d <_sk_lerp_u8_skx+0x1e>
-  .byte  127,255                             // jg            233d <_sk_lerp_u8_skx+0x10e>
+  .byte  233,25,255,255,255                  // jmpq          21f7 <_sk_lerp_u8_skx+0x18>
+  .byte  102,144                             // xchg          %ax,%ax
+  .byte  125,255                             // jge           22e1 <_sk_lerp_u8_skx+0x102>
   .byte  255                                 // (bad)
-  .byte  255,154,255,255,255,138             // lcall         *-0x75000001(%rdx)
+  .byte  255,152,255,255,255,136             // lcall         *-0x77000001(%rax)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  221,255                             // (bad)
+  .byte  219,255                             // (bad)
   .byte  255                                 // (bad)
-  .byte  255,210                             // callq         *%rdx
+  .byte  255,208                             // callq         *%rax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,199                             // inc           %edi
+  .byte  255,197                             // inc           %ebp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
-  .byte  183,255                             // mov           $0xff,%bh
+  .byte  181,255                             // mov           $0xff,%ch
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
@@ -2238,25 +2227,23 @@
 FUNCTION(_sk_lerp_565_skx)
 _sk_lerp_565_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,165,0,0,0                    // jne           241c <_sk_lerp_565_skx+0xc4>
-  .byte  196,1,122,111,4,88                  // vmovdqu       (%r8,%r11,2),%xmm8
+  .byte  15,133,165,0,0,0                    // jne           23ba <_sk_lerp_565_skx+0xbe>
+  .byte  196,65,122,111,4,80                 // vmovdqu       (%r8,%rdx,2),%xmm8
   .byte  196,66,125,51,192                   // vpmovzxwd     %xmm8,%ymm8
-  .byte  98,113,61,56,219,13,108,136,3,0     // vpandd        0x3886c(%rip){1to8},%ymm8,%ymm9        # 3abf8 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  .byte  98,113,61,56,219,13,254,128,3,0     // vpandd        0x380fe(%rip){1to8},%ymm8,%ymm9        # 3a428 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
   .byte  196,65,124,91,201                   // vcvtdq2ps     %ymm9,%ymm9
-  .byte  98,113,52,56,89,13,97,136,3,0       // vmulps        0x38861(%rip){1to8},%ymm9,%ymm9        # 3abfc <_sk_srcover_bgra_8888_sse2_lowp+0x330>
-  .byte  98,113,61,56,219,21,91,136,3,0      // vpandd        0x3885b(%rip){1to8},%ymm8,%ymm10        # 3ac00 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  .byte  98,113,52,56,89,13,243,128,3,0      // vmulps        0x380f3(%rip){1to8},%ymm9,%ymm9        # 3a42c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  .byte  98,113,61,56,219,21,237,128,3,0     // vpandd        0x380ed(%rip){1to8},%ymm8,%ymm10        # 3a430 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
   .byte  196,65,124,91,210                   // vcvtdq2ps     %ymm10,%ymm10
-  .byte  98,113,44,56,89,21,80,136,3,0       // vmulps        0x38850(%rip){1to8},%ymm10,%ymm10        # 3ac04 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
-  .byte  98,113,61,56,219,5,74,136,3,0       // vpandd        0x3884a(%rip){1to8},%ymm8,%ymm8        # 3ac08 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  .byte  98,113,44,56,89,21,226,128,3,0      // vmulps        0x380e2(%rip){1to8},%ymm10,%ymm10        # 3a434 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  .byte  98,113,61,56,219,5,220,128,3,0      // vpandd        0x380dc(%rip){1to8},%ymm8,%ymm8        # 3a438 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  98,113,60,56,89,5,63,136,3,0        // vmulps        0x3883f(%rip){1to8},%ymm8,%ymm8        # 3ac0c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  .byte  98,113,60,56,89,5,209,128,3,0       // vmulps        0x380d1(%rip){1to8},%ymm8,%ymm8        # 3a43c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
   .byte  98,241,100,40,194,199,1             // vcmpltps      %ymm7,%ymm3,%k0
   .byte  98,114,126,40,56,216                // vpmovm2d      %k0,%ymm11
   .byte  196,65,44,93,224                    // vminps        %ymm8,%ymm10,%ymm12
@@ -2274,54 +2261,53 @@
   .byte  196,226,37,168,223                  // vfmadd213ps   %ymm7,%ymm11,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,71,255,255,255               // ja            237d <_sk_lerp_565_skx+0x25>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,131,0,0,0                 // lea           0x83(%rip),%r10        # 24c4 <_sk_lerp_565_skx+0x16c>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  15,135,78,255,255,255               // ja            231b <_sk_lerp_565_skx+0x1f>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,129,0,0,0                 // lea           0x81(%rip),%r9        # 2458 <_sk_lerp_565_skx+0x15c>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  233,37,255,255,255                  // jmpq          237d <_sk_lerp_565_skx+0x25>
+  .byte  233,45,255,255,255                  // jmpq          231b <_sk_lerp_565_skx+0x1f>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,4,2              // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,2,121,52,12,88                  // vpmovzxwq     (%r8,%r11,2),%xmm9
+  .byte  196,65,57,196,68,80,4,2             // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,66,121,52,12,80                 // vpmovzxwq     (%r8,%rdx,2),%xmm9
   .byte  196,65,121,112,201,232              // vpshufd       $0xe8,%xmm9,%xmm9
   .byte  196,65,123,112,201,232              // vpshuflw      $0xe8,%xmm9,%xmm9
   .byte  196,67,57,2,193,1                   // vpblendd      $0x1,%xmm9,%xmm8,%xmm8
-  .byte  233,251,254,255,255                 // jmpq          237d <_sk_lerp_565_skx+0x25>
+  .byte  233,3,255,255,255                   // jmpq          231b <_sk_lerp_565_skx+0x1f>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,12,6             // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,10,5             // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,8,4              // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,2,121,51,12,88                  // vpmovzxwd     (%r8,%r11,2),%xmm9
+  .byte  196,65,57,196,68,80,12,6            // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,65,57,196,68,80,10,5            // vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,65,57,196,68,80,8,4             // vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,66,121,51,12,80                 // vpmovzxwd     (%r8,%rdx,2),%xmm9
   .byte  196,65,123,112,201,232              // vpshuflw      $0xe8,%xmm9,%xmm9
   .byte  196,65,122,112,201,232              // vpshufhw      $0xe8,%xmm9,%xmm9
   .byte  196,65,121,112,201,132              // vpshufd       $0x84,%xmm9,%xmm9
   .byte  196,65,49,109,192                   // vpunpckhqdq   %xmm8,%xmm9,%xmm8
-  .byte  233,188,254,255,255                 // jmpq          237d <_sk_lerp_565_skx+0x25>
-  .byte  15,31,0                             // nopl          (%rax)
-  .byte  134,255                             // xchg          %bh,%bh
+  .byte  233,196,254,255,255                 // jmpq          231b <_sk_lerp_565_skx+0x1f>
+  .byte  144                                 // nop
+  .byte  136,255                             // mov           %bh,%bh
   .byte  255                                 // (bad)
-  .byte  255,161,255,255,255,148             // jmpq          *-0x6b000001(%rcx)
+  .byte  255,163,255,255,255,150             // jmpq          *-0x69000001(%rbx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  219,255                             // (bad)
+  .byte  221,255                             // (bad)
   .byte  255                                 // (bad)
-  .byte  255,211                             // callq         *%rbx
+  .byte  255,213                             // callq         *%rbp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,203                             // dec           %ebx
+  .byte  255,205                             // dec           %ebp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  190                                 // .byte         0xbe
+  .byte  255,192                             // inc           %eax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -2333,7 +2319,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,124                             // jne           2566 <_sk_load_tables_skx+0x86>
+  .byte  117,124                             // jne           24fa <_sk_load_tables_skx+0x86>
   .byte  196,193,126,111,28,144              // vmovdqu       (%r8,%rdx,4),%ymm3
   .byte  65,184,17,17,17,17                  // mov           $0x11111111,%r8d
   .byte  196,193,123,146,200                 // kmovd         %r8d,%k1
@@ -2356,7 +2342,7 @@
   .byte  196,162,61,146,20,136               // vgatherdps    %ymm8,(%rax,%ymm9,4),%ymm2
   .byte  197,229,114,211,24                  // vpsrld        $0x18,%ymm3,%ymm3
   .byte  197,252,91,219                      // vcvtdq2ps     %ymm3,%ymm3
-  .byte  98,241,100,56,89,29,146,134,3,0     // vmulps        0x38692(%rip){1to8},%ymm3,%ymm3        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  98,241,100,56,89,29,46,127,3,0      // vmulps        0x37f2e(%rip){1to8},%ymm3,%ymm3        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,137,249                          // mov           %edi,%r9d
@@ -2364,14 +2350,14 @@
   .byte  197,229,239,219                     // vpxor         %ymm3,%ymm3,%ymm3
   .byte  65,128,193,255                      // add           $0xff,%r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,113,255,255,255              // ja            24f0 <_sk_load_tables_skx+0x10>
+  .byte  15,135,113,255,255,255              // ja            2484 <_sk_load_tables_skx+0x10>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,142,0,0,0                 // lea           0x8e(%rip),%r10        # 2618 <_sk_load_tables_skx+0x138>
+  .byte  76,141,21,142,0,0,0                 // lea           0x8e(%rip),%r10        # 25ac <_sk_load_tables_skx+0x138>
   .byte  79,99,12,138                        // movslq        (%r10,%r9,4),%r9
   .byte  77,1,209                            // add           %r10,%r9
   .byte  65,255,225                          // jmpq          *%r9
   .byte  196,193,121,110,28,144              // vmovd         (%r8,%rdx,4),%xmm3
-  .byte  233,81,255,255,255                  // jmpq          24f0 <_sk_load_tables_skx+0x10>
+  .byte  233,81,255,255,255                  // jmpq          2484 <_sk_load_tables_skx+0x10>
   .byte  196,193,121,110,68,144,8            // vmovd         0x8(%r8,%rdx,4),%xmm0
   .byte  65,177,4                            // mov           $0x4,%r9b
   .byte  196,193,123,146,201                 // kmovd         %r9d,%k1
@@ -2379,7 +2365,7 @@
   .byte  196,194,121,53,4,144                // vpmovzxdq     (%r8,%rdx,4),%xmm0
   .byte  197,249,112,192,232                 // vpshufd       $0xe8,%xmm0,%xmm0
   .byte  196,227,101,2,216,3                 // vpblendd      $0x3,%ymm0,%ymm3,%ymm3
-  .byte  233,38,255,255,255                  // jmpq          24f0 <_sk_load_tables_skx+0x10>
+  .byte  233,38,255,255,255                  // jmpq          2484 <_sk_load_tables_skx+0x10>
   .byte  196,193,121,110,68,144,24           // vmovd         0x18(%r8,%rdx,4),%xmm0
   .byte  65,177,64                           // mov           $0x40,%r9b
   .byte  196,193,123,146,201                 // kmovd         %r9d,%k1
@@ -2392,8 +2378,8 @@
   .byte  196,227,101,56,216,1                // vinserti128   $0x1,%xmm0,%ymm3,%ymm3
   .byte  196,193,122,111,4,144               // vmovdqu       (%r8,%rdx,4),%xmm0
   .byte  196,227,125,2,219,240               // vpblendd      $0xf0,%ymm3,%ymm0,%ymm3
-  .byte  233,216,254,255,255                 // jmpq          24f0 <_sk_load_tables_skx+0x10>
-  .byte  124,255                             // jl            2619 <_sk_load_tables_skx+0x139>
+  .byte  233,216,254,255,255                 // jmpq          2484 <_sk_load_tables_skx+0x10>
+  .byte  124,255                             // jl            25ad <_sk_load_tables_skx+0x139>
   .byte  255                                 // (bad)
   .byte  255,156,255,255,255,135,255         // lcall         *-0x780001(%rdi,%rdi,8)
   .byte  255                                 // (bad)
@@ -2420,7 +2406,7 @@
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  76,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,210,0,0,0                    // jne           271c <_sk_load_tables_u16_be_skx+0xe8>
+  .byte  15,133,210,0,0,0                    // jne           26b0 <_sk_load_tables_u16_be_skx+0xe8>
   .byte  196,1,121,16,4,72                   // vmovupd       (%r8,%r9,2),%xmm8
   .byte  196,129,121,16,84,72,16             // vmovupd       0x10(%r8,%r9,2),%xmm2
   .byte  196,129,121,16,92,72,32             // vmovupd       0x20(%r8,%r9,2),%xmm3
@@ -2435,7 +2421,7 @@
   .byte  197,113,105,219                     // vpunpckhwd    %xmm3,%xmm1,%xmm11
   .byte  197,185,108,200                     // vpunpcklqdq   %xmm0,%xmm8,%xmm1
   .byte  197,57,109,192                      // vpunpckhqdq   %xmm0,%xmm8,%xmm8
-  .byte  197,121,111,21,121,142,3,0          // vmovdqa       0x38e79(%rip),%xmm10        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  197,121,111,21,37,135,3,0           // vmovdqa       0x38725(%rip),%xmm10        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  196,193,113,219,194                 // vpand         %xmm10,%xmm1,%xmm0
   .byte  196,226,125,51,200                  // vpmovzxwd     %xmm0,%ymm1
   .byte  76,139,64,8                         // mov           0x8(%rax),%r8
@@ -2461,35 +2447,35 @@
   .byte  197,185,235,219                     // vpor          %xmm3,%xmm8,%xmm3
   .byte  196,226,125,51,219                  // vpmovzxwd     %xmm3,%ymm3
   .byte  197,252,91,219                      // vcvtdq2ps     %ymm3,%ymm3
-  .byte  98,241,100,56,89,29,248,132,3,0     // vmulps        0x384f8(%rip){1to8},%ymm3,%ymm3        # 3ac10 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
+  .byte  98,241,100,56,89,29,148,125,3,0     // vmulps        0x37d94(%rip){1to8},%ymm3,%ymm3        # 3a440 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,1,123,16,4,72                   // vmovsd        (%r8,%r9,2),%xmm8
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,85                              // je            2782 <_sk_load_tables_u16_be_skx+0x14e>
+  .byte  116,85                              // je            2716 <_sk_load_tables_u16_be_skx+0x14e>
   .byte  196,1,57,22,68,72,8                 // vmovhpd       0x8(%r8,%r9,2),%xmm8,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,72                              // jb            2782 <_sk_load_tables_u16_be_skx+0x14e>
+  .byte  114,72                              // jb            2716 <_sk_load_tables_u16_be_skx+0x14e>
   .byte  196,129,123,16,84,72,16             // vmovsd        0x10(%r8,%r9,2),%xmm2
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  116,72                              // je            278f <_sk_load_tables_u16_be_skx+0x15b>
+  .byte  116,72                              // je            2723 <_sk_load_tables_u16_be_skx+0x15b>
   .byte  196,129,105,22,84,72,24             // vmovhpd       0x18(%r8,%r9,2),%xmm2,%xmm2
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,59                              // jb            278f <_sk_load_tables_u16_be_skx+0x15b>
+  .byte  114,59                              // jb            2723 <_sk_load_tables_u16_be_skx+0x15b>
   .byte  196,129,123,16,92,72,32             // vmovsd        0x20(%r8,%r9,2),%xmm3
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  15,132,0,255,255,255                // je            2665 <_sk_load_tables_u16_be_skx+0x31>
+  .byte  15,132,0,255,255,255                // je            25f9 <_sk_load_tables_u16_be_skx+0x31>
   .byte  196,129,97,22,92,72,40              // vmovhpd       0x28(%r8,%r9,2),%xmm3,%xmm3
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,130,239,254,255,255              // jb            2665 <_sk_load_tables_u16_be_skx+0x31>
+  .byte  15,130,239,254,255,255              // jb            25f9 <_sk_load_tables_u16_be_skx+0x31>
   .byte  196,1,122,126,76,72,48              // vmovq         0x30(%r8,%r9,2),%xmm9
-  .byte  233,227,254,255,255                 // jmpq          2665 <_sk_load_tables_u16_be_skx+0x31>
+  .byte  233,227,254,255,255                 // jmpq          25f9 <_sk_load_tables_u16_be_skx+0x31>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
   .byte  197,233,87,210                      // vxorpd        %xmm2,%xmm2,%xmm2
-  .byte  233,214,254,255,255                 // jmpq          2665 <_sk_load_tables_u16_be_skx+0x31>
+  .byte  233,214,254,255,255                 // jmpq          25f9 <_sk_load_tables_u16_be_skx+0x31>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
-  .byte  233,205,254,255,255                 // jmpq          2665 <_sk_load_tables_u16_be_skx+0x31>
+  .byte  233,205,254,255,255                 // jmpq          25f9 <_sk_load_tables_u16_be_skx+0x31>
 
 HIDDEN _sk_load_tables_rgb_u16_be_skx
 .globl _sk_load_tables_rgb_u16_be_skx
@@ -2499,7 +2485,7 @@
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  76,141,12,82                        // lea           (%rdx,%rdx,2),%r9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,203,0,0,0                    // jne           2875 <_sk_load_tables_rgb_u16_be_skx+0xdd>
+  .byte  15,133,203,0,0,0                    // jne           2809 <_sk_load_tables_rgb_u16_be_skx+0xdd>
   .byte  196,1,121,16,28,72                  // vmovupd       (%r8,%r9,2),%xmm11
   .byte  196,129,121,16,92,72,12             // vmovupd       0xc(%r8,%r9,2),%xmm3
   .byte  196,129,121,16,84,72,24             // vmovupd       0x18(%r8,%r9,2),%xmm2
@@ -2518,7 +2504,7 @@
   .byte  197,249,105,193                     // vpunpckhwd    %xmm1,%xmm0,%xmm0
   .byte  197,105,108,200                     // vpunpcklqdq   %xmm0,%xmm2,%xmm9
   .byte  197,185,108,195                     // vpunpcklqdq   %xmm3,%xmm8,%xmm0
-  .byte  197,121,111,21,2,141,3,0            // vmovdqa       0x38d02(%rip),%xmm10        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  197,121,111,21,174,133,3,0          // vmovdqa       0x385ae(%rip),%xmm10        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  196,193,121,219,194                 // vpand         %xmm10,%xmm0,%xmm0
   .byte  196,226,125,51,200                  // vpmovzxwd     %xmm0,%ymm1
   .byte  76,139,64,8                         // mov           0x8(%rax),%r8
@@ -2539,69 +2525,69 @@
   .byte  196,226,125,51,219                  // vpmovzxwd     %xmm3,%ymm3
   .byte  196,226,29,146,20,152               // vgatherdps    %ymm12,(%rax,%ymm3,4),%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,9,131,3,0         // vbroadcastss  0x38309(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,165,123,3,0       // vbroadcastss  0x37ba5(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  255,224                             // jmpq          *%rax
   .byte  196,129,121,110,4,72                // vmovd         (%r8,%r9,2),%xmm0
   .byte  196,65,49,87,201                    // vxorpd        %xmm9,%xmm9,%xmm9
   .byte  196,1,121,196,92,72,4,2             // vpinsrw       $0x2,0x4(%r8,%r9,2),%xmm0,%xmm11
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,31                              // jne           28ad <_sk_load_tables_rgb_u16_be_skx+0x115>
+  .byte  117,31                              // jne           2841 <_sk_load_tables_rgb_u16_be_skx+0x115>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
   .byte  197,225,239,219                     // vpxor         %xmm3,%xmm3,%xmm3
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  233,47,255,255,255                  // jmpq          27dc <_sk_load_tables_rgb_u16_be_skx+0x44>
+  .byte  233,47,255,255,255                  // jmpq          2770 <_sk_load_tables_rgb_u16_be_skx+0x44>
   .byte  196,129,121,110,68,72,6             // vmovd         0x6(%r8,%r9,2),%xmm0
   .byte  196,65,49,87,201                    // vxorpd        %xmm9,%xmm9,%xmm9
   .byte  196,1,121,196,68,72,10,2            // vpinsrw       $0x2,0xa(%r8,%r9,2),%xmm0,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,48                              // jb            28f7 <_sk_load_tables_rgb_u16_be_skx+0x15f>
+  .byte  114,48                              // jb            288b <_sk_load_tables_rgb_u16_be_skx+0x15f>
   .byte  196,129,121,110,68,72,12            // vmovd         0xc(%r8,%r9,2),%xmm0
   .byte  196,65,49,87,201                    // vxorpd        %xmm9,%xmm9,%xmm9
   .byte  196,129,121,196,92,72,16,2          // vpinsrw       $0x2,0x10(%r8,%r9,2),%xmm0,%xmm3
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  117,48                              // jne           2911 <_sk_load_tables_rgb_u16_be_skx+0x179>
+  .byte  117,48                              // jne           28a5 <_sk_load_tables_rgb_u16_be_skx+0x179>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
-  .byte  233,229,254,255,255                 // jmpq          27dc <_sk_load_tables_rgb_u16_be_skx+0x44>
+  .byte  233,229,254,255,255                 // jmpq          2770 <_sk_load_tables_rgb_u16_be_skx+0x44>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
   .byte  197,225,239,219                     // vpxor         %xmm3,%xmm3,%xmm3
-  .byte  233,203,254,255,255                 // jmpq          27dc <_sk_load_tables_rgb_u16_be_skx+0x44>
+  .byte  233,203,254,255,255                 // jmpq          2770 <_sk_load_tables_rgb_u16_be_skx+0x44>
   .byte  196,129,121,110,68,72,18            // vmovd         0x12(%r8,%r9,2),%xmm0
   .byte  196,65,49,87,201                    // vxorpd        %xmm9,%xmm9,%xmm9
   .byte  196,1,121,196,84,72,22,2            // vpinsrw       $0x2,0x16(%r8,%r9,2),%xmm0,%xmm10
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,39                              // jb            2952 <_sk_load_tables_rgb_u16_be_skx+0x1ba>
+  .byte  114,39                              // jb            28e6 <_sk_load_tables_rgb_u16_be_skx+0x1ba>
   .byte  196,129,121,110,68,72,24            // vmovd         0x18(%r8,%r9,2),%xmm0
   .byte  196,65,49,87,201                    // vxorpd        %xmm9,%xmm9,%xmm9
   .byte  196,129,121,196,84,72,28,2          // vpinsrw       $0x2,0x1c(%r8,%r9,2),%xmm0,%xmm2
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  117,30                              // jne           2963 <_sk_load_tables_rgb_u16_be_skx+0x1cb>
+  .byte  117,30                              // jne           28f7 <_sk_load_tables_rgb_u16_be_skx+0x1cb>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
-  .byte  233,138,254,255,255                 // jmpq          27dc <_sk_load_tables_rgb_u16_be_skx+0x44>
+  .byte  233,138,254,255,255                 // jmpq          2770 <_sk_load_tables_rgb_u16_be_skx+0x44>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
-  .byte  233,121,254,255,255                 // jmpq          27dc <_sk_load_tables_rgb_u16_be_skx+0x44>
+  .byte  233,121,254,255,255                 // jmpq          2770 <_sk_load_tables_rgb_u16_be_skx+0x44>
   .byte  196,129,121,110,68,72,30            // vmovd         0x1e(%r8,%r9,2),%xmm0
   .byte  196,65,49,87,201                    // vxorpd        %xmm9,%xmm9,%xmm9
   .byte  196,129,121,196,76,72,34,2          // vpinsrw       $0x2,0x22(%r8,%r9,2),%xmm0,%xmm1
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,25                              // jb            2996 <_sk_load_tables_rgb_u16_be_skx+0x1fe>
+  .byte  114,25                              // jb            292a <_sk_load_tables_rgb_u16_be_skx+0x1fe>
   .byte  196,129,121,110,68,72,36            // vmovd         0x24(%r8,%r9,2),%xmm0
   .byte  196,65,49,87,201                    // vxorpd        %xmm9,%xmm9,%xmm9
   .byte  196,129,121,196,68,72,40,2          // vpinsrw       $0x2,0x28(%r8,%r9,2),%xmm0,%xmm0
-  .byte  233,70,254,255,255                  // jmpq          27dc <_sk_load_tables_rgb_u16_be_skx+0x44>
+  .byte  233,70,254,255,255                  // jmpq          2770 <_sk_load_tables_rgb_u16_be_skx+0x44>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  233,61,254,255,255                  // jmpq          27dc <_sk_load_tables_rgb_u16_be_skx+0x44>
+  .byte  233,61,254,255,255                  // jmpq          2770 <_sk_load_tables_rgb_u16_be_skx+0x44>
 
 HIDDEN _sk_byte_tables_skx
 .globl _sk_byte_tables_skx
@@ -2610,9 +2596,9 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,60,95,200                       // vmaxps        %ymm0,%ymm8,%ymm9
-  .byte  196,98,125,24,29,201,129,3,0        // vbroadcastss  0x381c9(%rip),%ymm11        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,29,101,122,3,0        // vbroadcastss  0x37a65(%rip),%ymm11        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,52,93,211                    // vminps        %ymm11,%ymm9,%ymm10
-  .byte  196,98,125,24,13,231,129,3,0        // vbroadcastss  0x381e7(%rip),%ymm9        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,98,125,24,13,131,122,3,0        // vbroadcastss  0x37a83(%rip),%ymm9        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   .byte  196,65,44,89,209                    // vmulps        %ymm9,%ymm10,%ymm10
   .byte  196,65,125,91,210                   // vcvtps2dq     %ymm10,%ymm10
   .byte  196,65,249,126,208                  // vmovq         %xmm10,%r8
@@ -2748,7 +2734,7 @@
   .byte  67,15,182,4,17                      // movzbl        (%r9,%r10,1),%eax
   .byte  196,194,125,49,194                  // vpmovzxbd     %xmm10,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,5,157,127,3,0         // vbroadcastss  0x37f9d(%rip),%ymm8        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,5,57,120,3,0          // vbroadcastss  0x37839(%rip),%ymm8        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
   .byte  196,226,125,49,201                  // vpmovzxbd     %xmm1,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
@@ -2774,7 +2760,7 @@
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
   .byte  197,52,95,208                       // vmaxps        %ymm0,%ymm9,%ymm10
-  .byte  196,98,125,24,29,197,126,3,0        // vbroadcastss  0x37ec5(%rip),%ymm11        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,29,97,119,3,0         // vbroadcastss  0x37761(%rip),%ymm11        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,44,93,211                    // vminps        %ymm11,%ymm10,%ymm10
   .byte  196,65,44,89,208                    // vmulps        %ymm8,%ymm10,%ymm10
   .byte  196,65,125,91,210                   // vcvtps2dq     %ymm10,%ymm10
@@ -2877,7 +2863,7 @@
   .byte  67,15,182,4,17                      // movzbl        (%r9,%r10,1),%eax
   .byte  196,194,125,49,194                  // vpmovzxbd     %xmm10,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,5,73,125,3,0          // vbroadcastss  0x37d49(%rip),%ymm8        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,5,229,117,3,0         // vbroadcastss  0x375e5(%rip),%ymm8        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
   .byte  196,226,125,49,201                  // vpmovzxbd     %xmm1,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
@@ -2901,7 +2887,7 @@
   .byte  196,65,124,91,200                   // vcvtdq2ps     %ymm8,%ymm9
   .byte  196,65,61,239,192                   // vpxor         %ymm8,%ymm8,%ymm8
   .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
-  .byte  98,241,124,56,93,5,125,124,3,0      // vminps        0x37c7d(%rip){1to8},%ymm0,%ymm0        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  98,241,124,56,93,5,25,117,3,0       // vminps        0x37519(%rip){1to8},%ymm0,%ymm0        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,124,89,193                  // vmulps        %ymm9,%ymm0,%ymm0
   .byte  197,253,91,192                      // vcvtps2dq     %ymm0,%ymm0
   .byte  196,65,53,118,201                   // vpcmpeqd      %ymm9,%ymm9,%ymm9
@@ -2922,7 +2908,7 @@
   .byte  196,65,124,91,200                   // vcvtdq2ps     %ymm8,%ymm9
   .byte  196,65,61,239,192                   // vpxor         %ymm8,%ymm8,%ymm8
   .byte  197,188,95,201                      // vmaxps        %ymm1,%ymm8,%ymm1
-  .byte  98,241,116,56,93,13,56,124,3,0      // vminps        0x37c38(%rip){1to8},%ymm1,%ymm1        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  98,241,116,56,93,13,212,116,3,0     // vminps        0x374d4(%rip){1to8},%ymm1,%ymm1        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,116,89,201                  // vmulps        %ymm9,%ymm1,%ymm1
   .byte  197,253,91,201                      // vcvtps2dq     %ymm1,%ymm1
   .byte  196,65,53,118,201                   // vpcmpeqd      %ymm9,%ymm9,%ymm9
@@ -2943,7 +2929,7 @@
   .byte  196,65,124,91,200                   // vcvtdq2ps     %ymm8,%ymm9
   .byte  196,65,61,239,192                   // vpxor         %ymm8,%ymm8,%ymm8
   .byte  197,188,95,210                      // vmaxps        %ymm2,%ymm8,%ymm2
-  .byte  98,241,108,56,93,21,243,123,3,0     // vminps        0x37bf3(%rip){1to8},%ymm2,%ymm2        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  98,241,108,56,93,21,143,116,3,0     // vminps        0x3748f(%rip){1to8},%ymm2,%ymm2        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,108,89,209                  // vmulps        %ymm9,%ymm2,%ymm2
   .byte  197,253,91,210                      // vcvtps2dq     %ymm2,%ymm2
   .byte  196,65,53,118,201                   // vpcmpeqd      %ymm9,%ymm9,%ymm9
@@ -2964,7 +2950,7 @@
   .byte  196,65,124,91,200                   // vcvtdq2ps     %ymm8,%ymm9
   .byte  196,65,61,239,192                   // vpxor         %ymm8,%ymm8,%ymm8
   .byte  197,188,95,219                      // vmaxps        %ymm3,%ymm8,%ymm3
-  .byte  98,241,100,56,93,29,174,123,3,0     // vminps        0x37bae(%rip){1to8},%ymm3,%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  98,241,100,56,93,29,74,116,3,0      // vminps        0x3744a(%rip){1to8},%ymm3,%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,100,89,217                  // vmulps        %ymm9,%ymm3,%ymm3
   .byte  197,253,91,219                      // vcvtps2dq     %ymm3,%ymm3
   .byte  196,65,53,118,201                   // vpcmpeqd      %ymm9,%ymm9,%ymm9
@@ -2989,33 +2975,33 @@
   .byte  98,209,44,40,194,195,0              // vcmpeqps      %ymm11,%ymm10,%k0
   .byte  98,114,126,40,56,224                // vpmovm2d      %k0,%ymm12
   .byte  196,65,124,91,234                   // vcvtdq2ps     %ymm10,%ymm13
-  .byte  196,98,125,24,53,219,123,3,0        // vbroadcastss  0x37bdb(%rip),%ymm14        # 3ac14 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
-  .byte  98,114,21,56,168,53,217,123,3,0     // vfmadd213ps   0x37bd9(%rip){1to8},%ymm13,%ymm14        # 3ac1c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
-  .byte  98,113,44,56,84,21,203,123,3,0      // vandps        0x37bcb(%rip){1to8},%ymm10,%ymm10        # 3ac18 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
-  .byte  98,113,44,56,86,21,33,123,3,0       // vorps         0x37b21(%rip){1to8},%ymm10,%ymm10        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
-  .byte  98,114,45,56,188,53,191,123,3,0     // vfnmadd231ps  0x37bbf(%rip){1to8},%ymm10,%ymm14        # 3ac20 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
-  .byte  98,113,44,56,88,21,185,123,3,0      // vaddps        0x37bb9(%rip){1to8},%ymm10,%ymm10        # 3ac24 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
-  .byte  196,98,125,24,45,180,123,3,0        // vbroadcastss  0x37bb4(%rip),%ymm13        # 3ac28 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  .byte  196,98,125,24,53,119,116,3,0        // vbroadcastss  0x37477(%rip),%ymm14        # 3a444 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  .byte  98,114,21,56,168,53,117,116,3,0     // vfmadd213ps   0x37475(%rip){1to8},%ymm13,%ymm14        # 3a44c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  .byte  98,113,44,56,84,21,103,116,3,0      // vandps        0x37467(%rip){1to8},%ymm10,%ymm10        # 3a448 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  .byte  98,113,44,56,86,21,189,115,3,0      // vorps         0x373bd(%rip){1to8},%ymm10,%ymm10        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  98,114,45,56,188,53,91,116,3,0      // vfnmadd231ps  0x3745b(%rip){1to8},%ymm10,%ymm14        # 3a450 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  .byte  98,113,44,56,88,21,85,116,3,0       // vaddps        0x37455(%rip){1to8},%ymm10,%ymm10        # 3a454 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  .byte  196,98,125,24,45,80,116,3,0         // vbroadcastss  0x37450(%rip),%ymm13        # 3a458 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   .byte  196,65,20,94,210                    // vdivps        %ymm10,%ymm13,%ymm10
   .byte  196,65,12,92,210                    // vsubps        %ymm10,%ymm14,%ymm10
   .byte  196,193,124,89,194                  // vmulps        %ymm10,%ymm0,%ymm0
   .byte  196,99,125,8,208,1                  // vroundps      $0x1,%ymm0,%ymm10
   .byte  196,65,124,92,210                   // vsubps        %ymm10,%ymm0,%ymm10
-  .byte  98,241,124,56,88,5,148,123,3,0      // vaddps        0x37b94(%rip){1to8},%ymm0,%ymm0        # 3ac2c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
-  .byte  98,242,45,56,188,5,142,123,3,0      // vfnmadd231ps  0x37b8e(%rip){1to8},%ymm10,%ymm0        # 3ac30 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
-  .byte  196,98,125,24,45,137,123,3,0        // vbroadcastss  0x37b89(%rip),%ymm13        # 3ac34 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  .byte  98,241,124,56,88,5,48,116,3,0       // vaddps        0x37430(%rip){1to8},%ymm0,%ymm0        # 3a45c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  .byte  98,242,45,56,188,5,42,116,3,0       // vfnmadd231ps  0x3742a(%rip){1to8},%ymm10,%ymm0        # 3a460 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  .byte  196,98,125,24,45,37,116,3,0         // vbroadcastss  0x37425(%rip),%ymm13        # 3a464 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   .byte  196,65,20,92,210                    // vsubps        %ymm10,%ymm13,%ymm10
-  .byte  196,98,125,24,45,127,123,3,0        // vbroadcastss  0x37b7f(%rip),%ymm13        # 3ac38 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  .byte  196,98,125,24,45,27,116,3,0         // vbroadcastss  0x3741b(%rip),%ymm13        # 3a468 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   .byte  196,65,20,94,210                    // vdivps        %ymm10,%ymm13,%ymm10
   .byte  196,193,124,88,194                  // vaddps        %ymm10,%ymm0,%ymm0
-  .byte  98,241,124,56,89,5,111,123,3,0      // vmulps        0x37b6f(%rip){1to8},%ymm0,%ymm0        # 3ac3c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  .byte  98,241,124,56,89,5,11,116,3,0       // vmulps        0x3740b(%rip){1to8},%ymm0,%ymm0        # 3a46c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   .byte  197,253,91,192                      // vcvtps2dq     %ymm0,%ymm0
   .byte  196,195,125,74,195,192              // vblendvps     %ymm12,%ymm11,%ymm0,%ymm0
   .byte  196,98,125,24,80,20                 // vbroadcastss  0x14(%rax),%ymm10
   .byte  196,193,124,88,194                  // vaddps        %ymm10,%ymm0,%ymm0
   .byte  196,195,125,74,193,128              // vblendvps     %ymm8,%ymm9,%ymm0,%ymm0
   .byte  196,193,124,95,195                  // vmaxps        %ymm11,%ymm0,%ymm0
-  .byte  98,241,124,56,93,5,133,122,3,0      // vminps        0x37a85(%rip){1to8},%ymm0,%ymm0        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  98,241,124,56,93,5,33,115,3,0       // vminps        0x37321(%rip){1to8},%ymm0,%ymm0        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -3035,33 +3021,33 @@
   .byte  98,209,44,40,194,195,0              // vcmpeqps      %ymm11,%ymm10,%k0
   .byte  98,114,126,40,56,224                // vpmovm2d      %k0,%ymm12
   .byte  196,65,124,91,234                   // vcvtdq2ps     %ymm10,%ymm13
-  .byte  196,98,125,24,53,202,122,3,0        // vbroadcastss  0x37aca(%rip),%ymm14        # 3ac14 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
-  .byte  98,114,21,56,168,53,200,122,3,0     // vfmadd213ps   0x37ac8(%rip){1to8},%ymm13,%ymm14        # 3ac1c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
-  .byte  98,113,44,56,84,21,186,122,3,0      // vandps        0x37aba(%rip){1to8},%ymm10,%ymm10        # 3ac18 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
-  .byte  98,113,44,56,86,21,16,122,3,0       // vorps         0x37a10(%rip){1to8},%ymm10,%ymm10        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
-  .byte  98,114,45,56,188,53,174,122,3,0     // vfnmadd231ps  0x37aae(%rip){1to8},%ymm10,%ymm14        # 3ac20 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
-  .byte  98,113,44,56,88,21,168,122,3,0      // vaddps        0x37aa8(%rip){1to8},%ymm10,%ymm10        # 3ac24 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
-  .byte  196,98,125,24,45,163,122,3,0        // vbroadcastss  0x37aa3(%rip),%ymm13        # 3ac28 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  .byte  196,98,125,24,53,102,115,3,0        // vbroadcastss  0x37366(%rip),%ymm14        # 3a444 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  .byte  98,114,21,56,168,53,100,115,3,0     // vfmadd213ps   0x37364(%rip){1to8},%ymm13,%ymm14        # 3a44c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  .byte  98,113,44,56,84,21,86,115,3,0       // vandps        0x37356(%rip){1to8},%ymm10,%ymm10        # 3a448 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  .byte  98,113,44,56,86,21,172,114,3,0      // vorps         0x372ac(%rip){1to8},%ymm10,%ymm10        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  98,114,45,56,188,53,74,115,3,0      // vfnmadd231ps  0x3734a(%rip){1to8},%ymm10,%ymm14        # 3a450 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  .byte  98,113,44,56,88,21,68,115,3,0       // vaddps        0x37344(%rip){1to8},%ymm10,%ymm10        # 3a454 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  .byte  196,98,125,24,45,63,115,3,0         // vbroadcastss  0x3733f(%rip),%ymm13        # 3a458 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   .byte  196,65,20,94,210                    // vdivps        %ymm10,%ymm13,%ymm10
   .byte  196,65,12,92,210                    // vsubps        %ymm10,%ymm14,%ymm10
   .byte  196,193,116,89,202                  // vmulps        %ymm10,%ymm1,%ymm1
   .byte  196,99,125,8,209,1                  // vroundps      $0x1,%ymm1,%ymm10
   .byte  196,65,116,92,210                   // vsubps        %ymm10,%ymm1,%ymm10
-  .byte  98,241,116,56,88,13,131,122,3,0     // vaddps        0x37a83(%rip){1to8},%ymm1,%ymm1        # 3ac2c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
-  .byte  98,242,45,56,188,13,125,122,3,0     // vfnmadd231ps  0x37a7d(%rip){1to8},%ymm10,%ymm1        # 3ac30 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
-  .byte  196,98,125,24,45,120,122,3,0        // vbroadcastss  0x37a78(%rip),%ymm13        # 3ac34 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  .byte  98,241,116,56,88,13,31,115,3,0      // vaddps        0x3731f(%rip){1to8},%ymm1,%ymm1        # 3a45c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  .byte  98,242,45,56,188,13,25,115,3,0      // vfnmadd231ps  0x37319(%rip){1to8},%ymm10,%ymm1        # 3a460 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  .byte  196,98,125,24,45,20,115,3,0         // vbroadcastss  0x37314(%rip),%ymm13        # 3a464 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   .byte  196,65,20,92,210                    // vsubps        %ymm10,%ymm13,%ymm10
-  .byte  196,98,125,24,45,110,122,3,0        // vbroadcastss  0x37a6e(%rip),%ymm13        # 3ac38 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  .byte  196,98,125,24,45,10,115,3,0         // vbroadcastss  0x3730a(%rip),%ymm13        # 3a468 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   .byte  196,65,20,94,210                    // vdivps        %ymm10,%ymm13,%ymm10
   .byte  196,193,116,88,202                  // vaddps        %ymm10,%ymm1,%ymm1
-  .byte  98,241,116,56,89,13,94,122,3,0      // vmulps        0x37a5e(%rip){1to8},%ymm1,%ymm1        # 3ac3c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  .byte  98,241,116,56,89,13,250,114,3,0     // vmulps        0x372fa(%rip){1to8},%ymm1,%ymm1        # 3a46c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   .byte  197,253,91,201                      // vcvtps2dq     %ymm1,%ymm1
   .byte  196,195,117,74,203,192              // vblendvps     %ymm12,%ymm11,%ymm1,%ymm1
   .byte  196,98,125,24,80,20                 // vbroadcastss  0x14(%rax),%ymm10
   .byte  196,193,116,88,202                  // vaddps        %ymm10,%ymm1,%ymm1
   .byte  196,195,117,74,201,128              // vblendvps     %ymm8,%ymm9,%ymm1,%ymm1
   .byte  196,193,116,95,203                  // vmaxps        %ymm11,%ymm1,%ymm1
-  .byte  98,241,116,56,93,13,116,121,3,0     // vminps        0x37974(%rip){1to8},%ymm1,%ymm1        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  98,241,116,56,93,13,16,114,3,0      // vminps        0x37210(%rip){1to8},%ymm1,%ymm1        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -3081,33 +3067,33 @@
   .byte  98,209,44,40,194,195,0              // vcmpeqps      %ymm11,%ymm10,%k0
   .byte  98,114,126,40,56,224                // vpmovm2d      %k0,%ymm12
   .byte  196,65,124,91,234                   // vcvtdq2ps     %ymm10,%ymm13
-  .byte  196,98,125,24,53,185,121,3,0        // vbroadcastss  0x379b9(%rip),%ymm14        # 3ac14 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
-  .byte  98,114,21,56,168,53,183,121,3,0     // vfmadd213ps   0x379b7(%rip){1to8},%ymm13,%ymm14        # 3ac1c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
-  .byte  98,113,44,56,84,21,169,121,3,0      // vandps        0x379a9(%rip){1to8},%ymm10,%ymm10        # 3ac18 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
-  .byte  98,113,44,56,86,21,255,120,3,0      // vorps         0x378ff(%rip){1to8},%ymm10,%ymm10        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
-  .byte  98,114,45,56,188,53,157,121,3,0     // vfnmadd231ps  0x3799d(%rip){1to8},%ymm10,%ymm14        # 3ac20 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
-  .byte  98,113,44,56,88,21,151,121,3,0      // vaddps        0x37997(%rip){1to8},%ymm10,%ymm10        # 3ac24 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
-  .byte  196,98,125,24,45,146,121,3,0        // vbroadcastss  0x37992(%rip),%ymm13        # 3ac28 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  .byte  196,98,125,24,53,85,114,3,0         // vbroadcastss  0x37255(%rip),%ymm14        # 3a444 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  .byte  98,114,21,56,168,53,83,114,3,0      // vfmadd213ps   0x37253(%rip){1to8},%ymm13,%ymm14        # 3a44c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  .byte  98,113,44,56,84,21,69,114,3,0       // vandps        0x37245(%rip){1to8},%ymm10,%ymm10        # 3a448 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  .byte  98,113,44,56,86,21,155,113,3,0      // vorps         0x3719b(%rip){1to8},%ymm10,%ymm10        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  98,114,45,56,188,53,57,114,3,0      // vfnmadd231ps  0x37239(%rip){1to8},%ymm10,%ymm14        # 3a450 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  .byte  98,113,44,56,88,21,51,114,3,0       // vaddps        0x37233(%rip){1to8},%ymm10,%ymm10        # 3a454 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  .byte  196,98,125,24,45,46,114,3,0         // vbroadcastss  0x3722e(%rip),%ymm13        # 3a458 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   .byte  196,65,20,94,210                    // vdivps        %ymm10,%ymm13,%ymm10
   .byte  196,65,12,92,210                    // vsubps        %ymm10,%ymm14,%ymm10
   .byte  196,193,108,89,210                  // vmulps        %ymm10,%ymm2,%ymm2
   .byte  196,99,125,8,210,1                  // vroundps      $0x1,%ymm2,%ymm10
   .byte  196,65,108,92,210                   // vsubps        %ymm10,%ymm2,%ymm10
-  .byte  98,241,108,56,88,21,114,121,3,0     // vaddps        0x37972(%rip){1to8},%ymm2,%ymm2        # 3ac2c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
-  .byte  98,242,45,56,188,21,108,121,3,0     // vfnmadd231ps  0x3796c(%rip){1to8},%ymm10,%ymm2        # 3ac30 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
-  .byte  196,98,125,24,45,103,121,3,0        // vbroadcastss  0x37967(%rip),%ymm13        # 3ac34 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  .byte  98,241,108,56,88,21,14,114,3,0      // vaddps        0x3720e(%rip){1to8},%ymm2,%ymm2        # 3a45c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  .byte  98,242,45,56,188,21,8,114,3,0       // vfnmadd231ps  0x37208(%rip){1to8},%ymm10,%ymm2        # 3a460 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  .byte  196,98,125,24,45,3,114,3,0          // vbroadcastss  0x37203(%rip),%ymm13        # 3a464 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   .byte  196,65,20,92,210                    // vsubps        %ymm10,%ymm13,%ymm10
-  .byte  196,98,125,24,45,93,121,3,0         // vbroadcastss  0x3795d(%rip),%ymm13        # 3ac38 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  .byte  196,98,125,24,45,249,113,3,0        // vbroadcastss  0x371f9(%rip),%ymm13        # 3a468 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   .byte  196,65,20,94,210                    // vdivps        %ymm10,%ymm13,%ymm10
   .byte  196,193,108,88,210                  // vaddps        %ymm10,%ymm2,%ymm2
-  .byte  98,241,108,56,89,21,77,121,3,0      // vmulps        0x3794d(%rip){1to8},%ymm2,%ymm2        # 3ac3c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  .byte  98,241,108,56,89,21,233,113,3,0     // vmulps        0x371e9(%rip){1to8},%ymm2,%ymm2        # 3a46c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   .byte  197,253,91,210                      // vcvtps2dq     %ymm2,%ymm2
   .byte  196,195,109,74,211,192              // vblendvps     %ymm12,%ymm11,%ymm2,%ymm2
   .byte  196,98,125,24,80,20                 // vbroadcastss  0x14(%rax),%ymm10
   .byte  196,193,108,88,210                  // vaddps        %ymm10,%ymm2,%ymm2
   .byte  196,195,109,74,209,128              // vblendvps     %ymm8,%ymm9,%ymm2,%ymm2
   .byte  196,193,108,95,211                  // vmaxps        %ymm11,%ymm2,%ymm2
-  .byte  98,241,108,56,93,21,99,120,3,0      // vminps        0x37863(%rip){1to8},%ymm2,%ymm2        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  98,241,108,56,93,21,255,112,3,0     // vminps        0x370ff(%rip){1to8},%ymm2,%ymm2        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -3127,33 +3113,33 @@
   .byte  98,209,44,40,194,195,0              // vcmpeqps      %ymm11,%ymm10,%k0
   .byte  98,114,126,40,56,224                // vpmovm2d      %k0,%ymm12
   .byte  196,65,124,91,234                   // vcvtdq2ps     %ymm10,%ymm13
-  .byte  196,98,125,24,53,168,120,3,0        // vbroadcastss  0x378a8(%rip),%ymm14        # 3ac14 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
-  .byte  98,114,21,56,168,53,166,120,3,0     // vfmadd213ps   0x378a6(%rip){1to8},%ymm13,%ymm14        # 3ac1c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
-  .byte  98,113,44,56,84,21,152,120,3,0      // vandps        0x37898(%rip){1to8},%ymm10,%ymm10        # 3ac18 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
-  .byte  98,113,44,56,86,21,238,119,3,0      // vorps         0x377ee(%rip){1to8},%ymm10,%ymm10        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
-  .byte  98,114,45,56,188,53,140,120,3,0     // vfnmadd231ps  0x3788c(%rip){1to8},%ymm10,%ymm14        # 3ac20 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
-  .byte  98,113,44,56,88,21,134,120,3,0      // vaddps        0x37886(%rip){1to8},%ymm10,%ymm10        # 3ac24 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
-  .byte  196,98,125,24,45,129,120,3,0        // vbroadcastss  0x37881(%rip),%ymm13        # 3ac28 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  .byte  196,98,125,24,53,68,113,3,0         // vbroadcastss  0x37144(%rip),%ymm14        # 3a444 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  .byte  98,114,21,56,168,53,66,113,3,0      // vfmadd213ps   0x37142(%rip){1to8},%ymm13,%ymm14        # 3a44c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  .byte  98,113,44,56,84,21,52,113,3,0       // vandps        0x37134(%rip){1to8},%ymm10,%ymm10        # 3a448 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  .byte  98,113,44,56,86,21,138,112,3,0      // vorps         0x3708a(%rip){1to8},%ymm10,%ymm10        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  98,114,45,56,188,53,40,113,3,0      // vfnmadd231ps  0x37128(%rip){1to8},%ymm10,%ymm14        # 3a450 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  .byte  98,113,44,56,88,21,34,113,3,0       // vaddps        0x37122(%rip){1to8},%ymm10,%ymm10        # 3a454 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  .byte  196,98,125,24,45,29,113,3,0         // vbroadcastss  0x3711d(%rip),%ymm13        # 3a458 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   .byte  196,65,20,94,210                    // vdivps        %ymm10,%ymm13,%ymm10
   .byte  196,65,12,92,210                    // vsubps        %ymm10,%ymm14,%ymm10
   .byte  196,193,100,89,218                  // vmulps        %ymm10,%ymm3,%ymm3
   .byte  196,99,125,8,211,1                  // vroundps      $0x1,%ymm3,%ymm10
   .byte  196,65,100,92,210                   // vsubps        %ymm10,%ymm3,%ymm10
-  .byte  98,241,100,56,88,29,97,120,3,0      // vaddps        0x37861(%rip){1to8},%ymm3,%ymm3        # 3ac2c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
-  .byte  98,242,45,56,188,29,91,120,3,0      // vfnmadd231ps  0x3785b(%rip){1to8},%ymm10,%ymm3        # 3ac30 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
-  .byte  196,98,125,24,45,86,120,3,0         // vbroadcastss  0x37856(%rip),%ymm13        # 3ac34 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  .byte  98,241,100,56,88,29,253,112,3,0     // vaddps        0x370fd(%rip){1to8},%ymm3,%ymm3        # 3a45c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  .byte  98,242,45,56,188,29,247,112,3,0     // vfnmadd231ps  0x370f7(%rip){1to8},%ymm10,%ymm3        # 3a460 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  .byte  196,98,125,24,45,242,112,3,0        // vbroadcastss  0x370f2(%rip),%ymm13        # 3a464 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   .byte  196,65,20,92,210                    // vsubps        %ymm10,%ymm13,%ymm10
-  .byte  196,98,125,24,45,76,120,3,0         // vbroadcastss  0x3784c(%rip),%ymm13        # 3ac38 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  .byte  196,98,125,24,45,232,112,3,0        // vbroadcastss  0x370e8(%rip),%ymm13        # 3a468 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   .byte  196,65,20,94,210                    // vdivps        %ymm10,%ymm13,%ymm10
   .byte  196,193,100,88,218                  // vaddps        %ymm10,%ymm3,%ymm3
-  .byte  98,241,100,56,89,29,60,120,3,0      // vmulps        0x3783c(%rip){1to8},%ymm3,%ymm3        # 3ac3c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  .byte  98,241,100,56,89,29,216,112,3,0     // vmulps        0x370d8(%rip){1to8},%ymm3,%ymm3        # 3a46c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   .byte  197,253,91,219                      // vcvtps2dq     %ymm3,%ymm3
   .byte  196,195,101,74,219,192              // vblendvps     %ymm12,%ymm11,%ymm3,%ymm3
   .byte  196,98,125,24,80,20                 // vbroadcastss  0x14(%rax),%ymm10
   .byte  196,193,100,88,218                  // vaddps        %ymm10,%ymm3,%ymm3
   .byte  196,195,101,74,217,128              // vblendvps     %ymm8,%ymm9,%ymm3,%ymm3
   .byte  196,193,100,95,219                  // vmaxps        %ymm11,%ymm3,%ymm3
-  .byte  98,241,100,56,93,29,82,119,3,0      // vminps        0x37752(%rip){1to8},%ymm3,%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  98,241,100,56,93,29,238,111,3,0     // vminps        0x36fee(%rip){1to8},%ymm3,%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -3167,34 +3153,34 @@
   .byte  197,196,87,255                      // vxorps        %ymm7,%ymm7,%ymm7
   .byte  98,241,124,40,194,199,0             // vcmpeqps      %ymm7,%ymm0,%k0
   .byte  197,124,91,208                      // vcvtdq2ps     %ymm0,%ymm10
-  .byte  196,98,125,24,29,192,119,3,0        // vbroadcastss  0x377c0(%rip),%ymm11        # 3ac14 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
-  .byte  196,98,125,24,37,187,119,3,0        // vbroadcastss  0x377bb(%rip),%ymm12        # 3ac18 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  .byte  196,98,125,24,29,92,112,3,0         // vbroadcastss  0x3705c(%rip),%ymm11        # 3a444 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  .byte  196,98,125,24,37,87,112,3,0         // vbroadcastss  0x37057(%rip),%ymm12        # 3a448 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   .byte  196,193,124,84,196                  // vandps        %ymm12,%ymm0,%ymm0
-  .byte  196,98,125,24,45,13,119,3,0         // vbroadcastss  0x3770d(%rip),%ymm13        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,45,169,111,3,0        // vbroadcastss  0x36fa9(%rip),%ymm13        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,193,124,86,197                  // vorps         %ymm13,%ymm0,%ymm0
-  .byte  196,98,125,24,53,163,119,3,0        // vbroadcastss  0x377a3(%rip),%ymm14        # 3ac1c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  .byte  196,98,125,24,53,63,112,3,0         // vbroadcastss  0x3703f(%rip),%ymm14        # 3a44c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   .byte  196,66,37,168,214                   // vfmadd213ps   %ymm14,%ymm11,%ymm10
-  .byte  196,98,125,24,61,153,119,3,0        // vbroadcastss  0x37799(%rip),%ymm15        # 3ac20 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  .byte  196,98,125,24,61,53,112,3,0         // vbroadcastss  0x37035(%rip),%ymm15        # 3a450 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   .byte  196,66,125,188,215                  // vfnmadd231ps  %ymm15,%ymm0,%ymm10
-  .byte  98,226,125,40,24,5,142,119,3,0      // vbroadcastss  0x3778e(%rip),%ymm16        # 3ac24 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  .byte  98,226,125,40,24,5,42,112,3,0       // vbroadcastss  0x3702a(%rip),%ymm16        # 3a454 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   .byte  98,177,124,40,88,192                // vaddps        %ymm16,%ymm0,%ymm0
-  .byte  98,226,125,40,24,13,130,119,3,0     // vbroadcastss  0x37782(%rip),%ymm17        # 3ac28 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  .byte  98,226,125,40,24,13,30,112,3,0      // vbroadcastss  0x3701e(%rip),%ymm17        # 3a458 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   .byte  98,241,116,32,94,192                // vdivps        %ymm0,%ymm17,%ymm0
   .byte  197,172,92,192                      // vsubps        %ymm0,%ymm10,%ymm0
   .byte  98,177,124,40,89,194                // vmulps        %ymm18,%ymm0,%ymm0
   .byte  196,99,125,8,208,1                  // vroundps      $0x1,%ymm0,%ymm10
   .byte  98,114,126,40,56,200                // vpmovm2d      %k0,%ymm9
   .byte  196,65,124,92,210                   // vsubps        %ymm10,%ymm0,%ymm10
-  .byte  98,226,125,40,24,29,91,119,3,0      // vbroadcastss  0x3775b(%rip),%ymm19        # 3ac2c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  .byte  98,226,125,40,24,29,247,111,3,0     // vbroadcastss  0x36ff7(%rip),%ymm19        # 3a45c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   .byte  98,177,124,40,88,195                // vaddps        %ymm19,%ymm0,%ymm0
-  .byte  98,226,125,40,24,37,79,119,3,0      // vbroadcastss  0x3774f(%rip),%ymm20        # 3ac30 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  .byte  98,226,125,40,24,37,235,111,3,0     // vbroadcastss  0x36feb(%rip),%ymm20        # 3a460 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   .byte  98,178,45,40,188,196                // vfnmadd231ps  %ymm20,%ymm10,%ymm0
-  .byte  98,226,125,40,24,45,67,119,3,0      // vbroadcastss  0x37743(%rip),%ymm21        # 3ac34 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  .byte  98,226,125,40,24,45,223,111,3,0     // vbroadcastss  0x36fdf(%rip),%ymm21        # 3a464 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   .byte  98,81,84,32,92,210                  // vsubps        %ymm10,%ymm21,%ymm10
-  .byte  98,226,125,40,24,53,55,119,3,0      // vbroadcastss  0x37737(%rip),%ymm22        # 3ac38 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  .byte  98,226,125,40,24,53,211,111,3,0     // vbroadcastss  0x36fd3(%rip),%ymm22        # 3a468 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   .byte  98,81,76,32,94,210                  // vdivps        %ymm10,%ymm22,%ymm10
   .byte  196,193,124,88,194                  // vaddps        %ymm10,%ymm0,%ymm0
-  .byte  196,98,125,24,21,39,119,3,0         // vbroadcastss  0x37727(%rip),%ymm10        # 3ac3c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  .byte  196,98,125,24,21,195,111,3,0        // vbroadcastss  0x36fc3(%rip),%ymm10        # 3a46c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   .byte  196,193,124,89,194                  // vmulps        %ymm10,%ymm0,%ymm0
   .byte  197,253,91,192                      // vcvtps2dq     %ymm0,%ymm0
   .byte  196,227,125,74,199,144              // vblendvps     %ymm9,%ymm7,%ymm0,%ymm0
@@ -3254,34 +3240,34 @@
   .byte  197,196,87,255                      // vxorps        %ymm7,%ymm7,%ymm7
   .byte  98,241,92,40,194,199,0              // vcmpeqps      %ymm7,%ymm4,%k0
   .byte  197,124,91,212                      // vcvtdq2ps     %ymm4,%ymm10
-  .byte  196,98,125,24,29,214,117,3,0        // vbroadcastss  0x375d6(%rip),%ymm11        # 3ac14 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
-  .byte  196,98,125,24,37,209,117,3,0        // vbroadcastss  0x375d1(%rip),%ymm12        # 3ac18 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  .byte  196,98,125,24,29,114,110,3,0        // vbroadcastss  0x36e72(%rip),%ymm11        # 3a444 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  .byte  196,98,125,24,37,109,110,3,0        // vbroadcastss  0x36e6d(%rip),%ymm12        # 3a448 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   .byte  196,193,92,84,228                   // vandps        %ymm12,%ymm4,%ymm4
-  .byte  196,98,125,24,45,35,117,3,0         // vbroadcastss  0x37523(%rip),%ymm13        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,45,191,109,3,0        // vbroadcastss  0x36dbf(%rip),%ymm13        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,193,92,86,229                   // vorps         %ymm13,%ymm4,%ymm4
-  .byte  196,98,125,24,53,185,117,3,0        // vbroadcastss  0x375b9(%rip),%ymm14        # 3ac1c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  .byte  196,98,125,24,53,85,110,3,0         // vbroadcastss  0x36e55(%rip),%ymm14        # 3a44c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   .byte  196,66,37,168,214                   // vfmadd213ps   %ymm14,%ymm11,%ymm10
-  .byte  196,98,125,24,61,175,117,3,0        // vbroadcastss  0x375af(%rip),%ymm15        # 3ac20 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  .byte  196,98,125,24,61,75,110,3,0         // vbroadcastss  0x36e4b(%rip),%ymm15        # 3a450 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   .byte  196,66,93,188,215                   // vfnmadd231ps  %ymm15,%ymm4,%ymm10
-  .byte  98,226,125,40,24,5,164,117,3,0      // vbroadcastss  0x375a4(%rip),%ymm16        # 3ac24 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  .byte  98,226,125,40,24,5,64,110,3,0       // vbroadcastss  0x36e40(%rip),%ymm16        # 3a454 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   .byte  98,177,92,40,88,224                 // vaddps        %ymm16,%ymm4,%ymm4
-  .byte  98,226,125,40,24,13,152,117,3,0     // vbroadcastss  0x37598(%rip),%ymm17        # 3ac28 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  .byte  98,226,125,40,24,13,52,110,3,0      // vbroadcastss  0x36e34(%rip),%ymm17        # 3a458 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   .byte  98,241,116,32,94,228                // vdivps        %ymm4,%ymm17,%ymm4
   .byte  197,172,92,228                      // vsubps        %ymm4,%ymm10,%ymm4
   .byte  98,177,92,40,89,226                 // vmulps        %ymm18,%ymm4,%ymm4
   .byte  196,99,125,8,212,1                  // vroundps      $0x1,%ymm4,%ymm10
   .byte  98,114,126,40,56,200                // vpmovm2d      %k0,%ymm9
   .byte  196,65,92,92,210                    // vsubps        %ymm10,%ymm4,%ymm10
-  .byte  98,226,125,40,24,29,113,117,3,0     // vbroadcastss  0x37571(%rip),%ymm19        # 3ac2c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  .byte  98,226,125,40,24,29,13,110,3,0      // vbroadcastss  0x36e0d(%rip),%ymm19        # 3a45c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   .byte  98,177,92,40,88,227                 // vaddps        %ymm19,%ymm4,%ymm4
-  .byte  98,226,125,40,24,37,101,117,3,0     // vbroadcastss  0x37565(%rip),%ymm20        # 3ac30 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  .byte  98,226,125,40,24,37,1,110,3,0       // vbroadcastss  0x36e01(%rip),%ymm20        # 3a460 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   .byte  98,178,45,40,188,228                // vfnmadd231ps  %ymm20,%ymm10,%ymm4
-  .byte  98,226,125,40,24,45,89,117,3,0      // vbroadcastss  0x37559(%rip),%ymm21        # 3ac34 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  .byte  98,226,125,40,24,45,245,109,3,0     // vbroadcastss  0x36df5(%rip),%ymm21        # 3a464 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   .byte  98,81,84,32,92,210                  // vsubps        %ymm10,%ymm21,%ymm10
-  .byte  98,226,125,40,24,53,77,117,3,0      // vbroadcastss  0x3754d(%rip),%ymm22        # 3ac38 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  .byte  98,226,125,40,24,53,233,109,3,0     // vbroadcastss  0x36de9(%rip),%ymm22        # 3a468 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   .byte  98,81,76,32,94,210                  // vdivps        %ymm10,%ymm22,%ymm10
   .byte  196,193,92,88,226                   // vaddps        %ymm10,%ymm4,%ymm4
-  .byte  196,98,125,24,21,61,117,3,0         // vbroadcastss  0x3753d(%rip),%ymm10        # 3ac3c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  .byte  196,98,125,24,21,217,109,3,0        // vbroadcastss  0x36dd9(%rip),%ymm10        # 3a46c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   .byte  196,193,92,89,226                   // vmulps        %ymm10,%ymm4,%ymm4
   .byte  197,253,91,228                      // vcvtps2dq     %ymm4,%ymm4
   .byte  196,227,93,74,231,144               // vblendvps     %ymm9,%ymm7,%ymm4,%ymm4
@@ -3335,23 +3321,23 @@
 .globl _sk_lab_to_xyz_skx
 FUNCTION(_sk_lab_to_xyz_skx)
 _sk_lab_to_xyz_skx:
-  .byte  196,98,125,24,5,53,116,3,0          // vbroadcastss  0x37435(%rip),%ymm8        # 3ac40 <_sk_srcover_bgra_8888_sse2_lowp+0x374>
-  .byte  196,98,125,24,13,148,115,3,0        // vbroadcastss  0x37394(%rip),%ymm9        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
-  .byte  196,98,125,24,21,39,116,3,0         // vbroadcastss  0x37427(%rip),%ymm10        # 3ac44 <_sk_srcover_bgra_8888_sse2_lowp+0x378>
+  .byte  196,98,125,24,5,209,108,3,0         // vbroadcastss  0x36cd1(%rip),%ymm8        # 3a470 <_sk_srcover_bgra_8888_sse2_lowp+0x374>
+  .byte  196,98,125,24,13,48,108,3,0         // vbroadcastss  0x36c30(%rip),%ymm9        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,98,125,24,21,195,108,3,0        // vbroadcastss  0x36cc3(%rip),%ymm10        # 3a474 <_sk_srcover_bgra_8888_sse2_lowp+0x378>
   .byte  196,194,53,168,202                  // vfmadd213ps   %ymm10,%ymm9,%ymm1
   .byte  196,194,53,168,210                  // vfmadd213ps   %ymm10,%ymm9,%ymm2
-  .byte  98,114,125,56,168,5,23,116,3,0      // vfmadd213ps   0x37417(%rip){1to8},%ymm0,%ymm8        # 3ac48 <_sk_srcover_bgra_8888_sse2_lowp+0x37c>
-  .byte  98,241,60,56,89,5,17,116,3,0        // vmulps        0x37411(%rip){1to8},%ymm8,%ymm0        # 3ac4c <_sk_srcover_bgra_8888_sse2_lowp+0x380>
-  .byte  98,242,125,56,152,13,11,116,3,0     // vfmadd132ps   0x3740b(%rip){1to8},%ymm0,%ymm1        # 3ac50 <_sk_srcover_bgra_8888_sse2_lowp+0x384>
-  .byte  98,242,125,56,156,21,5,116,3,0      // vfnmadd132ps  0x37405(%rip){1to8},%ymm0,%ymm2        # 3ac54 <_sk_srcover_bgra_8888_sse2_lowp+0x388>
+  .byte  98,114,125,56,168,5,179,108,3,0     // vfmadd213ps   0x36cb3(%rip){1to8},%ymm0,%ymm8        # 3a478 <_sk_srcover_bgra_8888_sse2_lowp+0x37c>
+  .byte  98,241,60,56,89,5,173,108,3,0       // vmulps        0x36cad(%rip){1to8},%ymm8,%ymm0        # 3a47c <_sk_srcover_bgra_8888_sse2_lowp+0x380>
+  .byte  98,242,125,56,152,13,167,108,3,0    // vfmadd132ps   0x36ca7(%rip){1to8},%ymm0,%ymm1        # 3a480 <_sk_srcover_bgra_8888_sse2_lowp+0x384>
+  .byte  98,242,125,56,156,21,161,108,3,0    // vfnmadd132ps  0x36ca1(%rip){1to8},%ymm0,%ymm2        # 3a484 <_sk_srcover_bgra_8888_sse2_lowp+0x388>
   .byte  197,116,89,193                      // vmulps        %ymm1,%ymm1,%ymm8
   .byte  196,65,116,89,192                   // vmulps        %ymm8,%ymm1,%ymm8
-  .byte  196,98,125,24,13,247,115,3,0        // vbroadcastss  0x373f7(%rip),%ymm9        # 3ac58 <_sk_srcover_bgra_8888_sse2_lowp+0x38c>
+  .byte  196,98,125,24,13,147,108,3,0        // vbroadcastss  0x36c93(%rip),%ymm9        # 3a488 <_sk_srcover_bgra_8888_sse2_lowp+0x38c>
   .byte  98,209,52,40,194,192,1              // vcmpltps      %ymm8,%ymm9,%k0
   .byte  98,114,126,40,56,208                // vpmovm2d      %k0,%ymm10
-  .byte  196,98,125,24,29,229,115,3,0        // vbroadcastss  0x373e5(%rip),%ymm11        # 3ac5c <_sk_srcover_bgra_8888_sse2_lowp+0x390>
+  .byte  196,98,125,24,29,129,108,3,0        // vbroadcastss  0x36c81(%rip),%ymm11        # 3a48c <_sk_srcover_bgra_8888_sse2_lowp+0x390>
   .byte  196,193,116,88,203                  // vaddps        %ymm11,%ymm1,%ymm1
-  .byte  196,98,125,24,37,219,115,3,0        // vbroadcastss  0x373db(%rip),%ymm12        # 3ac60 <_sk_srcover_bgra_8888_sse2_lowp+0x394>
+  .byte  196,98,125,24,37,119,108,3,0        // vbroadcastss  0x36c77(%rip),%ymm12        # 3a490 <_sk_srcover_bgra_8888_sse2_lowp+0x394>
   .byte  196,193,116,89,204                  // vmulps        %ymm12,%ymm1,%ymm1
   .byte  196,67,117,74,192,160               // vblendvps     %ymm10,%ymm8,%ymm1,%ymm8
   .byte  197,252,89,200                      // vmulps        %ymm0,%ymm0,%ymm1
@@ -3368,8 +3354,8 @@
   .byte  196,193,108,88,211                  // vaddps        %ymm11,%ymm2,%ymm2
   .byte  196,193,108,89,212                  // vmulps        %ymm12,%ymm2,%ymm2
   .byte  196,227,109,74,208,144              // vblendvps     %ymm9,%ymm0,%ymm2,%ymm2
-  .byte  98,241,60,56,89,5,128,115,3,0       // vmulps        0x37380(%rip){1to8},%ymm8,%ymm0        # 3ac64 <_sk_srcover_bgra_8888_sse2_lowp+0x398>
-  .byte  98,241,108,56,89,21,122,115,3,0     // vmulps        0x3737a(%rip){1to8},%ymm2,%ymm2        # 3ac68 <_sk_srcover_bgra_8888_sse2_lowp+0x39c>
+  .byte  98,241,60,56,89,5,28,108,3,0        // vmulps        0x36c1c(%rip){1to8},%ymm8,%ymm0        # 3a494 <_sk_srcover_bgra_8888_sse2_lowp+0x398>
+  .byte  98,241,108,56,89,21,22,108,3,0      // vmulps        0x36c16(%rip){1to8},%ymm2,%ymm2        # 3a498 <_sk_srcover_bgra_8888_sse2_lowp+0x39c>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -3378,75 +3364,73 @@
 FUNCTION(_sk_load_a8_skx)
 _sk_load_a8_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,49                              // jne           393b <_sk_load_a8_skx+0x49>
-  .byte  196,130,121,48,4,24                 // vpmovzxbw     (%r8,%r11,1),%xmm0
-  .byte  197,249,219,5,248,123,3,0           // vpand         0x37bf8(%rip),%xmm0,%xmm0        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  117,49                              // jne           38c9 <_sk_load_a8_skx+0x43>
+  .byte  196,194,121,48,4,16                 // vpmovzxbw     (%r8,%rdx,1),%xmm0
+  .byte  197,249,219,5,170,116,3,0           // vpand         0x374aa(%rip),%xmm0,%xmm0        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  196,226,125,51,192                  // vpmovzxwd     %xmm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  98,241,124,56,89,29,201,114,3,0     // vmulps        0x372c9(%rip){1to8},%ymm0,%ymm3        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  98,241,124,56,89,29,107,107,3,0     // vmulps        0x36b6b(%rip){1to8},%ymm0,%ymm3        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
   .byte  197,236,87,210                      // vxorps        %ymm2,%ymm2,%ymm2
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,192                             // ja            3910 <_sk_load_a8_skx+0x1e>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,133,0,0,0                 // lea           0x85(%rip),%r10        # 39e0 <_sk_load_a8_skx+0xee>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,199                             // ja            389e <_sk_load_a8_skx+0x18>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,131,0,0,0                 // lea           0x83(%rip),%r9        # 3964 <_sk_load_a8_skx+0xde>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  235,161                             // jmp           3910 <_sk_load_a8_skx+0x1e>
-  .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
+  .byte  235,169                             // jmp           389e <_sk_load_a8_skx+0x18>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,249,196,192,2                   // vpinsrw       $0x2,%eax,%xmm0,%xmm0
-  .byte  196,130,121,50,12,24                // vpmovzxbq     (%r8,%r11,1),%xmm1
+  .byte  196,194,121,50,12,16                // vpmovzxbq     (%r8,%rdx,1),%xmm1
   .byte  197,249,112,201,232                 // vpshufd       $0xe8,%xmm1,%xmm1
   .byte  197,251,112,201,232                 // vpshuflw      $0xe8,%xmm1,%xmm1
   .byte  196,227,121,2,193,1                 // vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  .byte  233,119,255,255,255                 // jmpq          3910 <_sk_load_a8_skx+0x1e>
-  .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
+  .byte  235,130                             // jmp           389e <_sk_load_a8_skx+0x18>
+  .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,249,196,192,6                   // vpinsrw       $0x6,%eax,%xmm0,%xmm0
-  .byte  67,15,182,68,24,5                   // movzbl        0x5(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,5                   // movzbl        0x5(%r8,%rdx,1),%eax
   .byte  197,249,196,192,5                   // vpinsrw       $0x5,%eax,%xmm0,%xmm0
-  .byte  67,15,182,68,24,4                   // movzbl        0x4(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,4                   // movzbl        0x4(%r8,%rdx,1),%eax
   .byte  197,249,196,192,4                   // vpinsrw       $0x4,%eax,%xmm0,%xmm0
-  .byte  196,130,121,49,12,24                // vpmovzxbd     (%r8,%r11,1),%xmm1
+  .byte  196,194,121,49,12,16                // vpmovzxbd     (%r8,%rdx,1),%xmm1
   .byte  197,251,112,201,232                 // vpshuflw      $0xe8,%xmm1,%xmm1
   .byte  197,250,112,201,232                 // vpshufhw      $0xe8,%xmm1,%xmm1
   .byte  197,249,112,201,232                 // vpshufd       $0xe8,%xmm1,%xmm1
   .byte  196,227,113,2,192,12                // vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  .byte  233,50,255,255,255                  // jmpq          3910 <_sk_load_a8_skx+0x1e>
-  .byte  102,144                             // xchg          %ax,%ax
-  .byte  132,255                             // test          %bh,%bh
+  .byte  233,61,255,255,255                  // jmpq          389e <_sk_load_a8_skx+0x18>
+  .byte  15,31,0                             // nopl          (%rax)
+  .byte  134,255                             // xchg          %bh,%bh
   .byte  255                                 // (bad)
-  .byte  255,158,255,255,255,143             // lcall         *-0x70000001(%rsi)
+  .byte  255,160,255,255,255,145             // jmpq          *-0x6e000001(%rax)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  222,255                             // fdivrp        %st,%st(7)
+  .byte  221,255                             // (bad)
   .byte  255                                 // (bad)
-  .byte  255,211                             // callq         *%rbx
+  .byte  255,210                             // callq         *%rdx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,200                             // dec           %eax
+  .byte  255,199                             // inc           %edi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  185                                 // .byte         0xb9
+  .byte  184                                 // .byte         0xb8
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -3456,74 +3440,73 @@
 FUNCTION(_sk_load_a8_dst_skx)
 _sk_load_a8_dst_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,49                              // jne           3a45 <_sk_load_a8_dst_skx+0x49>
-  .byte  196,130,121,48,36,24                // vpmovzxbw     (%r8,%r11,1),%xmm4
-  .byte  197,217,219,37,238,122,3,0          // vpand         0x37aee(%rip),%xmm4,%xmm4        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  117,49                              // jne           39c3 <_sk_load_a8_dst_skx+0x43>
+  .byte  196,194,121,48,36,16                // vpmovzxbw     (%r8,%rdx,1),%xmm4
+  .byte  197,217,219,37,176,115,3,0          // vpand         0x373b0(%rip),%xmm4,%xmm4        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  196,226,125,51,228                  // vpmovzxwd     %xmm4,%ymm4
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  98,241,92,56,89,61,191,113,3,0      // vmulps        0x371bf(%rip){1to8},%ymm4,%ymm7        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  98,241,92,56,89,61,113,106,3,0      // vmulps        0x36a71(%rip){1to8},%ymm4,%ymm7        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,220,87,228                      // vxorps        %ymm4,%ymm4,%ymm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
   .byte  197,204,87,246                      // vxorps        %ymm6,%ymm6,%ymm6
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,192                             // ja            3a1a <_sk_load_a8_dst_skx+0x1e>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,131,0,0,0                 // lea           0x83(%rip),%r10        # 3ae8 <_sk_load_a8_dst_skx+0xec>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,199                             // ja            3998 <_sk_load_a8_dst_skx+0x18>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,129,0,0,0                 // lea           0x81(%rip),%r9        # 3a5c <_sk_load_a8_dst_skx+0xdc>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  235,161                             // jmp           3a1a <_sk_load_a8_dst_skx+0x1e>
-  .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
+  .byte  235,169                             // jmp           3998 <_sk_load_a8_dst_skx+0x18>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  197,217,196,224,2                   // vpinsrw       $0x2,%eax,%xmm4,%xmm4
-  .byte  196,130,121,50,44,24                // vpmovzxbq     (%r8,%r11,1),%xmm5
+  .byte  196,194,121,50,44,16                // vpmovzxbq     (%r8,%rdx,1),%xmm5
   .byte  197,249,112,237,232                 // vpshufd       $0xe8,%xmm5,%xmm5
   .byte  197,251,112,237,232                 // vpshuflw      $0xe8,%xmm5,%xmm5
   .byte  196,227,89,2,229,1                  // vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  .byte  233,119,255,255,255                 // jmpq          3a1a <_sk_load_a8_dst_skx+0x1e>
-  .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
+  .byte  235,130                             // jmp           3998 <_sk_load_a8_dst_skx+0x18>
+  .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  197,217,196,224,6                   // vpinsrw       $0x6,%eax,%xmm4,%xmm4
-  .byte  67,15,182,68,24,5                   // movzbl        0x5(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,5                   // movzbl        0x5(%r8,%rdx,1),%eax
   .byte  197,217,196,224,5                   // vpinsrw       $0x5,%eax,%xmm4,%xmm4
-  .byte  67,15,182,68,24,4                   // movzbl        0x4(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,4                   // movzbl        0x4(%r8,%rdx,1),%eax
   .byte  197,217,196,224,4                   // vpinsrw       $0x4,%eax,%xmm4,%xmm4
-  .byte  196,130,121,49,44,24                // vpmovzxbd     (%r8,%r11,1),%xmm5
+  .byte  196,194,121,49,44,16                // vpmovzxbd     (%r8,%rdx,1),%xmm5
   .byte  197,251,112,237,232                 // vpshuflw      $0xe8,%xmm5,%xmm5
   .byte  197,250,112,237,232                 // vpshufhw      $0xe8,%xmm5,%xmm5
   .byte  197,249,112,237,232                 // vpshufd       $0xe8,%xmm5,%xmm5
   .byte  196,227,81,2,228,12                 // vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  .byte  233,50,255,255,255                  // jmpq          3a1a <_sk_load_a8_dst_skx+0x1e>
-  .byte  134,255                             // xchg          %bh,%bh
+  .byte  233,61,255,255,255                  // jmpq          3998 <_sk_load_a8_dst_skx+0x18>
+  .byte  144                                 // nop
+  .byte  136,255                             // mov           %bh,%bh
   .byte  255                                 // (bad)
-  .byte  255,160,255,255,255,145             // jmpq          *-0x6e000001(%rax)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,224                             // jmpq          *%rax
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,213                             // callq         *%rbp
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,202                             // dec           %edx
+  .byte  255,162,255,255,255,147             // jmpq          *-0x6c000001(%rdx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  187                                 // .byte         0xbb
+  .byte  223,255                             // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,212                             // callq         *%rsp
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,201                             // dec           %ecx
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  186                                 // .byte         0xba
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -3583,7 +3566,7 @@
   .byte  196,227,121,32,192,7                // vpinsrb       $0x7,%eax,%xmm0,%xmm0
   .byte  196,226,125,49,192                  // vpmovzxbd     %xmm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  98,241,124,56,89,29,2,112,3,0       // vmulps        0x37002(%rip){1to8},%ymm0,%ymm3        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  98,241,124,56,89,29,190,104,3,0     // vmulps        0x368be(%rip){1to8},%ymm0,%ymm3        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
@@ -3599,63 +3582,64 @@
 FUNCTION(_sk_store_a8_skx)
 _sk_store_a8_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,60,95,195                       // vmaxps        %ymm3,%ymm8,%ymm8
-  .byte  98,113,60,56,93,5,77,111,3,0        // vminps        0x36f4d(%rip){1to8},%ymm8,%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
-  .byte  98,113,60,56,89,5,111,111,3,0       // vmulps        0x36f6f(%rip){1to8},%ymm8,%ymm8        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  98,113,60,56,93,5,15,104,3,0        // vminps        0x3680f(%rip){1to8},%ymm8,%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  98,113,60,56,89,5,49,104,3,0        // vmulps        0x36831(%rip){1to8},%ymm8,%ymm8        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   .byte  196,65,125,91,192                   // vcvtps2dq     %ymm8,%ymm8
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,66,57,43,193                    // vpackusdw     %xmm9,%xmm8,%xmm8
   .byte  197,57,103,192                      // vpackuswb     %xmm0,%xmm8,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           3c5c <_sk_store_a8_skx+0x53>
-  .byte  196,1,121,214,4,24                  // vmovq         %xmm8,(%r8,%r11,1)
+  .byte  117,10                              // jne           3bca <_sk_store_a8_skx+0x4d>
+  .byte  196,65,121,214,4,16                 // vmovq         %xmm8,(%r8,%rdx,1)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,235                             // ja            3c58 <_sk_store_a8_skx+0x4f>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,242                             // ja            3bc6 <_sk_store_a8_skx+0x49>
   .byte  196,66,121,48,192                   // vpmovzxbw     %xmm8,%xmm8
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,79,0,0,0                  // lea           0x4f(%rip),%r10        # 3ccc <_sk_store_a8_skx+0xc3>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,81,0,0,0                  // lea           0x51(%rip),%r9        # 3c34 <_sk_store_a8_skx+0xb7>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,3,121,20,4,24,0                 // vpextrb       $0x0,%xmm8,(%r8,%r11,1)
-  .byte  235,201                             // jmp           3c58 <_sk_store_a8_skx+0x4f>
-  .byte  196,3,121,20,68,24,2,4              // vpextrb       $0x4,%xmm8,0x2(%r8,%r11,1)
+  .byte  196,67,121,20,4,16,0                // vpextrb       $0x0,%xmm8,(%r8,%rdx,1)
+  .byte  235,209                             // jmp           3bc6 <_sk_store_a8_skx+0x49>
+  .byte  196,67,121,20,68,16,2,4             // vpextrb       $0x4,%xmm8,0x2(%r8,%rdx,1)
   .byte  196,66,121,49,192                   // vpmovzxbd     %xmm8,%xmm8
-  .byte  98,18,126,8,50,4,24                 // vpmovqb       %xmm8,(%r8,%r11,1)
-  .byte  235,179                             // jmp           3c58 <_sk_store_a8_skx+0x4f>
-  .byte  196,3,121,20,68,24,6,12             // vpextrb       $0xc,%xmm8,0x6(%r8,%r11,1)
-  .byte  196,3,121,20,68,24,5,10             // vpextrb       $0xa,%xmm8,0x5(%r8,%r11,1)
-  .byte  196,3,121,20,68,24,4,8              // vpextrb       $0x8,%xmm8,0x4(%r8,%r11,1)
+  .byte  98,82,126,8,50,4,16                 // vpmovqb       %xmm8,(%r8,%rdx,1)
+  .byte  235,187                             // jmp           3bc6 <_sk_store_a8_skx+0x49>
+  .byte  196,67,121,20,68,16,6,12            // vpextrb       $0xc,%xmm8,0x6(%r8,%rdx,1)
+  .byte  196,67,121,20,68,16,5,10            // vpextrb       $0xa,%xmm8,0x5(%r8,%rdx,1)
+  .byte  196,67,121,20,68,16,4,8             // vpextrb       $0x8,%xmm8,0x4(%r8,%rdx,1)
   .byte  196,66,121,48,192                   // vpmovzxbw     %xmm8,%xmm8
-  .byte  98,18,126,8,49,4,24                 // vpmovdb       %xmm8,(%r8,%r11,1)
-  .byte  235,141                             // jmp           3c58 <_sk_store_a8_skx+0x4f>
-  .byte  144                                 // nop
-  .byte  186,255,255,255,203                 // mov           $0xcbffffff,%edx
+  .byte  98,82,126,8,49,4,16                 // vpmovdb       %xmm8,(%r8,%rdx,1)
+  .byte  235,149                             // jmp           3bc6 <_sk_store_a8_skx+0x49>
+  .byte  15,31,0                             // nopl          (%rax)
+  .byte  184,255,255,255,201                 // mov           $0xc9ffffff,%eax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,195                             // inc           %ebx
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,241                             // push          %rcx
+  .byte  255,193                             // inc           %ecx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  233,255,255,255,225                 // jmpq          ffffffffe2003ce0 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffe1fc9414>
+  .byte  239                                 // out           %eax,(%dx)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,231                             // jmpq          *%rdi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  217,255                             // fcos
+  .byte  223,255                             // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,215                             // callq         *%rdi
+  .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
@@ -3664,74 +3648,73 @@
 FUNCTION(_sk_load_g8_skx)
 _sk_load_g8_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,54                              // jne           3d36 <_sk_load_g8_skx+0x4e>
-  .byte  196,130,121,48,4,24                 // vpmovzxbw     (%r8,%r11,1),%xmm0
-  .byte  197,249,219,5,2,120,3,0             // vpand         0x37802(%rip),%xmm0,%xmm0        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  117,54                              // jne           3c98 <_sk_load_g8_skx+0x48>
+  .byte  196,194,121,48,4,16                 // vpmovzxbw     (%r8,%rdx,1),%xmm0
+  .byte  197,249,219,5,224,112,3,0           // vpand         0x370e0(%rip),%xmm0,%xmm0        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  196,226,125,51,192                  // vpmovzxwd     %xmm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  98,241,124,56,89,5,211,110,3,0      // vmulps        0x36ed3(%rip){1to8},%ymm0,%ymm0        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  98,241,124,56,89,5,161,103,3,0      // vmulps        0x367a1(%rip){1to8},%ymm0,%ymm0        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,80,110,3,0        // vbroadcastss  0x36e50(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,30,103,3,0        // vbroadcastss  0x3671e(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,252,40,200                      // vmovaps       %ymm0,%ymm1
   .byte  197,252,40,208                      // vmovaps       %ymm0,%ymm2
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,187                             // ja            3d06 <_sk_load_g8_skx+0x1e>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,134,0,0,0                 // lea           0x86(%rip),%r10        # 3ddc <_sk_load_g8_skx+0xf4>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,194                             // ja            3c68 <_sk_load_g8_skx+0x18>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,132,0,0,0                 // lea           0x84(%rip),%r9        # 3d34 <_sk_load_g8_skx+0xe4>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  235,156                             // jmp           3d06 <_sk_load_g8_skx+0x1e>
-  .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
+  .byte  235,164                             // jmp           3c68 <_sk_load_g8_skx+0x18>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,249,196,192,2                   // vpinsrw       $0x2,%eax,%xmm0,%xmm0
-  .byte  196,130,121,50,12,24                // vpmovzxbq     (%r8,%r11,1),%xmm1
+  .byte  196,194,121,50,12,16                // vpmovzxbq     (%r8,%rdx,1),%xmm1
   .byte  197,249,112,201,232                 // vpshufd       $0xe8,%xmm1,%xmm1
   .byte  197,251,112,201,232                 // vpshuflw      $0xe8,%xmm1,%xmm1
   .byte  196,227,121,2,193,1                 // vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  .byte  233,114,255,255,255                 // jmpq          3d06 <_sk_load_g8_skx+0x1e>
-  .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
+  .byte  233,122,255,255,255                 // jmpq          3c68 <_sk_load_g8_skx+0x18>
+  .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,249,196,192,6                   // vpinsrw       $0x6,%eax,%xmm0,%xmm0
-  .byte  67,15,182,68,24,5                   // movzbl        0x5(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,5                   // movzbl        0x5(%r8,%rdx,1),%eax
   .byte  197,249,196,192,5                   // vpinsrw       $0x5,%eax,%xmm0,%xmm0
-  .byte  67,15,182,68,24,4                   // movzbl        0x4(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,4                   // movzbl        0x4(%r8,%rdx,1),%eax
   .byte  197,249,196,192,4                   // vpinsrw       $0x4,%eax,%xmm0,%xmm0
-  .byte  196,130,121,49,12,24                // vpmovzxbd     (%r8,%r11,1),%xmm1
+  .byte  196,194,121,49,12,16                // vpmovzxbd     (%r8,%rdx,1),%xmm1
   .byte  197,251,112,201,232                 // vpshuflw      $0xe8,%xmm1,%xmm1
   .byte  197,250,112,201,232                 // vpshufhw      $0xe8,%xmm1,%xmm1
   .byte  197,249,112,201,232                 // vpshufd       $0xe8,%xmm1,%xmm1
   .byte  196,227,113,2,192,12                // vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  .byte  233,45,255,255,255                  // jmpq          3d06 <_sk_load_g8_skx+0x1e>
-  .byte  15,31,0                             // nopl          (%rax)
-  .byte  131,255,255                         // cmp           $0xffffffff,%edi
-  .byte  255,157,255,255,255,142             // lcall         *-0x71000001(%rbp)
+  .byte  233,53,255,255,255                  // jmpq          3c68 <_sk_load_g8_skx+0x18>
+  .byte  144                                 // nop
+  .byte  133,255                             // test          %edi,%edi
+  .byte  255                                 // (bad)
+  .byte  255,159,255,255,255,144             // lcall         *-0x6f000001(%rdi)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  221,255                             // (bad)
+  .byte  223,255                             // (bad)
   .byte  255                                 // (bad)
-  .byte  255,210                             // callq         *%rdx
+  .byte  255,212                             // callq         *%rsp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,199                             // inc           %edi
+  .byte  255,201                             // dec           %ecx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  184                                 // .byte         0xb8
+  .byte  186                                 // .byte         0xba
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -3741,74 +3724,73 @@
 FUNCTION(_sk_load_g8_dst_skx)
 _sk_load_g8_dst_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,54                              // jne           3e46 <_sk_load_g8_dst_skx+0x4e>
-  .byte  196,130,121,48,36,24                // vpmovzxbw     (%r8,%r11,1),%xmm4
-  .byte  197,217,219,37,242,118,3,0          // vpand         0x376f2(%rip),%xmm4,%xmm4        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  117,54                              // jne           3d98 <_sk_load_g8_dst_skx+0x48>
+  .byte  196,194,121,48,36,16                // vpmovzxbw     (%r8,%rdx,1),%xmm4
+  .byte  197,217,219,37,224,111,3,0          // vpand         0x36fe0(%rip),%xmm4,%xmm4        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  196,226,125,51,228                  // vpmovzxwd     %xmm4,%ymm4
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  98,241,92,56,89,37,195,109,3,0      // vmulps        0x36dc3(%rip){1to8},%ymm4,%ymm4        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  98,241,92,56,89,37,161,102,3,0      // vmulps        0x366a1(%rip){1to8},%ymm4,%ymm4        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,61,64,109,3,0        // vbroadcastss  0x36d40(%rip),%ymm7        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,61,30,102,3,0        // vbroadcastss  0x3661e(%rip),%ymm7        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,252,40,236                      // vmovaps       %ymm4,%ymm5
   .byte  197,252,40,244                      // vmovaps       %ymm4,%ymm6
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,187                             // ja            3e16 <_sk_load_g8_dst_skx+0x1e>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,134,0,0,0                 // lea           0x86(%rip),%r10        # 3eec <_sk_load_g8_dst_skx+0xf4>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,194                             // ja            3d68 <_sk_load_g8_dst_skx+0x18>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,132,0,0,0                 // lea           0x84(%rip),%r9        # 3e34 <_sk_load_g8_dst_skx+0xe4>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  235,156                             // jmp           3e16 <_sk_load_g8_dst_skx+0x1e>
-  .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
+  .byte  235,164                             // jmp           3d68 <_sk_load_g8_dst_skx+0x18>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  197,217,196,224,2                   // vpinsrw       $0x2,%eax,%xmm4,%xmm4
-  .byte  196,130,121,50,44,24                // vpmovzxbq     (%r8,%r11,1),%xmm5
+  .byte  196,194,121,50,44,16                // vpmovzxbq     (%r8,%rdx,1),%xmm5
   .byte  197,249,112,237,232                 // vpshufd       $0xe8,%xmm5,%xmm5
   .byte  197,251,112,237,232                 // vpshuflw      $0xe8,%xmm5,%xmm5
   .byte  196,227,89,2,229,1                  // vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  .byte  233,114,255,255,255                 // jmpq          3e16 <_sk_load_g8_dst_skx+0x1e>
-  .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
+  .byte  233,122,255,255,255                 // jmpq          3d68 <_sk_load_g8_dst_skx+0x18>
+  .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  197,217,196,224,6                   // vpinsrw       $0x6,%eax,%xmm4,%xmm4
-  .byte  67,15,182,68,24,5                   // movzbl        0x5(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,5                   // movzbl        0x5(%r8,%rdx,1),%eax
   .byte  197,217,196,224,5                   // vpinsrw       $0x5,%eax,%xmm4,%xmm4
-  .byte  67,15,182,68,24,4                   // movzbl        0x4(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,4                   // movzbl        0x4(%r8,%rdx,1),%eax
   .byte  197,217,196,224,4                   // vpinsrw       $0x4,%eax,%xmm4,%xmm4
-  .byte  196,130,121,49,44,24                // vpmovzxbd     (%r8,%r11,1),%xmm5
+  .byte  196,194,121,49,44,16                // vpmovzxbd     (%r8,%rdx,1),%xmm5
   .byte  197,251,112,237,232                 // vpshuflw      $0xe8,%xmm5,%xmm5
   .byte  197,250,112,237,232                 // vpshufhw      $0xe8,%xmm5,%xmm5
   .byte  197,249,112,237,232                 // vpshufd       $0xe8,%xmm5,%xmm5
   .byte  196,227,81,2,228,12                 // vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  .byte  233,45,255,255,255                  // jmpq          3e16 <_sk_load_g8_dst_skx+0x1e>
-  .byte  15,31,0                             // nopl          (%rax)
-  .byte  131,255,255                         // cmp           $0xffffffff,%edi
-  .byte  255,157,255,255,255,142             // lcall         *-0x71000001(%rbp)
+  .byte  233,53,255,255,255                  // jmpq          3d68 <_sk_load_g8_dst_skx+0x18>
+  .byte  144                                 // nop
+  .byte  133,255                             // test          %edi,%edi
+  .byte  255                                 // (bad)
+  .byte  255,159,255,255,255,144             // lcall         *-0x6f000001(%rdi)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  221,255                             // (bad)
+  .byte  223,255                             // (bad)
   .byte  255                                 // (bad)
-  .byte  255,210                             // callq         *%rdx
+  .byte  255,212                             // callq         *%rsp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,199                             // inc           %edi
+  .byte  255,201                             // dec           %ecx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  184                                 // .byte         0xb8
+  .byte  186                                 // .byte         0xba
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -3868,9 +3850,9 @@
   .byte  196,227,121,32,192,7                // vpinsrb       $0x7,%eax,%xmm0,%xmm0
   .byte  196,226,125,49,192                  // vpmovzxbd     %xmm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  98,241,124,56,89,5,254,107,3,0      // vmulps        0x36bfe(%rip){1to8},%ymm0,%ymm0        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  98,241,124,56,89,5,230,100,3,0      // vmulps        0x364e6(%rip){1to8},%ymm0,%ymm0        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,123,107,3,0       // vbroadcastss  0x36b7b(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,99,100,3,0        // vbroadcastss  0x36463(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,252,40,200                      // vmovaps       %ymm0,%ymm1
   .byte  197,252,40,208                      // vmovaps       %ymm0,%ymm2
   .byte  91                                  // pop           %rbx
@@ -3884,137 +3866,57 @@
 FUNCTION(_sk_load_565_skx)
 _sk_load_565_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,96                              // jne           408d <_sk_load_565_skx+0x7b>
-  .byte  196,129,122,111,4,88                // vmovdqu       (%r8,%r11,2),%xmm0
+  .byte  117,96                              // jne           3fcf <_sk_load_565_skx+0x75>
+  .byte  196,193,122,111,4,80                // vmovdqu       (%r8,%rdx,2),%xmm0
   .byte  196,226,125,51,208                  // vpmovzxwd     %xmm0,%ymm2
-  .byte  98,241,109,56,219,5,182,107,3,0     // vpandd        0x36bb6(%rip){1to8},%ymm2,%ymm0        # 3abf8 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  .byte  98,241,109,56,219,5,164,100,3,0     // vpandd        0x364a4(%rip){1to8},%ymm2,%ymm0        # 3a428 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  98,241,124,56,89,5,172,107,3,0      // vmulps        0x36bac(%rip){1to8},%ymm0,%ymm0        # 3abfc <_sk_srcover_bgra_8888_sse2_lowp+0x330>
-  .byte  98,241,109,56,219,13,166,107,3,0    // vpandd        0x36ba6(%rip){1to8},%ymm2,%ymm1        # 3ac00 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  .byte  98,241,124,56,89,5,154,100,3,0      // vmulps        0x3649a(%rip){1to8},%ymm0,%ymm0        # 3a42c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  .byte  98,241,109,56,219,13,148,100,3,0    // vpandd        0x36494(%rip){1to8},%ymm2,%ymm1        # 3a430 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  98,241,116,56,89,13,156,107,3,0     // vmulps        0x36b9c(%rip){1to8},%ymm1,%ymm1        # 3ac04 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
-  .byte  98,241,109,56,219,21,150,107,3,0    // vpandd        0x36b96(%rip){1to8},%ymm2,%ymm2        # 3ac08 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  .byte  98,241,116,56,89,13,138,100,3,0     // vmulps        0x3648a(%rip){1to8},%ymm1,%ymm1        # 3a434 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  .byte  98,241,109,56,219,21,132,100,3,0    // vpandd        0x36484(%rip){1to8},%ymm2,%ymm2        # 3a438 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
-  .byte  98,241,108,56,89,21,140,107,3,0     // vmulps        0x36b8c(%rip){1to8},%ymm2,%ymm2        # 3ac0c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  .byte  98,241,108,56,89,21,122,100,3,0     // vmulps        0x3647a(%rip){1to8},%ymm2,%ymm2        # 3a43c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,241,106,3,0       // vbroadcastss  0x36af1(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,223,99,3,0        // vbroadcastss  0x363df(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,145                             // ja            4033 <_sk_load_565_skx+0x21>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,123,0,0,0                 // lea           0x7b(%rip),%r10        # 4128 <_sk_load_565_skx+0x116>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,152                             // ja            3f75 <_sk_load_565_skx+0x1b>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,121,0,0,0                 // lea           0x79(%rip),%r9        # 4060 <_sk_load_565_skx+0x106>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  233,111,255,255,255                 // jmpq          4033 <_sk_load_565_skx+0x21>
+  .byte  233,119,255,255,255                 // jmpq          3f75 <_sk_load_565_skx+0x1b>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,4,2           // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,130,121,52,12,88                // vpmovzxwq     (%r8,%r11,2),%xmm1
+  .byte  196,193,121,196,68,80,4,2           // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,194,121,52,12,80                // vpmovzxwq     (%r8,%rdx,2),%xmm1
   .byte  197,249,112,201,232                 // vpshufd       $0xe8,%xmm1,%xmm1
   .byte  197,251,112,201,232                 // vpshuflw      $0xe8,%xmm1,%xmm1
   .byte  196,227,121,2,193,1                 // vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  .byte  233,72,255,255,255                  // jmpq          4033 <_sk_load_565_skx+0x21>
+  .byte  233,80,255,255,255                  // jmpq          3f75 <_sk_load_565_skx+0x1b>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,12,6          // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,10,5          // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,8,4           // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,130,121,51,12,88                // vpmovzxwd     (%r8,%r11,2),%xmm1
+  .byte  196,193,121,196,68,80,12,6          // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,193,121,196,68,80,10,5          // vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,193,121,196,68,80,8,4           // vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,194,121,51,12,80                // vpmovzxwd     (%r8,%rdx,2),%xmm1
   .byte  197,251,112,201,232                 // vpshuflw      $0xe8,%xmm1,%xmm1
   .byte  197,250,112,201,232                 // vpshufhw      $0xe8,%xmm1,%xmm1
   .byte  197,249,112,201,132                 // vpshufd       $0x84,%xmm1,%xmm1
   .byte  197,241,109,192                     // vpunpckhqdq   %xmm0,%xmm1,%xmm0
-  .byte  233,14,255,255,255                  // jmpq          4033 <_sk_load_565_skx+0x21>
-  .byte  15,31,0                             // nopl          (%rax)
-  .byte  142,255                             // mov           %edi,%?
-  .byte  255                                 // (bad)
-  .byte  255,168,255,255,255,156             // ljmp          *-0x63000001(%rax)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  223,255                             // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,215                             // callq         *%rdi
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,207                             // dec           %edi
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,195                             // inc           %ebx
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // .byte         0xff
-
-HIDDEN _sk_load_565_dst_skx
-.globl _sk_load_565_dst_skx
-FUNCTION(_sk_load_565_dst_skx)
-_sk_load_565_dst_skx:
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
-  .byte  77,1,192                            // add           %r8,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
-  .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,96                              // jne           41bf <_sk_load_565_dst_skx+0x7b>
-  .byte  196,129,122,111,36,88               // vmovdqu       (%r8,%r11,2),%xmm4
-  .byte  196,226,125,51,244                  // vpmovzxwd     %xmm4,%ymm6
-  .byte  98,241,77,56,219,37,132,106,3,0     // vpandd        0x36a84(%rip){1to8},%ymm6,%ymm4        # 3abf8 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
-  .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  98,241,92,56,89,37,122,106,3,0      // vmulps        0x36a7a(%rip){1to8},%ymm4,%ymm4        # 3abfc <_sk_srcover_bgra_8888_sse2_lowp+0x330>
-  .byte  98,241,77,56,219,45,116,106,3,0     // vpandd        0x36a74(%rip){1to8},%ymm6,%ymm5        # 3ac00 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
-  .byte  197,252,91,237                      // vcvtdq2ps     %ymm5,%ymm5
-  .byte  98,241,84,56,89,45,106,106,3,0      // vmulps        0x36a6a(%rip){1to8},%ymm5,%ymm5        # 3ac04 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
-  .byte  98,241,77,56,219,53,100,106,3,0     // vpandd        0x36a64(%rip){1to8},%ymm6,%ymm6        # 3ac08 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
-  .byte  197,252,91,246                      // vcvtdq2ps     %ymm6,%ymm6
-  .byte  98,241,76,56,89,53,90,106,3,0       // vmulps        0x36a5a(%rip){1to8},%ymm6,%ymm6        # 3ac0c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,61,191,105,3,0       // vbroadcastss  0x369bf(%rip),%ymm7        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
-  .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,145                             // ja            4165 <_sk_load_565_dst_skx+0x21>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,121,0,0,0                 // lea           0x79(%rip),%r10        # 4258 <_sk_load_565_dst_skx+0x114>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
-  .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
-  .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  233,111,255,255,255                 // jmpq          4165 <_sk_load_565_dst_skx+0x21>
-  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,4,2           // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,130,121,52,44,88                // vpmovzxwq     (%r8,%r11,2),%xmm5
-  .byte  197,249,112,237,232                 // vpshufd       $0xe8,%xmm5,%xmm5
-  .byte  197,251,112,237,232                 // vpshuflw      $0xe8,%xmm5,%xmm5
-  .byte  196,227,89,2,229,1                  // vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  .byte  233,72,255,255,255                  // jmpq          4165 <_sk_load_565_dst_skx+0x21>
-  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,12,6          // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,10,5          // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,8,4           // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,130,121,51,44,88                // vpmovzxwd     (%r8,%r11,2),%xmm5
-  .byte  197,251,112,237,232                 // vpshuflw      $0xe8,%xmm5,%xmm5
-  .byte  197,250,112,237,232                 // vpshufhw      $0xe8,%xmm5,%xmm5
-  .byte  197,249,112,237,132                 // vpshufd       $0x84,%xmm5,%xmm5
-  .byte  197,209,109,228                     // vpunpckhqdq   %xmm4,%xmm5,%xmm4
-  .byte  233,14,255,255,255                  // jmpq          4165 <_sk_load_565_dst_skx+0x21>
+  .byte  233,22,255,255,255                  // jmpq          3f75 <_sk_load_565_skx+0x1b>
   .byte  144                                 // nop
   .byte  144                                 // nop
   .byte  255                                 // (bad)
@@ -4036,6 +3938,82 @@
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
+HIDDEN _sk_load_565_dst_skx
+.globl _sk_load_565_dst_skx
+FUNCTION(_sk_load_565_dst_skx)
+_sk_load_565_dst_skx:
+  .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
+  .byte  77,1,192                            // add           %r8,%r8
+  .byte  76,3,0                              // add           (%rax),%r8
+  .byte  72,133,255                          // test          %rdi,%rdi
+  .byte  117,96                              // jne           40f1 <_sk_load_565_dst_skx+0x75>
+  .byte  196,193,122,111,36,80               // vmovdqu       (%r8,%rdx,2),%xmm4
+  .byte  196,226,125,51,244                  // vpmovzxwd     %xmm4,%ymm6
+  .byte  98,241,77,56,219,37,130,99,3,0      // vpandd        0x36382(%rip){1to8},%ymm6,%ymm4        # 3a428 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
+  .byte  98,241,92,56,89,37,120,99,3,0       // vmulps        0x36378(%rip){1to8},%ymm4,%ymm4        # 3a42c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  .byte  98,241,77,56,219,45,114,99,3,0      // vpandd        0x36372(%rip){1to8},%ymm6,%ymm5        # 3a430 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  .byte  197,252,91,237                      // vcvtdq2ps     %ymm5,%ymm5
+  .byte  98,241,84,56,89,45,104,99,3,0       // vmulps        0x36368(%rip){1to8},%ymm5,%ymm5        # 3a434 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  .byte  98,241,77,56,219,53,98,99,3,0       // vpandd        0x36362(%rip){1to8},%ymm6,%ymm6        # 3a438 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  .byte  197,252,91,246                      // vcvtdq2ps     %ymm6,%ymm6
+  .byte  98,241,76,56,89,53,88,99,3,0        // vmulps        0x36358(%rip){1to8},%ymm6,%ymm6        # 3a43c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  196,226,125,24,61,189,98,3,0        // vbroadcastss  0x362bd(%rip),%ymm7        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  255,224                             // jmpq          *%rax
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,152                             // ja            4097 <_sk_load_565_dst_skx+0x1b>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,123,0,0,0                 // lea           0x7b(%rip),%r9        # 4184 <_sk_load_565_dst_skx+0x108>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
+  .byte  255,224                             // jmpq          *%rax
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
+  .byte  197,249,110,224                     // vmovd         %eax,%xmm4
+  .byte  233,119,255,255,255                 // jmpq          4097 <_sk_load_565_dst_skx+0x1b>
+  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
+  .byte  196,193,89,196,100,80,4,2           // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,194,121,52,44,80                // vpmovzxwq     (%r8,%rdx,2),%xmm5
+  .byte  197,249,112,237,232                 // vpshufd       $0xe8,%xmm5,%xmm5
+  .byte  197,251,112,237,232                 // vpshuflw      $0xe8,%xmm5,%xmm5
+  .byte  196,227,89,2,229,1                  // vpblendd      $0x1,%xmm5,%xmm4,%xmm4
+  .byte  233,80,255,255,255                  // jmpq          4097 <_sk_load_565_dst_skx+0x1b>
+  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
+  .byte  196,193,89,196,100,80,12,6          // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,193,89,196,100,80,10,5          // vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,193,89,196,100,80,8,4           // vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,194,121,51,44,80                // vpmovzxwd     (%r8,%rdx,2),%xmm5
+  .byte  197,251,112,237,232                 // vpshuflw      $0xe8,%xmm5,%xmm5
+  .byte  197,250,112,237,232                 // vpshufhw      $0xe8,%xmm5,%xmm5
+  .byte  197,249,112,237,132                 // vpshufd       $0x84,%xmm5,%xmm5
+  .byte  197,209,109,228                     // vpunpckhqdq   %xmm4,%xmm5,%xmm4
+  .byte  233,22,255,255,255                  // jmpq          4097 <_sk_load_565_dst_skx+0x1b>
+  .byte  15,31,0                             // nopl          (%rax)
+  .byte  142,255                             // mov           %edi,%?
+  .byte  255                                 // (bad)
+  .byte  255,168,255,255,255,156             // ljmp          *-0x63000001(%rax)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  223,255                             // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,215                             // callq         *%rdi
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,207                             // dec           %edi
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,195                             // inc           %ebx
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255                                 // .byte         0xff
+
 HIDDEN _sk_gather_565_skx
 .globl _sk_gather_565_skx
 FUNCTION(_sk_gather_565_skx)
@@ -4090,17 +4068,17 @@
   .byte  65,15,183,4,88                      // movzwl        (%r8,%rbx,2),%eax
   .byte  197,249,196,192,7                   // vpinsrw       $0x7,%eax,%xmm0,%xmm0
   .byte  196,226,125,51,208                  // vpmovzxwd     %xmm0,%ymm2
-  .byte  98,241,109,56,219,5,159,104,3,0     // vpandd        0x3689f(%rip){1to8},%ymm2,%ymm0        # 3abf8 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  .byte  98,241,109,56,219,5,163,97,3,0      // vpandd        0x361a3(%rip){1to8},%ymm2,%ymm0        # 3a428 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  98,241,124,56,89,5,149,104,3,0      // vmulps        0x36895(%rip){1to8},%ymm0,%ymm0        # 3abfc <_sk_srcover_bgra_8888_sse2_lowp+0x330>
-  .byte  98,241,109,56,219,13,143,104,3,0    // vpandd        0x3688f(%rip){1to8},%ymm2,%ymm1        # 3ac00 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  .byte  98,241,124,56,89,5,153,97,3,0       // vmulps        0x36199(%rip){1to8},%ymm0,%ymm0        # 3a42c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  .byte  98,241,109,56,219,13,147,97,3,0     // vpandd        0x36193(%rip){1to8},%ymm2,%ymm1        # 3a430 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  98,241,116,56,89,13,133,104,3,0     // vmulps        0x36885(%rip){1to8},%ymm1,%ymm1        # 3ac04 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
-  .byte  98,241,109,56,219,21,127,104,3,0    // vpandd        0x3687f(%rip){1to8},%ymm2,%ymm2        # 3ac08 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  .byte  98,241,116,56,89,13,137,97,3,0      // vmulps        0x36189(%rip){1to8},%ymm1,%ymm1        # 3a434 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  .byte  98,241,109,56,219,21,131,97,3,0     // vpandd        0x36183(%rip){1to8},%ymm2,%ymm2        # 3a438 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
-  .byte  98,241,108,56,89,21,117,104,3,0     // vmulps        0x36875(%rip){1to8},%ymm2,%ymm2        # 3ac0c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  .byte  98,241,108,56,89,21,121,97,3,0      // vmulps        0x36179(%rip){1to8},%ymm2,%ymm2        # 3a43c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,218,103,3,0       // vbroadcastss  0x367da(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,222,96,3,0        // vbroadcastss  0x360de(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  91                                  // pop           %rbx
   .byte  65,92                               // pop           %r12
   .byte  65,94                               // pop           %r14
@@ -4112,23 +4090,21 @@
 FUNCTION(_sk_store_565_skx)
 _sk_store_565_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,60,95,200                       // vmaxps        %ymm0,%ymm8,%ymm9
-  .byte  196,98,125,24,21,169,103,3,0        // vbroadcastss  0x367a9(%rip),%ymm10        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,21,179,96,3,0         // vbroadcastss  0x360b3(%rip),%ymm10        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,52,93,202                    // vminps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,29,139,104,3,0        // vbroadcastss  0x3688b(%rip),%ymm11        # 3ac6c <_sk_srcover_bgra_8888_sse2_lowp+0x3a0>
+  .byte  196,98,125,24,29,149,97,3,0         // vbroadcastss  0x36195(%rip),%ymm11        # 3a49c <_sk_srcover_bgra_8888_sse2_lowp+0x3a0>
   .byte  196,65,52,89,203                    // vmulps        %ymm11,%ymm9,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  196,193,53,114,241,11               // vpslld        $0xb,%ymm9,%ymm9
   .byte  197,60,95,225                       // vmaxps        %ymm1,%ymm8,%ymm12
   .byte  196,65,28,93,226                    // vminps        %ymm10,%ymm12,%ymm12
-  .byte  98,113,28,56,89,37,108,104,3,0      // vmulps        0x3686c(%rip){1to8},%ymm12,%ymm12        # 3ac70 <_sk_srcover_bgra_8888_sse2_lowp+0x3a4>
+  .byte  98,113,28,56,89,37,118,97,3,0       // vmulps        0x36176(%rip){1to8},%ymm12,%ymm12        # 3a4a0 <_sk_srcover_bgra_8888_sse2_lowp+0x3a4>
   .byte  196,65,125,91,228                   // vcvtps2dq     %ymm12,%ymm12
   .byte  196,193,29,114,244,5                // vpslld        $0x5,%ymm12,%ymm12
   .byte  196,65,29,235,201                   // vpor          %ymm9,%ymm12,%ymm9
@@ -4140,50 +4116,48 @@
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,66,57,43,193                    // vpackusdw     %xmm9,%xmm8,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           4446 <_sk_store_565_skx+0x9b>
-  .byte  196,1,122,127,4,88                  // vmovdqu       %xmm8,(%r8,%r11,2)
+  .byte  117,10                              // jne           436c <_sk_store_565_skx+0x95>
+  .byte  196,65,122,127,4,80                 // vmovdqu       %xmm8,(%r8,%rdx,2)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,235                             // ja            4442 <_sk_store_565_skx+0x97>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,78,0,0,0                  // lea           0x4e(%rip),%r10        # 44b0 <_sk_store_565_skx+0x105>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,242                             // ja            4368 <_sk_store_565_skx+0x91>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,80,0,0,0                  // lea           0x50(%rip),%r9        # 43d0 <_sk_store_565_skx+0xf9>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,3,121,21,4,88,0                 // vpextrw       $0x0,%xmm8,(%r8,%r11,2)
-  .byte  235,206                             // jmp           4442 <_sk_store_565_skx+0x97>
-  .byte  196,3,121,21,68,88,4,2              // vpextrw       $0x2,%xmm8,0x4(%r8,%r11,2)
+  .byte  196,67,121,21,4,80,0                // vpextrw       $0x0,%xmm8,(%r8,%rdx,2)
+  .byte  235,214                             // jmp           4368 <_sk_store_565_skx+0x91>
+  .byte  196,67,121,21,68,80,4,2             // vpextrw       $0x2,%xmm8,0x4(%r8,%rdx,2)
   .byte  196,66,121,52,192                   // vpmovzxwq     %xmm8,%xmm8
-  .byte  98,18,126,8,52,4,88                 // vpmovqw       %xmm8,(%r8,%r11,2)
-  .byte  235,184                             // jmp           4442 <_sk_store_565_skx+0x97>
-  .byte  196,3,121,21,68,88,12,6             // vpextrw       $0x6,%xmm8,0xc(%r8,%r11,2)
-  .byte  196,3,121,21,68,88,10,5             // vpextrw       $0x5,%xmm8,0xa(%r8,%r11,2)
-  .byte  196,3,121,21,68,88,8,4              // vpextrw       $0x4,%xmm8,0x8(%r8,%r11,2)
+  .byte  98,82,126,8,52,4,80                 // vpmovqw       %xmm8,(%r8,%rdx,2)
+  .byte  235,192                             // jmp           4368 <_sk_store_565_skx+0x91>
+  .byte  196,67,121,21,68,80,12,6            // vpextrw       $0x6,%xmm8,0xc(%r8,%rdx,2)
+  .byte  196,67,121,21,68,80,10,5            // vpextrw       $0x5,%xmm8,0xa(%r8,%rdx,2)
+  .byte  196,67,121,21,68,80,8,4             // vpextrw       $0x4,%xmm8,0x8(%r8,%rdx,2)
   .byte  196,66,121,51,192                   // vpmovzxwd     %xmm8,%xmm8
-  .byte  98,18,126,8,51,4,88                 // vpmovdw       %xmm8,(%r8,%r11,2)
-  .byte  235,146                             // jmp           4442 <_sk_store_565_skx+0x97>
-  .byte  187,255,255,255,204                 // mov           $0xccffffff,%ebx
+  .byte  98,82,126,8,51,4,80                 // vpmovdw       %xmm8,(%r8,%rdx,2)
+  .byte  235,154                             // jmp           4368 <_sk_store_565_skx+0x91>
+  .byte  102,144                             // xchg          %ax,%ax
+  .byte  185,255,255,255,202                 // mov           $0xcaffffff,%ecx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,196                             // inc           %esp
+  .byte  255,194                             // inc           %edx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,242                             // push          %rdx
+  .byte  255,240                             // push          %rax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  234                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,226                             // jmpq          *%rdx
+  .byte  232,255,255,255,224                 // callq         ffffffffe10043e4 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffe0fca2e8>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  218,255                             // (bad)
+  .byte  216,255                             // fdivr         %st(7),%st
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
@@ -4192,78 +4166,75 @@
 FUNCTION(_sk_load_4444_skx)
 _sk_load_4444_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,111                             // jne           4556 <_sk_load_4444_skx+0x8a>
-  .byte  196,129,122,111,4,88                // vmovdqu       (%r8,%r11,2),%xmm0
+  .byte  117,111                             // jne           4470 <_sk_load_4444_skx+0x84>
+  .byte  196,193,122,111,4,80                // vmovdqu       (%r8,%rdx,2),%xmm0
   .byte  196,226,125,51,216                  // vpmovzxwd     %xmm0,%ymm3
-  .byte  98,241,101,56,219,5,120,103,3,0     // vpandd        0x36778(%rip){1to8},%ymm3,%ymm0        # 3ac74 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
+  .byte  98,241,101,56,219,5,142,96,3,0      // vpandd        0x3608e(%rip){1to8},%ymm3,%ymm0        # 3a4a4 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  98,241,124,56,89,5,110,103,3,0      // vmulps        0x3676e(%rip){1to8},%ymm0,%ymm0        # 3ac78 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
-  .byte  98,241,101,56,219,13,104,103,3,0    // vpandd        0x36768(%rip){1to8},%ymm3,%ymm1        # 3ac7c <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
+  .byte  98,241,124,56,89,5,132,96,3,0       // vmulps        0x36084(%rip){1to8},%ymm0,%ymm0        # 3a4a8 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
+  .byte  98,241,101,56,219,13,126,96,3,0     // vpandd        0x3607e(%rip){1to8},%ymm3,%ymm1        # 3a4ac <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  98,241,116,56,89,13,94,103,3,0      // vmulps        0x3675e(%rip){1to8},%ymm1,%ymm1        # 3ac80 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
-  .byte  98,241,101,56,219,21,88,103,3,0     // vpandd        0x36758(%rip){1to8},%ymm3,%ymm2        # 3ac84 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
+  .byte  98,241,116,56,89,13,116,96,3,0      // vmulps        0x36074(%rip){1to8},%ymm1,%ymm1        # 3a4b0 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
+  .byte  98,241,101,56,219,21,110,96,3,0     // vpandd        0x3606e(%rip){1to8},%ymm3,%ymm2        # 3a4b4 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
-  .byte  98,241,108,56,89,21,78,103,3,0      // vmulps        0x3674e(%rip){1to8},%ymm2,%ymm2        # 3ac88 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
-  .byte  98,241,101,56,219,29,72,103,3,0     // vpandd        0x36748(%rip){1to8},%ymm3,%ymm3        # 3ac8c <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
+  .byte  98,241,108,56,89,21,100,96,3,0      // vmulps        0x36064(%rip){1to8},%ymm2,%ymm2        # 3a4b8 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
+  .byte  98,241,101,56,219,29,94,96,3,0      // vpandd        0x3605e(%rip){1to8},%ymm3,%ymm3        # 3a4bc <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
   .byte  197,252,91,219                      // vcvtdq2ps     %ymm3,%ymm3
-  .byte  98,241,100,56,89,29,62,103,3,0      // vmulps        0x3673e(%rip){1to8},%ymm3,%ymm3        # 3ac90 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
+  .byte  98,241,100,56,89,29,84,96,3,0       // vmulps        0x36054(%rip){1to8},%ymm3,%ymm3        # 3a4c0 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,130                             // ja            44ed <_sk_load_4444_skx+0x21>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,122,0,0,0                 // lea           0x7a(%rip),%r10        # 45f0 <_sk_load_4444_skx+0x124>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,137                             // ja            4407 <_sk_load_4444_skx+0x1b>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,120,0,0,0                 // lea           0x78(%rip),%r9        # 4500 <_sk_load_4444_skx+0x114>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  233,96,255,255,255                  // jmpq          44ed <_sk_load_4444_skx+0x21>
+  .byte  233,104,255,255,255                 // jmpq          4407 <_sk_load_4444_skx+0x1b>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,4,2           // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,130,121,52,12,88                // vpmovzxwq     (%r8,%r11,2),%xmm1
+  .byte  196,193,121,196,68,80,4,2           // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,194,121,52,12,80                // vpmovzxwq     (%r8,%rdx,2),%xmm1
   .byte  197,249,112,201,232                 // vpshufd       $0xe8,%xmm1,%xmm1
   .byte  197,251,112,201,232                 // vpshuflw      $0xe8,%xmm1,%xmm1
   .byte  196,227,121,2,193,1                 // vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  .byte  233,57,255,255,255                  // jmpq          44ed <_sk_load_4444_skx+0x21>
+  .byte  233,65,255,255,255                  // jmpq          4407 <_sk_load_4444_skx+0x1b>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,12,6          // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,10,5          // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,8,4           // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,130,121,51,12,88                // vpmovzxwd     (%r8,%r11,2),%xmm1
+  .byte  196,193,121,196,68,80,12,6          // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,193,121,196,68,80,10,5          // vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,193,121,196,68,80,8,4           // vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,194,121,51,12,80                // vpmovzxwd     (%r8,%rdx,2),%xmm1
   .byte  197,251,112,201,232                 // vpshuflw      $0xe8,%xmm1,%xmm1
   .byte  197,250,112,201,232                 // vpshufhw      $0xe8,%xmm1,%xmm1
   .byte  197,249,112,201,132                 // vpshufd       $0x84,%xmm1,%xmm1
   .byte  197,241,109,192                     // vpunpckhqdq   %xmm0,%xmm1,%xmm0
-  .byte  233,255,254,255,255                 // jmpq          44ed <_sk_load_4444_skx+0x21>
-  .byte  102,144                             // xchg          %ax,%ax
-  .byte  143                                 // (bad)
+  .byte  233,7,255,255,255                   // jmpq          4407 <_sk_load_4444_skx+0x1b>
+  .byte  145                                 // xchg          %eax,%ecx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,169,255,255,255,157             // ljmp          *-0x62000001(%rcx)
+  .byte  255,171,255,255,255,159             // ljmp          *-0x60000001(%rbx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,224                             // jmpq          *%rax
+  .byte  255,226                             // jmpq          *%rdx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  216,255                             // fdivr         %st(7),%st
+  .byte  218,255                             // (bad)
   .byte  255                                 // (bad)
-  .byte  255,208                             // callq         *%rax
+  .byte  255,210                             // callq         *%rdx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,196                             // inc           %esp
+  .byte  255,198                             // inc           %esi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -4273,78 +4244,75 @@
 FUNCTION(_sk_load_4444_dst_skx)
 _sk_load_4444_dst_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,111                             // jne           4696 <_sk_load_4444_dst_skx+0x8a>
-  .byte  196,129,122,111,36,88               // vmovdqu       (%r8,%r11,2),%xmm4
+  .byte  117,111                             // jne           45a0 <_sk_load_4444_dst_skx+0x84>
+  .byte  196,193,122,111,36,80               // vmovdqu       (%r8,%rdx,2),%xmm4
   .byte  196,226,125,51,252                  // vpmovzxwd     %xmm4,%ymm7
-  .byte  98,241,69,56,219,37,56,102,3,0      // vpandd        0x36638(%rip){1to8},%ymm7,%ymm4        # 3ac74 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
+  .byte  98,241,69,56,219,37,94,95,3,0       // vpandd        0x35f5e(%rip){1to8},%ymm7,%ymm4        # 3a4a4 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  98,241,92,56,89,37,46,102,3,0       // vmulps        0x3662e(%rip){1to8},%ymm4,%ymm4        # 3ac78 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
-  .byte  98,241,69,56,219,45,40,102,3,0      // vpandd        0x36628(%rip){1to8},%ymm7,%ymm5        # 3ac7c <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
+  .byte  98,241,92,56,89,37,84,95,3,0        // vmulps        0x35f54(%rip){1to8},%ymm4,%ymm4        # 3a4a8 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
+  .byte  98,241,69,56,219,45,78,95,3,0       // vpandd        0x35f4e(%rip){1to8},%ymm7,%ymm5        # 3a4ac <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
   .byte  197,252,91,237                      // vcvtdq2ps     %ymm5,%ymm5
-  .byte  98,241,84,56,89,45,30,102,3,0       // vmulps        0x3661e(%rip){1to8},%ymm5,%ymm5        # 3ac80 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
-  .byte  98,241,69,56,219,53,24,102,3,0      // vpandd        0x36618(%rip){1to8},%ymm7,%ymm6        # 3ac84 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
+  .byte  98,241,84,56,89,45,68,95,3,0        // vmulps        0x35f44(%rip){1to8},%ymm5,%ymm5        # 3a4b0 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
+  .byte  98,241,69,56,219,53,62,95,3,0       // vpandd        0x35f3e(%rip){1to8},%ymm7,%ymm6        # 3a4b4 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
   .byte  197,252,91,246                      // vcvtdq2ps     %ymm6,%ymm6
-  .byte  98,241,76,56,89,53,14,102,3,0       // vmulps        0x3660e(%rip){1to8},%ymm6,%ymm6        # 3ac88 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
-  .byte  98,241,69,56,219,61,8,102,3,0       // vpandd        0x36608(%rip){1to8},%ymm7,%ymm7        # 3ac8c <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
+  .byte  98,241,76,56,89,53,52,95,3,0        // vmulps        0x35f34(%rip){1to8},%ymm6,%ymm6        # 3a4b8 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
+  .byte  98,241,69,56,219,61,46,95,3,0       // vpandd        0x35f2e(%rip){1to8},%ymm7,%ymm7        # 3a4bc <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
   .byte  197,252,91,255                      // vcvtdq2ps     %ymm7,%ymm7
-  .byte  98,241,68,56,89,61,254,101,3,0      // vmulps        0x365fe(%rip){1to8},%ymm7,%ymm7        # 3ac90 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
+  .byte  98,241,68,56,89,61,36,95,3,0        // vmulps        0x35f24(%rip){1to8},%ymm7,%ymm7        # 3a4c0 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,130                             // ja            462d <_sk_load_4444_dst_skx+0x21>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,122,0,0,0                 // lea           0x7a(%rip),%r10        # 4730 <_sk_load_4444_dst_skx+0x124>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,137                             // ja            4537 <_sk_load_4444_dst_skx+0x1b>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,120,0,0,0                 // lea           0x78(%rip),%r9        # 4630 <_sk_load_4444_dst_skx+0x114>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  233,96,255,255,255                  // jmpq          462d <_sk_load_4444_dst_skx+0x21>
+  .byte  233,104,255,255,255                 // jmpq          4537 <_sk_load_4444_dst_skx+0x1b>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,4,2           // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,130,121,52,44,88                // vpmovzxwq     (%r8,%r11,2),%xmm5
+  .byte  196,193,89,196,100,80,4,2           // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,194,121,52,44,80                // vpmovzxwq     (%r8,%rdx,2),%xmm5
   .byte  197,249,112,237,232                 // vpshufd       $0xe8,%xmm5,%xmm5
   .byte  197,251,112,237,232                 // vpshuflw      $0xe8,%xmm5,%xmm5
   .byte  196,227,89,2,229,1                  // vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  .byte  233,57,255,255,255                  // jmpq          462d <_sk_load_4444_dst_skx+0x21>
+  .byte  233,65,255,255,255                  // jmpq          4537 <_sk_load_4444_dst_skx+0x1b>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,12,6          // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,10,5          // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,8,4           // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,130,121,51,44,88                // vpmovzxwd     (%r8,%r11,2),%xmm5
+  .byte  196,193,89,196,100,80,12,6          // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,193,89,196,100,80,10,5          // vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,193,89,196,100,80,8,4           // vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,194,121,51,44,80                // vpmovzxwd     (%r8,%rdx,2),%xmm5
   .byte  197,251,112,237,232                 // vpshuflw      $0xe8,%xmm5,%xmm5
   .byte  197,250,112,237,232                 // vpshufhw      $0xe8,%xmm5,%xmm5
   .byte  197,249,112,237,132                 // vpshufd       $0x84,%xmm5,%xmm5
   .byte  197,209,109,228                     // vpunpckhqdq   %xmm4,%xmm5,%xmm4
-  .byte  233,255,254,255,255                 // jmpq          462d <_sk_load_4444_dst_skx+0x21>
-  .byte  102,144                             // xchg          %ax,%ax
-  .byte  143                                 // (bad)
+  .byte  233,7,255,255,255                   // jmpq          4537 <_sk_load_4444_dst_skx+0x1b>
+  .byte  145                                 // xchg          %eax,%ecx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,169,255,255,255,157             // ljmp          *-0x62000001(%rcx)
+  .byte  255,171,255,255,255,159             // ljmp          *-0x60000001(%rbx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,224                             // jmpq          *%rax
+  .byte  255,226                             // jmpq          *%rdx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  216,255                             // fdivr         %st(7),%st
+  .byte  218,255                             // (bad)
   .byte  255                                 // (bad)
-  .byte  255,208                             // callq         *%rax
+  .byte  255,210                             // callq         *%rdx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,196                             // inc           %esp
+  .byte  255,198                             // inc           %esi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -4403,18 +4371,18 @@
   .byte  65,15,183,4,88                      // movzwl        (%r8,%rbx,2),%eax
   .byte  197,249,196,192,7                   // vpinsrw       $0x7,%eax,%xmm0,%xmm0
   .byte  196,226,125,51,216                  // vpmovzxwd     %xmm0,%ymm3
-  .byte  98,241,101,56,219,5,67,100,3,0      // vpandd        0x36443(%rip){1to8},%ymm3,%ymm0        # 3ac74 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
+  .byte  98,241,101,56,219,5,115,93,3,0      // vpandd        0x35d73(%rip){1to8},%ymm3,%ymm0        # 3a4a4 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  98,241,124,56,89,5,57,100,3,0       // vmulps        0x36439(%rip){1to8},%ymm0,%ymm0        # 3ac78 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
-  .byte  98,241,101,56,219,13,51,100,3,0     // vpandd        0x36433(%rip){1to8},%ymm3,%ymm1        # 3ac7c <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
+  .byte  98,241,124,56,89,5,105,93,3,0       // vmulps        0x35d69(%rip){1to8},%ymm0,%ymm0        # 3a4a8 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
+  .byte  98,241,101,56,219,13,99,93,3,0      // vpandd        0x35d63(%rip){1to8},%ymm3,%ymm1        # 3a4ac <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  98,241,116,56,89,13,41,100,3,0      // vmulps        0x36429(%rip){1to8},%ymm1,%ymm1        # 3ac80 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
-  .byte  98,241,101,56,219,21,35,100,3,0     // vpandd        0x36423(%rip){1to8},%ymm3,%ymm2        # 3ac84 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
+  .byte  98,241,116,56,89,13,89,93,3,0       // vmulps        0x35d59(%rip){1to8},%ymm1,%ymm1        # 3a4b0 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
+  .byte  98,241,101,56,219,21,83,93,3,0      // vpandd        0x35d53(%rip){1to8},%ymm3,%ymm2        # 3a4b4 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
-  .byte  98,241,108,56,89,21,25,100,3,0      // vmulps        0x36419(%rip){1to8},%ymm2,%ymm2        # 3ac88 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
-  .byte  98,241,101,56,219,29,19,100,3,0     // vpandd        0x36413(%rip){1to8},%ymm3,%ymm3        # 3ac8c <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
+  .byte  98,241,108,56,89,21,73,93,3,0       // vmulps        0x35d49(%rip){1to8},%ymm2,%ymm2        # 3a4b8 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
+  .byte  98,241,101,56,219,29,67,93,3,0      // vpandd        0x35d43(%rip){1to8},%ymm3,%ymm3        # 3a4bc <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
   .byte  197,252,91,219                      // vcvtdq2ps     %ymm3,%ymm3
-  .byte  98,241,100,56,89,29,9,100,3,0       // vmulps        0x36409(%rip){1to8},%ymm3,%ymm3        # 3ac90 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
+  .byte  98,241,100,56,89,29,57,93,3,0       // vmulps        0x35d39(%rip){1to8},%ymm3,%ymm3        # 3a4c0 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  91                                  // pop           %rbx
   .byte  65,92                               // pop           %r12
@@ -4427,17 +4395,15 @@
 FUNCTION(_sk_store_4444_skx)
 _sk_store_4444_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,60,95,200                       // vmaxps        %ymm0,%ymm8,%ymm9
-  .byte  196,98,125,24,21,194,98,3,0         // vbroadcastss  0x362c2(%rip),%ymm10        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,21,248,91,3,0         // vbroadcastss  0x35bf8(%rip),%ymm10        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,52,93,202                    // vminps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,29,204,99,3,0         // vbroadcastss  0x363cc(%rip),%ymm11        # 3ac94 <_sk_srcover_bgra_8888_sse2_lowp+0x3c8>
+  .byte  196,98,125,24,29,2,93,3,0           // vbroadcastss  0x35d02(%rip),%ymm11        # 3a4c4 <_sk_srcover_bgra_8888_sse2_lowp+0x3c8>
   .byte  196,65,52,89,203                    // vmulps        %ymm11,%ymm9,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  196,193,53,114,241,12               // vpslld        $0xc,%ymm9,%ymm9
@@ -4461,50 +4427,48 @@
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,66,57,43,193                    // vpackusdw     %xmm9,%xmm8,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           4946 <_sk_store_4444_skx+0xb4>
-  .byte  196,1,122,127,4,88                  // vmovdqu       %xmm8,(%r8,%r11,2)
+  .byte  117,10                              // jne           4840 <_sk_store_4444_skx+0xae>
+  .byte  196,65,122,127,4,80                 // vmovdqu       %xmm8,(%r8,%rdx,2)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,235                             // ja            4942 <_sk_store_4444_skx+0xb0>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,78,0,0,0                  // lea           0x4e(%rip),%r10        # 49b0 <_sk_store_4444_skx+0x11e>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,242                             // ja            483c <_sk_store_4444_skx+0xaa>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,80,0,0,0                  // lea           0x50(%rip),%r9        # 48a4 <_sk_store_4444_skx+0x112>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,3,121,21,4,88,0                 // vpextrw       $0x0,%xmm8,(%r8,%r11,2)
-  .byte  235,206                             // jmp           4942 <_sk_store_4444_skx+0xb0>
-  .byte  196,3,121,21,68,88,4,2              // vpextrw       $0x2,%xmm8,0x4(%r8,%r11,2)
+  .byte  196,67,121,21,4,80,0                // vpextrw       $0x0,%xmm8,(%r8,%rdx,2)
+  .byte  235,214                             // jmp           483c <_sk_store_4444_skx+0xaa>
+  .byte  196,67,121,21,68,80,4,2             // vpextrw       $0x2,%xmm8,0x4(%r8,%rdx,2)
   .byte  196,66,121,52,192                   // vpmovzxwq     %xmm8,%xmm8
-  .byte  98,18,126,8,52,4,88                 // vpmovqw       %xmm8,(%r8,%r11,2)
-  .byte  235,184                             // jmp           4942 <_sk_store_4444_skx+0xb0>
-  .byte  196,3,121,21,68,88,12,6             // vpextrw       $0x6,%xmm8,0xc(%r8,%r11,2)
-  .byte  196,3,121,21,68,88,10,5             // vpextrw       $0x5,%xmm8,0xa(%r8,%r11,2)
-  .byte  196,3,121,21,68,88,8,4              // vpextrw       $0x4,%xmm8,0x8(%r8,%r11,2)
+  .byte  98,82,126,8,52,4,80                 // vpmovqw       %xmm8,(%r8,%rdx,2)
+  .byte  235,192                             // jmp           483c <_sk_store_4444_skx+0xaa>
+  .byte  196,67,121,21,68,80,12,6            // vpextrw       $0x6,%xmm8,0xc(%r8,%rdx,2)
+  .byte  196,67,121,21,68,80,10,5            // vpextrw       $0x5,%xmm8,0xa(%r8,%rdx,2)
+  .byte  196,67,121,21,68,80,8,4             // vpextrw       $0x4,%xmm8,0x8(%r8,%rdx,2)
   .byte  196,66,121,51,192                   // vpmovzxwd     %xmm8,%xmm8
-  .byte  98,18,126,8,51,4,88                 // vpmovdw       %xmm8,(%r8,%r11,2)
-  .byte  235,146                             // jmp           4942 <_sk_store_4444_skx+0xb0>
-  .byte  187,255,255,255,204                 // mov           $0xccffffff,%ebx
+  .byte  98,82,126,8,51,4,80                 // vpmovdw       %xmm8,(%r8,%rdx,2)
+  .byte  235,154                             // jmp           483c <_sk_store_4444_skx+0xaa>
+  .byte  102,144                             // xchg          %ax,%ax
+  .byte  185,255,255,255,202                 // mov           $0xcaffffff,%ecx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,196                             // inc           %esp
+  .byte  255,194                             // inc           %edx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,242                             // push          %rdx
+  .byte  255,240                             // push          %rax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  234                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,226                             // jmpq          *%rdx
+  .byte  232,255,255,255,224                 // callq         ffffffffe10048b8 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffe0fca7bc>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  218,255                             // (bad)
+  .byte  216,255                             // fdivr         %st(7),%st
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
@@ -4513,20 +4477,18 @@
 FUNCTION(_sk_load_8888_skx)
 _sk_load_8888_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,97                              // jne           4a49 <_sk_load_8888_skx+0x7d>
-  .byte  196,129,126,111,28,152              // vmovdqu       (%r8,%r11,4),%ymm3
+  .byte  117,97                              // jne           4937 <_sk_load_8888_skx+0x77>
+  .byte  196,193,126,111,28,144              // vmovdqu       (%r8,%rdx,4),%ymm3
   .byte  184,17,17,17,17                     // mov           $0x11111111,%eax
   .byte  197,251,146,200                     // kmovd         %eax,%k1
   .byte  98,241,127,169,111,195              // vmovdqu8      %ymm3,%ymm0{%k1}{z}
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,5,234,97,3,0          // vbroadcastss  0x361ea(%rip),%ymm8        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,5,44,91,3,0           // vbroadcastss  0x35b2c(%rip),%ymm8        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
   .byte  197,245,114,211,8                   // vpsrld        $0x8,%ymm3,%ymm1
   .byte  98,241,127,169,111,201              // vmovdqu8      %ymm1,%ymm1{%k1}{z}
@@ -4541,57 +4503,56 @@
   .byte  196,193,100,89,216                  // vmulps        %ymm8,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,229,239,219                     // vpxor         %ymm3,%ymm3,%ymm3
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,144                             // ja            49ee <_sk_load_8888_skx+0x22>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,139,0,0,0                 // lea           0x8b(%rip),%r10        # 4af4 <_sk_load_8888_skx+0x128>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,151                             // ja            48dc <_sk_load_8888_skx+0x1c>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,137,0,0,0                 // lea           0x89(%rip),%r9        # 49d8 <_sk_load_8888_skx+0x118>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,129,121,110,28,152              // vmovd         (%r8,%r11,4),%xmm3
-  .byte  233,113,255,255,255                 // jmpq          49ee <_sk_load_8888_skx+0x22>
-  .byte  196,129,121,110,68,152,8            // vmovd         0x8(%r8,%r11,4),%xmm0
+  .byte  196,193,121,110,28,144              // vmovd         (%r8,%rdx,4),%xmm3
+  .byte  233,121,255,255,255                 // jmpq          48dc <_sk_load_8888_skx+0x1c>
+  .byte  196,193,121,110,68,144,8            // vmovd         0x8(%r8,%rdx,4),%xmm0
   .byte  176,4                               // mov           $0x4,%al
   .byte  197,251,146,200                     // kmovd         %eax,%k1
   .byte  98,242,125,169,137,216              // vpexpandd     %ymm0,%ymm3{%k1}{z}
-  .byte  196,130,121,53,4,152                // vpmovzxdq     (%r8,%r11,4),%xmm0
+  .byte  196,194,121,53,4,144                // vpmovzxdq     (%r8,%rdx,4),%xmm0
   .byte  197,249,112,192,232                 // vpshufd       $0xe8,%xmm0,%xmm0
   .byte  196,227,101,2,216,3                 // vpblendd      $0x3,%ymm0,%ymm3,%ymm3
-  .byte  233,72,255,255,255                  // jmpq          49ee <_sk_load_8888_skx+0x22>
-  .byte  196,129,121,110,68,152,24           // vmovd         0x18(%r8,%r11,4),%xmm0
+  .byte  233,80,255,255,255                  // jmpq          48dc <_sk_load_8888_skx+0x1c>
+  .byte  196,193,121,110,68,144,24           // vmovd         0x18(%r8,%rdx,4),%xmm0
   .byte  176,64                              // mov           $0x40,%al
   .byte  197,251,146,200                     // kmovd         %eax,%k1
   .byte  98,242,125,169,137,216              // vpexpandd     %ymm0,%ymm3{%k1}{z}
   .byte  196,227,125,57,216,1                // vextracti128  $0x1,%ymm3,%xmm0
-  .byte  196,131,121,34,68,152,20,1          // vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm0,%xmm0
+  .byte  196,195,121,34,68,144,20,1          // vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm0,%xmm0
   .byte  196,227,101,56,216,1                // vinserti128   $0x1,%xmm0,%ymm3,%ymm3
   .byte  196,227,125,57,216,1                // vextracti128  $0x1,%ymm3,%xmm0
-  .byte  196,131,121,34,68,152,16,0          // vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm0,%xmm0
+  .byte  196,195,121,34,68,144,16,0          // vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm0,%xmm0
   .byte  196,227,101,56,216,1                // vinserti128   $0x1,%xmm0,%ymm3,%ymm3
-  .byte  196,129,122,111,4,152               // vmovdqu       (%r8,%r11,4),%xmm0
+  .byte  196,193,122,111,4,144               // vmovdqu       (%r8,%rdx,4),%xmm0
   .byte  196,227,125,2,219,240               // vpblendd      $0xf0,%ymm3,%ymm0,%ymm3
-  .byte  233,252,254,255,255                 // jmpq          49ee <_sk_load_8888_skx+0x22>
-  .byte  102,144                             // xchg          %ax,%ax
-  .byte  126,255                             // jle           4af5 <_sk_load_8888_skx+0x129>
-  .byte  255                                 // (bad)
-  .byte  255,156,255,255,255,137,255         // lcall         *-0x760001(%rdi,%rdi,8)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  237                                 // in            (%dx),%eax
+  .byte  233,4,255,255,255                   // jmpq          48dc <_sk_load_8888_skx+0x1c>
+  .byte  128,255,255                         // cmp           $0xff,%bh
+  .byte  255,158,255,255,255,139             // lcall         *-0x74000001(%rsi)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  217,255                             // fcos
+  .byte  239                                 // out           %eax,(%dx)
   .byte  255                                 // (bad)
-  .byte  255,197                             // inc           %ebp
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  219,255                             // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,199                             // inc           %edi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
-  .byte  178,255                             // mov           $0xff,%dl
+  .byte  180,255                             // mov           $0xff,%ah
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
@@ -4600,20 +4561,18 @@
 FUNCTION(_sk_load_8888_dst_skx)
 _sk_load_8888_dst_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,97                              // jne           4b8d <_sk_load_8888_dst_skx+0x7d>
-  .byte  196,129,126,111,60,152              // vmovdqu       (%r8,%r11,4),%ymm7
+  .byte  117,97                              // jne           4a6b <_sk_load_8888_dst_skx+0x77>
+  .byte  196,193,126,111,60,144              // vmovdqu       (%r8,%rdx,4),%ymm7
   .byte  184,17,17,17,17                     // mov           $0x11111111,%eax
   .byte  197,251,146,200                     // kmovd         %eax,%k1
   .byte  98,241,127,169,111,231              // vmovdqu8      %ymm7,%ymm4{%k1}{z}
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,98,125,24,5,166,96,3,0          // vbroadcastss  0x360a6(%rip),%ymm8        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,5,248,89,3,0          // vbroadcastss  0x359f8(%rip),%ymm8        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,193,92,89,224                   // vmulps        %ymm8,%ymm4,%ymm4
   .byte  197,213,114,215,8                   // vpsrld        $0x8,%ymm7,%ymm5
   .byte  98,241,127,169,111,237              // vmovdqu8      %ymm5,%ymm5{%k1}{z}
@@ -4628,57 +4587,56 @@
   .byte  196,193,68,89,248                   // vmulps        %ymm8,%ymm7,%ymm7
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,197,239,255                     // vpxor         %ymm7,%ymm7,%ymm7
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,144                             // ja            4b32 <_sk_load_8888_dst_skx+0x22>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,139,0,0,0                 // lea           0x8b(%rip),%r10        # 4c38 <_sk_load_8888_dst_skx+0x128>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,151                             // ja            4a10 <_sk_load_8888_dst_skx+0x1c>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,137,0,0,0                 // lea           0x89(%rip),%r9        # 4b0c <_sk_load_8888_dst_skx+0x118>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,129,121,110,60,152              // vmovd         (%r8,%r11,4),%xmm7
-  .byte  233,113,255,255,255                 // jmpq          4b32 <_sk_load_8888_dst_skx+0x22>
-  .byte  196,129,121,110,100,152,8           // vmovd         0x8(%r8,%r11,4),%xmm4
+  .byte  196,193,121,110,60,144              // vmovd         (%r8,%rdx,4),%xmm7
+  .byte  233,121,255,255,255                 // jmpq          4a10 <_sk_load_8888_dst_skx+0x1c>
+  .byte  196,193,121,110,100,144,8           // vmovd         0x8(%r8,%rdx,4),%xmm4
   .byte  176,4                               // mov           $0x4,%al
   .byte  197,251,146,200                     // kmovd         %eax,%k1
   .byte  98,242,125,169,137,252              // vpexpandd     %ymm4,%ymm7{%k1}{z}
-  .byte  196,130,121,53,36,152               // vpmovzxdq     (%r8,%r11,4),%xmm4
+  .byte  196,194,121,53,36,144               // vpmovzxdq     (%r8,%rdx,4),%xmm4
   .byte  197,249,112,228,232                 // vpshufd       $0xe8,%xmm4,%xmm4
   .byte  196,227,69,2,252,3                  // vpblendd      $0x3,%ymm4,%ymm7,%ymm7
-  .byte  233,72,255,255,255                  // jmpq          4b32 <_sk_load_8888_dst_skx+0x22>
-  .byte  196,129,121,110,100,152,24          // vmovd         0x18(%r8,%r11,4),%xmm4
+  .byte  233,80,255,255,255                  // jmpq          4a10 <_sk_load_8888_dst_skx+0x1c>
+  .byte  196,193,121,110,100,144,24          // vmovd         0x18(%r8,%rdx,4),%xmm4
   .byte  176,64                              // mov           $0x40,%al
   .byte  197,251,146,200                     // kmovd         %eax,%k1
   .byte  98,242,125,169,137,252              // vpexpandd     %ymm4,%ymm7{%k1}{z}
   .byte  196,227,125,57,252,1                // vextracti128  $0x1,%ymm7,%xmm4
-  .byte  196,131,89,34,100,152,20,1          // vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,20,1          // vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,227,69,56,252,1                 // vinserti128   $0x1,%xmm4,%ymm7,%ymm7
   .byte  196,227,125,57,252,1                // vextracti128  $0x1,%ymm7,%xmm4
-  .byte  196,131,89,34,100,152,16,0          // vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,16,0          // vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,227,69,56,252,1                 // vinserti128   $0x1,%xmm4,%ymm7,%ymm7
-  .byte  196,129,122,111,36,152              // vmovdqu       (%r8,%r11,4),%xmm4
+  .byte  196,193,122,111,36,144              // vmovdqu       (%r8,%rdx,4),%xmm4
   .byte  196,227,93,2,255,240                // vpblendd      $0xf0,%ymm7,%ymm4,%ymm7
-  .byte  233,252,254,255,255                 // jmpq          4b32 <_sk_load_8888_dst_skx+0x22>
-  .byte  102,144                             // xchg          %ax,%ax
-  .byte  126,255                             // jle           4c39 <_sk_load_8888_dst_skx+0x129>
-  .byte  255                                 // (bad)
-  .byte  255,156,255,255,255,137,255         // lcall         *-0x760001(%rdi,%rdi,8)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  237                                 // in            (%dx),%eax
+  .byte  233,4,255,255,255                   // jmpq          4a10 <_sk_load_8888_dst_skx+0x1c>
+  .byte  128,255,255                         // cmp           $0xff,%bh
+  .byte  255,158,255,255,255,139             // lcall         *-0x74000001(%rsi)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  217,255                             // fcos
+  .byte  239                                 // out           %eax,(%dx)
   .byte  255                                 // (bad)
-  .byte  255,197                             // inc           %ebp
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  219,255                             // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,199                             // inc           %edi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
-  .byte  178,255                             // mov           $0xff,%dl
+  .byte  180,255                             // mov           $0xff,%ah
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
@@ -4707,7 +4665,7 @@
   .byte  197,251,146,200                     // kmovd         %eax,%k1
   .byte  98,209,127,169,111,192              // vmovdqu8      %ymm8,%ymm0{%k1}{z}
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,29,57,95,3,0         // vbroadcastss  0x35f39(%rip),%ymm3        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,226,125,24,29,149,88,3,0        // vbroadcastss  0x35895(%rip),%ymm3        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  197,252,89,195                      // vmulps        %ymm3,%ymm0,%ymm0
   .byte  196,193,117,114,208,8               // vpsrld        $0x8,%ymm8,%ymm1
   .byte  98,241,127,169,111,201              // vmovdqu8      %ymm1,%ymm1{%k1}{z}
@@ -4728,17 +4686,15 @@
 FUNCTION(_sk_store_8888_skx)
 _sk_store_8888_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,60,95,200                       // vmaxps        %ymm0,%ymm8,%ymm9
-  .byte  196,98,125,24,21,89,94,3,0          // vbroadcastss  0x35e59(%rip),%ymm10        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,21,187,87,3,0         // vbroadcastss  0x357bb(%rip),%ymm10        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,52,93,202                    // vminps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,29,119,94,3,0         // vbroadcastss  0x35e77(%rip),%ymm11        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,98,125,24,29,217,87,3,0         // vbroadcastss  0x357d9(%rip),%ymm11        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   .byte  196,65,52,89,203                    // vmulps        %ymm11,%ymm9,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  197,60,95,225                       // vmaxps        %ymm1,%ymm8,%ymm12
@@ -4760,50 +4716,50 @@
   .byte  196,65,29,235,192                   // vpor          %ymm8,%ymm12,%ymm8
   .byte  196,65,53,235,192                   // vpor          %ymm8,%ymm9,%ymm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           4da4 <_sk_store_8888_skx+0xaa>
-  .byte  196,1,126,127,4,152                 // vmovdqu       %ymm8,(%r8,%r11,4)
+  .byte  117,10                              // jne           4c72 <_sk_store_8888_skx+0xa4>
+  .byte  196,65,126,127,4,144                // vmovdqu       %ymm8,(%r8,%rdx,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,235                             // ja            4da0 <_sk_store_8888_skx+0xa6>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,88,0,0,0                  // lea           0x58(%rip),%r10        # 4e18 <_sk_store_8888_skx+0x11e>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,242                             // ja            4c6e <_sk_store_8888_skx+0xa0>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,90,0,0,0                  // lea           0x5a(%rip),%r9        # 4ce0 <_sk_store_8888_skx+0x112>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,1,121,126,4,152                 // vmovd         %xmm8,(%r8,%r11,4)
-  .byte  235,207                             // jmp           4da0 <_sk_store_8888_skx+0xa6>
-  .byte  196,3,121,22,68,152,8,2             // vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
+  .byte  196,65,121,126,4,144                // vmovd         %xmm8,(%r8,%rdx,4)
+  .byte  235,215                             // jmp           4c6e <_sk_store_8888_skx+0xa0>
+  .byte  196,67,121,22,68,144,8,2            // vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
   .byte  196,66,121,53,192                   // vpmovzxdq     %xmm8,%xmm8
-  .byte  98,18,126,8,53,4,152                // vpmovqd       %xmm8,(%r8,%r11,4)
-  .byte  235,185                             // jmp           4da0 <_sk_store_8888_skx+0xa6>
+  .byte  98,82,126,8,53,4,144                // vpmovqd       %xmm8,(%r8,%rdx,4)
+  .byte  235,193                             // jmp           4c6e <_sk_store_8888_skx+0xa0>
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,24,2            // vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,24,2           // vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,20,1            // vpextrd       $0x1,%xmm9,0x14(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,20,1           // vpextrd       $0x1,%xmm9,0x14(%r8,%rdx,4)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,1,121,126,76,152,16             // vmovd         %xmm9,0x10(%r8,%r11,4)
-  .byte  196,1,122,127,4,152                 // vmovdqu       %xmm8,(%r8,%r11,4)
-  .byte  235,136                             // jmp           4da0 <_sk_store_8888_skx+0xa6>
-  .byte  177,255                             // mov           $0xff,%cl
-  .byte  255                                 // (bad)
-  .byte  255,193                             // inc           %ecx
+  .byte  196,65,121,126,76,144,16            // vmovd         %xmm9,0x10(%r8,%rdx,4)
+  .byte  196,65,122,127,4,144                // vmovdqu       %xmm8,(%r8,%rdx,4)
+  .byte  235,144                             // jmp           4c6e <_sk_store_8888_skx+0xa0>
+  .byte  102,144                             // xchg          %ax,%ax
+  .byte  175                                 // scas          %es:(%rdi),%eax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  185,255,255,255,248                 // mov           $0xf8ffffff,%ecx
+  .byte  191,255,255,255,183                 // mov           $0xb7ffffff,%edi
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,246                             // push          %rsi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  235,255                             // jmp           4e29 <_sk_store_8888_skx+0x12f>
+  .byte  233,255,255,255,219                 // jmpq          ffffffffdc004cf4 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffdbfcabf8>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  221,255                             // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,207                             // dec           %edi
+  .byte  255,205                             // dec           %ebp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -4813,20 +4769,18 @@
 FUNCTION(_sk_load_bgra_skx)
 _sk_load_bgra_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,97                              // jne           4eb1 <_sk_load_bgra_skx+0x7d>
-  .byte  196,129,126,111,28,152              // vmovdqu       (%r8,%r11,4),%ymm3
+  .byte  117,97                              // jne           4d73 <_sk_load_bgra_skx+0x77>
+  .byte  196,193,126,111,28,144              // vmovdqu       (%r8,%rdx,4),%ymm3
   .byte  184,17,17,17,17                     // mov           $0x11111111,%eax
   .byte  197,251,146,200                     // kmovd         %eax,%k1
   .byte  98,241,127,169,111,195              // vmovdqu8      %ymm3,%ymm0{%k1}{z}
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,5,130,93,3,0          // vbroadcastss  0x35d82(%rip),%ymm8        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,5,240,86,3,0          // vbroadcastss  0x356f0(%rip),%ymm8        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,193,124,89,208                  // vmulps        %ymm8,%ymm0,%ymm2
   .byte  197,253,114,211,8                   // vpsrld        $0x8,%ymm3,%ymm0
   .byte  98,241,127,169,111,192              // vmovdqu8      %ymm0,%ymm0{%k1}{z}
@@ -4841,57 +4795,56 @@
   .byte  196,193,100,89,216                  // vmulps        %ymm8,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,229,239,219                     // vpxor         %ymm3,%ymm3,%ymm3
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,144                             // ja            4e56 <_sk_load_bgra_skx+0x22>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,139,0,0,0                 // lea           0x8b(%rip),%r10        # 4f5c <_sk_load_bgra_skx+0x128>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,151                             // ja            4d18 <_sk_load_bgra_skx+0x1c>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,137,0,0,0                 // lea           0x89(%rip),%r9        # 4e14 <_sk_load_bgra_skx+0x118>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,129,121,110,28,152              // vmovd         (%r8,%r11,4),%xmm3
-  .byte  233,113,255,255,255                 // jmpq          4e56 <_sk_load_bgra_skx+0x22>
-  .byte  196,129,121,110,68,152,8            // vmovd         0x8(%r8,%r11,4),%xmm0
+  .byte  196,193,121,110,28,144              // vmovd         (%r8,%rdx,4),%xmm3
+  .byte  233,121,255,255,255                 // jmpq          4d18 <_sk_load_bgra_skx+0x1c>
+  .byte  196,193,121,110,68,144,8            // vmovd         0x8(%r8,%rdx,4),%xmm0
   .byte  176,4                               // mov           $0x4,%al
   .byte  197,251,146,200                     // kmovd         %eax,%k1
   .byte  98,242,125,169,137,216              // vpexpandd     %ymm0,%ymm3{%k1}{z}
-  .byte  196,130,121,53,4,152                // vpmovzxdq     (%r8,%r11,4),%xmm0
+  .byte  196,194,121,53,4,144                // vpmovzxdq     (%r8,%rdx,4),%xmm0
   .byte  197,249,112,192,232                 // vpshufd       $0xe8,%xmm0,%xmm0
   .byte  196,227,101,2,216,3                 // vpblendd      $0x3,%ymm0,%ymm3,%ymm3
-  .byte  233,72,255,255,255                  // jmpq          4e56 <_sk_load_bgra_skx+0x22>
-  .byte  196,129,121,110,68,152,24           // vmovd         0x18(%r8,%r11,4),%xmm0
+  .byte  233,80,255,255,255                  // jmpq          4d18 <_sk_load_bgra_skx+0x1c>
+  .byte  196,193,121,110,68,144,24           // vmovd         0x18(%r8,%rdx,4),%xmm0
   .byte  176,64                              // mov           $0x40,%al
   .byte  197,251,146,200                     // kmovd         %eax,%k1
   .byte  98,242,125,169,137,216              // vpexpandd     %ymm0,%ymm3{%k1}{z}
   .byte  196,227,125,57,216,1                // vextracti128  $0x1,%ymm3,%xmm0
-  .byte  196,131,121,34,68,152,20,1          // vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm0,%xmm0
+  .byte  196,195,121,34,68,144,20,1          // vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm0,%xmm0
   .byte  196,227,101,56,216,1                // vinserti128   $0x1,%xmm0,%ymm3,%ymm3
   .byte  196,227,125,57,216,1                // vextracti128  $0x1,%ymm3,%xmm0
-  .byte  196,131,121,34,68,152,16,0          // vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm0,%xmm0
+  .byte  196,195,121,34,68,144,16,0          // vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm0,%xmm0
   .byte  196,227,101,56,216,1                // vinserti128   $0x1,%xmm0,%ymm3,%ymm3
-  .byte  196,129,122,111,4,152               // vmovdqu       (%r8,%r11,4),%xmm0
+  .byte  196,193,122,111,4,144               // vmovdqu       (%r8,%rdx,4),%xmm0
   .byte  196,227,125,2,219,240               // vpblendd      $0xf0,%ymm3,%ymm0,%ymm3
-  .byte  233,252,254,255,255                 // jmpq          4e56 <_sk_load_bgra_skx+0x22>
-  .byte  102,144                             // xchg          %ax,%ax
-  .byte  126,255                             // jle           4f5d <_sk_load_bgra_skx+0x129>
-  .byte  255                                 // (bad)
-  .byte  255,156,255,255,255,137,255         // lcall         *-0x760001(%rdi,%rdi,8)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  237                                 // in            (%dx),%eax
+  .byte  233,4,255,255,255                   // jmpq          4d18 <_sk_load_bgra_skx+0x1c>
+  .byte  128,255,255                         // cmp           $0xff,%bh
+  .byte  255,158,255,255,255,139             // lcall         *-0x74000001(%rsi)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  217,255                             // fcos
+  .byte  239                                 // out           %eax,(%dx)
   .byte  255                                 // (bad)
-  .byte  255,197                             // inc           %ebp
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  219,255                             // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,199                             // inc           %edi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
-  .byte  178,255                             // mov           $0xff,%dl
+  .byte  180,255                             // mov           $0xff,%ah
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
@@ -4900,20 +4853,18 @@
 FUNCTION(_sk_load_bgra_dst_skx)
 _sk_load_bgra_dst_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,97                              // jne           4ff5 <_sk_load_bgra_dst_skx+0x7d>
-  .byte  196,129,126,111,60,152              // vmovdqu       (%r8,%r11,4),%ymm7
+  .byte  117,97                              // jne           4ea7 <_sk_load_bgra_dst_skx+0x77>
+  .byte  196,193,126,111,60,144              // vmovdqu       (%r8,%rdx,4),%ymm7
   .byte  184,17,17,17,17                     // mov           $0x11111111,%eax
   .byte  197,251,146,200                     // kmovd         %eax,%k1
   .byte  98,241,127,169,111,231              // vmovdqu8      %ymm7,%ymm4{%k1}{z}
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,98,125,24,5,62,92,3,0           // vbroadcastss  0x35c3e(%rip),%ymm8        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,5,188,85,3,0          // vbroadcastss  0x355bc(%rip),%ymm8        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,193,92,89,240                   // vmulps        %ymm8,%ymm4,%ymm6
   .byte  197,221,114,215,8                   // vpsrld        $0x8,%ymm7,%ymm4
   .byte  98,241,127,169,111,228              // vmovdqu8      %ymm4,%ymm4{%k1}{z}
@@ -4928,57 +4879,56 @@
   .byte  196,193,68,89,248                   // vmulps        %ymm8,%ymm7,%ymm7
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,197,239,255                     // vpxor         %ymm7,%ymm7,%ymm7
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,144                             // ja            4f9a <_sk_load_bgra_dst_skx+0x22>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,139,0,0,0                 // lea           0x8b(%rip),%r10        # 50a0 <_sk_load_bgra_dst_skx+0x128>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,151                             // ja            4e4c <_sk_load_bgra_dst_skx+0x1c>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,137,0,0,0                 // lea           0x89(%rip),%r9        # 4f48 <_sk_load_bgra_dst_skx+0x118>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,129,121,110,60,152              // vmovd         (%r8,%r11,4),%xmm7
-  .byte  233,113,255,255,255                 // jmpq          4f9a <_sk_load_bgra_dst_skx+0x22>
-  .byte  196,129,121,110,100,152,8           // vmovd         0x8(%r8,%r11,4),%xmm4
+  .byte  196,193,121,110,60,144              // vmovd         (%r8,%rdx,4),%xmm7
+  .byte  233,121,255,255,255                 // jmpq          4e4c <_sk_load_bgra_dst_skx+0x1c>
+  .byte  196,193,121,110,100,144,8           // vmovd         0x8(%r8,%rdx,4),%xmm4
   .byte  176,4                               // mov           $0x4,%al
   .byte  197,251,146,200                     // kmovd         %eax,%k1
   .byte  98,242,125,169,137,252              // vpexpandd     %ymm4,%ymm7{%k1}{z}
-  .byte  196,130,121,53,36,152               // vpmovzxdq     (%r8,%r11,4),%xmm4
+  .byte  196,194,121,53,36,144               // vpmovzxdq     (%r8,%rdx,4),%xmm4
   .byte  197,249,112,228,232                 // vpshufd       $0xe8,%xmm4,%xmm4
   .byte  196,227,69,2,252,3                  // vpblendd      $0x3,%ymm4,%ymm7,%ymm7
-  .byte  233,72,255,255,255                  // jmpq          4f9a <_sk_load_bgra_dst_skx+0x22>
-  .byte  196,129,121,110,100,152,24          // vmovd         0x18(%r8,%r11,4),%xmm4
+  .byte  233,80,255,255,255                  // jmpq          4e4c <_sk_load_bgra_dst_skx+0x1c>
+  .byte  196,193,121,110,100,144,24          // vmovd         0x18(%r8,%rdx,4),%xmm4
   .byte  176,64                              // mov           $0x40,%al
   .byte  197,251,146,200                     // kmovd         %eax,%k1
   .byte  98,242,125,169,137,252              // vpexpandd     %ymm4,%ymm7{%k1}{z}
   .byte  196,227,125,57,252,1                // vextracti128  $0x1,%ymm7,%xmm4
-  .byte  196,131,89,34,100,152,20,1          // vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,20,1          // vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,227,69,56,252,1                 // vinserti128   $0x1,%xmm4,%ymm7,%ymm7
   .byte  196,227,125,57,252,1                // vextracti128  $0x1,%ymm7,%xmm4
-  .byte  196,131,89,34,100,152,16,0          // vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,16,0          // vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,227,69,56,252,1                 // vinserti128   $0x1,%xmm4,%ymm7,%ymm7
-  .byte  196,129,122,111,36,152              // vmovdqu       (%r8,%r11,4),%xmm4
+  .byte  196,193,122,111,36,144              // vmovdqu       (%r8,%rdx,4),%xmm4
   .byte  196,227,93,2,255,240                // vpblendd      $0xf0,%ymm7,%ymm4,%ymm7
-  .byte  233,252,254,255,255                 // jmpq          4f9a <_sk_load_bgra_dst_skx+0x22>
-  .byte  102,144                             // xchg          %ax,%ax
-  .byte  126,255                             // jle           50a1 <_sk_load_bgra_dst_skx+0x129>
-  .byte  255                                 // (bad)
-  .byte  255,156,255,255,255,137,255         // lcall         *-0x760001(%rdi,%rdi,8)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  237                                 // in            (%dx),%eax
+  .byte  233,4,255,255,255                   // jmpq          4e4c <_sk_load_bgra_dst_skx+0x1c>
+  .byte  128,255,255                         // cmp           $0xff,%bh
+  .byte  255,158,255,255,255,139             // lcall         *-0x74000001(%rsi)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  217,255                             // fcos
+  .byte  239                                 // out           %eax,(%dx)
   .byte  255                                 // (bad)
-  .byte  255,197                             // inc           %ebp
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  219,255                             // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,199                             // inc           %edi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
-  .byte  178,255                             // mov           $0xff,%dl
+  .byte  180,255                             // mov           $0xff,%ah
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
@@ -5007,7 +4957,7 @@
   .byte  197,251,146,200                     // kmovd         %eax,%k1
   .byte  98,209,127,169,111,192              // vmovdqu8      %ymm8,%ymm0{%k1}{z}
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,29,209,90,3,0        // vbroadcastss  0x35ad1(%rip),%ymm3        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,226,125,24,29,89,84,3,0         // vbroadcastss  0x35459(%rip),%ymm3        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  197,252,89,211                      // vmulps        %ymm3,%ymm0,%ymm2
   .byte  196,193,125,114,208,8               // vpsrld        $0x8,%ymm8,%ymm0
   .byte  98,241,127,169,111,192              // vmovdqu8      %ymm0,%ymm0{%k1}{z}
@@ -5028,17 +4978,15 @@
 FUNCTION(_sk_store_bgra_skx)
 _sk_store_bgra_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,60,95,202                       // vmaxps        %ymm2,%ymm8,%ymm9
-  .byte  196,98,125,24,21,241,89,3,0         // vbroadcastss  0x359f1(%rip),%ymm10        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,21,127,83,3,0         // vbroadcastss  0x3537f(%rip),%ymm10        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,52,93,202                    // vminps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,29,15,90,3,0          // vbroadcastss  0x35a0f(%rip),%ymm11        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,98,125,24,29,157,83,3,0         // vbroadcastss  0x3539d(%rip),%ymm11        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   .byte  196,65,52,89,203                    // vmulps        %ymm11,%ymm9,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  197,60,95,225                       // vmaxps        %ymm1,%ymm8,%ymm12
@@ -5060,50 +5008,50 @@
   .byte  196,65,29,235,192                   // vpor          %ymm8,%ymm12,%ymm8
   .byte  196,65,53,235,192                   // vpor          %ymm8,%ymm9,%ymm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           520c <_sk_store_bgra_skx+0xaa>
-  .byte  196,1,126,127,4,152                 // vmovdqu       %ymm8,(%r8,%r11,4)
+  .byte  117,10                              // jne           50ae <_sk_store_bgra_skx+0xa4>
+  .byte  196,65,126,127,4,144                // vmovdqu       %ymm8,(%r8,%rdx,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  65,128,193,255                      // add           $0xff,%r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,235                             // ja            5208 <_sk_store_bgra_skx+0xa6>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,88,0,0,0                  // lea           0x58(%rip),%r10        # 5280 <_sk_store_bgra_skx+0x11e>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  4,255                               // add           $0xff,%al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,242                             // ja            50aa <_sk_store_bgra_skx+0xa0>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,90,0,0,0                  // lea           0x5a(%rip),%r9        # 511c <_sk_store_bgra_skx+0x112>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,1,121,126,4,152                 // vmovd         %xmm8,(%r8,%r11,4)
-  .byte  235,207                             // jmp           5208 <_sk_store_bgra_skx+0xa6>
-  .byte  196,3,121,22,68,152,8,2             // vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
+  .byte  196,65,121,126,4,144                // vmovd         %xmm8,(%r8,%rdx,4)
+  .byte  235,215                             // jmp           50aa <_sk_store_bgra_skx+0xa0>
+  .byte  196,67,121,22,68,144,8,2            // vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
   .byte  196,66,121,53,192                   // vpmovzxdq     %xmm8,%xmm8
-  .byte  98,18,126,8,53,4,152                // vpmovqd       %xmm8,(%r8,%r11,4)
-  .byte  235,185                             // jmp           5208 <_sk_store_bgra_skx+0xa6>
+  .byte  98,82,126,8,53,4,144                // vpmovqd       %xmm8,(%r8,%rdx,4)
+  .byte  235,193                             // jmp           50aa <_sk_store_bgra_skx+0xa0>
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,24,2            // vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,24,2           // vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,20,1            // vpextrd       $0x1,%xmm9,0x14(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,20,1           // vpextrd       $0x1,%xmm9,0x14(%r8,%rdx,4)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,1,121,126,76,152,16             // vmovd         %xmm9,0x10(%r8,%r11,4)
-  .byte  196,1,122,127,4,152                 // vmovdqu       %xmm8,(%r8,%r11,4)
-  .byte  235,136                             // jmp           5208 <_sk_store_bgra_skx+0xa6>
-  .byte  177,255                             // mov           $0xff,%cl
-  .byte  255                                 // (bad)
-  .byte  255,193                             // inc           %ecx
+  .byte  196,65,121,126,76,144,16            // vmovd         %xmm9,0x10(%r8,%rdx,4)
+  .byte  196,65,122,127,4,144                // vmovdqu       %xmm8,(%r8,%rdx,4)
+  .byte  235,144                             // jmp           50aa <_sk_store_bgra_skx+0xa0>
+  .byte  102,144                             // xchg          %ax,%ax
+  .byte  175                                 // scas          %es:(%rdi),%eax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  185,255,255,255,248                 // mov           $0xf8ffffff,%ecx
+  .byte  191,255,255,255,183                 // mov           $0xb7ffffff,%edi
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,246                             // push          %rsi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  235,255                             // jmp           5291 <_sk_store_bgra_skx+0x12f>
+  .byte  233,255,255,255,219                 // jmpq          ffffffffdc005130 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffdbfcb034>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  221,255                             // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,207                             // dec           %edi
+  .byte  255,205                             // dec           %ebp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -5113,18 +5061,16 @@
 FUNCTION(_sk_load_f16_skx)
 _sk_load_f16_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,3                        // shl           $0x3,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,101                             // jne           531d <_sk_load_f16_skx+0x81>
-  .byte  196,65,121,16,4,192                 // vmovupd       (%r8,%rax,8),%xmm8
-  .byte  196,193,121,16,84,192,16            // vmovupd       0x10(%r8,%rax,8),%xmm2
-  .byte  196,193,121,16,76,192,32            // vmovupd       0x20(%r8,%rax,8),%xmm1
-  .byte  196,65,122,111,76,192,48            // vmovdqu       0x30(%r8,%rax,8),%xmm9
+  .byte  117,101                             // jne           51b3 <_sk_load_f16_skx+0x7b>
+  .byte  196,65,121,16,4,208                 // vmovupd       (%r8,%rdx,8),%xmm8
+  .byte  196,193,121,16,84,208,16            // vmovupd       0x10(%r8,%rdx,8),%xmm2
+  .byte  196,193,121,16,76,208,32            // vmovupd       0x20(%r8,%rdx,8),%xmm1
+  .byte  196,65,122,111,76,208,48            // vmovdqu       0x30(%r8,%rdx,8),%xmm9
   .byte  197,185,97,194                      // vpunpcklwd    %xmm2,%xmm8,%xmm0
   .byte  197,185,105,210                     // vpunpckhwd    %xmm2,%xmm8,%xmm2
   .byte  196,65,113,97,193                   // vpunpcklwd    %xmm9,%xmm1,%xmm8
@@ -5143,50 +5089,48 @@
   .byte  196,226,125,19,219                  // vcvtph2ps     %xmm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,65,123,16,4,192                 // vmovsd        (%r8,%rax,8),%xmm8
+  .byte  196,65,123,16,4,208                 // vmovsd        (%r8,%rdx,8),%xmm8
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,85                              // je            5383 <_sk_load_f16_skx+0xe7>
-  .byte  196,65,57,22,68,192,8               // vmovhpd       0x8(%r8,%rax,8),%xmm8,%xmm8
+  .byte  116,85                              // je            5219 <_sk_load_f16_skx+0xe1>
+  .byte  196,65,57,22,68,208,8               // vmovhpd       0x8(%r8,%rdx,8),%xmm8,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,72                              // jb            5383 <_sk_load_f16_skx+0xe7>
-  .byte  196,193,123,16,84,192,16            // vmovsd        0x10(%r8,%rax,8),%xmm2
+  .byte  114,72                              // jb            5219 <_sk_load_f16_skx+0xe1>
+  .byte  196,193,123,16,84,208,16            // vmovsd        0x10(%r8,%rdx,8),%xmm2
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  116,72                              // je            5390 <_sk_load_f16_skx+0xf4>
-  .byte  196,193,105,22,84,192,24            // vmovhpd       0x18(%r8,%rax,8),%xmm2,%xmm2
+  .byte  116,72                              // je            5226 <_sk_load_f16_skx+0xee>
+  .byte  196,193,105,22,84,208,24            // vmovhpd       0x18(%r8,%rdx,8),%xmm2,%xmm2
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,59                              // jb            5390 <_sk_load_f16_skx+0xf4>
-  .byte  196,193,123,16,76,192,32            // vmovsd        0x20(%r8,%rax,8),%xmm1
+  .byte  114,59                              // jb            5226 <_sk_load_f16_skx+0xee>
+  .byte  196,193,123,16,76,208,32            // vmovsd        0x20(%r8,%rdx,8),%xmm1
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  15,132,109,255,255,255              // je            52d3 <_sk_load_f16_skx+0x37>
-  .byte  196,193,113,22,76,192,40            // vmovhpd       0x28(%r8,%rax,8),%xmm1,%xmm1
+  .byte  15,132,109,255,255,255              // je            5169 <_sk_load_f16_skx+0x31>
+  .byte  196,193,113,22,76,208,40            // vmovhpd       0x28(%r8,%rdx,8),%xmm1,%xmm1
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,130,92,255,255,255               // jb            52d3 <_sk_load_f16_skx+0x37>
-  .byte  196,65,122,126,76,192,48            // vmovq         0x30(%r8,%rax,8),%xmm9
-  .byte  233,80,255,255,255                  // jmpq          52d3 <_sk_load_f16_skx+0x37>
+  .byte  15,130,92,255,255,255               // jb            5169 <_sk_load_f16_skx+0x31>
+  .byte  196,65,122,126,76,208,48            // vmovq         0x30(%r8,%rdx,8),%xmm9
+  .byte  233,80,255,255,255                  // jmpq          5169 <_sk_load_f16_skx+0x31>
   .byte  197,241,87,201                      // vxorpd        %xmm1,%xmm1,%xmm1
   .byte  197,233,87,210                      // vxorpd        %xmm2,%xmm2,%xmm2
-  .byte  233,67,255,255,255                  // jmpq          52d3 <_sk_load_f16_skx+0x37>
+  .byte  233,67,255,255,255                  // jmpq          5169 <_sk_load_f16_skx+0x31>
   .byte  197,241,87,201                      // vxorpd        %xmm1,%xmm1,%xmm1
-  .byte  233,58,255,255,255                  // jmpq          52d3 <_sk_load_f16_skx+0x37>
+  .byte  233,58,255,255,255                  // jmpq          5169 <_sk_load_f16_skx+0x31>
 
 HIDDEN _sk_load_f16_dst_skx
 .globl _sk_load_f16_dst_skx
 FUNCTION(_sk_load_f16_dst_skx)
 _sk_load_f16_dst_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,3                        // shl           $0x3,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,101                             // jne           541a <_sk_load_f16_dst_skx+0x81>
-  .byte  196,65,121,16,4,192                 // vmovupd       (%r8,%rax,8),%xmm8
-  .byte  196,193,121,16,116,192,16           // vmovupd       0x10(%r8,%rax,8),%xmm6
-  .byte  196,193,121,16,108,192,32           // vmovupd       0x20(%r8,%rax,8),%xmm5
-  .byte  196,65,122,111,76,192,48            // vmovdqu       0x30(%r8,%rax,8),%xmm9
+  .byte  117,101                             // jne           52aa <_sk_load_f16_dst_skx+0x7b>
+  .byte  196,65,121,16,4,208                 // vmovupd       (%r8,%rdx,8),%xmm8
+  .byte  196,193,121,16,116,208,16           // vmovupd       0x10(%r8,%rdx,8),%xmm6
+  .byte  196,193,121,16,108,208,32           // vmovupd       0x20(%r8,%rdx,8),%xmm5
+  .byte  196,65,122,111,76,208,48            // vmovdqu       0x30(%r8,%rdx,8),%xmm9
   .byte  197,185,97,230                      // vpunpcklwd    %xmm6,%xmm8,%xmm4
   .byte  197,185,105,246                     // vpunpckhwd    %xmm6,%xmm8,%xmm6
   .byte  196,65,81,97,193                    // vpunpcklwd    %xmm9,%xmm5,%xmm8
@@ -5205,32 +5149,32 @@
   .byte  196,226,125,19,255                  // vcvtph2ps     %xmm7,%ymm7
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,65,123,16,4,192                 // vmovsd        (%r8,%rax,8),%xmm8
+  .byte  196,65,123,16,4,208                 // vmovsd        (%r8,%rdx,8),%xmm8
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,85                              // je            5480 <_sk_load_f16_dst_skx+0xe7>
-  .byte  196,65,57,22,68,192,8               // vmovhpd       0x8(%r8,%rax,8),%xmm8,%xmm8
+  .byte  116,85                              // je            5310 <_sk_load_f16_dst_skx+0xe1>
+  .byte  196,65,57,22,68,208,8               // vmovhpd       0x8(%r8,%rdx,8),%xmm8,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,72                              // jb            5480 <_sk_load_f16_dst_skx+0xe7>
-  .byte  196,193,123,16,116,192,16           // vmovsd        0x10(%r8,%rax,8),%xmm6
+  .byte  114,72                              // jb            5310 <_sk_load_f16_dst_skx+0xe1>
+  .byte  196,193,123,16,116,208,16           // vmovsd        0x10(%r8,%rdx,8),%xmm6
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  116,72                              // je            548d <_sk_load_f16_dst_skx+0xf4>
-  .byte  196,193,73,22,116,192,24            // vmovhpd       0x18(%r8,%rax,8),%xmm6,%xmm6
+  .byte  116,72                              // je            531d <_sk_load_f16_dst_skx+0xee>
+  .byte  196,193,73,22,116,208,24            // vmovhpd       0x18(%r8,%rdx,8),%xmm6,%xmm6
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,59                              // jb            548d <_sk_load_f16_dst_skx+0xf4>
-  .byte  196,193,123,16,108,192,32           // vmovsd        0x20(%r8,%rax,8),%xmm5
+  .byte  114,59                              // jb            531d <_sk_load_f16_dst_skx+0xee>
+  .byte  196,193,123,16,108,208,32           // vmovsd        0x20(%r8,%rdx,8),%xmm5
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  15,132,109,255,255,255              // je            53d0 <_sk_load_f16_dst_skx+0x37>
-  .byte  196,193,81,22,108,192,40            // vmovhpd       0x28(%r8,%rax,8),%xmm5,%xmm5
+  .byte  15,132,109,255,255,255              // je            5260 <_sk_load_f16_dst_skx+0x31>
+  .byte  196,193,81,22,108,208,40            // vmovhpd       0x28(%r8,%rdx,8),%xmm5,%xmm5
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,130,92,255,255,255               // jb            53d0 <_sk_load_f16_dst_skx+0x37>
-  .byte  196,65,122,126,76,192,48            // vmovq         0x30(%r8,%rax,8),%xmm9
-  .byte  233,80,255,255,255                  // jmpq          53d0 <_sk_load_f16_dst_skx+0x37>
+  .byte  15,130,92,255,255,255               // jb            5260 <_sk_load_f16_dst_skx+0x31>
+  .byte  196,65,122,126,76,208,48            // vmovq         0x30(%r8,%rdx,8),%xmm9
+  .byte  233,80,255,255,255                  // jmpq          5260 <_sk_load_f16_dst_skx+0x31>
   .byte  197,209,87,237                      // vxorpd        %xmm5,%xmm5,%xmm5
   .byte  197,201,87,246                      // vxorpd        %xmm6,%xmm6,%xmm6
-  .byte  233,67,255,255,255                  // jmpq          53d0 <_sk_load_f16_dst_skx+0x37>
+  .byte  233,67,255,255,255                  // jmpq          5260 <_sk_load_f16_dst_skx+0x31>
   .byte  197,209,87,237                      // vxorpd        %xmm5,%xmm5,%xmm5
-  .byte  233,58,255,255,255                  // jmpq          53d0 <_sk_load_f16_dst_skx+0x37>
+  .byte  233,58,255,255,255                  // jmpq          5260 <_sk_load_f16_dst_skx+0x31>
 
 HIDDEN _sk_gather_f16_skx
 .globl _sk_gather_f16_skx
@@ -5286,15 +5230,13 @@
 FUNCTION(_sk_store_f16_skx)
 _sk_store_f16_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,3                        // shl           $0x3,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
   .byte  196,195,125,29,192,4                // vcvtps2ph     $0x4,%ymm0,%xmm8
   .byte  196,195,125,29,201,4                // vcvtps2ph     $0x4,%ymm1,%xmm9
   .byte  196,195,125,29,210,4                // vcvtps2ph     $0x4,%ymm2,%xmm10
-  .byte  72,99,194                           // movslq        %edx,%rax
+  .byte  76,3,0                              // add           (%rax),%r8
   .byte  196,195,125,29,219,4                // vcvtps2ph     $0x4,%ymm3,%xmm11
   .byte  196,65,57,97,225                    // vpunpcklwd    %xmm9,%xmm8,%xmm12
   .byte  196,65,57,105,193                   // vpunpckhwd    %xmm9,%xmm8,%xmm8
@@ -5305,50 +5247,48 @@
   .byte  196,65,57,98,205                    // vpunpckldq    %xmm13,%xmm8,%xmm9
   .byte  196,65,57,106,197                   // vpunpckhdq    %xmm13,%xmm8,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,31                              // jne           55db <_sk_store_f16_skx+0x7b>
-  .byte  196,65,122,127,28,192               // vmovdqu       %xmm11,(%r8,%rax,8)
-  .byte  196,65,122,127,84,192,16            // vmovdqu       %xmm10,0x10(%r8,%rax,8)
-  .byte  196,65,122,127,76,192,32            // vmovdqu       %xmm9,0x20(%r8,%rax,8)
-  .byte  196,65,122,127,68,192,48            // vmovdqu       %xmm8,0x30(%r8,%rax,8)
+  .byte  117,31                              // jne           5465 <_sk_store_f16_skx+0x75>
+  .byte  196,65,122,127,28,208               // vmovdqu       %xmm11,(%r8,%rdx,8)
+  .byte  196,65,122,127,84,208,16            // vmovdqu       %xmm10,0x10(%r8,%rdx,8)
+  .byte  196,65,122,127,76,208,32            // vmovdqu       %xmm9,0x20(%r8,%rdx,8)
+  .byte  196,65,122,127,68,208,48            // vmovdqu       %xmm8,0x30(%r8,%rdx,8)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,65,121,214,28,192               // vmovq         %xmm11,(%r8,%rax,8)
+  .byte  196,65,121,214,28,208               // vmovq         %xmm11,(%r8,%rdx,8)
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,240                             // je            55d7 <_sk_store_f16_skx+0x77>
-  .byte  196,65,121,23,92,192,8              // vmovhpd       %xmm11,0x8(%r8,%rax,8)
+  .byte  116,240                             // je            5461 <_sk_store_f16_skx+0x71>
+  .byte  196,65,121,23,92,208,8              // vmovhpd       %xmm11,0x8(%r8,%rdx,8)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,227                             // jb            55d7 <_sk_store_f16_skx+0x77>
-  .byte  196,65,121,214,84,192,16            // vmovq         %xmm10,0x10(%r8,%rax,8)
-  .byte  116,218                             // je            55d7 <_sk_store_f16_skx+0x77>
-  .byte  196,65,121,23,84,192,24             // vmovhpd       %xmm10,0x18(%r8,%rax,8)
+  .byte  114,227                             // jb            5461 <_sk_store_f16_skx+0x71>
+  .byte  196,65,121,214,84,208,16            // vmovq         %xmm10,0x10(%r8,%rdx,8)
+  .byte  116,218                             // je            5461 <_sk_store_f16_skx+0x71>
+  .byte  196,65,121,23,84,208,24             // vmovhpd       %xmm10,0x18(%r8,%rdx,8)
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,205                             // jb            55d7 <_sk_store_f16_skx+0x77>
-  .byte  196,65,121,214,76,192,32            // vmovq         %xmm9,0x20(%r8,%rax,8)
-  .byte  116,196                             // je            55d7 <_sk_store_f16_skx+0x77>
-  .byte  196,65,121,23,76,192,40             // vmovhpd       %xmm9,0x28(%r8,%rax,8)
+  .byte  114,205                             // jb            5461 <_sk_store_f16_skx+0x71>
+  .byte  196,65,121,214,76,208,32            // vmovq         %xmm9,0x20(%r8,%rdx,8)
+  .byte  116,196                             // je            5461 <_sk_store_f16_skx+0x71>
+  .byte  196,65,121,23,76,208,40             // vmovhpd       %xmm9,0x28(%r8,%rdx,8)
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,183                             // jb            55d7 <_sk_store_f16_skx+0x77>
-  .byte  196,65,121,214,68,192,48            // vmovq         %xmm8,0x30(%r8,%rax,8)
-  .byte  235,174                             // jmp           55d7 <_sk_store_f16_skx+0x77>
+  .byte  114,183                             // jb            5461 <_sk_store_f16_skx+0x71>
+  .byte  196,65,121,214,68,208,48            // vmovq         %xmm8,0x30(%r8,%rdx,8)
+  .byte  235,174                             // jmp           5461 <_sk_store_f16_skx+0x71>
 
 HIDDEN _sk_load_u16_be_skx
 .globl _sk_load_u16_be_skx
 FUNCTION(_sk_load_u16_be_skx)
 _sk_load_u16_be_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
+  .byte  76,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  73,99,193                           // movslq        %r9d,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,204,0,0,0                    // jne           571c <_sk_load_u16_be_skx+0xf3>
-  .byte  196,65,121,16,4,64                  // vmovupd       (%r8,%rax,2),%xmm8
-  .byte  196,193,121,16,84,64,16             // vmovupd       0x10(%r8,%rax,2),%xmm2
-  .byte  196,193,121,16,92,64,32             // vmovupd       0x20(%r8,%rax,2),%xmm3
-  .byte  196,65,122,111,76,64,48             // vmovdqu       0x30(%r8,%rax,2),%xmm9
+  .byte  15,133,204,0,0,0                    // jne           55a0 <_sk_load_u16_be_skx+0xed>
+  .byte  196,1,121,16,4,72                   // vmovupd       (%r8,%r9,2),%xmm8
+  .byte  196,129,121,16,84,72,16             // vmovupd       0x10(%r8,%r9,2),%xmm2
+  .byte  196,129,121,16,92,72,32             // vmovupd       0x20(%r8,%r9,2),%xmm3
+  .byte  196,1,122,111,76,72,48              // vmovdqu       0x30(%r8,%r9,2),%xmm9
   .byte  197,185,97,194                      // vpunpcklwd    %xmm2,%xmm8,%xmm0
   .byte  197,185,105,210                     // vpunpckhwd    %xmm2,%xmm8,%xmm2
   .byte  196,193,97,97,201                   // vpunpcklwd    %xmm9,%xmm3,%xmm1
@@ -5363,7 +5303,7 @@
   .byte  197,241,235,192                     // vpor          %xmm0,%xmm1,%xmm0
   .byte  196,226,125,51,192                  // vpmovzxwd     %xmm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,21,95,85,3,0          // vbroadcastss  0x3555f(%rip),%ymm10        # 3ac10 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
+  .byte  196,98,125,24,21,11,79,3,0          // vbroadcastss  0x34f0b(%rip),%ymm10        # 3a440 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
   .byte  196,193,124,89,194                  // vmulps        %ymm10,%ymm0,%ymm0
   .byte  197,185,109,202                     // vpunpckhqdq   %xmm2,%xmm8,%xmm1
   .byte  197,233,113,241,8                   // vpsllw        $0x8,%xmm1,%xmm2
@@ -5388,53 +5328,49 @@
   .byte  196,193,100,89,218                  // vmulps        %ymm10,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,65,123,16,4,64                  // vmovsd        (%r8,%rax,2),%xmm8
+  .byte  196,1,123,16,4,72                   // vmovsd        (%r8,%r9,2),%xmm8
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,85                              // je            5782 <_sk_load_u16_be_skx+0x159>
-  .byte  196,65,57,22,68,64,8                // vmovhpd       0x8(%r8,%rax,2),%xmm8,%xmm8
+  .byte  116,85                              // je            5606 <_sk_load_u16_be_skx+0x153>
+  .byte  196,1,57,22,68,72,8                 // vmovhpd       0x8(%r8,%r9,2),%xmm8,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,72                              // jb            5782 <_sk_load_u16_be_skx+0x159>
-  .byte  196,193,123,16,84,64,16             // vmovsd        0x10(%r8,%rax,2),%xmm2
+  .byte  114,72                              // jb            5606 <_sk_load_u16_be_skx+0x153>
+  .byte  196,129,123,16,84,72,16             // vmovsd        0x10(%r8,%r9,2),%xmm2
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  116,72                              // je            578f <_sk_load_u16_be_skx+0x166>
-  .byte  196,193,105,22,84,64,24             // vmovhpd       0x18(%r8,%rax,2),%xmm2,%xmm2
+  .byte  116,72                              // je            5613 <_sk_load_u16_be_skx+0x160>
+  .byte  196,129,105,22,84,72,24             // vmovhpd       0x18(%r8,%r9,2),%xmm2,%xmm2
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,59                              // jb            578f <_sk_load_u16_be_skx+0x166>
-  .byte  196,193,123,16,92,64,32             // vmovsd        0x20(%r8,%rax,2),%xmm3
+  .byte  114,59                              // jb            5613 <_sk_load_u16_be_skx+0x160>
+  .byte  196,129,123,16,92,72,32             // vmovsd        0x20(%r8,%r9,2),%xmm3
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  15,132,6,255,255,255                // je            566b <_sk_load_u16_be_skx+0x42>
-  .byte  196,193,97,22,92,64,40              // vmovhpd       0x28(%r8,%rax,2),%xmm3,%xmm3
+  .byte  15,132,6,255,255,255                // je            54ef <_sk_load_u16_be_skx+0x3c>
+  .byte  196,129,97,22,92,72,40              // vmovhpd       0x28(%r8,%r9,2),%xmm3,%xmm3
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,130,245,254,255,255              // jb            566b <_sk_load_u16_be_skx+0x42>
-  .byte  196,65,122,126,76,64,48             // vmovq         0x30(%r8,%rax,2),%xmm9
-  .byte  233,233,254,255,255                 // jmpq          566b <_sk_load_u16_be_skx+0x42>
+  .byte  15,130,245,254,255,255              // jb            54ef <_sk_load_u16_be_skx+0x3c>
+  .byte  196,1,122,126,76,72,48              // vmovq         0x30(%r8,%r9,2),%xmm9
+  .byte  233,233,254,255,255                 // jmpq          54ef <_sk_load_u16_be_skx+0x3c>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
   .byte  197,233,87,210                      // vxorpd        %xmm2,%xmm2,%xmm2
-  .byte  233,220,254,255,255                 // jmpq          566b <_sk_load_u16_be_skx+0x42>
+  .byte  233,220,254,255,255                 // jmpq          54ef <_sk_load_u16_be_skx+0x3c>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
-  .byte  233,211,254,255,255                 // jmpq          566b <_sk_load_u16_be_skx+0x42>
+  .byte  233,211,254,255,255                 // jmpq          54ef <_sk_load_u16_be_skx+0x3c>
 
 HIDDEN _sk_load_rgb_u16_be_skx
 .globl _sk_load_rgb_u16_be_skx
 FUNCTION(_sk_load_rgb_u16_be_skx)
 _sk_load_rgb_u16_be_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
+  .byte  76,141,12,82                        // lea           (%rdx,%rdx,2),%r9
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,137,208                          // mov           %rdx,%rax
-  .byte  72,193,224,32                       // shl           $0x20,%rax
-  .byte  72,141,4,64                         // lea           (%rax,%rax,2),%rax
-  .byte  72,193,248,32                       // sar           $0x20,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,202,0,0,0                    // jne           588d <_sk_load_rgb_u16_be_skx+0xf5>
-  .byte  196,65,121,16,28,64                 // vmovupd       (%r8,%rax,2),%xmm11
-  .byte  196,193,121,16,92,64,12             // vmovupd       0xc(%r8,%rax,2),%xmm3
-  .byte  196,193,121,16,84,64,24             // vmovupd       0x18(%r8,%rax,2),%xmm2
-  .byte  98,209,125,8,115,92,64,2,4          // vpsrldq       $0x4,0x20(%r8,%rax,2),%xmm0
+  .byte  15,133,202,0,0,0                    // jne           5703 <_sk_load_rgb_u16_be_skx+0xe7>
+  .byte  196,1,121,16,28,72                  // vmovupd       (%r8,%r9,2),%xmm11
+  .byte  196,129,121,16,92,72,12             // vmovupd       0xc(%r8,%r9,2),%xmm3
+  .byte  196,129,121,16,84,72,24             // vmovupd       0x18(%r8,%r9,2),%xmm2
+  .byte  98,145,125,8,115,92,72,2,4          // vpsrldq       $0x4,0x20(%r8,%r9,2),%xmm0
   .byte  196,193,57,115,219,6                // vpsrldq       $0x6,%xmm11,%xmm8
   .byte  197,169,115,219,6                   // vpsrldq       $0x6,%xmm3,%xmm10
   .byte  197,241,115,218,6                   // vpsrldq       $0x6,%xmm2,%xmm1
@@ -5454,7 +5390,7 @@
   .byte  197,241,235,192                     // vpor          %xmm0,%xmm1,%xmm0
   .byte  196,226,125,51,192                  // vpmovzxwd     %xmm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,13,209,83,3,0         // vbroadcastss  0x353d1(%rip),%ymm9        # 3ac10 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
+  .byte  196,98,125,24,13,139,77,3,0         // vbroadcastss  0x34d8b(%rip),%ymm9        # 3a440 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
   .byte  196,193,124,89,193                  // vmulps        %ymm9,%ymm0,%ymm0
   .byte  197,185,109,203                     // vpunpckhqdq   %xmm3,%xmm8,%xmm1
   .byte  197,225,113,241,8                   // vpsllw        $0x8,%xmm1,%xmm3
@@ -5470,87 +5406,85 @@
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
   .byte  196,193,108,89,209                  // vmulps        %ymm9,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,241,82,3,0        // vbroadcastss  0x352f1(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,171,76,3,0        // vbroadcastss  0x34cab(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,193,121,110,4,64                // vmovd         (%r8,%rax,2),%xmm0
+  .byte  196,129,121,110,4,72                // vmovd         (%r8,%r9,2),%xmm0
   .byte  196,65,49,87,201                    // vxorpd        %xmm9,%xmm9,%xmm9
-  .byte  196,65,121,196,92,64,4,2            // vpinsrw       $0x2,0x4(%r8,%rax,2),%xmm0,%xmm11
+  .byte  196,1,121,196,92,72,4,2             // vpinsrw       $0x2,0x4(%r8,%r9,2),%xmm0,%xmm11
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,31                              // jne           58c5 <_sk_load_rgb_u16_be_skx+0x12d>
+  .byte  117,31                              // jne           573b <_sk_load_rgb_u16_be_skx+0x11f>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
   .byte  197,225,239,219                     // vpxor         %xmm3,%xmm3,%xmm3
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  233,48,255,255,255                  // jmpq          57f5 <_sk_load_rgb_u16_be_skx+0x5d>
-  .byte  196,193,121,110,68,64,6             // vmovd         0x6(%r8,%rax,2),%xmm0
+  .byte  233,48,255,255,255                  // jmpq          566b <_sk_load_rgb_u16_be_skx+0x4f>
+  .byte  196,129,121,110,68,72,6             // vmovd         0x6(%r8,%r9,2),%xmm0
   .byte  196,65,49,87,201                    // vxorpd        %xmm9,%xmm9,%xmm9
-  .byte  196,65,121,196,68,64,10,2           // vpinsrw       $0x2,0xa(%r8,%rax,2),%xmm0,%xmm8
+  .byte  196,1,121,196,68,72,10,2            // vpinsrw       $0x2,0xa(%r8,%r9,2),%xmm0,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,48                              // jb            590f <_sk_load_rgb_u16_be_skx+0x177>
-  .byte  196,193,121,110,68,64,12            // vmovd         0xc(%r8,%rax,2),%xmm0
+  .byte  114,48                              // jb            5785 <_sk_load_rgb_u16_be_skx+0x169>
+  .byte  196,129,121,110,68,72,12            // vmovd         0xc(%r8,%r9,2),%xmm0
   .byte  196,65,49,87,201                    // vxorpd        %xmm9,%xmm9,%xmm9
-  .byte  196,193,121,196,92,64,16,2          // vpinsrw       $0x2,0x10(%r8,%rax,2),%xmm0,%xmm3
+  .byte  196,129,121,196,92,72,16,2          // vpinsrw       $0x2,0x10(%r8,%r9,2),%xmm0,%xmm3
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  117,48                              // jne           5929 <_sk_load_rgb_u16_be_skx+0x191>
+  .byte  117,48                              // jne           579f <_sk_load_rgb_u16_be_skx+0x183>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
-  .byte  233,230,254,255,255                 // jmpq          57f5 <_sk_load_rgb_u16_be_skx+0x5d>
+  .byte  233,230,254,255,255                 // jmpq          566b <_sk_load_rgb_u16_be_skx+0x4f>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
   .byte  197,225,239,219                     // vpxor         %xmm3,%xmm3,%xmm3
-  .byte  233,204,254,255,255                 // jmpq          57f5 <_sk_load_rgb_u16_be_skx+0x5d>
-  .byte  196,193,121,110,68,64,18            // vmovd         0x12(%r8,%rax,2),%xmm0
+  .byte  233,204,254,255,255                 // jmpq          566b <_sk_load_rgb_u16_be_skx+0x4f>
+  .byte  196,129,121,110,68,72,18            // vmovd         0x12(%r8,%r9,2),%xmm0
   .byte  196,65,49,87,201                    // vxorpd        %xmm9,%xmm9,%xmm9
-  .byte  196,65,121,196,84,64,22,2           // vpinsrw       $0x2,0x16(%r8,%rax,2),%xmm0,%xmm10
+  .byte  196,1,121,196,84,72,22,2            // vpinsrw       $0x2,0x16(%r8,%r9,2),%xmm0,%xmm10
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,39                              // jb            596a <_sk_load_rgb_u16_be_skx+0x1d2>
-  .byte  196,193,121,110,68,64,24            // vmovd         0x18(%r8,%rax,2),%xmm0
+  .byte  114,39                              // jb            57e0 <_sk_load_rgb_u16_be_skx+0x1c4>
+  .byte  196,129,121,110,68,72,24            // vmovd         0x18(%r8,%r9,2),%xmm0
   .byte  196,65,49,87,201                    // vxorpd        %xmm9,%xmm9,%xmm9
-  .byte  196,193,121,196,84,64,28,2          // vpinsrw       $0x2,0x1c(%r8,%rax,2),%xmm0,%xmm2
+  .byte  196,129,121,196,84,72,28,2          // vpinsrw       $0x2,0x1c(%r8,%r9,2),%xmm0,%xmm2
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  117,30                              // jne           597b <_sk_load_rgb_u16_be_skx+0x1e3>
+  .byte  117,30                              // jne           57f1 <_sk_load_rgb_u16_be_skx+0x1d5>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
-  .byte  233,139,254,255,255                 // jmpq          57f5 <_sk_load_rgb_u16_be_skx+0x5d>
+  .byte  233,139,254,255,255                 // jmpq          566b <_sk_load_rgb_u16_be_skx+0x4f>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
-  .byte  233,122,254,255,255                 // jmpq          57f5 <_sk_load_rgb_u16_be_skx+0x5d>
-  .byte  196,193,121,110,68,64,30            // vmovd         0x1e(%r8,%rax,2),%xmm0
+  .byte  233,122,254,255,255                 // jmpq          566b <_sk_load_rgb_u16_be_skx+0x4f>
+  .byte  196,129,121,110,68,72,30            // vmovd         0x1e(%r8,%r9,2),%xmm0
   .byte  196,65,49,87,201                    // vxorpd        %xmm9,%xmm9,%xmm9
-  .byte  196,193,121,196,76,64,34,2          // vpinsrw       $0x2,0x22(%r8,%rax,2),%xmm0,%xmm1
+  .byte  196,129,121,196,76,72,34,2          // vpinsrw       $0x2,0x22(%r8,%r9,2),%xmm0,%xmm1
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,25                              // jb            59ae <_sk_load_rgb_u16_be_skx+0x216>
-  .byte  196,193,121,110,68,64,36            // vmovd         0x24(%r8,%rax,2),%xmm0
+  .byte  114,25                              // jb            5824 <_sk_load_rgb_u16_be_skx+0x208>
+  .byte  196,129,121,110,68,72,36            // vmovd         0x24(%r8,%r9,2),%xmm0
   .byte  196,65,49,87,201                    // vxorpd        %xmm9,%xmm9,%xmm9
-  .byte  196,193,121,196,68,64,40,2          // vpinsrw       $0x2,0x28(%r8,%rax,2),%xmm0,%xmm0
-  .byte  233,71,254,255,255                  // jmpq          57f5 <_sk_load_rgb_u16_be_skx+0x5d>
+  .byte  196,129,121,196,68,72,40,2          // vpinsrw       $0x2,0x28(%r8,%r9,2),%xmm0,%xmm0
+  .byte  233,71,254,255,255                  // jmpq          566b <_sk_load_rgb_u16_be_skx+0x4f>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  233,62,254,255,255                  // jmpq          57f5 <_sk_load_rgb_u16_be_skx+0x5d>
+  .byte  233,62,254,255,255                  // jmpq          566b <_sk_load_rgb_u16_be_skx+0x4f>
 
 HIDDEN _sk_store_u16_be_skx
 .globl _sk_store_u16_be_skx
 FUNCTION(_sk_store_u16_be_skx)
 _sk_store_u16_be_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  76,141,4,149,0,0,0,0                // lea           0x0(,%rdx,4),%r8
   .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  77,1,192                            // add           %r8,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  73,99,193                           // movslq        %r9d,%rax
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  77,1,201                            // add           %r9,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,60,95,200                       // vmaxps        %ymm0,%ymm8,%ymm9
-  .byte  196,98,125,24,21,149,81,3,0         // vbroadcastss  0x35195(%rip),%ymm10        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,21,85,75,3,0          // vbroadcastss  0x34b55(%rip),%ymm10        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,52,93,202                    // vminps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,29,163,82,3,0         // vbroadcastss  0x352a3(%rip),%ymm11        # 3ac98 <_sk_srcover_bgra_8888_sse2_lowp+0x3cc>
+  .byte  196,98,125,24,29,99,76,3,0          // vbroadcastss  0x34c63(%rip),%ymm11        # 3a4c8 <_sk_srcover_bgra_8888_sse2_lowp+0x3cc>
   .byte  196,65,52,89,203                    // vmulps        %ymm11,%ymm9,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  196,67,125,57,204,1                 // vextracti128  $0x1,%ymm9,%xmm12
@@ -5594,31 +5528,31 @@
   .byte  196,65,25,98,200                    // vpunpckldq    %xmm8,%xmm12,%xmm9
   .byte  196,65,25,106,192                   // vpunpckhdq    %xmm8,%xmm12,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,31                              // jne           5af4 <_sk_store_u16_be_skx+0x13d>
-  .byte  196,65,122,127,28,64                // vmovdqu       %xmm11,(%r8,%rax,2)
-  .byte  196,65,122,127,84,64,16             // vmovdqu       %xmm10,0x10(%r8,%rax,2)
-  .byte  196,65,122,127,76,64,32             // vmovdqu       %xmm9,0x20(%r8,%rax,2)
-  .byte  196,65,122,127,68,64,48             // vmovdqu       %xmm8,0x30(%r8,%rax,2)
+  .byte  117,31                              // jne           5964 <_sk_store_u16_be_skx+0x137>
+  .byte  196,1,122,127,28,65                 // vmovdqu       %xmm11,(%r9,%r8,2)
+  .byte  196,1,122,127,84,65,16              // vmovdqu       %xmm10,0x10(%r9,%r8,2)
+  .byte  196,1,122,127,76,65,32              // vmovdqu       %xmm9,0x20(%r9,%r8,2)
+  .byte  196,1,122,127,68,65,48              // vmovdqu       %xmm8,0x30(%r9,%r8,2)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,65,121,214,28,64                // vmovq         %xmm11,(%r8,%rax,2)
+  .byte  196,1,121,214,28,65                 // vmovq         %xmm11,(%r9,%r8,2)
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,240                             // je            5af0 <_sk_store_u16_be_skx+0x139>
-  .byte  196,65,121,23,92,64,8               // vmovhpd       %xmm11,0x8(%r8,%rax,2)
+  .byte  116,240                             // je            5960 <_sk_store_u16_be_skx+0x133>
+  .byte  196,1,121,23,92,65,8                // vmovhpd       %xmm11,0x8(%r9,%r8,2)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,227                             // jb            5af0 <_sk_store_u16_be_skx+0x139>
-  .byte  196,65,121,214,84,64,16             // vmovq         %xmm10,0x10(%r8,%rax,2)
-  .byte  116,218                             // je            5af0 <_sk_store_u16_be_skx+0x139>
-  .byte  196,65,121,23,84,64,24              // vmovhpd       %xmm10,0x18(%r8,%rax,2)
+  .byte  114,227                             // jb            5960 <_sk_store_u16_be_skx+0x133>
+  .byte  196,1,121,214,84,65,16              // vmovq         %xmm10,0x10(%r9,%r8,2)
+  .byte  116,218                             // je            5960 <_sk_store_u16_be_skx+0x133>
+  .byte  196,1,121,23,84,65,24               // vmovhpd       %xmm10,0x18(%r9,%r8,2)
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,205                             // jb            5af0 <_sk_store_u16_be_skx+0x139>
-  .byte  196,65,121,214,76,64,32             // vmovq         %xmm9,0x20(%r8,%rax,2)
-  .byte  116,196                             // je            5af0 <_sk_store_u16_be_skx+0x139>
-  .byte  196,65,121,23,76,64,40              // vmovhpd       %xmm9,0x28(%r8,%rax,2)
+  .byte  114,205                             // jb            5960 <_sk_store_u16_be_skx+0x133>
+  .byte  196,1,121,214,76,65,32              // vmovq         %xmm9,0x20(%r9,%r8,2)
+  .byte  116,196                             // je            5960 <_sk_store_u16_be_skx+0x133>
+  .byte  196,1,121,23,76,65,40               // vmovhpd       %xmm9,0x28(%r9,%r8,2)
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,183                             // jb            5af0 <_sk_store_u16_be_skx+0x139>
-  .byte  196,65,121,214,68,64,48             // vmovq         %xmm8,0x30(%r8,%rax,2)
-  .byte  235,174                             // jmp           5af0 <_sk_store_u16_be_skx+0x139>
+  .byte  114,183                             // jb            5960 <_sk_store_u16_be_skx+0x133>
+  .byte  196,1,121,214,68,65,48              // vmovq         %xmm8,0x30(%r9,%r8,2)
+  .byte  235,174                             // jmp           5960 <_sk_store_u16_be_skx+0x133>
 
 HIDDEN _sk_load_f32_skx
 .globl _sk_load_f32_skx
@@ -5626,20 +5560,18 @@
 _sk_load_f32_skx:
   .byte  98,225,253,40,40,223                // vmovapd       %ymm7,%ymm19
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  197,197,87,255                      // vxorpd        %ymm7,%ymm7,%ymm7
+  .byte  197,253,87,192                      // vxorpd        %ymm0,%ymm0,%ymm0
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,135,63,1,0,0                     // ja            5c97 <_sk_load_f32_skx+0x155>
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
-  .byte  73,193,224,2                        // shl           $0x2,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  77,99,201                           // movslq        %r9d,%r9
-  .byte  76,141,21,44,1,0,0                  // lea           0x12c(%rip),%r10        # 5ca8 <_sk_load_f32_skx+0x166>
+  .byte  15,135,57,1,0,0                     // ja            5b01 <_sk_load_f32_skx+0x14f>
+  .byte  76,141,4,149,0,0,0,0                // lea           0x0(,%rdx,4),%r8
+  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  73,193,225,2                        // shl           $0x2,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
+  .byte  76,141,21,46,1,0,0                  // lea           0x12e(%rip),%r10        # 5b14 <_sk_load_f32_skx+0x162>
   .byte  73,99,4,186                         // movslq        (%r10,%rdi,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
-  .byte  197,245,87,201                      // vxorpd        %ymm1,%ymm1,%ymm1
+  .byte  197,197,87,255                      // vxorpd        %ymm7,%ymm7,%ymm7
   .byte  196,65,45,87,210                    // vxorpd        %ymm10,%ymm10,%ymm10
   .byte  197,237,87,210                      // vxorpd        %ymm2,%ymm2,%ymm2
   .byte  98,161,253,32,87,192                // vxorpd        %ymm16,%ymm16,%ymm16
@@ -5653,38 +5585,38 @@
   .byte  98,161,245,32,87,201                // vxorpd        %ymm17,%ymm17,%ymm17
   .byte  196,65,61,87,192                    // vxorpd        %ymm8,%ymm8,%ymm8
   .byte  196,65,53,87,201                    // vxorpd        %ymm9,%ymm9,%ymm9
-  .byte  197,253,87,192                      // vxorpd        %ymm0,%ymm0,%ymm0
+  .byte  197,245,87,201                      // vxorpd        %ymm1,%ymm1,%ymm1
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,129,121,16,68,136,112           // vmovupd       0x70(%r8,%r9,4),%xmm0
-  .byte  196,227,125,6,248,40                // vperm2f128    $0x28,%ymm0,%ymm0,%ymm7
-  .byte  196,129,121,16,68,136,96            // vmovupd       0x60(%r8,%r9,4),%xmm0
-  .byte  196,227,125,6,200,40                // vperm2f128    $0x28,%ymm0,%ymm0,%ymm1
-  .byte  196,129,121,16,68,136,80            // vmovupd       0x50(%r8,%r9,4),%xmm0
-  .byte  196,227,125,6,208,40                // vperm2f128    $0x28,%ymm0,%ymm0,%ymm2
-  .byte  197,125,40,209                      // vmovapd       %ymm1,%ymm10
-  .byte  196,129,121,16,68,136,64            // vmovupd       0x40(%r8,%r9,4),%xmm0
-  .byte  196,227,125,6,216,40                // vperm2f128    $0x28,%ymm0,%ymm0,%ymm3
+  .byte  196,129,121,16,68,129,112           // vmovupd       0x70(%r9,%r8,4),%xmm0
+  .byte  196,227,125,6,192,40                // vperm2f128    $0x28,%ymm0,%ymm0,%ymm0
+  .byte  196,129,121,16,76,129,96            // vmovupd       0x60(%r9,%r8,4),%xmm1
+  .byte  196,227,125,6,249,40                // vperm2f128    $0x28,%ymm1,%ymm0,%ymm7
+  .byte  196,129,121,16,76,129,80            // vmovupd       0x50(%r9,%r8,4),%xmm1
+  .byte  196,227,125,6,209,40                // vperm2f128    $0x28,%ymm1,%ymm0,%ymm2
+  .byte  197,125,40,215                      // vmovapd       %ymm7,%ymm10
+  .byte  196,129,121,16,76,129,64            // vmovupd       0x40(%r9,%r8,4),%xmm1
+  .byte  196,227,125,6,217,40                // vperm2f128    $0x28,%ymm1,%ymm0,%ymm3
   .byte  98,193,253,40,40,194                // vmovapd       %ymm10,%ymm16
   .byte  197,125,40,226                      // vmovapd       %ymm2,%ymm12
-  .byte  196,129,121,16,68,136,48            // vmovupd       0x30(%r8,%r9,4),%xmm0
-  .byte  196,227,125,13,255,12               // vblendpd      $0xc,%ymm7,%ymm0,%ymm7
+  .byte  196,129,121,16,76,129,48            // vmovupd       0x30(%r9,%r8,4),%xmm1
+  .byte  196,227,117,13,192,12               // vblendpd      $0xc,%ymm0,%ymm1,%ymm0
   .byte  98,49,253,40,40,216                 // vmovapd       %ymm16,%ymm11
   .byte  98,193,253,40,40,212                // vmovapd       %ymm12,%ymm18
   .byte  197,125,40,251                      // vmovapd       %ymm3,%ymm15
-  .byte  196,129,121,16,68,136,32            // vmovupd       0x20(%r8,%r9,4),%xmm0
-  .byte  196,67,125,13,243,12                // vblendpd      $0xc,%ymm11,%ymm0,%ymm14
+  .byte  196,129,121,16,76,129,32            // vmovupd       0x20(%r9,%r8,4),%xmm1
+  .byte  196,67,117,13,243,12                // vblendpd      $0xc,%ymm11,%ymm1,%ymm14
   .byte  98,49,253,40,40,234                 // vmovapd       %ymm18,%ymm13
   .byte  98,193,253,40,40,207                // vmovapd       %ymm15,%ymm17
-  .byte  196,129,121,16,68,136,16            // vmovupd       0x10(%r8,%r9,4),%xmm0
-  .byte  196,67,125,13,205,12                // vblendpd      $0xc,%ymm13,%ymm0,%ymm9
+  .byte  196,129,121,16,76,129,16            // vmovupd       0x10(%r9,%r8,4),%xmm1
+  .byte  196,67,117,13,205,12                // vblendpd      $0xc,%ymm13,%ymm1,%ymm9
   .byte  196,65,125,40,198                   // vmovapd       %ymm14,%ymm8
-  .byte  98,177,253,40,40,193                // vmovapd       %ymm17,%ymm0
-  .byte  196,129,121,16,12,136               // vmovupd       (%r8,%r9,4),%xmm1
-  .byte  196,227,117,13,200,12               // vblendpd      $0xc,%ymm0,%ymm1,%ymm1
+  .byte  98,177,253,40,40,201                // vmovapd       %ymm17,%ymm1
+  .byte  196,129,121,16,20,129               // vmovupd       (%r9,%r8,4),%xmm2
+  .byte  196,227,109,13,201,12               // vblendpd      $0xc,%ymm1,%ymm2,%ymm1
   .byte  196,193,116,20,209                  // vunpcklps     %ymm9,%ymm1,%ymm2
   .byte  196,193,116,21,217                  // vunpckhps     %ymm9,%ymm1,%ymm3
-  .byte  197,188,20,207                      // vunpcklps     %ymm7,%ymm8,%ymm1
-  .byte  197,188,21,255                      // vunpckhps     %ymm7,%ymm8,%ymm7
+  .byte  197,188,20,200                      // vunpcklps     %ymm0,%ymm8,%ymm1
+  .byte  197,188,21,248                      // vunpckhps     %ymm0,%ymm8,%ymm7
   .byte  197,237,20,193                      // vunpcklpd     %ymm1,%ymm2,%ymm0
   .byte  197,237,21,201                      // vunpckhpd     %ymm1,%ymm2,%ymm1
   .byte  197,229,20,215                      // vunpcklpd     %ymm7,%ymm3,%ymm2
@@ -5695,101 +5627,7 @@
   .byte  196,65,61,87,192                    // vxorpd        %ymm8,%ymm8,%ymm8
   .byte  196,65,53,87,201                    // vxorpd        %ymm9,%ymm9,%ymm9
   .byte  197,245,87,201                      // vxorpd        %ymm1,%ymm1,%ymm1
-  .byte  235,196                             // jmp           5c6b <_sk_load_f32_skx+0x129>
-  .byte  144                                 // nop
-  .byte  39                                  // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,183,255,255,255,159             // pushq         -0x60000001(%rdi)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,134,255,255,255,105             // incl          0x69ffffff(%rsi)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,82,255                          // callq         *-0x1(%rdx)
-  .byte  255                                 // (bad)
-  .byte  255,65,255                          // incl          -0x1(%rcx)
-  .byte  255                                 // (bad)
-  .byte  255,52,255                          // pushq         (%rdi,%rdi,8)
-  .byte  255                                 // (bad)
-  .byte  255                                 // .byte         0xff
-
-HIDDEN _sk_load_f32_dst_skx
-.globl _sk_load_f32_dst_skx
-FUNCTION(_sk_load_f32_dst_skx)
-_sk_load_f32_dst_skx:
-  .byte  98,225,253,40,40,219                // vmovapd       %ymm3,%ymm19
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  197,229,87,219                      // vxorpd        %ymm3,%ymm3,%ymm3
-  .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,135,63,1,0,0                     // ja            5e1d <_sk_load_f32_dst_skx+0x155>
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
-  .byte  73,193,224,2                        // shl           $0x2,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  77,99,201                           // movslq        %r9d,%r9
-  .byte  76,141,21,46,1,0,0                  // lea           0x12e(%rip),%r10        # 5e30 <_sk_load_f32_dst_skx+0x168>
-  .byte  73,99,4,186                         // movslq        (%r10,%rdi,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
-  .byte  197,213,87,237                      // vxorpd        %ymm5,%ymm5,%ymm5
-  .byte  196,65,45,87,210                    // vxorpd        %ymm10,%ymm10,%ymm10
-  .byte  197,205,87,246                      // vxorpd        %ymm6,%ymm6,%ymm6
-  .byte  98,161,253,32,87,192                // vxorpd        %ymm16,%ymm16,%ymm16
-  .byte  196,65,29,87,228                    // vxorpd        %ymm12,%ymm12,%ymm12
-  .byte  197,197,87,255                      // vxorpd        %ymm7,%ymm7,%ymm7
-  .byte  196,65,37,87,219                    // vxorpd        %ymm11,%ymm11,%ymm11
-  .byte  98,161,237,32,87,210                // vxorpd        %ymm18,%ymm18,%ymm18
-  .byte  196,65,5,87,255                     // vxorpd        %ymm15,%ymm15,%ymm15
-  .byte  196,65,13,87,246                    // vxorpd        %ymm14,%ymm14,%ymm14
-  .byte  196,65,21,87,237                    // vxorpd        %ymm13,%ymm13,%ymm13
-  .byte  98,161,245,32,87,201                // vxorpd        %ymm17,%ymm17,%ymm17
-  .byte  196,65,61,87,192                    // vxorpd        %ymm8,%ymm8,%ymm8
-  .byte  196,65,53,87,201                    // vxorpd        %ymm9,%ymm9,%ymm9
-  .byte  197,221,87,228                      // vxorpd        %ymm4,%ymm4,%ymm4
-  .byte  255,224                             // jmpq          *%rax
-  .byte  196,129,121,16,92,136,112           // vmovupd       0x70(%r8,%r9,4),%xmm3
-  .byte  196,227,125,6,219,40                // vperm2f128    $0x28,%ymm3,%ymm0,%ymm3
-  .byte  196,129,121,16,100,136,96           // vmovupd       0x60(%r8,%r9,4),%xmm4
-  .byte  196,227,125,6,236,40                // vperm2f128    $0x28,%ymm4,%ymm0,%ymm5
-  .byte  196,129,121,16,100,136,80           // vmovupd       0x50(%r8,%r9,4),%xmm4
-  .byte  196,227,125,6,244,40                // vperm2f128    $0x28,%ymm4,%ymm0,%ymm6
-  .byte  197,125,40,213                      // vmovapd       %ymm5,%ymm10
-  .byte  196,129,121,16,100,136,64           // vmovupd       0x40(%r8,%r9,4),%xmm4
-  .byte  196,227,125,6,252,40                // vperm2f128    $0x28,%ymm4,%ymm0,%ymm7
-  .byte  98,193,253,40,40,194                // vmovapd       %ymm10,%ymm16
-  .byte  197,125,40,230                      // vmovapd       %ymm6,%ymm12
-  .byte  196,129,121,16,100,136,48           // vmovupd       0x30(%r8,%r9,4),%xmm4
-  .byte  196,227,93,13,219,12                // vblendpd      $0xc,%ymm3,%ymm4,%ymm3
-  .byte  98,49,253,40,40,216                 // vmovapd       %ymm16,%ymm11
-  .byte  98,193,253,40,40,212                // vmovapd       %ymm12,%ymm18
-  .byte  197,125,40,255                      // vmovapd       %ymm7,%ymm15
-  .byte  196,129,121,16,100,136,32           // vmovupd       0x20(%r8,%r9,4),%xmm4
-  .byte  196,67,93,13,243,12                 // vblendpd      $0xc,%ymm11,%ymm4,%ymm14
-  .byte  98,49,253,40,40,234                 // vmovapd       %ymm18,%ymm13
-  .byte  98,193,253,40,40,207                // vmovapd       %ymm15,%ymm17
-  .byte  196,129,121,16,100,136,16           // vmovupd       0x10(%r8,%r9,4),%xmm4
-  .byte  196,67,93,13,205,12                 // vblendpd      $0xc,%ymm13,%ymm4,%ymm9
-  .byte  196,65,125,40,198                   // vmovapd       %ymm14,%ymm8
-  .byte  98,177,253,40,40,225                // vmovapd       %ymm17,%ymm4
-  .byte  196,129,121,16,44,136               // vmovupd       (%r8,%r9,4),%xmm5
-  .byte  196,227,85,13,236,12                // vblendpd      $0xc,%ymm4,%ymm5,%ymm5
-  .byte  196,193,84,20,241                   // vunpcklps     %ymm9,%ymm5,%ymm6
-  .byte  196,193,84,21,249                   // vunpckhps     %ymm9,%ymm5,%ymm7
-  .byte  197,188,20,235                      // vunpcklps     %ymm3,%ymm8,%ymm5
-  .byte  197,188,21,219                      // vunpckhps     %ymm3,%ymm8,%ymm3
-  .byte  197,205,20,229                      // vunpcklpd     %ymm5,%ymm6,%ymm4
-  .byte  197,205,21,237                      // vunpckhpd     %ymm5,%ymm6,%ymm5
-  .byte  197,197,20,243                      // vunpcklpd     %ymm3,%ymm7,%ymm6
-  .byte  197,197,21,251                      // vunpckhpd     %ymm3,%ymm7,%ymm7
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  98,177,124,40,40,219                // vmovaps       %ymm19,%ymm3
-  .byte  255,224                             // jmpq          *%rax
-  .byte  196,65,61,87,192                    // vxorpd        %ymm8,%ymm8,%ymm8
-  .byte  196,65,53,87,201                    // vxorpd        %ymm9,%ymm9,%ymm9
-  .byte  197,213,87,237                      // vxorpd        %ymm5,%ymm5,%ymm5
-  .byte  235,196                             // jmp           5df1 <_sk_load_f32_dst_skx+0x129>
+  .byte  235,196                             // jmp           5ad5 <_sk_load_f32_skx+0x123>
   .byte  15,31,0                             // nopl          (%rax)
   .byte  37,255,255,255,181                  // and           $0xb5ffffff,%eax
   .byte  255                                 // (bad)
@@ -5810,18 +5648,107 @@
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
+HIDDEN _sk_load_f32_dst_skx
+.globl _sk_load_f32_dst_skx
+FUNCTION(_sk_load_f32_dst_skx)
+_sk_load_f32_dst_skx:
+  .byte  98,225,253,40,40,219                // vmovapd       %ymm3,%ymm19
+  .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  197,221,87,228                      // vxorpd        %ymm4,%ymm4,%ymm4
+  .byte  72,131,255,7                        // cmp           $0x7,%rdi
+  .byte  15,135,59,1,0,0                     // ja            5c85 <_sk_load_f32_dst_skx+0x151>
+  .byte  76,141,4,149,0,0,0,0                // lea           0x0(,%rdx,4),%r8
+  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  73,193,225,2                        // shl           $0x2,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
+  .byte  76,141,21,48,1,0,0                  // lea           0x130(%rip),%r10        # 5c98 <_sk_load_f32_dst_skx+0x164>
+  .byte  73,99,4,186                         // movslq        (%r10,%rdi,4),%rax
+  .byte  76,1,208                            // add           %r10,%rax
+  .byte  197,229,87,219                      // vxorpd        %ymm3,%ymm3,%ymm3
+  .byte  196,65,45,87,210                    // vxorpd        %ymm10,%ymm10,%ymm10
+  .byte  197,205,87,246                      // vxorpd        %ymm6,%ymm6,%ymm6
+  .byte  98,161,253,32,87,192                // vxorpd        %ymm16,%ymm16,%ymm16
+  .byte  196,65,29,87,228                    // vxorpd        %ymm12,%ymm12,%ymm12
+  .byte  197,197,87,255                      // vxorpd        %ymm7,%ymm7,%ymm7
+  .byte  196,65,37,87,219                    // vxorpd        %ymm11,%ymm11,%ymm11
+  .byte  98,161,237,32,87,210                // vxorpd        %ymm18,%ymm18,%ymm18
+  .byte  196,65,5,87,255                     // vxorpd        %ymm15,%ymm15,%ymm15
+  .byte  196,65,13,87,246                    // vxorpd        %ymm14,%ymm14,%ymm14
+  .byte  196,65,21,87,237                    // vxorpd        %ymm13,%ymm13,%ymm13
+  .byte  98,161,245,32,87,201                // vxorpd        %ymm17,%ymm17,%ymm17
+  .byte  196,65,61,87,192                    // vxorpd        %ymm8,%ymm8,%ymm8
+  .byte  196,65,53,87,201                    // vxorpd        %ymm9,%ymm9,%ymm9
+  .byte  197,213,87,237                      // vxorpd        %ymm5,%ymm5,%ymm5
+  .byte  255,224                             // jmpq          *%rax
+  .byte  196,129,121,16,92,129,112           // vmovupd       0x70(%r9,%r8,4),%xmm3
+  .byte  196,227,125,6,227,40                // vperm2f128    $0x28,%ymm3,%ymm0,%ymm4
+  .byte  196,129,121,16,92,129,96            // vmovupd       0x60(%r9,%r8,4),%xmm3
+  .byte  196,227,125,6,219,40                // vperm2f128    $0x28,%ymm3,%ymm0,%ymm3
+  .byte  196,129,121,16,108,129,80           // vmovupd       0x50(%r9,%r8,4),%xmm5
+  .byte  196,227,125,6,245,40                // vperm2f128    $0x28,%ymm5,%ymm0,%ymm6
+  .byte  197,125,40,211                      // vmovapd       %ymm3,%ymm10
+  .byte  196,129,121,16,92,129,64            // vmovupd       0x40(%r9,%r8,4),%xmm3
+  .byte  196,227,125,6,251,40                // vperm2f128    $0x28,%ymm3,%ymm0,%ymm7
+  .byte  98,193,253,40,40,194                // vmovapd       %ymm10,%ymm16
+  .byte  197,125,40,230                      // vmovapd       %ymm6,%ymm12
+  .byte  196,129,121,16,92,129,48            // vmovupd       0x30(%r9,%r8,4),%xmm3
+  .byte  196,227,101,13,228,12               // vblendpd      $0xc,%ymm4,%ymm3,%ymm4
+  .byte  98,49,253,40,40,216                 // vmovapd       %ymm16,%ymm11
+  .byte  98,193,253,40,40,212                // vmovapd       %ymm12,%ymm18
+  .byte  197,125,40,255                      // vmovapd       %ymm7,%ymm15
+  .byte  196,129,121,16,92,129,32            // vmovupd       0x20(%r9,%r8,4),%xmm3
+  .byte  196,67,101,13,243,12                // vblendpd      $0xc,%ymm11,%ymm3,%ymm14
+  .byte  98,49,253,40,40,234                 // vmovapd       %ymm18,%ymm13
+  .byte  98,193,253,40,40,207                // vmovapd       %ymm15,%ymm17
+  .byte  196,129,121,16,92,129,16            // vmovupd       0x10(%r9,%r8,4),%xmm3
+  .byte  196,67,101,13,205,12                // vblendpd      $0xc,%ymm13,%ymm3,%ymm9
+  .byte  196,65,125,40,198                   // vmovapd       %ymm14,%ymm8
+  .byte  98,177,253,40,40,233                // vmovapd       %ymm17,%ymm5
+  .byte  196,129,121,16,28,129               // vmovupd       (%r9,%r8,4),%xmm3
+  .byte  196,227,101,13,237,12               // vblendpd      $0xc,%ymm5,%ymm3,%ymm5
+  .byte  196,193,84,20,217                   // vunpcklps     %ymm9,%ymm5,%ymm3
+  .byte  196,193,84,21,249                   // vunpckhps     %ymm9,%ymm5,%ymm7
+  .byte  197,188,20,236                      // vunpcklps     %ymm4,%ymm8,%ymm5
+  .byte  197,60,21,196                       // vunpckhps     %ymm4,%ymm8,%ymm8
+  .byte  197,229,20,229                      // vunpcklpd     %ymm5,%ymm3,%ymm4
+  .byte  197,229,21,237                      // vunpckhpd     %ymm5,%ymm3,%ymm5
+  .byte  196,193,69,20,240                   // vunpcklpd     %ymm8,%ymm7,%ymm6
+  .byte  196,193,69,21,248                   // vunpckhpd     %ymm8,%ymm7,%ymm7
+  .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  98,177,124,40,40,219                // vmovaps       %ymm19,%ymm3
+  .byte  255,224                             // jmpq          *%rax
+  .byte  196,65,61,87,192                    // vxorpd        %ymm8,%ymm8,%ymm8
+  .byte  196,65,53,87,201                    // vxorpd        %ymm9,%ymm9,%ymm9
+  .byte  197,213,87,237                      // vxorpd        %ymm5,%ymm5,%ymm5
+  .byte  235,194                             // jmp           5c57 <_sk_load_f32_dst_skx+0x123>
+  .byte  15,31,0                             // nopl          (%rax)
+  .byte  35,255                              // and           %edi,%edi
+  .byte  255                                 // (bad)
+  .byte  255,179,255,255,255,155             // pushq         -0x64000001(%rbx)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,130,255,255,255,101             // incl          0x65ffffff(%rdx)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,78,255                          // decl          -0x1(%rsi)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  61,255,255,255,48                   // cmp           $0x30ffffff,%eax
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255                                 // .byte         0xff
+
 HIDDEN _sk_store_f32_skx
 .globl _sk_store_f32_skx
 FUNCTION(_sk_store_f32_skx)
 _sk_store_f32_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
+  .byte  76,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  73,99,193                           // movslq        %r9d,%rax
   .byte  197,124,20,193                      // vunpcklps     %ymm1,%ymm0,%ymm8
   .byte  197,124,21,217                      // vunpckhps     %ymm1,%ymm0,%ymm11
   .byte  197,108,20,203                      // vunpcklps     %ymm3,%ymm2,%ymm9
@@ -5831,35 +5758,35 @@
   .byte  196,65,37,20,196                    // vunpcklpd     %ymm12,%ymm11,%ymm8
   .byte  196,65,37,21,220                    // vunpckhpd     %ymm12,%ymm11,%ymm11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,55                              // jne           5ecf <_sk_store_f32_skx+0x7f>
+  .byte  117,55                              // jne           5d31 <_sk_store_f32_skx+0x79>
   .byte  196,67,45,24,225,1                  // vinsertf128   $0x1,%xmm9,%ymm10,%ymm12
   .byte  196,67,61,24,235,1                  // vinsertf128   $0x1,%xmm11,%ymm8,%ymm13
   .byte  196,67,45,6,201,49                  // vperm2f128    $0x31,%ymm9,%ymm10,%ymm9
   .byte  196,67,61,6,195,49                  // vperm2f128    $0x31,%ymm11,%ymm8,%ymm8
-  .byte  196,65,125,17,36,128                // vmovupd       %ymm12,(%r8,%rax,4)
-  .byte  196,65,125,17,108,128,32            // vmovupd       %ymm13,0x20(%r8,%rax,4)
-  .byte  196,65,124,17,76,128,64             // vmovups       %ymm9,0x40(%r8,%rax,4)
-  .byte  196,65,125,17,68,128,96             // vmovupd       %ymm8,0x60(%r8,%rax,4)
+  .byte  196,1,125,17,36,136                 // vmovupd       %ymm12,(%r8,%r9,4)
+  .byte  196,1,125,17,108,136,32             // vmovupd       %ymm13,0x20(%r8,%r9,4)
+  .byte  196,1,124,17,76,136,64              // vmovups       %ymm9,0x40(%r8,%r9,4)
+  .byte  196,1,125,17,68,136,96              // vmovupd       %ymm8,0x60(%r8,%r9,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,65,121,17,20,128                // vmovupd       %xmm10,(%r8,%rax,4)
+  .byte  196,1,121,17,20,136                 // vmovupd       %xmm10,(%r8,%r9,4)
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,240                             // je            5ecb <_sk_store_f32_skx+0x7b>
-  .byte  196,65,121,17,76,128,16             // vmovupd       %xmm9,0x10(%r8,%rax,4)
+  .byte  116,240                             // je            5d2d <_sk_store_f32_skx+0x75>
+  .byte  196,1,121,17,76,136,16              // vmovupd       %xmm9,0x10(%r8,%r9,4)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,227                             // jb            5ecb <_sk_store_f32_skx+0x7b>
-  .byte  196,65,121,17,68,128,32             // vmovupd       %xmm8,0x20(%r8,%rax,4)
-  .byte  116,218                             // je            5ecb <_sk_store_f32_skx+0x7b>
-  .byte  196,65,121,17,92,128,48             // vmovupd       %xmm11,0x30(%r8,%rax,4)
+  .byte  114,227                             // jb            5d2d <_sk_store_f32_skx+0x75>
+  .byte  196,1,121,17,68,136,32              // vmovupd       %xmm8,0x20(%r8,%r9,4)
+  .byte  116,218                             // je            5d2d <_sk_store_f32_skx+0x75>
+  .byte  196,1,121,17,92,136,48              // vmovupd       %xmm11,0x30(%r8,%r9,4)
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,205                             // jb            5ecb <_sk_store_f32_skx+0x7b>
-  .byte  196,67,125,25,84,128,64,1           // vextractf128  $0x1,%ymm10,0x40(%r8,%rax,4)
-  .byte  116,195                             // je            5ecb <_sk_store_f32_skx+0x7b>
-  .byte  196,67,125,25,76,128,80,1           // vextractf128  $0x1,%ymm9,0x50(%r8,%rax,4)
+  .byte  114,205                             // jb            5d2d <_sk_store_f32_skx+0x75>
+  .byte  196,3,125,25,84,136,64,1            // vextractf128  $0x1,%ymm10,0x40(%r8,%r9,4)
+  .byte  116,195                             // je            5d2d <_sk_store_f32_skx+0x75>
+  .byte  196,3,125,25,76,136,80,1            // vextractf128  $0x1,%ymm9,0x50(%r8,%r9,4)
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,181                             // jb            5ecb <_sk_store_f32_skx+0x7b>
-  .byte  196,67,125,25,68,128,96,1           // vextractf128  $0x1,%ymm8,0x60(%r8,%rax,4)
-  .byte  235,171                             // jmp           5ecb <_sk_store_f32_skx+0x7b>
+  .byte  114,181                             // jb            5d2d <_sk_store_f32_skx+0x75>
+  .byte  196,3,125,25,68,136,96,1            // vextractf128  $0x1,%ymm8,0x60(%r8,%r9,4)
+  .byte  235,171                             // jmp           5d2d <_sk_store_f32_skx+0x75>
 
 HIDDEN _sk_repeat_x_skx
 .globl _sk_repeat_x_skx
@@ -5896,7 +5823,7 @@
   .byte  196,65,124,92,218                   // vsubps        %ymm10,%ymm0,%ymm11
   .byte  196,193,58,88,192                   // vaddss        %xmm8,%xmm8,%xmm0
   .byte  196,98,125,24,192                   // vbroadcastss  %xmm0,%ymm8
-  .byte  197,178,89,5,247,75,3,0             // vmulss        0x34bf7(%rip),%xmm9,%xmm0        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  197,178,89,5,197,69,3,0             // vmulss        0x345c5(%rip),%xmm9,%xmm0        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,226,125,24,192                  // vbroadcastss  %xmm0,%ymm0
   .byte  197,164,89,192                      // vmulps        %ymm0,%ymm11,%ymm0
   .byte  196,227,125,8,192,1                 // vroundps      $0x1,%ymm0,%ymm0
@@ -5919,7 +5846,7 @@
   .byte  196,65,116,92,218                   // vsubps        %ymm10,%ymm1,%ymm11
   .byte  196,193,58,88,200                   // vaddss        %xmm8,%xmm8,%xmm1
   .byte  196,98,125,24,193                   // vbroadcastss  %xmm1,%ymm8
-  .byte  197,178,89,13,166,75,3,0            // vmulss        0x34ba6(%rip),%xmm9,%xmm1        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  197,178,89,13,116,69,3,0            // vmulss        0x34574(%rip),%xmm9,%xmm1        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,226,125,24,201                  // vbroadcastss  %xmm1,%ymm1
   .byte  197,164,89,201                      // vmulps        %ymm1,%ymm11,%ymm1
   .byte  196,227,125,8,201,1                 // vroundps      $0x1,%ymm1,%ymm1
@@ -5937,7 +5864,7 @@
 _sk_clamp_x_1_skx:
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
-  .byte  98,241,124,56,93,5,109,75,3,0       // vminps        0x34b6d(%rip){1to8},%ymm0,%ymm0        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  98,241,124,56,93,5,59,69,3,0        // vminps        0x3453b(%rip){1to8},%ymm0,%ymm0        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -5949,7 +5876,7 @@
   .byte  196,193,124,92,192                  // vsubps        %ymm8,%ymm0,%ymm0
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
-  .byte  98,241,124,56,93,5,75,75,3,0        // vminps        0x34b4b(%rip){1to8},%ymm0,%ymm0        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  98,241,124,56,93,5,25,69,3,0        // vminps        0x34519(%rip){1to8},%ymm0,%ymm0        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -5957,9 +5884,9 @@
 .globl _sk_mirror_x_1_skx
 FUNCTION(_sk_mirror_x_1_skx)
 _sk_mirror_x_1_skx:
-  .byte  196,98,125,24,5,86,75,3,0           // vbroadcastss  0x34b56(%rip),%ymm8        # 3ab94 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
+  .byte  196,98,125,24,5,36,69,3,0           // vbroadcastss  0x34524(%rip),%ymm8        # 3a3c4 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
   .byte  196,193,124,88,192                  // vaddps        %ymm8,%ymm0,%ymm0
-  .byte  98,113,124,56,89,13,43,75,3,0       // vmulps        0x34b2b(%rip){1to8},%ymm0,%ymm9        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  98,113,124,56,89,13,249,68,3,0      // vmulps        0x344f9(%rip){1to8},%ymm0,%ymm9        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,67,125,8,201,1                  // vroundps      $0x1,%ymm9,%ymm9
   .byte  196,65,52,88,201                    // vaddps        %ymm9,%ymm9,%ymm9
   .byte  196,193,124,92,193                  // vsubps        %ymm9,%ymm0,%ymm0
@@ -5968,7 +5895,7 @@
   .byte  197,60,92,200                       // vsubps        %ymm0,%ymm8,%ymm9
   .byte  197,180,84,192                      // vandps        %ymm0,%ymm9,%ymm0
   .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
-  .byte  98,241,124,56,93,5,255,74,3,0       // vminps        0x34aff(%rip){1to8},%ymm0,%ymm0        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  98,241,124,56,93,5,205,68,3,0       // vminps        0x344cd(%rip){1to8},%ymm0,%ymm0        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -5976,9 +5903,9 @@
 .globl _sk_luminance_to_alpha_skx
 FUNCTION(_sk_luminance_to_alpha_skx)
 _sk_luminance_to_alpha_skx:
-  .byte  98,241,116,56,89,29,17,76,3,0       // vmulps        0x34c11(%rip){1to8},%ymm1,%ymm3        # 3ac9c <_sk_srcover_bgra_8888_sse2_lowp+0x3d0>
-  .byte  98,242,125,56,184,29,11,76,3,0      // vfmadd231ps   0x34c0b(%rip){1to8},%ymm0,%ymm3        # 3aca0 <_sk_srcover_bgra_8888_sse2_lowp+0x3d4>
-  .byte  98,242,109,56,184,29,5,76,3,0       // vfmadd231ps   0x34c05(%rip){1to8},%ymm2,%ymm3        # 3aca4 <_sk_srcover_bgra_8888_sse2_lowp+0x3d8>
+  .byte  98,241,116,56,89,29,223,69,3,0      // vmulps        0x345df(%rip){1to8},%ymm1,%ymm3        # 3a4cc <_sk_srcover_bgra_8888_sse2_lowp+0x3d0>
+  .byte  98,242,125,56,184,29,217,69,3,0     // vfmadd231ps   0x345d9(%rip){1to8},%ymm0,%ymm3        # 3a4d0 <_sk_srcover_bgra_8888_sse2_lowp+0x3d4>
+  .byte  98,242,109,56,184,29,211,69,3,0     // vfmadd231ps   0x345d3(%rip){1to8},%ymm2,%ymm3        # 3a4d4 <_sk_srcover_bgra_8888_sse2_lowp+0x3d8>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
@@ -6160,7 +6087,7 @@
   .byte  197,244,89,200                      // vmulps        %ymm0,%ymm1,%ymm1
   .byte  197,126,91,209                      // vcvttps2dq    %ymm1,%ymm10
   .byte  73,131,249,8                        // cmp           $0x8,%r9
-  .byte  119,73                              // ja            639d <_sk_evenly_spaced_gradient_skx+0x70>
+  .byte  119,73                              // ja            61ff <_sk_evenly_spaced_gradient_skx+0x70>
   .byte  196,66,45,22,0                      // vpermps       (%r8),%ymm10,%ymm8
   .byte  76,139,64,40                        // mov           0x28(%rax),%r8
   .byte  196,66,45,22,8                      // vpermps       (%r8),%ymm10,%ymm9
@@ -6176,7 +6103,7 @@
   .byte  196,194,45,22,24                    // vpermps       (%r8),%ymm10,%ymm3
   .byte  72,139,64,64                        // mov           0x40(%rax),%rax
   .byte  196,98,45,22,40                     // vpermps       (%rax),%ymm10,%ymm13
-  .byte  233,147,0,0,0                       // jmpq          6430 <_sk_evenly_spaced_gradient_skx+0x103>
+  .byte  233,147,0,0,0                       // jmpq          6292 <_sk_evenly_spaced_gradient_skx+0x103>
   .byte  197,245,118,201                     // vpcmpeqd      %ymm1,%ymm1,%ymm1
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  196,2,117,146,4,144                 // vgatherdps    %ymm1,(%r8,%ymm10,4),%ymm8
@@ -6223,11 +6150,11 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  73,131,248,1                        // cmp           $0x1,%r8
-  .byte  15,134,229,0,0,0                    // jbe           6540 <_sk_gradient_skx+0xf4>
+  .byte  15,134,229,0,0,0                    // jbe           63a2 <_sk_gradient_skx+0xf4>
   .byte  76,139,72,72                        // mov           0x48(%rax),%r9
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  65,186,1,0,0,0                      // mov           $0x1,%r10d
-  .byte  196,226,125,24,21,14,71,3,0         // vbroadcastss  0x3470e(%rip),%ymm2        # 3ab80 <_sk_srcover_bgra_8888_sse2_lowp+0x2b4>
+  .byte  196,226,125,24,21,220,64,3,0        // vbroadcastss  0x340dc(%rip),%ymm2        # 3a3b0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b4>
   .byte  196,65,53,239,201                   // vpxor         %ymm9,%ymm9,%ymm9
   .byte  196,130,125,24,28,145               // vbroadcastss  (%r9,%r10,4),%ymm3
   .byte  98,241,100,40,194,192,2             // vcmpleps      %ymm0,%ymm3,%k0
@@ -6236,10 +6163,10 @@
   .byte  197,53,254,203                      // vpaddd        %ymm3,%ymm9,%ymm9
   .byte  73,131,194,1                        // add           $0x1,%r10
   .byte  77,57,208                           // cmp           %r10,%r8
-  .byte  117,218                             // jne           6477 <_sk_gradient_skx+0x2b>
+  .byte  117,218                             // jne           62d9 <_sk_gradient_skx+0x2b>
   .byte  76,139,72,8                         // mov           0x8(%rax),%r9
   .byte  73,131,248,8                        // cmp           $0x8,%r8
-  .byte  15,134,158,0,0,0                    // jbe           6549 <_sk_gradient_skx+0xfd>
+  .byte  15,134,158,0,0,0                    // jbe           63ab <_sk_gradient_skx+0xfd>
   .byte  197,245,118,201                     // vpcmpeqd      %ymm1,%ymm1,%ymm1
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  196,2,117,146,4,137                 // vgatherdps    %ymm1,(%r9,%ymm9,4),%ymm8
@@ -6271,7 +6198,7 @@
   .byte  196,65,20,87,237                    // vxorps        %ymm13,%ymm13,%ymm13
   .byte  72,139,64,64                        // mov           0x40(%rax),%rax
   .byte  196,34,13,146,44,136                // vgatherdps    %ymm14,(%rax,%ymm9,4),%ymm13
-  .byte  235,77                              // jmp           658d <_sk_gradient_skx+0x141>
+  .byte  235,77                              // jmp           63ef <_sk_gradient_skx+0x141>
   .byte  76,139,72,8                         // mov           0x8(%rax),%r9
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
   .byte  196,66,53,22,1                      // vpermps       (%r9),%ymm9,%ymm8
@@ -6327,24 +6254,24 @@
   .byte  196,65,52,95,226                    // vmaxps        %ymm10,%ymm9,%ymm12
   .byte  196,65,36,94,220                    // vdivps        %ymm12,%ymm11,%ymm11
   .byte  196,65,36,89,227                    // vmulps        %ymm11,%ymm11,%ymm12
-  .byte  196,98,125,24,45,144,70,3,0         // vbroadcastss  0x34690(%rip),%ymm13        # 3aca8 <_sk_srcover_bgra_8888_sse2_lowp+0x3dc>
-  .byte  98,114,29,56,168,45,138,70,3,0      // vfmadd213ps   0x3468a(%rip){1to8},%ymm12,%ymm13        # 3acac <_sk_srcover_bgra_8888_sse2_lowp+0x3e0>
-  .byte  98,114,29,56,168,45,132,70,3,0      // vfmadd213ps   0x34684(%rip){1to8},%ymm12,%ymm13        # 3acb0 <_sk_srcover_bgra_8888_sse2_lowp+0x3e4>
-  .byte  98,114,29,56,168,45,126,70,3,0      // vfmadd213ps   0x3467e(%rip){1to8},%ymm12,%ymm13        # 3acb4 <_sk_srcover_bgra_8888_sse2_lowp+0x3e8>
+  .byte  196,98,125,24,45,94,64,3,0          // vbroadcastss  0x3405e(%rip),%ymm13        # 3a4d8 <_sk_srcover_bgra_8888_sse2_lowp+0x3dc>
+  .byte  98,114,29,56,168,45,88,64,3,0       // vfmadd213ps   0x34058(%rip){1to8},%ymm12,%ymm13        # 3a4dc <_sk_srcover_bgra_8888_sse2_lowp+0x3e0>
+  .byte  98,114,29,56,168,45,82,64,3,0       // vfmadd213ps   0x34052(%rip){1to8},%ymm12,%ymm13        # 3a4e0 <_sk_srcover_bgra_8888_sse2_lowp+0x3e4>
+  .byte  98,114,29,56,168,45,76,64,3,0       // vfmadd213ps   0x3404c(%rip){1to8},%ymm12,%ymm13        # 3a4e4 <_sk_srcover_bgra_8888_sse2_lowp+0x3e8>
   .byte  196,65,36,89,221                    // vmulps        %ymm13,%ymm11,%ymm11
   .byte  98,209,52,40,194,194,1              // vcmpltps      %ymm10,%ymm9,%k0
   .byte  98,114,126,40,56,200                // vpmovm2d      %k0,%ymm9
-  .byte  196,98,125,24,21,103,70,3,0         // vbroadcastss  0x34667(%rip),%ymm10        # 3acb8 <_sk_srcover_bgra_8888_sse2_lowp+0x3ec>
+  .byte  196,98,125,24,21,53,64,3,0          // vbroadcastss  0x34035(%rip),%ymm10        # 3a4e8 <_sk_srcover_bgra_8888_sse2_lowp+0x3ec>
   .byte  196,65,44,92,211                    // vsubps        %ymm11,%ymm10,%ymm10
   .byte  196,67,37,74,202,144                // vblendvps     %ymm9,%ymm10,%ymm11,%ymm9
   .byte  98,209,124,40,194,192,1             // vcmpltps      %ymm8,%ymm0,%k0
   .byte  98,242,126,40,56,192                // vpmovm2d      %k0,%ymm0
-  .byte  196,98,125,24,21,6,69,3,0           // vbroadcastss  0x34506(%rip),%ymm10        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,21,212,62,3,0         // vbroadcastss  0x33ed4(%rip),%ymm10        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,65,44,92,209                    // vsubps        %ymm9,%ymm10,%ymm10
   .byte  196,195,53,74,194,0                 // vblendvps     %ymm0,%ymm10,%ymm9,%ymm0
   .byte  98,209,116,40,194,192,1             // vcmpltps      %ymm8,%ymm1,%k0
   .byte  98,114,126,40,56,200                // vpmovm2d      %k0,%ymm9
-  .byte  196,98,125,24,21,233,68,3,0         // vbroadcastss  0x344e9(%rip),%ymm10        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,21,183,62,3,0         // vbroadcastss  0x33eb7(%rip),%ymm10        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,44,92,208                       // vsubps        %ymm0,%ymm10,%ymm10
   .byte  196,195,125,74,194,144              // vblendvps     %ymm9,%ymm10,%ymm0,%ymm0
   .byte  98,209,124,40,194,192,3             // vcmpunordps   %ymm8,%ymm0,%k0
@@ -6367,7 +6294,7 @@
 .globl _sk_negate_x_skx
 FUNCTION(_sk_negate_x_skx)
 _sk_negate_x_skx:
-  .byte  98,241,124,56,87,5,236,69,3,0       // vxorps        0x345ec(%rip){1to8},%ymm0,%ymm0        # 3acbc <_sk_srcover_bgra_8888_sse2_lowp+0x3f0>
+  .byte  98,241,124,56,87,5,186,63,3,0       // vxorps        0x33fba(%rip){1to8},%ymm0,%ymm0        # 3a4ec <_sk_srcover_bgra_8888_sse2_lowp+0x3f0>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -6446,7 +6373,7 @@
 .globl _sk_alter_2pt_conical_unswap_skx
 FUNCTION(_sk_alter_2pt_conical_unswap_skx)
 _sk_alter_2pt_conical_unswap_skx:
-  .byte  196,98,125,24,5,8,68,3,0            // vbroadcastss  0x34408(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,214,61,3,0          // vbroadcastss  0x33dd6(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,188,92,192                      // vsubps        %ymm0,%ymm8,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -6499,7 +6426,7 @@
 FUNCTION(_sk_save_xy_skx)
 _sk_save_xy_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,98,125,24,5,125,67,3,0          // vbroadcastss  0x3437d(%rip),%ymm8        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,5,75,61,3,0           // vbroadcastss  0x33d4b(%rip),%ymm8        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,65,124,88,200                   // vaddps        %ymm8,%ymm0,%ymm9
   .byte  196,67,125,8,209,1                  // vroundps      $0x1,%ymm9,%ymm10
   .byte  196,65,52,92,202                    // vsubps        %ymm10,%ymm9,%ymm9
@@ -6534,8 +6461,8 @@
 _sk_bilinear_nx_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,16,0                        // vmovups       (%rax),%ymm0
-  .byte  98,241,124,56,88,5,74,68,3,0        // vaddps        0x3444a(%rip){1to8},%ymm0,%ymm0        # 3acc0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
-  .byte  196,98,125,24,5,253,66,3,0          // vbroadcastss  0x342fd(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  98,241,124,56,88,5,24,62,3,0        // vaddps        0x33e18(%rip){1to8},%ymm0,%ymm0        # 3a4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  .byte  196,98,125,24,5,203,60,3,0          // vbroadcastss  0x33ccb(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,128,128,0,0,0             // vsubps        0x80(%rax),%ymm8,%ymm8
   .byte  197,124,17,128,0,1,0,0              // vmovups       %ymm8,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -6548,7 +6475,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,16,0                        // vmovups       (%rax),%ymm0
   .byte  197,124,16,128,128,0,0,0            // vmovups       0x80(%rax),%ymm8
-  .byte  98,241,124,56,88,5,205,66,3,0       // vaddps        0x342cd(%rip){1to8},%ymm0,%ymm0        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  98,241,124,56,88,5,155,60,3,0       // vaddps        0x33c9b(%rip){1to8},%ymm0,%ymm0        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,124,17,128,0,1,0,0              // vmovups       %ymm8,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -6559,8 +6486,8 @@
 _sk_bilinear_ny_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,16,72,64                    // vmovups       0x40(%rax),%ymm1
-  .byte  98,241,116,56,88,13,248,67,3,0      // vaddps        0x343f8(%rip){1to8},%ymm1,%ymm1        # 3acc0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
-  .byte  196,98,125,24,5,171,66,3,0          // vbroadcastss  0x342ab(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  98,241,116,56,88,13,198,61,3,0      // vaddps        0x33dc6(%rip){1to8},%ymm1,%ymm1        # 3a4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  .byte  196,98,125,24,5,121,60,3,0          // vbroadcastss  0x33c79(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,128,192,0,0,0             // vsubps        0xc0(%rax),%ymm8,%ymm8
   .byte  197,124,17,128,64,1,0,0             // vmovups       %ymm8,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -6573,7 +6500,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,16,72,64                    // vmovups       0x40(%rax),%ymm1
   .byte  197,124,16,128,192,0,0,0            // vmovups       0xc0(%rax),%ymm8
-  .byte  98,241,116,56,88,13,122,66,3,0      // vaddps        0x3427a(%rip){1to8},%ymm1,%ymm1        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  98,241,116,56,88,13,72,60,3,0       // vaddps        0x33c48(%rip){1to8},%ymm1,%ymm1        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,124,17,128,64,1,0,0             // vmovups       %ymm8,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -6584,12 +6511,12 @@
 _sk_bicubic_n3x_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,16,0                        // vmovups       (%rax),%ymm0
-  .byte  98,241,124,56,88,5,170,67,3,0       // vaddps        0x343aa(%rip){1to8},%ymm0,%ymm0        # 3acc4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f8>
-  .byte  196,98,125,24,5,89,66,3,0           // vbroadcastss  0x34259(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  98,241,124,56,88,5,120,61,3,0       // vaddps        0x33d78(%rip){1to8},%ymm0,%ymm0        # 3a4f4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f8>
+  .byte  196,98,125,24,5,39,60,3,0           // vbroadcastss  0x33c27(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,128,128,0,0,0             // vsubps        0x80(%rax),%ymm8,%ymm8
   .byte  196,65,60,89,200                    // vmulps        %ymm8,%ymm8,%ymm9
-  .byte  196,98,125,24,21,143,67,3,0         // vbroadcastss  0x3438f(%rip),%ymm10        # 3acc8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
-  .byte  98,114,61,56,168,21,173,66,3,0      // vfmadd213ps   0x342ad(%rip){1to8},%ymm8,%ymm10        # 3abf0 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  .byte  196,98,125,24,21,93,61,3,0          // vbroadcastss  0x33d5d(%rip),%ymm10        # 3a4f8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
+  .byte  98,114,61,56,168,21,123,60,3,0      // vfmadd213ps   0x33c7b(%rip){1to8},%ymm8,%ymm10        # 3a420 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
   .byte  196,65,44,89,193                    // vmulps        %ymm9,%ymm10,%ymm8
   .byte  197,124,17,128,0,1,0,0              // vmovups       %ymm8,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -6601,13 +6528,13 @@
 _sk_bicubic_n1x_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,16,0                        // vmovups       (%rax),%ymm0
-  .byte  98,241,124,56,88,5,92,67,3,0        // vaddps        0x3435c(%rip){1to8},%ymm0,%ymm0        # 3acc0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
-  .byte  196,98,125,24,5,15,66,3,0           // vbroadcastss  0x3420f(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  98,241,124,56,88,5,42,61,3,0        // vaddps        0x33d2a(%rip){1to8},%ymm0,%ymm0        # 3a4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  .byte  196,98,125,24,5,221,59,3,0          // vbroadcastss  0x33bdd(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,128,128,0,0,0             // vsubps        0x80(%rax),%ymm8,%ymm8
-  .byte  196,98,125,24,13,78,67,3,0          // vbroadcastss  0x3434e(%rip),%ymm9        # 3accc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
-  .byte  98,114,61,56,168,13,72,67,3,0       // vfmadd213ps   0x34348(%rip){1to8},%ymm8,%ymm9        # 3acd0 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
-  .byte  98,114,61,56,168,13,230,65,3,0      // vfmadd213ps   0x341e6(%rip){1to8},%ymm8,%ymm9        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
-  .byte  98,114,61,56,168,13,56,67,3,0       // vfmadd213ps   0x34338(%rip){1to8},%ymm8,%ymm9        # 3acd4 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
+  .byte  196,98,125,24,13,28,61,3,0          // vbroadcastss  0x33d1c(%rip),%ymm9        # 3a4fc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  .byte  98,114,61,56,168,13,22,61,3,0       // vfmadd213ps   0x33d16(%rip){1to8},%ymm8,%ymm9        # 3a500 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  .byte  98,114,61,56,168,13,180,59,3,0      // vfmadd213ps   0x33bb4(%rip){1to8},%ymm8,%ymm9        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  98,114,61,56,168,13,6,61,3,0        // vfmadd213ps   0x33d06(%rip){1to8},%ymm8,%ymm9        # 3a504 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
   .byte  197,124,17,136,0,1,0,0              // vmovups       %ymm9,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -6617,13 +6544,13 @@
 FUNCTION(_sk_bicubic_p1x_skx)
 _sk_bicubic_p1x_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,98,125,24,5,197,65,3,0          // vbroadcastss  0x341c5(%rip),%ymm8        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,5,147,59,3,0          // vbroadcastss  0x33b93(%rip),%ymm8        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,188,88,0                        // vaddps        (%rax),%ymm8,%ymm0
   .byte  197,124,16,136,128,0,0,0            // vmovups       0x80(%rax),%ymm9
-  .byte  196,98,125,24,21,4,67,3,0           // vbroadcastss  0x34304(%rip),%ymm10        # 3accc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
-  .byte  98,114,53,56,168,21,254,66,3,0      // vfmadd213ps   0x342fe(%rip){1to8},%ymm9,%ymm10        # 3acd0 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  .byte  196,98,125,24,21,210,60,3,0         // vbroadcastss  0x33cd2(%rip),%ymm10        # 3a4fc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  .byte  98,114,53,56,168,21,204,60,3,0      // vfmadd213ps   0x33ccc(%rip){1to8},%ymm9,%ymm10        # 3a500 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
   .byte  196,66,53,168,208                   // vfmadd213ps   %ymm8,%ymm9,%ymm10
-  .byte  98,114,53,56,168,21,243,66,3,0      // vfmadd213ps   0x342f3(%rip){1to8},%ymm9,%ymm10        # 3acd4 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
+  .byte  98,114,53,56,168,21,193,60,3,0      // vfmadd213ps   0x33cc1(%rip){1to8},%ymm9,%ymm10        # 3a504 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
   .byte  197,124,17,144,0,1,0,0              // vmovups       %ymm10,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -6635,10 +6562,10 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,16,0                        // vmovups       (%rax),%ymm0
   .byte  197,124,16,128,128,0,0,0            // vmovups       0x80(%rax),%ymm8
-  .byte  98,241,124,56,88,5,203,66,3,0       // vaddps        0x342cb(%rip){1to8},%ymm0,%ymm0        # 3acd0 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  .byte  98,241,124,56,88,5,153,60,3,0       // vaddps        0x33c99(%rip){1to8},%ymm0,%ymm0        # 3a500 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
   .byte  196,65,60,89,200                    // vmulps        %ymm8,%ymm8,%ymm9
-  .byte  196,98,125,24,21,181,66,3,0         // vbroadcastss  0x342b5(%rip),%ymm10        # 3acc8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
-  .byte  98,114,61,56,168,21,211,65,3,0      // vfmadd213ps   0x341d3(%rip){1to8},%ymm8,%ymm10        # 3abf0 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  .byte  196,98,125,24,21,131,60,3,0         // vbroadcastss  0x33c83(%rip),%ymm10        # 3a4f8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
+  .byte  98,114,61,56,168,21,161,59,3,0      // vfmadd213ps   0x33ba1(%rip){1to8},%ymm8,%ymm10        # 3a420 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
   .byte  196,65,52,89,194                    // vmulps        %ymm10,%ymm9,%ymm8
   .byte  197,124,17,128,0,1,0,0              // vmovups       %ymm8,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -6650,12 +6577,12 @@
 _sk_bicubic_n3y_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,16,72,64                    // vmovups       0x40(%rax),%ymm1
-  .byte  98,241,116,56,88,13,133,66,3,0      // vaddps        0x34285(%rip){1to8},%ymm1,%ymm1        # 3acc4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f8>
-  .byte  196,98,125,24,5,52,65,3,0           // vbroadcastss  0x34134(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  98,241,116,56,88,13,83,60,3,0       // vaddps        0x33c53(%rip){1to8},%ymm1,%ymm1        # 3a4f4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f8>
+  .byte  196,98,125,24,5,2,59,3,0            // vbroadcastss  0x33b02(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,128,192,0,0,0             // vsubps        0xc0(%rax),%ymm8,%ymm8
   .byte  196,65,60,89,200                    // vmulps        %ymm8,%ymm8,%ymm9
-  .byte  196,98,125,24,21,106,66,3,0         // vbroadcastss  0x3426a(%rip),%ymm10        # 3acc8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
-  .byte  98,114,61,56,168,21,136,65,3,0      // vfmadd213ps   0x34188(%rip){1to8},%ymm8,%ymm10        # 3abf0 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  .byte  196,98,125,24,21,56,60,3,0          // vbroadcastss  0x33c38(%rip),%ymm10        # 3a4f8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
+  .byte  98,114,61,56,168,21,86,59,3,0       // vfmadd213ps   0x33b56(%rip){1to8},%ymm8,%ymm10        # 3a420 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
   .byte  196,65,44,89,193                    // vmulps        %ymm9,%ymm10,%ymm8
   .byte  197,124,17,128,64,1,0,0             // vmovups       %ymm8,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -6667,13 +6594,13 @@
 _sk_bicubic_n1y_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,16,72,64                    // vmovups       0x40(%rax),%ymm1
-  .byte  98,241,116,56,88,13,54,66,3,0       // vaddps        0x34236(%rip){1to8},%ymm1,%ymm1        # 3acc0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
-  .byte  196,98,125,24,5,233,64,3,0          // vbroadcastss  0x340e9(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  98,241,116,56,88,13,4,60,3,0        // vaddps        0x33c04(%rip){1to8},%ymm1,%ymm1        # 3a4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  .byte  196,98,125,24,5,183,58,3,0          // vbroadcastss  0x33ab7(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,128,192,0,0,0             // vsubps        0xc0(%rax),%ymm8,%ymm8
-  .byte  196,98,125,24,13,40,66,3,0          // vbroadcastss  0x34228(%rip),%ymm9        # 3accc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
-  .byte  98,114,61,56,168,13,34,66,3,0       // vfmadd213ps   0x34222(%rip){1to8},%ymm8,%ymm9        # 3acd0 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
-  .byte  98,114,61,56,168,13,192,64,3,0      // vfmadd213ps   0x340c0(%rip){1to8},%ymm8,%ymm9        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
-  .byte  98,114,61,56,168,13,18,66,3,0       // vfmadd213ps   0x34212(%rip){1to8},%ymm8,%ymm9        # 3acd4 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
+  .byte  196,98,125,24,13,246,59,3,0         // vbroadcastss  0x33bf6(%rip),%ymm9        # 3a4fc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  .byte  98,114,61,56,168,13,240,59,3,0      // vfmadd213ps   0x33bf0(%rip){1to8},%ymm8,%ymm9        # 3a500 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  .byte  98,114,61,56,168,13,142,58,3,0      // vfmadd213ps   0x33a8e(%rip){1to8},%ymm8,%ymm9        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  98,114,61,56,168,13,224,59,3,0      // vfmadd213ps   0x33be0(%rip){1to8},%ymm8,%ymm9        # 3a504 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
   .byte  197,124,17,136,64,1,0,0             // vmovups       %ymm9,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -6683,13 +6610,13 @@
 FUNCTION(_sk_bicubic_p1y_skx)
 _sk_bicubic_p1y_skx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,98,125,24,5,159,64,3,0          // vbroadcastss  0x3409f(%rip),%ymm8        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,5,109,58,3,0          // vbroadcastss  0x33a6d(%rip),%ymm8        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,188,88,72,64                    // vaddps        0x40(%rax),%ymm8,%ymm1
   .byte  197,124,16,136,192,0,0,0            // vmovups       0xc0(%rax),%ymm9
-  .byte  196,98,125,24,21,221,65,3,0         // vbroadcastss  0x341dd(%rip),%ymm10        # 3accc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
-  .byte  98,114,53,56,168,21,215,65,3,0      // vfmadd213ps   0x341d7(%rip){1to8},%ymm9,%ymm10        # 3acd0 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  .byte  196,98,125,24,21,171,59,3,0         // vbroadcastss  0x33bab(%rip),%ymm10        # 3a4fc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  .byte  98,114,53,56,168,21,165,59,3,0      // vfmadd213ps   0x33ba5(%rip){1to8},%ymm9,%ymm10        # 3a500 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
   .byte  196,66,53,168,208                   // vfmadd213ps   %ymm8,%ymm9,%ymm10
-  .byte  98,114,53,56,168,21,204,65,3,0      // vfmadd213ps   0x341cc(%rip){1to8},%ymm9,%ymm10        # 3acd4 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
+  .byte  98,114,53,56,168,21,154,59,3,0      // vfmadd213ps   0x33b9a(%rip){1to8},%ymm9,%ymm10        # 3a504 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
   .byte  197,124,17,144,64,1,0,0             // vmovups       %ymm10,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -6701,10 +6628,10 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,16,72,64                    // vmovups       0x40(%rax),%ymm1
   .byte  197,124,16,128,192,0,0,0            // vmovups       0xc0(%rax),%ymm8
-  .byte  98,241,116,56,88,13,163,65,3,0      // vaddps        0x341a3(%rip){1to8},%ymm1,%ymm1        # 3acd0 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  .byte  98,241,116,56,88,13,113,59,3,0      // vaddps        0x33b71(%rip){1to8},%ymm1,%ymm1        # 3a500 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
   .byte  196,65,60,89,200                    // vmulps        %ymm8,%ymm8,%ymm9
-  .byte  196,98,125,24,21,141,65,3,0         // vbroadcastss  0x3418d(%rip),%ymm10        # 3acc8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
-  .byte  98,114,61,56,168,21,171,64,3,0      // vfmadd213ps   0x340ab(%rip){1to8},%ymm8,%ymm10        # 3abf0 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  .byte  196,98,125,24,21,91,59,3,0          // vbroadcastss  0x33b5b(%rip),%ymm10        # 3a4f8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
+  .byte  98,114,61,56,168,21,121,58,3,0      // vfmadd213ps   0x33a79(%rip){1to8},%ymm8,%ymm10        # 3a420 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
   .byte  196,65,52,89,194                    // vmulps        %ymm10,%ymm9,%ymm8
   .byte  197,124,17,128,64,1,0,0             // vmovups       %ymm8,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -6830,7 +6757,7 @@
   .byte  98,226,61,40,64,224                 // vpmulld       %ymm0,%ymm8,%ymm20
   .byte  98,209,93,32,254,193                // vpaddd        %ymm9,%ymm20,%ymm0
   .byte  72,139,0                            // mov           (%rax),%rax
-  .byte  98,98,125,40,88,29,151,63,3,0       // vpbroadcastd  0x33f97(%rip),%ymm27        # 3acdc <_sk_srcover_bgra_8888_sse2_lowp+0x410>
+  .byte  98,98,125,40,88,29,101,57,3,0       // vpbroadcastd  0x33965(%rip),%ymm27        # 3a50c <_sk_srcover_bgra_8888_sse2_lowp+0x410>
   .byte  98,146,125,40,64,195                // vpmulld       %ymm27,%ymm0,%ymm0
   .byte  196,65,45,239,210                   // vpxor         %ymm10,%ymm10,%ymm10
   .byte  197,245,118,201                     // vpcmpeqd      %ymm1,%ymm1,%ymm1
@@ -6843,9 +6770,9 @@
   .byte  196,65,37,118,219                   // vpcmpeqd      %ymm11,%ymm11,%ymm11
   .byte  196,162,37,146,12,144               // vgatherdps    %ymm11,(%rax,%ymm10,4),%ymm1
   .byte  98,97,124,40,40,233                 // vmovaps       %ymm1,%ymm29
-  .byte  196,98,125,24,21,77,63,3,0          // vbroadcastss  0x33f4d(%rip),%ymm10        # 3acd8 <_sk_srcover_bgra_8888_sse2_lowp+0x40c>
+  .byte  196,98,125,24,21,27,57,3,0          // vbroadcastss  0x3391b(%rip),%ymm10        # 3a508 <_sk_srcover_bgra_8888_sse2_lowp+0x40c>
   .byte  98,81,60,32,88,218                  // vaddps        %ymm10,%ymm24,%ymm11
-  .byte  98,226,125,40,88,5,237,61,3,0       // vpbroadcastd  0x33ded(%rip),%ymm16        # 3ab88 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
+  .byte  98,226,125,40,88,5,187,55,3,0       // vpbroadcastd  0x337bb(%rip),%ymm16        # 3a3b8 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
   .byte  98,177,125,40,254,192               // vpaddd        %ymm16,%ymm0,%ymm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  196,65,29,118,228                   // vpcmpeqd      %ymm12,%ymm12,%ymm12
@@ -7085,7 +7012,7 @@
   .byte  98,162,45,40,64,229                 // vpmulld       %ymm21,%ymm10,%ymm20
   .byte  98,241,93,32,254,193                // vpaddd        %ymm1,%ymm20,%ymm0
   .byte  72,139,0                            // mov           (%rax),%rax
-  .byte  98,226,125,40,88,5,41,58,3,0        // vpbroadcastd  0x33a29(%rip),%ymm16        # 3acdc <_sk_srcover_bgra_8888_sse2_lowp+0x410>
+  .byte  98,226,125,40,88,5,247,51,3,0       // vpbroadcastd  0x333f7(%rip),%ymm16        # 3a50c <_sk_srcover_bgra_8888_sse2_lowp+0x410>
   .byte  98,50,125,40,64,216                 // vpmulld       %ymm16,%ymm0,%ymm11
   .byte  196,65,28,87,228                    // vxorps        %ymm12,%ymm12,%ymm12
   .byte  197,253,118,192                     // vpcmpeqd      %ymm0,%ymm0,%ymm0
@@ -7097,9 +7024,9 @@
   .byte  196,65,29,118,228                   // vpcmpeqd      %ymm12,%ymm12,%ymm12
   .byte  196,98,29,146,44,128                // vgatherdps    %ymm12,(%rax,%ymm0,4),%ymm13
   .byte  197,124,17,172,36,192,4,0,0         // vmovups       %ymm13,0x4c0(%rsp)
-  .byte  196,226,125,24,5,219,57,3,0         // vbroadcastss  0x339db(%rip),%ymm0        # 3acd8 <_sk_srcover_bgra_8888_sse2_lowp+0x40c>
+  .byte  196,226,125,24,5,169,51,3,0         // vbroadcastss  0x333a9(%rip),%ymm0        # 3a508 <_sk_srcover_bgra_8888_sse2_lowp+0x40c>
   .byte  98,113,28,32,88,224                 // vaddps        %ymm0,%ymm28,%ymm12
-  .byte  98,226,125,40,88,13,123,56,3,0      // vpbroadcastd  0x3387b(%rip),%ymm17        # 3ab88 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
+  .byte  98,226,125,40,88,13,73,50,3,0       // vpbroadcastd  0x33249(%rip),%ymm17        # 3a3b8 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
   .byte  98,49,37,40,254,217                 // vpaddd        %ymm17,%ymm11,%ymm11
   .byte  197,236,87,210                      // vxorps        %ymm2,%ymm2,%ymm2
   .byte  196,65,21,118,237                   // vpcmpeqd      %ymm13,%ymm13,%ymm13
@@ -7504,7 +7431,7 @@
   .byte  197,228,92,214                      // vsubps        %ymm6,%ymm3,%ymm2
   .byte  196,226,93,168,214                  // vfmadd213ps   %ymm6,%ymm4,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,25,47,3,0         // vbroadcastss  0x32f19(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,231,40,3,0        // vbroadcastss  0x328e7(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  98,145,124,40,40,227                // vmovaps       %ymm27,%ymm4
   .byte  197,252,16,108,36,128               // vmovups       -0x80(%rsp),%ymm5
   .byte  197,252,16,116,36,160               // vmovups       -0x60(%rsp),%ymm6
@@ -7516,11 +7443,11 @@
 .globl _sk_gauss_a_to_rgba_skx
 FUNCTION(_sk_gauss_a_to_rgba_skx)
 _sk_gauss_a_to_rgba_skx:
-  .byte  196,226,125,24,5,83,48,3,0          // vbroadcastss  0x33053(%rip),%ymm0        # 3ace0 <_sk_srcover_bgra_8888_sse2_lowp+0x414>
-  .byte  98,242,101,56,168,5,77,48,3,0       // vfmadd213ps   0x3304d(%rip){1to8},%ymm3,%ymm0        # 3ace4 <_sk_srcover_bgra_8888_sse2_lowp+0x418>
-  .byte  98,242,101,56,168,5,71,48,3,0       // vfmadd213ps   0x33047(%rip){1to8},%ymm3,%ymm0        # 3ace8 <_sk_srcover_bgra_8888_sse2_lowp+0x41c>
-  .byte  98,242,101,56,168,5,65,48,3,0       // vfmadd213ps   0x33041(%rip){1to8},%ymm3,%ymm0        # 3acec <_sk_srcover_bgra_8888_sse2_lowp+0x420>
-  .byte  98,242,101,56,168,5,59,48,3,0       // vfmadd213ps   0x3303b(%rip){1to8},%ymm3,%ymm0        # 3acf0 <_sk_srcover_bgra_8888_sse2_lowp+0x424>
+  .byte  196,226,125,24,5,33,42,3,0          // vbroadcastss  0x32a21(%rip),%ymm0        # 3a510 <_sk_srcover_bgra_8888_sse2_lowp+0x414>
+  .byte  98,242,101,56,168,5,27,42,3,0       // vfmadd213ps   0x32a1b(%rip){1to8},%ymm3,%ymm0        # 3a514 <_sk_srcover_bgra_8888_sse2_lowp+0x418>
+  .byte  98,242,101,56,168,5,21,42,3,0       // vfmadd213ps   0x32a15(%rip){1to8},%ymm3,%ymm0        # 3a518 <_sk_srcover_bgra_8888_sse2_lowp+0x41c>
+  .byte  98,242,101,56,168,5,15,42,3,0       // vfmadd213ps   0x32a0f(%rip){1to8},%ymm3,%ymm0        # 3a51c <_sk_srcover_bgra_8888_sse2_lowp+0x420>
+  .byte  98,242,101,56,168,5,9,42,3,0        // vfmadd213ps   0x32a09(%rip){1to8},%ymm3,%ymm0        # 3a520 <_sk_srcover_bgra_8888_sse2_lowp+0x424>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,40,200                      // vmovaps       %ymm0,%ymm1
   .byte  197,252,40,208                      // vmovaps       %ymm0,%ymm2
@@ -7536,7 +7463,7 @@
   .byte  197,252,17,108,36,136               // vmovups       %ymm5,-0x78(%rsp)
   .byte  98,225,124,40,40,244                // vmovaps       %ymm4,%ymm22
   .byte  98,97,124,40,40,249                 // vmovaps       %ymm1,%ymm31
-  .byte  196,226,125,24,21,140,46,3,0        // vbroadcastss  0x32e8c(%rip),%ymm2        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,226,125,24,21,90,40,3,0         // vbroadcastss  0x3285a(%rip),%ymm2        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,252,88,218                      // vaddps        %ymm2,%ymm0,%ymm3
   .byte  196,227,125,8,227,1                 // vroundps      $0x1,%ymm3,%ymm4
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -7544,7 +7471,7 @@
   .byte  196,227,125,8,234,1                 // vroundps      $0x1,%ymm2,%ymm5
   .byte  197,100,92,212                      // vsubps        %ymm4,%ymm3,%ymm10
   .byte  197,236,92,205                      // vsubps        %ymm5,%ymm2,%ymm1
-  .byte  196,226,125,24,21,103,46,3,0        // vbroadcastss  0x32e67(%rip),%ymm2        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,21,53,40,3,0         // vbroadcastss  0x32835(%rip),%ymm2        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,108,92,226                   // vsubps        %ymm10,%ymm2,%ymm12
   .byte  98,225,124,40,40,217                // vmovaps       %ymm1,%ymm19
   .byte  98,225,108,40,92,233                // vsubps        %ymm1,%ymm2,%ymm21
@@ -7555,13 +7482,13 @@
   .byte  98,225,109,40,254,211               // vpaddd        %ymm3,%ymm2,%ymm18
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  98,226,125,40,88,64,2               // vpbroadcastd  0x8(%rax),%ymm16
-  .byte  98,225,126,8,16,13,108,47,3,0       // vmovss        0x32f6c(%rip),%xmm17        # 3acc0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  .byte  98,225,126,8,16,13,58,41,3,0        // vmovss        0x3293a(%rip),%xmm17        # 3a4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   .byte  196,65,20,87,237                    // vxorps        %ymm13,%ymm13,%ymm13
   .byte  197,192,87,255                      // vxorps        %xmm7,%xmm7,%xmm7
   .byte  184,17,17,17,17                     // mov           $0x11111111,%eax
-  .byte  98,226,125,40,24,37,136,46,3,0      // vbroadcastss  0x32e88(%rip),%ymm20        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
-  .byte  197,250,16,53,8,46,3,0              // vmovss        0x32e08(%rip),%xmm6        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
-  .byte  197,250,16,45,252,45,3,0            // vmovss        0x32dfc(%rip),%xmm5        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  98,226,125,40,24,37,86,40,3,0       // vbroadcastss  0x32856(%rip),%ymm20        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  197,250,16,53,214,39,3,0            // vmovss        0x327d6(%rip),%xmm6        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  197,250,16,45,202,39,3,0            // vmovss        0x327ca(%rip),%xmm5        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,229,239,219                     // vpxor         %ymm3,%ymm3,%ymm3
   .byte  197,237,239,210                     // vpxor         %ymm2,%ymm2,%ymm2
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
@@ -7573,7 +7500,7 @@
   .byte  98,97,124,8,46,207                  // vucomiss      %xmm7,%xmm25
   .byte  98,177,124,40,40,203                // vmovaps       %ymm19,%ymm1
   .byte  98,225,124,40,40,249                // vmovaps       %ymm1,%ymm23
-  .byte  119,12                              // ja            7dc4 <_sk_bilerp_clamp_8888_skx+0xff>
+  .byte  119,12                              // ja            7c26 <_sk_bilerp_clamp_8888_skx+0xff>
   .byte  98,177,124,40,40,205                // vmovaps       %ymm21,%ymm1
   .byte  98,225,124,40,40,249                // vmovaps       %ymm1,%ymm23
   .byte  98,177,92,40,93,226                 // vminps        %ymm18,%ymm4,%ymm4
@@ -7606,7 +7533,7 @@
   .byte  98,33,116,40,89,236                 // vmulps        %ymm20,%ymm1,%ymm29
   .byte  197,248,46,231                      // vucomiss      %xmm7,%xmm4
   .byte  98,65,124,40,40,242                 // vmovaps       %ymm10,%ymm30
-  .byte  119,6                               // ja            7e6f <_sk_bilerp_clamp_8888_skx+0x1aa>
+  .byte  119,6                               // ja            7cd1 <_sk_bilerp_clamp_8888_skx+0x1aa>
   .byte  98,65,124,40,40,244                 // vmovaps       %ymm12,%ymm30
   .byte  98,145,68,32,89,206                 // vmulps        %ymm30,%ymm23,%ymm1
   .byte  98,18,117,40,184,202                // vfmadd231ps   %ymm26,%ymm1,%ymm9
@@ -7615,10 +7542,10 @@
   .byte  98,146,117,40,184,221               // vfmadd231ps   %ymm29,%ymm1,%ymm3
   .byte  197,218,88,230                      // vaddss        %xmm6,%xmm4,%xmm4
   .byte  197,248,46,236                      // vucomiss      %xmm4,%xmm5
-  .byte  15,131,63,255,255,255               // jae           7dda <_sk_bilerp_clamp_8888_skx+0x115>
+  .byte  15,131,63,255,255,255               // jae           7c3c <_sk_bilerp_clamp_8888_skx+0x115>
   .byte  98,97,54,0,88,206                   // vaddss        %xmm6,%xmm25,%xmm25
   .byte  98,145,124,8,46,233                 // vucomiss      %xmm25,%xmm5
-  .byte  15,131,231,254,255,255              // jae           7d94 <_sk_bilerp_clamp_8888_skx+0xcf>
+  .byte  15,131,231,254,255,255              // jae           7bf6 <_sk_bilerp_clamp_8888_skx+0xcf>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,124,41,200                      // vmovaps       %ymm9,%ymm0
   .byte  197,124,41,193                      // vmovaps       %ymm8,%ymm1
@@ -7628,8 +7555,6 @@
   .byte  197,252,16,124,36,200               // vmovups       -0x38(%rsp),%ymm7
   .byte  255,224                             // jmpq          *%rax
   .byte  144                                 // nop
-  .byte  144                                 // nop
-  .byte  144                                 // nop
 
 HIDDEN _sk_start_pipeline_hsw
 .globl _sk_start_pipeline_hsw
@@ -7652,13 +7577,13 @@
   .byte  73,137,246                          // mov           %rsi,%r14
   .byte  72,137,77,192                       // mov           %rcx,-0x40(%rbp)
   .byte  72,57,203                           // cmp           %rcx,%rbx
-  .byte  15,131,151,0,0,0                    // jae           7f9e <_sk_start_pipeline_hsw+0xca>
+  .byte  15,131,151,0,0,0                    // jae           7dfe <_sk_start_pipeline_hsw+0xca>
   .byte  72,139,69,208                       // mov           -0x30(%rbp),%rax
   .byte  72,141,64,8                         // lea           0x8(%rax),%rax
   .byte  72,137,69,200                       // mov           %rax,-0x38(%rbp)
   .byte  72,139,85,208                       // mov           -0x30(%rbp),%rdx
   .byte  76,57,125,200                       // cmp           %r15,-0x38(%rbp)
-  .byte  119,67                              // ja            7f60 <_sk_start_pipeline_hsw+0x8c>
+  .byte  119,67                              // ja            7dc0 <_sk_start_pipeline_hsw+0x8c>
   .byte  76,139,101,208                      // mov           -0x30(%rbp),%r12
   .byte  49,255                              // xor           %edi,%edi
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
@@ -7677,10 +7602,10 @@
   .byte  73,131,196,16                       // add           $0x10,%r12
   .byte  77,57,252                           // cmp           %r15,%r12
   .byte  73,137,212                          // mov           %rdx,%r12
-  .byte  118,193                             // jbe           7f21 <_sk_start_pipeline_hsw+0x4d>
+  .byte  118,193                             // jbe           7d81 <_sk_start_pipeline_hsw+0x4d>
   .byte  76,137,255                          // mov           %r15,%rdi
   .byte  72,41,215                           // sub           %rdx,%rdi
-  .byte  116,41                              // je            7f91 <_sk_start_pipeline_hsw+0xbd>
+  .byte  116,41                              // je            7df1 <_sk_start_pipeline_hsw+0xbd>
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  197,236,87,210                      // vxorps        %ymm2,%ymm2,%ymm2
@@ -7694,7 +7619,7 @@
   .byte  65,255,213                          // callq         *%r13
   .byte  72,255,195                          // inc           %rbx
   .byte  72,59,93,192                        // cmp           -0x40(%rbp),%rbx
-  .byte  15,133,117,255,255,255              // jne           7f13 <_sk_start_pipeline_hsw+0x3f>
+  .byte  15,133,117,255,255,255              // jne           7d73 <_sk_start_pipeline_hsw+0x3f>
   .byte  72,131,196,24                       // add           $0x18,%rsp
   .byte  91                                  // pop           %rbx
   .byte  65,92                               // pop           %r12
@@ -7723,10 +7648,10 @@
   .byte  197,249,110,201                     // vmovd         %ecx,%xmm1
   .byte  196,226,125,88,201                  // vpbroadcastd  %xmm1,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  196,226,125,24,21,158,43,3,0        // vbroadcastss  0x32b9e(%rip),%ymm2        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,226,125,24,21,110,37,3,0        // vbroadcastss  0x3256e(%rip),%ymm2        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,244,88,202                      // vaddps        %ymm2,%ymm1,%ymm1
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,21,147,43,3,0        // vbroadcastss  0x32b93(%rip),%ymm2        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,21,99,37,3,0         // vbroadcastss  0x32563(%rip),%ymm2        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,228,87,219                      // vxorps        %ymm3,%ymm3,%ymm3
   .byte  197,220,87,228                      // vxorps        %ymm4,%ymm4,%ymm4
   .byte  197,212,87,237                      // vxorps        %ymm5,%ymm5,%ymm5
@@ -7741,17 +7666,17 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,121,110,194                     // vmovd         %edx,%xmm8
   .byte  196,66,125,88,192                   // vpbroadcastd  %xmm8,%ymm8
-  .byte  197,61,254,5,46,45,3,0              // vpaddd        0x32d2e(%rip),%ymm8,%ymm8        # 3ad40 <_sk_srcover_bgra_8888_sse2_lowp+0x474>
+  .byte  197,61,254,5,14,39,3,0              // vpaddd        0x3270e(%rip),%ymm8,%ymm8        # 3a580 <_sk_srcover_bgra_8888_sse2_lowp+0x484>
   .byte  197,121,110,201                     // vmovd         %ecx,%xmm9
   .byte  196,66,125,88,201                   // vpbroadcastd  %xmm9,%ymm9
   .byte  196,65,53,239,200                   // vpxor         %ymm8,%ymm9,%ymm9
-  .byte  196,98,125,88,21,87,43,3,0          // vpbroadcastd  0x32b57(%rip),%ymm10        # 3ab80 <_sk_srcover_bgra_8888_sse2_lowp+0x2b4>
+  .byte  196,98,125,88,21,39,37,3,0          // vpbroadcastd  0x32527(%rip),%ymm10        # 3a3b0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b4>
   .byte  196,65,53,219,218                   // vpand         %ymm10,%ymm9,%ymm11
   .byte  196,193,37,114,243,5                // vpslld        $0x5,%ymm11,%ymm11
   .byte  196,65,61,219,210                   // vpand         %ymm10,%ymm8,%ymm10
   .byte  196,193,45,114,242,4                // vpslld        $0x4,%ymm10,%ymm10
-  .byte  196,98,125,88,37,60,43,3,0          // vpbroadcastd  0x32b3c(%rip),%ymm12        # 3ab84 <_sk_srcover_bgra_8888_sse2_lowp+0x2b8>
-  .byte  196,98,125,88,45,55,43,3,0          // vpbroadcastd  0x32b37(%rip),%ymm13        # 3ab88 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
+  .byte  196,98,125,88,37,12,37,3,0          // vpbroadcastd  0x3250c(%rip),%ymm12        # 3a3b4 <_sk_srcover_bgra_8888_sse2_lowp+0x2b8>
+  .byte  196,98,125,88,45,7,37,3,0           // vpbroadcastd  0x32507(%rip),%ymm13        # 3a3b8 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
   .byte  196,65,53,219,245                   // vpand         %ymm13,%ymm9,%ymm14
   .byte  196,193,13,114,246,2                // vpslld        $0x2,%ymm14,%ymm14
   .byte  196,65,37,235,222                   // vpor          %ymm14,%ymm11,%ymm11
@@ -7766,8 +7691,8 @@
   .byte  196,65,61,235,195                   // vpor          %ymm11,%ymm8,%ymm8
   .byte  196,65,61,235,193                   // vpor          %ymm9,%ymm8,%ymm8
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  196,98,125,24,13,233,42,3,0         // vbroadcastss  0x32ae9(%rip),%ymm9        # 3ab8c <_sk_srcover_bgra_8888_sse2_lowp+0x2c0>
-  .byte  196,98,125,24,21,228,42,3,0         // vbroadcastss  0x32ae4(%rip),%ymm10        # 3ab90 <_sk_srcover_bgra_8888_sse2_lowp+0x2c4>
+  .byte  196,98,125,24,13,185,36,3,0         // vbroadcastss  0x324b9(%rip),%ymm9        # 3a3bc <_sk_srcover_bgra_8888_sse2_lowp+0x2c0>
+  .byte  196,98,125,24,21,180,36,3,0         // vbroadcastss  0x324b4(%rip),%ymm10        # 3a3c0 <_sk_srcover_bgra_8888_sse2_lowp+0x2c4>
   .byte  196,66,61,184,209                   // vfmadd231ps   %ymm9,%ymm8,%ymm10
   .byte  196,98,125,24,0                     // vbroadcastss  (%rax),%ymm8
   .byte  196,65,44,89,192                    // vmulps        %ymm8,%ymm10,%ymm8
@@ -7801,7 +7726,7 @@
 FUNCTION(_sk_black_color_hsw)
 _sk_black_color_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,108,42,3,0        // vbroadcastss  0x32a6c(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,60,36,3,0         // vbroadcastss  0x3243c(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  197,236,87,210                      // vxorps        %ymm2,%ymm2,%ymm2
@@ -7812,7 +7737,7 @@
 FUNCTION(_sk_white_color_hsw)
 _sk_white_color_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,83,42,3,0          // vbroadcastss  0x32a53(%rip),%ymm0        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,5,35,36,3,0          // vbroadcastss  0x32423(%rip),%ymm0        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,252,40,200                      // vmovaps       %ymm0,%ymm1
   .byte  197,252,40,208                      // vmovaps       %ymm0,%ymm2
   .byte  197,252,40,216                      // vmovaps       %ymm0,%ymm3
@@ -7858,7 +7783,7 @@
 FUNCTION(_sk_srcatop_hsw)
 _sk_srcatop_hsw:
   .byte  197,252,89,199                      // vmulps        %ymm7,%ymm0,%ymm0
-  .byte  196,98,125,24,5,242,41,3,0          // vbroadcastss  0x329f2(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,194,35,3,0          // vbroadcastss  0x323c2(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  196,226,61,184,196                  // vfmadd231ps   %ymm4,%ymm8,%ymm0
   .byte  197,244,89,207                      // vmulps        %ymm7,%ymm1,%ymm1
@@ -7874,7 +7799,7 @@
 .globl _sk_dstatop_hsw
 FUNCTION(_sk_dstatop_hsw)
 _sk_dstatop_hsw:
-  .byte  196,98,125,24,5,193,41,3,0          // vbroadcastss  0x329c1(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,145,35,3,0          // vbroadcastss  0x32391(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,199                       // vsubps        %ymm7,%ymm8,%ymm8
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
   .byte  196,226,101,184,196                 // vfmadd231ps   %ymm4,%ymm3,%ymm0
@@ -7913,7 +7838,7 @@
 .globl _sk_srcout_hsw
 FUNCTION(_sk_srcout_hsw)
 _sk_srcout_hsw:
-  .byte  196,98,125,24,5,100,41,3,0          // vbroadcastss  0x32964(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,52,35,3,0           // vbroadcastss  0x32334(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,199                       // vsubps        %ymm7,%ymm8,%ymm8
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
   .byte  197,188,89,201                      // vmulps        %ymm1,%ymm8,%ymm1
@@ -7926,7 +7851,7 @@
 .globl _sk_dstout_hsw
 FUNCTION(_sk_dstout_hsw)
 _sk_dstout_hsw:
-  .byte  196,226,125,24,5,67,41,3,0          // vbroadcastss  0x32943(%rip),%ymm0        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,5,19,35,3,0          // vbroadcastss  0x32313(%rip),%ymm0        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,252,92,219                      // vsubps        %ymm3,%ymm0,%ymm3
   .byte  197,228,89,196                      // vmulps        %ymm4,%ymm3,%ymm0
   .byte  197,228,89,205                      // vmulps        %ymm5,%ymm3,%ymm1
@@ -7939,7 +7864,7 @@
 .globl _sk_srcover_hsw
 FUNCTION(_sk_srcover_hsw)
 _sk_srcover_hsw:
-  .byte  196,98,125,24,5,34,41,3,0           // vbroadcastss  0x32922(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,242,34,3,0          // vbroadcastss  0x322f2(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  196,194,93,184,192                  // vfmadd231ps   %ymm8,%ymm4,%ymm0
   .byte  196,194,85,184,200                  // vfmadd231ps   %ymm8,%ymm5,%ymm1
@@ -7952,7 +7877,7 @@
 .globl _sk_dstover_hsw
 FUNCTION(_sk_dstover_hsw)
 _sk_dstover_hsw:
-  .byte  196,98,125,24,5,253,40,3,0          // vbroadcastss  0x328fd(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,205,34,3,0          // vbroadcastss  0x322cd(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,199                       // vsubps        %ymm7,%ymm8,%ymm8
   .byte  196,226,61,168,196                  // vfmadd213ps   %ymm4,%ymm8,%ymm0
   .byte  196,226,61,168,205                  // vfmadd213ps   %ymm5,%ymm8,%ymm1
@@ -7976,7 +7901,7 @@
 .globl _sk_multiply_hsw
 FUNCTION(_sk_multiply_hsw)
 _sk_multiply_hsw:
-  .byte  196,98,125,24,5,196,40,3,0          // vbroadcastss  0x328c4(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,148,34,3,0          // vbroadcastss  0x32294(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,207                       // vsubps        %ymm7,%ymm8,%ymm9
   .byte  197,52,89,208                       // vmulps        %ymm0,%ymm9,%ymm10
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -7999,7 +7924,7 @@
 FUNCTION(_sk_plus__hsw)
 _sk_plus__hsw:
   .byte  197,252,88,196                      // vaddps        %ymm4,%ymm0,%ymm0
-  .byte  196,98,125,24,5,115,40,3,0          // vbroadcastss  0x32873(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,67,34,3,0           // vbroadcastss  0x32243(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  197,244,88,205                      // vaddps        %ymm5,%ymm1,%ymm1
   .byte  196,193,116,93,200                  // vminps        %ymm8,%ymm1,%ymm1
@@ -8029,7 +7954,7 @@
 .globl _sk_xor__hsw
 FUNCTION(_sk_xor__hsw)
 _sk_xor__hsw:
-  .byte  196,98,125,24,5,30,40,3,0           // vbroadcastss  0x3281e(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,238,33,3,0          // vbroadcastss  0x321ee(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,207                       // vsubps        %ymm7,%ymm8,%ymm9
   .byte  197,180,89,192                      // vmulps        %ymm0,%ymm9,%ymm0
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -8063,7 +7988,7 @@
   .byte  197,100,89,206                      // vmulps        %ymm6,%ymm3,%ymm9
   .byte  196,193,108,95,209                  // vmaxps        %ymm9,%ymm2,%ymm2
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
-  .byte  196,98,125,24,5,162,39,3,0          // vbroadcastss  0x327a2(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,114,33,3,0          // vbroadcastss  0x32172(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  196,194,69,184,216                  // vfmadd231ps   %ymm8,%ymm7,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -8088,7 +8013,7 @@
   .byte  197,100,89,206                      // vmulps        %ymm6,%ymm3,%ymm9
   .byte  196,193,108,93,209                  // vminps        %ymm9,%ymm2,%ymm2
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
-  .byte  196,98,125,24,5,77,39,3,0           // vbroadcastss  0x3274d(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,29,33,3,0           // vbroadcastss  0x3211d(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  196,194,69,184,216                  // vfmadd231ps   %ymm8,%ymm7,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -8116,7 +8041,7 @@
   .byte  196,193,108,93,209                  // vminps        %ymm9,%ymm2,%ymm2
   .byte  197,236,88,210                      // vaddps        %ymm2,%ymm2,%ymm2
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
-  .byte  196,98,125,24,5,236,38,3,0          // vbroadcastss  0x326ec(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,188,32,3,0          // vbroadcastss  0x320bc(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  196,194,69,184,216                  // vfmadd231ps   %ymm8,%ymm7,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -8138,7 +8063,7 @@
   .byte  197,236,89,214                      // vmulps        %ymm6,%ymm2,%ymm2
   .byte  197,236,88,210                      // vaddps        %ymm2,%ymm2,%ymm2
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
-  .byte  196,98,125,24,5,166,38,3,0          // vbroadcastss  0x326a6(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,118,32,3,0          // vbroadcastss  0x32076(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  196,194,69,184,216                  // vfmadd231ps   %ymm8,%ymm7,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -8148,7 +8073,7 @@
 .globl _sk_colorburn_hsw
 FUNCTION(_sk_colorburn_hsw)
 _sk_colorburn_hsw:
-  .byte  196,98,125,24,5,144,38,3,0          // vbroadcastss  0x32690(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,96,32,3,0           // vbroadcastss  0x32060(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,207                       // vsubps        %ymm7,%ymm8,%ymm9
   .byte  197,52,89,216                       // vmulps        %ymm0,%ymm9,%ymm11
   .byte  196,65,44,87,210                    // vxorps        %ymm10,%ymm10,%ymm10
@@ -8206,7 +8131,7 @@
 FUNCTION(_sk_colordodge_hsw)
 _sk_colordodge_hsw:
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
-  .byte  196,98,125,24,13,160,37,3,0         // vbroadcastss  0x325a0(%rip),%ymm9        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,13,112,31,3,0         // vbroadcastss  0x31f70(%rip),%ymm9        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,52,92,215                       // vsubps        %ymm7,%ymm9,%ymm10
   .byte  197,44,89,216                       // vmulps        %ymm0,%ymm10,%ymm11
   .byte  197,52,92,203                       // vsubps        %ymm3,%ymm9,%ymm9
@@ -8259,7 +8184,7 @@
 .globl _sk_hardlight_hsw
 FUNCTION(_sk_hardlight_hsw)
 _sk_hardlight_hsw:
-  .byte  196,98,125,24,5,186,36,3,0          // vbroadcastss  0x324ba(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,138,30,3,0          // vbroadcastss  0x31e8a(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,215                       // vsubps        %ymm7,%ymm8,%ymm10
   .byte  197,44,89,216                       // vmulps        %ymm0,%ymm10,%ymm11
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -8310,7 +8235,7 @@
 .globl _sk_overlay_hsw
 FUNCTION(_sk_overlay_hsw)
 _sk_overlay_hsw:
-  .byte  196,98,125,24,5,238,35,3,0          // vbroadcastss  0x323ee(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,190,29,3,0          // vbroadcastss  0x31dbe(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,215                       // vsubps        %ymm7,%ymm8,%ymm10
   .byte  197,44,89,216                       // vmulps        %ymm0,%ymm10,%ymm11
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -8371,10 +8296,10 @@
   .byte  196,65,20,88,197                    // vaddps        %ymm13,%ymm13,%ymm8
   .byte  196,65,60,88,192                    // vaddps        %ymm8,%ymm8,%ymm8
   .byte  196,66,61,168,192                   // vfmadd213ps   %ymm8,%ymm8,%ymm8
-  .byte  196,98,125,24,29,9,35,3,0           // vbroadcastss  0x32309(%rip),%ymm11        # 3ab94 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
+  .byte  196,98,125,24,29,217,28,3,0         // vbroadcastss  0x31cd9(%rip),%ymm11        # 3a3c4 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
   .byte  196,65,20,88,227                    // vaddps        %ymm11,%ymm13,%ymm12
   .byte  196,65,28,89,192                    // vmulps        %ymm8,%ymm12,%ymm8
-  .byte  196,98,125,24,37,250,34,3,0         // vbroadcastss  0x322fa(%rip),%ymm12        # 3ab98 <_sk_srcover_bgra_8888_sse2_lowp+0x2cc>
+  .byte  196,98,125,24,37,202,28,3,0         // vbroadcastss  0x31cca(%rip),%ymm12        # 3a3c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2cc>
   .byte  196,66,21,184,196                   // vfmadd231ps   %ymm12,%ymm13,%ymm8
   .byte  196,65,124,82,245                   // vrsqrtps      %ymm13,%ymm14
   .byte  196,65,124,83,246                   // vrcpps        %ymm14,%ymm14
@@ -8384,7 +8309,7 @@
   .byte  197,4,194,255,2                     // vcmpleps      %ymm7,%ymm15,%ymm15
   .byte  196,67,13,74,240,240                // vblendvps     %ymm15,%ymm8,%ymm14,%ymm14
   .byte  197,116,88,249                      // vaddps        %ymm1,%ymm1,%ymm15
-  .byte  196,98,125,24,5,169,34,3,0          // vbroadcastss  0x322a9(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,121,28,3,0          // vbroadcastss  0x31c79(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,60,92,237                    // vsubps        %ymm13,%ymm8,%ymm13
   .byte  197,132,92,195                      // vsubps        %ymm3,%ymm15,%ymm0
   .byte  196,98,125,168,235                  // vfmadd213ps   %ymm3,%ymm0,%ymm13
@@ -8497,11 +8422,11 @@
   .byte  196,65,28,89,210                    // vmulps        %ymm10,%ymm12,%ymm10
   .byte  196,65,44,94,214                    // vdivps        %ymm14,%ymm10,%ymm10
   .byte  196,67,45,74,224,240                // vblendvps     %ymm15,%ymm8,%ymm10,%ymm12
-  .byte  196,98,125,24,53,193,32,3,0         // vbroadcastss  0x320c1(%rip),%ymm14        # 3ab9c <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
-  .byte  196,98,125,24,61,188,32,3,0         // vbroadcastss  0x320bc(%rip),%ymm15        # 3aba0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
+  .byte  196,98,125,24,53,145,26,3,0         // vbroadcastss  0x31a91(%rip),%ymm14        # 3a3cc <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  .byte  196,98,125,24,61,140,26,3,0         // vbroadcastss  0x31a8c(%rip),%ymm15        # 3a3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
   .byte  196,65,84,89,239                    // vmulps        %ymm15,%ymm5,%ymm13
   .byte  196,66,93,184,238                   // vfmadd231ps   %ymm14,%ymm4,%ymm13
-  .byte  196,226,125,24,5,173,32,3,0         // vbroadcastss  0x320ad(%rip),%ymm0        # 3aba4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
+  .byte  196,226,125,24,5,125,26,3,0         // vbroadcastss  0x31a7d(%rip),%ymm0        # 3a3d4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
   .byte  196,98,77,184,232                   // vfmadd231ps   %ymm0,%ymm6,%ymm13
   .byte  196,65,116,89,215                   // vmulps        %ymm15,%ymm1,%ymm10
   .byte  196,66,53,184,214                   // vfmadd231ps   %ymm14,%ymm9,%ymm10
@@ -8556,7 +8481,7 @@
   .byte  196,193,124,95,192                  // vmaxps        %ymm8,%ymm0,%ymm0
   .byte  196,65,36,95,200                    // vmaxps        %ymm8,%ymm11,%ymm9
   .byte  196,65,116,95,192                   // vmaxps        %ymm8,%ymm1,%ymm8
-  .byte  196,226,125,24,13,110,31,3,0        // vbroadcastss  0x31f6e(%rip),%ymm1        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,13,62,25,3,0         // vbroadcastss  0x3193e(%rip),%ymm1        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,116,92,215                      // vsubps        %ymm7,%ymm1,%ymm10
   .byte  197,172,89,210                      // vmulps        %ymm2,%ymm10,%ymm2
   .byte  197,116,92,219                      // vsubps        %ymm3,%ymm1,%ymm11
@@ -8610,11 +8535,11 @@
   .byte  196,65,28,89,210                    // vmulps        %ymm10,%ymm12,%ymm10
   .byte  196,65,44,94,214                    // vdivps        %ymm14,%ymm10,%ymm10
   .byte  196,67,45,74,224,240                // vblendvps     %ymm15,%ymm8,%ymm10,%ymm12
-  .byte  196,98,125,24,53,161,30,3,0         // vbroadcastss  0x31ea1(%rip),%ymm14        # 3ab9c <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
-  .byte  196,98,125,24,61,156,30,3,0         // vbroadcastss  0x31e9c(%rip),%ymm15        # 3aba0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
+  .byte  196,98,125,24,53,113,24,3,0         // vbroadcastss  0x31871(%rip),%ymm14        # 3a3cc <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  .byte  196,98,125,24,61,108,24,3,0         // vbroadcastss  0x3186c(%rip),%ymm15        # 3a3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
   .byte  196,65,84,89,239                    // vmulps        %ymm15,%ymm5,%ymm13
   .byte  196,66,93,184,238                   // vfmadd231ps   %ymm14,%ymm4,%ymm13
-  .byte  196,226,125,24,5,141,30,3,0         // vbroadcastss  0x31e8d(%rip),%ymm0        # 3aba4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
+  .byte  196,226,125,24,5,93,24,3,0          // vbroadcastss  0x3185d(%rip),%ymm0        # 3a3d4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
   .byte  196,98,77,184,232                   // vfmadd231ps   %ymm0,%ymm6,%ymm13
   .byte  196,65,116,89,215                   // vmulps        %ymm15,%ymm1,%ymm10
   .byte  196,66,53,184,214                   // vfmadd231ps   %ymm14,%ymm9,%ymm10
@@ -8669,7 +8594,7 @@
   .byte  196,193,124,95,192                  // vmaxps        %ymm8,%ymm0,%ymm0
   .byte  196,65,36,95,200                    // vmaxps        %ymm8,%ymm11,%ymm9
   .byte  196,65,116,95,192                   // vmaxps        %ymm8,%ymm1,%ymm8
-  .byte  196,226,125,24,13,78,29,3,0         // vbroadcastss  0x31d4e(%rip),%ymm1        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,13,30,23,3,0         // vbroadcastss  0x3171e(%rip),%ymm1        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,116,92,215                      // vsubps        %ymm7,%ymm1,%ymm10
   .byte  197,172,89,210                      // vmulps        %ymm2,%ymm10,%ymm2
   .byte  197,116,92,219                      // vsubps        %ymm3,%ymm1,%ymm11
@@ -8697,11 +8622,11 @@
   .byte  197,108,89,199                      // vmulps        %ymm7,%ymm2,%ymm8
   .byte  197,116,89,215                      // vmulps        %ymm7,%ymm1,%ymm10
   .byte  197,52,89,223                       // vmulps        %ymm7,%ymm9,%ymm11
-  .byte  196,98,125,24,45,3,29,3,0           // vbroadcastss  0x31d03(%rip),%ymm13        # 3ab9c <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
-  .byte  196,98,125,24,53,254,28,3,0         // vbroadcastss  0x31cfe(%rip),%ymm14        # 3aba0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
+  .byte  196,98,125,24,45,211,22,3,0         // vbroadcastss  0x316d3(%rip),%ymm13        # 3a3cc <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  .byte  196,98,125,24,53,206,22,3,0         // vbroadcastss  0x316ce(%rip),%ymm14        # 3a3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
   .byte  196,65,84,89,230                    // vmulps        %ymm14,%ymm5,%ymm12
   .byte  196,66,93,184,229                   // vfmadd231ps   %ymm13,%ymm4,%ymm12
-  .byte  196,98,125,24,61,239,28,3,0         // vbroadcastss  0x31cef(%rip),%ymm15        # 3aba4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
+  .byte  196,98,125,24,61,191,22,3,0         // vbroadcastss  0x316bf(%rip),%ymm15        # 3a3d4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
   .byte  196,66,77,184,231                   // vfmadd231ps   %ymm15,%ymm6,%ymm12
   .byte  196,65,44,89,206                    // vmulps        %ymm14,%ymm10,%ymm9
   .byte  196,66,61,184,205                   // vfmadd231ps   %ymm13,%ymm8,%ymm9
@@ -8757,7 +8682,7 @@
   .byte  196,193,116,95,206                  // vmaxps        %ymm14,%ymm1,%ymm1
   .byte  196,65,44,95,198                    // vmaxps        %ymm14,%ymm10,%ymm8
   .byte  196,65,124,95,206                   // vmaxps        %ymm14,%ymm0,%ymm9
-  .byte  196,226,125,24,5,165,27,3,0         // vbroadcastss  0x31ba5(%rip),%ymm0        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,5,117,21,3,0         // vbroadcastss  0x31575(%rip),%ymm0        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,124,92,215                      // vsubps        %ymm7,%ymm0,%ymm10
   .byte  197,172,89,210                      // vmulps        %ymm2,%ymm10,%ymm2
   .byte  197,124,92,219                      // vsubps        %ymm3,%ymm0,%ymm11
@@ -8785,11 +8710,11 @@
   .byte  197,100,89,196                      // vmulps        %ymm4,%ymm3,%ymm8
   .byte  197,100,89,213                      // vmulps        %ymm5,%ymm3,%ymm10
   .byte  197,100,89,222                      // vmulps        %ymm6,%ymm3,%ymm11
-  .byte  196,98,125,24,45,90,27,3,0          // vbroadcastss  0x31b5a(%rip),%ymm13        # 3ab9c <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
-  .byte  196,98,125,24,53,85,27,3,0          // vbroadcastss  0x31b55(%rip),%ymm14        # 3aba0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
+  .byte  196,98,125,24,45,42,21,3,0          // vbroadcastss  0x3152a(%rip),%ymm13        # 3a3cc <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  .byte  196,98,125,24,53,37,21,3,0          // vbroadcastss  0x31525(%rip),%ymm14        # 3a3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
   .byte  196,65,116,89,230                   // vmulps        %ymm14,%ymm1,%ymm12
   .byte  196,66,109,184,229                  // vfmadd231ps   %ymm13,%ymm2,%ymm12
-  .byte  196,98,125,24,61,70,27,3,0          // vbroadcastss  0x31b46(%rip),%ymm15        # 3aba4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
+  .byte  196,98,125,24,61,22,21,3,0          // vbroadcastss  0x31516(%rip),%ymm15        # 3a3d4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
   .byte  196,66,53,184,231                   // vfmadd231ps   %ymm15,%ymm9,%ymm12
   .byte  196,65,44,89,206                    // vmulps        %ymm14,%ymm10,%ymm9
   .byte  196,66,61,184,205                   // vfmadd231ps   %ymm13,%ymm8,%ymm9
@@ -8845,7 +8770,7 @@
   .byte  196,193,116,95,206                  // vmaxps        %ymm14,%ymm1,%ymm1
   .byte  196,65,44,95,198                    // vmaxps        %ymm14,%ymm10,%ymm8
   .byte  196,65,124,95,206                   // vmaxps        %ymm14,%ymm0,%ymm9
-  .byte  196,226,125,24,5,252,25,3,0         // vbroadcastss  0x319fc(%rip),%ymm0        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,5,204,19,3,0         // vbroadcastss  0x313cc(%rip),%ymm0        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,124,92,215                      // vsubps        %ymm7,%ymm0,%ymm10
   .byte  197,172,89,210                      // vmulps        %ymm2,%ymm10,%ymm2
   .byte  197,124,92,219                      // vsubps        %ymm3,%ymm0,%ymm11
@@ -8867,27 +8792,25 @@
 FUNCTION(_sk_srcover_rgba_8888_hsw)
 _sk_srcover_rgba_8888_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,224,0,0,0                    // jne           92c2 <_sk_srcover_rgba_8888_hsw+0x100>
-  .byte  196,129,126,111,60,152              // vmovdqu       (%r8,%r11,4),%ymm7
-  .byte  197,197,219,37,112,27,3,0           // vpand         0x31b70(%rip),%ymm7,%ymm4        # 3ad60 <_sk_srcover_bgra_8888_sse2_lowp+0x494>
+  .byte  15,133,224,0,0,0                    // jne           911c <_sk_srcover_rgba_8888_hsw+0xfa>
+  .byte  196,193,126,111,60,144              // vmovdqu       (%r8,%rdx,4),%ymm7
+  .byte  197,197,219,37,86,21,3,0            // vpand         0x31556(%rip),%ymm7,%ymm4        # 3a5a0 <_sk_srcover_bgra_8888_sse2_lowp+0x4a4>
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,226,69,0,45,131,27,3,0          // vpshufb       0x31b83(%rip),%ymm7,%ymm5        # 3ad80 <_sk_srcover_bgra_8888_sse2_lowp+0x4b4>
+  .byte  196,226,69,0,45,105,21,3,0          // vpshufb       0x31569(%rip),%ymm7,%ymm5        # 3a5c0 <_sk_srcover_bgra_8888_sse2_lowp+0x4c4>
   .byte  197,252,91,237                      // vcvtdq2ps     %ymm5,%ymm5
-  .byte  196,226,69,0,53,150,27,3,0          // vpshufb       0x31b96(%rip),%ymm7,%ymm6        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0x4d4>
+  .byte  196,226,69,0,53,124,21,3,0          // vpshufb       0x3157c(%rip),%ymm7,%ymm6        # 3a5e0 <_sk_srcover_bgra_8888_sse2_lowp+0x4e4>
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,252,91,246                      // vcvtdq2ps     %ymm6,%ymm6
   .byte  197,197,114,215,24                  // vpsrld        $0x18,%ymm7,%ymm7
   .byte  197,252,91,255                      // vcvtdq2ps     %ymm7,%ymm7
-  .byte  196,98,125,24,13,87,25,3,0          // vbroadcastss  0x31957(%rip),%ymm9        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,13,45,19,3,0          // vbroadcastss  0x3132d(%rip),%ymm9        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,52,92,203                       // vsubps        %ymm3,%ymm9,%ymm9
-  .byte  196,98,125,24,21,118,25,3,0         // vbroadcastss  0x31976(%rip),%ymm10        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,98,125,24,21,76,19,3,0          // vbroadcastss  0x3134c(%rip),%ymm10        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   .byte  196,193,124,89,194                  // vmulps        %ymm10,%ymm0,%ymm0
   .byte  196,194,93,184,193                  // vfmadd231ps   %ymm9,%ymm4,%ymm0
   .byte  196,193,116,89,202                  // vmulps        %ymm10,%ymm1,%ymm1
@@ -8915,68 +8838,68 @@
   .byte  196,65,37,235,192                   // vpor          %ymm8,%ymm11,%ymm8
   .byte  196,65,53,235,192                   // vpor          %ymm8,%ymm9,%ymm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,65                              // jne           92f9 <_sk_srcover_rgba_8888_hsw+0x137>
-  .byte  196,1,126,127,4,152                 // vmovdqu       %ymm8,(%r8,%r11,4)
+  .byte  117,58                              // jne           914c <_sk_srcover_rgba_8888_hsw+0x12a>
+  .byte  196,65,126,127,4,144                // vmovdqu       %ymm8,(%r8,%rdx,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,197,239,255                     // vpxor         %ymm7,%ymm7,%ymm7
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,14,255,255,255               // ja            91e8 <_sk_srcover_rgba_8888_hsw+0x26>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,255,0,0,0                 // lea           0xff(%rip),%r10        # 93e4 <_sk_srcover_rgba_8888_hsw+0x222>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
-  .byte  255,224                             // jmpq          *%rax
-  .byte  196,129,121,110,60,152              // vmovd         (%r8,%r11,4),%xmm7
-  .byte  233,239,254,255,255                 // jmpq          91e8 <_sk_srcover_rgba_8888_hsw+0x26>
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,181                             // ja            92be <_sk_srcover_rgba_8888_hsw+0xfc>
-  .byte  65,15,182,193                       // movzbl        %r9b,%eax
-  .byte  76,141,13,236,0,0,0                 // lea           0xec(%rip),%r9        # 9400 <_sk_srcover_rgba_8888_hsw+0x23e>
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  15,135,20,255,255,255               // ja            9042 <_sk_srcover_rgba_8888_hsw+0x20>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,248,0,0,0                 // lea           0xf8(%rip),%r9        # 9230 <_sk_srcover_rgba_8888_hsw+0x20e>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,1,121,126,4,152                 // vmovd         %xmm8,(%r8,%r11,4)
-  .byte  235,153                             // jmp           92be <_sk_srcover_rgba_8888_hsw+0xfc>
-  .byte  196,129,121,110,100,152,8           // vmovd         0x8(%r8,%r11,4),%xmm4
+  .byte  196,193,121,110,60,144              // vmovd         (%r8,%rdx,4),%xmm7
+  .byte  233,246,254,255,255                 // jmpq          9042 <_sk_srcover_rgba_8888_hsw+0x20>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,194                             // ja            9118 <_sk_srcover_rgba_8888_hsw+0xf6>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,236,0,0,0                 // lea           0xec(%rip),%r9        # 924c <_sk_srcover_rgba_8888_hsw+0x22a>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
+  .byte  255,224                             // jmpq          *%rax
+  .byte  196,65,121,126,4,144                // vmovd         %xmm8,(%r8,%rdx,4)
+  .byte  235,167                             // jmp           9118 <_sk_srcover_rgba_8888_hsw+0xf6>
+  .byte  196,193,121,110,100,144,8           // vmovd         0x8(%r8,%rdx,4),%xmm4
   .byte  196,226,121,89,228                  // vpbroadcastq  %xmm4,%xmm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
   .byte  196,227,85,2,252,4                  // vpblendd      $0x4,%ymm4,%ymm5,%ymm7
-  .byte  196,129,122,126,36,152              // vmovq         (%r8,%r11,4),%xmm4
+  .byte  196,193,122,126,36,144              // vmovq         (%r8,%rdx,4),%xmm4
   .byte  196,227,69,2,252,3                  // vpblendd      $0x3,%ymm4,%ymm7,%ymm7
-  .byte  233,156,254,255,255                 // jmpq          91e8 <_sk_srcover_rgba_8888_hsw+0x26>
-  .byte  196,129,121,110,100,152,24          // vmovd         0x18(%r8,%r11,4),%xmm4
+  .byte  233,170,254,255,255                 // jmpq          9042 <_sk_srcover_rgba_8888_hsw+0x20>
+  .byte  196,193,121,110,100,144,24          // vmovd         0x18(%r8,%rdx,4),%xmm4
   .byte  196,226,125,89,228                  // vpbroadcastq  %xmm4,%ymm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
   .byte  196,227,85,2,252,64                 // vpblendd      $0x40,%ymm4,%ymm5,%ymm7
   .byte  196,227,125,57,252,1                // vextracti128  $0x1,%ymm7,%xmm4
-  .byte  196,131,89,34,100,152,20,1          // vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,20,1          // vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,227,69,56,252,1                 // vinserti128   $0x1,%xmm4,%ymm7,%ymm7
   .byte  196,227,125,57,252,1                // vextracti128  $0x1,%ymm7,%xmm4
-  .byte  196,131,89,34,100,152,16,0          // vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,16,0          // vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,227,69,56,252,1                 // vinserti128   $0x1,%xmm4,%ymm7,%ymm7
-  .byte  196,129,122,111,36,152              // vmovdqu       (%r8,%r11,4),%xmm4
+  .byte  196,193,122,111,36,144              // vmovdqu       (%r8,%rdx,4),%xmm4
   .byte  196,227,93,2,255,240                // vpblendd      $0xf0,%ymm7,%ymm4,%ymm7
-  .byte  233,77,254,255,255                  // jmpq          91e8 <_sk_srcover_rgba_8888_hsw+0x26>
-  .byte  196,3,121,22,68,152,8,2             // vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
-  .byte  196,1,121,214,4,152                 // vmovq         %xmm8,(%r8,%r11,4)
-  .byte  233,16,255,255,255                  // jmpq          92be <_sk_srcover_rgba_8888_hsw+0xfc>
+  .byte  233,91,254,255,255                  // jmpq          9042 <_sk_srcover_rgba_8888_hsw+0x20>
+  .byte  196,67,121,22,68,144,8,2            // vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
+  .byte  196,65,121,214,4,144                // vmovq         %xmm8,(%r8,%rdx,4)
+  .byte  233,30,255,255,255                  // jmpq          9118 <_sk_srcover_rgba_8888_hsw+0xf6>
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,24,2            // vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,24,2           // vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,20,1            // vpextrd       $0x1,%xmm9,0x14(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,20,1           // vpextrd       $0x1,%xmm9,0x14(%r8,%rdx,4)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,1,121,126,76,152,16             // vmovd         %xmm9,0x10(%r8,%r11,4)
-  .byte  196,1,122,127,4,152                 // vmovdqu       %xmm8,(%r8,%r11,4)
-  .byte  233,220,254,255,255                 // jmpq          92be <_sk_srcover_rgba_8888_hsw+0xfc>
+  .byte  196,65,121,126,76,144,16            // vmovd         %xmm9,0x10(%r8,%rdx,4)
+  .byte  196,65,122,127,4,144                // vmovdqu       %xmm8,(%r8,%rdx,4)
+  .byte  233,234,254,255,255                 // jmpq          9118 <_sk_srcover_rgba_8888_hsw+0xf6>
   .byte  102,144                             // xchg          %ax,%ax
-  .byte  10,255                              // or            %bh,%bh
+  .byte  17,255                              // adc           %edi,%edi
   .byte  255                                 // (bad)
   .byte  255,87,255                          // callq         *-0x1(%rdi)
   .byte  255                                 // (bad)
@@ -8986,11 +8909,11 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  126,255                             // jle           93f9 <_sk_srcover_rgba_8888_hsw+0x237>
+  .byte  126,255                             // jle           9245 <_sk_srcover_rgba_8888_hsw+0x223>
   .byte  255                                 // (bad)
   .byte  255,104,255                         // ljmp          *-0x1(%rax)
   .byte  255                                 // (bad)
-  .byte  255,29,255,255,255,163              // lcall         *-0x5c000001(%rip)        # ffffffffa4009404 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffa3fceb38>
+  .byte  255,29,255,255,255,163              // lcall         *-0x5c000001(%rip)        # ffffffffa4009250 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffa3fcf154>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,155,255,255,255,215             // lcall         *-0x28000001(%rbx)
@@ -9010,27 +8933,25 @@
 FUNCTION(_sk_srcover_bgra_8888_hsw)
 _sk_srcover_bgra_8888_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,224,0,0,0                    // jne           951c <_sk_srcover_bgra_8888_hsw+0x100>
-  .byte  196,129,126,111,60,152              // vmovdqu       (%r8,%r11,4),%ymm7
-  .byte  197,197,219,37,118,25,3,0           // vpand         0x31976(%rip),%ymm7,%ymm4        # 3adc0 <_sk_srcover_bgra_8888_sse2_lowp+0x4f4>
+  .byte  15,133,224,0,0,0                    // jne           9362 <_sk_srcover_bgra_8888_hsw+0xfa>
+  .byte  196,193,126,111,60,144              // vmovdqu       (%r8,%rdx,4),%ymm7
+  .byte  197,197,219,37,112,19,3,0           // vpand         0x31370(%rip),%ymm7,%ymm4        # 3a600 <_sk_srcover_bgra_8888_sse2_lowp+0x504>
   .byte  197,252,91,244                      // vcvtdq2ps     %ymm4,%ymm6
-  .byte  196,226,69,0,37,137,25,3,0          // vpshufb       0x31989(%rip),%ymm7,%ymm4        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0x514>
+  .byte  196,226,69,0,37,131,19,3,0          // vpshufb       0x31383(%rip),%ymm7,%ymm4        # 3a620 <_sk_srcover_bgra_8888_sse2_lowp+0x524>
   .byte  197,252,91,236                      // vcvtdq2ps     %ymm4,%ymm5
-  .byte  196,226,69,0,37,156,25,3,0          // vpshufb       0x3199c(%rip),%ymm7,%ymm4        # 3ae00 <_sk_srcover_bgra_8888_sse2_lowp+0x534>
+  .byte  196,226,69,0,37,150,19,3,0          // vpshufb       0x31396(%rip),%ymm7,%ymm4        # 3a640 <_sk_srcover_bgra_8888_sse2_lowp+0x544>
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
   .byte  197,197,114,215,24                  // vpsrld        $0x18,%ymm7,%ymm7
   .byte  197,252,91,255                      // vcvtdq2ps     %ymm7,%ymm7
-  .byte  196,98,125,24,13,253,22,3,0         // vbroadcastss  0x316fd(%rip),%ymm9        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,13,231,16,3,0         // vbroadcastss  0x310e7(%rip),%ymm9        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,52,92,203                       // vsubps        %ymm3,%ymm9,%ymm9
-  .byte  196,98,125,24,21,28,23,3,0          // vbroadcastss  0x3171c(%rip),%ymm10        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,98,125,24,21,6,17,3,0           // vbroadcastss  0x31106(%rip),%ymm10        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   .byte  196,193,124,89,194                  // vmulps        %ymm10,%ymm0,%ymm0
   .byte  196,194,93,184,193                  // vfmadd231ps   %ymm9,%ymm4,%ymm0
   .byte  196,193,116,89,202                  // vmulps        %ymm10,%ymm1,%ymm1
@@ -9058,67 +8979,67 @@
   .byte  196,65,37,235,192                   // vpor          %ymm8,%ymm11,%ymm8
   .byte  196,65,53,235,192                   // vpor          %ymm8,%ymm9,%ymm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,65                              // jne           9553 <_sk_srcover_bgra_8888_hsw+0x137>
-  .byte  196,1,126,127,4,152                 // vmovdqu       %ymm8,(%r8,%r11,4)
+  .byte  117,58                              // jne           9392 <_sk_srcover_bgra_8888_hsw+0x12a>
+  .byte  196,65,126,127,4,144                // vmovdqu       %ymm8,(%r8,%rdx,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,197,239,255                     // vpxor         %ymm7,%ymm7,%ymm7
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,14,255,255,255               // ja            9442 <_sk_srcover_bgra_8888_hsw+0x26>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,253,0,0,0                 // lea           0xfd(%rip),%r10        # 963c <_sk_srcover_bgra_8888_hsw+0x220>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
-  .byte  255,224                             // jmpq          *%rax
-  .byte  196,129,121,110,60,152              // vmovd         (%r8,%r11,4),%xmm7
-  .byte  233,239,254,255,255                 // jmpq          9442 <_sk_srcover_bgra_8888_hsw+0x26>
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,181                             // ja            9518 <_sk_srcover_bgra_8888_hsw+0xfc>
-  .byte  65,15,182,193                       // movzbl        %r9b,%eax
-  .byte  76,141,13,234,0,0,0                 // lea           0xea(%rip),%r9        # 9658 <_sk_srcover_bgra_8888_hsw+0x23c>
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  15,135,20,255,255,255               // ja            9288 <_sk_srcover_bgra_8888_hsw+0x20>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,246,0,0,0                 // lea           0xf6(%rip),%r9        # 9474 <_sk_srcover_bgra_8888_hsw+0x20c>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,1,121,126,4,152                 // vmovd         %xmm8,(%r8,%r11,4)
-  .byte  235,153                             // jmp           9518 <_sk_srcover_bgra_8888_hsw+0xfc>
-  .byte  196,129,121,110,100,152,8           // vmovd         0x8(%r8,%r11,4),%xmm4
+  .byte  196,193,121,110,60,144              // vmovd         (%r8,%rdx,4),%xmm7
+  .byte  233,246,254,255,255                 // jmpq          9288 <_sk_srcover_bgra_8888_hsw+0x20>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,194                             // ja            935e <_sk_srcover_bgra_8888_hsw+0xf6>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,234,0,0,0                 // lea           0xea(%rip),%r9        # 9490 <_sk_srcover_bgra_8888_hsw+0x228>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
+  .byte  255,224                             // jmpq          *%rax
+  .byte  196,65,121,126,4,144                // vmovd         %xmm8,(%r8,%rdx,4)
+  .byte  235,167                             // jmp           935e <_sk_srcover_bgra_8888_hsw+0xf6>
+  .byte  196,193,121,110,100,144,8           // vmovd         0x8(%r8,%rdx,4),%xmm4
   .byte  196,226,121,89,228                  // vpbroadcastq  %xmm4,%xmm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
   .byte  196,227,85,2,252,4                  // vpblendd      $0x4,%ymm4,%ymm5,%ymm7
-  .byte  196,129,122,126,36,152              // vmovq         (%r8,%r11,4),%xmm4
+  .byte  196,193,122,126,36,144              // vmovq         (%r8,%rdx,4),%xmm4
   .byte  196,227,69,2,252,3                  // vpblendd      $0x3,%ymm4,%ymm7,%ymm7
-  .byte  233,156,254,255,255                 // jmpq          9442 <_sk_srcover_bgra_8888_hsw+0x26>
-  .byte  196,129,121,110,100,152,24          // vmovd         0x18(%r8,%r11,4),%xmm4
+  .byte  233,170,254,255,255                 // jmpq          9288 <_sk_srcover_bgra_8888_hsw+0x20>
+  .byte  196,193,121,110,100,144,24          // vmovd         0x18(%r8,%rdx,4),%xmm4
   .byte  196,226,125,89,228                  // vpbroadcastq  %xmm4,%ymm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
   .byte  196,227,85,2,252,64                 // vpblendd      $0x40,%ymm4,%ymm5,%ymm7
   .byte  196,227,125,57,252,1                // vextracti128  $0x1,%ymm7,%xmm4
-  .byte  196,131,89,34,100,152,20,1          // vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,20,1          // vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,227,69,56,252,1                 // vinserti128   $0x1,%xmm4,%ymm7,%ymm7
   .byte  196,227,125,57,252,1                // vextracti128  $0x1,%ymm7,%xmm4
-  .byte  196,131,89,34,100,152,16,0          // vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,16,0          // vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,227,69,56,252,1                 // vinserti128   $0x1,%xmm4,%ymm7,%ymm7
-  .byte  196,129,122,111,36,152              // vmovdqu       (%r8,%r11,4),%xmm4
+  .byte  196,193,122,111,36,144              // vmovdqu       (%r8,%rdx,4),%xmm4
   .byte  196,227,93,2,255,240                // vpblendd      $0xf0,%ymm7,%ymm4,%ymm7
-  .byte  233,77,254,255,255                  // jmpq          9442 <_sk_srcover_bgra_8888_hsw+0x26>
-  .byte  196,3,121,22,68,152,8,2             // vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
-  .byte  196,1,121,214,4,152                 // vmovq         %xmm8,(%r8,%r11,4)
-  .byte  233,16,255,255,255                  // jmpq          9518 <_sk_srcover_bgra_8888_hsw+0xfc>
+  .byte  233,91,254,255,255                  // jmpq          9288 <_sk_srcover_bgra_8888_hsw+0x20>
+  .byte  196,67,121,22,68,144,8,2            // vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
+  .byte  196,65,121,214,4,144                // vmovq         %xmm8,(%r8,%rdx,4)
+  .byte  233,30,255,255,255                  // jmpq          935e <_sk_srcover_bgra_8888_hsw+0xf6>
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,24,2            // vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,24,2           // vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,20,1            // vpextrd       $0x1,%xmm9,0x14(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,20,1           // vpextrd       $0x1,%xmm9,0x14(%r8,%rdx,4)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,1,121,126,76,152,16             // vmovd         %xmm9,0x10(%r8,%r11,4)
-  .byte  196,1,122,127,4,152                 // vmovdqu       %xmm8,(%r8,%r11,4)
-  .byte  233,220,254,255,255                 // jmpq          9518 <_sk_srcover_bgra_8888_hsw+0xfc>
-  .byte  12,255                              // or            $0xff,%al
+  .byte  196,65,121,126,76,144,16            // vmovd         %xmm9,0x10(%r8,%rdx,4)
+  .byte  196,65,122,127,4,144                // vmovdqu       %xmm8,(%r8,%rdx,4)
+  .byte  233,234,254,255,255                 // jmpq          935e <_sk_srcover_bgra_8888_hsw+0xf6>
+  .byte  19,255                              // adc           %edi,%edi
   .byte  255                                 // (bad)
   .byte  255,89,255                          // lcall         *-0x1(%rcx)
   .byte  255                                 // (bad)
@@ -9164,7 +9085,7 @@
 .globl _sk_clamp_1_hsw
 FUNCTION(_sk_clamp_1_hsw)
 _sk_clamp_1_hsw:
-  .byte  196,98,125,24,5,226,20,3,0          // vbroadcastss  0x314e2(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,218,14,3,0          // vbroadcastss  0x30eda(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  196,193,116,93,200                  // vminps        %ymm8,%ymm1,%ymm1
   .byte  196,193,108,93,208                  // vminps        %ymm8,%ymm2,%ymm2
@@ -9176,7 +9097,7 @@
 .globl _sk_clamp_a_hsw
 FUNCTION(_sk_clamp_a_hsw)
 _sk_clamp_a_hsw:
-  .byte  196,98,125,24,5,193,20,3,0          // vbroadcastss  0x314c1(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,185,14,3,0          // vbroadcastss  0x30eb9(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,100,93,216                  // vminps        %ymm8,%ymm3,%ymm3
   .byte  197,252,93,195                      // vminps        %ymm3,%ymm0,%ymm0
   .byte  197,244,93,203                      // vminps        %ymm3,%ymm1,%ymm1
@@ -9188,7 +9109,7 @@
 .globl _sk_clamp_a_dst_hsw
 FUNCTION(_sk_clamp_a_dst_hsw)
 _sk_clamp_a_dst_hsw:
-  .byte  196,98,125,24,5,163,20,3,0          // vbroadcastss  0x314a3(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,155,14,3,0          // vbroadcastss  0x30e9b(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,68,93,248                   // vminps        %ymm8,%ymm7,%ymm7
   .byte  197,220,93,231                      // vminps        %ymm7,%ymm4,%ymm4
   .byte  197,212,93,239                      // vminps        %ymm7,%ymm5,%ymm5
@@ -9221,7 +9142,7 @@
 .globl _sk_invert_hsw
 FUNCTION(_sk_invert_hsw)
 _sk_invert_hsw:
-  .byte  196,98,125,24,5,94,20,3,0           // vbroadcastss  0x3145e(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,86,14,3,0           // vbroadcastss  0x30e56(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,188,92,192                      // vsubps        %ymm0,%ymm8,%ymm0
   .byte  197,188,92,201                      // vsubps        %ymm1,%ymm8,%ymm1
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
@@ -9275,9 +9196,9 @@
 .globl _sk_unpremul_hsw
 FUNCTION(_sk_unpremul_hsw)
 _sk_unpremul_hsw:
-  .byte  196,98,125,24,5,249,19,3,0          // vbroadcastss  0x313f9(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,241,13,3,0          // vbroadcastss  0x30df1(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,94,195                       // vdivps        %ymm3,%ymm8,%ymm8
-  .byte  196,98,125,24,13,28,20,3,0          // vbroadcastss  0x3141c(%rip),%ymm9        # 3abac <_sk_srcover_bgra_8888_sse2_lowp+0x2e0>
+  .byte  196,98,125,24,13,20,14,3,0          // vbroadcastss  0x30e14(%rip),%ymm9        # 3a3dc <_sk_srcover_bgra_8888_sse2_lowp+0x2e0>
   .byte  196,65,60,194,201,1                 // vcmpltps      %ymm9,%ymm8,%ymm9
   .byte  196,65,44,87,210                    // vxorps        %ymm10,%ymm10,%ymm10
   .byte  196,67,45,74,192,144                // vblendvps     %ymm9,%ymm8,%ymm10,%ymm8
@@ -9291,16 +9212,16 @@
 .globl _sk_from_srgb_hsw
 FUNCTION(_sk_from_srgb_hsw)
 _sk_from_srgb_hsw:
-  .byte  196,98,125,24,5,246,19,3,0          // vbroadcastss  0x313f6(%rip),%ymm8        # 3abb0 <_sk_srcover_bgra_8888_sse2_lowp+0x2e4>
+  .byte  196,98,125,24,5,238,13,3,0          // vbroadcastss  0x30dee(%rip),%ymm8        # 3a3e0 <_sk_srcover_bgra_8888_sse2_lowp+0x2e4>
   .byte  196,65,124,89,200                   // vmulps        %ymm8,%ymm0,%ymm9
   .byte  197,124,89,208                      // vmulps        %ymm0,%ymm0,%ymm10
-  .byte  196,98,125,24,29,232,19,3,0         // vbroadcastss  0x313e8(%rip),%ymm11        # 3abb4 <_sk_srcover_bgra_8888_sse2_lowp+0x2e8>
-  .byte  196,98,125,24,37,199,19,3,0         // vbroadcastss  0x313c7(%rip),%ymm12        # 3ab9c <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  .byte  196,98,125,24,29,224,13,3,0         // vbroadcastss  0x30de0(%rip),%ymm11        # 3a3e4 <_sk_srcover_bgra_8888_sse2_lowp+0x2e8>
+  .byte  196,98,125,24,37,191,13,3,0         // vbroadcastss  0x30dbf(%rip),%ymm12        # 3a3cc <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
   .byte  196,65,124,40,236                   // vmovaps       %ymm12,%ymm13
   .byte  196,66,125,168,235                  // vfmadd213ps   %ymm11,%ymm0,%ymm13
-  .byte  196,98,125,24,53,208,19,3,0         // vbroadcastss  0x313d0(%rip),%ymm14        # 3abb8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ec>
+  .byte  196,98,125,24,53,200,13,3,0         // vbroadcastss  0x30dc8(%rip),%ymm14        # 3a3e8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ec>
   .byte  196,66,45,168,238                   // vfmadd213ps   %ymm14,%ymm10,%ymm13
-  .byte  196,98,125,24,21,198,19,3,0         // vbroadcastss  0x313c6(%rip),%ymm10        # 3abbc <_sk_srcover_bgra_8888_sse2_lowp+0x2f0>
+  .byte  196,98,125,24,21,190,13,3,0         // vbroadcastss  0x30dbe(%rip),%ymm10        # 3a3ec <_sk_srcover_bgra_8888_sse2_lowp+0x2f0>
   .byte  196,193,124,194,194,1               // vcmpltps      %ymm10,%ymm0,%ymm0
   .byte  196,195,21,74,193,0                 // vblendvps     %ymm0,%ymm9,%ymm13,%ymm0
   .byte  196,65,116,89,200                   // vmulps        %ymm8,%ymm1,%ymm9
@@ -9323,16 +9244,16 @@
 .globl _sk_from_srgb_dst_hsw
 FUNCTION(_sk_from_srgb_dst_hsw)
 _sk_from_srgb_dst_hsw:
-  .byte  196,98,125,24,5,94,19,3,0           // vbroadcastss  0x3135e(%rip),%ymm8        # 3abb0 <_sk_srcover_bgra_8888_sse2_lowp+0x2e4>
+  .byte  196,98,125,24,5,86,13,3,0           // vbroadcastss  0x30d56(%rip),%ymm8        # 3a3e0 <_sk_srcover_bgra_8888_sse2_lowp+0x2e4>
   .byte  196,65,92,89,200                    // vmulps        %ymm8,%ymm4,%ymm9
   .byte  197,92,89,212                       // vmulps        %ymm4,%ymm4,%ymm10
-  .byte  196,98,125,24,29,80,19,3,0          // vbroadcastss  0x31350(%rip),%ymm11        # 3abb4 <_sk_srcover_bgra_8888_sse2_lowp+0x2e8>
-  .byte  196,98,125,24,37,47,19,3,0          // vbroadcastss  0x3132f(%rip),%ymm12        # 3ab9c <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  .byte  196,98,125,24,29,72,13,3,0          // vbroadcastss  0x30d48(%rip),%ymm11        # 3a3e4 <_sk_srcover_bgra_8888_sse2_lowp+0x2e8>
+  .byte  196,98,125,24,37,39,13,3,0          // vbroadcastss  0x30d27(%rip),%ymm12        # 3a3cc <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
   .byte  196,65,124,40,236                   // vmovaps       %ymm12,%ymm13
   .byte  196,66,93,168,235                   // vfmadd213ps   %ymm11,%ymm4,%ymm13
-  .byte  196,98,125,24,53,56,19,3,0          // vbroadcastss  0x31338(%rip),%ymm14        # 3abb8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ec>
+  .byte  196,98,125,24,53,48,13,3,0          // vbroadcastss  0x30d30(%rip),%ymm14        # 3a3e8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ec>
   .byte  196,66,45,168,238                   // vfmadd213ps   %ymm14,%ymm10,%ymm13
-  .byte  196,98,125,24,21,46,19,3,0          // vbroadcastss  0x3132e(%rip),%ymm10        # 3abbc <_sk_srcover_bgra_8888_sse2_lowp+0x2f0>
+  .byte  196,98,125,24,21,38,13,3,0          // vbroadcastss  0x30d26(%rip),%ymm10        # 3a3ec <_sk_srcover_bgra_8888_sse2_lowp+0x2f0>
   .byte  196,193,92,194,226,1                // vcmpltps      %ymm10,%ymm4,%ymm4
   .byte  196,195,21,74,225,64                // vblendvps     %ymm4,%ymm9,%ymm13,%ymm4
   .byte  196,65,84,89,200                    // vmulps        %ymm8,%ymm5,%ymm9
@@ -9356,19 +9277,19 @@
 FUNCTION(_sk_to_srgb_hsw)
 _sk_to_srgb_hsw:
   .byte  197,124,82,200                      // vrsqrtps      %ymm0,%ymm9
-  .byte  196,98,125,24,5,210,18,3,0          // vbroadcastss  0x312d2(%rip),%ymm8        # 3abc0 <_sk_srcover_bgra_8888_sse2_lowp+0x2f4>
+  .byte  196,98,125,24,5,202,12,3,0          // vbroadcastss  0x30cca(%rip),%ymm8        # 3a3f0 <_sk_srcover_bgra_8888_sse2_lowp+0x2f4>
   .byte  196,65,124,89,208                   // vmulps        %ymm8,%ymm0,%ymm10
-  .byte  196,98,125,24,29,200,18,3,0         // vbroadcastss  0x312c8(%rip),%ymm11        # 3abc4 <_sk_srcover_bgra_8888_sse2_lowp+0x2f8>
-  .byte  196,98,125,24,37,195,18,3,0         // vbroadcastss  0x312c3(%rip),%ymm12        # 3abc8 <_sk_srcover_bgra_8888_sse2_lowp+0x2fc>
+  .byte  196,98,125,24,29,192,12,3,0         // vbroadcastss  0x30cc0(%rip),%ymm11        # 3a3f4 <_sk_srcover_bgra_8888_sse2_lowp+0x2f8>
+  .byte  196,98,125,24,37,187,12,3,0         // vbroadcastss  0x30cbb(%rip),%ymm12        # 3a3f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2fc>
   .byte  196,65,124,40,236                   // vmovaps       %ymm12,%ymm13
   .byte  196,66,53,168,235                   // vfmadd213ps   %ymm11,%ymm9,%ymm13
-  .byte  196,98,125,24,53,220,19,3,0         // vbroadcastss  0x313dc(%rip),%ymm14        # 3acf4 <_sk_srcover_bgra_8888_sse2_lowp+0x428>
+  .byte  196,98,125,24,53,212,13,3,0         // vbroadcastss  0x30dd4(%rip),%ymm14        # 3a524 <_sk_srcover_bgra_8888_sse2_lowp+0x428>
   .byte  196,66,53,168,238                   // vfmadd213ps   %ymm14,%ymm9,%ymm13
-  .byte  196,98,125,24,61,210,19,3,0         // vbroadcastss  0x313d2(%rip),%ymm15        # 3acf8 <_sk_srcover_bgra_8888_sse2_lowp+0x42c>
+  .byte  196,98,125,24,61,202,13,3,0         // vbroadcastss  0x30dca(%rip),%ymm15        # 3a528 <_sk_srcover_bgra_8888_sse2_lowp+0x42c>
   .byte  196,65,52,88,207                    // vaddps        %ymm15,%ymm9,%ymm9
   .byte  196,65,124,83,201                   // vrcpps        %ymm9,%ymm9
   .byte  196,65,20,89,201                    // vmulps        %ymm9,%ymm13,%ymm9
-  .byte  196,98,125,24,45,150,18,3,0         // vbroadcastss  0x31296(%rip),%ymm13        # 3abd4 <_sk_srcover_bgra_8888_sse2_lowp+0x308>
+  .byte  196,98,125,24,45,142,12,3,0         // vbroadcastss  0x30c8e(%rip),%ymm13        # 3a404 <_sk_srcover_bgra_8888_sse2_lowp+0x308>
   .byte  196,193,124,194,197,1               // vcmpltps      %ymm13,%ymm0,%ymm0
   .byte  196,195,53,74,194,0                 // vblendvps     %ymm0,%ymm10,%ymm9,%ymm0
   .byte  197,124,82,201                      // vrsqrtps      %ymm1,%ymm9
@@ -9402,26 +9323,26 @@
   .byte  197,116,93,202                      // vminps        %ymm2,%ymm1,%ymm9
   .byte  196,65,124,93,201                   // vminps        %ymm9,%ymm0,%ymm9
   .byte  196,65,60,92,209                    // vsubps        %ymm9,%ymm8,%ymm10
-  .byte  196,98,125,24,29,173,17,3,0         // vbroadcastss  0x311ad(%rip),%ymm11        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,29,165,11,3,0         // vbroadcastss  0x30ba5(%rip),%ymm11        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,36,94,218                    // vdivps        %ymm10,%ymm11,%ymm11
   .byte  197,116,92,226                      // vsubps        %ymm2,%ymm1,%ymm12
   .byte  197,116,194,234,1                   // vcmpltps      %ymm2,%ymm1,%ymm13
-  .byte  196,98,125,24,53,242,17,3,0         // vbroadcastss  0x311f2(%rip),%ymm14        # 3abd8 <_sk_srcover_bgra_8888_sse2_lowp+0x30c>
+  .byte  196,98,125,24,53,234,11,3,0         // vbroadcastss  0x30bea(%rip),%ymm14        # 3a408 <_sk_srcover_bgra_8888_sse2_lowp+0x30c>
   .byte  196,65,4,87,255                     // vxorps        %ymm15,%ymm15,%ymm15
   .byte  196,67,5,74,238,208                 // vblendvps     %ymm13,%ymm14,%ymm15,%ymm13
   .byte  196,66,37,168,229                   // vfmadd213ps   %ymm13,%ymm11,%ymm12
   .byte  197,236,92,208                      // vsubps        %ymm0,%ymm2,%ymm2
   .byte  197,124,92,233                      // vsubps        %ymm1,%ymm0,%ymm13
-  .byte  196,98,125,24,53,217,17,3,0         // vbroadcastss  0x311d9(%rip),%ymm14        # 3abe0 <_sk_srcover_bgra_8888_sse2_lowp+0x314>
+  .byte  196,98,125,24,53,209,11,3,0         // vbroadcastss  0x30bd1(%rip),%ymm14        # 3a410 <_sk_srcover_bgra_8888_sse2_lowp+0x314>
   .byte  196,66,37,168,238                   // vfmadd213ps   %ymm14,%ymm11,%ymm13
-  .byte  196,98,125,24,53,199,17,3,0         // vbroadcastss  0x311c7(%rip),%ymm14        # 3abdc <_sk_srcover_bgra_8888_sse2_lowp+0x310>
+  .byte  196,98,125,24,53,191,11,3,0         // vbroadcastss  0x30bbf(%rip),%ymm14        # 3a40c <_sk_srcover_bgra_8888_sse2_lowp+0x310>
   .byte  196,194,37,168,214                  // vfmadd213ps   %ymm14,%ymm11,%ymm2
   .byte  197,188,194,201,0                   // vcmpeqps      %ymm1,%ymm8,%ymm1
   .byte  196,227,21,74,202,16                // vblendvps     %ymm1,%ymm2,%ymm13,%ymm1
   .byte  197,188,194,192,0                   // vcmpeqps      %ymm0,%ymm8,%ymm0
   .byte  196,195,117,74,196,0                // vblendvps     %ymm0,%ymm12,%ymm1,%ymm0
   .byte  196,193,60,88,201                   // vaddps        %ymm9,%ymm8,%ymm1
-  .byte  196,98,125,24,29,58,17,3,0          // vbroadcastss  0x3113a(%rip),%ymm11        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,29,50,11,3,0          // vbroadcastss  0x30b32(%rip),%ymm11        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,193,116,89,211                  // vmulps        %ymm11,%ymm1,%ymm2
   .byte  197,36,194,218,1                    // vcmpltps      %ymm2,%ymm11,%ymm11
   .byte  196,65,12,92,224                    // vsubps        %ymm8,%ymm14,%ymm12
@@ -9431,7 +9352,7 @@
   .byte  197,172,94,201                      // vdivps        %ymm1,%ymm10,%ymm1
   .byte  196,195,125,74,199,128              // vblendvps     %ymm8,%ymm15,%ymm0,%ymm0
   .byte  196,195,117,74,207,128              // vblendvps     %ymm8,%ymm15,%ymm1,%ymm1
-  .byte  196,98,125,24,5,109,17,3,0          // vbroadcastss  0x3116d(%rip),%ymm8        # 3abe4 <_sk_srcover_bgra_8888_sse2_lowp+0x318>
+  .byte  196,98,125,24,5,101,11,3,0          // vbroadcastss  0x30b65(%rip),%ymm8        # 3a414 <_sk_srcover_bgra_8888_sse2_lowp+0x318>
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -9448,30 +9369,30 @@
   .byte  197,252,17,92,36,128                // vmovups       %ymm3,-0x80(%rsp)
   .byte  197,252,40,233                      // vmovaps       %ymm1,%ymm5
   .byte  197,252,40,224                      // vmovaps       %ymm0,%ymm4
-  .byte  196,98,125,24,5,198,16,3,0          // vbroadcastss  0x310c6(%rip),%ymm8        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,5,190,10,3,0          // vbroadcastss  0x30abe(%rip),%ymm8        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,60,194,202,2                    // vcmpleps      %ymm2,%ymm8,%ymm9
   .byte  197,84,89,210                       // vmulps        %ymm2,%ymm5,%ymm10
   .byte  196,65,84,92,218                    // vsubps        %ymm10,%ymm5,%ymm11
   .byte  196,67,45,74,203,144                // vblendvps     %ymm9,%ymm11,%ymm10,%ymm9
   .byte  197,52,88,210                       // vaddps        %ymm2,%ymm9,%ymm10
-  .byte  196,98,125,24,13,9,17,3,0           // vbroadcastss  0x31109(%rip),%ymm9        # 3abdc <_sk_srcover_bgra_8888_sse2_lowp+0x310>
+  .byte  196,98,125,24,13,1,11,3,0           // vbroadcastss  0x30b01(%rip),%ymm9        # 3a40c <_sk_srcover_bgra_8888_sse2_lowp+0x310>
   .byte  196,66,109,170,202                  // vfmsub213ps   %ymm10,%ymm2,%ymm9
-  .byte  196,98,125,24,29,7,17,3,0           // vbroadcastss  0x31107(%rip),%ymm11        # 3abe8 <_sk_srcover_bgra_8888_sse2_lowp+0x31c>
+  .byte  196,98,125,24,29,255,10,3,0         // vbroadcastss  0x30aff(%rip),%ymm11        # 3a418 <_sk_srcover_bgra_8888_sse2_lowp+0x31c>
   .byte  196,65,92,88,219                    // vaddps        %ymm11,%ymm4,%ymm11
   .byte  196,67,125,8,227,1                  // vroundps      $0x1,%ymm11,%ymm12
   .byte  196,65,36,92,252                    // vsubps        %ymm12,%ymm11,%ymm15
   .byte  196,65,44,92,217                    // vsubps        %ymm9,%ymm10,%ymm11
-  .byte  196,98,125,24,45,217,16,3,0         // vbroadcastss  0x310d9(%rip),%ymm13        # 3abd8 <_sk_srcover_bgra_8888_sse2_lowp+0x30c>
+  .byte  196,98,125,24,45,209,10,3,0         // vbroadcastss  0x30ad1(%rip),%ymm13        # 3a408 <_sk_srcover_bgra_8888_sse2_lowp+0x30c>
   .byte  196,193,4,89,197                    // vmulps        %ymm13,%ymm15,%ymm0
-  .byte  196,98,125,24,53,211,16,3,0         // vbroadcastss  0x310d3(%rip),%ymm14        # 3abe0 <_sk_srcover_bgra_8888_sse2_lowp+0x314>
+  .byte  196,98,125,24,53,203,10,3,0         // vbroadcastss  0x30acb(%rip),%ymm14        # 3a410 <_sk_srcover_bgra_8888_sse2_lowp+0x314>
   .byte  197,12,92,224                       // vsubps        %ymm0,%ymm14,%ymm12
   .byte  196,66,37,168,225                   // vfmadd213ps   %ymm9,%ymm11,%ymm12
-  .byte  196,226,125,24,29,205,16,3,0        // vbroadcastss  0x310cd(%rip),%ymm3        # 3abec <_sk_srcover_bgra_8888_sse2_lowp+0x320>
+  .byte  196,226,125,24,29,197,10,3,0        // vbroadcastss  0x30ac5(%rip),%ymm3        # 3a41c <_sk_srcover_bgra_8888_sse2_lowp+0x320>
   .byte  196,193,100,194,255,2               // vcmpleps      %ymm15,%ymm3,%ymm7
   .byte  196,195,29,74,249,112               // vblendvps     %ymm7,%ymm9,%ymm12,%ymm7
   .byte  196,65,60,194,231,2                 // vcmpleps      %ymm15,%ymm8,%ymm12
   .byte  196,227,45,74,255,192               // vblendvps     %ymm12,%ymm7,%ymm10,%ymm7
-  .byte  196,98,125,24,37,164,16,3,0         // vbroadcastss  0x310a4(%rip),%ymm12        # 3abe4 <_sk_srcover_bgra_8888_sse2_lowp+0x318>
+  .byte  196,98,125,24,37,156,10,3,0         // vbroadcastss  0x30a9c(%rip),%ymm12        # 3a414 <_sk_srcover_bgra_8888_sse2_lowp+0x318>
   .byte  196,65,28,194,255,2                 // vcmpleps      %ymm15,%ymm12,%ymm15
   .byte  196,194,37,168,193                  // vfmadd213ps   %ymm9,%ymm11,%ymm0
   .byte  196,99,125,74,255,240               // vblendvps     %ymm15,%ymm7,%ymm0,%ymm15
@@ -9487,7 +9408,7 @@
   .byte  197,156,194,192,2                   // vcmpleps      %ymm0,%ymm12,%ymm0
   .byte  196,194,37,168,249                  // vfmadd213ps   %ymm9,%ymm11,%ymm7
   .byte  196,227,69,74,201,0                 // vblendvps     %ymm0,%ymm1,%ymm7,%ymm1
-  .byte  196,226,125,24,5,88,16,3,0          // vbroadcastss  0x31058(%rip),%ymm0        # 3abf0 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  .byte  196,226,125,24,5,80,10,3,0          // vbroadcastss  0x30a50(%rip),%ymm0        # 3a420 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
   .byte  197,220,88,192                      // vaddps        %ymm0,%ymm4,%ymm0
   .byte  196,227,125,8,224,1                 // vroundps      $0x1,%ymm0,%ymm4
   .byte  197,252,92,196                      // vsubps        %ymm4,%ymm0,%ymm0
@@ -9533,18 +9454,16 @@
 FUNCTION(_sk_scale_u8_hsw)
 _sk_scale_u8_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,58                              // jne           9c87 <_sk_scale_u8_hsw+0x52>
-  .byte  196,2,121,48,4,24                   // vpmovzxbw     (%r8,%r11,1),%xmm8
-  .byte  197,57,219,5,181,24,3,0             // vpand         0x318b5(%rip),%xmm8,%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  117,58                              // jne           9ab9 <_sk_scale_u8_hsw+0x4c>
+  .byte  196,66,121,48,4,16                  // vpmovzxbw     (%r8,%rdx,1),%xmm8
+  .byte  197,57,219,5,195,18,3,0             // vpand         0x312c3(%rip),%xmm8,%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  196,66,125,51,192                   // vpmovzxwd     %xmm8,%ymm8
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  196,98,125,24,13,134,15,3,0         // vbroadcastss  0x30f86(%rip),%ymm9        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,13,132,9,3,0          // vbroadcastss  0x30984(%rip),%ymm9        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
   .byte  197,188,89,201                      // vmulps        %ymm1,%ymm8,%ymm1
@@ -9552,56 +9471,54 @@
   .byte  197,188,89,219                      // vmulps        %ymm3,%ymm8,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,183                             // ja            9c53 <_sk_scale_u8_hsw+0x1e>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,121,0,0,0                 // lea           0x79(%rip),%r10        # 9d20 <_sk_scale_u8_hsw+0xeb>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,189                             // ja            9a85 <_sk_scale_u8_hsw+0x18>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,122,0,0,0                 // lea           0x7a(%rip),%r9        # 9b4c <_sk_scale_u8_hsw+0xdf>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  235,152                             // jmp           9c53 <_sk_scale_u8_hsw+0x1e>
-  .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
+  .byte  235,159                             // jmp           9a85 <_sk_scale_u8_hsw+0x18>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  197,57,196,192,2                    // vpinsrw       $0x2,%eax,%xmm8,%xmm8
-  .byte  67,15,183,4,24                      // movzwl        (%r8,%r11,1),%eax
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  197,121,110,200                     // vmovd         %eax,%xmm9
   .byte  196,66,121,48,201                   // vpmovzxbw     %xmm9,%xmm9
   .byte  196,67,57,2,193,1                   // vpblendd      $0x1,%xmm9,%xmm8,%xmm8
-  .byte  233,111,255,255,255                 // jmpq          9c53 <_sk_scale_u8_hsw+0x1e>
-  .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
+  .byte  233,118,255,255,255                 // jmpq          9a85 <_sk_scale_u8_hsw+0x18>
+  .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  197,57,196,192,6                    // vpinsrw       $0x6,%eax,%xmm8,%xmm8
-  .byte  67,15,182,68,24,5                   // movzbl        0x5(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,5                   // movzbl        0x5(%r8,%rdx,1),%eax
   .byte  197,57,196,192,5                    // vpinsrw       $0x5,%eax,%xmm8,%xmm8
-  .byte  67,15,182,68,24,4                   // movzbl        0x4(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,4                   // movzbl        0x4(%r8,%rdx,1),%eax
   .byte  197,57,196,192,4                    // vpinsrw       $0x4,%eax,%xmm8,%xmm8
-  .byte  196,1,121,110,12,24                 // vmovd         (%r8,%r11,1),%xmm9
+  .byte  196,65,121,110,12,16                // vmovd         (%r8,%rdx,1),%xmm9
   .byte  196,66,121,48,201                   // vpmovzxbw     %xmm9,%xmm9
   .byte  196,67,49,2,192,12                  // vpblendd      $0xc,%xmm8,%xmm9,%xmm8
-  .byte  233,51,255,255,255                  // jmpq          9c53 <_sk_scale_u8_hsw+0x1e>
+  .byte  233,58,255,255,255                  // jmpq          9a85 <_sk_scale_u8_hsw+0x18>
   .byte  144                                 // nop
+  .byte  143                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,171,255,255,255,155             // ljmp          *-0x64000001(%rbx)
+  .byte  255,170,255,255,255,154             // ljmp          *-0x65000001(%rdx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  234                                 // (bad)
+  .byte  233,255,255,255,222                 // jmpq          ffffffffdf009b5c <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffdefcfa60>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  223,255                             // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,212                             // callq         *%rsp
+  .byte  255,211                             // callq         *%rbx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,196                             // inc           %esp
+  .byte  255,195                             // inc           %ebx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -9611,30 +9528,28 @@
 FUNCTION(_sk_scale_565_hsw)
 _sk_scale_565_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,161,0,0,0                    // jne           9dfc <_sk_scale_565_hsw+0xc0>
-  .byte  196,1,122,111,4,88                  // vmovdqu       (%r8,%r11,2),%xmm8
+  .byte  15,133,161,0,0,0                    // jne           9c22 <_sk_scale_565_hsw+0xba>
+  .byte  196,65,122,111,4,80                 // vmovdqu       (%r8,%rdx,2),%xmm8
   .byte  196,66,125,51,192                   // vpmovzxwd     %xmm8,%ymm8
-  .byte  196,98,125,88,13,137,14,3,0         // vpbroadcastd  0x30e89(%rip),%ymm9        # 3abf8 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  .byte  196,98,125,88,13,147,8,3,0          // vpbroadcastd  0x30893(%rip),%ymm9        # 3a428 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
   .byte  196,65,61,219,201                   // vpand         %ymm9,%ymm8,%ymm9
   .byte  196,65,124,91,201                   // vcvtdq2ps     %ymm9,%ymm9
-  .byte  196,98,125,24,21,122,14,3,0         // vbroadcastss  0x30e7a(%rip),%ymm10        # 3abfc <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  .byte  196,98,125,24,21,132,8,3,0          // vbroadcastss  0x30884(%rip),%ymm10        # 3a42c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
   .byte  196,65,52,89,202                    // vmulps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,88,21,112,14,3,0         // vpbroadcastd  0x30e70(%rip),%ymm10        # 3ac00 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  .byte  196,98,125,88,21,122,8,3,0          // vpbroadcastd  0x3087a(%rip),%ymm10        # 3a430 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
   .byte  196,65,61,219,210                   // vpand         %ymm10,%ymm8,%ymm10
   .byte  196,65,124,91,210                   // vcvtdq2ps     %ymm10,%ymm10
-  .byte  196,98,125,24,29,97,14,3,0          // vbroadcastss  0x30e61(%rip),%ymm11        # 3ac04 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  .byte  196,98,125,24,29,107,8,3,0          // vbroadcastss  0x3086b(%rip),%ymm11        # 3a434 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
   .byte  196,65,44,89,211                    // vmulps        %ymm11,%ymm10,%ymm10
-  .byte  196,98,125,88,29,87,14,3,0          // vpbroadcastd  0x30e57(%rip),%ymm11        # 3ac08 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  .byte  196,98,125,88,29,97,8,3,0           // vpbroadcastd  0x30861(%rip),%ymm11        # 3a438 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
   .byte  196,65,61,219,195                   // vpand         %ymm11,%ymm8,%ymm8
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  196,98,125,24,29,72,14,3,0          // vbroadcastss  0x30e48(%rip),%ymm11        # 3ac0c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  .byte  196,98,125,24,29,82,8,3,0           // vbroadcastss  0x30852(%rip),%ymm11        # 3a43c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
   .byte  196,65,60,89,195                    // vmulps        %ymm11,%ymm8,%ymm8
   .byte  197,100,194,223,1                   // vcmpltps      %ymm7,%ymm3,%ymm11
   .byte  196,65,44,93,224                    // vminps        %ymm8,%ymm10,%ymm12
@@ -9648,49 +9563,51 @@
   .byte  197,164,89,219                      // vmulps        %ymm3,%ymm11,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,76,255,255,255               // ja            9d61 <_sk_scale_565_hsw+0x25>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,100,0,0,0                 // lea           0x64(%rip),%r10        # 9e84 <_sk_scale_565_hsw+0x148>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  15,135,82,255,255,255               // ja            9b87 <_sk_scale_565_hsw+0x1f>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,101,0,0,0                 // lea           0x65(%rip),%r9        # 9ca4 <_sk_scale_565_hsw+0x13c>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  233,42,255,255,255                  // jmpq          9d61 <_sk_scale_565_hsw+0x25>
+  .byte  233,49,255,255,255                  // jmpq          9b87 <_sk_scale_565_hsw+0x1f>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,4,2              // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,1,121,110,12,88                 // vmovd         (%r8,%r11,2),%xmm9
+  .byte  196,65,57,196,68,80,4,2             // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,65,121,110,12,80                // vmovd         (%r8,%rdx,2),%xmm9
   .byte  196,67,57,2,193,1                   // vpblendd      $0x1,%xmm9,%xmm8,%xmm8
-  .byte  233,12,255,255,255                  // jmpq          9d61 <_sk_scale_565_hsw+0x25>
+  .byte  233,19,255,255,255                  // jmpq          9b87 <_sk_scale_565_hsw+0x1f>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,12,6             // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,10,5             // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,8,4              // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,1,122,126,12,88                 // vmovq         (%r8,%r11,2),%xmm9
+  .byte  196,65,57,196,68,80,12,6            // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,65,57,196,68,80,10,5            // vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,65,57,196,68,80,8,4             // vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,65,122,126,12,80                // vmovq         (%r8,%rdx,2),%xmm9
   .byte  196,67,49,2,192,12                  // vpblendd      $0xc,%xmm8,%xmm9,%xmm8
-  .byte  233,222,254,255,255                 // jmpq          9d61 <_sk_scale_565_hsw+0x25>
-  .byte  144                                 // nop
-  .byte  165                                 // movsl         %ds:(%rsi),%es:(%rdi)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,192                             // inc           %eax
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,179,255,255,255,238             // pushq         -0x11000001(%rbx)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,230                             // jmpq          *%rsi
+  .byte  233,229,254,255,255                 // jmpq          9b87 <_sk_scale_565_hsw+0x1f>
+  .byte  102,144                             // xchg          %ax,%ax
+  .byte  164                                 // movsb         %ds:(%rsi),%es:(%rdi)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  222,255                             // fdivrp        %st,%st(7)
+  .byte  191,255,255,255,178                 // mov           $0xb2ffffff,%edi
   .byte  255                                 // (bad)
-  .byte  255,209                             // callq         *%rcx
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  237                                 // in            (%dx),%eax
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,229                             // jmpq          *%rbp
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  221,255                             // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,208                             // callq         *%rax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -9717,18 +9634,16 @@
 FUNCTION(_sk_lerp_u8_hsw)
 _sk_lerp_u8_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,78                              // jne           9f35 <_sk_lerp_u8_hsw+0x66>
-  .byte  196,2,121,48,4,24                   // vpmovzxbw     (%r8,%r11,1),%xmm8
-  .byte  197,57,219,5,27,22,3,0              // vpand         0x3161b(%rip),%xmm8,%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  117,78                              // jne           9d4f <_sk_lerp_u8_hsw+0x60>
+  .byte  196,66,121,48,4,16                  // vpmovzxbw     (%r8,%rdx,1),%xmm8
+  .byte  197,57,219,5,65,16,3,0              // vpand         0x31041(%rip),%xmm8,%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  196,66,125,51,192                   // vpmovzxwd     %xmm8,%ymm8
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  196,98,125,24,13,236,12,3,0         // vbroadcastss  0x30cec(%rip),%ymm9        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,13,2,7,3,0            // vbroadcastss  0x30702(%rip),%ymm9        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
   .byte  197,252,92,196                      // vsubps        %ymm4,%ymm0,%ymm0
   .byte  196,226,61,168,196                  // vfmadd213ps   %ymm4,%ymm8,%ymm0
@@ -9740,53 +9655,56 @@
   .byte  196,226,61,168,223                  // vfmadd213ps   %ymm7,%ymm8,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,163                             // ja            9eed <_sk_lerp_u8_hsw+0x1e>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,123,0,0,0                 // lea           0x7b(%rip),%r10        # 9fd0 <_sk_lerp_u8_hsw+0x101>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,169                             // ja            9d07 <_sk_lerp_u8_hsw+0x18>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,124,0,0,0                 // lea           0x7c(%rip),%r9        # 9de4 <_sk_lerp_u8_hsw+0xf5>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  235,132                             // jmp           9eed <_sk_lerp_u8_hsw+0x1e>
-  .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
+  .byte  235,139                             // jmp           9d07 <_sk_lerp_u8_hsw+0x18>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  197,57,196,192,2                    // vpinsrw       $0x2,%eax,%xmm8,%xmm8
-  .byte  67,15,183,4,24                      // movzwl        (%r8,%r11,1),%eax
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  197,121,110,200                     // vmovd         %eax,%xmm9
   .byte  196,66,121,48,201                   // vpmovzxbw     %xmm9,%xmm9
   .byte  196,67,57,2,193,1                   // vpblendd      $0x1,%xmm9,%xmm8,%xmm8
-  .byte  233,91,255,255,255                  // jmpq          9eed <_sk_lerp_u8_hsw+0x1e>
-  .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
+  .byte  233,98,255,255,255                  // jmpq          9d07 <_sk_lerp_u8_hsw+0x18>
+  .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  197,57,196,192,6                    // vpinsrw       $0x6,%eax,%xmm8,%xmm8
-  .byte  67,15,182,68,24,5                   // movzbl        0x5(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,5                   // movzbl        0x5(%r8,%rdx,1),%eax
   .byte  197,57,196,192,5                    // vpinsrw       $0x5,%eax,%xmm8,%xmm8
-  .byte  67,15,182,68,24,4                   // movzbl        0x4(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,4                   // movzbl        0x4(%r8,%rdx,1),%eax
   .byte  197,57,196,192,4                    // vpinsrw       $0x4,%eax,%xmm8,%xmm8
-  .byte  196,1,121,110,12,24                 // vmovd         (%r8,%r11,1),%xmm9
+  .byte  196,65,121,110,12,16                // vmovd         (%r8,%rdx,1),%xmm9
   .byte  196,66,121,48,201                   // vpmovzxbw     %xmm9,%xmm9
   .byte  196,67,49,2,192,12                  // vpblendd      $0xc,%xmm8,%xmm9,%xmm8
-  .byte  233,31,255,255,255                  // jmpq          9eed <_sk_lerp_u8_hsw+0x1e>
-  .byte  102,144                             // xchg          %ax,%ax
-  .byte  142,255                             // mov           %edi,%?
+  .byte  233,38,255,255,255                  // jmpq          9d07 <_sk_lerp_u8_hsw+0x18>
+  .byte  15,31,0                             // nopl          (%rax)
+  .byte  141                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,169,255,255,255,153             // ljmp          *-0x66000001(%rcx)
+  .byte  255                                 // (bad)
+  .byte  255,168,255,255,255,152             // ljmp          *-0x67000001(%rax)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,231                             // jmpq          *%rdi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  232,255,255,255,221                 // callq         ffffffffde009fe0 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddfcf714>
+  .byte  220,255                             // fdivr         %st,%st(7)
+  .byte  255                                 // (bad)
+  .byte  255,209                             // callq         *%rcx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,210                             // callq         *%rdx
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,194                             // inc           %edx
+  .byte  255,193                             // inc           %ecx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -9796,30 +9714,28 @@
 FUNCTION(_sk_lerp_565_hsw)
 _sk_lerp_565_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,181,0,0,0                    // jne           a0c0 <_sk_lerp_565_hsw+0xd4>
-  .byte  196,1,122,111,4,88                  // vmovdqu       (%r8,%r11,2),%xmm8
+  .byte  15,133,181,0,0,0                    // jne           9ece <_sk_lerp_565_hsw+0xce>
+  .byte  196,65,122,111,4,80                 // vmovdqu       (%r8,%rdx,2),%xmm8
   .byte  196,66,125,51,192                   // vpmovzxwd     %xmm8,%ymm8
-  .byte  196,98,125,88,13,217,11,3,0         // vpbroadcastd  0x30bd9(%rip),%ymm9        # 3abf8 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  .byte  196,98,125,88,13,251,5,3,0          // vpbroadcastd  0x305fb(%rip),%ymm9        # 3a428 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
   .byte  196,65,61,219,201                   // vpand         %ymm9,%ymm8,%ymm9
   .byte  196,65,124,91,201                   // vcvtdq2ps     %ymm9,%ymm9
-  .byte  196,98,125,24,21,202,11,3,0         // vbroadcastss  0x30bca(%rip),%ymm10        # 3abfc <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  .byte  196,98,125,24,21,236,5,3,0          // vbroadcastss  0x305ec(%rip),%ymm10        # 3a42c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
   .byte  196,65,52,89,202                    // vmulps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,88,21,192,11,3,0         // vpbroadcastd  0x30bc0(%rip),%ymm10        # 3ac00 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  .byte  196,98,125,88,21,226,5,3,0          // vpbroadcastd  0x305e2(%rip),%ymm10        # 3a430 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
   .byte  196,65,61,219,210                   // vpand         %ymm10,%ymm8,%ymm10
   .byte  196,65,124,91,210                   // vcvtdq2ps     %ymm10,%ymm10
-  .byte  196,98,125,24,29,177,11,3,0         // vbroadcastss  0x30bb1(%rip),%ymm11        # 3ac04 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  .byte  196,98,125,24,29,211,5,3,0          // vbroadcastss  0x305d3(%rip),%ymm11        # 3a434 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
   .byte  196,65,44,89,211                    // vmulps        %ymm11,%ymm10,%ymm10
-  .byte  196,98,125,88,29,167,11,3,0         // vpbroadcastd  0x30ba7(%rip),%ymm11        # 3ac08 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  .byte  196,98,125,88,29,201,5,3,0          // vpbroadcastd  0x305c9(%rip),%ymm11        # 3a438 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
   .byte  196,65,61,219,195                   // vpand         %ymm11,%ymm8,%ymm8
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  196,98,125,24,29,152,11,3,0         // vbroadcastss  0x30b98(%rip),%ymm11        # 3ac0c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  .byte  196,98,125,24,29,186,5,3,0          // vbroadcastss  0x305ba(%rip),%ymm11        # 3a43c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
   .byte  196,65,60,89,195                    // vmulps        %ymm11,%ymm8,%ymm8
   .byte  197,100,194,223,1                   // vcmpltps      %ymm7,%ymm3,%ymm11
   .byte  196,65,44,93,224                    // vminps        %ymm8,%ymm10,%ymm12
@@ -9837,49 +9753,51 @@
   .byte  196,226,37,168,223                  // vfmadd213ps   %ymm7,%ymm11,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,56,255,255,255               // ja            a011 <_sk_lerp_565_hsw+0x25>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,100,0,0,0                 // lea           0x64(%rip),%r10        # a148 <_sk_lerp_565_hsw+0x15c>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  15,135,62,255,255,255               // ja            9e1f <_sk_lerp_565_hsw+0x1f>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,101,0,0,0                 // lea           0x65(%rip),%r9        # 9f50 <_sk_lerp_565_hsw+0x150>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  233,22,255,255,255                  // jmpq          a011 <_sk_lerp_565_hsw+0x25>
+  .byte  233,29,255,255,255                  // jmpq          9e1f <_sk_lerp_565_hsw+0x1f>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,4,2              // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,1,121,110,12,88                 // vmovd         (%r8,%r11,2),%xmm9
+  .byte  196,65,57,196,68,80,4,2             // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,65,121,110,12,80                // vmovd         (%r8,%rdx,2),%xmm9
   .byte  196,67,57,2,193,1                   // vpblendd      $0x1,%xmm9,%xmm8,%xmm8
-  .byte  233,248,254,255,255                 // jmpq          a011 <_sk_lerp_565_hsw+0x25>
+  .byte  233,255,254,255,255                 // jmpq          9e1f <_sk_lerp_565_hsw+0x1f>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,12,6             // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,10,5             // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,8,4              // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,1,122,126,12,88                 // vmovq         (%r8,%r11,2),%xmm9
+  .byte  196,65,57,196,68,80,12,6            // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,65,57,196,68,80,10,5            // vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,65,57,196,68,80,8,4             // vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,65,122,126,12,80                // vmovq         (%r8,%rdx,2),%xmm9
   .byte  196,67,49,2,192,12                  // vpblendd      $0xc,%xmm8,%xmm9,%xmm8
-  .byte  233,202,254,255,255                 // jmpq          a011 <_sk_lerp_565_hsw+0x25>
-  .byte  144                                 // nop
-  .byte  165                                 // movsl         %ds:(%rsi),%es:(%rdi)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,192                             // inc           %eax
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,179,255,255,255,238             // pushq         -0x11000001(%rbx)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,230                             // jmpq          *%rsi
+  .byte  233,209,254,255,255                 // jmpq          9e1f <_sk_lerp_565_hsw+0x1f>
+  .byte  102,144                             // xchg          %ax,%ax
+  .byte  164                                 // movsb         %ds:(%rsi),%es:(%rdi)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  222,255                             // fdivrp        %st,%st(7)
+  .byte  191,255,255,255,178                 // mov           $0xb2ffffff,%edi
   .byte  255                                 // (bad)
-  .byte  255,209                             // callq         *%rcx
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  237                                 // in            (%dx),%eax
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,229                             // jmpq          *%rbp
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  221,255                             // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,208                             // callq         *%rax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -9891,9 +9809,9 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,116                             // jne           a1e2 <_sk_load_tables_hsw+0x7e>
+  .byte  117,116                             // jne           9fea <_sk_load_tables_hsw+0x7e>
   .byte  196,193,126,111,28,144              // vmovdqu       (%r8,%rdx,4),%ymm3
-  .byte  197,229,219,13,164,12,3,0           // vpand         0x30ca4(%rip),%ymm3,%ymm1        # 3ae20 <_sk_srcover_bgra_8888_sse2_lowp+0x554>
+  .byte  197,229,219,13,220,6,3,0            // vpand         0x306dc(%rip),%ymm3,%ymm1        # 3a660 <_sk_srcover_bgra_8888_sse2_lowp+0x564>
   .byte  196,65,61,118,192                   // vpcmpeqd      %ymm8,%ymm8,%ymm8
   .byte  76,139,64,8                         // mov           0x8(%rax),%r8
   .byte  76,139,72,16                        // mov           0x10(%rax),%r9
@@ -9901,16 +9819,16 @@
   .byte  197,253,239,192                     // vpxor         %ymm0,%ymm0,%ymm0
   .byte  196,65,53,118,201                   // vpcmpeqd      %ymm9,%ymm9,%ymm9
   .byte  196,194,53,146,4,136                // vgatherdps    %ymm9,(%r8,%ymm1,4),%ymm0
-  .byte  196,98,101,0,13,155,12,3,0          // vpshufb       0x30c9b(%rip),%ymm3,%ymm9        # 3ae40 <_sk_srcover_bgra_8888_sse2_lowp+0x574>
+  .byte  196,98,101,0,13,211,6,3,0           // vpshufb       0x306d3(%rip),%ymm3,%ymm9        # 3a680 <_sk_srcover_bgra_8888_sse2_lowp+0x584>
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  196,65,45,118,210                   // vpcmpeqd      %ymm10,%ymm10,%ymm10
   .byte  196,130,45,146,12,137               // vgatherdps    %ymm10,(%r9,%ymm9,4),%ymm1
   .byte  72,139,64,24                        // mov           0x18(%rax),%rax
-  .byte  196,98,101,0,13,159,12,3,0          // vpshufb       0x30c9f(%rip),%ymm3,%ymm9        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0x594>
+  .byte  196,98,101,0,13,215,6,3,0           // vpshufb       0x306d7(%rip),%ymm3,%ymm9        # 3a6a0 <_sk_srcover_bgra_8888_sse2_lowp+0x5a4>
   .byte  196,162,61,146,20,136               // vgatherdps    %ymm8,(%rax,%ymm9,4),%ymm2
   .byte  197,229,114,211,24                  // vpsrld        $0x18,%ymm3,%ymm3
   .byte  197,252,91,219                      // vcvtdq2ps     %ymm3,%ymm3
-  .byte  196,98,125,24,5,27,10,3,0           // vbroadcastss  0x30a1b(%rip),%ymm8        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,5,67,4,3,0            // vbroadcastss  0x30443(%rip),%ymm8        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,193,100,89,216                  // vmulps        %ymm8,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -9919,21 +9837,21 @@
   .byte  197,229,239,219                     // vpxor         %ymm3,%ymm3,%ymm3
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,122,255,255,255              // ja            a174 <_sk_load_tables_hsw+0x10>
+  .byte  15,135,122,255,255,255              // ja            9f7c <_sk_load_tables_hsw+0x10>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,139,0,0,0                 // lea           0x8b(%rip),%r10        # a290 <_sk_load_tables_hsw+0x12c>
+  .byte  76,141,21,139,0,0,0                 // lea           0x8b(%rip),%r10        # a098 <_sk_load_tables_hsw+0x12c>
   .byte  79,99,12,138                        // movslq        (%r10,%r9,4),%r9
   .byte  77,1,209                            // add           %r10,%r9
   .byte  65,255,225                          // jmpq          *%r9
   .byte  196,193,121,110,28,144              // vmovd         (%r8,%rdx,4),%xmm3
-  .byte  233,90,255,255,255                  // jmpq          a174 <_sk_load_tables_hsw+0x10>
+  .byte  233,90,255,255,255                  // jmpq          9f7c <_sk_load_tables_hsw+0x10>
   .byte  196,193,121,110,68,144,8            // vmovd         0x8(%r8,%rdx,4),%xmm0
   .byte  196,226,121,89,192                  // vpbroadcastq  %xmm0,%xmm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
   .byte  196,227,117,2,216,4                 // vpblendd      $0x4,%ymm0,%ymm1,%ymm3
   .byte  196,193,122,126,4,144               // vmovq         (%r8,%rdx,4),%xmm0
   .byte  196,227,101,2,216,3                 // vpblendd      $0x3,%ymm0,%ymm3,%ymm3
-  .byte  233,51,255,255,255                  // jmpq          a174 <_sk_load_tables_hsw+0x10>
+  .byte  233,51,255,255,255                  // jmpq          9f7c <_sk_load_tables_hsw+0x10>
   .byte  196,193,121,110,68,144,24           // vmovd         0x18(%r8,%rdx,4),%xmm0
   .byte  196,226,125,89,192                  // vpbroadcastq  %xmm0,%ymm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
@@ -9946,8 +9864,8 @@
   .byte  196,227,101,56,216,1                // vinserti128   $0x1,%xmm0,%ymm3,%ymm3
   .byte  196,193,122,111,4,144               // vmovdqu       (%r8,%rdx,4),%xmm0
   .byte  196,227,125,2,219,240               // vpblendd      $0xf0,%ymm3,%ymm0,%ymm3
-  .byte  233,228,254,255,255                 // jmpq          a174 <_sk_load_tables_hsw+0x10>
-  .byte  127,255                             // jg            a291 <_sk_load_tables_hsw+0x12d>
+  .byte  233,228,254,255,255                 // jmpq          9f7c <_sk_load_tables_hsw+0x10>
+  .byte  127,255                             // jg            a099 <_sk_load_tables_hsw+0x12d>
   .byte  255                                 // (bad)
   .byte  255,160,255,255,255,138             // jmpq          *-0x75000001(%rax)
   .byte  255                                 // (bad)
@@ -9975,7 +9893,7 @@
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  76,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,215,0,0,0                    // jne           a399 <_sk_load_tables_u16_be_hsw+0xed>
+  .byte  15,133,215,0,0,0                    // jne           a1a1 <_sk_load_tables_u16_be_hsw+0xed>
   .byte  196,1,121,16,4,72                   // vmovupd       (%r8,%r9,2),%xmm8
   .byte  196,129,121,16,84,72,16             // vmovupd       0x10(%r8,%r9,2),%xmm2
   .byte  196,129,121,16,92,72,32             // vmovupd       0x20(%r8,%r9,2),%xmm3
@@ -9991,7 +9909,7 @@
   .byte  197,185,108,200                     // vpunpcklqdq   %xmm0,%xmm8,%xmm1
   .byte  197,57,109,192                      // vpunpckhqdq   %xmm0,%xmm8,%xmm8
   .byte  196,65,49,108,214                   // vpunpcklqdq   %xmm14,%xmm9,%xmm10
-  .byte  197,121,111,29,252,17,3,0           // vmovdqa       0x311fc(%rip),%xmm11        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  197,121,111,29,52,12,3,0            // vmovdqa       0x30c34(%rip),%xmm11        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  196,193,113,219,195                 // vpand         %xmm11,%xmm1,%xmm0
   .byte  196,226,125,51,200                  // vpmovzxwd     %xmm0,%ymm1
   .byte  196,65,29,118,228                   // vpcmpeqd      %ymm12,%ymm12,%ymm12
@@ -10016,36 +9934,36 @@
   .byte  197,185,235,219                     // vpor          %xmm3,%xmm8,%xmm3
   .byte  196,226,125,51,219                  // vpmovzxwd     %xmm3,%ymm3
   .byte  197,252,91,219                      // vcvtdq2ps     %ymm3,%ymm3
-  .byte  196,98,125,24,5,128,8,3,0           // vbroadcastss  0x30880(%rip),%ymm8        # 3ac10 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
+  .byte  196,98,125,24,5,168,2,3,0           // vbroadcastss  0x302a8(%rip),%ymm8        # 3a440 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
   .byte  196,193,100,89,216                  // vmulps        %ymm8,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,1,123,16,4,72                   // vmovsd        (%r8,%r9,2),%xmm8
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,85                              // je            a3ff <_sk_load_tables_u16_be_hsw+0x153>
+  .byte  116,85                              // je            a207 <_sk_load_tables_u16_be_hsw+0x153>
   .byte  196,1,57,22,68,72,8                 // vmovhpd       0x8(%r8,%r9,2),%xmm8,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,72                              // jb            a3ff <_sk_load_tables_u16_be_hsw+0x153>
+  .byte  114,72                              // jb            a207 <_sk_load_tables_u16_be_hsw+0x153>
   .byte  196,129,123,16,84,72,16             // vmovsd        0x10(%r8,%r9,2),%xmm2
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  116,72                              // je            a40c <_sk_load_tables_u16_be_hsw+0x160>
+  .byte  116,72                              // je            a214 <_sk_load_tables_u16_be_hsw+0x160>
   .byte  196,129,105,22,84,72,24             // vmovhpd       0x18(%r8,%r9,2),%xmm2,%xmm2
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,59                              // jb            a40c <_sk_load_tables_u16_be_hsw+0x160>
+  .byte  114,59                              // jb            a214 <_sk_load_tables_u16_be_hsw+0x160>
   .byte  196,129,123,16,92,72,32             // vmovsd        0x20(%r8,%r9,2),%xmm3
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  15,132,251,254,255,255              // je            a2dd <_sk_load_tables_u16_be_hsw+0x31>
+  .byte  15,132,251,254,255,255              // je            a0e5 <_sk_load_tables_u16_be_hsw+0x31>
   .byte  196,129,97,22,92,72,40              // vmovhpd       0x28(%r8,%r9,2),%xmm3,%xmm3
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,130,234,254,255,255              // jb            a2dd <_sk_load_tables_u16_be_hsw+0x31>
+  .byte  15,130,234,254,255,255              // jb            a0e5 <_sk_load_tables_u16_be_hsw+0x31>
   .byte  196,1,122,126,76,72,48              // vmovq         0x30(%r8,%r9,2),%xmm9
-  .byte  233,222,254,255,255                 // jmpq          a2dd <_sk_load_tables_u16_be_hsw+0x31>
+  .byte  233,222,254,255,255                 // jmpq          a0e5 <_sk_load_tables_u16_be_hsw+0x31>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
   .byte  197,233,87,210                      // vxorpd        %xmm2,%xmm2,%xmm2
-  .byte  233,209,254,255,255                 // jmpq          a2dd <_sk_load_tables_u16_be_hsw+0x31>
+  .byte  233,209,254,255,255                 // jmpq          a0e5 <_sk_load_tables_u16_be_hsw+0x31>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
-  .byte  233,200,254,255,255                 // jmpq          a2dd <_sk_load_tables_u16_be_hsw+0x31>
+  .byte  233,200,254,255,255                 // jmpq          a0e5 <_sk_load_tables_u16_be_hsw+0x31>
 
 HIDDEN _sk_load_tables_rgb_u16_be_hsw
 .globl _sk_load_tables_rgb_u16_be_hsw
@@ -10055,7 +9973,7 @@
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  76,141,12,82                        // lea           (%rdx,%rdx,2),%r9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,206,0,0,0                    // jne           a4f5 <_sk_load_tables_rgb_u16_be_hsw+0xe0>
+  .byte  15,133,206,0,0,0                    // jne           a2fd <_sk_load_tables_rgb_u16_be_hsw+0xe0>
   .byte  196,1,122,111,28,72                 // vmovdqu       (%r8,%r9,2),%xmm11
   .byte  196,129,122,111,92,72,12            // vmovdqu       0xc(%r8,%r9,2),%xmm3
   .byte  196,129,122,111,84,72,24            // vmovdqu       0x18(%r8,%r9,2),%xmm2
@@ -10076,7 +9994,7 @@
   .byte  197,105,108,192                     // vpunpcklqdq   %xmm0,%xmm2,%xmm8
   .byte  197,241,108,195                     // vpunpcklqdq   %xmm3,%xmm1,%xmm0
   .byte  197,241,109,203                     // vpunpckhqdq   %xmm3,%xmm1,%xmm1
-  .byte  197,249,111,29,124,16,3,0           // vmovdqa       0x3107c(%rip),%xmm3        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  197,249,111,29,180,10,3,0           // vmovdqa       0x30ab4(%rip),%xmm3        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  197,249,219,195                     // vpand         %xmm3,%xmm0,%xmm0
   .byte  196,98,125,51,200                   // vpmovzxwd     %xmm0,%ymm9
   .byte  196,65,45,118,210                   // vpcmpeqd      %ymm10,%ymm10,%ymm10
@@ -10096,69 +10014,69 @@
   .byte  196,226,125,51,219                  // vpmovzxwd     %xmm3,%ymm3
   .byte  196,226,45,146,20,152               // vgatherdps    %ymm10,(%rax,%ymm3,4),%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,137,6,3,0         // vbroadcastss  0x30689(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,177,0,3,0         // vbroadcastss  0x300b1(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  255,224                             // jmpq          *%rax
   .byte  196,129,121,110,4,72                // vmovd         (%r8,%r9,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,1,121,196,92,72,4,2             // vpinsrw       $0x2,0x4(%r8,%r9,2),%xmm0,%xmm11
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,31                              // jne           a52d <_sk_load_tables_rgb_u16_be_hsw+0x118>
+  .byte  117,31                              // jne           a335 <_sk_load_tables_rgb_u16_be_hsw+0x118>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
   .byte  197,225,239,219                     // vpxor         %xmm3,%xmm3,%xmm3
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  233,47,255,255,255                  // jmpq          a45c <_sk_load_tables_rgb_u16_be_hsw+0x47>
+  .byte  233,47,255,255,255                  // jmpq          a264 <_sk_load_tables_rgb_u16_be_hsw+0x47>
   .byte  196,129,121,110,68,72,6             // vmovd         0x6(%r8,%r9,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,1,121,196,68,72,10,2            // vpinsrw       $0x2,0xa(%r8,%r9,2),%xmm0,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,48                              // jb            a577 <_sk_load_tables_rgb_u16_be_hsw+0x162>
+  .byte  114,48                              // jb            a37f <_sk_load_tables_rgb_u16_be_hsw+0x162>
   .byte  196,129,121,110,68,72,12            // vmovd         0xc(%r8,%r9,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,129,121,196,92,72,16,2          // vpinsrw       $0x2,0x10(%r8,%r9,2),%xmm0,%xmm3
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  117,48                              // jne           a591 <_sk_load_tables_rgb_u16_be_hsw+0x17c>
+  .byte  117,48                              // jne           a399 <_sk_load_tables_rgb_u16_be_hsw+0x17c>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
-  .byte  233,229,254,255,255                 // jmpq          a45c <_sk_load_tables_rgb_u16_be_hsw+0x47>
+  .byte  233,229,254,255,255                 // jmpq          a264 <_sk_load_tables_rgb_u16_be_hsw+0x47>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
   .byte  197,225,239,219                     // vpxor         %xmm3,%xmm3,%xmm3
-  .byte  233,203,254,255,255                 // jmpq          a45c <_sk_load_tables_rgb_u16_be_hsw+0x47>
+  .byte  233,203,254,255,255                 // jmpq          a264 <_sk_load_tables_rgb_u16_be_hsw+0x47>
   .byte  196,129,121,110,68,72,18            // vmovd         0x12(%r8,%r9,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,1,121,196,84,72,22,2            // vpinsrw       $0x2,0x16(%r8,%r9,2),%xmm0,%xmm10
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,39                              // jb            a5d2 <_sk_load_tables_rgb_u16_be_hsw+0x1bd>
+  .byte  114,39                              // jb            a3da <_sk_load_tables_rgb_u16_be_hsw+0x1bd>
   .byte  196,129,121,110,68,72,24            // vmovd         0x18(%r8,%r9,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,129,121,196,84,72,28,2          // vpinsrw       $0x2,0x1c(%r8,%r9,2),%xmm0,%xmm2
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  117,30                              // jne           a5e3 <_sk_load_tables_rgb_u16_be_hsw+0x1ce>
+  .byte  117,30                              // jne           a3eb <_sk_load_tables_rgb_u16_be_hsw+0x1ce>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
-  .byte  233,138,254,255,255                 // jmpq          a45c <_sk_load_tables_rgb_u16_be_hsw+0x47>
+  .byte  233,138,254,255,255                 // jmpq          a264 <_sk_load_tables_rgb_u16_be_hsw+0x47>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
-  .byte  233,121,254,255,255                 // jmpq          a45c <_sk_load_tables_rgb_u16_be_hsw+0x47>
+  .byte  233,121,254,255,255                 // jmpq          a264 <_sk_load_tables_rgb_u16_be_hsw+0x47>
   .byte  196,129,121,110,68,72,30            // vmovd         0x1e(%r8,%r9,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,129,121,196,76,72,34,2          // vpinsrw       $0x2,0x22(%r8,%r9,2),%xmm0,%xmm1
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,25                              // jb            a616 <_sk_load_tables_rgb_u16_be_hsw+0x201>
+  .byte  114,25                              // jb            a41e <_sk_load_tables_rgb_u16_be_hsw+0x201>
   .byte  196,129,121,110,68,72,36            // vmovd         0x24(%r8,%r9,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,129,121,196,68,72,40,2          // vpinsrw       $0x2,0x28(%r8,%r9,2),%xmm0,%xmm0
-  .byte  233,70,254,255,255                  // jmpq          a45c <_sk_load_tables_rgb_u16_be_hsw+0x47>
+  .byte  233,70,254,255,255                  // jmpq          a264 <_sk_load_tables_rgb_u16_be_hsw+0x47>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  233,61,254,255,255                  // jmpq          a45c <_sk_load_tables_rgb_u16_be_hsw+0x47>
+  .byte  233,61,254,255,255                  // jmpq          a264 <_sk_load_tables_rgb_u16_be_hsw+0x47>
 
 HIDDEN _sk_byte_tables_hsw
 .globl _sk_byte_tables_hsw
@@ -10167,9 +10085,9 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,60,95,200                       // vmaxps        %ymm0,%ymm8,%ymm9
-  .byte  196,98,125,24,29,73,5,3,0           // vbroadcastss  0x30549(%rip),%ymm11        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,29,113,255,2,0        // vbroadcastss  0x2ff71(%rip),%ymm11        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,52,93,211                    // vminps        %ymm11,%ymm9,%ymm10
-  .byte  196,98,125,24,13,103,5,3,0          // vbroadcastss  0x30567(%rip),%ymm9        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,98,125,24,13,143,255,2,0        // vbroadcastss  0x2ff8f(%rip),%ymm9        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   .byte  196,65,44,89,209                    // vmulps        %ymm9,%ymm10,%ymm10
   .byte  196,65,125,91,210                   // vcvtps2dq     %ymm10,%ymm10
   .byte  196,65,249,126,208                  // vmovq         %xmm10,%r8
@@ -10305,7 +10223,7 @@
   .byte  67,15,182,4,17                      // movzbl        (%r9,%r10,1),%eax
   .byte  196,194,125,49,194                  // vpmovzxbd     %xmm10,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,5,29,3,3,0            // vbroadcastss  0x3031d(%rip),%ymm8        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,5,69,253,2,0          // vbroadcastss  0x2fd45(%rip),%ymm8        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
   .byte  196,226,125,49,201                  // vpmovzxbd     %xmm1,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
@@ -10332,7 +10250,7 @@
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
   .byte  197,52,95,208                       // vmaxps        %ymm0,%ymm9,%ymm10
-  .byte  196,98,125,24,29,66,2,3,0           // vbroadcastss  0x30242(%rip),%ymm11        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,29,106,252,2,0        // vbroadcastss  0x2fc6a(%rip),%ymm11        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,44,93,211                    // vminps        %ymm11,%ymm10,%ymm10
   .byte  196,65,44,89,208                    // vmulps        %ymm8,%ymm10,%ymm10
   .byte  196,65,125,91,210                   // vcvtps2dq     %ymm10,%ymm10
@@ -10435,7 +10353,7 @@
   .byte  67,15,182,4,17                      // movzbl        (%r9,%r10,1),%eax
   .byte  196,194,125,49,194                  // vpmovzxbd     %xmm10,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,5,198,0,3,0           // vbroadcastss  0x300c6(%rip),%ymm8        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,5,238,250,2,0         // vbroadcastss  0x2faee(%rip),%ymm8        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
   .byte  196,226,125,49,201                  // vpmovzxbd     %xmm1,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
@@ -10460,7 +10378,7 @@
   .byte  196,65,124,91,200                   // vcvtdq2ps     %ymm8,%ymm9
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
-  .byte  196,98,125,24,21,249,255,2,0        // vbroadcastss  0x2fff9(%rip),%ymm10        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,21,33,250,2,0         // vbroadcastss  0x2fa21(%rip),%ymm10        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,124,93,194                  // vminps        %ymm10,%ymm0,%ymm0
   .byte  196,193,124,89,193                  // vmulps        %ymm9,%ymm0,%ymm0
   .byte  197,253,91,192                      // vcvtps2dq     %ymm0,%ymm0
@@ -10483,7 +10401,7 @@
   .byte  196,65,124,91,200                   // vcvtdq2ps     %ymm8,%ymm9
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,188,95,201                      // vmaxps        %ymm1,%ymm8,%ymm1
-  .byte  196,98,125,24,21,174,255,2,0        // vbroadcastss  0x2ffae(%rip),%ymm10        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,21,214,249,2,0        // vbroadcastss  0x2f9d6(%rip),%ymm10        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,116,93,202                  // vminps        %ymm10,%ymm1,%ymm1
   .byte  196,193,116,89,201                  // vmulps        %ymm9,%ymm1,%ymm1
   .byte  197,253,91,201                      // vcvtps2dq     %ymm1,%ymm1
@@ -10506,7 +10424,7 @@
   .byte  196,65,124,91,200                   // vcvtdq2ps     %ymm8,%ymm9
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,188,95,210                      // vmaxps        %ymm2,%ymm8,%ymm2
-  .byte  196,98,125,24,21,99,255,2,0         // vbroadcastss  0x2ff63(%rip),%ymm10        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,21,139,249,2,0        // vbroadcastss  0x2f98b(%rip),%ymm10        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,108,93,210                  // vminps        %ymm10,%ymm2,%ymm2
   .byte  196,193,108,89,209                  // vmulps        %ymm9,%ymm2,%ymm2
   .byte  197,253,91,210                      // vcvtps2dq     %ymm2,%ymm2
@@ -10529,7 +10447,7 @@
   .byte  196,65,124,91,200                   // vcvtdq2ps     %ymm8,%ymm9
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,188,95,219                      // vmaxps        %ymm3,%ymm8,%ymm3
-  .byte  196,98,125,24,21,24,255,2,0         // vbroadcastss  0x2ff18(%rip),%ymm10        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,21,64,249,2,0         // vbroadcastss  0x2f940(%rip),%ymm10        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,100,93,218                  // vminps        %ymm10,%ymm3,%ymm3
   .byte  196,193,100,89,217                  // vmulps        %ymm9,%ymm3,%ymm3
   .byte  197,253,91,219                      // vcvtps2dq     %ymm3,%ymm3
@@ -10556,33 +10474,33 @@
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
   .byte  197,36,194,208,0                    // vcmpeqps      %ymm0,%ymm11,%ymm10
   .byte  196,65,124,91,235                   // vcvtdq2ps     %ymm11,%ymm13
-  .byte  196,98,125,24,53,67,255,2,0         // vbroadcastss  0x2ff43(%rip),%ymm14        # 3ac14 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
-  .byte  196,98,125,24,61,62,255,2,0         // vbroadcastss  0x2ff3e(%rip),%ymm15        # 3ac18 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  .byte  196,98,125,24,53,107,249,2,0        // vbroadcastss  0x2f96b(%rip),%ymm14        # 3a444 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  .byte  196,98,125,24,61,102,249,2,0        // vbroadcastss  0x2f966(%rip),%ymm15        # 3a448 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   .byte  196,65,36,84,223                    // vandps        %ymm15,%ymm11,%ymm11
-  .byte  196,98,125,24,61,144,254,2,0        // vbroadcastss  0x2fe90(%rip),%ymm15        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,61,184,248,2,0        // vbroadcastss  0x2f8b8(%rip),%ymm15        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,65,36,86,223                    // vorps         %ymm15,%ymm11,%ymm11
-  .byte  196,98,125,24,61,38,255,2,0         // vbroadcastss  0x2ff26(%rip),%ymm15        # 3ac1c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  .byte  196,98,125,24,61,78,249,2,0         // vbroadcastss  0x2f94e(%rip),%ymm15        # 3a44c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   .byte  196,66,21,184,254                   // vfmadd231ps   %ymm14,%ymm13,%ymm15
-  .byte  196,98,125,24,45,28,255,2,0         // vbroadcastss  0x2ff1c(%rip),%ymm13        # 3ac20 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  .byte  196,98,125,24,45,68,249,2,0         // vbroadcastss  0x2f944(%rip),%ymm13        # 3a450 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   .byte  196,66,37,172,239                   // vfnmadd213ps  %ymm15,%ymm11,%ymm13
-  .byte  196,98,125,24,53,18,255,2,0         // vbroadcastss  0x2ff12(%rip),%ymm14        # 3ac24 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  .byte  196,98,125,24,53,58,249,2,0         // vbroadcastss  0x2f93a(%rip),%ymm14        # 3a454 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   .byte  196,65,36,88,222                    // vaddps        %ymm14,%ymm11,%ymm11
-  .byte  196,98,125,24,53,8,255,2,0          // vbroadcastss  0x2ff08(%rip),%ymm14        # 3ac28 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  .byte  196,98,125,24,53,48,249,2,0         // vbroadcastss  0x2f930(%rip),%ymm14        # 3a458 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   .byte  196,65,12,94,219                    // vdivps        %ymm11,%ymm14,%ymm11
   .byte  196,65,20,92,219                    // vsubps        %ymm11,%ymm13,%ymm11
   .byte  196,65,28,89,219                    // vmulps        %ymm11,%ymm12,%ymm11
   .byte  196,67,125,8,227,1                  // vroundps      $0x1,%ymm11,%ymm12
   .byte  196,65,36,92,228                    // vsubps        %ymm12,%ymm11,%ymm12
-  .byte  196,98,125,24,45,233,254,2,0        // vbroadcastss  0x2fee9(%rip),%ymm13        # 3ac2c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  .byte  196,98,125,24,45,17,249,2,0         // vbroadcastss  0x2f911(%rip),%ymm13        # 3a45c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   .byte  196,65,36,88,221                    // vaddps        %ymm13,%ymm11,%ymm11
-  .byte  196,98,125,24,45,223,254,2,0        // vbroadcastss  0x2fedf(%rip),%ymm13        # 3ac30 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  .byte  196,98,125,24,45,7,249,2,0          // vbroadcastss  0x2f907(%rip),%ymm13        # 3a460 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   .byte  196,66,29,172,235                   // vfnmadd213ps  %ymm11,%ymm12,%ymm13
-  .byte  196,98,125,24,29,213,254,2,0        // vbroadcastss  0x2fed5(%rip),%ymm11        # 3ac34 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  .byte  196,98,125,24,29,253,248,2,0        // vbroadcastss  0x2f8fd(%rip),%ymm11        # 3a464 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   .byte  196,65,36,92,220                    // vsubps        %ymm12,%ymm11,%ymm11
-  .byte  196,98,125,24,37,203,254,2,0        // vbroadcastss  0x2fecb(%rip),%ymm12        # 3ac38 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  .byte  196,98,125,24,37,243,248,2,0        // vbroadcastss  0x2f8f3(%rip),%ymm12        # 3a468 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   .byte  196,65,28,94,219                    // vdivps        %ymm11,%ymm12,%ymm11
   .byte  196,65,20,88,219                    // vaddps        %ymm11,%ymm13,%ymm11
-  .byte  196,98,125,24,37,188,254,2,0        // vbroadcastss  0x2febc(%rip),%ymm12        # 3ac3c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  .byte  196,98,125,24,37,228,248,2,0        // vbroadcastss  0x2f8e4(%rip),%ymm12        # 3a46c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   .byte  196,65,36,89,220                    // vmulps        %ymm12,%ymm11,%ymm11
   .byte  196,65,125,91,219                   // vcvtps2dq     %ymm11,%ymm11
   .byte  196,99,37,74,208,160                // vblendvps     %ymm10,%ymm0,%ymm11,%ymm10
@@ -10590,7 +10508,7 @@
   .byte  196,65,44,88,211                    // vaddps        %ymm11,%ymm10,%ymm10
   .byte  196,67,45,74,193,128                // vblendvps     %ymm8,%ymm9,%ymm10,%ymm8
   .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
-  .byte  196,98,125,24,5,206,253,2,0         // vbroadcastss  0x2fdce(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,246,247,2,0         // vbroadcastss  0x2f7f6(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -10612,33 +10530,33 @@
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  197,36,194,209,0                    // vcmpeqps      %ymm1,%ymm11,%ymm10
   .byte  196,65,124,91,235                   // vcvtdq2ps     %ymm11,%ymm13
-  .byte  196,98,125,24,53,17,254,2,0         // vbroadcastss  0x2fe11(%rip),%ymm14        # 3ac14 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
-  .byte  196,98,125,24,61,12,254,2,0         // vbroadcastss  0x2fe0c(%rip),%ymm15        # 3ac18 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  .byte  196,98,125,24,53,57,248,2,0         // vbroadcastss  0x2f839(%rip),%ymm14        # 3a444 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  .byte  196,98,125,24,61,52,248,2,0         // vbroadcastss  0x2f834(%rip),%ymm15        # 3a448 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   .byte  196,65,36,84,223                    // vandps        %ymm15,%ymm11,%ymm11
-  .byte  196,98,125,24,61,94,253,2,0         // vbroadcastss  0x2fd5e(%rip),%ymm15        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,61,134,247,2,0        // vbroadcastss  0x2f786(%rip),%ymm15        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,65,36,86,223                    // vorps         %ymm15,%ymm11,%ymm11
-  .byte  196,98,125,24,61,244,253,2,0        // vbroadcastss  0x2fdf4(%rip),%ymm15        # 3ac1c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  .byte  196,98,125,24,61,28,248,2,0         // vbroadcastss  0x2f81c(%rip),%ymm15        # 3a44c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   .byte  196,66,21,184,254                   // vfmadd231ps   %ymm14,%ymm13,%ymm15
-  .byte  196,98,125,24,45,234,253,2,0        // vbroadcastss  0x2fdea(%rip),%ymm13        # 3ac20 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  .byte  196,98,125,24,45,18,248,2,0         // vbroadcastss  0x2f812(%rip),%ymm13        # 3a450 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   .byte  196,66,37,172,239                   // vfnmadd213ps  %ymm15,%ymm11,%ymm13
-  .byte  196,98,125,24,53,224,253,2,0        // vbroadcastss  0x2fde0(%rip),%ymm14        # 3ac24 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  .byte  196,98,125,24,53,8,248,2,0          // vbroadcastss  0x2f808(%rip),%ymm14        # 3a454 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   .byte  196,65,36,88,222                    // vaddps        %ymm14,%ymm11,%ymm11
-  .byte  196,98,125,24,53,214,253,2,0        // vbroadcastss  0x2fdd6(%rip),%ymm14        # 3ac28 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  .byte  196,98,125,24,53,254,247,2,0        // vbroadcastss  0x2f7fe(%rip),%ymm14        # 3a458 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   .byte  196,65,12,94,219                    // vdivps        %ymm11,%ymm14,%ymm11
   .byte  196,65,20,92,219                    // vsubps        %ymm11,%ymm13,%ymm11
   .byte  196,65,28,89,219                    // vmulps        %ymm11,%ymm12,%ymm11
   .byte  196,67,125,8,227,1                  // vroundps      $0x1,%ymm11,%ymm12
   .byte  196,65,36,92,228                    // vsubps        %ymm12,%ymm11,%ymm12
-  .byte  196,98,125,24,45,183,253,2,0        // vbroadcastss  0x2fdb7(%rip),%ymm13        # 3ac2c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  .byte  196,98,125,24,45,223,247,2,0        // vbroadcastss  0x2f7df(%rip),%ymm13        # 3a45c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   .byte  196,65,36,88,221                    // vaddps        %ymm13,%ymm11,%ymm11
-  .byte  196,98,125,24,45,173,253,2,0        // vbroadcastss  0x2fdad(%rip),%ymm13        # 3ac30 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  .byte  196,98,125,24,45,213,247,2,0        // vbroadcastss  0x2f7d5(%rip),%ymm13        # 3a460 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   .byte  196,66,29,172,235                   // vfnmadd213ps  %ymm11,%ymm12,%ymm13
-  .byte  196,98,125,24,29,163,253,2,0        // vbroadcastss  0x2fda3(%rip),%ymm11        # 3ac34 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  .byte  196,98,125,24,29,203,247,2,0        // vbroadcastss  0x2f7cb(%rip),%ymm11        # 3a464 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   .byte  196,65,36,92,220                    // vsubps        %ymm12,%ymm11,%ymm11
-  .byte  196,98,125,24,37,153,253,2,0        // vbroadcastss  0x2fd99(%rip),%ymm12        # 3ac38 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  .byte  196,98,125,24,37,193,247,2,0        // vbroadcastss  0x2f7c1(%rip),%ymm12        # 3a468 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   .byte  196,65,28,94,219                    // vdivps        %ymm11,%ymm12,%ymm11
   .byte  196,65,20,88,219                    // vaddps        %ymm11,%ymm13,%ymm11
-  .byte  196,98,125,24,37,138,253,2,0        // vbroadcastss  0x2fd8a(%rip),%ymm12        # 3ac3c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  .byte  196,98,125,24,37,178,247,2,0        // vbroadcastss  0x2f7b2(%rip),%ymm12        # 3a46c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   .byte  196,65,36,89,220                    // vmulps        %ymm12,%ymm11,%ymm11
   .byte  196,65,125,91,219                   // vcvtps2dq     %ymm11,%ymm11
   .byte  196,99,37,74,209,160                // vblendvps     %ymm10,%ymm1,%ymm11,%ymm10
@@ -10646,7 +10564,7 @@
   .byte  196,65,44,88,211                    // vaddps        %ymm11,%ymm10,%ymm10
   .byte  196,67,45,74,193,128                // vblendvps     %ymm8,%ymm9,%ymm10,%ymm8
   .byte  197,188,95,201                      // vmaxps        %ymm1,%ymm8,%ymm1
-  .byte  196,98,125,24,5,156,252,2,0         // vbroadcastss  0x2fc9c(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,196,246,2,0         // vbroadcastss  0x2f6c4(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,116,93,200                  // vminps        %ymm8,%ymm1,%ymm1
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -10668,33 +10586,33 @@
   .byte  197,236,87,210                      // vxorps        %ymm2,%ymm2,%ymm2
   .byte  197,36,194,210,0                    // vcmpeqps      %ymm2,%ymm11,%ymm10
   .byte  196,65,124,91,235                   // vcvtdq2ps     %ymm11,%ymm13
-  .byte  196,98,125,24,53,223,252,2,0        // vbroadcastss  0x2fcdf(%rip),%ymm14        # 3ac14 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
-  .byte  196,98,125,24,61,218,252,2,0        // vbroadcastss  0x2fcda(%rip),%ymm15        # 3ac18 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  .byte  196,98,125,24,53,7,247,2,0          // vbroadcastss  0x2f707(%rip),%ymm14        # 3a444 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  .byte  196,98,125,24,61,2,247,2,0          // vbroadcastss  0x2f702(%rip),%ymm15        # 3a448 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   .byte  196,65,36,84,223                    // vandps        %ymm15,%ymm11,%ymm11
-  .byte  196,98,125,24,61,44,252,2,0         // vbroadcastss  0x2fc2c(%rip),%ymm15        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,61,84,246,2,0         // vbroadcastss  0x2f654(%rip),%ymm15        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,65,36,86,223                    // vorps         %ymm15,%ymm11,%ymm11
-  .byte  196,98,125,24,61,194,252,2,0        // vbroadcastss  0x2fcc2(%rip),%ymm15        # 3ac1c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  .byte  196,98,125,24,61,234,246,2,0        // vbroadcastss  0x2f6ea(%rip),%ymm15        # 3a44c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   .byte  196,66,21,184,254                   // vfmadd231ps   %ymm14,%ymm13,%ymm15
-  .byte  196,98,125,24,45,184,252,2,0        // vbroadcastss  0x2fcb8(%rip),%ymm13        # 3ac20 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  .byte  196,98,125,24,45,224,246,2,0        // vbroadcastss  0x2f6e0(%rip),%ymm13        # 3a450 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   .byte  196,66,37,172,239                   // vfnmadd213ps  %ymm15,%ymm11,%ymm13
-  .byte  196,98,125,24,53,174,252,2,0        // vbroadcastss  0x2fcae(%rip),%ymm14        # 3ac24 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  .byte  196,98,125,24,53,214,246,2,0        // vbroadcastss  0x2f6d6(%rip),%ymm14        # 3a454 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   .byte  196,65,36,88,222                    // vaddps        %ymm14,%ymm11,%ymm11
-  .byte  196,98,125,24,53,164,252,2,0        // vbroadcastss  0x2fca4(%rip),%ymm14        # 3ac28 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  .byte  196,98,125,24,53,204,246,2,0        // vbroadcastss  0x2f6cc(%rip),%ymm14        # 3a458 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   .byte  196,65,12,94,219                    // vdivps        %ymm11,%ymm14,%ymm11
   .byte  196,65,20,92,219                    // vsubps        %ymm11,%ymm13,%ymm11
   .byte  196,65,28,89,219                    // vmulps        %ymm11,%ymm12,%ymm11
   .byte  196,67,125,8,227,1                  // vroundps      $0x1,%ymm11,%ymm12
   .byte  196,65,36,92,228                    // vsubps        %ymm12,%ymm11,%ymm12
-  .byte  196,98,125,24,45,133,252,2,0        // vbroadcastss  0x2fc85(%rip),%ymm13        # 3ac2c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  .byte  196,98,125,24,45,173,246,2,0        // vbroadcastss  0x2f6ad(%rip),%ymm13        # 3a45c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   .byte  196,65,36,88,221                    // vaddps        %ymm13,%ymm11,%ymm11
-  .byte  196,98,125,24,45,123,252,2,0        // vbroadcastss  0x2fc7b(%rip),%ymm13        # 3ac30 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  .byte  196,98,125,24,45,163,246,2,0        // vbroadcastss  0x2f6a3(%rip),%ymm13        # 3a460 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   .byte  196,66,29,172,235                   // vfnmadd213ps  %ymm11,%ymm12,%ymm13
-  .byte  196,98,125,24,29,113,252,2,0        // vbroadcastss  0x2fc71(%rip),%ymm11        # 3ac34 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  .byte  196,98,125,24,29,153,246,2,0        // vbroadcastss  0x2f699(%rip),%ymm11        # 3a464 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   .byte  196,65,36,92,220                    // vsubps        %ymm12,%ymm11,%ymm11
-  .byte  196,98,125,24,37,103,252,2,0        // vbroadcastss  0x2fc67(%rip),%ymm12        # 3ac38 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  .byte  196,98,125,24,37,143,246,2,0        // vbroadcastss  0x2f68f(%rip),%ymm12        # 3a468 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   .byte  196,65,28,94,219                    // vdivps        %ymm11,%ymm12,%ymm11
   .byte  196,65,20,88,219                    // vaddps        %ymm11,%ymm13,%ymm11
-  .byte  196,98,125,24,37,88,252,2,0         // vbroadcastss  0x2fc58(%rip),%ymm12        # 3ac3c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  .byte  196,98,125,24,37,128,246,2,0        // vbroadcastss  0x2f680(%rip),%ymm12        # 3a46c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   .byte  196,65,36,89,220                    // vmulps        %ymm12,%ymm11,%ymm11
   .byte  196,65,125,91,219                   // vcvtps2dq     %ymm11,%ymm11
   .byte  196,99,37,74,210,160                // vblendvps     %ymm10,%ymm2,%ymm11,%ymm10
@@ -10702,7 +10620,7 @@
   .byte  196,65,44,88,211                    // vaddps        %ymm11,%ymm10,%ymm10
   .byte  196,67,45,74,193,128                // vblendvps     %ymm8,%ymm9,%ymm10,%ymm8
   .byte  197,188,95,210                      // vmaxps        %ymm2,%ymm8,%ymm2
-  .byte  196,98,125,24,5,106,251,2,0         // vbroadcastss  0x2fb6a(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,146,245,2,0         // vbroadcastss  0x2f592(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,108,93,208                  // vminps        %ymm8,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -10724,33 +10642,33 @@
   .byte  197,228,87,219                      // vxorps        %ymm3,%ymm3,%ymm3
   .byte  197,36,194,211,0                    // vcmpeqps      %ymm3,%ymm11,%ymm10
   .byte  196,65,124,91,235                   // vcvtdq2ps     %ymm11,%ymm13
-  .byte  196,98,125,24,53,173,251,2,0        // vbroadcastss  0x2fbad(%rip),%ymm14        # 3ac14 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
-  .byte  196,98,125,24,61,168,251,2,0        // vbroadcastss  0x2fba8(%rip),%ymm15        # 3ac18 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  .byte  196,98,125,24,53,213,245,2,0        // vbroadcastss  0x2f5d5(%rip),%ymm14        # 3a444 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  .byte  196,98,125,24,61,208,245,2,0        // vbroadcastss  0x2f5d0(%rip),%ymm15        # 3a448 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   .byte  196,65,36,84,223                    // vandps        %ymm15,%ymm11,%ymm11
-  .byte  196,98,125,24,61,250,250,2,0        // vbroadcastss  0x2fafa(%rip),%ymm15        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,61,34,245,2,0         // vbroadcastss  0x2f522(%rip),%ymm15        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,65,36,86,223                    // vorps         %ymm15,%ymm11,%ymm11
-  .byte  196,98,125,24,61,144,251,2,0        // vbroadcastss  0x2fb90(%rip),%ymm15        # 3ac1c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  .byte  196,98,125,24,61,184,245,2,0        // vbroadcastss  0x2f5b8(%rip),%ymm15        # 3a44c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   .byte  196,66,21,184,254                   // vfmadd231ps   %ymm14,%ymm13,%ymm15
-  .byte  196,98,125,24,45,134,251,2,0        // vbroadcastss  0x2fb86(%rip),%ymm13        # 3ac20 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  .byte  196,98,125,24,45,174,245,2,0        // vbroadcastss  0x2f5ae(%rip),%ymm13        # 3a450 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   .byte  196,66,37,172,239                   // vfnmadd213ps  %ymm15,%ymm11,%ymm13
-  .byte  196,98,125,24,53,124,251,2,0        // vbroadcastss  0x2fb7c(%rip),%ymm14        # 3ac24 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  .byte  196,98,125,24,53,164,245,2,0        // vbroadcastss  0x2f5a4(%rip),%ymm14        # 3a454 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   .byte  196,65,36,88,222                    // vaddps        %ymm14,%ymm11,%ymm11
-  .byte  196,98,125,24,53,114,251,2,0        // vbroadcastss  0x2fb72(%rip),%ymm14        # 3ac28 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  .byte  196,98,125,24,53,154,245,2,0        // vbroadcastss  0x2f59a(%rip),%ymm14        # 3a458 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   .byte  196,65,12,94,219                    // vdivps        %ymm11,%ymm14,%ymm11
   .byte  196,65,20,92,219                    // vsubps        %ymm11,%ymm13,%ymm11
   .byte  196,65,28,89,219                    // vmulps        %ymm11,%ymm12,%ymm11
   .byte  196,67,125,8,227,1                  // vroundps      $0x1,%ymm11,%ymm12
   .byte  196,65,36,92,228                    // vsubps        %ymm12,%ymm11,%ymm12
-  .byte  196,98,125,24,45,83,251,2,0         // vbroadcastss  0x2fb53(%rip),%ymm13        # 3ac2c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  .byte  196,98,125,24,45,123,245,2,0        // vbroadcastss  0x2f57b(%rip),%ymm13        # 3a45c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   .byte  196,65,36,88,221                    // vaddps        %ymm13,%ymm11,%ymm11
-  .byte  196,98,125,24,45,73,251,2,0         // vbroadcastss  0x2fb49(%rip),%ymm13        # 3ac30 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  .byte  196,98,125,24,45,113,245,2,0        // vbroadcastss  0x2f571(%rip),%ymm13        # 3a460 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   .byte  196,66,29,172,235                   // vfnmadd213ps  %ymm11,%ymm12,%ymm13
-  .byte  196,98,125,24,29,63,251,2,0         // vbroadcastss  0x2fb3f(%rip),%ymm11        # 3ac34 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  .byte  196,98,125,24,29,103,245,2,0        // vbroadcastss  0x2f567(%rip),%ymm11        # 3a464 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   .byte  196,65,36,92,220                    // vsubps        %ymm12,%ymm11,%ymm11
-  .byte  196,98,125,24,37,53,251,2,0         // vbroadcastss  0x2fb35(%rip),%ymm12        # 3ac38 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  .byte  196,98,125,24,37,93,245,2,0         // vbroadcastss  0x2f55d(%rip),%ymm12        # 3a468 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   .byte  196,65,28,94,219                    // vdivps        %ymm11,%ymm12,%ymm11
   .byte  196,65,20,88,219                    // vaddps        %ymm11,%ymm13,%ymm11
-  .byte  196,98,125,24,37,38,251,2,0         // vbroadcastss  0x2fb26(%rip),%ymm12        # 3ac3c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  .byte  196,98,125,24,37,78,245,2,0         // vbroadcastss  0x2f54e(%rip),%ymm12        # 3a46c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   .byte  196,65,36,89,220                    // vmulps        %ymm12,%ymm11,%ymm11
   .byte  196,65,125,91,219                   // vcvtps2dq     %ymm11,%ymm11
   .byte  196,99,37,74,211,160                // vblendvps     %ymm10,%ymm3,%ymm11,%ymm10
@@ -10758,7 +10676,7 @@
   .byte  196,65,44,88,211                    // vaddps        %ymm11,%ymm10,%ymm10
   .byte  196,67,45,74,193,128                // vblendvps     %ymm8,%ymm9,%ymm10,%ymm8
   .byte  197,188,95,219                      // vmaxps        %ymm3,%ymm8,%ymm3
-  .byte  196,98,125,24,5,56,250,2,0          // vbroadcastss  0x2fa38(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,96,244,2,0          // vbroadcastss  0x2f460(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,100,93,216                  // vminps        %ymm8,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -10776,24 +10694,24 @@
   .byte  197,252,17,84,36,224                // vmovups       %ymm2,-0x20(%rsp)
   .byte  197,252,17,12,36                    // vmovups       %ymm1,(%rsp)
   .byte  197,124,91,208                      // vcvtdq2ps     %ymm0,%ymm10
-  .byte  196,98,125,24,29,129,250,2,0        // vbroadcastss  0x2fa81(%rip),%ymm11        # 3ac14 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
-  .byte  196,226,125,24,37,124,250,2,0       // vbroadcastss  0x2fa7c(%rip),%ymm4        # 3ac18 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  .byte  196,98,125,24,29,169,244,2,0        // vbroadcastss  0x2f4a9(%rip),%ymm11        # 3a444 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  .byte  196,226,125,24,37,164,244,2,0       // vbroadcastss  0x2f4a4(%rip),%ymm4        # 3a448 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   .byte  197,124,84,228                      // vandps        %ymm4,%ymm0,%ymm12
-  .byte  196,226,125,24,29,207,249,2,0       // vbroadcastss  0x2f9cf(%rip),%ymm3        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,226,125,24,29,247,243,2,0       // vbroadcastss  0x2f3f7(%rip),%ymm3        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,252,17,92,36,32                 // vmovups       %ymm3,0x20(%rsp)
   .byte  197,28,86,227                       // vorps         %ymm3,%ymm12,%ymm12
-  .byte  196,98,125,24,45,96,250,2,0         // vbroadcastss  0x2fa60(%rip),%ymm13        # 3ac1c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  .byte  196,98,125,24,45,136,244,2,0        // vbroadcastss  0x2f488(%rip),%ymm13        # 3a44c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   .byte  196,66,37,168,213                   // vfmadd213ps   %ymm13,%ymm11,%ymm10
   .byte  197,124,91,241                      // vcvtdq2ps     %ymm1,%ymm14
   .byte  196,66,37,168,245                   // vfmadd213ps   %ymm13,%ymm11,%ymm14
   .byte  197,124,91,250                      // vcvtdq2ps     %ymm2,%ymm15
   .byte  196,66,37,168,253                   // vfmadd213ps   %ymm13,%ymm11,%ymm15
-  .byte  196,226,125,24,45,68,250,2,0        // vbroadcastss  0x2fa44(%rip),%ymm5        # 3ac20 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  .byte  196,226,125,24,45,108,244,2,0       // vbroadcastss  0x2f46c(%rip),%ymm5        # 3a450 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   .byte  196,98,29,188,213                   // vfnmadd231ps  %ymm5,%ymm12,%ymm10
-  .byte  196,226,125,24,13,58,250,2,0        // vbroadcastss  0x2fa3a(%rip),%ymm1        # 3ac24 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  .byte  196,226,125,24,13,98,244,2,0        // vbroadcastss  0x2f462(%rip),%ymm1        # 3a454 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   .byte  197,252,17,76,36,160                // vmovups       %ymm1,-0x60(%rsp)
   .byte  197,28,88,225                       // vaddps        %ymm1,%ymm12,%ymm12
-  .byte  196,98,125,24,5,43,250,2,0          // vbroadcastss  0x2fa2b(%rip),%ymm8        # 3ac28 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  .byte  196,98,125,24,5,83,244,2,0          // vbroadcastss  0x2f453(%rip),%ymm8        # 3a458 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   .byte  196,65,60,94,228                    // vdivps        %ymm12,%ymm8,%ymm12
   .byte  197,124,17,68,36,128                // vmovups       %ymm8,-0x80(%rsp)
   .byte  196,65,44,92,212                    // vsubps        %ymm12,%ymm10,%ymm10
@@ -10802,18 +10720,18 @@
   .byte  196,65,44,89,213                    // vmulps        %ymm13,%ymm10,%ymm10
   .byte  196,195,125,8,250,1                 // vroundps      $0x1,%ymm10,%ymm7
   .byte  197,172,92,255                      // vsubps        %ymm7,%ymm10,%ymm7
-  .byte  196,98,125,24,29,0,250,2,0          // vbroadcastss  0x2fa00(%rip),%ymm11        # 3ac2c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  .byte  196,98,125,24,29,40,244,2,0         // vbroadcastss  0x2f428(%rip),%ymm11        # 3a45c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   .byte  196,65,44,88,211                    // vaddps        %ymm11,%ymm10,%ymm10
-  .byte  196,98,125,24,37,246,249,2,0        // vbroadcastss  0x2f9f6(%rip),%ymm12        # 3ac30 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  .byte  196,98,125,24,37,30,244,2,0         // vbroadcastss  0x2f41e(%rip),%ymm12        # 3a460 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   .byte  196,66,69,188,212                   // vfnmadd231ps  %ymm12,%ymm7,%ymm10
-  .byte  196,98,125,24,13,236,249,2,0        // vbroadcastss  0x2f9ec(%rip),%ymm9        # 3ac34 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  .byte  196,98,125,24,13,20,244,2,0         // vbroadcastss  0x2f414(%rip),%ymm9        # 3a464 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   .byte  197,180,92,255                      // vsubps        %ymm7,%ymm9,%ymm7
-  .byte  196,226,125,24,13,227,249,2,0       // vbroadcastss  0x2f9e3(%rip),%ymm1        # 3ac38 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  .byte  196,226,125,24,13,11,244,2,0        // vbroadcastss  0x2f40b(%rip),%ymm1        # 3a468 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   .byte  197,244,94,255                      // vdivps        %ymm7,%ymm1,%ymm7
   .byte  197,172,88,255                      // vaddps        %ymm7,%ymm10,%ymm7
   .byte  196,65,44,87,210                    // vxorps        %ymm10,%ymm10,%ymm10
   .byte  196,193,124,194,242,0               // vcmpeqps      %ymm10,%ymm0,%ymm6
-  .byte  196,226,125,24,29,203,249,2,0       // vbroadcastss  0x2f9cb(%rip),%ymm3        # 3ac3c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  .byte  196,226,125,24,29,243,243,2,0       // vbroadcastss  0x2f3f3(%rip),%ymm3        # 3a46c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   .byte  197,196,89,251                      // vmulps        %ymm3,%ymm7,%ymm7
   .byte  197,253,91,255                      // vcvtps2dq     %ymm7,%ymm7
   .byte  196,195,69,74,194,96                // vblendvps     %ymm6,%ymm10,%ymm7,%ymm0
@@ -10882,27 +10800,27 @@
   .byte  197,252,17,76,36,64                 // vmovups       %ymm1,0x40(%rsp)
   .byte  197,252,17,68,36,32                 // vmovups       %ymm0,0x20(%rsp)
   .byte  197,124,91,212                      // vcvtdq2ps     %ymm4,%ymm10
-  .byte  196,98,125,24,29,77,248,2,0         // vbroadcastss  0x2f84d(%rip),%ymm11        # 3ac14 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
-  .byte  196,226,125,24,5,72,248,2,0         // vbroadcastss  0x2f848(%rip),%ymm0        # 3ac18 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  .byte  196,98,125,24,29,117,242,2,0        // vbroadcastss  0x2f275(%rip),%ymm11        # 3a444 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  .byte  196,226,125,24,5,112,242,2,0        // vbroadcastss  0x2f270(%rip),%ymm0        # 3a448 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   .byte  197,92,84,224                       // vandps        %ymm0,%ymm4,%ymm12
   .byte  197,252,40,208                      // vmovaps       %ymm0,%ymm2
   .byte  197,252,40,220                      // vmovaps       %ymm4,%ymm3
-  .byte  196,226,125,24,5,147,247,2,0        // vbroadcastss  0x2f793(%rip),%ymm0        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,226,125,24,5,187,241,2,0        // vbroadcastss  0x2f1bb(%rip),%ymm0        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,252,17,4,36                     // vmovups       %ymm0,(%rsp)
   .byte  197,28,86,224                       // vorps         %ymm0,%ymm12,%ymm12
-  .byte  196,98,125,24,45,37,248,2,0         // vbroadcastss  0x2f825(%rip),%ymm13        # 3ac1c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  .byte  196,98,125,24,45,77,242,2,0         // vbroadcastss  0x2f24d(%rip),%ymm13        # 3a44c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   .byte  196,66,37,168,213                   // vfmadd213ps   %ymm13,%ymm11,%ymm10
   .byte  197,252,40,197                      // vmovaps       %ymm5,%ymm0
   .byte  197,124,91,240                      // vcvtdq2ps     %ymm0,%ymm14
   .byte  196,66,37,168,245                   // vfmadd213ps   %ymm13,%ymm11,%ymm14
   .byte  197,124,91,124,36,128               // vcvtdq2ps     -0x80(%rsp),%ymm15
   .byte  196,66,37,168,253                   // vfmadd213ps   %ymm13,%ymm11,%ymm15
-  .byte  196,226,125,24,45,3,248,2,0         // vbroadcastss  0x2f803(%rip),%ymm5        # 3ac20 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  .byte  196,226,125,24,45,43,242,2,0        // vbroadcastss  0x2f22b(%rip),%ymm5        # 3a450 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   .byte  196,98,29,188,213                   // vfnmadd231ps  %ymm5,%ymm12,%ymm10
-  .byte  196,226,125,24,13,249,247,2,0       // vbroadcastss  0x2f7f9(%rip),%ymm1        # 3ac24 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  .byte  196,226,125,24,13,33,242,2,0        // vbroadcastss  0x2f221(%rip),%ymm1        # 3a454 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   .byte  197,252,17,76,36,192                // vmovups       %ymm1,-0x40(%rsp)
   .byte  197,28,88,225                       // vaddps        %ymm1,%ymm12,%ymm12
-  .byte  196,98,125,24,13,234,247,2,0        // vbroadcastss  0x2f7ea(%rip),%ymm9        # 3ac28 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  .byte  196,98,125,24,13,18,242,2,0         // vbroadcastss  0x2f212(%rip),%ymm9        # 3a458 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   .byte  196,65,52,94,228                    // vdivps        %ymm12,%ymm9,%ymm12
   .byte  197,124,17,76,36,160                // vmovups       %ymm9,-0x60(%rsp)
   .byte  196,65,44,92,212                    // vsubps        %ymm12,%ymm10,%ymm10
@@ -10911,18 +10829,18 @@
   .byte  196,65,44,89,213                    // vmulps        %ymm13,%ymm10,%ymm10
   .byte  196,195,125,8,250,1                 // vroundps      $0x1,%ymm10,%ymm7
   .byte  197,172,92,255                      // vsubps        %ymm7,%ymm10,%ymm7
-  .byte  196,98,125,24,29,191,247,2,0        // vbroadcastss  0x2f7bf(%rip),%ymm11        # 3ac2c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  .byte  196,98,125,24,29,231,241,2,0        // vbroadcastss  0x2f1e7(%rip),%ymm11        # 3a45c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   .byte  196,65,44,88,211                    // vaddps        %ymm11,%ymm10,%ymm10
-  .byte  196,98,125,24,37,181,247,2,0        // vbroadcastss  0x2f7b5(%rip),%ymm12        # 3ac30 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  .byte  196,98,125,24,37,221,241,2,0        // vbroadcastss  0x2f1dd(%rip),%ymm12        # 3a460 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   .byte  196,66,69,188,212                   // vfnmadd231ps  %ymm12,%ymm7,%ymm10
-  .byte  196,98,125,24,5,171,247,2,0         // vbroadcastss  0x2f7ab(%rip),%ymm8        # 3ac34 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  .byte  196,98,125,24,5,211,241,2,0         // vbroadcastss  0x2f1d3(%rip),%ymm8        # 3a464 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   .byte  197,188,92,255                      // vsubps        %ymm7,%ymm8,%ymm7
-  .byte  196,226,125,24,13,162,247,2,0       // vbroadcastss  0x2f7a2(%rip),%ymm1        # 3ac38 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  .byte  196,226,125,24,13,202,241,2,0       // vbroadcastss  0x2f1ca(%rip),%ymm1        # 3a468 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   .byte  197,244,94,255                      // vdivps        %ymm7,%ymm1,%ymm7
   .byte  197,172,88,255                      // vaddps        %ymm7,%ymm10,%ymm7
   .byte  196,65,44,87,210                    // vxorps        %ymm10,%ymm10,%ymm10
   .byte  196,193,100,194,242,0               // vcmpeqps      %ymm10,%ymm3,%ymm6
-  .byte  196,226,125,24,29,138,247,2,0       // vbroadcastss  0x2f78a(%rip),%ymm3        # 3ac3c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  .byte  196,226,125,24,29,178,241,2,0       // vbroadcastss  0x2f1b2(%rip),%ymm3        # 3a46c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   .byte  197,196,89,251                      // vmulps        %ymm3,%ymm7,%ymm7
   .byte  197,253,91,255                      // vcvtps2dq     %ymm7,%ymm7
   .byte  196,195,69,74,226,96                // vblendvps     %ymm6,%ymm10,%ymm7,%ymm4
@@ -10983,26 +10901,26 @@
 .globl _sk_lab_to_xyz_hsw
 FUNCTION(_sk_lab_to_xyz_hsw)
 _sk_lab_to_xyz_hsw:
-  .byte  196,98,125,24,5,117,246,2,0         // vbroadcastss  0x2f675(%rip),%ymm8        # 3ac40 <_sk_srcover_bgra_8888_sse2_lowp+0x374>
-  .byte  196,98,125,24,13,212,245,2,0        // vbroadcastss  0x2f5d4(%rip),%ymm9        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
-  .byte  196,98,125,24,21,103,246,2,0        // vbroadcastss  0x2f667(%rip),%ymm10        # 3ac44 <_sk_srcover_bgra_8888_sse2_lowp+0x378>
+  .byte  196,98,125,24,5,157,240,2,0         // vbroadcastss  0x2f09d(%rip),%ymm8        # 3a470 <_sk_srcover_bgra_8888_sse2_lowp+0x374>
+  .byte  196,98,125,24,13,252,239,2,0        // vbroadcastss  0x2effc(%rip),%ymm9        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,98,125,24,21,143,240,2,0        // vbroadcastss  0x2f08f(%rip),%ymm10        # 3a474 <_sk_srcover_bgra_8888_sse2_lowp+0x378>
   .byte  196,194,53,168,202                  // vfmadd213ps   %ymm10,%ymm9,%ymm1
   .byte  196,194,53,168,210                  // vfmadd213ps   %ymm10,%ymm9,%ymm2
-  .byte  196,98,125,24,13,88,246,2,0         // vbroadcastss  0x2f658(%rip),%ymm9        # 3ac48 <_sk_srcover_bgra_8888_sse2_lowp+0x37c>
+  .byte  196,98,125,24,13,128,240,2,0        // vbroadcastss  0x2f080(%rip),%ymm9        # 3a478 <_sk_srcover_bgra_8888_sse2_lowp+0x37c>
   .byte  196,66,125,184,200                  // vfmadd231ps   %ymm8,%ymm0,%ymm9
-  .byte  196,226,125,24,5,78,246,2,0         // vbroadcastss  0x2f64e(%rip),%ymm0        # 3ac4c <_sk_srcover_bgra_8888_sse2_lowp+0x380>
+  .byte  196,226,125,24,5,118,240,2,0        // vbroadcastss  0x2f076(%rip),%ymm0        # 3a47c <_sk_srcover_bgra_8888_sse2_lowp+0x380>
   .byte  197,180,89,192                      // vmulps        %ymm0,%ymm9,%ymm0
-  .byte  196,98,125,24,5,69,246,2,0          // vbroadcastss  0x2f645(%rip),%ymm8        # 3ac50 <_sk_srcover_bgra_8888_sse2_lowp+0x384>
+  .byte  196,98,125,24,5,109,240,2,0         // vbroadcastss  0x2f06d(%rip),%ymm8        # 3a480 <_sk_srcover_bgra_8888_sse2_lowp+0x384>
   .byte  196,98,117,168,192                  // vfmadd213ps   %ymm0,%ymm1,%ymm8
-  .byte  196,98,125,24,13,59,246,2,0         // vbroadcastss  0x2f63b(%rip),%ymm9        # 3ac54 <_sk_srcover_bgra_8888_sse2_lowp+0x388>
+  .byte  196,98,125,24,13,99,240,2,0         // vbroadcastss  0x2f063(%rip),%ymm9        # 3a484 <_sk_srcover_bgra_8888_sse2_lowp+0x388>
   .byte  196,98,109,172,200                  // vfnmadd213ps  %ymm0,%ymm2,%ymm9
   .byte  196,193,60,89,200                   // vmulps        %ymm8,%ymm8,%ymm1
   .byte  197,188,89,201                      // vmulps        %ymm1,%ymm8,%ymm1
-  .byte  196,226,125,24,21,40,246,2,0        // vbroadcastss  0x2f628(%rip),%ymm2        # 3ac58 <_sk_srcover_bgra_8888_sse2_lowp+0x38c>
+  .byte  196,226,125,24,21,80,240,2,0        // vbroadcastss  0x2f050(%rip),%ymm2        # 3a488 <_sk_srcover_bgra_8888_sse2_lowp+0x38c>
   .byte  197,108,194,209,1                   // vcmpltps      %ymm1,%ymm2,%ymm10
-  .byte  196,98,125,24,29,30,246,2,0         // vbroadcastss  0x2f61e(%rip),%ymm11        # 3ac5c <_sk_srcover_bgra_8888_sse2_lowp+0x390>
+  .byte  196,98,125,24,29,70,240,2,0         // vbroadcastss  0x2f046(%rip),%ymm11        # 3a48c <_sk_srcover_bgra_8888_sse2_lowp+0x390>
   .byte  196,65,60,88,195                    // vaddps        %ymm11,%ymm8,%ymm8
-  .byte  196,98,125,24,37,20,246,2,0         // vbroadcastss  0x2f614(%rip),%ymm12        # 3ac60 <_sk_srcover_bgra_8888_sse2_lowp+0x394>
+  .byte  196,98,125,24,37,60,240,2,0         // vbroadcastss  0x2f03c(%rip),%ymm12        # 3a490 <_sk_srcover_bgra_8888_sse2_lowp+0x394>
   .byte  196,65,60,89,196                    // vmulps        %ymm12,%ymm8,%ymm8
   .byte  196,99,61,74,193,160                // vblendvps     %ymm10,%ymm1,%ymm8,%ymm8
   .byte  197,252,89,200                      // vmulps        %ymm0,%ymm0,%ymm1
@@ -11017,9 +10935,9 @@
   .byte  196,65,52,88,203                    // vaddps        %ymm11,%ymm9,%ymm9
   .byte  196,65,52,89,204                    // vmulps        %ymm12,%ymm9,%ymm9
   .byte  196,227,53,74,208,32                // vblendvps     %ymm2,%ymm0,%ymm9,%ymm2
-  .byte  196,226,125,24,5,201,245,2,0        // vbroadcastss  0x2f5c9(%rip),%ymm0        # 3ac64 <_sk_srcover_bgra_8888_sse2_lowp+0x398>
+  .byte  196,226,125,24,5,241,239,2,0        // vbroadcastss  0x2eff1(%rip),%ymm0        # 3a494 <_sk_srcover_bgra_8888_sse2_lowp+0x398>
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
-  .byte  196,98,125,24,5,192,245,2,0         // vbroadcastss  0x2f5c0(%rip),%ymm8        # 3ac68 <_sk_srcover_bgra_8888_sse2_lowp+0x39c>
+  .byte  196,98,125,24,5,232,239,2,0         // vbroadcastss  0x2efe8(%rip),%ymm8        # 3a498 <_sk_srcover_bgra_8888_sse2_lowp+0x39c>
   .byte  196,193,108,89,208                  // vmulps        %ymm8,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -11029,66 +10947,64 @@
 FUNCTION(_sk_load_a8_hsw)
 _sk_load_a8_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,52                              // jne           b6fd <_sk_load_a8_hsw+0x4c>
-  .byte  196,130,121,48,4,24                 // vpmovzxbw     (%r8,%r11,1),%xmm0
-  .byte  197,249,219,5,57,254,2,0            // vpand         0x2fe39(%rip),%xmm0,%xmm0        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  117,52                              // jne           b4ff <_sk_load_a8_hsw+0x46>
+  .byte  196,194,121,48,4,16                 // vpmovzxbw     (%r8,%rdx,1),%xmm0
+  .byte  197,249,219,5,119,248,2,0           // vpand         0x2f877(%rip),%xmm0,%xmm0        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  196,226,125,51,192                  // vpmovzxwd     %xmm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,11,245,2,0        // vbroadcastss  0x2f50b(%rip),%ymm1        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,226,125,24,13,57,239,2,0        // vbroadcastss  0x2ef39(%rip),%ymm1        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  197,252,89,217                      // vmulps        %ymm1,%ymm0,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  197,236,87,210                      // vxorps        %ymm2,%ymm2,%ymm2
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,190                             // ja            b6cf <_sk_load_a8_hsw+0x1e>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,120,0,0,0                 // lea           0x78(%rip),%r10        # b794 <_sk_load_a8_hsw+0xe3>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,196                             // ja            b4d1 <_sk_load_a8_hsw+0x18>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,117,0,0,0                 // lea           0x75(%rip),%r9        # b58c <_sk_load_a8_hsw+0xd3>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  235,159                             // jmp           b6cf <_sk_load_a8_hsw+0x1e>
-  .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
+  .byte  235,166                             // jmp           b4d1 <_sk_load_a8_hsw+0x18>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,249,196,192,2                   // vpinsrw       $0x2,%eax,%xmm0,%xmm0
-  .byte  67,15,183,4,24                      // movzwl        (%r8,%r11,1),%eax
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  197,249,110,200                     // vmovd         %eax,%xmm1
   .byte  196,226,121,48,201                  // vpmovzxbw     %xmm1,%xmm1
   .byte  196,227,121,2,193,1                 // vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  .byte  233,119,255,255,255                 // jmpq          b6cf <_sk_load_a8_hsw+0x1e>
-  .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
+  .byte  235,129                             // jmp           b4d1 <_sk_load_a8_hsw+0x18>
+  .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,249,196,192,6                   // vpinsrw       $0x6,%eax,%xmm0,%xmm0
-  .byte  67,15,182,68,24,5                   // movzbl        0x5(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,5                   // movzbl        0x5(%r8,%rdx,1),%eax
   .byte  197,249,196,192,5                   // vpinsrw       $0x5,%eax,%xmm0,%xmm0
-  .byte  67,15,182,68,24,4                   // movzbl        0x4(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,4                   // movzbl        0x4(%r8,%rdx,1),%eax
   .byte  197,249,196,192,4                   // vpinsrw       $0x4,%eax,%xmm0,%xmm0
-  .byte  196,129,121,110,12,24               // vmovd         (%r8,%r11,1),%xmm1
+  .byte  196,193,121,110,12,16               // vmovd         (%r8,%rdx,1),%xmm1
   .byte  196,226,121,48,201                  // vpmovzxbw     %xmm1,%xmm1
   .byte  196,227,113,2,192,12                // vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  .byte  233,60,255,255,255                  // jmpq          b6cf <_sk_load_a8_hsw+0x1e>
+  .byte  233,70,255,255,255                  // jmpq          b4d1 <_sk_load_a8_hsw+0x18>
   .byte  144                                 // nop
-  .byte  145                                 // xchg          %eax,%ecx
+  .byte  148                                 // xchg          %eax,%esp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,171,255,255,255,156             // ljmp          *-0x63000001(%rbx)
+  .byte  255,174,255,255,255,159             // ljmp          *-0x60000001(%rsi)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  233,255,255,255,222                 // jmpq          ffffffffdf00b7a4 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffdefd0ed8>
+  .byte  233,255,255,255,222                 // jmpq          ffffffffdf00b59c <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffdefd14a0>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,211                             // callq         *%rbx
@@ -11104,66 +11020,64 @@
 FUNCTION(_sk_load_a8_dst_hsw)
 _sk_load_a8_dst_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,52                              // jne           b7fc <_sk_load_a8_dst_hsw+0x4c>
-  .byte  196,130,121,48,36,24                // vpmovzxbw     (%r8,%r11,1),%xmm4
-  .byte  197,217,219,37,58,253,2,0           // vpand         0x2fd3a(%rip),%xmm4,%xmm4        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  117,52                              // jne           b5ee <_sk_load_a8_dst_hsw+0x46>
+  .byte  196,194,121,48,36,16                // vpmovzxbw     (%r8,%rdx,1),%xmm4
+  .byte  197,217,219,37,136,247,2,0          // vpand         0x2f788(%rip),%xmm4,%xmm4        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  196,226,125,51,228                  // vpmovzxwd     %xmm4,%ymm4
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,226,125,24,45,12,244,2,0        // vbroadcastss  0x2f40c(%rip),%ymm5        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,226,125,24,45,74,238,2,0        // vbroadcastss  0x2ee4a(%rip),%ymm5        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  197,220,89,253                      // vmulps        %ymm5,%ymm4,%ymm7
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,220,87,228                      // vxorps        %ymm4,%ymm4,%ymm4
   .byte  197,212,87,237                      // vxorps        %ymm5,%ymm5,%ymm5
   .byte  197,204,87,246                      // vxorps        %ymm6,%ymm6,%ymm6
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,190                             // ja            b7ce <_sk_load_a8_dst_hsw+0x1e>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,121,0,0,0                 // lea           0x79(%rip),%r10        # b894 <_sk_load_a8_dst_hsw+0xe4>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,196                             // ja            b5c0 <_sk_load_a8_dst_hsw+0x18>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,118,0,0,0                 // lea           0x76(%rip),%r9        # b67c <_sk_load_a8_dst_hsw+0xd4>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  235,159                             // jmp           b7ce <_sk_load_a8_dst_hsw+0x1e>
-  .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
+  .byte  235,166                             // jmp           b5c0 <_sk_load_a8_dst_hsw+0x18>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  197,217,196,224,2                   // vpinsrw       $0x2,%eax,%xmm4,%xmm4
-  .byte  67,15,183,4,24                      // movzwl        (%r8,%r11,1),%eax
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  197,249,110,232                     // vmovd         %eax,%xmm5
   .byte  196,226,121,48,237                  // vpmovzxbw     %xmm5,%xmm5
   .byte  196,227,89,2,229,1                  // vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  .byte  233,119,255,255,255                 // jmpq          b7ce <_sk_load_a8_dst_hsw+0x1e>
-  .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
+  .byte  235,129                             // jmp           b5c0 <_sk_load_a8_dst_hsw+0x18>
+  .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  197,217,196,224,6                   // vpinsrw       $0x6,%eax,%xmm4,%xmm4
-  .byte  67,15,182,68,24,5                   // movzbl        0x5(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,5                   // movzbl        0x5(%r8,%rdx,1),%eax
   .byte  197,217,196,224,5                   // vpinsrw       $0x5,%eax,%xmm4,%xmm4
-  .byte  67,15,182,68,24,4                   // movzbl        0x4(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,4                   // movzbl        0x4(%r8,%rdx,1),%eax
   .byte  197,217,196,224,4                   // vpinsrw       $0x4,%eax,%xmm4,%xmm4
-  .byte  196,129,121,110,44,24               // vmovd         (%r8,%r11,1),%xmm5
+  .byte  196,193,121,110,44,16               // vmovd         (%r8,%rdx,1),%xmm5
   .byte  196,226,121,48,237                  // vpmovzxbw     %xmm5,%xmm5
   .byte  196,227,81,2,228,12                 // vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  .byte  233,60,255,255,255                  // jmpq          b7ce <_sk_load_a8_dst_hsw+0x1e>
+  .byte  233,70,255,255,255                  // jmpq          b5c0 <_sk_load_a8_dst_hsw+0x18>
   .byte  102,144                             // xchg          %ax,%ax
-  .byte  144                                 // nop
+  .byte  147                                 // xchg          %eax,%ebx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,170,255,255,255,155             // ljmp          *-0x64000001(%rdx)
+  .byte  255,173,255,255,255,158             // ljmp          *-0x61000001(%rbp)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  232,255,255,255,221                 // callq         ffffffffde00b8a4 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddfd0fd8>
+  .byte  232,255,255,255,221                 // callq         ffffffffde00b68c <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddfd1590>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,210                             // callq         *%rdx
@@ -11230,7 +11144,7 @@
   .byte  196,227,121,32,192,7                // vpinsrb       $0x7,%eax,%xmm0,%xmm0
   .byte  196,226,125,49,192                  // vpmovzxbd     %xmm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,83,242,2,0        // vbroadcastss  0x2f253(%rip),%ymm1        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,226,125,24,13,155,236,2,0       // vbroadcastss  0x2ec9b(%rip),%ymm1        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  197,252,89,217                      // vmulps        %ymm1,%ymm0,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
@@ -11247,65 +11161,64 @@
 FUNCTION(_sk_store_a8_hsw)
 _sk_store_a8_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,60,95,195                       // vmaxps        %ymm3,%ymm8,%ymm8
-  .byte  196,98,125,24,13,155,241,2,0        // vbroadcastss  0x2f19b(%rip),%ymm9        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,13,233,235,2,0        // vbroadcastss  0x2ebe9(%rip),%ymm9        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,60,93,193                    // vminps        %ymm9,%ymm8,%ymm8
-  .byte  196,98,125,24,13,185,241,2,0        // vbroadcastss  0x2f1b9(%rip),%ymm9        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,98,125,24,13,7,236,2,0          // vbroadcastss  0x2ec07(%rip),%ymm9        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
   .byte  196,65,125,91,192                   // vcvtps2dq     %ymm8,%ymm8
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
   .byte  196,66,57,43,193                    // vpackusdw     %xmm9,%xmm8,%xmm8
   .byte  197,57,103,192                      // vpackuswb     %xmm0,%xmm8,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           ba17 <_sk_store_a8_hsw+0x5b>
-  .byte  196,1,121,214,4,24                  // vmovq         %xmm8,(%r8,%r11,1)
+  .byte  117,10                              // jne           b7f9 <_sk_store_a8_hsw+0x55>
+  .byte  196,65,121,214,4,16                 // vmovq         %xmm8,(%r8,%rdx,1)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,236                             // ja            ba13 <_sk_store_a8_hsw+0x57>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,242                             // ja            b7f5 <_sk_store_a8_hsw+0x51>
   .byte  196,66,121,48,192                   // vpmovzxbw     %xmm8,%xmm8
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,85,0,0,0                  // lea           0x55(%rip),%r10        # ba8c <_sk_store_a8_hsw+0xd0>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,86,0,0,0                  // lea           0x56(%rip),%r9        # b868 <_sk_store_a8_hsw+0xc4>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,3,121,20,4,24,0                 // vpextrb       $0x0,%xmm8,(%r8,%r11,1)
-  .byte  235,202                             // jmp           ba13 <_sk_store_a8_hsw+0x57>
-  .byte  196,3,121,20,68,24,2,4              // vpextrb       $0x4,%xmm8,0x2(%r8,%r11,1)
-  .byte  196,98,57,0,5,198,250,2,0           // vpshufb       0x2fac6(%rip),%xmm8,%xmm8        # 3b520 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
-  .byte  196,3,121,21,4,24,0                 // vpextrw       $0x0,%xmm8,(%r8,%r11,1)
-  .byte  235,176                             // jmp           ba13 <_sk_store_a8_hsw+0x57>
-  .byte  196,3,121,20,68,24,6,12             // vpextrb       $0xc,%xmm8,0x6(%r8,%r11,1)
-  .byte  196,3,121,20,68,24,5,10             // vpextrb       $0xa,%xmm8,0x5(%r8,%r11,1)
-  .byte  196,3,121,20,68,24,4,8              // vpextrb       $0x8,%xmm8,0x4(%r8,%r11,1)
-  .byte  196,98,57,0,5,172,250,2,0           // vpshufb       0x2faac(%rip),%xmm8,%xmm8        # 3b530 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
-  .byte  196,1,121,126,4,24                  // vmovd         %xmm8,(%r8,%r11,1)
-  .byte  235,135                             // jmp           ba13 <_sk_store_a8_hsw+0x57>
-  .byte  180,255                             // mov           $0xff,%ah
+  .byte  196,67,121,20,4,16,0                // vpextrb       $0x0,%xmm8,(%r8,%rdx,1)
+  .byte  235,209                             // jmp           b7f5 <_sk_store_a8_hsw+0x51>
+  .byte  196,67,121,20,68,16,2,4             // vpextrb       $0x4,%xmm8,0x2(%r8,%rdx,1)
+  .byte  196,98,57,0,5,43,245,2,0            // vpshufb       0x2f52b(%rip),%xmm8,%xmm8        # 3ad60 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  .byte  196,67,121,21,4,16,0                // vpextrw       $0x0,%xmm8,(%r8,%rdx,1)
+  .byte  235,183                             // jmp           b7f5 <_sk_store_a8_hsw+0x51>
+  .byte  196,67,121,20,68,16,6,12            // vpextrb       $0xc,%xmm8,0x6(%r8,%rdx,1)
+  .byte  196,67,121,20,68,16,5,10            // vpextrb       $0xa,%xmm8,0x5(%r8,%rdx,1)
+  .byte  196,67,121,20,68,16,4,8             // vpextrb       $0x8,%xmm8,0x4(%r8,%rdx,1)
+  .byte  196,98,57,0,5,17,245,2,0            // vpshufb       0x2f511(%rip),%xmm8,%xmm8        # 3ad70 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  .byte  196,65,121,126,4,16                 // vmovd         %xmm8,(%r8,%rdx,1)
+  .byte  235,142                             // jmp           b7f5 <_sk_store_a8_hsw+0x51>
+  .byte  144                                 // nop
+  .byte  179,255                             // mov           $0xff,%bl
   .byte  255                                 // (bad)
-  .byte  255,197                             // inc           %ebp
+  .byte  255,196                             // inc           %esp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  189,255,255,255,239                 // mov           $0xefffffff,%ebp
+  .byte  188,255,255,255,238                 // mov           $0xeeffffff,%esp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,231                             // jmpq          *%rdi
+  .byte  255,230                             // jmpq          *%rsi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  223,255                             // (bad)
+  .byte  222,255                             // fdivrp        %st,%st(7)
   .byte  255                                 // (bad)
-  .byte  255,215                             // callq         *%rdi
+  .byte  255,214                             // callq         *%rsi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -11315,72 +11228,70 @@
 FUNCTION(_sk_load_g8_hsw)
 _sk_load_g8_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,57                              // jne           baf9 <_sk_load_g8_hsw+0x51>
-  .byte  196,130,121,48,4,24                 // vpmovzxbw     (%r8,%r11,1),%xmm0
-  .byte  197,249,219,5,66,250,2,0            // vpand         0x2fa42(%rip),%xmm0,%xmm0        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  117,57                              // jne           b8cf <_sk_load_g8_hsw+0x4b>
+  .byte  196,194,121,48,4,16                 // vpmovzxbw     (%r8,%rdx,1),%xmm0
+  .byte  197,249,219,5,172,244,2,0           // vpand         0x2f4ac(%rip),%xmm0,%xmm0        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  196,226,125,51,192                  // vpmovzxwd     %xmm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,20,241,2,0        // vbroadcastss  0x2f114(%rip),%ymm1        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,226,125,24,13,110,235,2,0       // vbroadcastss  0x2eb6e(%rip),%ymm1        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,141,240,2,0       // vbroadcastss  0x2f08d(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,231,234,2,0       // vbroadcastss  0x2eae7(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,252,40,200                      // vmovaps       %ymm0,%ymm1
   .byte  197,252,40,208                      // vmovaps       %ymm0,%ymm2
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,185                             // ja            bac6 <_sk_load_g8_hsw+0x1e>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,120,0,0,0                 // lea           0x78(%rip),%r10        # bb90 <_sk_load_g8_hsw+0xe8>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,191                             // ja            b89c <_sk_load_g8_hsw+0x18>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,121,0,0,0                 // lea           0x79(%rip),%r9        # b960 <_sk_load_g8_hsw+0xdc>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  235,154                             // jmp           bac6 <_sk_load_g8_hsw+0x1e>
-  .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
+  .byte  235,161                             // jmp           b89c <_sk_load_g8_hsw+0x18>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,249,196,192,2                   // vpinsrw       $0x2,%eax,%xmm0,%xmm0
-  .byte  67,15,183,4,24                      // movzwl        (%r8,%r11,1),%eax
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  197,249,110,200                     // vmovd         %eax,%xmm1
   .byte  196,226,121,48,201                  // vpmovzxbw     %xmm1,%xmm1
   .byte  196,227,121,2,193,1                 // vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  .byte  233,114,255,255,255                 // jmpq          bac6 <_sk_load_g8_hsw+0x1e>
-  .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
+  .byte  233,121,255,255,255                 // jmpq          b89c <_sk_load_g8_hsw+0x18>
+  .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,249,196,192,6                   // vpinsrw       $0x6,%eax,%xmm0,%xmm0
-  .byte  67,15,182,68,24,5                   // movzbl        0x5(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,5                   // movzbl        0x5(%r8,%rdx,1),%eax
   .byte  197,249,196,192,5                   // vpinsrw       $0x5,%eax,%xmm0,%xmm0
-  .byte  67,15,182,68,24,4                   // movzbl        0x4(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,4                   // movzbl        0x4(%r8,%rdx,1),%eax
   .byte  197,249,196,192,4                   // vpinsrw       $0x4,%eax,%xmm0,%xmm0
-  .byte  196,129,121,110,12,24               // vmovd         (%r8,%r11,1),%xmm1
+  .byte  196,193,121,110,12,16               // vmovd         (%r8,%rdx,1),%xmm1
   .byte  196,226,121,48,201                  // vpmovzxbw     %xmm1,%xmm1
   .byte  196,227,113,2,192,12                // vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  .byte  233,55,255,255,255                  // jmpq          bac6 <_sk_load_g8_hsw+0x1e>
+  .byte  233,62,255,255,255                  // jmpq          b89c <_sk_load_g8_hsw+0x18>
+  .byte  102,144                             // xchg          %ax,%ax
   .byte  144                                 // nop
-  .byte  145                                 // xchg          %eax,%ecx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,171,255,255,255,156             // ljmp          *-0x63000001(%rbx)
+  .byte  255,170,255,255,255,155             // ljmp          *-0x64000001(%rdx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  233,255,255,255,222                 // jmpq          ffffffffdf00bba0 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffdefd12d4>
+  .byte  232,255,255,255,221                 // callq         ffffffffde00b970 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddfd1874>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,211                             // callq         *%rbx
+  .byte  255,210                             // callq         *%rdx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,196                             // inc           %esp
+  .byte  255,195                             // inc           %ebx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -11390,72 +11301,70 @@
 FUNCTION(_sk_load_g8_dst_hsw)
 _sk_load_g8_dst_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,57                              // jne           bbfd <_sk_load_g8_dst_hsw+0x51>
-  .byte  196,130,121,48,36,24                // vpmovzxbw     (%r8,%r11,1),%xmm4
-  .byte  197,217,219,37,62,249,2,0           // vpand         0x2f93e(%rip),%xmm4,%xmm4        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  117,57                              // jne           b9c7 <_sk_load_g8_dst_hsw+0x4b>
+  .byte  196,194,121,48,36,16                // vpmovzxbw     (%r8,%rdx,1),%xmm4
+  .byte  197,217,219,37,180,243,2,0          // vpand         0x2f3b4(%rip),%xmm4,%xmm4        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  196,226,125,51,228                  // vpmovzxwd     %xmm4,%ymm4
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,226,125,24,45,16,240,2,0        // vbroadcastss  0x2f010(%rip),%ymm5        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,226,125,24,45,118,234,2,0       // vbroadcastss  0x2ea76(%rip),%ymm5        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  197,220,89,229                      // vmulps        %ymm5,%ymm4,%ymm4
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,61,137,239,2,0       // vbroadcastss  0x2ef89(%rip),%ymm7        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,61,239,233,2,0       // vbroadcastss  0x2e9ef(%rip),%ymm7        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,252,40,236                      // vmovaps       %ymm4,%ymm5
   .byte  197,252,40,244                      // vmovaps       %ymm4,%ymm6
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,185                             // ja            bbca <_sk_load_g8_dst_hsw+0x1e>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,120,0,0,0                 // lea           0x78(%rip),%r10        # bc94 <_sk_load_g8_dst_hsw+0xe8>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,191                             // ja            b994 <_sk_load_g8_dst_hsw+0x18>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,121,0,0,0                 // lea           0x79(%rip),%r9        # ba58 <_sk_load_g8_dst_hsw+0xdc>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  235,154                             // jmp           bbca <_sk_load_g8_dst_hsw+0x1e>
-  .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
+  .byte  235,161                             // jmp           b994 <_sk_load_g8_dst_hsw+0x18>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  197,217,196,224,2                   // vpinsrw       $0x2,%eax,%xmm4,%xmm4
-  .byte  67,15,183,4,24                      // movzwl        (%r8,%r11,1),%eax
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  197,249,110,232                     // vmovd         %eax,%xmm5
   .byte  196,226,121,48,237                  // vpmovzxbw     %xmm5,%xmm5
   .byte  196,227,89,2,229,1                  // vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  .byte  233,114,255,255,255                 // jmpq          bbca <_sk_load_g8_dst_hsw+0x1e>
-  .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
+  .byte  233,121,255,255,255                 // jmpq          b994 <_sk_load_g8_dst_hsw+0x18>
+  .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  197,217,196,224,6                   // vpinsrw       $0x6,%eax,%xmm4,%xmm4
-  .byte  67,15,182,68,24,5                   // movzbl        0x5(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,5                   // movzbl        0x5(%r8,%rdx,1),%eax
   .byte  197,217,196,224,5                   // vpinsrw       $0x5,%eax,%xmm4,%xmm4
-  .byte  67,15,182,68,24,4                   // movzbl        0x4(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,4                   // movzbl        0x4(%r8,%rdx,1),%eax
   .byte  197,217,196,224,4                   // vpinsrw       $0x4,%eax,%xmm4,%xmm4
-  .byte  196,129,121,110,44,24               // vmovd         (%r8,%r11,1),%xmm5
+  .byte  196,193,121,110,44,16               // vmovd         (%r8,%rdx,1),%xmm5
   .byte  196,226,121,48,237                  // vpmovzxbw     %xmm5,%xmm5
   .byte  196,227,81,2,228,12                 // vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  .byte  233,55,255,255,255                  // jmpq          bbca <_sk_load_g8_dst_hsw+0x1e>
+  .byte  233,62,255,255,255                  // jmpq          b994 <_sk_load_g8_dst_hsw+0x18>
+  .byte  102,144                             // xchg          %ax,%ax
   .byte  144                                 // nop
-  .byte  145                                 // xchg          %eax,%ecx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,171,255,255,255,156             // ljmp          *-0x63000001(%rbx)
+  .byte  255,170,255,255,255,155             // ljmp          *-0x64000001(%rdx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  233,255,255,255,222                 // jmpq          ffffffffdf00bca4 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffdefd13d8>
+  .byte  232,255,255,255,221                 // callq         ffffffffde00ba68 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddfd196c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,211                             // callq         *%rbx
+  .byte  255,210                             // callq         *%rdx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,196                             // inc           %esp
+  .byte  255,195                             // inc           %ebx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -11516,10 +11425,10 @@
   .byte  196,227,121,32,192,7                // vpinsrb       $0x7,%eax,%xmm0,%xmm0
   .byte  196,226,125,49,192                  // vpmovzxbd     %xmm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,83,238,2,0        // vbroadcastss  0x2ee53(%rip),%ymm1        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,226,125,24,13,191,232,2,0       // vbroadcastss  0x2e8bf(%rip),%ymm1        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,204,237,2,0       // vbroadcastss  0x2edcc(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,56,232,2,0        // vbroadcastss  0x2e838(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,252,40,200                      // vmovaps       %ymm0,%ymm1
   .byte  197,252,40,208                      // vmovaps       %ymm0,%ymm2
   .byte  91                                  // pop           %rbx
@@ -11533,139 +11442,58 @@
 FUNCTION(_sk_load_565_hsw)
 _sk_load_565_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,114                             // jne           be4e <_sk_load_565_hsw+0x8d>
-  .byte  196,129,122,111,4,88                // vmovdqu       (%r8,%r11,2),%xmm0
+  .byte  117,114                             // jne           bc0c <_sk_load_565_hsw+0x87>
+  .byte  196,193,122,111,4,80                // vmovdqu       (%r8,%rdx,2),%xmm0
   .byte  196,226,125,51,208                  // vpmovzxwd     %xmm0,%ymm2
-  .byte  196,226,125,88,5,8,238,2,0          // vpbroadcastd  0x2ee08(%rip),%ymm0        # 3abf8 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  .byte  196,226,125,88,5,122,232,2,0        // vpbroadcastd  0x2e87a(%rip),%ymm0        # 3a428 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
   .byte  197,237,219,192                     // vpand         %ymm0,%ymm2,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,251,237,2,0       // vbroadcastss  0x2edfb(%rip),%ymm1        # 3abfc <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  .byte  196,226,125,24,13,109,232,2,0       // vbroadcastss  0x2e86d(%rip),%ymm1        # 3a42c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
-  .byte  196,226,125,88,13,242,237,2,0       // vpbroadcastd  0x2edf2(%rip),%ymm1        # 3ac00 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  .byte  196,226,125,88,13,100,232,2,0       // vpbroadcastd  0x2e864(%rip),%ymm1        # 3a430 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
   .byte  197,237,219,201                     // vpand         %ymm1,%ymm2,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  196,226,125,24,29,229,237,2,0       // vbroadcastss  0x2ede5(%rip),%ymm3        # 3ac04 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  .byte  196,226,125,24,29,87,232,2,0        // vbroadcastss  0x2e857(%rip),%ymm3        # 3a434 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
   .byte  197,244,89,203                      // vmulps        %ymm3,%ymm1,%ymm1
-  .byte  196,226,125,88,29,220,237,2,0       // vpbroadcastd  0x2eddc(%rip),%ymm3        # 3ac08 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  .byte  196,226,125,88,29,78,232,2,0        // vpbroadcastd  0x2e84e(%rip),%ymm3        # 3a438 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
   .byte  197,237,219,211                     // vpand         %ymm3,%ymm2,%ymm2
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
-  .byte  196,226,125,24,29,207,237,2,0       // vbroadcastss  0x2edcf(%rip),%ymm3        # 3ac0c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  .byte  196,226,125,24,29,65,232,2,0        // vbroadcastss  0x2e841(%rip),%ymm3        # 3a43c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
   .byte  197,236,89,211                      // vmulps        %ymm3,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,48,237,2,0        // vbroadcastss  0x2ed30(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,162,231,2,0       // vbroadcastss  0x2e7a2(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,128                             // ja            bde2 <_sk_load_565_hsw+0x21>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,99,0,0,0                  // lea           0x63(%rip),%r10        # bed0 <_sk_load_565_hsw+0x10f>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,134                             // ja            bba0 <_sk_load_565_hsw+0x1b>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,100,0,0,0                 // lea           0x64(%rip),%r9        # bc88 <_sk_load_565_hsw+0x103>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  233,94,255,255,255                  // jmpq          bde2 <_sk_load_565_hsw+0x21>
+  .byte  233,101,255,255,255                 // jmpq          bba0 <_sk_load_565_hsw+0x1b>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,4,2           // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,129,121,110,12,88               // vmovd         (%r8,%r11,2),%xmm1
+  .byte  196,193,121,196,68,80,4,2           // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,193,121,110,12,80               // vmovd         (%r8,%rdx,2),%xmm1
   .byte  196,227,121,2,193,1                 // vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  .byte  233,65,255,255,255                  // jmpq          bde2 <_sk_load_565_hsw+0x21>
+  .byte  233,72,255,255,255                  // jmpq          bba0 <_sk_load_565_hsw+0x1b>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,12,6          // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,10,5          // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,8,4           // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,129,122,126,12,88               // vmovq         (%r8,%r11,2),%xmm1
+  .byte  196,193,121,196,68,80,12,6          // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,193,121,196,68,80,10,5          // vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,193,121,196,68,80,8,4           // vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,193,122,126,12,80               // vmovq         (%r8,%rdx,2),%xmm1
   .byte  196,227,113,2,192,12                // vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  .byte  233,20,255,255,255                  // jmpq          bde2 <_sk_load_565_hsw+0x21>
-  .byte  102,144                             // xchg          %ax,%ax
-  .byte  166                                 // cmpsb         %es:(%rdi),%ds:(%rsi)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,192                             // inc           %eax
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,180,255,255,255,237,255         // pushq         -0x120001(%rdi,%rdi,8)
-  .byte  255                                 // (bad)
-  .byte  255,229                             // jmpq          *%rbp
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  221,255                             // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,209                             // callq         *%rcx
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // .byte         0xff
-
-HIDDEN _sk_load_565_dst_hsw
-.globl _sk_load_565_dst_hsw
-FUNCTION(_sk_load_565_dst_hsw)
-_sk_load_565_dst_hsw:
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
-  .byte  77,1,192                            // add           %r8,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
-  .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,114                             // jne           bf79 <_sk_load_565_dst_hsw+0x8d>
-  .byte  196,129,122,111,36,88               // vmovdqu       (%r8,%r11,2),%xmm4
-  .byte  196,226,125,51,244                  // vpmovzxwd     %xmm4,%ymm6
-  .byte  196,226,125,88,37,221,236,2,0       // vpbroadcastd  0x2ecdd(%rip),%ymm4        # 3abf8 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
-  .byte  197,205,219,228                     // vpand         %ymm4,%ymm6,%ymm4
-  .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,226,125,24,45,208,236,2,0       // vbroadcastss  0x2ecd0(%rip),%ymm5        # 3abfc <_sk_srcover_bgra_8888_sse2_lowp+0x330>
-  .byte  197,220,89,229                      // vmulps        %ymm5,%ymm4,%ymm4
-  .byte  196,226,125,88,45,199,236,2,0       // vpbroadcastd  0x2ecc7(%rip),%ymm5        # 3ac00 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
-  .byte  197,205,219,237                     // vpand         %ymm5,%ymm6,%ymm5
-  .byte  197,252,91,237                      // vcvtdq2ps     %ymm5,%ymm5
-  .byte  196,226,125,24,61,186,236,2,0       // vbroadcastss  0x2ecba(%rip),%ymm7        # 3ac04 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
-  .byte  197,212,89,239                      // vmulps        %ymm7,%ymm5,%ymm5
-  .byte  196,226,125,88,61,177,236,2,0       // vpbroadcastd  0x2ecb1(%rip),%ymm7        # 3ac08 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
-  .byte  197,205,219,247                     // vpand         %ymm7,%ymm6,%ymm6
-  .byte  197,252,91,246                      // vcvtdq2ps     %ymm6,%ymm6
-  .byte  196,226,125,24,61,164,236,2,0       // vbroadcastss  0x2eca4(%rip),%ymm7        # 3ac0c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
-  .byte  197,204,89,247                      // vmulps        %ymm7,%ymm6,%ymm6
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,61,5,236,2,0         // vbroadcastss  0x2ec05(%rip),%ymm7        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
-  .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,128                             // ja            bf0d <_sk_load_565_dst_hsw+0x21>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,100,0,0,0                 // lea           0x64(%rip),%r10        # bffc <_sk_load_565_dst_hsw+0x110>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
-  .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
-  .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  233,94,255,255,255                  // jmpq          bf0d <_sk_load_565_dst_hsw+0x21>
-  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,4,2           // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,129,121,110,44,88               // vmovd         (%r8,%r11,2),%xmm5
-  .byte  196,227,89,2,229,1                  // vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  .byte  233,65,255,255,255                  // jmpq          bf0d <_sk_load_565_dst_hsw+0x21>
-  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,12,6          // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,10,5          // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,8,4           // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,129,122,126,44,88               // vmovq         (%r8,%r11,2),%xmm5
-  .byte  196,227,81,2,228,12                 // vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  .byte  233,20,255,255,255                  // jmpq          bf0d <_sk_load_565_dst_hsw+0x21>
+  .byte  233,27,255,255,255                  // jmpq          bba0 <_sk_load_565_hsw+0x1b>
   .byte  15,31,0                             // nopl          (%rax)
   .byte  165                                 // movsl         %ds:(%rsi),%es:(%rdi)
   .byte  255                                 // (bad)
@@ -11689,6 +11517,82 @@
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
+HIDDEN _sk_load_565_dst_hsw
+.globl _sk_load_565_dst_hsw
+FUNCTION(_sk_load_565_dst_hsw)
+_sk_load_565_dst_hsw:
+  .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
+  .byte  77,1,192                            // add           %r8,%r8
+  .byte  76,3,0                              // add           (%rax),%r8
+  .byte  72,133,255                          // test          %rdi,%rdi
+  .byte  117,114                             // jne           bd2b <_sk_load_565_dst_hsw+0x87>
+  .byte  196,193,122,111,36,80               // vmovdqu       (%r8,%rdx,2),%xmm4
+  .byte  196,226,125,51,244                  // vpmovzxwd     %xmm4,%ymm6
+  .byte  196,226,125,88,37,91,231,2,0        // vpbroadcastd  0x2e75b(%rip),%ymm4        # 3a428 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  .byte  197,205,219,228                     // vpand         %ymm4,%ymm6,%ymm4
+  .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
+  .byte  196,226,125,24,45,78,231,2,0        // vbroadcastss  0x2e74e(%rip),%ymm5        # 3a42c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  .byte  197,220,89,229                      // vmulps        %ymm5,%ymm4,%ymm4
+  .byte  196,226,125,88,45,69,231,2,0        // vpbroadcastd  0x2e745(%rip),%ymm5        # 3a430 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  .byte  197,205,219,237                     // vpand         %ymm5,%ymm6,%ymm5
+  .byte  197,252,91,237                      // vcvtdq2ps     %ymm5,%ymm5
+  .byte  196,226,125,24,61,56,231,2,0        // vbroadcastss  0x2e738(%rip),%ymm7        # 3a434 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  .byte  197,212,89,239                      // vmulps        %ymm7,%ymm5,%ymm5
+  .byte  196,226,125,88,61,47,231,2,0        // vpbroadcastd  0x2e72f(%rip),%ymm7        # 3a438 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  .byte  197,205,219,247                     // vpand         %ymm7,%ymm6,%ymm6
+  .byte  197,252,91,246                      // vcvtdq2ps     %ymm6,%ymm6
+  .byte  196,226,125,24,61,34,231,2,0        // vbroadcastss  0x2e722(%rip),%ymm7        # 3a43c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  .byte  197,204,89,247                      // vmulps        %ymm7,%ymm6,%ymm6
+  .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  196,226,125,24,61,131,230,2,0       // vbroadcastss  0x2e683(%rip),%ymm7        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  255,224                             // jmpq          *%rax
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,134                             // ja            bcbf <_sk_load_565_dst_hsw+0x1b>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,97,0,0,0                  // lea           0x61(%rip),%r9        # bda4 <_sk_load_565_dst_hsw+0x100>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
+  .byte  255,224                             // jmpq          *%rax
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
+  .byte  197,249,110,224                     // vmovd         %eax,%xmm4
+  .byte  233,101,255,255,255                 // jmpq          bcbf <_sk_load_565_dst_hsw+0x1b>
+  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
+  .byte  196,193,89,196,100,80,4,2           // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,193,121,110,44,80               // vmovd         (%r8,%rdx,2),%xmm5
+  .byte  196,227,89,2,229,1                  // vpblendd      $0x1,%xmm5,%xmm4,%xmm4
+  .byte  233,72,255,255,255                  // jmpq          bcbf <_sk_load_565_dst_hsw+0x1b>
+  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
+  .byte  196,193,89,196,100,80,12,6          // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,193,89,196,100,80,10,5          // vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,193,89,196,100,80,8,4           // vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,193,122,126,44,80               // vmovq         (%r8,%rdx,2),%xmm5
+  .byte  196,227,81,2,228,12                 // vpblendd      $0xc,%xmm4,%xmm5,%xmm4
+  .byte  233,27,255,255,255                  // jmpq          bcbf <_sk_load_565_dst_hsw+0x1b>
+  .byte  168,255                             // test          $0xff,%al
+  .byte  255                                 // (bad)
+  .byte  255,194                             // inc           %edx
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,182,255,255,255,239             // pushq         -0x10000001(%rsi)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,231                             // jmpq          *%rdi
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  223,255                             // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,211                             // callq         *%rbx
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255                                 // .byte         0xff
+
 HIDDEN _sk_gather_565_hsw
 .globl _sk_gather_565_hsw
 FUNCTION(_sk_gather_565_hsw)
@@ -11744,23 +11648,23 @@
   .byte  65,15,183,4,88                      // movzwl        (%r8,%rbx,2),%eax
   .byte  197,249,196,192,7                   // vpinsrw       $0x7,%eax,%xmm0,%xmm0
   .byte  196,226,125,51,208                  // vpmovzxwd     %xmm0,%ymm2
-  .byte  196,226,125,88,5,248,234,2,0        // vpbroadcastd  0x2eaf8(%rip),%ymm0        # 3abf8 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  .byte  196,226,125,88,5,128,229,2,0        // vpbroadcastd  0x2e580(%rip),%ymm0        # 3a428 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
   .byte  197,237,219,192                     // vpand         %ymm0,%ymm2,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,235,234,2,0       // vbroadcastss  0x2eaeb(%rip),%ymm1        # 3abfc <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  .byte  196,226,125,24,13,115,229,2,0       // vbroadcastss  0x2e573(%rip),%ymm1        # 3a42c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
-  .byte  196,226,125,88,13,226,234,2,0       // vpbroadcastd  0x2eae2(%rip),%ymm1        # 3ac00 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  .byte  196,226,125,88,13,106,229,2,0       // vpbroadcastd  0x2e56a(%rip),%ymm1        # 3a430 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
   .byte  197,237,219,201                     // vpand         %ymm1,%ymm2,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  196,226,125,24,29,213,234,2,0       // vbroadcastss  0x2ead5(%rip),%ymm3        # 3ac04 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  .byte  196,226,125,24,29,93,229,2,0        // vbroadcastss  0x2e55d(%rip),%ymm3        # 3a434 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
   .byte  197,244,89,203                      // vmulps        %ymm3,%ymm1,%ymm1
-  .byte  196,226,125,88,29,204,234,2,0       // vpbroadcastd  0x2eacc(%rip),%ymm3        # 3ac08 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  .byte  196,226,125,88,29,84,229,2,0        // vpbroadcastd  0x2e554(%rip),%ymm3        # 3a438 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
   .byte  197,237,219,211                     // vpand         %ymm3,%ymm2,%ymm2
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
-  .byte  196,226,125,24,29,191,234,2,0       // vbroadcastss  0x2eabf(%rip),%ymm3        # 3ac0c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  .byte  196,226,125,24,29,71,229,2,0        // vbroadcastss  0x2e547(%rip),%ymm3        # 3a43c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
   .byte  197,236,89,211                      // vmulps        %ymm3,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,32,234,2,0        // vbroadcastss  0x2ea20(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,168,228,2,0       // vbroadcastss  0x2e4a8(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  91                                  // pop           %rbx
   .byte  65,92                               // pop           %r12
   .byte  65,94                               // pop           %r14
@@ -11772,23 +11676,21 @@
 FUNCTION(_sk_store_565_hsw)
 _sk_store_565_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,60,95,200                       // vmaxps        %ymm0,%ymm8,%ymm9
-  .byte  196,98,125,24,21,239,233,2,0        // vbroadcastss  0x2e9ef(%rip),%ymm10        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,21,125,228,2,0        // vbroadcastss  0x2e47d(%rip),%ymm10        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,52,93,202                    // vminps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,29,209,234,2,0        // vbroadcastss  0x2ead1(%rip),%ymm11        # 3ac6c <_sk_srcover_bgra_8888_sse2_lowp+0x3a0>
+  .byte  196,98,125,24,29,95,229,2,0         // vbroadcastss  0x2e55f(%rip),%ymm11        # 3a49c <_sk_srcover_bgra_8888_sse2_lowp+0x3a0>
   .byte  196,65,52,89,203                    // vmulps        %ymm11,%ymm9,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  196,193,53,114,241,11               // vpslld        $0xb,%ymm9,%ymm9
   .byte  197,60,95,225                       // vmaxps        %ymm1,%ymm8,%ymm12
   .byte  196,65,28,93,226                    // vminps        %ymm10,%ymm12,%ymm12
-  .byte  196,98,125,24,45,179,234,2,0        // vbroadcastss  0x2eab3(%rip),%ymm13        # 3ac70 <_sk_srcover_bgra_8888_sse2_lowp+0x3a4>
+  .byte  196,98,125,24,45,65,229,2,0         // vbroadcastss  0x2e541(%rip),%ymm13        # 3a4a0 <_sk_srcover_bgra_8888_sse2_lowp+0x3a4>
   .byte  196,65,28,89,229                    // vmulps        %ymm13,%ymm12,%ymm12
   .byte  196,65,125,91,228                   // vcvtps2dq     %ymm12,%ymm12
   .byte  196,193,29,114,244,5                // vpslld        $0x5,%ymm12,%ymm12
@@ -11801,52 +11703,49 @@
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,66,57,43,193                    // vpackusdw     %xmm9,%xmm8,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           c204 <_sk_store_565_hsw+0x9f>
-  .byte  196,1,122,127,4,88                  // vmovdqu       %xmm8,(%r8,%r11,2)
+  .byte  117,10                              // jne           bfa6 <_sk_store_565_hsw+0x99>
+  .byte  196,65,122,127,4,80                 // vmovdqu       %xmm8,(%r8,%rdx,2)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,236                             // ja            c200 <_sk_store_565_hsw+0x9b>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,69,0,0,0                  // lea           0x45(%rip),%r10        # c264 <_sk_store_565_hsw+0xff>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,242                             // ja            bfa2 <_sk_store_565_hsw+0x95>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,66,0,0,0                  // lea           0x42(%rip),%r9        # bffc <_sk_store_565_hsw+0xef>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,3,121,21,4,88,0                 // vpextrw       $0x0,%xmm8,(%r8,%r11,2)
-  .byte  235,207                             // jmp           c200 <_sk_store_565_hsw+0x9b>
-  .byte  196,3,121,21,68,88,4,2              // vpextrw       $0x2,%xmm8,0x4(%r8,%r11,2)
-  .byte  196,1,121,126,4,88                  // vmovd         %xmm8,(%r8,%r11,2)
-  .byte  235,191                             // jmp           c200 <_sk_store_565_hsw+0x9b>
-  .byte  196,3,121,21,68,88,12,6             // vpextrw       $0x6,%xmm8,0xc(%r8,%r11,2)
-  .byte  196,3,121,21,68,88,10,5             // vpextrw       $0x5,%xmm8,0xa(%r8,%r11,2)
-  .byte  196,3,121,21,68,88,8,4              // vpextrw       $0x4,%xmm8,0x8(%r8,%r11,2)
-  .byte  196,1,121,214,4,88                  // vmovq         %xmm8,(%r8,%r11,2)
-  .byte  235,159                             // jmp           c200 <_sk_store_565_hsw+0x9b>
-  .byte  15,31,0                             // nopl          (%rax)
-  .byte  196                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,213                             // callq         *%rbp
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,205                             // dec           %ebp
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,245                             // push          %rbp
+  .byte  196,67,121,21,4,80,0                // vpextrw       $0x0,%xmm8,(%r8,%rdx,2)
+  .byte  235,214                             // jmp           bfa2 <_sk_store_565_hsw+0x95>
+  .byte  196,67,121,21,68,80,4,2             // vpextrw       $0x2,%xmm8,0x4(%r8,%rdx,2)
+  .byte  196,65,121,126,4,80                 // vmovd         %xmm8,(%r8,%rdx,2)
+  .byte  235,198                             // jmp           bfa2 <_sk_store_565_hsw+0x95>
+  .byte  196,67,121,21,68,80,12,6            // vpextrw       $0x6,%xmm8,0xc(%r8,%rdx,2)
+  .byte  196,67,121,21,68,80,10,5            // vpextrw       $0x5,%xmm8,0xa(%r8,%rdx,2)
+  .byte  196,67,121,21,68,80,8,4             // vpextrw       $0x4,%xmm8,0x8(%r8,%rdx,2)
+  .byte  196,65,121,214,4,80                 // vmovq         %xmm8,(%r8,%rdx,2)
+  .byte  235,166                             // jmp           bfa2 <_sk_store_565_hsw+0x95>
+  .byte  199                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  237                                 // in            (%dx),%eax
+  .byte  216,255                             // fdivr         %st(7),%st
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,229                             // jmpq          *%rbp
+  .byte  255,208                             // callq         *%rax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  221,255                             // (bad)
+  .byte  248                                 // clc
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,240                             // push          %rax
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  232,255,255,255,224                 // callq         ffffffffe100c014 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffe0fd1f18>
+  .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
@@ -11855,83 +11754,77 @@
 FUNCTION(_sk_load_4444_hsw)
 _sk_load_4444_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,138,0,0,0                    // jne           c329 <_sk_load_4444_hsw+0xa9>
-  .byte  196,129,122,111,4,88                // vmovdqu       (%r8,%r11,2),%xmm0
+  .byte  15,133,138,0,0,0                    // jne           c0bb <_sk_load_4444_hsw+0xa3>
+  .byte  196,193,122,111,4,80                // vmovdqu       (%r8,%rdx,2),%xmm0
   .byte  196,226,125,51,216                  // vpmovzxwd     %xmm0,%ymm3
-  .byte  196,226,125,88,5,193,233,2,0        // vpbroadcastd  0x2e9c1(%rip),%ymm0        # 3ac74 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
+  .byte  196,226,125,88,5,95,228,2,0         // vpbroadcastd  0x2e45f(%rip),%ymm0        # 3a4a4 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
   .byte  197,229,219,192                     // vpand         %ymm0,%ymm3,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,180,233,2,0       // vbroadcastss  0x2e9b4(%rip),%ymm1        # 3ac78 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
+  .byte  196,226,125,24,13,82,228,2,0        // vbroadcastss  0x2e452(%rip),%ymm1        # 3a4a8 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
-  .byte  196,226,125,88,13,171,233,2,0       // vpbroadcastd  0x2e9ab(%rip),%ymm1        # 3ac7c <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
+  .byte  196,226,125,88,13,73,228,2,0        // vpbroadcastd  0x2e449(%rip),%ymm1        # 3a4ac <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
   .byte  197,229,219,201                     // vpand         %ymm1,%ymm3,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  196,226,125,24,21,158,233,2,0       // vbroadcastss  0x2e99e(%rip),%ymm2        # 3ac80 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
+  .byte  196,226,125,24,21,60,228,2,0        // vbroadcastss  0x2e43c(%rip),%ymm2        # 3a4b0 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
   .byte  197,244,89,202                      // vmulps        %ymm2,%ymm1,%ymm1
-  .byte  196,226,125,88,21,149,233,2,0       // vpbroadcastd  0x2e995(%rip),%ymm2        # 3ac84 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
+  .byte  196,226,125,88,21,51,228,2,0        // vpbroadcastd  0x2e433(%rip),%ymm2        # 3a4b4 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
   .byte  197,229,219,210                     // vpand         %ymm2,%ymm3,%ymm2
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
-  .byte  196,98,125,24,5,136,233,2,0         // vbroadcastss  0x2e988(%rip),%ymm8        # 3ac88 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
+  .byte  196,98,125,24,5,38,228,2,0          // vbroadcastss  0x2e426(%rip),%ymm8        # 3a4b8 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
   .byte  196,193,108,89,208                  // vmulps        %ymm8,%ymm2,%ymm2
-  .byte  196,98,125,88,5,126,233,2,0         // vpbroadcastd  0x2e97e(%rip),%ymm8        # 3ac8c <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
+  .byte  196,98,125,88,5,28,228,2,0          // vpbroadcastd  0x2e41c(%rip),%ymm8        # 3a4bc <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
   .byte  196,193,101,219,216                 // vpand         %ymm8,%ymm3,%ymm3
   .byte  197,252,91,219                      // vcvtdq2ps     %ymm3,%ymm3
-  .byte  196,98,125,24,5,112,233,2,0         // vbroadcastss  0x2e970(%rip),%ymm8        # 3ac90 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
+  .byte  196,98,125,24,5,14,228,2,0          // vbroadcastss  0x2e40e(%rip),%ymm8        # 3a4c0 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
   .byte  196,193,100,89,216                  // vmulps        %ymm8,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,100,255,255,255              // ja            c2a5 <_sk_load_4444_hsw+0x25>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,100,0,0,0                 // lea           0x64(%rip),%r10        # c3b0 <_sk_load_4444_hsw+0x130>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  15,135,106,255,255,255              // ja            c037 <_sk_load_4444_hsw+0x1f>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,97,0,0,0                  // lea           0x61(%rip),%r9        # c138 <_sk_load_4444_hsw+0x120>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  233,66,255,255,255                  // jmpq          c2a5 <_sk_load_4444_hsw+0x25>
+  .byte  233,73,255,255,255                  // jmpq          c037 <_sk_load_4444_hsw+0x1f>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,4,2           // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,129,121,110,12,88               // vmovd         (%r8,%r11,2),%xmm1
+  .byte  196,193,121,196,68,80,4,2           // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,193,121,110,12,80               // vmovd         (%r8,%rdx,2),%xmm1
   .byte  196,227,121,2,193,1                 // vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  .byte  233,37,255,255,255                  // jmpq          c2a5 <_sk_load_4444_hsw+0x25>
+  .byte  233,44,255,255,255                  // jmpq          c037 <_sk_load_4444_hsw+0x1f>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,12,6          // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,10,5          // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,8,4           // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,129,122,126,12,88               // vmovq         (%r8,%r11,2),%xmm1
+  .byte  196,193,121,196,68,80,12,6          // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,193,121,196,68,80,10,5          // vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,193,121,196,68,80,8,4           // vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,193,122,126,12,80               // vmovq         (%r8,%rdx,2),%xmm1
   .byte  196,227,113,2,192,12                // vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  .byte  233,248,254,255,255                 // jmpq          c2a5 <_sk_load_4444_hsw+0x25>
-  .byte  15,31,0                             // nopl          (%rax)
-  .byte  165                                 // movsl         %ds:(%rsi),%es:(%rdi)
+  .byte  233,255,254,255,255                 // jmpq          c037 <_sk_load_4444_hsw+0x1f>
+  .byte  168,255                             // test          $0xff,%al
+  .byte  255                                 // (bad)
+  .byte  255,194                             // inc           %edx
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,182,255,255,255,239             // pushq         -0x10000001(%rsi)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,231                             // jmpq          *%rdi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  191,255,255,255,179                 // mov           $0xb3ffffff,%edi
+  .byte  223,255                             // (bad)
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  236                                 // in            (%dx),%al
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,228                             // jmpq          *%rsp
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  220,255                             // fdivr         %st,%st(7)
-  .byte  255                                 // (bad)
-  .byte  255,208                             // callq         *%rax
+  .byte  255,211                             // callq         *%rbx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -11941,83 +11834,77 @@
 FUNCTION(_sk_load_4444_dst_hsw)
 _sk_load_4444_dst_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,138,0,0,0                    // jne           c475 <_sk_load_4444_dst_hsw+0xa9>
-  .byte  196,129,122,111,36,88               // vmovdqu       (%r8,%r11,2),%xmm4
+  .byte  15,133,138,0,0,0                    // jne           c1f7 <_sk_load_4444_dst_hsw+0xa3>
+  .byte  196,193,122,111,36,80               // vmovdqu       (%r8,%rdx,2),%xmm4
   .byte  196,226,125,51,252                  // vpmovzxwd     %xmm4,%ymm7
-  .byte  196,226,125,88,37,117,232,2,0       // vpbroadcastd  0x2e875(%rip),%ymm4        # 3ac74 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
+  .byte  196,226,125,88,37,35,227,2,0        // vpbroadcastd  0x2e323(%rip),%ymm4        # 3a4a4 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
   .byte  197,197,219,228                     // vpand         %ymm4,%ymm7,%ymm4
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,226,125,24,45,104,232,2,0       // vbroadcastss  0x2e868(%rip),%ymm5        # 3ac78 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
+  .byte  196,226,125,24,45,22,227,2,0        // vbroadcastss  0x2e316(%rip),%ymm5        # 3a4a8 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
   .byte  197,220,89,229                      // vmulps        %ymm5,%ymm4,%ymm4
-  .byte  196,226,125,88,45,95,232,2,0        // vpbroadcastd  0x2e85f(%rip),%ymm5        # 3ac7c <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
+  .byte  196,226,125,88,45,13,227,2,0        // vpbroadcastd  0x2e30d(%rip),%ymm5        # 3a4ac <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
   .byte  197,197,219,237                     // vpand         %ymm5,%ymm7,%ymm5
   .byte  197,252,91,237                      // vcvtdq2ps     %ymm5,%ymm5
-  .byte  196,226,125,24,53,82,232,2,0        // vbroadcastss  0x2e852(%rip),%ymm6        # 3ac80 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
+  .byte  196,226,125,24,53,0,227,2,0         // vbroadcastss  0x2e300(%rip),%ymm6        # 3a4b0 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
   .byte  197,212,89,238                      // vmulps        %ymm6,%ymm5,%ymm5
-  .byte  196,226,125,88,53,73,232,2,0        // vpbroadcastd  0x2e849(%rip),%ymm6        # 3ac84 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
+  .byte  196,226,125,88,53,247,226,2,0       // vpbroadcastd  0x2e2f7(%rip),%ymm6        # 3a4b4 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
   .byte  197,197,219,246                     // vpand         %ymm6,%ymm7,%ymm6
   .byte  197,252,91,246                      // vcvtdq2ps     %ymm6,%ymm6
-  .byte  196,98,125,24,5,60,232,2,0          // vbroadcastss  0x2e83c(%rip),%ymm8        # 3ac88 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
+  .byte  196,98,125,24,5,234,226,2,0         // vbroadcastss  0x2e2ea(%rip),%ymm8        # 3a4b8 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
   .byte  196,193,76,89,240                   // vmulps        %ymm8,%ymm6,%ymm6
-  .byte  196,98,125,88,5,50,232,2,0          // vpbroadcastd  0x2e832(%rip),%ymm8        # 3ac8c <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
+  .byte  196,98,125,88,5,224,226,2,0         // vpbroadcastd  0x2e2e0(%rip),%ymm8        # 3a4bc <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
   .byte  196,193,69,219,248                  // vpand         %ymm8,%ymm7,%ymm7
   .byte  197,252,91,255                      // vcvtdq2ps     %ymm7,%ymm7
-  .byte  196,98,125,24,5,36,232,2,0          // vbroadcastss  0x2e824(%rip),%ymm8        # 3ac90 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
+  .byte  196,98,125,24,5,210,226,2,0         // vbroadcastss  0x2e2d2(%rip),%ymm8        # 3a4c0 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
   .byte  196,193,68,89,248                   // vmulps        %ymm8,%ymm7,%ymm7
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,100,255,255,255              // ja            c3f1 <_sk_load_4444_dst_hsw+0x25>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,100,0,0,0                 // lea           0x64(%rip),%r10        # c4fc <_sk_load_4444_dst_hsw+0x130>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  15,135,106,255,255,255              // ja            c173 <_sk_load_4444_dst_hsw+0x1f>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,97,0,0,0                  // lea           0x61(%rip),%r9        # c274 <_sk_load_4444_dst_hsw+0x120>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  233,66,255,255,255                  // jmpq          c3f1 <_sk_load_4444_dst_hsw+0x25>
+  .byte  233,73,255,255,255                  // jmpq          c173 <_sk_load_4444_dst_hsw+0x1f>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,4,2           // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,129,121,110,44,88               // vmovd         (%r8,%r11,2),%xmm5
+  .byte  196,193,89,196,100,80,4,2           // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,193,121,110,44,80               // vmovd         (%r8,%rdx,2),%xmm5
   .byte  196,227,89,2,229,1                  // vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  .byte  233,37,255,255,255                  // jmpq          c3f1 <_sk_load_4444_dst_hsw+0x25>
+  .byte  233,44,255,255,255                  // jmpq          c173 <_sk_load_4444_dst_hsw+0x1f>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,12,6          // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,10,5          // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,8,4           // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,129,122,126,44,88               // vmovq         (%r8,%r11,2),%xmm5
+  .byte  196,193,89,196,100,80,12,6          // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,193,89,196,100,80,10,5          // vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,193,89,196,100,80,8,4           // vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,193,122,126,44,80               // vmovq         (%r8,%rdx,2),%xmm5
   .byte  196,227,81,2,228,12                 // vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  .byte  233,248,254,255,255                 // jmpq          c3f1 <_sk_load_4444_dst_hsw+0x25>
-  .byte  15,31,0                             // nopl          (%rax)
-  .byte  165                                 // movsl         %ds:(%rsi),%es:(%rdi)
+  .byte  233,255,254,255,255                 // jmpq          c173 <_sk_load_4444_dst_hsw+0x1f>
+  .byte  168,255                             // test          $0xff,%al
+  .byte  255                                 // (bad)
+  .byte  255,194                             // inc           %edx
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,182,255,255,255,239             // pushq         -0x10000001(%rsi)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,231                             // jmpq          *%rdi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  191,255,255,255,179                 // mov           $0xb3ffffff,%edi
+  .byte  223,255                             // (bad)
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  236                                 // in            (%dx),%al
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,228                             // jmpq          *%rsp
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  220,255                             // fdivr         %st,%st(7)
-  .byte  255                                 // (bad)
-  .byte  255,208                             // callq         *%rax
+  .byte  255,211                             // callq         *%rbx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -12077,25 +11964,25 @@
   .byte  65,15,183,4,88                      // movzwl        (%r8,%rbx,2),%eax
   .byte  197,249,196,192,7                   // vpinsrw       $0x7,%eax,%xmm0,%xmm0
   .byte  196,226,125,51,216                  // vpmovzxwd     %xmm0,%ymm3
-  .byte  196,226,125,88,5,116,230,2,0        // vpbroadcastd  0x2e674(%rip),%ymm0        # 3ac74 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
+  .byte  196,226,125,88,5,44,225,2,0         // vpbroadcastd  0x2e12c(%rip),%ymm0        # 3a4a4 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
   .byte  197,229,219,192                     // vpand         %ymm0,%ymm3,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,103,230,2,0       // vbroadcastss  0x2e667(%rip),%ymm1        # 3ac78 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
+  .byte  196,226,125,24,13,31,225,2,0        // vbroadcastss  0x2e11f(%rip),%ymm1        # 3a4a8 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
-  .byte  196,226,125,88,13,94,230,2,0        // vpbroadcastd  0x2e65e(%rip),%ymm1        # 3ac7c <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
+  .byte  196,226,125,88,13,22,225,2,0        // vpbroadcastd  0x2e116(%rip),%ymm1        # 3a4ac <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
   .byte  197,229,219,201                     // vpand         %ymm1,%ymm3,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  196,226,125,24,21,81,230,2,0        // vbroadcastss  0x2e651(%rip),%ymm2        # 3ac80 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
+  .byte  196,226,125,24,21,9,225,2,0         // vbroadcastss  0x2e109(%rip),%ymm2        # 3a4b0 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
   .byte  197,244,89,202                      // vmulps        %ymm2,%ymm1,%ymm1
-  .byte  196,226,125,88,21,72,230,2,0        // vpbroadcastd  0x2e648(%rip),%ymm2        # 3ac84 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
+  .byte  196,226,125,88,21,0,225,2,0         // vpbroadcastd  0x2e100(%rip),%ymm2        # 3a4b4 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
   .byte  197,229,219,210                     // vpand         %ymm2,%ymm3,%ymm2
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
-  .byte  196,98,125,24,5,59,230,2,0          // vbroadcastss  0x2e63b(%rip),%ymm8        # 3ac88 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
+  .byte  196,98,125,24,5,243,224,2,0         // vbroadcastss  0x2e0f3(%rip),%ymm8        # 3a4b8 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
   .byte  196,193,108,89,208                  // vmulps        %ymm8,%ymm2,%ymm2
-  .byte  196,98,125,88,5,49,230,2,0          // vpbroadcastd  0x2e631(%rip),%ymm8        # 3ac8c <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
+  .byte  196,98,125,88,5,233,224,2,0         // vpbroadcastd  0x2e0e9(%rip),%ymm8        # 3a4bc <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
   .byte  196,193,101,219,216                 // vpand         %ymm8,%ymm3,%ymm3
   .byte  197,252,91,219                      // vcvtdq2ps     %ymm3,%ymm3
-  .byte  196,98,125,24,5,35,230,2,0          // vbroadcastss  0x2e623(%rip),%ymm8        # 3ac90 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
+  .byte  196,98,125,24,5,219,224,2,0         // vbroadcastss  0x2e0db(%rip),%ymm8        # 3a4c0 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
   .byte  196,193,100,89,216                  // vmulps        %ymm8,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  91                                  // pop           %rbx
@@ -12109,17 +11996,15 @@
 FUNCTION(_sk_store_4444_hsw)
 _sk_store_4444_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,60,95,200                       // vmaxps        %ymm0,%ymm8,%ymm9
-  .byte  196,98,125,24,21,215,228,2,0        // vbroadcastss  0x2e4d7(%rip),%ymm10        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,21,149,223,2,0        // vbroadcastss  0x2df95(%rip),%ymm10        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,52,93,202                    // vminps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,29,225,229,2,0        // vbroadcastss  0x2e5e1(%rip),%ymm11        # 3ac94 <_sk_srcover_bgra_8888_sse2_lowp+0x3c8>
+  .byte  196,98,125,24,29,159,224,2,0        // vbroadcastss  0x2e09f(%rip),%ymm11        # 3a4c4 <_sk_srcover_bgra_8888_sse2_lowp+0x3c8>
   .byte  196,65,52,89,203                    // vmulps        %ymm11,%ymm9,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  196,193,53,114,241,12               // vpslld        $0xc,%ymm9,%ymm9
@@ -12143,50 +12028,52 @@
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,66,57,43,193                    // vpackusdw     %xmm9,%xmm8,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           c731 <_sk_store_4444_hsw+0xb4>
-  .byte  196,1,122,127,4,88                  // vmovdqu       %xmm8,(%r8,%r11,2)
+  .byte  117,10                              // jne           c4a3 <_sk_store_4444_hsw+0xae>
+  .byte  196,65,122,127,4,80                 // vmovdqu       %xmm8,(%r8,%rdx,2)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,236                             // ja            c72d <_sk_store_4444_hsw+0xb0>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,68,0,0,0                  // lea           0x44(%rip),%r10        # c790 <_sk_store_4444_hsw+0x113>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,242                             // ja            c49f <_sk_store_4444_hsw+0xaa>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,69,0,0,0                  // lea           0x45(%rip),%r9        # c4fc <_sk_store_4444_hsw+0x107>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,3,121,21,4,88,0                 // vpextrw       $0x0,%xmm8,(%r8,%r11,2)
-  .byte  235,207                             // jmp           c72d <_sk_store_4444_hsw+0xb0>
-  .byte  196,3,121,21,68,88,4,2              // vpextrw       $0x2,%xmm8,0x4(%r8,%r11,2)
-  .byte  196,1,121,126,4,88                  // vmovd         %xmm8,(%r8,%r11,2)
-  .byte  235,191                             // jmp           c72d <_sk_store_4444_hsw+0xb0>
-  .byte  196,3,121,21,68,88,12,6             // vpextrw       $0x6,%xmm8,0xc(%r8,%r11,2)
-  .byte  196,3,121,21,68,88,10,5             // vpextrw       $0x5,%xmm8,0xa(%r8,%r11,2)
-  .byte  196,3,121,21,68,88,8,4              // vpextrw       $0x4,%xmm8,0x8(%r8,%r11,2)
-  .byte  196,1,121,214,4,88                  // vmovq         %xmm8,(%r8,%r11,2)
-  .byte  235,159                             // jmp           c72d <_sk_store_4444_hsw+0xb0>
-  .byte  102,144                             // xchg          %ax,%ax
-  .byte  197,255,255                         // (bad)
-  .byte  255,214                             // callq         *%rsi
+  .byte  196,67,121,21,4,80,0                // vpextrw       $0x0,%xmm8,(%r8,%rdx,2)
+  .byte  235,214                             // jmp           c49f <_sk_store_4444_hsw+0xaa>
+  .byte  196,67,121,21,68,80,4,2             // vpextrw       $0x2,%xmm8,0x4(%r8,%rdx,2)
+  .byte  196,65,121,126,4,80                 // vmovd         %xmm8,(%r8,%rdx,2)
+  .byte  235,198                             // jmp           c49f <_sk_store_4444_hsw+0xaa>
+  .byte  196,67,121,21,68,80,12,6            // vpextrw       $0x6,%xmm8,0xc(%r8,%rdx,2)
+  .byte  196,67,121,21,68,80,10,5            // vpextrw       $0x5,%xmm8,0xa(%r8,%rdx,2)
+  .byte  196,67,121,21,68,80,8,4             // vpextrw       $0x4,%xmm8,0x8(%r8,%rdx,2)
+  .byte  196,65,121,214,4,80                 // vmovq         %xmm8,(%r8,%rdx,2)
+  .byte  235,166                             // jmp           c49f <_sk_store_4444_hsw+0xaa>
+  .byte  15,31,0                             // nopl          (%rax)
+  .byte  196                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,206                             // dec           %esi
+  .byte  255,213                             // callq         *%rbp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,246                             // push          %rsi
+  .byte  255,205                             // dec           %ebp
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,245                             // push          %rbp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  238                                 // out           %al,(%dx)
+  .byte  237                                 // in            (%dx),%eax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,230                             // jmpq          *%rsi
+  .byte  255,229                             // jmpq          *%rbp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  222,255                             // fdivrp        %st,%st(7)
+  .byte  221,255                             // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
@@ -12195,23 +12082,21 @@
 FUNCTION(_sk_load_8888_hsw)
 _sk_load_8888_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,86                              // jne           c81e <_sk_load_8888_hsw+0x72>
-  .byte  196,129,126,111,28,152              // vmovdqu       (%r8,%r11,4),%ymm3
-  .byte  197,229,219,5,170,230,2,0           // vpand         0x2e6aa(%rip),%ymm3,%ymm0        # 3ae80 <_sk_srcover_bgra_8888_sse2_lowp+0x5b4>
+  .byte  117,86                              // jne           c584 <_sk_load_8888_hsw+0x6c>
+  .byte  196,193,126,111,28,144              // vmovdqu       (%r8,%rdx,4),%ymm3
+  .byte  197,229,219,5,132,225,2,0           // vpand         0x2e184(%rip),%ymm3,%ymm0        # 3a6c0 <_sk_srcover_bgra_8888_sse2_lowp+0x5c4>
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,5,17,228,2,0          // vbroadcastss  0x2e411(%rip),%ymm8        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,5,219,222,2,0         // vbroadcastss  0x2dedb(%rip),%ymm8        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
-  .byte  196,226,101,0,13,175,230,2,0        // vpshufb       0x2e6af(%rip),%ymm3,%ymm1        # 3aea0 <_sk_srcover_bgra_8888_sse2_lowp+0x5d4>
+  .byte  196,226,101,0,13,137,225,2,0        // vpshufb       0x2e189(%rip),%ymm3,%ymm1        # 3a6e0 <_sk_srcover_bgra_8888_sse2_lowp+0x5e4>
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
   .byte  196,193,116,89,200                  // vmulps        %ymm8,%ymm1,%ymm1
-  .byte  196,226,101,0,21,189,230,2,0        // vpshufb       0x2e6bd(%rip),%ymm3,%ymm2        # 3aec0 <_sk_srcover_bgra_8888_sse2_lowp+0x5f4>
+  .byte  196,226,101,0,21,151,225,2,0        // vpshufb       0x2e197(%rip),%ymm3,%ymm2        # 3a700 <_sk_srcover_bgra_8888_sse2_lowp+0x604>
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
   .byte  196,193,108,89,208                  // vmulps        %ymm8,%ymm2,%ymm2
   .byte  197,229,114,211,24                  // vpsrld        $0x18,%ymm3,%ymm3
@@ -12219,57 +12104,53 @@
   .byte  196,193,100,89,216                  // vmulps        %ymm8,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,229,239,219                     // vpxor         %ymm3,%ymm3,%ymm3
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,156                             // ja            c7ce <_sk_load_8888_hsw+0x22>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,135,0,0,0                 // lea           0x87(%rip),%r10        # c8c4 <_sk_load_8888_hsw+0x118>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,162                             // ja            c534 <_sk_load_8888_hsw+0x1c>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,136,0,0,0                 // lea           0x88(%rip),%r9        # c624 <_sk_load_8888_hsw+0x10c>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,129,121,110,28,152              // vmovd         (%r8,%r11,4),%xmm3
-  .byte  235,128                             // jmp           c7ce <_sk_load_8888_hsw+0x22>
-  .byte  196,129,121,110,68,152,8            // vmovd         0x8(%r8,%r11,4),%xmm0
+  .byte  196,193,121,110,28,144              // vmovd         (%r8,%rdx,4),%xmm3
+  .byte  235,135                             // jmp           c534 <_sk_load_8888_hsw+0x1c>
+  .byte  196,193,121,110,68,144,8            // vmovd         0x8(%r8,%rdx,4),%xmm0
   .byte  196,226,121,89,192                  // vpbroadcastq  %xmm0,%xmm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
   .byte  196,227,117,2,216,4                 // vpblendd      $0x4,%ymm0,%ymm1,%ymm3
-  .byte  196,129,122,126,4,152               // vmovq         (%r8,%r11,4),%xmm0
+  .byte  196,193,122,126,4,144               // vmovq         (%r8,%rdx,4),%xmm0
   .byte  196,227,101,2,216,3                 // vpblendd      $0x3,%ymm0,%ymm3,%ymm3
-  .byte  233,89,255,255,255                  // jmpq          c7ce <_sk_load_8888_hsw+0x22>
-  .byte  196,129,121,110,68,152,24           // vmovd         0x18(%r8,%r11,4),%xmm0
+  .byte  233,96,255,255,255                  // jmpq          c534 <_sk_load_8888_hsw+0x1c>
+  .byte  196,193,121,110,68,144,24           // vmovd         0x18(%r8,%rdx,4),%xmm0
   .byte  196,226,125,89,192                  // vpbroadcastq  %xmm0,%ymm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
   .byte  196,227,117,2,216,64                // vpblendd      $0x40,%ymm0,%ymm1,%ymm3
   .byte  196,227,125,57,216,1                // vextracti128  $0x1,%ymm3,%xmm0
-  .byte  196,131,121,34,68,152,20,1          // vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm0,%xmm0
+  .byte  196,195,121,34,68,144,20,1          // vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm0,%xmm0
   .byte  196,227,101,56,216,1                // vinserti128   $0x1,%xmm0,%ymm3,%ymm3
   .byte  196,227,125,57,216,1                // vextracti128  $0x1,%ymm3,%xmm0
-  .byte  196,131,121,34,68,152,16,0          // vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm0,%xmm0
+  .byte  196,195,121,34,68,144,16,0          // vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm0,%xmm0
   .byte  196,227,101,56,216,1                // vinserti128   $0x1,%xmm0,%ymm3,%ymm3
-  .byte  196,129,122,111,4,152               // vmovdqu       (%r8,%r11,4),%xmm0
+  .byte  196,193,122,111,4,144               // vmovdqu       (%r8,%rdx,4),%xmm0
   .byte  196,227,125,2,219,240               // vpblendd      $0xf0,%ymm3,%ymm0,%ymm3
-  .byte  233,10,255,255,255                  // jmpq          c7ce <_sk_load_8888_hsw+0x22>
-  .byte  130                                 // (bad)
+  .byte  233,17,255,255,255                  // jmpq          c534 <_sk_load_8888_hsw+0x1c>
+  .byte  144                                 // nop
+  .byte  129,255,255,255,159,255             // cmp           $0xff9fffff,%edi
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,160,255,255,255,138             // jmpq          *-0x75000001(%rax)
+  .byte  255,137,255,255,255,238             // decl          -0x11000001(%rcx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  239                                 // out           %eax,(%dx)
+  .byte  218,255                             // (bad)
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  219,255                             // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,199                             // inc           %edi
+  .byte  255,198                             // inc           %esi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
-  .byte  177,255                             // mov           $0xff,%cl
+  .byte  176,255                             // mov           $0xff,%al
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
@@ -12278,23 +12159,21 @@
 FUNCTION(_sk_load_8888_dst_hsw)
 _sk_load_8888_dst_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,86                              // jne           c952 <_sk_load_8888_dst_hsw+0x72>
-  .byte  196,129,126,111,60,152              // vmovdqu       (%r8,%r11,4),%ymm7
-  .byte  197,197,219,37,214,229,2,0          // vpand         0x2e5d6(%rip),%ymm7,%ymm4        # 3aee0 <_sk_srcover_bgra_8888_sse2_lowp+0x614>
+  .byte  117,86                              // jne           c6ac <_sk_load_8888_dst_hsw+0x6c>
+  .byte  196,193,126,111,60,144              // vmovdqu       (%r8,%rdx,4),%ymm7
+  .byte  197,197,219,37,188,224,2,0          // vpand         0x2e0bc(%rip),%ymm7,%ymm4        # 3a720 <_sk_srcover_bgra_8888_sse2_lowp+0x624>
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,98,125,24,5,221,226,2,0         // vbroadcastss  0x2e2dd(%rip),%ymm8        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,5,179,221,2,0         // vbroadcastss  0x2ddb3(%rip),%ymm8        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,193,92,89,224                   // vmulps        %ymm8,%ymm4,%ymm4
-  .byte  196,226,69,0,45,219,229,2,0         // vpshufb       0x2e5db(%rip),%ymm7,%ymm5        # 3af00 <_sk_srcover_bgra_8888_sse2_lowp+0x634>
+  .byte  196,226,69,0,45,193,224,2,0         // vpshufb       0x2e0c1(%rip),%ymm7,%ymm5        # 3a740 <_sk_srcover_bgra_8888_sse2_lowp+0x644>
   .byte  197,252,91,237                      // vcvtdq2ps     %ymm5,%ymm5
   .byte  196,193,84,89,232                   // vmulps        %ymm8,%ymm5,%ymm5
-  .byte  196,226,69,0,53,233,229,2,0         // vpshufb       0x2e5e9(%rip),%ymm7,%ymm6        # 3af20 <_sk_srcover_bgra_8888_sse2_lowp+0x654>
+  .byte  196,226,69,0,53,207,224,2,0         // vpshufb       0x2e0cf(%rip),%ymm7,%ymm6        # 3a760 <_sk_srcover_bgra_8888_sse2_lowp+0x664>
   .byte  197,252,91,246                      // vcvtdq2ps     %ymm6,%ymm6
   .byte  196,193,76,89,240                   // vmulps        %ymm8,%ymm6,%ymm6
   .byte  197,197,114,215,24                  // vpsrld        $0x18,%ymm7,%ymm7
@@ -12302,57 +12181,53 @@
   .byte  196,193,68,89,248                   // vmulps        %ymm8,%ymm7,%ymm7
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,197,239,255                     // vpxor         %ymm7,%ymm7,%ymm7
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,156                             // ja            c902 <_sk_load_8888_dst_hsw+0x22>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,135,0,0,0                 // lea           0x87(%rip),%r10        # c9f8 <_sk_load_8888_dst_hsw+0x118>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,162                             // ja            c65c <_sk_load_8888_dst_hsw+0x1c>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,136,0,0,0                 // lea           0x88(%rip),%r9        # c74c <_sk_load_8888_dst_hsw+0x10c>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,129,121,110,60,152              // vmovd         (%r8,%r11,4),%xmm7
-  .byte  235,128                             // jmp           c902 <_sk_load_8888_dst_hsw+0x22>
-  .byte  196,129,121,110,100,152,8           // vmovd         0x8(%r8,%r11,4),%xmm4
+  .byte  196,193,121,110,60,144              // vmovd         (%r8,%rdx,4),%xmm7
+  .byte  235,135                             // jmp           c65c <_sk_load_8888_dst_hsw+0x1c>
+  .byte  196,193,121,110,100,144,8           // vmovd         0x8(%r8,%rdx,4),%xmm4
   .byte  196,226,121,89,228                  // vpbroadcastq  %xmm4,%xmm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
   .byte  196,227,85,2,252,4                  // vpblendd      $0x4,%ymm4,%ymm5,%ymm7
-  .byte  196,129,122,126,36,152              // vmovq         (%r8,%r11,4),%xmm4
+  .byte  196,193,122,126,36,144              // vmovq         (%r8,%rdx,4),%xmm4
   .byte  196,227,69,2,252,3                  // vpblendd      $0x3,%ymm4,%ymm7,%ymm7
-  .byte  233,89,255,255,255                  // jmpq          c902 <_sk_load_8888_dst_hsw+0x22>
-  .byte  196,129,121,110,100,152,24          // vmovd         0x18(%r8,%r11,4),%xmm4
+  .byte  233,96,255,255,255                  // jmpq          c65c <_sk_load_8888_dst_hsw+0x1c>
+  .byte  196,193,121,110,100,144,24          // vmovd         0x18(%r8,%rdx,4),%xmm4
   .byte  196,226,125,89,228                  // vpbroadcastq  %xmm4,%ymm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
   .byte  196,227,85,2,252,64                 // vpblendd      $0x40,%ymm4,%ymm5,%ymm7
   .byte  196,227,125,57,252,1                // vextracti128  $0x1,%ymm7,%xmm4
-  .byte  196,131,89,34,100,152,20,1          // vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,20,1          // vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,227,69,56,252,1                 // vinserti128   $0x1,%xmm4,%ymm7,%ymm7
   .byte  196,227,125,57,252,1                // vextracti128  $0x1,%ymm7,%xmm4
-  .byte  196,131,89,34,100,152,16,0          // vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,16,0          // vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,227,69,56,252,1                 // vinserti128   $0x1,%xmm4,%ymm7,%ymm7
-  .byte  196,129,122,111,36,152              // vmovdqu       (%r8,%r11,4),%xmm4
+  .byte  196,193,122,111,36,144              // vmovdqu       (%r8,%rdx,4),%xmm4
   .byte  196,227,93,2,255,240                // vpblendd      $0xf0,%ymm7,%ymm4,%ymm7
-  .byte  233,10,255,255,255                  // jmpq          c902 <_sk_load_8888_dst_hsw+0x22>
-  .byte  130                                 // (bad)
+  .byte  233,17,255,255,255                  // jmpq          c65c <_sk_load_8888_dst_hsw+0x1c>
+  .byte  144                                 // nop
+  .byte  129,255,255,255,159,255             // cmp           $0xff9fffff,%edi
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,160,255,255,255,138             // jmpq          *-0x75000001(%rax)
+  .byte  255,137,255,255,255,238             // decl          -0x11000001(%rcx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  239                                 // out           %eax,(%dx)
+  .byte  218,255                             // (bad)
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  219,255                             // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,199                             // inc           %edi
+  .byte  255,198                             // inc           %esi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
-  .byte  177,255                             // mov           $0xff,%cl
+  .byte  176,255                             // mov           $0xff,%al
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
@@ -12378,14 +12253,14 @@
   .byte  197,254,91,192                      // vcvttps2dq    %ymm0,%ymm0
   .byte  197,245,254,192                     // vpaddd        %ymm0,%ymm1,%ymm0
   .byte  196,66,101,144,4,128                // vpgatherdd    %ymm3,(%r8,%ymm0,4),%ymm8
-  .byte  197,189,219,5,213,228,2,0           // vpand         0x2e4d5(%rip),%ymm8,%ymm0        # 3af40 <_sk_srcover_bgra_8888_sse2_lowp+0x674>
+  .byte  197,189,219,5,193,223,2,0           // vpand         0x2dfc1(%rip),%ymm8,%ymm0        # 3a780 <_sk_srcover_bgra_8888_sse2_lowp+0x684>
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,29,124,225,2,0       // vbroadcastss  0x2e17c(%rip),%ymm3        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,226,125,24,29,88,220,2,0        // vbroadcastss  0x2dc58(%rip),%ymm3        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  197,252,89,195                      // vmulps        %ymm3,%ymm0,%ymm0
-  .byte  196,226,61,0,13,219,228,2,0         // vpshufb       0x2e4db(%rip),%ymm8,%ymm1        # 3af60 <_sk_srcover_bgra_8888_sse2_lowp+0x694>
+  .byte  196,226,61,0,13,199,223,2,0         // vpshufb       0x2dfc7(%rip),%ymm8,%ymm1        # 3a7a0 <_sk_srcover_bgra_8888_sse2_lowp+0x6a4>
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
   .byte  197,244,89,203                      // vmulps        %ymm3,%ymm1,%ymm1
-  .byte  196,226,61,0,21,234,228,2,0         // vpshufb       0x2e4ea(%rip),%ymm8,%ymm2        # 3af80 <_sk_srcover_bgra_8888_sse2_lowp+0x6b4>
+  .byte  196,226,61,0,21,214,223,2,0         // vpshufb       0x2dfd6(%rip),%ymm8,%ymm2        # 3a7c0 <_sk_srcover_bgra_8888_sse2_lowp+0x6c4>
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
   .byte  197,236,89,211                      // vmulps        %ymm3,%ymm2,%ymm2
   .byte  196,193,61,114,208,24               // vpsrld        $0x18,%ymm8,%ymm8
@@ -12399,17 +12274,15 @@
 FUNCTION(_sk_store_8888_hsw)
 _sk_store_8888_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,60,95,200                       // vmaxps        %ymm0,%ymm8,%ymm9
-  .byte  196,98,125,24,21,162,224,2,0        // vbroadcastss  0x2e0a2(%rip),%ymm10        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,21,132,219,2,0        // vbroadcastss  0x2db84(%rip),%ymm10        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,52,93,202                    // vminps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,29,192,224,2,0        // vbroadcastss  0x2e0c0(%rip),%ymm11        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,98,125,24,29,162,219,2,0        // vbroadcastss  0x2dba2(%rip),%ymm11        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   .byte  196,65,52,89,203                    // vmulps        %ymm11,%ymm9,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  197,60,95,225                       // vmaxps        %ymm1,%ymm8,%ymm12
@@ -12431,49 +12304,51 @@
   .byte  196,65,29,235,192                   // vpor          %ymm8,%ymm12,%ymm8
   .byte  196,65,53,235,192                   // vpor          %ymm8,%ymm9,%ymm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           cb5b <_sk_store_8888_hsw+0xaa>
-  .byte  196,1,126,127,4,152                 // vmovdqu       %ymm8,(%r8,%r11,4)
+  .byte  117,10                              // jne           c8a9 <_sk_store_8888_hsw+0xa4>
+  .byte  196,65,126,127,4,144                // vmovdqu       %ymm8,(%r8,%rdx,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,236                             // ja            cb57 <_sk_store_8888_hsw+0xa6>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,82,0,0,0                  // lea           0x52(%rip),%r10        # cbc8 <_sk_store_8888_hsw+0x117>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,242                             // ja            c8a5 <_sk_store_8888_hsw+0xa0>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,83,0,0,0                  // lea           0x53(%rip),%r9        # c910 <_sk_store_8888_hsw+0x10b>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,1,121,126,4,152                 // vmovd         %xmm8,(%r8,%r11,4)
-  .byte  235,208                             // jmp           cb57 <_sk_store_8888_hsw+0xa6>
-  .byte  196,3,121,22,68,152,8,2             // vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
-  .byte  196,1,121,214,4,152                 // vmovq         %xmm8,(%r8,%r11,4)
-  .byte  235,192                             // jmp           cb57 <_sk_store_8888_hsw+0xa6>
+  .byte  196,65,121,126,4,144                // vmovd         %xmm8,(%r8,%rdx,4)
+  .byte  235,215                             // jmp           c8a5 <_sk_store_8888_hsw+0xa0>
+  .byte  196,67,121,22,68,144,8,2            // vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
+  .byte  196,65,121,214,4,144                // vmovq         %xmm8,(%r8,%rdx,4)
+  .byte  235,199                             // jmp           c8a5 <_sk_store_8888_hsw+0xa0>
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,24,2            // vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,24,2           // vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,20,1            // vpextrd       $0x1,%xmm9,0x14(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,20,1           // vpextrd       $0x1,%xmm9,0x14(%r8,%rdx,4)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,1,121,126,76,152,16             // vmovd         %xmm9,0x10(%r8,%r11,4)
-  .byte  196,1,122,127,4,152                 // vmovdqu       %xmm8,(%r8,%r11,4)
-  .byte  235,143                             // jmp           cb57 <_sk_store_8888_hsw+0xa6>
-  .byte  183,255                             // mov           $0xff,%bh
+  .byte  196,65,121,126,76,144,16            // vmovd         %xmm9,0x10(%r8,%rdx,4)
+  .byte  196,65,122,127,4,144                // vmovdqu       %xmm8,(%r8,%rdx,4)
+  .byte  235,150                             // jmp           c8a5 <_sk_store_8888_hsw+0xa0>
+  .byte  144                                 // nop
+  .byte  182,255                             // mov           $0xff,%dh
   .byte  255                                 // (bad)
-  .byte  255,199                             // inc           %edi
+  .byte  255,198                             // inc           %esi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  191,255,255,255,248                 // mov           $0xf8ffffff,%edi
+  .byte  190,255,255,255,247                 // mov           $0xf7ffffff,%esi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  235,255                             // jmp           cbd9 <_sk_store_8888_hsw+0x128>
+  .byte  234                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  221,255                             // (bad)
   .byte  255                                 // (bad)
-  .byte  255,207                             // dec           %edi
+  .byte  220,255                             // fdivr         %st,%st(7)
+  .byte  255                                 // (bad)
+  .byte  255,206                             // dec           %esi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -12483,23 +12358,21 @@
 FUNCTION(_sk_load_bgra_hsw)
 _sk_load_bgra_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,86                              // jne           cc56 <_sk_load_bgra_hsw+0x72>
-  .byte  196,129,126,111,28,152              // vmovdqu       (%r8,%r11,4),%ymm3
-  .byte  197,229,219,5,146,227,2,0           // vpand         0x2e392(%rip),%ymm3,%ymm0        # 3afa0 <_sk_srcover_bgra_8888_sse2_lowp+0x6d4>
+  .byte  117,86                              // jne           c998 <_sk_load_bgra_hsw+0x6c>
+  .byte  196,193,126,111,28,144              // vmovdqu       (%r8,%rdx,4),%ymm3
+  .byte  197,229,219,5,144,222,2,0           // vpand         0x2de90(%rip),%ymm3,%ymm0        # 3a7e0 <_sk_srcover_bgra_8888_sse2_lowp+0x6e4>
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,5,217,223,2,0         // vbroadcastss  0x2dfd9(%rip),%ymm8        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,5,199,218,2,0         // vbroadcastss  0x2dac7(%rip),%ymm8        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,193,124,89,208                  // vmulps        %ymm8,%ymm0,%ymm2
-  .byte  196,226,101,0,5,151,227,2,0         // vpshufb       0x2e397(%rip),%ymm3,%ymm0        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0x6f4>
+  .byte  196,226,101,0,5,149,222,2,0         // vpshufb       0x2de95(%rip),%ymm3,%ymm0        # 3a800 <_sk_srcover_bgra_8888_sse2_lowp+0x704>
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
   .byte  196,193,124,89,200                  // vmulps        %ymm8,%ymm0,%ymm1
-  .byte  196,226,101,0,5,165,227,2,0         // vpshufb       0x2e3a5(%rip),%ymm3,%ymm0        # 3afe0 <_sk_srcover_bgra_8888_sse2_lowp+0x714>
+  .byte  196,226,101,0,5,163,222,2,0         // vpshufb       0x2dea3(%rip),%ymm3,%ymm0        # 3a820 <_sk_srcover_bgra_8888_sse2_lowp+0x724>
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
   .byte  197,229,114,211,24                  // vpsrld        $0x18,%ymm3,%ymm3
@@ -12507,57 +12380,53 @@
   .byte  196,193,100,89,216                  // vmulps        %ymm8,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,229,239,219                     // vpxor         %ymm3,%ymm3,%ymm3
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,156                             // ja            cc06 <_sk_load_bgra_hsw+0x22>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,135,0,0,0                 // lea           0x87(%rip),%r10        # ccfc <_sk_load_bgra_hsw+0x118>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,162                             // ja            c948 <_sk_load_bgra_hsw+0x1c>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,136,0,0,0                 // lea           0x88(%rip),%r9        # ca38 <_sk_load_bgra_hsw+0x10c>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,129,121,110,28,152              // vmovd         (%r8,%r11,4),%xmm3
-  .byte  235,128                             // jmp           cc06 <_sk_load_bgra_hsw+0x22>
-  .byte  196,129,121,110,68,152,8            // vmovd         0x8(%r8,%r11,4),%xmm0
+  .byte  196,193,121,110,28,144              // vmovd         (%r8,%rdx,4),%xmm3
+  .byte  235,135                             // jmp           c948 <_sk_load_bgra_hsw+0x1c>
+  .byte  196,193,121,110,68,144,8            // vmovd         0x8(%r8,%rdx,4),%xmm0
   .byte  196,226,121,89,192                  // vpbroadcastq  %xmm0,%xmm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
   .byte  196,227,117,2,216,4                 // vpblendd      $0x4,%ymm0,%ymm1,%ymm3
-  .byte  196,129,122,126,4,152               // vmovq         (%r8,%r11,4),%xmm0
+  .byte  196,193,122,126,4,144               // vmovq         (%r8,%rdx,4),%xmm0
   .byte  196,227,101,2,216,3                 // vpblendd      $0x3,%ymm0,%ymm3,%ymm3
-  .byte  233,89,255,255,255                  // jmpq          cc06 <_sk_load_bgra_hsw+0x22>
-  .byte  196,129,121,110,68,152,24           // vmovd         0x18(%r8,%r11,4),%xmm0
+  .byte  233,96,255,255,255                  // jmpq          c948 <_sk_load_bgra_hsw+0x1c>
+  .byte  196,193,121,110,68,144,24           // vmovd         0x18(%r8,%rdx,4),%xmm0
   .byte  196,226,125,89,192                  // vpbroadcastq  %xmm0,%ymm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
   .byte  196,227,117,2,216,64                // vpblendd      $0x40,%ymm0,%ymm1,%ymm3
   .byte  196,227,125,57,216,1                // vextracti128  $0x1,%ymm3,%xmm0
-  .byte  196,131,121,34,68,152,20,1          // vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm0,%xmm0
+  .byte  196,195,121,34,68,144,20,1          // vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm0,%xmm0
   .byte  196,227,101,56,216,1                // vinserti128   $0x1,%xmm0,%ymm3,%ymm3
   .byte  196,227,125,57,216,1                // vextracti128  $0x1,%ymm3,%xmm0
-  .byte  196,131,121,34,68,152,16,0          // vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm0,%xmm0
+  .byte  196,195,121,34,68,144,16,0          // vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm0,%xmm0
   .byte  196,227,101,56,216,1                // vinserti128   $0x1,%xmm0,%ymm3,%ymm3
-  .byte  196,129,122,111,4,152               // vmovdqu       (%r8,%r11,4),%xmm0
+  .byte  196,193,122,111,4,144               // vmovdqu       (%r8,%rdx,4),%xmm0
   .byte  196,227,125,2,219,240               // vpblendd      $0xf0,%ymm3,%ymm0,%ymm3
-  .byte  233,10,255,255,255                  // jmpq          cc06 <_sk_load_bgra_hsw+0x22>
-  .byte  130                                 // (bad)
+  .byte  233,17,255,255,255                  // jmpq          c948 <_sk_load_bgra_hsw+0x1c>
+  .byte  144                                 // nop
+  .byte  129,255,255,255,159,255             // cmp           $0xff9fffff,%edi
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,160,255,255,255,138             // jmpq          *-0x75000001(%rax)
+  .byte  255,137,255,255,255,238             // decl          -0x11000001(%rcx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  239                                 // out           %eax,(%dx)
+  .byte  218,255                             // (bad)
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  219,255                             // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,199                             // inc           %edi
+  .byte  255,198                             // inc           %esi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
-  .byte  177,255                             // mov           $0xff,%cl
+  .byte  176,255                             // mov           $0xff,%al
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
@@ -12566,23 +12435,21 @@
 FUNCTION(_sk_load_bgra_dst_hsw)
 _sk_load_bgra_dst_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,86                              // jne           cd8a <_sk_load_bgra_dst_hsw+0x72>
-  .byte  196,129,126,111,60,152              // vmovdqu       (%r8,%r11,4),%ymm7
-  .byte  197,197,219,37,190,226,2,0          // vpand         0x2e2be(%rip),%ymm7,%ymm4        # 3b000 <_sk_srcover_bgra_8888_sse2_lowp+0x734>
+  .byte  117,86                              // jne           cac0 <_sk_load_bgra_dst_hsw+0x6c>
+  .byte  196,193,126,111,60,144              // vmovdqu       (%r8,%rdx,4),%ymm7
+  .byte  197,197,219,37,200,221,2,0          // vpand         0x2ddc8(%rip),%ymm7,%ymm4        # 3a840 <_sk_srcover_bgra_8888_sse2_lowp+0x744>
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,98,125,24,5,165,222,2,0         // vbroadcastss  0x2dea5(%rip),%ymm8        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,5,159,217,2,0         // vbroadcastss  0x2d99f(%rip),%ymm8        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,193,92,89,240                   // vmulps        %ymm8,%ymm4,%ymm6
-  .byte  196,226,69,0,37,195,226,2,0         // vpshufb       0x2e2c3(%rip),%ymm7,%ymm4        # 3b020 <_sk_srcover_bgra_8888_sse2_lowp+0x754>
+  .byte  196,226,69,0,37,205,221,2,0         // vpshufb       0x2ddcd(%rip),%ymm7,%ymm4        # 3a860 <_sk_srcover_bgra_8888_sse2_lowp+0x764>
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
   .byte  196,193,92,89,232                   // vmulps        %ymm8,%ymm4,%ymm5
-  .byte  196,226,69,0,37,209,226,2,0         // vpshufb       0x2e2d1(%rip),%ymm7,%ymm4        # 3b040 <_sk_srcover_bgra_8888_sse2_lowp+0x774>
+  .byte  196,226,69,0,37,219,221,2,0         // vpshufb       0x2dddb(%rip),%ymm7,%ymm4        # 3a880 <_sk_srcover_bgra_8888_sse2_lowp+0x784>
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
   .byte  196,193,92,89,224                   // vmulps        %ymm8,%ymm4,%ymm4
   .byte  197,197,114,215,24                  // vpsrld        $0x18,%ymm7,%ymm7
@@ -12590,57 +12457,53 @@
   .byte  196,193,68,89,248                   // vmulps        %ymm8,%ymm7,%ymm7
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,197,239,255                     // vpxor         %ymm7,%ymm7,%ymm7
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,156                             // ja            cd3a <_sk_load_bgra_dst_hsw+0x22>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,135,0,0,0                 // lea           0x87(%rip),%r10        # ce30 <_sk_load_bgra_dst_hsw+0x118>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,162                             // ja            ca70 <_sk_load_bgra_dst_hsw+0x1c>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,136,0,0,0                 // lea           0x88(%rip),%r9        # cb60 <_sk_load_bgra_dst_hsw+0x10c>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,129,121,110,60,152              // vmovd         (%r8,%r11,4),%xmm7
-  .byte  235,128                             // jmp           cd3a <_sk_load_bgra_dst_hsw+0x22>
-  .byte  196,129,121,110,100,152,8           // vmovd         0x8(%r8,%r11,4),%xmm4
+  .byte  196,193,121,110,60,144              // vmovd         (%r8,%rdx,4),%xmm7
+  .byte  235,135                             // jmp           ca70 <_sk_load_bgra_dst_hsw+0x1c>
+  .byte  196,193,121,110,100,144,8           // vmovd         0x8(%r8,%rdx,4),%xmm4
   .byte  196,226,121,89,228                  // vpbroadcastq  %xmm4,%xmm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
   .byte  196,227,85,2,252,4                  // vpblendd      $0x4,%ymm4,%ymm5,%ymm7
-  .byte  196,129,122,126,36,152              // vmovq         (%r8,%r11,4),%xmm4
+  .byte  196,193,122,126,36,144              // vmovq         (%r8,%rdx,4),%xmm4
   .byte  196,227,69,2,252,3                  // vpblendd      $0x3,%ymm4,%ymm7,%ymm7
-  .byte  233,89,255,255,255                  // jmpq          cd3a <_sk_load_bgra_dst_hsw+0x22>
-  .byte  196,129,121,110,100,152,24          // vmovd         0x18(%r8,%r11,4),%xmm4
+  .byte  233,96,255,255,255                  // jmpq          ca70 <_sk_load_bgra_dst_hsw+0x1c>
+  .byte  196,193,121,110,100,144,24          // vmovd         0x18(%r8,%rdx,4),%xmm4
   .byte  196,226,125,89,228                  // vpbroadcastq  %xmm4,%ymm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
   .byte  196,227,85,2,252,64                 // vpblendd      $0x40,%ymm4,%ymm5,%ymm7
   .byte  196,227,125,57,252,1                // vextracti128  $0x1,%ymm7,%xmm4
-  .byte  196,131,89,34,100,152,20,1          // vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,20,1          // vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,227,69,56,252,1                 // vinserti128   $0x1,%xmm4,%ymm7,%ymm7
   .byte  196,227,125,57,252,1                // vextracti128  $0x1,%ymm7,%xmm4
-  .byte  196,131,89,34,100,152,16,0          // vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,16,0          // vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,227,69,56,252,1                 // vinserti128   $0x1,%xmm4,%ymm7,%ymm7
-  .byte  196,129,122,111,36,152              // vmovdqu       (%r8,%r11,4),%xmm4
+  .byte  196,193,122,111,36,144              // vmovdqu       (%r8,%rdx,4),%xmm4
   .byte  196,227,93,2,255,240                // vpblendd      $0xf0,%ymm7,%ymm4,%ymm7
-  .byte  233,10,255,255,255                  // jmpq          cd3a <_sk_load_bgra_dst_hsw+0x22>
-  .byte  130                                 // (bad)
+  .byte  233,17,255,255,255                  // jmpq          ca70 <_sk_load_bgra_dst_hsw+0x1c>
+  .byte  144                                 // nop
+  .byte  129,255,255,255,159,255             // cmp           $0xff9fffff,%edi
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,160,255,255,255,138             // jmpq          *-0x75000001(%rax)
+  .byte  255,137,255,255,255,238             // decl          -0x11000001(%rcx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  239                                 // out           %eax,(%dx)
+  .byte  218,255                             // (bad)
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  219,255                             // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,199                             // inc           %edi
+  .byte  255,198                             // inc           %esi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
-  .byte  177,255                             // mov           $0xff,%cl
+  .byte  176,255                             // mov           $0xff,%al
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
@@ -12666,14 +12529,14 @@
   .byte  197,254,91,192                      // vcvttps2dq    %ymm0,%ymm0
   .byte  197,245,254,192                     // vpaddd        %ymm0,%ymm1,%ymm0
   .byte  196,66,101,144,4,128                // vpgatherdd    %ymm3,(%r8,%ymm0,4),%ymm8
-  .byte  197,189,219,5,189,225,2,0           // vpand         0x2e1bd(%rip),%ymm8,%ymm0        # 3b060 <_sk_srcover_bgra_8888_sse2_lowp+0x794>
+  .byte  197,189,219,5,205,220,2,0           // vpand         0x2dccd(%rip),%ymm8,%ymm0        # 3a8a0 <_sk_srcover_bgra_8888_sse2_lowp+0x7a4>
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,29,68,221,2,0        // vbroadcastss  0x2dd44(%rip),%ymm3        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,226,125,24,29,68,216,2,0        // vbroadcastss  0x2d844(%rip),%ymm3        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  197,252,89,211                      // vmulps        %ymm3,%ymm0,%ymm2
-  .byte  196,226,61,0,5,195,225,2,0          // vpshufb       0x2e1c3(%rip),%ymm8,%ymm0        # 3b080 <_sk_srcover_bgra_8888_sse2_lowp+0x7b4>
+  .byte  196,226,61,0,5,211,220,2,0          // vpshufb       0x2dcd3(%rip),%ymm8,%ymm0        # 3a8c0 <_sk_srcover_bgra_8888_sse2_lowp+0x7c4>
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
   .byte  197,252,89,203                      // vmulps        %ymm3,%ymm0,%ymm1
-  .byte  196,226,61,0,5,210,225,2,0          // vpshufb       0x2e1d2(%rip),%ymm8,%ymm0        # 3b0a0 <_sk_srcover_bgra_8888_sse2_lowp+0x7d4>
+  .byte  196,226,61,0,5,226,220,2,0          // vpshufb       0x2dce2(%rip),%ymm8,%ymm0        # 3a8e0 <_sk_srcover_bgra_8888_sse2_lowp+0x7e4>
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
   .byte  197,252,89,195                      // vmulps        %ymm3,%ymm0,%ymm0
   .byte  196,193,61,114,208,24               // vpsrld        $0x18,%ymm8,%ymm8
@@ -12687,17 +12550,15 @@
 FUNCTION(_sk_store_bgra_hsw)
 _sk_store_bgra_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,60,95,202                       // vmaxps        %ymm2,%ymm8,%ymm9
-  .byte  196,98,125,24,21,106,220,2,0        // vbroadcastss  0x2dc6a(%rip),%ymm10        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,21,112,215,2,0        // vbroadcastss  0x2d770(%rip),%ymm10        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,52,93,202                    // vminps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,29,136,220,2,0        // vbroadcastss  0x2dc88(%rip),%ymm11        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,98,125,24,29,142,215,2,0        // vbroadcastss  0x2d78e(%rip),%ymm11        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   .byte  196,65,52,89,203                    // vmulps        %ymm11,%ymm9,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  197,60,95,225                       // vmaxps        %ymm1,%ymm8,%ymm12
@@ -12719,49 +12580,51 @@
   .byte  196,65,29,235,192                   // vpor          %ymm8,%ymm12,%ymm8
   .byte  196,65,53,235,192                   // vpor          %ymm8,%ymm9,%ymm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           cf93 <_sk_store_bgra_hsw+0xaa>
-  .byte  196,1,126,127,4,152                 // vmovdqu       %ymm8,(%r8,%r11,4)
+  .byte  117,10                              // jne           ccbd <_sk_store_bgra_hsw+0xa4>
+  .byte  196,65,126,127,4,144                // vmovdqu       %ymm8,(%r8,%rdx,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,236                             // ja            cf8f <_sk_store_bgra_hsw+0xa6>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,82,0,0,0                  // lea           0x52(%rip),%r10        # d000 <_sk_store_bgra_hsw+0x117>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,242                             // ja            ccb9 <_sk_store_bgra_hsw+0xa0>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,83,0,0,0                  // lea           0x53(%rip),%r9        # cd24 <_sk_store_bgra_hsw+0x10b>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,1,121,126,4,152                 // vmovd         %xmm8,(%r8,%r11,4)
-  .byte  235,208                             // jmp           cf8f <_sk_store_bgra_hsw+0xa6>
-  .byte  196,3,121,22,68,152,8,2             // vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
-  .byte  196,1,121,214,4,152                 // vmovq         %xmm8,(%r8,%r11,4)
-  .byte  235,192                             // jmp           cf8f <_sk_store_bgra_hsw+0xa6>
+  .byte  196,65,121,126,4,144                // vmovd         %xmm8,(%r8,%rdx,4)
+  .byte  235,215                             // jmp           ccb9 <_sk_store_bgra_hsw+0xa0>
+  .byte  196,67,121,22,68,144,8,2            // vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
+  .byte  196,65,121,214,4,144                // vmovq         %xmm8,(%r8,%rdx,4)
+  .byte  235,199                             // jmp           ccb9 <_sk_store_bgra_hsw+0xa0>
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,24,2            // vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,24,2           // vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,20,1            // vpextrd       $0x1,%xmm9,0x14(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,20,1           // vpextrd       $0x1,%xmm9,0x14(%r8,%rdx,4)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
-  .byte  196,1,121,126,76,152,16             // vmovd         %xmm9,0x10(%r8,%r11,4)
-  .byte  196,1,122,127,4,152                 // vmovdqu       %xmm8,(%r8,%r11,4)
-  .byte  235,143                             // jmp           cf8f <_sk_store_bgra_hsw+0xa6>
-  .byte  183,255                             // mov           $0xff,%bh
+  .byte  196,65,121,126,76,144,16            // vmovd         %xmm9,0x10(%r8,%rdx,4)
+  .byte  196,65,122,127,4,144                // vmovdqu       %xmm8,(%r8,%rdx,4)
+  .byte  235,150                             // jmp           ccb9 <_sk_store_bgra_hsw+0xa0>
+  .byte  144                                 // nop
+  .byte  182,255                             // mov           $0xff,%dh
   .byte  255                                 // (bad)
-  .byte  255,199                             // inc           %edi
+  .byte  255,198                             // inc           %esi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  191,255,255,255,248                 // mov           $0xf8ffffff,%edi
+  .byte  190,255,255,255,247                 // mov           $0xf7ffffff,%esi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  235,255                             // jmp           d011 <_sk_store_bgra_hsw+0x128>
+  .byte  234                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  221,255                             // (bad)
   .byte  255                                 // (bad)
-  .byte  255,207                             // dec           %edi
+  .byte  220,255                             // fdivr         %st,%st(7)
+  .byte  255                                 // (bad)
+  .byte  255,206                             // dec           %esi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -12771,18 +12634,16 @@
 FUNCTION(_sk_load_f16_hsw)
 _sk_load_f16_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,3                        // shl           $0x3,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,101                             // jne           d09d <_sk_load_f16_hsw+0x81>
-  .byte  196,65,121,16,4,192                 // vmovupd       (%r8,%rax,8),%xmm8
-  .byte  196,193,121,16,84,192,16            // vmovupd       0x10(%r8,%rax,8),%xmm2
-  .byte  196,193,121,16,92,192,32            // vmovupd       0x20(%r8,%rax,8),%xmm3
-  .byte  196,65,122,111,76,192,48            // vmovdqu       0x30(%r8,%rax,8),%xmm9
+  .byte  117,101                             // jne           cdbb <_sk_load_f16_hsw+0x7b>
+  .byte  196,65,121,16,4,208                 // vmovupd       (%r8,%rdx,8),%xmm8
+  .byte  196,193,121,16,84,208,16            // vmovupd       0x10(%r8,%rdx,8),%xmm2
+  .byte  196,193,121,16,92,208,32            // vmovupd       0x20(%r8,%rdx,8),%xmm3
+  .byte  196,65,122,111,76,208,48            // vmovdqu       0x30(%r8,%rdx,8),%xmm9
   .byte  197,185,97,194                      // vpunpcklwd    %xmm2,%xmm8,%xmm0
   .byte  197,185,105,210                     // vpunpckhwd    %xmm2,%xmm8,%xmm2
   .byte  196,193,97,97,201                   // vpunpcklwd    %xmm9,%xmm3,%xmm1
@@ -12801,50 +12662,48 @@
   .byte  196,226,125,19,219                  // vcvtph2ps     %xmm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,65,123,16,4,192                 // vmovsd        (%r8,%rax,8),%xmm8
+  .byte  196,65,123,16,4,208                 // vmovsd        (%r8,%rdx,8),%xmm8
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,85                              // je            d103 <_sk_load_f16_hsw+0xe7>
-  .byte  196,65,57,22,68,192,8               // vmovhpd       0x8(%r8,%rax,8),%xmm8,%xmm8
+  .byte  116,85                              // je            ce21 <_sk_load_f16_hsw+0xe1>
+  .byte  196,65,57,22,68,208,8               // vmovhpd       0x8(%r8,%rdx,8),%xmm8,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,72                              // jb            d103 <_sk_load_f16_hsw+0xe7>
-  .byte  196,193,123,16,84,192,16            // vmovsd        0x10(%r8,%rax,8),%xmm2
+  .byte  114,72                              // jb            ce21 <_sk_load_f16_hsw+0xe1>
+  .byte  196,193,123,16,84,208,16            // vmovsd        0x10(%r8,%rdx,8),%xmm2
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  116,72                              // je            d110 <_sk_load_f16_hsw+0xf4>
-  .byte  196,193,105,22,84,192,24            // vmovhpd       0x18(%r8,%rax,8),%xmm2,%xmm2
+  .byte  116,72                              // je            ce2e <_sk_load_f16_hsw+0xee>
+  .byte  196,193,105,22,84,208,24            // vmovhpd       0x18(%r8,%rdx,8),%xmm2,%xmm2
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,59                              // jb            d110 <_sk_load_f16_hsw+0xf4>
-  .byte  196,193,123,16,92,192,32            // vmovsd        0x20(%r8,%rax,8),%xmm3
+  .byte  114,59                              // jb            ce2e <_sk_load_f16_hsw+0xee>
+  .byte  196,193,123,16,92,208,32            // vmovsd        0x20(%r8,%rdx,8),%xmm3
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  15,132,109,255,255,255              // je            d053 <_sk_load_f16_hsw+0x37>
-  .byte  196,193,97,22,92,192,40             // vmovhpd       0x28(%r8,%rax,8),%xmm3,%xmm3
+  .byte  15,132,109,255,255,255              // je            cd71 <_sk_load_f16_hsw+0x31>
+  .byte  196,193,97,22,92,208,40             // vmovhpd       0x28(%r8,%rdx,8),%xmm3,%xmm3
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,130,92,255,255,255               // jb            d053 <_sk_load_f16_hsw+0x37>
-  .byte  196,65,122,126,76,192,48            // vmovq         0x30(%r8,%rax,8),%xmm9
-  .byte  233,80,255,255,255                  // jmpq          d053 <_sk_load_f16_hsw+0x37>
+  .byte  15,130,92,255,255,255               // jb            cd71 <_sk_load_f16_hsw+0x31>
+  .byte  196,65,122,126,76,208,48            // vmovq         0x30(%r8,%rdx,8),%xmm9
+  .byte  233,80,255,255,255                  // jmpq          cd71 <_sk_load_f16_hsw+0x31>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
   .byte  197,233,87,210                      // vxorpd        %xmm2,%xmm2,%xmm2
-  .byte  233,67,255,255,255                  // jmpq          d053 <_sk_load_f16_hsw+0x37>
+  .byte  233,67,255,255,255                  // jmpq          cd71 <_sk_load_f16_hsw+0x31>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
-  .byte  233,58,255,255,255                  // jmpq          d053 <_sk_load_f16_hsw+0x37>
+  .byte  233,58,255,255,255                  // jmpq          cd71 <_sk_load_f16_hsw+0x31>
 
 HIDDEN _sk_load_f16_dst_hsw
 .globl _sk_load_f16_dst_hsw
 FUNCTION(_sk_load_f16_dst_hsw)
 _sk_load_f16_dst_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,3                        // shl           $0x3,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,101                             // jne           d19a <_sk_load_f16_dst_hsw+0x81>
-  .byte  196,65,121,16,4,192                 // vmovupd       (%r8,%rax,8),%xmm8
-  .byte  196,193,121,16,116,192,16           // vmovupd       0x10(%r8,%rax,8),%xmm6
-  .byte  196,193,121,16,124,192,32           // vmovupd       0x20(%r8,%rax,8),%xmm7
-  .byte  196,65,122,111,76,192,48            // vmovdqu       0x30(%r8,%rax,8),%xmm9
+  .byte  117,101                             // jne           ceb2 <_sk_load_f16_dst_hsw+0x7b>
+  .byte  196,65,121,16,4,208                 // vmovupd       (%r8,%rdx,8),%xmm8
+  .byte  196,193,121,16,116,208,16           // vmovupd       0x10(%r8,%rdx,8),%xmm6
+  .byte  196,193,121,16,124,208,32           // vmovupd       0x20(%r8,%rdx,8),%xmm7
+  .byte  196,65,122,111,76,208,48            // vmovdqu       0x30(%r8,%rdx,8),%xmm9
   .byte  197,185,97,230                      // vpunpcklwd    %xmm6,%xmm8,%xmm4
   .byte  197,185,105,246                     // vpunpckhwd    %xmm6,%xmm8,%xmm6
   .byte  196,193,65,97,233                   // vpunpcklwd    %xmm9,%xmm7,%xmm5
@@ -12863,32 +12722,32 @@
   .byte  196,226,125,19,255                  // vcvtph2ps     %xmm7,%ymm7
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,65,123,16,4,192                 // vmovsd        (%r8,%rax,8),%xmm8
+  .byte  196,65,123,16,4,208                 // vmovsd        (%r8,%rdx,8),%xmm8
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,85                              // je            d200 <_sk_load_f16_dst_hsw+0xe7>
-  .byte  196,65,57,22,68,192,8               // vmovhpd       0x8(%r8,%rax,8),%xmm8,%xmm8
+  .byte  116,85                              // je            cf18 <_sk_load_f16_dst_hsw+0xe1>
+  .byte  196,65,57,22,68,208,8               // vmovhpd       0x8(%r8,%rdx,8),%xmm8,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,72                              // jb            d200 <_sk_load_f16_dst_hsw+0xe7>
-  .byte  196,193,123,16,116,192,16           // vmovsd        0x10(%r8,%rax,8),%xmm6
+  .byte  114,72                              // jb            cf18 <_sk_load_f16_dst_hsw+0xe1>
+  .byte  196,193,123,16,116,208,16           // vmovsd        0x10(%r8,%rdx,8),%xmm6
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  116,72                              // je            d20d <_sk_load_f16_dst_hsw+0xf4>
-  .byte  196,193,73,22,116,192,24            // vmovhpd       0x18(%r8,%rax,8),%xmm6,%xmm6
+  .byte  116,72                              // je            cf25 <_sk_load_f16_dst_hsw+0xee>
+  .byte  196,193,73,22,116,208,24            // vmovhpd       0x18(%r8,%rdx,8),%xmm6,%xmm6
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,59                              // jb            d20d <_sk_load_f16_dst_hsw+0xf4>
-  .byte  196,193,123,16,124,192,32           // vmovsd        0x20(%r8,%rax,8),%xmm7
+  .byte  114,59                              // jb            cf25 <_sk_load_f16_dst_hsw+0xee>
+  .byte  196,193,123,16,124,208,32           // vmovsd        0x20(%r8,%rdx,8),%xmm7
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  15,132,109,255,255,255              // je            d150 <_sk_load_f16_dst_hsw+0x37>
-  .byte  196,193,65,22,124,192,40            // vmovhpd       0x28(%r8,%rax,8),%xmm7,%xmm7
+  .byte  15,132,109,255,255,255              // je            ce68 <_sk_load_f16_dst_hsw+0x31>
+  .byte  196,193,65,22,124,208,40            // vmovhpd       0x28(%r8,%rdx,8),%xmm7,%xmm7
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,130,92,255,255,255               // jb            d150 <_sk_load_f16_dst_hsw+0x37>
-  .byte  196,65,122,126,76,192,48            // vmovq         0x30(%r8,%rax,8),%xmm9
-  .byte  233,80,255,255,255                  // jmpq          d150 <_sk_load_f16_dst_hsw+0x37>
+  .byte  15,130,92,255,255,255               // jb            ce68 <_sk_load_f16_dst_hsw+0x31>
+  .byte  196,65,122,126,76,208,48            // vmovq         0x30(%r8,%rdx,8),%xmm9
+  .byte  233,80,255,255,255                  // jmpq          ce68 <_sk_load_f16_dst_hsw+0x31>
   .byte  197,193,87,255                      // vxorpd        %xmm7,%xmm7,%xmm7
   .byte  197,201,87,246                      // vxorpd        %xmm6,%xmm6,%xmm6
-  .byte  233,67,255,255,255                  // jmpq          d150 <_sk_load_f16_dst_hsw+0x37>
+  .byte  233,67,255,255,255                  // jmpq          ce68 <_sk_load_f16_dst_hsw+0x31>
   .byte  197,193,87,255                      // vxorpd        %xmm7,%xmm7,%xmm7
-  .byte  233,58,255,255,255                  // jmpq          d150 <_sk_load_f16_dst_hsw+0x37>
+  .byte  233,58,255,255,255                  // jmpq          ce68 <_sk_load_f16_dst_hsw+0x31>
 
 HIDDEN _sk_gather_f16_hsw
 .globl _sk_gather_f16_hsw
@@ -12942,12 +12801,10 @@
 FUNCTION(_sk_store_f16_hsw)
 _sk_store_f16_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,3                        // shl           $0x3,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  196,195,125,29,192,4                // vcvtps2ph     $0x4,%ymm0,%xmm8
   .byte  196,195,125,29,201,4                // vcvtps2ph     $0x4,%ymm1,%xmm9
   .byte  196,195,125,29,210,4                // vcvtps2ph     $0x4,%ymm2,%xmm10
@@ -12961,50 +12818,48 @@
   .byte  196,65,57,98,205                    // vpunpckldq    %xmm13,%xmm8,%xmm9
   .byte  196,65,57,106,197                   // vpunpckhdq    %xmm13,%xmm8,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,31                              // jne           d34a <_sk_store_f16_hsw+0x7b>
-  .byte  196,65,122,127,28,192               // vmovdqu       %xmm11,(%r8,%rax,8)
-  .byte  196,65,122,127,84,192,16            // vmovdqu       %xmm10,0x10(%r8,%rax,8)
-  .byte  196,65,122,127,76,192,32            // vmovdqu       %xmm9,0x20(%r8,%rax,8)
-  .byte  196,65,122,127,68,192,48            // vmovdqu       %xmm8,0x30(%r8,%rax,8)
+  .byte  117,31                              // jne           d05c <_sk_store_f16_hsw+0x75>
+  .byte  196,65,122,127,28,208               // vmovdqu       %xmm11,(%r8,%rdx,8)
+  .byte  196,65,122,127,84,208,16            // vmovdqu       %xmm10,0x10(%r8,%rdx,8)
+  .byte  196,65,122,127,76,208,32            // vmovdqu       %xmm9,0x20(%r8,%rdx,8)
+  .byte  196,65,122,127,68,208,48            // vmovdqu       %xmm8,0x30(%r8,%rdx,8)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,65,121,214,28,192               // vmovq         %xmm11,(%r8,%rax,8)
+  .byte  196,65,121,214,28,208               // vmovq         %xmm11,(%r8,%rdx,8)
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,240                             // je            d346 <_sk_store_f16_hsw+0x77>
-  .byte  196,65,121,23,92,192,8              // vmovhpd       %xmm11,0x8(%r8,%rax,8)
+  .byte  116,240                             // je            d058 <_sk_store_f16_hsw+0x71>
+  .byte  196,65,121,23,92,208,8              // vmovhpd       %xmm11,0x8(%r8,%rdx,8)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,227                             // jb            d346 <_sk_store_f16_hsw+0x77>
-  .byte  196,65,121,214,84,192,16            // vmovq         %xmm10,0x10(%r8,%rax,8)
-  .byte  116,218                             // je            d346 <_sk_store_f16_hsw+0x77>
-  .byte  196,65,121,23,84,192,24             // vmovhpd       %xmm10,0x18(%r8,%rax,8)
+  .byte  114,227                             // jb            d058 <_sk_store_f16_hsw+0x71>
+  .byte  196,65,121,214,84,208,16            // vmovq         %xmm10,0x10(%r8,%rdx,8)
+  .byte  116,218                             // je            d058 <_sk_store_f16_hsw+0x71>
+  .byte  196,65,121,23,84,208,24             // vmovhpd       %xmm10,0x18(%r8,%rdx,8)
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,205                             // jb            d346 <_sk_store_f16_hsw+0x77>
-  .byte  196,65,121,214,76,192,32            // vmovq         %xmm9,0x20(%r8,%rax,8)
-  .byte  116,196                             // je            d346 <_sk_store_f16_hsw+0x77>
-  .byte  196,65,121,23,76,192,40             // vmovhpd       %xmm9,0x28(%r8,%rax,8)
+  .byte  114,205                             // jb            d058 <_sk_store_f16_hsw+0x71>
+  .byte  196,65,121,214,76,208,32            // vmovq         %xmm9,0x20(%r8,%rdx,8)
+  .byte  116,196                             // je            d058 <_sk_store_f16_hsw+0x71>
+  .byte  196,65,121,23,76,208,40             // vmovhpd       %xmm9,0x28(%r8,%rdx,8)
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,183                             // jb            d346 <_sk_store_f16_hsw+0x77>
-  .byte  196,65,121,214,68,192,48            // vmovq         %xmm8,0x30(%r8,%rax,8)
-  .byte  235,174                             // jmp           d346 <_sk_store_f16_hsw+0x77>
+  .byte  114,183                             // jb            d058 <_sk_store_f16_hsw+0x71>
+  .byte  196,65,121,214,68,208,48            // vmovq         %xmm8,0x30(%r8,%rdx,8)
+  .byte  235,174                             // jmp           d058 <_sk_store_f16_hsw+0x71>
 
 HIDDEN _sk_load_u16_be_hsw
 .globl _sk_load_u16_be_hsw
 FUNCTION(_sk_load_u16_be_hsw)
 _sk_load_u16_be_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
-  .byte  77,1,192                            // add           %r8,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  73,99,193                           // movslq        %r9d,%rax
+  .byte  76,141,4,149,0,0,0,0                // lea           0x0(,%rdx,4),%r8
+  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  77,1,201                            // add           %r9,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,204,0,0,0                    // jne           d48b <_sk_load_u16_be_hsw+0xf3>
-  .byte  196,65,121,16,4,64                  // vmovupd       (%r8,%rax,2),%xmm8
-  .byte  196,193,121,16,84,64,16             // vmovupd       0x10(%r8,%rax,2),%xmm2
-  .byte  196,193,121,16,92,64,32             // vmovupd       0x20(%r8,%rax,2),%xmm3
-  .byte  196,65,122,111,76,64,48             // vmovdqu       0x30(%r8,%rax,2),%xmm9
+  .byte  15,133,204,0,0,0                    // jne           d197 <_sk_load_u16_be_hsw+0xed>
+  .byte  196,1,121,16,4,65                   // vmovupd       (%r9,%r8,2),%xmm8
+  .byte  196,129,121,16,84,65,16             // vmovupd       0x10(%r9,%r8,2),%xmm2
+  .byte  196,129,121,16,92,65,32             // vmovupd       0x20(%r9,%r8,2),%xmm3
+  .byte  196,1,122,111,76,65,48              // vmovdqu       0x30(%r9,%r8,2),%xmm9
   .byte  197,185,97,194                      // vpunpcklwd    %xmm2,%xmm8,%xmm0
   .byte  197,185,105,210                     // vpunpckhwd    %xmm2,%xmm8,%xmm2
   .byte  196,193,97,97,201                   // vpunpcklwd    %xmm9,%xmm3,%xmm1
@@ -13019,7 +12874,7 @@
   .byte  197,241,235,192                     // vpor          %xmm0,%xmm1,%xmm0
   .byte  196,226,125,51,192                  // vpmovzxwd     %xmm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,21,240,215,2,0        // vbroadcastss  0x2d7f0(%rip),%ymm10        # 3ac10 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
+  .byte  196,98,125,24,21,20,211,2,0         // vbroadcastss  0x2d314(%rip),%ymm10        # 3a440 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
   .byte  196,193,124,89,194                  // vmulps        %ymm10,%ymm0,%ymm0
   .byte  197,185,109,202                     // vpunpckhqdq   %xmm2,%xmm8,%xmm1
   .byte  197,233,113,241,8                   // vpsllw        $0x8,%xmm1,%xmm2
@@ -13044,53 +12899,49 @@
   .byte  196,193,100,89,218                  // vmulps        %ymm10,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,65,123,16,4,64                  // vmovsd        (%r8,%rax,2),%xmm8
+  .byte  196,1,123,16,4,65                   // vmovsd        (%r9,%r8,2),%xmm8
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,85                              // je            d4f1 <_sk_load_u16_be_hsw+0x159>
-  .byte  196,65,57,22,68,64,8                // vmovhpd       0x8(%r8,%rax,2),%xmm8,%xmm8
+  .byte  116,85                              // je            d1fd <_sk_load_u16_be_hsw+0x153>
+  .byte  196,1,57,22,68,65,8                 // vmovhpd       0x8(%r9,%r8,2),%xmm8,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,72                              // jb            d4f1 <_sk_load_u16_be_hsw+0x159>
-  .byte  196,193,123,16,84,64,16             // vmovsd        0x10(%r8,%rax,2),%xmm2
+  .byte  114,72                              // jb            d1fd <_sk_load_u16_be_hsw+0x153>
+  .byte  196,129,123,16,84,65,16             // vmovsd        0x10(%r9,%r8,2),%xmm2
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  116,72                              // je            d4fe <_sk_load_u16_be_hsw+0x166>
-  .byte  196,193,105,22,84,64,24             // vmovhpd       0x18(%r8,%rax,2),%xmm2,%xmm2
+  .byte  116,72                              // je            d20a <_sk_load_u16_be_hsw+0x160>
+  .byte  196,129,105,22,84,65,24             // vmovhpd       0x18(%r9,%r8,2),%xmm2,%xmm2
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,59                              // jb            d4fe <_sk_load_u16_be_hsw+0x166>
-  .byte  196,193,123,16,92,64,32             // vmovsd        0x20(%r8,%rax,2),%xmm3
+  .byte  114,59                              // jb            d20a <_sk_load_u16_be_hsw+0x160>
+  .byte  196,129,123,16,92,65,32             // vmovsd        0x20(%r9,%r8,2),%xmm3
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  15,132,6,255,255,255                // je            d3da <_sk_load_u16_be_hsw+0x42>
-  .byte  196,193,97,22,92,64,40              // vmovhpd       0x28(%r8,%rax,2),%xmm3,%xmm3
+  .byte  15,132,6,255,255,255                // je            d0e6 <_sk_load_u16_be_hsw+0x3c>
+  .byte  196,129,97,22,92,65,40              // vmovhpd       0x28(%r9,%r8,2),%xmm3,%xmm3
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,130,245,254,255,255              // jb            d3da <_sk_load_u16_be_hsw+0x42>
-  .byte  196,65,122,126,76,64,48             // vmovq         0x30(%r8,%rax,2),%xmm9
-  .byte  233,233,254,255,255                 // jmpq          d3da <_sk_load_u16_be_hsw+0x42>
+  .byte  15,130,245,254,255,255              // jb            d0e6 <_sk_load_u16_be_hsw+0x3c>
+  .byte  196,1,122,126,76,65,48              // vmovq         0x30(%r9,%r8,2),%xmm9
+  .byte  233,233,254,255,255                 // jmpq          d0e6 <_sk_load_u16_be_hsw+0x3c>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
   .byte  197,233,87,210                      // vxorpd        %xmm2,%xmm2,%xmm2
-  .byte  233,220,254,255,255                 // jmpq          d3da <_sk_load_u16_be_hsw+0x42>
+  .byte  233,220,254,255,255                 // jmpq          d0e6 <_sk_load_u16_be_hsw+0x3c>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
-  .byte  233,211,254,255,255                 // jmpq          d3da <_sk_load_u16_be_hsw+0x42>
+  .byte  233,211,254,255,255                 // jmpq          d0e6 <_sk_load_u16_be_hsw+0x3c>
 
 HIDDEN _sk_load_rgb_u16_be_hsw
 .globl _sk_load_rgb_u16_be_hsw
 FUNCTION(_sk_load_rgb_u16_be_hsw)
 _sk_load_rgb_u16_be_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  76,141,4,82                         // lea           (%rdx,%rdx,2),%r8
   .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
-  .byte  77,1,192                            // add           %r8,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,137,208                          // mov           %rdx,%rax
-  .byte  72,193,224,32                       // shl           $0x20,%rax
-  .byte  72,141,4,64                         // lea           (%rax,%rax,2),%rax
-  .byte  72,193,248,32                       // sar           $0x20,%rax
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  77,1,201                            // add           %r9,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,205,0,0,0                    // jne           d5ff <_sk_load_rgb_u16_be_hsw+0xf8>
-  .byte  196,65,122,111,28,64                // vmovdqu       (%r8,%rax,2),%xmm11
-  .byte  196,193,122,111,92,64,12            // vmovdqu       0xc(%r8,%rax,2),%xmm3
-  .byte  196,193,122,111,84,64,24            // vmovdqu       0x18(%r8,%rax,2),%xmm2
-  .byte  196,193,122,111,68,64,32            // vmovdqu       0x20(%r8,%rax,2),%xmm0
+  .byte  15,133,205,0,0,0                    // jne           d2fd <_sk_load_rgb_u16_be_hsw+0xea>
+  .byte  196,1,122,111,28,65                 // vmovdqu       (%r9,%r8,2),%xmm11
+  .byte  196,129,122,111,92,65,12            // vmovdqu       0xc(%r9,%r8,2),%xmm3
+  .byte  196,129,122,111,84,65,24            // vmovdqu       0x18(%r9,%r8,2),%xmm2
+  .byte  196,129,122,111,68,65,32            // vmovdqu       0x20(%r9,%r8,2),%xmm0
   .byte  197,249,115,216,4                   // vpsrldq       $0x4,%xmm0,%xmm0
   .byte  196,193,57,115,219,6                // vpsrldq       $0x6,%xmm11,%xmm8
   .byte  197,169,115,219,6                   // vpsrldq       $0x6,%xmm3,%xmm10
@@ -13111,7 +12962,7 @@
   .byte  197,241,235,192                     // vpor          %xmm0,%xmm1,%xmm0
   .byte  196,226,125,51,192                  // vpmovzxwd     %xmm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,13,95,214,2,0         // vbroadcastss  0x2d65f(%rip),%ymm9        # 3ac10 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
+  .byte  196,98,125,24,13,145,209,2,0        // vbroadcastss  0x2d191(%rip),%ymm9        # 3a440 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
   .byte  196,193,124,89,193                  // vmulps        %ymm9,%ymm0,%ymm0
   .byte  197,185,109,203                     // vpunpckhqdq   %xmm3,%xmm8,%xmm1
   .byte  197,225,113,241,8                   // vpsllw        $0x8,%xmm1,%xmm3
@@ -13127,87 +12978,85 @@
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
   .byte  196,193,108,89,209                  // vmulps        %ymm9,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,127,213,2,0       // vbroadcastss  0x2d57f(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,177,208,2,0       // vbroadcastss  0x2d0b1(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,193,121,110,4,64                // vmovd         (%r8,%rax,2),%xmm0
+  .byte  196,129,121,110,4,65                // vmovd         (%r9,%r8,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
-  .byte  196,65,121,196,92,64,4,2            // vpinsrw       $0x2,0x4(%r8,%rax,2),%xmm0,%xmm11
+  .byte  196,1,121,196,92,65,4,2             // vpinsrw       $0x2,0x4(%r9,%r8,2),%xmm0,%xmm11
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,31                              // jne           d637 <_sk_load_rgb_u16_be_hsw+0x130>
+  .byte  117,31                              // jne           d335 <_sk_load_rgb_u16_be_hsw+0x122>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
   .byte  197,225,239,219                     // vpxor         %xmm3,%xmm3,%xmm3
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  233,48,255,255,255                  // jmpq          d567 <_sk_load_rgb_u16_be_hsw+0x60>
-  .byte  196,193,121,110,68,64,6             // vmovd         0x6(%r8,%rax,2),%xmm0
+  .byte  233,48,255,255,255                  // jmpq          d265 <_sk_load_rgb_u16_be_hsw+0x52>
+  .byte  196,129,121,110,68,65,6             // vmovd         0x6(%r9,%r8,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
-  .byte  196,65,121,196,68,64,10,2           // vpinsrw       $0x2,0xa(%r8,%rax,2),%xmm0,%xmm8
+  .byte  196,1,121,196,68,65,10,2            // vpinsrw       $0x2,0xa(%r9,%r8,2),%xmm0,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,48                              // jb            d681 <_sk_load_rgb_u16_be_hsw+0x17a>
-  .byte  196,193,121,110,68,64,12            // vmovd         0xc(%r8,%rax,2),%xmm0
+  .byte  114,48                              // jb            d37f <_sk_load_rgb_u16_be_hsw+0x16c>
+  .byte  196,129,121,110,68,65,12            // vmovd         0xc(%r9,%r8,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
-  .byte  196,193,121,196,92,64,16,2          // vpinsrw       $0x2,0x10(%r8,%rax,2),%xmm0,%xmm3
+  .byte  196,129,121,196,92,65,16,2          // vpinsrw       $0x2,0x10(%r9,%r8,2),%xmm0,%xmm3
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  117,48                              // jne           d69b <_sk_load_rgb_u16_be_hsw+0x194>
+  .byte  117,48                              // jne           d399 <_sk_load_rgb_u16_be_hsw+0x186>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
-  .byte  233,230,254,255,255                 // jmpq          d567 <_sk_load_rgb_u16_be_hsw+0x60>
+  .byte  233,230,254,255,255                 // jmpq          d265 <_sk_load_rgb_u16_be_hsw+0x52>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
   .byte  197,225,239,219                     // vpxor         %xmm3,%xmm3,%xmm3
-  .byte  233,204,254,255,255                 // jmpq          d567 <_sk_load_rgb_u16_be_hsw+0x60>
-  .byte  196,193,121,110,68,64,18            // vmovd         0x12(%r8,%rax,2),%xmm0
+  .byte  233,204,254,255,255                 // jmpq          d265 <_sk_load_rgb_u16_be_hsw+0x52>
+  .byte  196,129,121,110,68,65,18            // vmovd         0x12(%r9,%r8,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
-  .byte  196,65,121,196,84,64,22,2           // vpinsrw       $0x2,0x16(%r8,%rax,2),%xmm0,%xmm10
+  .byte  196,1,121,196,84,65,22,2            // vpinsrw       $0x2,0x16(%r9,%r8,2),%xmm0,%xmm10
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,39                              // jb            d6dc <_sk_load_rgb_u16_be_hsw+0x1d5>
-  .byte  196,193,121,110,68,64,24            // vmovd         0x18(%r8,%rax,2),%xmm0
+  .byte  114,39                              // jb            d3da <_sk_load_rgb_u16_be_hsw+0x1c7>
+  .byte  196,129,121,110,68,65,24            // vmovd         0x18(%r9,%r8,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
-  .byte  196,193,121,196,84,64,28,2          // vpinsrw       $0x2,0x1c(%r8,%rax,2),%xmm0,%xmm2
+  .byte  196,129,121,196,84,65,28,2          // vpinsrw       $0x2,0x1c(%r9,%r8,2),%xmm0,%xmm2
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  117,30                              // jne           d6ed <_sk_load_rgb_u16_be_hsw+0x1e6>
+  .byte  117,30                              // jne           d3eb <_sk_load_rgb_u16_be_hsw+0x1d8>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
-  .byte  233,139,254,255,255                 // jmpq          d567 <_sk_load_rgb_u16_be_hsw+0x60>
+  .byte  233,139,254,255,255                 // jmpq          d265 <_sk_load_rgb_u16_be_hsw+0x52>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
-  .byte  233,122,254,255,255                 // jmpq          d567 <_sk_load_rgb_u16_be_hsw+0x60>
-  .byte  196,193,121,110,68,64,30            // vmovd         0x1e(%r8,%rax,2),%xmm0
+  .byte  233,122,254,255,255                 // jmpq          d265 <_sk_load_rgb_u16_be_hsw+0x52>
+  .byte  196,129,121,110,68,65,30            // vmovd         0x1e(%r9,%r8,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
-  .byte  196,193,121,196,76,64,34,2          // vpinsrw       $0x2,0x22(%r8,%rax,2),%xmm0,%xmm1
+  .byte  196,129,121,196,76,65,34,2          // vpinsrw       $0x2,0x22(%r9,%r8,2),%xmm0,%xmm1
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,25                              // jb            d720 <_sk_load_rgb_u16_be_hsw+0x219>
-  .byte  196,193,121,110,68,64,36            // vmovd         0x24(%r8,%rax,2),%xmm0
+  .byte  114,25                              // jb            d41e <_sk_load_rgb_u16_be_hsw+0x20b>
+  .byte  196,129,121,110,68,65,36            // vmovd         0x24(%r9,%r8,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
-  .byte  196,193,121,196,68,64,40,2          // vpinsrw       $0x2,0x28(%r8,%rax,2),%xmm0,%xmm0
-  .byte  233,71,254,255,255                  // jmpq          d567 <_sk_load_rgb_u16_be_hsw+0x60>
+  .byte  196,129,121,196,68,65,40,2          // vpinsrw       $0x2,0x28(%r9,%r8,2),%xmm0,%xmm0
+  .byte  233,71,254,255,255                  // jmpq          d265 <_sk_load_rgb_u16_be_hsw+0x52>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  233,62,254,255,255                  // jmpq          d567 <_sk_load_rgb_u16_be_hsw+0x60>
+  .byte  233,62,254,255,255                  // jmpq          d265 <_sk_load_rgb_u16_be_hsw+0x52>
 
 HIDDEN _sk_store_u16_be_hsw
 .globl _sk_store_u16_be_hsw
 FUNCTION(_sk_store_u16_be_hsw)
 _sk_store_u16_be_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
-  .byte  77,1,192                            // add           %r8,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  73,99,193                           // movslq        %r9d,%rax
+  .byte  76,141,4,149,0,0,0,0                // lea           0x0(,%rdx,4),%r8
+  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  77,1,201                            // add           %r9,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,60,95,200                       // vmaxps        %ymm0,%ymm8,%ymm9
-  .byte  196,98,125,24,21,35,212,2,0         // vbroadcastss  0x2d423(%rip),%ymm10        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,21,91,207,2,0         // vbroadcastss  0x2cf5b(%rip),%ymm10        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,52,93,202                    // vminps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,29,49,213,2,0         // vbroadcastss  0x2d531(%rip),%ymm11        # 3ac98 <_sk_srcover_bgra_8888_sse2_lowp+0x3cc>
+  .byte  196,98,125,24,29,105,208,2,0        // vbroadcastss  0x2d069(%rip),%ymm11        # 3a4c8 <_sk_srcover_bgra_8888_sse2_lowp+0x3cc>
   .byte  196,65,52,89,203                    // vmulps        %ymm11,%ymm9,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  196,67,125,25,204,1                 // vextractf128  $0x1,%ymm9,%xmm12
@@ -13251,31 +13100,31 @@
   .byte  196,65,25,98,200                    // vpunpckldq    %xmm8,%xmm12,%xmm9
   .byte  196,65,25,106,192                   // vpunpckhdq    %xmm8,%xmm12,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,31                              // jne           d866 <_sk_store_u16_be_hsw+0x13d>
-  .byte  196,65,122,127,28,64                // vmovdqu       %xmm11,(%r8,%rax,2)
-  .byte  196,65,122,127,84,64,16             // vmovdqu       %xmm10,0x10(%r8,%rax,2)
-  .byte  196,65,122,127,76,64,32             // vmovdqu       %xmm9,0x20(%r8,%rax,2)
-  .byte  196,65,122,127,68,64,48             // vmovdqu       %xmm8,0x30(%r8,%rax,2)
+  .byte  117,31                              // jne           d55e <_sk_store_u16_be_hsw+0x137>
+  .byte  196,1,122,127,28,65                 // vmovdqu       %xmm11,(%r9,%r8,2)
+  .byte  196,1,122,127,84,65,16              // vmovdqu       %xmm10,0x10(%r9,%r8,2)
+  .byte  196,1,122,127,76,65,32              // vmovdqu       %xmm9,0x20(%r9,%r8,2)
+  .byte  196,1,122,127,68,65,48              // vmovdqu       %xmm8,0x30(%r9,%r8,2)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,65,121,214,28,64                // vmovq         %xmm11,(%r8,%rax,2)
+  .byte  196,1,121,214,28,65                 // vmovq         %xmm11,(%r9,%r8,2)
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,240                             // je            d862 <_sk_store_u16_be_hsw+0x139>
-  .byte  196,65,121,23,92,64,8               // vmovhpd       %xmm11,0x8(%r8,%rax,2)
+  .byte  116,240                             // je            d55a <_sk_store_u16_be_hsw+0x133>
+  .byte  196,1,121,23,92,65,8                // vmovhpd       %xmm11,0x8(%r9,%r8,2)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,227                             // jb            d862 <_sk_store_u16_be_hsw+0x139>
-  .byte  196,65,121,214,84,64,16             // vmovq         %xmm10,0x10(%r8,%rax,2)
-  .byte  116,218                             // je            d862 <_sk_store_u16_be_hsw+0x139>
-  .byte  196,65,121,23,84,64,24              // vmovhpd       %xmm10,0x18(%r8,%rax,2)
+  .byte  114,227                             // jb            d55a <_sk_store_u16_be_hsw+0x133>
+  .byte  196,1,121,214,84,65,16              // vmovq         %xmm10,0x10(%r9,%r8,2)
+  .byte  116,218                             // je            d55a <_sk_store_u16_be_hsw+0x133>
+  .byte  196,1,121,23,84,65,24               // vmovhpd       %xmm10,0x18(%r9,%r8,2)
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,205                             // jb            d862 <_sk_store_u16_be_hsw+0x139>
-  .byte  196,65,121,214,76,64,32             // vmovq         %xmm9,0x20(%r8,%rax,2)
-  .byte  116,196                             // je            d862 <_sk_store_u16_be_hsw+0x139>
-  .byte  196,65,121,23,76,64,40              // vmovhpd       %xmm9,0x28(%r8,%rax,2)
+  .byte  114,205                             // jb            d55a <_sk_store_u16_be_hsw+0x133>
+  .byte  196,1,121,214,76,65,32              // vmovq         %xmm9,0x20(%r9,%r8,2)
+  .byte  116,196                             // je            d55a <_sk_store_u16_be_hsw+0x133>
+  .byte  196,1,121,23,76,65,40               // vmovhpd       %xmm9,0x28(%r9,%r8,2)
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,183                             // jb            d862 <_sk_store_u16_be_hsw+0x139>
-  .byte  196,65,121,214,68,64,48             // vmovq         %xmm8,0x30(%r8,%rax,2)
-  .byte  235,174                             // jmp           d862 <_sk_store_u16_be_hsw+0x139>
+  .byte  114,183                             // jb            d55a <_sk_store_u16_be_hsw+0x133>
+  .byte  196,1,121,214,68,65,48              // vmovq         %xmm8,0x30(%r9,%r8,2)
+  .byte  235,174                             // jmp           d55a <_sk_store_u16_be_hsw+0x133>
 
 HIDDEN _sk_load_f32_hsw
 .globl _sk_load_f32_hsw
@@ -13284,20 +13133,18 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,253,87,192                      // vxorpd        %ymm0,%ymm0,%ymm0
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,135,97,1,0,0                     // ja            da25 <_sk_load_f32_hsw+0x171>
+  .byte  15,135,91,1,0,0                     // ja            d717 <_sk_load_f32_hsw+0x16b>
   .byte  72,131,236,24                       // sub           $0x18,%rsp
   .byte  197,253,17,100,36,128               // vmovupd       %ymm4,-0x80(%rsp)
   .byte  197,253,17,108,36,160               // vmovupd       %ymm5,-0x60(%rsp)
   .byte  197,253,17,116,36,192               // vmovupd       %ymm6,-0x40(%rsp)
   .byte  197,253,17,124,36,224               // vmovupd       %ymm7,-0x20(%rsp)
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
-  .byte  73,193,224,2                        // shl           $0x2,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  77,99,201                           // movslq        %r9d,%r9
-  .byte  76,141,21,48,1,0,0                  // lea           0x130(%rip),%r10        # da34 <_sk_load_f32_hsw+0x180>
+  .byte  76,141,4,149,0,0,0,0                // lea           0x0(,%rdx,4),%r8
+  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  73,193,225,2                        // shl           $0x2,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
+  .byte  76,141,21,50,1,0,0                  // lea           0x132(%rip),%r10        # d728 <_sk_load_f32_hsw+0x17c>
   .byte  73,99,4,186                         // movslq        (%r10,%rdi,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  197,221,87,228                      // vxorpd        %ymm4,%ymm4,%ymm4
@@ -13316,31 +13163,31 @@
   .byte  196,65,45,87,210                    // vxorpd        %ymm10,%ymm10,%ymm10
   .byte  197,197,87,255                      // vxorpd        %ymm7,%ymm7,%ymm7
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,129,121,16,68,136,112           // vmovupd       0x70(%r8,%r9,4),%xmm0
+  .byte  196,129,121,16,68,129,112           // vmovupd       0x70(%r9,%r8,4),%xmm0
   .byte  196,227,125,6,192,40                // vperm2f128    $0x28,%ymm0,%ymm0,%ymm0
-  .byte  196,129,121,16,76,136,96            // vmovupd       0x60(%r8,%r9,4),%xmm1
+  .byte  196,129,121,16,76,129,96            // vmovupd       0x60(%r9,%r8,4),%xmm1
   .byte  196,227,125,6,225,40                // vperm2f128    $0x28,%ymm1,%ymm0,%ymm4
-  .byte  196,129,121,16,76,136,80            // vmovupd       0x50(%r8,%r9,4),%xmm1
+  .byte  196,129,121,16,76,129,80            // vmovupd       0x50(%r9,%r8,4),%xmm1
   .byte  196,227,125,6,209,40                // vperm2f128    $0x28,%ymm1,%ymm0,%ymm2
   .byte  197,125,40,204                      // vmovapd       %ymm4,%ymm9
-  .byte  196,129,121,16,76,136,64            // vmovupd       0x40(%r8,%r9,4),%xmm1
+  .byte  196,129,121,16,76,129,64            // vmovupd       0x40(%r9,%r8,4),%xmm1
   .byte  196,99,125,6,193,40                 // vperm2f128    $0x28,%ymm1,%ymm0,%ymm8
   .byte  196,65,125,40,217                   // vmovapd       %ymm9,%ymm11
   .byte  197,125,40,226                      // vmovapd       %ymm2,%ymm12
-  .byte  196,129,121,16,76,136,48            // vmovupd       0x30(%r8,%r9,4),%xmm1
+  .byte  196,129,121,16,76,129,48            // vmovupd       0x30(%r9,%r8,4),%xmm1
   .byte  196,227,117,13,192,12               // vblendpd      $0xc,%ymm0,%ymm1,%ymm0
   .byte  196,65,125,40,243                   // vmovapd       %ymm11,%ymm14
   .byte  197,125,41,230                      // vmovapd       %ymm12,%ymm6
   .byte  196,65,125,40,248                   // vmovapd       %ymm8,%ymm15
-  .byte  196,129,121,16,76,136,32            // vmovupd       0x20(%r8,%r9,4),%xmm1
+  .byte  196,129,121,16,76,129,32            // vmovupd       0x20(%r9,%r8,4),%xmm1
   .byte  196,195,117,13,206,12               // vblendpd      $0xc,%ymm14,%ymm1,%ymm1
   .byte  197,125,40,238                      // vmovapd       %ymm6,%ymm13
   .byte  197,125,41,253                      // vmovapd       %ymm15,%ymm5
-  .byte  196,129,121,16,84,136,16            // vmovupd       0x10(%r8,%r9,4),%xmm2
+  .byte  196,129,121,16,84,129,16            // vmovupd       0x10(%r9,%r8,4),%xmm2
   .byte  196,67,109,13,213,12                // vblendpd      $0xc,%ymm13,%ymm2,%ymm10
   .byte  197,253,40,217                      // vmovapd       %ymm1,%ymm3
   .byte  197,253,40,253                      // vmovapd       %ymm5,%ymm7
-  .byte  196,129,121,16,12,136               // vmovupd       (%r8,%r9,4),%xmm1
+  .byte  196,129,121,16,12,129               // vmovupd       (%r9,%r8,4),%xmm1
   .byte  196,227,117,13,207,12               // vblendpd      $0xc,%ymm7,%ymm1,%ymm1
   .byte  197,252,16,124,36,224               // vmovups       -0x20(%rsp),%ymm7
   .byte  197,252,16,116,36,192               // vmovups       -0x40(%rsp),%ymm6
@@ -13360,21 +13207,19 @@
   .byte  197,229,87,219                      // vxorpd        %ymm3,%ymm3,%ymm3
   .byte  196,65,45,87,210                    // vxorpd        %ymm10,%ymm10,%ymm10
   .byte  197,245,87,201                      // vxorpd        %ymm1,%ymm1,%ymm1
-  .byte  235,203                             // jmp           d9ff <_sk_load_f32_hsw+0x14b>
-  .byte  29,255,255,255,163                  // sbb           $0xa3ffffff,%eax
+  .byte  235,203                             // jmp           d6f1 <_sk_load_f32_hsw+0x145>
+  .byte  102,144                             // xchg          %ax,%ax
+  .byte  27,255                              // sbb           %edi,%edi
+  .byte  255                                 // (bad)
+  .byte  255,161,255,255,255,140             // jmpq          *-0x73000001(%rcx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,142,255,255,255,121             // decl          0x79ffffff(%rsi)
+  .byte  255,119,255                         // pushq         -0x1(%rdi)
   .byte  255                                 // (bad)
+  .byte  255,92,255,255                      // lcall         *-0x1(%rdi,%rdi,8)
+  .byte  255,70,255                          // incl          -0x1(%rsi)
   .byte  255                                 // (bad)
-  .byte  255,94,255                          // lcall         *-0x1(%rsi)
-  .byte  255                                 // (bad)
-  .byte  255,72,255                          // decl          -0x1(%rax)
-  .byte  255                                 // (bad)
-  .byte  255,55                              // pushq         (%rdi)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,42                              // ljmp          *(%rdx)
+  .byte  255,53,255,255,255,40               // pushq         0x28ffffff(%rip)        # 2900d744 <_sk_srcover_bgra_8888_sse2_lowp+0x28fd3648>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -13386,20 +13231,18 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,221,87,228                      // vxorpd        %ymm4,%ymm4,%ymm4
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,135,97,1,0,0                     // ja            dbc5 <_sk_load_f32_dst_hsw+0x171>
+  .byte  15,135,91,1,0,0                     // ja            d8b3 <_sk_load_f32_dst_hsw+0x16b>
   .byte  72,131,236,24                       // sub           $0x18,%rsp
   .byte  197,253,17,68,36,128                // vmovupd       %ymm0,-0x80(%rsp)
   .byte  197,253,17,76,36,160                // vmovupd       %ymm1,-0x60(%rsp)
   .byte  197,253,17,84,36,192                // vmovupd       %ymm2,-0x40(%rsp)
   .byte  197,253,17,92,36,224                // vmovupd       %ymm3,-0x20(%rsp)
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
-  .byte  73,193,224,2                        // shl           $0x2,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  77,99,201                           // movslq        %r9d,%r9
-  .byte  76,141,21,48,1,0,0                  // lea           0x130(%rip),%r10        # dbd4 <_sk_load_f32_dst_hsw+0x180>
+  .byte  76,141,4,149,0,0,0,0                // lea           0x0(,%rdx,4),%r8
+  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  73,193,225,2                        // shl           $0x2,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
+  .byte  76,141,21,50,1,0,0                  // lea           0x132(%rip),%r10        # d8c4 <_sk_load_f32_dst_hsw+0x17c>
   .byte  73,99,4,186                         // movslq        (%r10,%rdi,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  197,253,87,192                      // vxorpd        %ymm0,%ymm0,%ymm0
@@ -13418,31 +13261,31 @@
   .byte  196,65,45,87,210                    // vxorpd        %ymm10,%ymm10,%ymm10
   .byte  197,229,87,219                      // vxorpd        %ymm3,%ymm3,%ymm3
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,129,121,16,68,136,112           // vmovupd       0x70(%r8,%r9,4),%xmm0
+  .byte  196,129,121,16,68,129,112           // vmovupd       0x70(%r9,%r8,4),%xmm0
   .byte  196,227,125,6,224,40                // vperm2f128    $0x28,%ymm0,%ymm0,%ymm4
-  .byte  196,129,121,16,68,136,96            // vmovupd       0x60(%r8,%r9,4),%xmm0
+  .byte  196,129,121,16,68,129,96            // vmovupd       0x60(%r9,%r8,4),%xmm0
   .byte  196,227,125,6,192,40                // vperm2f128    $0x28,%ymm0,%ymm0,%ymm0
-  .byte  196,129,121,16,76,136,80            // vmovupd       0x50(%r8,%r9,4),%xmm1
+  .byte  196,129,121,16,76,129,80            // vmovupd       0x50(%r9,%r8,4),%xmm1
   .byte  196,227,125,6,241,40                // vperm2f128    $0x28,%ymm1,%ymm0,%ymm6
   .byte  197,125,40,200                      // vmovapd       %ymm0,%ymm9
-  .byte  196,129,121,16,68,136,64            // vmovupd       0x40(%r8,%r9,4),%xmm0
+  .byte  196,129,121,16,68,129,64            // vmovupd       0x40(%r9,%r8,4),%xmm0
   .byte  196,99,125,6,192,40                 // vperm2f128    $0x28,%ymm0,%ymm0,%ymm8
   .byte  196,65,125,40,217                   // vmovapd       %ymm9,%ymm11
   .byte  197,125,40,230                      // vmovapd       %ymm6,%ymm12
-  .byte  196,129,121,16,68,136,48            // vmovupd       0x30(%r8,%r9,4),%xmm0
+  .byte  196,129,121,16,68,129,48            // vmovupd       0x30(%r9,%r8,4),%xmm0
   .byte  196,227,125,13,228,12               // vblendpd      $0xc,%ymm4,%ymm0,%ymm4
   .byte  196,65,125,40,243                   // vmovapd       %ymm11,%ymm14
   .byte  197,125,41,226                      // vmovapd       %ymm12,%ymm2
   .byte  196,65,125,40,248                   // vmovapd       %ymm8,%ymm15
-  .byte  196,129,121,16,68,136,32            // vmovupd       0x20(%r8,%r9,4),%xmm0
+  .byte  196,129,121,16,68,129,32            // vmovupd       0x20(%r9,%r8,4),%xmm0
   .byte  196,195,125,13,238,12               // vblendpd      $0xc,%ymm14,%ymm0,%ymm5
   .byte  197,125,40,234                      // vmovapd       %ymm2,%ymm13
   .byte  197,125,41,249                      // vmovapd       %ymm15,%ymm1
-  .byte  196,129,121,16,68,136,16            // vmovupd       0x10(%r8,%r9,4),%xmm0
+  .byte  196,129,121,16,68,129,16            // vmovupd       0x10(%r9,%r8,4),%xmm0
   .byte  196,67,125,13,213,12                // vblendpd      $0xc,%ymm13,%ymm0,%ymm10
   .byte  197,253,40,253                      // vmovapd       %ymm5,%ymm7
   .byte  197,253,40,217                      // vmovapd       %ymm1,%ymm3
-  .byte  196,129,121,16,4,136                // vmovupd       (%r8,%r9,4),%xmm0
+  .byte  196,129,121,16,4,129                // vmovupd       (%r9,%r8,4),%xmm0
   .byte  196,227,125,13,235,12               // vblendpd      $0xc,%ymm3,%ymm0,%ymm5
   .byte  197,252,16,92,36,224                // vmovups       -0x20(%rsp),%ymm3
   .byte  197,252,16,84,36,192                // vmovups       -0x40(%rsp),%ymm2
@@ -13462,21 +13305,19 @@
   .byte  197,197,87,255                      // vxorpd        %ymm7,%ymm7,%ymm7
   .byte  196,65,45,87,210                    // vxorpd        %ymm10,%ymm10,%ymm10
   .byte  197,213,87,237                      // vxorpd        %ymm5,%ymm5,%ymm5
-  .byte  235,203                             // jmp           db9f <_sk_load_f32_dst_hsw+0x14b>
-  .byte  29,255,255,255,163                  // sbb           $0xa3ffffff,%eax
+  .byte  235,203                             // jmp           d88d <_sk_load_f32_dst_hsw+0x145>
+  .byte  102,144                             // xchg          %ax,%ax
+  .byte  27,255                              // sbb           %edi,%edi
+  .byte  255                                 // (bad)
+  .byte  255,161,255,255,255,140             // jmpq          *-0x73000001(%rcx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,142,255,255,255,121             // decl          0x79ffffff(%rsi)
+  .byte  255,119,255                         // pushq         -0x1(%rdi)
   .byte  255                                 // (bad)
+  .byte  255,92,255,255                      // lcall         *-0x1(%rdi,%rdi,8)
+  .byte  255,70,255                          // incl          -0x1(%rsi)
   .byte  255                                 // (bad)
-  .byte  255,94,255                          // lcall         *-0x1(%rsi)
-  .byte  255                                 // (bad)
-  .byte  255,72,255                          // decl          -0x1(%rax)
-  .byte  255                                 // (bad)
-  .byte  255,55                              // pushq         (%rdi)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,42                              // ljmp          *(%rdx)
+  .byte  255,53,255,255,255,40               // pushq         0x28ffffff(%rip)        # 2900d8e0 <_sk_srcover_bgra_8888_sse2_lowp+0x28fd37e4>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -13486,13 +13327,11 @@
 FUNCTION(_sk_store_f32_hsw)
 _sk_store_f32_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
-  .byte  73,193,224,2                        // shl           $0x2,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  73,99,193                           // movslq        %r9d,%rax
+  .byte  76,141,4,149,0,0,0,0                // lea           0x0(,%rdx,4),%r8
+  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  73,193,225,2                        // shl           $0x2,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
   .byte  197,124,20,193                      // vunpcklps     %ymm1,%ymm0,%ymm8
   .byte  197,124,21,217                      // vunpckhps     %ymm1,%ymm0,%ymm11
   .byte  197,108,20,203                      // vunpcklps     %ymm3,%ymm2,%ymm9
@@ -13502,35 +13341,35 @@
   .byte  196,65,37,20,196                    // vunpcklpd     %ymm12,%ymm11,%ymm8
   .byte  196,65,37,21,220                    // vunpckhpd     %ymm12,%ymm11,%ymm11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,55                              // jne           dc73 <_sk_store_f32_hsw+0x7f>
+  .byte  117,55                              // jne           d95d <_sk_store_f32_hsw+0x79>
   .byte  196,67,45,24,225,1                  // vinsertf128   $0x1,%xmm9,%ymm10,%ymm12
   .byte  196,67,61,24,235,1                  // vinsertf128   $0x1,%xmm11,%ymm8,%ymm13
   .byte  196,67,45,6,201,49                  // vperm2f128    $0x31,%ymm9,%ymm10,%ymm9
   .byte  196,67,61,6,195,49                  // vperm2f128    $0x31,%ymm11,%ymm8,%ymm8
-  .byte  196,65,125,17,36,128                // vmovupd       %ymm12,(%r8,%rax,4)
-  .byte  196,65,125,17,108,128,32            // vmovupd       %ymm13,0x20(%r8,%rax,4)
-  .byte  196,65,125,17,76,128,64             // vmovupd       %ymm9,0x40(%r8,%rax,4)
-  .byte  196,65,125,17,68,128,96             // vmovupd       %ymm8,0x60(%r8,%rax,4)
+  .byte  196,1,125,17,36,129                 // vmovupd       %ymm12,(%r9,%r8,4)
+  .byte  196,1,125,17,108,129,32             // vmovupd       %ymm13,0x20(%r9,%r8,4)
+  .byte  196,1,125,17,76,129,64              // vmovupd       %ymm9,0x40(%r9,%r8,4)
+  .byte  196,1,125,17,68,129,96              // vmovupd       %ymm8,0x60(%r9,%r8,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,65,121,17,20,128                // vmovupd       %xmm10,(%r8,%rax,4)
+  .byte  196,1,121,17,20,129                 // vmovupd       %xmm10,(%r9,%r8,4)
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,240                             // je            dc6f <_sk_store_f32_hsw+0x7b>
-  .byte  196,65,121,17,76,128,16             // vmovupd       %xmm9,0x10(%r8,%rax,4)
+  .byte  116,240                             // je            d959 <_sk_store_f32_hsw+0x75>
+  .byte  196,1,121,17,76,129,16              // vmovupd       %xmm9,0x10(%r9,%r8,4)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,227                             // jb            dc6f <_sk_store_f32_hsw+0x7b>
-  .byte  196,65,121,17,68,128,32             // vmovupd       %xmm8,0x20(%r8,%rax,4)
-  .byte  116,218                             // je            dc6f <_sk_store_f32_hsw+0x7b>
-  .byte  196,65,121,17,92,128,48             // vmovupd       %xmm11,0x30(%r8,%rax,4)
+  .byte  114,227                             // jb            d959 <_sk_store_f32_hsw+0x75>
+  .byte  196,1,121,17,68,129,32              // vmovupd       %xmm8,0x20(%r9,%r8,4)
+  .byte  116,218                             // je            d959 <_sk_store_f32_hsw+0x75>
+  .byte  196,1,121,17,92,129,48              // vmovupd       %xmm11,0x30(%r9,%r8,4)
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,205                             // jb            dc6f <_sk_store_f32_hsw+0x7b>
-  .byte  196,67,125,25,84,128,64,1           // vextractf128  $0x1,%ymm10,0x40(%r8,%rax,4)
-  .byte  116,195                             // je            dc6f <_sk_store_f32_hsw+0x7b>
-  .byte  196,67,125,25,76,128,80,1           // vextractf128  $0x1,%ymm9,0x50(%r8,%rax,4)
+  .byte  114,205                             // jb            d959 <_sk_store_f32_hsw+0x75>
+  .byte  196,3,125,25,84,129,64,1            // vextractf128  $0x1,%ymm10,0x40(%r9,%r8,4)
+  .byte  116,195                             // je            d959 <_sk_store_f32_hsw+0x75>
+  .byte  196,3,125,25,76,129,80,1            // vextractf128  $0x1,%ymm9,0x50(%r9,%r8,4)
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,181                             // jb            dc6f <_sk_store_f32_hsw+0x7b>
-  .byte  196,67,125,25,68,128,96,1           // vextractf128  $0x1,%ymm8,0x60(%r8,%rax,4)
-  .byte  235,171                             // jmp           dc6f <_sk_store_f32_hsw+0x7b>
+  .byte  114,181                             // jb            d959 <_sk_store_f32_hsw+0x75>
+  .byte  196,3,125,25,68,129,96,1            // vextractf128  $0x1,%ymm8,0x60(%r9,%r8,4)
+  .byte  235,171                             // jmp           d959 <_sk_store_f32_hsw+0x75>
 
 HIDDEN _sk_repeat_x_hsw
 .globl _sk_repeat_x_hsw
@@ -13569,7 +13408,7 @@
   .byte  196,65,124,92,218                   // vsubps        %ymm10,%ymm0,%ymm11
   .byte  196,193,58,88,192                   // vaddss        %xmm8,%xmm8,%xmm0
   .byte  196,98,125,24,192                   // vbroadcastss  %xmm0,%ymm8
-  .byte  197,178,89,5,77,206,2,0             // vmulss        0x2ce4d(%rip),%xmm9,%xmm0        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  197,178,89,5,147,201,2,0            // vmulss        0x2c993(%rip),%xmm9,%xmm0        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,226,125,24,192                  // vbroadcastss  %xmm0,%ymm0
   .byte  197,164,89,192                      // vmulps        %ymm0,%ymm11,%ymm0
   .byte  196,227,125,8,192,1                 // vroundps      $0x1,%ymm0,%ymm0
@@ -13592,7 +13431,7 @@
   .byte  196,65,116,92,218                   // vsubps        %ymm10,%ymm1,%ymm11
   .byte  196,193,58,88,200                   // vaddss        %xmm8,%xmm8,%xmm1
   .byte  196,98,125,24,193                   // vbroadcastss  %xmm1,%ymm8
-  .byte  197,178,89,13,252,205,2,0           // vmulss        0x2cdfc(%rip),%xmm9,%xmm1        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  197,178,89,13,66,201,2,0            // vmulss        0x2c942(%rip),%xmm9,%xmm1        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,226,125,24,201                  // vbroadcastss  %xmm1,%ymm1
   .byte  197,164,89,201                      // vmulps        %ymm1,%ymm11,%ymm1
   .byte  196,227,125,8,201,1                 // vroundps      $0x1,%ymm1,%ymm1
@@ -13610,7 +13449,7 @@
 _sk_clamp_x_1_hsw:
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
-  .byte  196,98,125,24,5,196,205,2,0         // vbroadcastss  0x2cdc4(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,10,201,2,0          // vbroadcastss  0x2c90a(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -13623,7 +13462,7 @@
   .byte  196,193,124,92,192                  // vsubps        %ymm8,%ymm0,%ymm0
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
-  .byte  196,98,125,24,5,158,205,2,0         // vbroadcastss  0x2cd9e(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,228,200,2,0         // vbroadcastss  0x2c8e4(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -13632,9 +13471,9 @@
 .globl _sk_mirror_x_1_hsw
 FUNCTION(_sk_mirror_x_1_hsw)
 _sk_mirror_x_1_hsw:
-  .byte  196,98,125,24,5,164,205,2,0         // vbroadcastss  0x2cda4(%rip),%ymm8        # 3ab94 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
+  .byte  196,98,125,24,5,234,200,2,0         // vbroadcastss  0x2c8ea(%rip),%ymm8        # 3a3c4 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
   .byte  196,193,124,88,192                  // vaddps        %ymm8,%ymm0,%ymm0
-  .byte  196,98,125,24,13,122,205,2,0        // vbroadcastss  0x2cd7a(%rip),%ymm9        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,13,192,200,2,0        // vbroadcastss  0x2c8c0(%rip),%ymm9        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,65,124,89,201                   // vmulps        %ymm9,%ymm0,%ymm9
   .byte  196,67,125,8,201,1                  // vroundps      $0x1,%ymm9,%ymm9
   .byte  196,65,52,88,201                    // vaddps        %ymm9,%ymm9,%ymm9
@@ -13644,7 +13483,7 @@
   .byte  197,60,92,200                       // vsubps        %ymm0,%ymm8,%ymm9
   .byte  197,180,84,192                      // vandps        %ymm0,%ymm9,%ymm0
   .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
-  .byte  196,98,125,24,5,74,205,2,0          // vbroadcastss  0x2cd4a(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,144,200,2,0         // vbroadcastss  0x2c890(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -13653,11 +13492,11 @@
 .globl _sk_luminance_to_alpha_hsw
 FUNCTION(_sk_luminance_to_alpha_hsw)
 _sk_luminance_to_alpha_hsw:
-  .byte  196,226,125,24,29,92,206,2,0        // vbroadcastss  0x2ce5c(%rip),%ymm3        # 3aca0 <_sk_srcover_bgra_8888_sse2_lowp+0x3d4>
-  .byte  196,98,125,24,5,79,206,2,0          // vbroadcastss  0x2ce4f(%rip),%ymm8        # 3ac9c <_sk_srcover_bgra_8888_sse2_lowp+0x3d0>
+  .byte  196,226,125,24,29,162,201,2,0       // vbroadcastss  0x2c9a2(%rip),%ymm3        # 3a4d0 <_sk_srcover_bgra_8888_sse2_lowp+0x3d4>
+  .byte  196,98,125,24,5,149,201,2,0         // vbroadcastss  0x2c995(%rip),%ymm8        # 3a4cc <_sk_srcover_bgra_8888_sse2_lowp+0x3d0>
   .byte  196,193,116,89,200                  // vmulps        %ymm8,%ymm1,%ymm1
   .byte  196,226,125,184,203                 // vfmadd231ps   %ymm3,%ymm0,%ymm1
-  .byte  196,226,125,24,29,68,206,2,0        // vbroadcastss  0x2ce44(%rip),%ymm3        # 3aca4 <_sk_srcover_bgra_8888_sse2_lowp+0x3d8>
+  .byte  196,226,125,24,29,138,201,2,0       // vbroadcastss  0x2c98a(%rip),%ymm3        # 3a4d4 <_sk_srcover_bgra_8888_sse2_lowp+0x3d8>
   .byte  196,226,109,168,217                 // vfmadd213ps   %ymm1,%ymm2,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
@@ -13856,9 +13695,9 @@
   .byte  76,139,64,8                         // mov           0x8(%rax),%r8
   .byte  77,137,202                          // mov           %r9,%r10
   .byte  73,255,202                          // dec           %r10
-  .byte  120,7                               // js            e158 <_sk_evenly_spaced_gradient_hsw+0x18>
+  .byte  120,7                               // js            de42 <_sk_evenly_spaced_gradient_hsw+0x18>
   .byte  196,193,242,42,202                  // vcvtsi2ss     %r10,%xmm1,%xmm1
-  .byte  235,22                              // jmp           e16e <_sk_evenly_spaced_gradient_hsw+0x2e>
+  .byte  235,22                              // jmp           de58 <_sk_evenly_spaced_gradient_hsw+0x2e>
   .byte  77,137,211                          // mov           %r10,%r11
   .byte  73,209,235                          // shr           %r11
   .byte  65,131,226,1                        // and           $0x1,%r10d
@@ -13869,7 +13708,7 @@
   .byte  197,244,89,200                      // vmulps        %ymm0,%ymm1,%ymm1
   .byte  197,126,91,225                      // vcvttps2dq    %ymm1,%ymm12
   .byte  73,131,249,8                        // cmp           $0x8,%r9
-  .byte  119,73                              // ja            e1ca <_sk_evenly_spaced_gradient_hsw+0x8a>
+  .byte  119,73                              // ja            deb4 <_sk_evenly_spaced_gradient_hsw+0x8a>
   .byte  196,66,29,22,0                      // vpermps       (%r8),%ymm12,%ymm8
   .byte  76,139,64,40                        // mov           0x28(%rax),%r8
   .byte  196,66,29,22,8                      // vpermps       (%r8),%ymm12,%ymm9
@@ -13885,7 +13724,7 @@
   .byte  196,194,29,22,24                    // vpermps       (%r8),%ymm12,%ymm3
   .byte  72,139,64,64                        // mov           0x40(%rax),%rax
   .byte  196,98,29,22,16                     // vpermps       (%rax),%ymm12,%ymm10
-  .byte  233,147,0,0,0                       // jmpq          e25d <_sk_evenly_spaced_gradient_hsw+0x11d>
+  .byte  233,147,0,0,0                       // jmpq          df47 <_sk_evenly_spaced_gradient_hsw+0x11d>
   .byte  196,65,13,118,246                   // vpcmpeqd      %ymm14,%ymm14,%ymm14
   .byte  196,65,44,87,210                    // vxorps        %ymm10,%ymm10,%ymm10
   .byte  197,245,118,201                     // vpcmpeqd      %ymm1,%ymm1,%ymm1
@@ -13932,11 +13771,11 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  73,131,248,1                        // cmp           $0x1,%r8
-  .byte  15,134,220,0,0,0                    // jbe           e364 <_sk_gradient_hsw+0xeb>
+  .byte  15,134,220,0,0,0                    // jbe           e04e <_sk_gradient_hsw+0xeb>
   .byte  76,139,72,72                        // mov           0x48(%rax),%r9
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  65,186,1,0,0,0                      // mov           $0x1,%r10d
-  .byte  196,226,125,24,21,225,200,2,0       // vbroadcastss  0x2c8e1(%rip),%ymm2        # 3ab80 <_sk_srcover_bgra_8888_sse2_lowp+0x2b4>
+  .byte  196,226,125,24,21,39,196,2,0        // vbroadcastss  0x2c427(%rip),%ymm2        # 3a3b0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b4>
   .byte  196,65,53,239,201                   // vpxor         %ymm9,%ymm9,%ymm9
   .byte  196,130,125,24,28,145               // vbroadcastss  (%r9,%r10,4),%ymm3
   .byte  197,228,194,216,2                   // vcmpleps      %ymm0,%ymm3,%ymm3
@@ -13944,10 +13783,10 @@
   .byte  197,53,254,203                      // vpaddd        %ymm3,%ymm9,%ymm9
   .byte  73,255,194                          // inc           %r10
   .byte  77,57,208                           // cmp           %r10,%r8
-  .byte  117,227                             // jne           e2a4 <_sk_gradient_hsw+0x2b>
+  .byte  117,227                             // jne           df8e <_sk_gradient_hsw+0x2b>
   .byte  76,139,72,8                         // mov           0x8(%rax),%r9
   .byte  73,131,248,8                        // cmp           $0x8,%r8
-  .byte  15,134,158,0,0,0                    // jbe           e36d <_sk_gradient_hsw+0xf4>
+  .byte  15,134,158,0,0,0                    // jbe           e057 <_sk_gradient_hsw+0xf4>
   .byte  196,65,13,118,246                   // vpcmpeqd      %ymm14,%ymm14,%ymm14
   .byte  196,65,36,87,219                    // vxorps        %ymm11,%ymm11,%ymm11
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
@@ -13979,7 +13818,7 @@
   .byte  196,130,5,146,28,136                // vgatherdps    %ymm15,(%r8,%ymm9,4),%ymm3
   .byte  72,139,64,64                        // mov           0x40(%rax),%rax
   .byte  196,34,13,146,28,136                // vgatherdps    %ymm14,(%rax,%ymm9,4),%ymm11
-  .byte  235,77                              // jmp           e3b1 <_sk_gradient_hsw+0x138>
+  .byte  235,77                              // jmp           e09b <_sk_gradient_hsw+0x138>
   .byte  76,139,72,8                         // mov           0x8(%rax),%r9
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
   .byte  196,66,53,22,1                      // vpermps       (%r9),%ymm9,%ymm8
@@ -14039,24 +13878,24 @@
   .byte  196,65,52,95,226                    // vmaxps        %ymm10,%ymm9,%ymm12
   .byte  196,65,36,94,220                    // vdivps        %ymm12,%ymm11,%ymm11
   .byte  196,65,36,89,227                    // vmulps        %ymm11,%ymm11,%ymm12
-  .byte  196,98,125,24,45,92,200,2,0         // vbroadcastss  0x2c85c(%rip),%ymm13        # 3aca8 <_sk_srcover_bgra_8888_sse2_lowp+0x3dc>
-  .byte  196,98,125,24,53,87,200,2,0         // vbroadcastss  0x2c857(%rip),%ymm14        # 3acac <_sk_srcover_bgra_8888_sse2_lowp+0x3e0>
+  .byte  196,98,125,24,45,162,195,2,0        // vbroadcastss  0x2c3a2(%rip),%ymm13        # 3a4d8 <_sk_srcover_bgra_8888_sse2_lowp+0x3dc>
+  .byte  196,98,125,24,53,157,195,2,0        // vbroadcastss  0x2c39d(%rip),%ymm14        # 3a4dc <_sk_srcover_bgra_8888_sse2_lowp+0x3e0>
   .byte  196,66,29,184,245                   // vfmadd231ps   %ymm13,%ymm12,%ymm14
-  .byte  196,98,125,24,45,77,200,2,0         // vbroadcastss  0x2c84d(%rip),%ymm13        # 3acb0 <_sk_srcover_bgra_8888_sse2_lowp+0x3e4>
+  .byte  196,98,125,24,45,147,195,2,0        // vbroadcastss  0x2c393(%rip),%ymm13        # 3a4e0 <_sk_srcover_bgra_8888_sse2_lowp+0x3e4>
   .byte  196,66,29,184,238                   // vfmadd231ps   %ymm14,%ymm12,%ymm13
-  .byte  196,98,125,24,53,67,200,2,0         // vbroadcastss  0x2c843(%rip),%ymm14        # 3acb4 <_sk_srcover_bgra_8888_sse2_lowp+0x3e8>
+  .byte  196,98,125,24,53,137,195,2,0        // vbroadcastss  0x2c389(%rip),%ymm14        # 3a4e4 <_sk_srcover_bgra_8888_sse2_lowp+0x3e8>
   .byte  196,66,29,184,245                   // vfmadd231ps   %ymm13,%ymm12,%ymm14
   .byte  196,65,36,89,222                    // vmulps        %ymm14,%ymm11,%ymm11
   .byte  196,65,52,194,202,1                 // vcmpltps      %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,21,46,200,2,0         // vbroadcastss  0x2c82e(%rip),%ymm10        # 3acb8 <_sk_srcover_bgra_8888_sse2_lowp+0x3ec>
+  .byte  196,98,125,24,21,116,195,2,0        // vbroadcastss  0x2c374(%rip),%ymm10        # 3a4e8 <_sk_srcover_bgra_8888_sse2_lowp+0x3ec>
   .byte  196,65,44,92,211                    // vsubps        %ymm11,%ymm10,%ymm10
   .byte  196,67,37,74,202,144                // vblendvps     %ymm9,%ymm10,%ymm11,%ymm9
   .byte  196,193,124,194,192,1               // vcmpltps      %ymm8,%ymm0,%ymm0
-  .byte  196,98,125,24,21,212,198,2,0        // vbroadcastss  0x2c6d4(%rip),%ymm10        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,21,26,194,2,0         // vbroadcastss  0x2c21a(%rip),%ymm10        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,65,44,92,209                    // vsubps        %ymm9,%ymm10,%ymm10
   .byte  196,195,53,74,194,0                 // vblendvps     %ymm0,%ymm10,%ymm9,%ymm0
   .byte  196,65,116,194,200,1                // vcmpltps      %ymm8,%ymm1,%ymm9
-  .byte  196,98,125,24,21,190,198,2,0        // vbroadcastss  0x2c6be(%rip),%ymm10        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,21,4,194,2,0          // vbroadcastss  0x2c204(%rip),%ymm10        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,44,92,208                       // vsubps        %ymm0,%ymm10,%ymm10
   .byte  196,195,125,74,194,144              // vblendvps     %ymm9,%ymm10,%ymm0,%ymm0
   .byte  196,65,124,194,200,3                // vcmpunordps   %ymm8,%ymm0,%ymm9
@@ -14078,7 +13917,7 @@
 .globl _sk_negate_x_hsw
 FUNCTION(_sk_negate_x_hsw)
 _sk_negate_x_hsw:
-  .byte  196,98,125,24,5,201,199,2,0         // vbroadcastss  0x2c7c9(%rip),%ymm8        # 3acbc <_sk_srcover_bgra_8888_sse2_lowp+0x3f0>
+  .byte  196,98,125,24,5,15,195,2,0          // vbroadcastss  0x2c30f(%rip),%ymm8        # 3a4ec <_sk_srcover_bgra_8888_sse2_lowp+0x3f0>
   .byte  196,193,124,87,192                  // vxorps        %ymm8,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -14158,7 +13997,7 @@
 .globl _sk_alter_2pt_conical_unswap_hsw
 FUNCTION(_sk_alter_2pt_conical_unswap_hsw)
 _sk_alter_2pt_conical_unswap_hsw:
-  .byte  196,98,125,24,5,224,197,2,0         // vbroadcastss  0x2c5e0(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,38,193,2,0          // vbroadcastss  0x2c126(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,188,92,192                      // vsubps        %ymm0,%ymm8,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -14209,7 +14048,7 @@
 FUNCTION(_sk_save_xy_hsw)
 _sk_save_xy_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,98,125,24,5,100,197,2,0         // vbroadcastss  0x2c564(%rip),%ymm8        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,5,170,192,2,0         // vbroadcastss  0x2c0aa(%rip),%ymm8        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,65,124,88,200                   // vaddps        %ymm8,%ymm0,%ymm9
   .byte  196,67,125,8,209,1                  // vroundps      $0x1,%ymm9,%ymm10
   .byte  196,65,52,92,202                    // vsubps        %ymm10,%ymm9,%ymm9
@@ -14243,9 +14082,9 @@
 FUNCTION(_sk_bilinear_nx_hsw)
 _sk_bilinear_nx_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,54,198,2,0         // vbroadcastss  0x2c636(%rip),%ymm0        # 3acc0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  .byte  196,226,125,24,5,124,193,2,0        // vbroadcastss  0x2c17c(%rip),%ymm0        # 3a4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   .byte  197,252,88,0                        // vaddps        (%rax),%ymm0,%ymm0
-  .byte  196,98,125,24,5,229,196,2,0         // vbroadcastss  0x2c4e5(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,43,192,2,0          // vbroadcastss  0x2c02b(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,128,128,0,0,0             // vsubps        0x80(%rax),%ymm8,%ymm8
   .byte  197,124,17,128,0,1,0,0              // vmovups       %ymm8,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -14256,7 +14095,7 @@
 FUNCTION(_sk_bilinear_px_hsw)
 _sk_bilinear_px_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,194,196,2,0        // vbroadcastss  0x2c4c2(%rip),%ymm0        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,226,125,24,5,8,192,2,0          // vbroadcastss  0x2c008(%rip),%ymm0        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,252,88,0                        // vaddps        (%rax),%ymm0,%ymm0
   .byte  197,124,16,128,128,0,0,0            // vmovups       0x80(%rax),%ymm8
   .byte  197,124,17,128,0,1,0,0              // vmovups       %ymm8,0x100(%rax)
@@ -14268,9 +14107,9 @@
 FUNCTION(_sk_bilinear_ny_hsw)
 _sk_bilinear_ny_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,13,231,197,2,0       // vbroadcastss  0x2c5e7(%rip),%ymm1        # 3acc0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  .byte  196,226,125,24,13,45,193,2,0        // vbroadcastss  0x2c12d(%rip),%ymm1        # 3a4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   .byte  197,244,88,72,64                    // vaddps        0x40(%rax),%ymm1,%ymm1
-  .byte  196,98,125,24,5,149,196,2,0         // vbroadcastss  0x2c495(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,219,191,2,0         // vbroadcastss  0x2bfdb(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,128,192,0,0,0             // vsubps        0xc0(%rax),%ymm8,%ymm8
   .byte  197,124,17,128,64,1,0,0             // vmovups       %ymm8,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -14281,7 +14120,7 @@
 FUNCTION(_sk_bilinear_py_hsw)
 _sk_bilinear_py_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,13,114,196,2,0       // vbroadcastss  0x2c472(%rip),%ymm1        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,226,125,24,13,184,191,2,0       // vbroadcastss  0x2bfb8(%rip),%ymm1        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,244,88,72,64                    // vaddps        0x40(%rax),%ymm1,%ymm1
   .byte  197,124,16,128,192,0,0,0            // vmovups       0xc0(%rax),%ymm8
   .byte  197,124,17,128,64,1,0,0             // vmovups       %ymm8,0x140(%rax)
@@ -14293,13 +14132,13 @@
 FUNCTION(_sk_bicubic_n3x_hsw)
 _sk_bicubic_n3x_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,154,197,2,0        // vbroadcastss  0x2c59a(%rip),%ymm0        # 3acc4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f8>
+  .byte  196,226,125,24,5,224,192,2,0        // vbroadcastss  0x2c0e0(%rip),%ymm0        # 3a4f4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f8>
   .byte  197,252,88,0                        // vaddps        (%rax),%ymm0,%ymm0
-  .byte  196,98,125,24,5,69,196,2,0          // vbroadcastss  0x2c445(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,139,191,2,0         // vbroadcastss  0x2bf8b(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,128,128,0,0,0             // vsubps        0x80(%rax),%ymm8,%ymm8
   .byte  196,65,60,89,200                    // vmulps        %ymm8,%ymm8,%ymm9
-  .byte  196,98,125,24,21,163,196,2,0        // vbroadcastss  0x2c4a3(%rip),%ymm10        # 3abf0 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
-  .byte  196,98,125,24,29,114,197,2,0        // vbroadcastss  0x2c572(%rip),%ymm11        # 3acc8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
+  .byte  196,98,125,24,21,233,191,2,0        // vbroadcastss  0x2bfe9(%rip),%ymm10        # 3a420 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  .byte  196,98,125,24,29,184,192,2,0        // vbroadcastss  0x2c0b8(%rip),%ymm11        # 3a4f8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
   .byte  196,66,61,168,218                   // vfmadd213ps   %ymm10,%ymm8,%ymm11
   .byte  196,65,36,89,193                    // vmulps        %ymm9,%ymm11,%ymm8
   .byte  197,124,17,128,0,1,0,0              // vmovups       %ymm8,0x100(%rax)
@@ -14311,16 +14150,16 @@
 FUNCTION(_sk_bicubic_n1x_hsw)
 _sk_bicubic_n1x_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,73,197,2,0         // vbroadcastss  0x2c549(%rip),%ymm0        # 3acc0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  .byte  196,226,125,24,5,143,192,2,0        // vbroadcastss  0x2c08f(%rip),%ymm0        # 3a4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   .byte  197,252,88,0                        // vaddps        (%rax),%ymm0,%ymm0
-  .byte  196,98,125,24,5,248,195,2,0         // vbroadcastss  0x2c3f8(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,62,191,2,0          // vbroadcastss  0x2bf3e(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,128,128,0,0,0             // vsubps        0x80(%rax),%ymm8,%ymm8
-  .byte  196,98,125,24,13,59,197,2,0         // vbroadcastss  0x2c53b(%rip),%ymm9        # 3acd0 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
-  .byte  196,98,125,24,21,46,197,2,0         // vbroadcastss  0x2c52e(%rip),%ymm10        # 3accc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  .byte  196,98,125,24,13,129,192,2,0        // vbroadcastss  0x2c081(%rip),%ymm9        # 3a500 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  .byte  196,98,125,24,21,116,192,2,0        // vbroadcastss  0x2c074(%rip),%ymm10        # 3a4fc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
   .byte  196,66,61,168,209                   // vfmadd213ps   %ymm9,%ymm8,%ymm10
-  .byte  196,98,125,24,13,204,195,2,0        // vbroadcastss  0x2c3cc(%rip),%ymm9        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,13,18,191,2,0         // vbroadcastss  0x2bf12(%rip),%ymm9        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,66,61,184,202                   // vfmadd231ps   %ymm10,%ymm8,%ymm9
-  .byte  196,98,125,24,21,26,197,2,0         // vbroadcastss  0x2c51a(%rip),%ymm10        # 3acd4 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
+  .byte  196,98,125,24,21,96,192,2,0         // vbroadcastss  0x2c060(%rip),%ymm10        # 3a504 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
   .byte  196,66,61,184,209                   // vfmadd231ps   %ymm9,%ymm8,%ymm10
   .byte  197,124,17,144,0,1,0,0              // vmovups       %ymm10,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -14331,14 +14170,14 @@
 FUNCTION(_sk_bicubic_p1x_hsw)
 _sk_bicubic_p1x_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,98,125,24,5,162,195,2,0         // vbroadcastss  0x2c3a2(%rip),%ymm8        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,5,232,190,2,0         // vbroadcastss  0x2bee8(%rip),%ymm8        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,188,88,0                        // vaddps        (%rax),%ymm8,%ymm0
   .byte  197,124,16,136,128,0,0,0            // vmovups       0x80(%rax),%ymm9
-  .byte  196,98,125,24,21,229,196,2,0        // vbroadcastss  0x2c4e5(%rip),%ymm10        # 3acd0 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
-  .byte  196,98,125,24,29,216,196,2,0        // vbroadcastss  0x2c4d8(%rip),%ymm11        # 3accc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  .byte  196,98,125,24,21,43,192,2,0         // vbroadcastss  0x2c02b(%rip),%ymm10        # 3a500 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  .byte  196,98,125,24,29,30,192,2,0         // vbroadcastss  0x2c01e(%rip),%ymm11        # 3a4fc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
   .byte  196,66,53,168,218                   // vfmadd213ps   %ymm10,%ymm9,%ymm11
   .byte  196,66,53,168,216                   // vfmadd213ps   %ymm8,%ymm9,%ymm11
-  .byte  196,98,125,24,5,205,196,2,0         // vbroadcastss  0x2c4cd(%rip),%ymm8        # 3acd4 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
+  .byte  196,98,125,24,5,19,192,2,0          // vbroadcastss  0x2c013(%rip),%ymm8        # 3a504 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
   .byte  196,66,53,184,195                   // vfmadd231ps   %ymm11,%ymm9,%ymm8
   .byte  197,124,17,128,0,1,0,0              // vmovups       %ymm8,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -14349,12 +14188,12 @@
 FUNCTION(_sk_bicubic_p3x_hsw)
 _sk_bicubic_p3x_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,173,196,2,0        // vbroadcastss  0x2c4ad(%rip),%ymm0        # 3acd0 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  .byte  196,226,125,24,5,243,191,2,0        // vbroadcastss  0x2bff3(%rip),%ymm0        # 3a500 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
   .byte  197,252,88,0                        // vaddps        (%rax),%ymm0,%ymm0
   .byte  197,124,16,128,128,0,0,0            // vmovups       0x80(%rax),%ymm8
   .byte  196,65,60,89,200                    // vmulps        %ymm8,%ymm8,%ymm9
-  .byte  196,98,125,24,21,179,195,2,0        // vbroadcastss  0x2c3b3(%rip),%ymm10        # 3abf0 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
-  .byte  196,98,125,24,29,130,196,2,0        // vbroadcastss  0x2c482(%rip),%ymm11        # 3acc8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
+  .byte  196,98,125,24,21,249,190,2,0        // vbroadcastss  0x2bef9(%rip),%ymm10        # 3a420 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  .byte  196,98,125,24,29,200,191,2,0        // vbroadcastss  0x2bfc8(%rip),%ymm11        # 3a4f8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
   .byte  196,66,61,168,218                   // vfmadd213ps   %ymm10,%ymm8,%ymm11
   .byte  196,65,52,89,195                    // vmulps        %ymm11,%ymm9,%ymm8
   .byte  197,124,17,128,0,1,0,0              // vmovups       %ymm8,0x100(%rax)
@@ -14366,13 +14205,13 @@
 FUNCTION(_sk_bicubic_n3y_hsw)
 _sk_bicubic_n3y_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,13,93,196,2,0        // vbroadcastss  0x2c45d(%rip),%ymm1        # 3acc4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f8>
+  .byte  196,226,125,24,13,163,191,2,0       // vbroadcastss  0x2bfa3(%rip),%ymm1        # 3a4f4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f8>
   .byte  197,244,88,72,64                    // vaddps        0x40(%rax),%ymm1,%ymm1
-  .byte  196,98,125,24,5,7,195,2,0           // vbroadcastss  0x2c307(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,77,190,2,0          // vbroadcastss  0x2be4d(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,128,192,0,0,0             // vsubps        0xc0(%rax),%ymm8,%ymm8
   .byte  196,65,60,89,200                    // vmulps        %ymm8,%ymm8,%ymm9
-  .byte  196,98,125,24,21,101,195,2,0        // vbroadcastss  0x2c365(%rip),%ymm10        # 3abf0 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
-  .byte  196,98,125,24,29,52,196,2,0         // vbroadcastss  0x2c434(%rip),%ymm11        # 3acc8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
+  .byte  196,98,125,24,21,171,190,2,0        // vbroadcastss  0x2beab(%rip),%ymm10        # 3a420 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  .byte  196,98,125,24,29,122,191,2,0        // vbroadcastss  0x2bf7a(%rip),%ymm11        # 3a4f8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
   .byte  196,66,61,168,218                   // vfmadd213ps   %ymm10,%ymm8,%ymm11
   .byte  196,65,36,89,193                    // vmulps        %ymm9,%ymm11,%ymm8
   .byte  197,124,17,128,64,1,0,0             // vmovups       %ymm8,0x140(%rax)
@@ -14384,16 +14223,16 @@
 FUNCTION(_sk_bicubic_n1y_hsw)
 _sk_bicubic_n1y_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,13,11,196,2,0        // vbroadcastss  0x2c40b(%rip),%ymm1        # 3acc0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  .byte  196,226,125,24,13,81,191,2,0        // vbroadcastss  0x2bf51(%rip),%ymm1        # 3a4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   .byte  197,244,88,72,64                    // vaddps        0x40(%rax),%ymm1,%ymm1
-  .byte  196,98,125,24,5,185,194,2,0         // vbroadcastss  0x2c2b9(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,255,189,2,0         // vbroadcastss  0x2bdff(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,128,192,0,0,0             // vsubps        0xc0(%rax),%ymm8,%ymm8
-  .byte  196,98,125,24,13,252,195,2,0        // vbroadcastss  0x2c3fc(%rip),%ymm9        # 3acd0 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
-  .byte  196,98,125,24,21,239,195,2,0        // vbroadcastss  0x2c3ef(%rip),%ymm10        # 3accc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  .byte  196,98,125,24,13,66,191,2,0         // vbroadcastss  0x2bf42(%rip),%ymm9        # 3a500 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  .byte  196,98,125,24,21,53,191,2,0         // vbroadcastss  0x2bf35(%rip),%ymm10        # 3a4fc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
   .byte  196,66,61,168,209                   // vfmadd213ps   %ymm9,%ymm8,%ymm10
-  .byte  196,98,125,24,13,141,194,2,0        // vbroadcastss  0x2c28d(%rip),%ymm9        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,13,211,189,2,0        // vbroadcastss  0x2bdd3(%rip),%ymm9        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,66,61,184,202                   // vfmadd231ps   %ymm10,%ymm8,%ymm9
-  .byte  196,98,125,24,21,219,195,2,0        // vbroadcastss  0x2c3db(%rip),%ymm10        # 3acd4 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
+  .byte  196,98,125,24,21,33,191,2,0         // vbroadcastss  0x2bf21(%rip),%ymm10        # 3a504 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
   .byte  196,66,61,184,209                   // vfmadd231ps   %ymm9,%ymm8,%ymm10
   .byte  197,124,17,144,64,1,0,0             // vmovups       %ymm10,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -14404,14 +14243,14 @@
 FUNCTION(_sk_bicubic_p1y_hsw)
 _sk_bicubic_p1y_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,98,125,24,5,99,194,2,0          // vbroadcastss  0x2c263(%rip),%ymm8        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,5,169,189,2,0         // vbroadcastss  0x2bda9(%rip),%ymm8        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,188,88,72,64                    // vaddps        0x40(%rax),%ymm8,%ymm1
   .byte  197,124,16,136,192,0,0,0            // vmovups       0xc0(%rax),%ymm9
-  .byte  196,98,125,24,21,165,195,2,0        // vbroadcastss  0x2c3a5(%rip),%ymm10        # 3acd0 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
-  .byte  196,98,125,24,29,152,195,2,0        // vbroadcastss  0x2c398(%rip),%ymm11        # 3accc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  .byte  196,98,125,24,21,235,190,2,0        // vbroadcastss  0x2beeb(%rip),%ymm10        # 3a500 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  .byte  196,98,125,24,29,222,190,2,0        // vbroadcastss  0x2bede(%rip),%ymm11        # 3a4fc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
   .byte  196,66,53,168,218                   // vfmadd213ps   %ymm10,%ymm9,%ymm11
   .byte  196,66,53,168,216                   // vfmadd213ps   %ymm8,%ymm9,%ymm11
-  .byte  196,98,125,24,5,141,195,2,0         // vbroadcastss  0x2c38d(%rip),%ymm8        # 3acd4 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
+  .byte  196,98,125,24,5,211,190,2,0         // vbroadcastss  0x2bed3(%rip),%ymm8        # 3a504 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
   .byte  196,66,53,184,195                   // vfmadd231ps   %ymm11,%ymm9,%ymm8
   .byte  197,124,17,128,64,1,0,0             // vmovups       %ymm8,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -14422,12 +14261,12 @@
 FUNCTION(_sk_bicubic_p3y_hsw)
 _sk_bicubic_p3y_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,13,109,195,2,0       // vbroadcastss  0x2c36d(%rip),%ymm1        # 3acd0 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  .byte  196,226,125,24,13,179,190,2,0       // vbroadcastss  0x2beb3(%rip),%ymm1        # 3a500 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
   .byte  197,244,88,72,64                    // vaddps        0x40(%rax),%ymm1,%ymm1
   .byte  197,124,16,128,192,0,0,0            // vmovups       0xc0(%rax),%ymm8
   .byte  196,65,60,89,200                    // vmulps        %ymm8,%ymm8,%ymm9
-  .byte  196,98,125,24,21,114,194,2,0        // vbroadcastss  0x2c272(%rip),%ymm10        # 3abf0 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
-  .byte  196,98,125,24,29,65,195,2,0         // vbroadcastss  0x2c341(%rip),%ymm11        # 3acc8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
+  .byte  196,98,125,24,21,184,189,2,0        // vbroadcastss  0x2bdb8(%rip),%ymm10        # 3a420 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  .byte  196,98,125,24,29,135,190,2,0        // vbroadcastss  0x2be87(%rip),%ymm11        # 3a4f8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
   .byte  196,66,61,168,218                   // vfmadd213ps   %ymm10,%ymm8,%ymm11
   .byte  196,65,52,89,195                    // vmulps        %ymm11,%ymm9,%ymm8
   .byte  197,124,17,128,64,1,0,0             // vmovups       %ymm8,0x140(%rax)
@@ -14567,7 +14406,7 @@
   .byte  196,98,93,64,218                    // vpmulld       %ymm2,%ymm4,%ymm11
   .byte  72,139,0                            // mov           (%rax),%rax
   .byte  197,165,254,193                     // vpaddd        %ymm1,%ymm11,%ymm0
-  .byte  196,98,125,88,61,3,193,2,0          // vpbroadcastd  0x2c103(%rip),%ymm15        # 3acdc <_sk_srcover_bgra_8888_sse2_lowp+0x410>
+  .byte  196,98,125,88,61,73,188,2,0         // vpbroadcastd  0x2bc49(%rip),%ymm15        # 3a50c <_sk_srcover_bgra_8888_sse2_lowp+0x410>
   .byte  196,194,125,64,199                  // vpmulld       %ymm15,%ymm0,%ymm0
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
   .byte  197,237,118,210                     // vpcmpeqd      %ymm2,%ymm2,%ymm2
@@ -14579,13 +14418,13 @@
   .byte  197,213,118,237                     // vpcmpeqd      %ymm5,%ymm5,%ymm5
   .byte  196,226,85,146,60,144               // vgatherdps    %ymm5,(%rax,%ymm2,4),%ymm7
   .byte  197,252,17,188,36,0,2,0,0           // vmovups       %ymm7,0x200(%rsp)
-  .byte  196,226,125,88,61,105,191,2,0       // vpbroadcastd  0x2bf69(%rip),%ymm7        # 3ab88 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
+  .byte  196,226,125,88,61,175,186,2,0       // vpbroadcastd  0x2baaf(%rip),%ymm7        # 3a3b8 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
   .byte  197,253,254,199                     // vpaddd        %ymm7,%ymm0,%ymm0
   .byte  197,236,87,210                      // vxorps        %ymm2,%ymm2,%ymm2
   .byte  197,213,118,237                     // vpcmpeqd      %ymm5,%ymm5,%ymm5
   .byte  196,226,85,146,20,128               // vgatherdps    %ymm5,(%rax,%ymm0,4),%ymm2
   .byte  197,252,17,148,36,32,1,0,0          // vmovups       %ymm2,0x120(%rsp)
-  .byte  196,226,125,24,5,149,192,2,0        // vbroadcastss  0x2c095(%rip),%ymm0        # 3acd8 <_sk_srcover_bgra_8888_sse2_lowp+0x40c>
+  .byte  196,226,125,24,5,219,187,2,0        // vbroadcastss  0x2bbdb(%rip),%ymm0        # 3a508 <_sk_srcover_bgra_8888_sse2_lowp+0x40c>
   .byte  197,172,88,232                      // vaddps        %ymm0,%ymm10,%ymm5
   .byte  197,254,91,237                      // vcvttps2dq    %ymm5,%ymm5
   .byte  196,226,93,64,213                   // vpmulld       %ymm5,%ymm4,%ymm2
@@ -14847,7 +14686,7 @@
   .byte  197,254,127,132,36,0,1,0,0          // vmovdqu       %ymm0,0x100(%rsp)
   .byte  196,98,109,64,200                   // vpmulld       %ymm0,%ymm2,%ymm9
   .byte  197,181,254,199                     // vpaddd        %ymm7,%ymm9,%ymm0
-  .byte  196,98,125,88,21,46,187,2,0         // vpbroadcastd  0x2bb2e(%rip),%ymm10        # 3acdc <_sk_srcover_bgra_8888_sse2_lowp+0x410>
+  .byte  196,98,125,88,21,116,182,2,0        // vpbroadcastd  0x2b674(%rip),%ymm10        # 3a50c <_sk_srcover_bgra_8888_sse2_lowp+0x410>
   .byte  196,194,125,64,194                  // vpmulld       %ymm10,%ymm0,%ymm0
   .byte  197,213,118,237                     // vpcmpeqd      %ymm5,%ymm5,%ymm5
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
@@ -14859,13 +14698,13 @@
   .byte  196,65,36,87,219                    // vxorps        %ymm11,%ymm11,%ymm11
   .byte  196,98,61,146,28,168                // vgatherdps    %ymm8,(%rax,%ymm5,4),%ymm11
   .byte  197,124,17,156,36,192,0,0,0         // vmovups       %ymm11,0xc0(%rsp)
-  .byte  196,98,125,88,29,145,185,2,0        // vpbroadcastd  0x2b991(%rip),%ymm11        # 3ab88 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
+  .byte  196,98,125,88,29,215,180,2,0        // vpbroadcastd  0x2b4d7(%rip),%ymm11        # 3a3b8 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
   .byte  196,193,125,254,195                 // vpaddd        %ymm11,%ymm0,%ymm0
   .byte  196,65,61,118,192                   // vpcmpeqd      %ymm8,%ymm8,%ymm8
   .byte  197,212,87,237                      // vxorps        %ymm5,%ymm5,%ymm5
   .byte  196,226,61,146,44,128               // vgatherdps    %ymm8,(%rax,%ymm0,4),%ymm5
   .byte  197,252,17,108,36,32                // vmovups       %ymm5,0x20(%rsp)
-  .byte  196,226,125,24,5,190,186,2,0        // vbroadcastss  0x2babe(%rip),%ymm0        # 3acd8 <_sk_srcover_bgra_8888_sse2_lowp+0x40c>
+  .byte  196,226,125,24,5,4,182,2,0          // vbroadcastss  0x2b604(%rip),%ymm0        # 3a508 <_sk_srcover_bgra_8888_sse2_lowp+0x40c>
   .byte  197,116,88,192                      // vaddps        %ymm0,%ymm1,%ymm8
   .byte  196,65,126,91,192                   // vcvttps2dq    %ymm8,%ymm8
   .byte  196,194,109,64,232                  // vpmulld       %ymm8,%ymm2,%ymm5
@@ -15298,7 +15137,7 @@
   .byte  196,193,100,92,210                  // vsubps        %ymm10,%ymm3,%ymm2
   .byte  196,194,77,168,210                  // vfmadd213ps   %ymm10,%ymm6,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,180,175,2,0       // vbroadcastss  0x2afb4(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,250,170,2,0       // vbroadcastss  0x2aafa(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,252,16,164,36,96,6,0,0          // vmovups       0x660(%rsp),%ymm4
   .byte  197,252,16,172,36,128,6,0,0         // vmovups       0x680(%rsp),%ymm5
   .byte  197,252,16,180,36,160,6,0,0         // vmovups       0x6a0(%rsp),%ymm6
@@ -15310,14 +15149,14 @@
 .globl _sk_gauss_a_to_rgba_hsw
 FUNCTION(_sk_gauss_a_to_rgba_hsw)
 _sk_gauss_a_to_rgba_hsw:
-  .byte  196,226,125,24,5,230,176,2,0        // vbroadcastss  0x2b0e6(%rip),%ymm0        # 3ace4 <_sk_srcover_bgra_8888_sse2_lowp+0x418>
-  .byte  196,226,125,24,13,217,176,2,0       // vbroadcastss  0x2b0d9(%rip),%ymm1        # 3ace0 <_sk_srcover_bgra_8888_sse2_lowp+0x414>
+  .byte  196,226,125,24,5,44,172,2,0         // vbroadcastss  0x2ac2c(%rip),%ymm0        # 3a514 <_sk_srcover_bgra_8888_sse2_lowp+0x418>
+  .byte  196,226,125,24,13,31,172,2,0        // vbroadcastss  0x2ac1f(%rip),%ymm1        # 3a510 <_sk_srcover_bgra_8888_sse2_lowp+0x414>
   .byte  196,226,101,168,200                 // vfmadd213ps   %ymm0,%ymm3,%ymm1
-  .byte  196,226,125,24,5,211,176,2,0        // vbroadcastss  0x2b0d3(%rip),%ymm0        # 3ace8 <_sk_srcover_bgra_8888_sse2_lowp+0x41c>
+  .byte  196,226,125,24,5,25,172,2,0         // vbroadcastss  0x2ac19(%rip),%ymm0        # 3a518 <_sk_srcover_bgra_8888_sse2_lowp+0x41c>
   .byte  196,226,101,184,193                 // vfmadd231ps   %ymm1,%ymm3,%ymm0
-  .byte  196,226,125,24,13,201,176,2,0       // vbroadcastss  0x2b0c9(%rip),%ymm1        # 3acec <_sk_srcover_bgra_8888_sse2_lowp+0x420>
+  .byte  196,226,125,24,13,15,172,2,0        // vbroadcastss  0x2ac0f(%rip),%ymm1        # 3a51c <_sk_srcover_bgra_8888_sse2_lowp+0x420>
   .byte  196,226,101,184,200                 // vfmadd231ps   %ymm0,%ymm3,%ymm1
-  .byte  196,226,125,24,5,191,176,2,0        // vbroadcastss  0x2b0bf(%rip),%ymm0        # 3acf0 <_sk_srcover_bgra_8888_sse2_lowp+0x424>
+  .byte  196,226,125,24,5,5,172,2,0          // vbroadcastss  0x2ac05(%rip),%ymm0        # 3a520 <_sk_srcover_bgra_8888_sse2_lowp+0x424>
   .byte  196,226,101,184,193                 // vfmadd231ps   %ymm1,%ymm3,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,40,200                      // vmovaps       %ymm0,%ymm1
@@ -15335,7 +15174,7 @@
   .byte  197,252,17,108,36,192               // vmovups       %ymm5,-0x40(%rsp)
   .byte  197,252,17,100,36,160               // vmovups       %ymm4,-0x60(%rsp)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,37,9,175,2,0         // vbroadcastss  0x2af09(%rip),%ymm4        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,226,125,24,37,79,170,2,0        // vbroadcastss  0x2aa4f(%rip),%ymm4        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,252,88,212                      // vaddps        %ymm4,%ymm0,%ymm2
   .byte  196,227,125,8,218,1                 // vroundps      $0x1,%ymm2,%ymm3
   .byte  197,108,92,235                      // vsubps        %ymm3,%ymm2,%ymm13
@@ -15343,7 +15182,7 @@
   .byte  197,244,88,204                      // vaddps        %ymm4,%ymm1,%ymm1
   .byte  196,227,125,8,209,1                 // vroundps      $0x1,%ymm1,%ymm2
   .byte  197,244,92,210                      // vsubps        %ymm2,%ymm1,%ymm2
-  .byte  196,226,125,24,13,223,174,2,0       // vbroadcastss  0x2aedf(%rip),%ymm1        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,13,37,170,2,0        // vbroadcastss  0x2aa25(%rip),%ymm1        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,116,92,221                  // vsubps        %ymm13,%ymm1,%ymm3
   .byte  197,252,17,156,36,192,0,0,0         // vmovups       %ymm3,0xc0(%rsp)
   .byte  197,252,17,148,36,128,0,0,0         // vmovups       %ymm2,0x80(%rsp)
@@ -15358,8 +15197,8 @@
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  196,226,125,24,72,8                 // vbroadcastss  0x8(%rax),%ymm1
   .byte  197,252,17,76,36,64                 // vmovups       %ymm1,0x40(%rsp)
-  .byte  197,250,16,13,205,175,2,0           // vmovss        0x2afcd(%rip),%xmm1        # 3acc0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
-  .byte  196,226,125,24,61,248,174,2,0       // vbroadcastss  0x2aef8(%rip),%ymm7        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  197,250,16,13,19,171,2,0            // vmovss        0x2ab13(%rip),%xmm1        # 3a4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  .byte  196,226,125,24,61,62,170,2,0        // vbroadcastss  0x2aa3e(%rip),%ymm7        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  197,228,87,219                      // vxorps        %ymm3,%ymm3,%ymm3
   .byte  197,237,239,210                     // vpxor         %ymm2,%ymm2,%ymm2
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
@@ -15370,14 +15209,14 @@
   .byte  197,220,87,228                      // vxorps        %ymm4,%ymm4,%ymm4
   .byte  197,220,95,201                      // vmaxps        %ymm1,%ymm4,%ymm1
   .byte  197,248,41,108,36,144               // vmovaps       %xmm5,-0x70(%rsp)
-  .byte  197,248,46,45,198,175,2,0           // vucomiss      0x2afc6(%rip),%xmm5        # 3acfc <_sk_srcover_bgra_8888_sse2_lowp+0x430>
+  .byte  197,248,46,45,12,171,2,0            // vucomiss      0x2ab0c(%rip),%xmm5        # 3a52c <_sk_srcover_bgra_8888_sse2_lowp+0x430>
   .byte  197,124,16,164,36,128,0,0,0         // vmovups       0x80(%rsp),%ymm12
-  .byte  119,6                               // ja            fd47 <_sk_bilerp_clamp_8888_hsw+0x101>
+  .byte  119,6                               // ja            fa31 <_sk_bilerp_clamp_8888_hsw+0x101>
   .byte  197,124,16,100,36,32                // vmovups       0x20(%rsp),%ymm12
   .byte  197,244,93,76,36,96                 // vminps        0x60(%rsp),%ymm1,%ymm1
   .byte  197,254,91,201                      // vcvttps2dq    %ymm1,%ymm1
   .byte  196,226,117,64,100,36,64            // vpmulld       0x40(%rsp),%ymm1,%ymm4
-  .byte  197,250,16,53,96,175,2,0            // vmovss        0x2af60(%rip),%xmm6        # 3acc0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  .byte  197,250,16,53,166,170,2,0           // vmovss        0x2aaa6(%rip),%xmm6        # 3a4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   .byte  196,226,125,24,206                  // vbroadcastss  %xmm6,%ymm1
   .byte  197,244,88,200                      // vaddps        %ymm0,%ymm1,%ymm1
   .byte  197,212,87,237                      // vxorps        %ymm5,%ymm5,%ymm5
@@ -15388,36 +15227,36 @@
   .byte  197,213,118,237                     // vpcmpeqd      %ymm5,%ymm5,%ymm5
   .byte  196,65,45,239,210                   // vpxor         %ymm10,%ymm10,%ymm10
   .byte  196,66,85,144,20,136                // vpgatherdd    %ymm5,(%r8,%ymm1,4),%ymm10
-  .byte  197,173,219,13,43,179,2,0           // vpand         0x2b32b(%rip),%ymm10,%ymm1        # 3b0c0 <_sk_srcover_bgra_8888_sse2_lowp+0x7f4>
+  .byte  197,173,219,13,129,174,2,0          // vpand         0x2ae81(%rip),%ymm10,%ymm1        # 3a900 <_sk_srcover_bgra_8888_sse2_lowp+0x804>
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
   .byte  197,116,89,223                      // vmulps        %ymm7,%ymm1,%ymm11
-  .byte  196,226,45,0,13,58,179,2,0          // vpshufb       0x2b33a(%rip),%ymm10,%ymm1        # 3b0e0 <_sk_srcover_bgra_8888_sse2_lowp+0x814>
+  .byte  196,226,45,0,13,144,174,2,0         // vpshufb       0x2ae90(%rip),%ymm10,%ymm1        # 3a920 <_sk_srcover_bgra_8888_sse2_lowp+0x824>
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
   .byte  197,244,89,239                      // vmulps        %ymm7,%ymm1,%ymm5
-  .byte  196,226,45,0,13,73,179,2,0          // vpshufb       0x2b349(%rip),%ymm10,%ymm1        # 3b100 <_sk_srcover_bgra_8888_sse2_lowp+0x834>
+  .byte  196,226,45,0,13,159,174,2,0         // vpshufb       0x2ae9f(%rip),%ymm10,%ymm1        # 3a940 <_sk_srcover_bgra_8888_sse2_lowp+0x844>
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
   .byte  197,244,89,207                      // vmulps        %ymm7,%ymm1,%ymm1
   .byte  196,193,45,114,210,24               // vpsrld        $0x18,%ymm10,%ymm10
   .byte  196,65,124,91,210                   // vcvtdq2ps     %ymm10,%ymm10
   .byte  197,44,89,255                       // vmulps        %ymm7,%ymm10,%ymm15
-  .byte  197,248,46,53,38,175,2,0            // vucomiss      0x2af26(%rip),%xmm6        # 3acfc <_sk_srcover_bgra_8888_sse2_lowp+0x430>
+  .byte  197,248,46,53,108,170,2,0           // vucomiss      0x2aa6c(%rip),%xmm6        # 3a52c <_sk_srcover_bgra_8888_sse2_lowp+0x430>
   .byte  196,65,124,40,213                   // vmovaps       %ymm13,%ymm10
-  .byte  119,9                               // ja            fde6 <_sk_bilerp_clamp_8888_hsw+0x1a0>
+  .byte  119,9                               // ja            fad0 <_sk_bilerp_clamp_8888_hsw+0x1a0>
   .byte  197,124,16,148,36,192,0,0,0         // vmovups       0xc0(%rsp),%ymm10
   .byte  196,65,28,89,210                    // vmulps        %ymm10,%ymm12,%ymm10
   .byte  196,66,45,184,203                   // vfmadd231ps   %ymm11,%ymm10,%ymm9
   .byte  196,98,45,184,197                   // vfmadd231ps   %ymm5,%ymm10,%ymm8
   .byte  196,226,45,184,209                  // vfmadd231ps   %ymm1,%ymm10,%ymm2
   .byte  196,194,45,184,223                  // vfmadd231ps   %ymm15,%ymm10,%ymm3
-  .byte  197,202,88,53,117,173,2,0           // vaddss        0x2ad75(%rip),%xmm6,%xmm6        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
-  .byte  197,250,16,13,105,173,2,0           // vmovss        0x2ad69(%rip),%xmm1        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  197,202,88,53,187,168,2,0           // vaddss        0x2a8bb(%rip),%xmm6,%xmm6        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  197,250,16,13,175,168,2,0           // vmovss        0x2a8af(%rip),%xmm1        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,248,46,206                      // vucomiss      %xmm6,%xmm1
-  .byte  15,131,71,255,255,255               // jae           fd60 <_sk_bilerp_clamp_8888_hsw+0x11a>
+  .byte  15,131,71,255,255,255               // jae           fa4a <_sk_bilerp_clamp_8888_hsw+0x11a>
   .byte  197,248,40,108,36,144               // vmovaps       -0x70(%rsp),%xmm5
-  .byte  197,210,88,45,85,173,2,0            // vaddss        0x2ad55(%rip),%xmm5,%xmm5        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
-  .byte  197,250,16,13,73,173,2,0            // vmovss        0x2ad49(%rip),%xmm1        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  197,210,88,45,155,168,2,0           // vaddss        0x2a89b(%rip),%xmm5,%xmm5        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  197,250,16,13,143,168,2,0           // vmovss        0x2a88f(%rip),%xmm1        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,248,46,205                      // vucomiss      %xmm5,%xmm1
-  .byte  15,131,217,254,255,255              // jae           fd12 <_sk_bilerp_clamp_8888_hsw+0xcc>
+  .byte  15,131,217,254,255,255              // jae           f9fc <_sk_bilerp_clamp_8888_hsw+0xcc>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,124,41,200                      // vmovaps       %ymm9,%ymm0
   .byte  197,124,41,193                      // vmovaps       %ymm8,%ymm1
@@ -15428,6 +15267,8 @@
   .byte  72,129,196,248,0,0,0                // add           $0xf8,%rsp
   .byte  255,224                             // jmpq          *%rax
   .byte  144                                 // nop
+  .byte  144                                 // nop
+  .byte  144                                 // nop
 
 HIDDEN _sk_start_pipeline_avx
 .globl _sk_start_pipeline_avx
@@ -15450,13 +15291,13 @@
   .byte  73,137,246                          // mov           %rsi,%r14
   .byte  72,137,77,192                       // mov           %rcx,-0x40(%rbp)
   .byte  72,57,203                           // cmp           %rcx,%rbx
-  .byte  15,131,151,0,0,0                    // jae           ff2e <_sk_start_pipeline_avx+0xca>
+  .byte  15,131,151,0,0,0                    // jae           fc1a <_sk_start_pipeline_avx+0xca>
   .byte  72,139,69,208                       // mov           -0x30(%rbp),%rax
   .byte  72,141,64,8                         // lea           0x8(%rax),%rax
   .byte  72,137,69,200                       // mov           %rax,-0x38(%rbp)
   .byte  72,139,85,208                       // mov           -0x30(%rbp),%rdx
   .byte  76,57,125,200                       // cmp           %r15,-0x38(%rbp)
-  .byte  119,67                              // ja            fef0 <_sk_start_pipeline_avx+0x8c>
+  .byte  119,67                              // ja            fbdc <_sk_start_pipeline_avx+0x8c>
   .byte  76,139,101,208                      // mov           -0x30(%rbp),%r12
   .byte  49,255                              // xor           %edi,%edi
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
@@ -15475,10 +15316,10 @@
   .byte  73,131,196,16                       // add           $0x10,%r12
   .byte  77,57,252                           // cmp           %r15,%r12
   .byte  73,137,212                          // mov           %rdx,%r12
-  .byte  118,193                             // jbe           feb1 <_sk_start_pipeline_avx+0x4d>
+  .byte  118,193                             // jbe           fb9d <_sk_start_pipeline_avx+0x4d>
   .byte  76,137,255                          // mov           %r15,%rdi
   .byte  72,41,215                           // sub           %rdx,%rdi
-  .byte  116,41                              // je            ff21 <_sk_start_pipeline_avx+0xbd>
+  .byte  116,41                              // je            fc0d <_sk_start_pipeline_avx+0xbd>
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  197,236,87,210                      // vxorps        %ymm2,%ymm2,%ymm2
@@ -15492,7 +15333,7 @@
   .byte  65,255,213                          // callq         *%r13
   .byte  72,255,195                          // inc           %rbx
   .byte  72,59,93,192                        // cmp           -0x40(%rbp),%rbx
-  .byte  15,133,117,255,255,255              // jne           fea3 <_sk_start_pipeline_avx+0x3f>
+  .byte  15,133,117,255,255,255              // jne           fb8f <_sk_start_pipeline_avx+0x3f>
   .byte  72,131,196,24                       // add           $0x18,%rsp
   .byte  91                                  // pop           %rbx
   .byte  65,92                               // pop           %r12
@@ -15523,10 +15364,10 @@
   .byte  197,249,112,201,0                   // vpshufd       $0x0,%xmm1,%xmm1
   .byte  196,227,117,24,201,1                // vinsertf128   $0x1,%xmm1,%ymm1,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  196,226,125,24,21,2,172,2,0         // vbroadcastss  0x2ac02(%rip),%ymm2        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,226,125,24,21,70,167,2,0        // vbroadcastss  0x2a746(%rip),%ymm2        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,244,88,202                      // vaddps        %ymm2,%ymm1,%ymm1
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,21,247,171,2,0       // vbroadcastss  0x2abf7(%rip),%ymm2        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,21,59,167,2,0        // vbroadcastss  0x2a73b(%rip),%ymm2        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,228,87,219                      // vxorps        %ymm3,%ymm3,%ymm3
   .byte  197,220,87,228                      // vxorps        %ymm4,%ymm4,%ymm4
   .byte  197,212,87,237                      // vxorps        %ymm5,%ymm5,%ymm5
@@ -15540,46 +15381,46 @@
 _sk_dither_avx:
   .byte  197,121,110,194                     // vmovd         %edx,%xmm8
   .byte  196,65,121,112,192,0                // vpshufd       $0x0,%xmm8,%xmm8
-  .byte  197,57,254,13,147,181,2,0           // vpaddd        0x2b593(%rip),%xmm8,%xmm9        # 3b540 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
-  .byte  197,57,254,5,155,181,2,0            // vpaddd        0x2b59b(%rip),%xmm8,%xmm8        # 3b550 <_sk_srcover_bgra_8888_sse2_lowp+0xc84>
+  .byte  197,57,254,13,231,176,2,0           // vpaddd        0x2b0e7(%rip),%xmm8,%xmm9        # 3ad80 <_sk_srcover_bgra_8888_sse2_lowp+0xc84>
+  .byte  197,57,254,5,239,176,2,0            // vpaddd        0x2b0ef(%rip),%xmm8,%xmm8        # 3ad90 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
   .byte  196,67,53,24,208,1                  // vinsertf128   $0x1,%xmm8,%ymm9,%ymm10
   .byte  197,121,110,217                     // vmovd         %ecx,%xmm11
   .byte  196,65,121,112,219,0                // vpshufd       $0x0,%xmm11,%xmm11
   .byte  196,67,37,24,219,1                  // vinsertf128   $0x1,%xmm11,%ymm11,%ymm11
   .byte  196,65,36,87,218                    // vxorps        %ymm10,%ymm11,%ymm11
-  .byte  196,98,125,24,21,167,171,2,0        // vbroadcastss  0x2aba7(%rip),%ymm10        # 3ab80 <_sk_srcover_bgra_8888_sse2_lowp+0x2b4>
+  .byte  196,98,125,24,21,235,166,2,0        // vbroadcastss  0x2a6eb(%rip),%ymm10        # 3a3b0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b4>
   .byte  196,65,36,84,210                    // vandps        %ymm10,%ymm11,%ymm10
   .byte  196,193,25,114,242,5                // vpslld        $0x5,%xmm10,%xmm12
   .byte  196,67,125,25,210,1                 // vextractf128  $0x1,%ymm10,%xmm10
   .byte  196,193,41,114,242,5                // vpslld        $0x5,%xmm10,%xmm10
   .byte  196,67,29,24,210,1                  // vinsertf128   $0x1,%xmm10,%ymm12,%ymm10
-  .byte  197,123,18,37,114,189,2,0           // vmovddup      0x2bd72(%rip),%xmm12        # 3bd70 <_sk_srcover_bgra_8888_sse2_lowp+0x14a4>
+  .byte  197,123,18,37,198,184,2,0           // vmovddup      0x2b8c6(%rip),%xmm12        # 3b5b0 <_sk_srcover_bgra_8888_sse2_lowp+0x14b4>
   .byte  196,65,49,219,236                   // vpand         %xmm12,%xmm9,%xmm13
   .byte  196,193,17,114,245,4                // vpslld        $0x4,%xmm13,%xmm13
   .byte  196,65,57,219,228                   // vpand         %xmm12,%xmm8,%xmm12
   .byte  196,193,25,114,244,4                // vpslld        $0x4,%xmm12,%xmm12
   .byte  196,67,21,24,228,1                  // vinsertf128   $0x1,%xmm12,%ymm13,%ymm12
-  .byte  196,98,125,24,45,101,171,2,0        // vbroadcastss  0x2ab65(%rip),%ymm13        # 3ab88 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
+  .byte  196,98,125,24,45,169,166,2,0        // vbroadcastss  0x2a6a9(%rip),%ymm13        # 3a3b8 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
   .byte  196,65,36,84,237                    // vandps        %ymm13,%ymm11,%ymm13
   .byte  196,193,9,114,245,2                 // vpslld        $0x2,%xmm13,%xmm14
   .byte  196,67,125,25,237,1                 // vextractf128  $0x1,%ymm13,%xmm13
   .byte  196,193,17,114,245,2                // vpslld        $0x2,%xmm13,%xmm13
   .byte  196,67,13,24,237,1                  // vinsertf128   $0x1,%xmm13,%ymm14,%ymm13
-  .byte  197,123,18,53,48,189,2,0            // vmovddup      0x2bd30(%rip),%xmm14        # 3bd78 <_sk_srcover_bgra_8888_sse2_lowp+0x14ac>
+  .byte  197,123,18,53,132,184,2,0           // vmovddup      0x2b884(%rip),%xmm14        # 3b5b8 <_sk_srcover_bgra_8888_sse2_lowp+0x14bc>
   .byte  196,65,49,219,254                   // vpand         %xmm14,%xmm9,%xmm15
   .byte  196,65,1,254,255                    // vpaddd        %xmm15,%xmm15,%xmm15
   .byte  196,65,57,219,246                   // vpand         %xmm14,%xmm8,%xmm14
   .byte  196,65,9,254,246                    // vpaddd        %xmm14,%xmm14,%xmm14
   .byte  196,67,5,24,246,1                   // vinsertf128   $0x1,%xmm14,%ymm15,%ymm14
   .byte  196,65,12,86,228                    // vorps         %ymm12,%ymm14,%ymm12
-  .byte  196,98,125,24,53,20,171,2,0         // vbroadcastss  0x2ab14(%rip),%ymm14        # 3ab84 <_sk_srcover_bgra_8888_sse2_lowp+0x2b8>
+  .byte  196,98,125,24,53,88,166,2,0         // vbroadcastss  0x2a658(%rip),%ymm14        # 3a3b4 <_sk_srcover_bgra_8888_sse2_lowp+0x2b8>
   .byte  196,65,36,84,222                    // vandps        %ymm14,%ymm11,%ymm11
   .byte  196,193,9,114,211,1                 // vpsrld        $0x1,%xmm11,%xmm14
   .byte  196,67,125,25,219,1                 // vextractf128  $0x1,%ymm11,%xmm11
   .byte  196,193,33,114,211,1                // vpsrld        $0x1,%xmm11,%xmm11
   .byte  196,67,13,24,219,1                  // vinsertf128   $0x1,%xmm11,%ymm14,%ymm11
   .byte  196,65,20,86,219                    // vorps         %ymm11,%ymm13,%ymm11
-  .byte  197,123,18,45,230,188,2,0           // vmovddup      0x2bce6(%rip),%xmm13        # 3bd80 <_sk_srcover_bgra_8888_sse2_lowp+0x14b4>
+  .byte  197,123,18,45,58,184,2,0            // vmovddup      0x2b83a(%rip),%xmm13        # 3b5c0 <_sk_srcover_bgra_8888_sse2_lowp+0x14c4>
   .byte  196,65,49,219,205                   // vpand         %xmm13,%xmm9,%xmm9
   .byte  196,65,57,219,197                   // vpand         %xmm13,%xmm8,%xmm8
   .byte  196,193,49,114,209,2                // vpsrld        $0x2,%xmm9,%xmm9
@@ -15590,9 +15431,9 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  196,65,60,86,195                    // vorps         %ymm11,%ymm8,%ymm8
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  196,98,125,24,13,183,170,2,0        // vbroadcastss  0x2aab7(%rip),%ymm9        # 3ab8c <_sk_srcover_bgra_8888_sse2_lowp+0x2c0>
+  .byte  196,98,125,24,13,251,165,2,0        // vbroadcastss  0x2a5fb(%rip),%ymm9        # 3a3bc <_sk_srcover_bgra_8888_sse2_lowp+0x2c0>
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
-  .byte  196,98,125,24,13,173,170,2,0        // vbroadcastss  0x2aaad(%rip),%ymm9        # 3ab90 <_sk_srcover_bgra_8888_sse2_lowp+0x2c4>
+  .byte  196,98,125,24,13,241,165,2,0        // vbroadcastss  0x2a5f1(%rip),%ymm9        # 3a3c0 <_sk_srcover_bgra_8888_sse2_lowp+0x2c4>
   .byte  196,65,60,88,193                    // vaddps        %ymm9,%ymm8,%ymm8
   .byte  196,98,125,24,8                     // vbroadcastss  (%rax),%ymm9
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
@@ -15626,7 +15467,7 @@
 FUNCTION(_sk_black_color_avx)
 _sk_black_color_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,53,170,2,0        // vbroadcastss  0x2aa35(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,121,165,2,0       // vbroadcastss  0x2a579(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  197,236,87,210                      // vxorps        %ymm2,%ymm2,%ymm2
@@ -15637,7 +15478,7 @@
 FUNCTION(_sk_white_color_avx)
 _sk_white_color_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,28,170,2,0         // vbroadcastss  0x2aa1c(%rip),%ymm0        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,5,96,165,2,0         // vbroadcastss  0x2a560(%rip),%ymm0        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,252,40,200                      // vmovaps       %ymm0,%ymm1
   .byte  197,252,40,208                      // vmovaps       %ymm0,%ymm2
   .byte  197,252,40,216                      // vmovaps       %ymm0,%ymm3
@@ -15683,7 +15524,7 @@
 FUNCTION(_sk_srcatop_avx)
 _sk_srcatop_avx:
   .byte  197,252,89,199                      // vmulps        %ymm7,%ymm0,%ymm0
-  .byte  196,98,125,24,5,187,169,2,0         // vbroadcastss  0x2a9bb(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,255,164,2,0         // vbroadcastss  0x2a4ff(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  197,60,89,204                       // vmulps        %ymm4,%ymm8,%ymm9
   .byte  197,180,88,192                      // vaddps        %ymm0,%ymm9,%ymm0
@@ -15704,7 +15545,7 @@
 FUNCTION(_sk_dstatop_avx)
 _sk_dstatop_avx:
   .byte  197,100,89,196                      // vmulps        %ymm4,%ymm3,%ymm8
-  .byte  196,98,125,24,13,121,169,2,0        // vbroadcastss  0x2a979(%rip),%ymm9        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,13,189,164,2,0        // vbroadcastss  0x2a4bd(%rip),%ymm9        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,52,92,207                       // vsubps        %ymm7,%ymm9,%ymm9
   .byte  197,180,89,192                      // vmulps        %ymm0,%ymm9,%ymm0
   .byte  197,188,88,192                      // vaddps        %ymm0,%ymm8,%ymm0
@@ -15746,7 +15587,7 @@
 .globl _sk_srcout_avx
 FUNCTION(_sk_srcout_avx)
 _sk_srcout_avx:
-  .byte  196,98,125,24,5,20,169,2,0          // vbroadcastss  0x2a914(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,88,164,2,0          // vbroadcastss  0x2a458(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,199                       // vsubps        %ymm7,%ymm8,%ymm8
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
   .byte  197,188,89,201                      // vmulps        %ymm1,%ymm8,%ymm1
@@ -15759,7 +15600,7 @@
 .globl _sk_dstout_avx
 FUNCTION(_sk_dstout_avx)
 _sk_dstout_avx:
-  .byte  196,226,125,24,5,243,168,2,0        // vbroadcastss  0x2a8f3(%rip),%ymm0        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,5,55,164,2,0         // vbroadcastss  0x2a437(%rip),%ymm0        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,252,92,219                      // vsubps        %ymm3,%ymm0,%ymm3
   .byte  197,228,89,196                      // vmulps        %ymm4,%ymm3,%ymm0
   .byte  197,228,89,205                      // vmulps        %ymm5,%ymm3,%ymm1
@@ -15772,7 +15613,7 @@
 .globl _sk_srcover_avx
 FUNCTION(_sk_srcover_avx)
 _sk_srcover_avx:
-  .byte  196,98,125,24,5,210,168,2,0         // vbroadcastss  0x2a8d2(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,22,164,2,0          // vbroadcastss  0x2a416(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  197,60,89,204                       // vmulps        %ymm4,%ymm8,%ymm9
   .byte  197,180,88,192                      // vaddps        %ymm0,%ymm9,%ymm0
@@ -15789,7 +15630,7 @@
 .globl _sk_dstover_avx
 FUNCTION(_sk_dstover_avx)
 _sk_dstover_avx:
-  .byte  196,98,125,24,5,161,168,2,0         // vbroadcastss  0x2a8a1(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,229,163,2,0         // vbroadcastss  0x2a3e5(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,199                       // vsubps        %ymm7,%ymm8,%ymm8
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
   .byte  197,252,88,196                      // vaddps        %ymm4,%ymm0,%ymm0
@@ -15817,7 +15658,7 @@
 .globl _sk_multiply_avx
 FUNCTION(_sk_multiply_avx)
 _sk_multiply_avx:
-  .byte  196,98,125,24,5,92,168,2,0          // vbroadcastss  0x2a85c(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,160,163,2,0         // vbroadcastss  0x2a3a0(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,207                       // vsubps        %ymm7,%ymm8,%ymm9
   .byte  197,52,89,208                       // vmulps        %ymm0,%ymm9,%ymm10
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -15848,7 +15689,7 @@
 FUNCTION(_sk_plus__avx)
 _sk_plus__avx:
   .byte  197,252,88,196                      // vaddps        %ymm4,%ymm0,%ymm0
-  .byte  196,98,125,24,5,235,167,2,0         // vbroadcastss  0x2a7eb(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,47,163,2,0          // vbroadcastss  0x2a32f(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  197,244,88,205                      // vaddps        %ymm5,%ymm1,%ymm1
   .byte  196,193,116,93,200                  // vminps        %ymm8,%ymm1,%ymm1
@@ -15882,7 +15723,7 @@
 .globl _sk_xor__avx
 FUNCTION(_sk_xor__avx)
 _sk_xor__avx:
-  .byte  196,98,125,24,5,138,167,2,0         // vbroadcastss  0x2a78a(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,206,162,2,0         // vbroadcastss  0x2a2ce(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,207                       // vsubps        %ymm7,%ymm8,%ymm9
   .byte  197,180,89,192                      // vmulps        %ymm0,%ymm9,%ymm0
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -15919,7 +15760,7 @@
   .byte  197,100,89,206                      // vmulps        %ymm6,%ymm3,%ymm9
   .byte  196,193,108,95,209                  // vmaxps        %ymm9,%ymm2,%ymm2
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
-  .byte  196,98,125,24,5,6,167,2,0           // vbroadcastss  0x2a706(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,74,162,2,0          // vbroadcastss  0x2a24a(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  197,60,89,199                       // vmulps        %ymm7,%ymm8,%ymm8
   .byte  197,188,88,219                      // vaddps        %ymm3,%ymm8,%ymm3
@@ -15945,7 +15786,7 @@
   .byte  197,100,89,206                      // vmulps        %ymm6,%ymm3,%ymm9
   .byte  196,193,108,93,209                  // vminps        %ymm9,%ymm2,%ymm2
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
-  .byte  196,98,125,24,5,174,166,2,0         // vbroadcastss  0x2a6ae(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,242,161,2,0         // vbroadcastss  0x2a1f2(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  197,60,89,199                       // vmulps        %ymm7,%ymm8,%ymm8
   .byte  197,188,88,219                      // vaddps        %ymm3,%ymm8,%ymm3
@@ -15974,7 +15815,7 @@
   .byte  196,193,108,93,209                  // vminps        %ymm9,%ymm2,%ymm2
   .byte  197,236,88,210                      // vaddps        %ymm2,%ymm2,%ymm2
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
-  .byte  196,98,125,24,5,74,166,2,0          // vbroadcastss  0x2a64a(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,142,161,2,0         // vbroadcastss  0x2a18e(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  197,60,89,199                       // vmulps        %ymm7,%ymm8,%ymm8
   .byte  197,188,88,219                      // vaddps        %ymm3,%ymm8,%ymm3
@@ -15997,7 +15838,7 @@
   .byte  197,236,89,214                      // vmulps        %ymm6,%ymm2,%ymm2
   .byte  197,236,88,210                      // vaddps        %ymm2,%ymm2,%ymm2
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
-  .byte  196,98,125,24,5,1,166,2,0           // vbroadcastss  0x2a601(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,69,161,2,0          // vbroadcastss  0x2a145(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  197,60,89,199                       // vmulps        %ymm7,%ymm8,%ymm8
   .byte  197,188,88,219                      // vaddps        %ymm3,%ymm8,%ymm3
@@ -16008,7 +15849,7 @@
 .globl _sk_colorburn_avx
 FUNCTION(_sk_colorburn_avx)
 _sk_colorburn_avx:
-  .byte  196,98,125,24,5,232,165,2,0         // vbroadcastss  0x2a5e8(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,44,161,2,0          // vbroadcastss  0x2a12c(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,207                       // vsubps        %ymm7,%ymm8,%ymm9
   .byte  197,52,89,216                       // vmulps        %ymm0,%ymm9,%ymm11
   .byte  196,65,44,87,210                    // vxorps        %ymm10,%ymm10,%ymm10
@@ -16070,7 +15911,7 @@
 FUNCTION(_sk_colordodge_avx)
 _sk_colordodge_avx:
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
-  .byte  196,98,125,24,13,236,164,2,0        // vbroadcastss  0x2a4ec(%rip),%ymm9        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,13,48,160,2,0         // vbroadcastss  0x2a030(%rip),%ymm9        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,52,92,215                       // vsubps        %ymm7,%ymm9,%ymm10
   .byte  197,44,89,216                       // vmulps        %ymm0,%ymm10,%ymm11
   .byte  197,52,92,203                       // vsubps        %ymm3,%ymm9,%ymm9
@@ -16127,7 +15968,7 @@
 .globl _sk_hardlight_avx
 FUNCTION(_sk_hardlight_avx)
 _sk_hardlight_avx:
-  .byte  196,98,125,24,5,247,163,2,0         // vbroadcastss  0x2a3f7(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,59,159,2,0          // vbroadcastss  0x29f3b(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,215                       // vsubps        %ymm7,%ymm8,%ymm10
   .byte  197,44,89,200                       // vmulps        %ymm0,%ymm10,%ymm9
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -16182,7 +16023,7 @@
 .globl _sk_overlay_avx
 FUNCTION(_sk_overlay_avx)
 _sk_overlay_avx:
-  .byte  196,98,125,24,5,28,163,2,0          // vbroadcastss  0x2a31c(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,96,158,2,0          // vbroadcastss  0x29e60(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,215                       // vsubps        %ymm7,%ymm8,%ymm10
   .byte  197,44,89,200                       // vmulps        %ymm0,%ymm10,%ymm9
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -16248,10 +16089,10 @@
   .byte  196,65,60,88,192                    // vaddps        %ymm8,%ymm8,%ymm8
   .byte  196,65,60,89,216                    // vmulps        %ymm8,%ymm8,%ymm11
   .byte  196,65,60,88,195                    // vaddps        %ymm11,%ymm8,%ymm8
-  .byte  196,98,125,24,29,35,162,2,0         // vbroadcastss  0x2a223(%rip),%ymm11        # 3ab94 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
+  .byte  196,98,125,24,29,103,157,2,0        // vbroadcastss  0x29d67(%rip),%ymm11        # 3a3c4 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
   .byte  196,65,28,88,235                    // vaddps        %ymm11,%ymm12,%ymm13
   .byte  196,65,20,89,192                    // vmulps        %ymm8,%ymm13,%ymm8
-  .byte  196,98,125,24,45,20,162,2,0         // vbroadcastss  0x2a214(%rip),%ymm13        # 3ab98 <_sk_srcover_bgra_8888_sse2_lowp+0x2cc>
+  .byte  196,98,125,24,45,88,157,2,0         // vbroadcastss  0x29d58(%rip),%ymm13        # 3a3c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2cc>
   .byte  196,65,28,89,245                    // vmulps        %ymm13,%ymm12,%ymm14
   .byte  196,65,12,88,192                    // vaddps        %ymm8,%ymm14,%ymm8
   .byte  196,65,124,82,244                   // vrsqrtps      %ymm12,%ymm14
@@ -16262,7 +16103,7 @@
   .byte  197,4,194,255,2                     // vcmpleps      %ymm7,%ymm15,%ymm15
   .byte  196,67,13,74,240,240                // vblendvps     %ymm15,%ymm8,%ymm14,%ymm14
   .byte  197,116,88,249                      // vaddps        %ymm1,%ymm1,%ymm15
-  .byte  196,98,125,24,5,190,161,2,0         // vbroadcastss  0x2a1be(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,2,157,2,0           // vbroadcastss  0x29d02(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,60,92,228                    // vsubps        %ymm12,%ymm8,%ymm12
   .byte  197,132,92,195                      // vsubps        %ymm3,%ymm15,%ymm0
   .byte  196,65,124,89,228                   // vmulps        %ymm12,%ymm0,%ymm12
@@ -16389,12 +16230,12 @@
   .byte  196,65,28,89,219                    // vmulps        %ymm11,%ymm12,%ymm11
   .byte  196,65,36,94,222                    // vdivps        %ymm14,%ymm11,%ymm11
   .byte  196,67,37,74,224,240                // vblendvps     %ymm15,%ymm8,%ymm11,%ymm12
-  .byte  196,98,125,24,53,161,159,2,0        // vbroadcastss  0x29fa1(%rip),%ymm14        # 3ab9c <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  .byte  196,98,125,24,53,229,154,2,0        // vbroadcastss  0x29ae5(%rip),%ymm14        # 3a3cc <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
   .byte  196,65,92,89,222                    // vmulps        %ymm14,%ymm4,%ymm11
-  .byte  196,98,125,24,61,151,159,2,0        // vbroadcastss  0x29f97(%rip),%ymm15        # 3aba0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
+  .byte  196,98,125,24,61,219,154,2,0        // vbroadcastss  0x29adb(%rip),%ymm15        # 3a3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
   .byte  196,65,84,89,239                    // vmulps        %ymm15,%ymm5,%ymm13
   .byte  196,65,36,88,221                    // vaddps        %ymm13,%ymm11,%ymm11
-  .byte  196,226,125,24,5,136,159,2,0        // vbroadcastss  0x29f88(%rip),%ymm0        # 3aba4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
+  .byte  196,226,125,24,5,204,154,2,0        // vbroadcastss  0x29acc(%rip),%ymm0        # 3a3d4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
   .byte  197,76,89,232                       // vmulps        %ymm0,%ymm6,%ymm13
   .byte  196,65,36,88,221                    // vaddps        %ymm13,%ymm11,%ymm11
   .byte  196,65,52,89,238                    // vmulps        %ymm14,%ymm9,%ymm13
@@ -16455,7 +16296,7 @@
   .byte  196,65,36,95,208                    // vmaxps        %ymm8,%ymm11,%ymm10
   .byte  196,195,109,74,209,240              // vblendvps     %ymm15,%ymm9,%ymm2,%ymm2
   .byte  196,193,108,95,208                  // vmaxps        %ymm8,%ymm2,%ymm2
-  .byte  196,98,125,24,5,53,158,2,0          // vbroadcastss  0x29e35(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,121,153,2,0         // vbroadcastss  0x29979(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,207                       // vsubps        %ymm7,%ymm8,%ymm9
   .byte  197,180,89,201                      // vmulps        %ymm1,%ymm9,%ymm1
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -16512,12 +16353,12 @@
   .byte  196,65,28,89,219                    // vmulps        %ymm11,%ymm12,%ymm11
   .byte  196,65,36,94,222                    // vdivps        %ymm14,%ymm11,%ymm11
   .byte  196,67,37,74,224,240                // vblendvps     %ymm15,%ymm8,%ymm11,%ymm12
-  .byte  196,98,125,24,53,95,157,2,0         // vbroadcastss  0x29d5f(%rip),%ymm14        # 3ab9c <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  .byte  196,98,125,24,53,163,152,2,0        // vbroadcastss  0x298a3(%rip),%ymm14        # 3a3cc <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
   .byte  196,65,92,89,222                    // vmulps        %ymm14,%ymm4,%ymm11
-  .byte  196,98,125,24,61,85,157,2,0         // vbroadcastss  0x29d55(%rip),%ymm15        # 3aba0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
+  .byte  196,98,125,24,61,153,152,2,0        // vbroadcastss  0x29899(%rip),%ymm15        # 3a3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
   .byte  196,65,84,89,239                    // vmulps        %ymm15,%ymm5,%ymm13
   .byte  196,65,36,88,221                    // vaddps        %ymm13,%ymm11,%ymm11
-  .byte  196,226,125,24,5,70,157,2,0         // vbroadcastss  0x29d46(%rip),%ymm0        # 3aba4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
+  .byte  196,226,125,24,5,138,152,2,0        // vbroadcastss  0x2988a(%rip),%ymm0        # 3a3d4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
   .byte  197,76,89,232                       // vmulps        %ymm0,%ymm6,%ymm13
   .byte  196,65,36,88,221                    // vaddps        %ymm13,%ymm11,%ymm11
   .byte  196,65,52,89,238                    // vmulps        %ymm14,%ymm9,%ymm13
@@ -16578,7 +16419,7 @@
   .byte  196,65,36,95,208                    // vmaxps        %ymm8,%ymm11,%ymm10
   .byte  196,195,109,74,209,240              // vblendvps     %ymm15,%ymm9,%ymm2,%ymm2
   .byte  196,193,108,95,208                  // vmaxps        %ymm8,%ymm2,%ymm2
-  .byte  196,98,125,24,5,243,155,2,0         // vbroadcastss  0x29bf3(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,55,151,2,0          // vbroadcastss  0x29737(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,207                       // vsubps        %ymm7,%ymm8,%ymm9
   .byte  197,180,89,201                      // vmulps        %ymm1,%ymm9,%ymm1
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -16607,12 +16448,12 @@
   .byte  197,252,17,68,36,168                // vmovups       %ymm0,-0x58(%rsp)
   .byte  197,124,89,199                      // vmulps        %ymm7,%ymm0,%ymm8
   .byte  197,116,89,207                      // vmulps        %ymm7,%ymm1,%ymm9
-  .byte  196,98,125,24,45,165,155,2,0        // vbroadcastss  0x29ba5(%rip),%ymm13        # 3ab9c <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  .byte  196,98,125,24,45,233,150,2,0        // vbroadcastss  0x296e9(%rip),%ymm13        # 3a3cc <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
   .byte  196,65,92,89,213                    // vmulps        %ymm13,%ymm4,%ymm10
-  .byte  196,98,125,24,53,155,155,2,0        // vbroadcastss  0x29b9b(%rip),%ymm14        # 3aba0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
+  .byte  196,98,125,24,53,223,150,2,0        // vbroadcastss  0x296df(%rip),%ymm14        # 3a3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
   .byte  196,65,84,89,222                    // vmulps        %ymm14,%ymm5,%ymm11
   .byte  196,65,44,88,211                    // vaddps        %ymm11,%ymm10,%ymm10
-  .byte  196,98,125,24,61,140,155,2,0        // vbroadcastss  0x29b8c(%rip),%ymm15        # 3aba4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
+  .byte  196,98,125,24,61,208,150,2,0        // vbroadcastss  0x296d0(%rip),%ymm15        # 3a3d4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
   .byte  196,65,76,89,223                    // vmulps        %ymm15,%ymm6,%ymm11
   .byte  196,193,44,88,195                   // vaddps        %ymm11,%ymm10,%ymm0
   .byte  196,65,60,89,221                    // vmulps        %ymm13,%ymm8,%ymm11
@@ -16675,7 +16516,7 @@
   .byte  196,65,44,95,207                    // vmaxps        %ymm15,%ymm10,%ymm9
   .byte  196,195,37,74,192,0                 // vblendvps     %ymm0,%ymm8,%ymm11,%ymm0
   .byte  196,65,124,95,199                   // vmaxps        %ymm15,%ymm0,%ymm8
-  .byte  196,226,125,24,5,39,154,2,0         // vbroadcastss  0x29a27(%rip),%ymm0        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,5,107,149,2,0        // vbroadcastss  0x2956b(%rip),%ymm0        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,124,92,215                      // vsubps        %ymm7,%ymm0,%ymm10
   .byte  197,172,89,84,36,168                // vmulps        -0x58(%rsp),%ymm10,%ymm2
   .byte  197,124,92,219                      // vsubps        %ymm3,%ymm0,%ymm11
@@ -16705,12 +16546,12 @@
   .byte  197,252,40,208                      // vmovaps       %ymm0,%ymm2
   .byte  197,100,89,196                      // vmulps        %ymm4,%ymm3,%ymm8
   .byte  197,100,89,205                      // vmulps        %ymm5,%ymm3,%ymm9
-  .byte  196,98,125,24,45,213,153,2,0        // vbroadcastss  0x299d5(%rip),%ymm13        # 3ab9c <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  .byte  196,98,125,24,45,25,149,2,0         // vbroadcastss  0x29519(%rip),%ymm13        # 3a3cc <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
   .byte  196,65,108,89,213                   // vmulps        %ymm13,%ymm2,%ymm10
-  .byte  196,98,125,24,53,203,153,2,0        // vbroadcastss  0x299cb(%rip),%ymm14        # 3aba0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
+  .byte  196,98,125,24,53,15,149,2,0         // vbroadcastss  0x2950f(%rip),%ymm14        # 3a3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
   .byte  196,65,116,89,222                   // vmulps        %ymm14,%ymm1,%ymm11
   .byte  196,65,44,88,211                    // vaddps        %ymm11,%ymm10,%ymm10
-  .byte  196,98,125,24,61,188,153,2,0        // vbroadcastss  0x299bc(%rip),%ymm15        # 3aba4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
+  .byte  196,98,125,24,61,0,149,2,0          // vbroadcastss  0x29500(%rip),%ymm15        # 3a3d4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
   .byte  196,65,28,89,223                    // vmulps        %ymm15,%ymm12,%ymm11
   .byte  196,193,44,88,195                   // vaddps        %ymm11,%ymm10,%ymm0
   .byte  196,65,60,89,221                    // vmulps        %ymm13,%ymm8,%ymm11
@@ -16773,7 +16614,7 @@
   .byte  196,65,44,95,207                    // vmaxps        %ymm15,%ymm10,%ymm9
   .byte  196,195,37,74,192,0                 // vblendvps     %ymm0,%ymm8,%ymm11,%ymm0
   .byte  196,65,124,95,199                   // vmaxps        %ymm15,%ymm0,%ymm8
-  .byte  196,226,125,24,5,87,152,2,0         // vbroadcastss  0x29857(%rip),%ymm0        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,5,155,147,2,0        // vbroadcastss  0x2939b(%rip),%ymm0        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,124,92,215                      // vsubps        %ymm7,%ymm0,%ymm10
   .byte  197,172,89,210                      // vmulps        %ymm2,%ymm10,%ymm2
   .byte  197,124,92,219                      // vsubps        %ymm3,%ymm0,%ymm11
@@ -16798,16 +16639,14 @@
 FUNCTION(_sk_srcover_rgba_8888_avx)
 _sk_srcover_rgba_8888_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,87,1,0,0                     // jne           114e7 <_sk_srcover_rgba_8888_avx+0x177>
-  .byte  196,1,125,16,12,152                 // vmovupd       (%r8,%r11,4),%ymm9
-  .byte  197,125,40,5,162,157,2,0            // vmovapd       0x29da2(%rip),%ymm8        # 3b140 <_sk_srcover_bgra_8888_sse2_lowp+0x874>
+  .byte  15,133,87,1,0,0                     // jne           111cd <_sk_srcover_rgba_8888_avx+0x171>
+  .byte  196,65,125,16,12,144                // vmovupd       (%r8,%rdx,4),%ymm9
+  .byte  197,125,40,5,252,152,2,0            // vmovapd       0x298fc(%rip),%ymm8        # 3a980 <_sk_srcover_bgra_8888_sse2_lowp+0x884>
   .byte  196,193,53,84,224                   // vandpd        %ymm8,%ymm9,%ymm4
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
   .byte  196,193,81,114,209,8                // vpsrld        $0x8,%xmm9,%xmm5
@@ -16826,9 +16665,9 @@
   .byte  197,193,114,215,24                  // vpsrld        $0x18,%xmm7,%xmm7
   .byte  196,227,53,24,255,1                 // vinsertf128   $0x1,%xmm7,%ymm9,%ymm7
   .byte  197,252,91,255                      // vcvtdq2ps     %ymm7,%ymm7
-  .byte  196,98,125,24,13,120,151,2,0        // vbroadcastss  0x29778(%rip),%ymm9        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,13,194,146,2,0        // vbroadcastss  0x292c2(%rip),%ymm9        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,52,92,211                       // vsubps        %ymm3,%ymm9,%ymm10
-  .byte  196,98,125,24,13,151,151,2,0        // vbroadcastss  0x29797(%rip),%ymm9        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,98,125,24,13,225,146,2,0        // vbroadcastss  0x292e1(%rip),%ymm9        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   .byte  196,193,124,89,193                  // vmulps        %ymm9,%ymm0,%ymm0
   .byte  197,44,89,220                       // vmulps        %ymm4,%ymm10,%ymm11
   .byte  196,193,124,88,195                  // vaddps        %ymm11,%ymm0,%ymm0
@@ -16869,69 +16708,69 @@
   .byte  196,65,37,86,192                    // vorpd         %ymm8,%ymm11,%ymm8
   .byte  196,65,45,86,192                    // vorpd         %ymm8,%ymm10,%ymm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,66                              // jne           1151f <_sk_srcover_rgba_8888_avx+0x1af>
-  .byte  196,1,124,17,4,152                  // vmovups       %ymm8,(%r8,%r11,4)
+  .byte  117,59                              // jne           111fe <_sk_srcover_rgba_8888_avx+0x1a2>
+  .byte  196,65,124,17,4,144                 // vmovups       %ymm8,(%r8,%rdx,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,150,254,255,255              // ja            11396 <_sk_srcover_rgba_8888_avx+0x26>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,5,1,0,0                   // lea           0x105(%rip),%r10        # 11610 <_sk_srcover_rgba_8888_avx+0x2a0>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
-  .byte  255,224                             // jmpq          *%rax
-  .byte  196,1,122,16,12,152                 // vmovss        (%r8,%r11,4),%xmm9
-  .byte  233,119,254,255,255                 // jmpq          11396 <_sk_srcover_rgba_8888_avx+0x26>
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,180                             // ja            114e3 <_sk_srcover_rgba_8888_avx+0x173>
-  .byte  65,15,182,193                       // movzbl        %r9b,%eax
-  .byte  76,141,13,242,0,0,0                 // lea           0xf2(%rip),%r9        # 1162c <_sk_srcover_rgba_8888_avx+0x2bc>
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  15,135,156,254,255,255              // ja            1107c <_sk_srcover_rgba_8888_avx+0x20>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,254,0,0,0                 // lea           0xfe(%rip),%r9        # 112e8 <_sk_srcover_rgba_8888_avx+0x28c>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,1,121,126,4,152                 // vmovd         %xmm8,(%r8,%r11,4)
-  .byte  235,152                             // jmp           114e3 <_sk_srcover_rgba_8888_avx+0x173>
-  .byte  196,129,121,110,100,152,8           // vmovd         0x8(%r8,%r11,4),%xmm4
+  .byte  196,65,122,16,12,144                // vmovss        (%r8,%rdx,4),%xmm9
+  .byte  233,126,254,255,255                 // jmpq          1107c <_sk_srcover_rgba_8888_avx+0x20>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,193                             // ja            111c9 <_sk_srcover_rgba_8888_avx+0x16d>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,242,0,0,0                 // lea           0xf2(%rip),%r9        # 11304 <_sk_srcover_rgba_8888_avx+0x2a8>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
+  .byte  255,224                             // jmpq          *%rax
+  .byte  196,65,121,126,4,144                // vmovd         %xmm8,(%r8,%rdx,4)
+  .byte  235,166                             // jmp           111c9 <_sk_srcover_rgba_8888_avx+0x16d>
+  .byte  196,193,121,110,100,144,8           // vmovd         0x8(%r8,%rdx,4),%xmm4
   .byte  197,249,112,228,68                  // vpshufd       $0x44,%xmm4,%xmm4
   .byte  197,212,87,237                      // vxorps        %ymm5,%ymm5,%ymm5
   .byte  196,99,85,12,204,4                  // vblendps      $0x4,%ymm4,%ymm5,%ymm9
-  .byte  196,129,123,16,36,152               // vmovsd        (%r8,%r11,4),%xmm4
+  .byte  196,193,123,16,36,144               // vmovsd        (%r8,%rdx,4),%xmm4
   .byte  196,99,53,13,204,1                  // vblendpd      $0x1,%ymm4,%ymm9,%ymm9
-  .byte  233,36,254,255,255                  // jmpq          11396 <_sk_srcover_rgba_8888_avx+0x26>
-  .byte  196,129,121,110,100,152,24          // vmovd         0x18(%r8,%r11,4),%xmm4
+  .byte  233,50,254,255,255                  // jmpq          1107c <_sk_srcover_rgba_8888_avx+0x20>
+  .byte  196,193,121,110,100,144,24          // vmovd         0x18(%r8,%rdx,4),%xmm4
   .byte  197,249,112,228,68                  // vpshufd       $0x44,%xmm4,%xmm4
   .byte  196,227,125,24,228,1                // vinsertf128   $0x1,%xmm4,%ymm0,%ymm4
   .byte  197,212,87,237                      // vxorps        %ymm5,%ymm5,%ymm5
   .byte  196,99,85,12,204,64                 // vblendps      $0x40,%ymm4,%ymm5,%ymm9
   .byte  196,99,125,25,204,1                 // vextractf128  $0x1,%ymm9,%xmm4
-  .byte  196,131,89,34,100,152,20,1          // vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,20,1          // vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,99,53,24,204,1                  // vinsertf128   $0x1,%xmm4,%ymm9,%ymm9
   .byte  196,99,125,25,204,1                 // vextractf128  $0x1,%ymm9,%xmm4
-  .byte  196,131,89,34,100,152,16,0          // vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,16,0          // vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,99,53,24,204,1                  // vinsertf128   $0x1,%xmm4,%ymm9,%ymm9
-  .byte  196,129,121,16,36,152               // vmovupd       (%r8,%r11,4),%xmm4
+  .byte  196,193,121,16,36,144               // vmovupd       (%r8,%rdx,4),%xmm4
   .byte  196,67,93,13,201,12                 // vblendpd      $0xc,%ymm9,%ymm4,%ymm9
-  .byte  233,207,253,255,255                 // jmpq          11396 <_sk_srcover_rgba_8888_avx+0x26>
-  .byte  196,3,121,22,68,152,8,2             // vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
-  .byte  196,1,121,214,4,152                 // vmovq         %xmm8,(%r8,%r11,4)
-  .byte  233,9,255,255,255                   // jmpq          114e3 <_sk_srcover_rgba_8888_avx+0x173>
+  .byte  233,221,253,255,255                 // jmpq          1107c <_sk_srcover_rgba_8888_avx+0x20>
+  .byte  196,67,121,22,68,144,8,2            // vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
+  .byte  196,65,121,214,4,144                // vmovq         %xmm8,(%r8,%rdx,4)
+  .byte  233,23,255,255,255                  // jmpq          111c9 <_sk_srcover_rgba_8888_avx+0x16d>
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,24,2            // vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,24,2           // vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,20,1            // vpextrd       $0x1,%xmm9,0x14(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,20,1           // vpextrd       $0x1,%xmm9,0x14(%r8,%rdx,4)
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
-  .byte  196,1,121,126,76,152,16             // vmovd         %xmm9,0x10(%r8,%r11,4)
-  .byte  196,1,121,17,4,152                  // vmovupd       %xmm8,(%r8,%r11,4)
-  .byte  233,213,254,255,255                 // jmpq          114e3 <_sk_srcover_rgba_8888_avx+0x173>
+  .byte  196,65,121,126,76,144,16            // vmovd         %xmm9,0x10(%r8,%rdx,4)
+  .byte  196,65,121,17,4,144                 // vmovupd       %xmm8,(%r8,%rdx,4)
+  .byte  233,227,254,255,255                 // jmpq          111c9 <_sk_srcover_rgba_8888_avx+0x16d>
   .byte  102,144                             // xchg          %ax,%ax
-  .byte  4,255                               // add           $0xff,%al
+  .byte  11,255                              // or            %edi,%edi
   .byte  255                                 // (bad)
   .byte  255,81,255                          // callq         *-0x1(%rcx)
   .byte  255                                 // (bad)
@@ -16942,7 +16781,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  126,255                             // jle           11625 <_sk_srcover_rgba_8888_avx+0x2b5>
+  .byte  126,255                             // jle           112fd <_sk_srcover_rgba_8888_avx+0x2a1>
   .byte  255                                 // (bad)
   .byte  255,98,255                          // jmpq          *-0x1(%rdx)
   .byte  255                                 // (bad)
@@ -16969,16 +16808,14 @@
 FUNCTION(_sk_srcover_bgra_8888_avx)
 _sk_srcover_bgra_8888_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,87,1,0,0                     // jne           117bf <_sk_srcover_bgra_8888_avx+0x177>
-  .byte  196,1,125,16,12,152                 // vmovupd       (%r8,%r11,4),%ymm9
-  .byte  197,125,40,5,234,154,2,0            // vmovapd       0x29aea(%rip),%ymm8        # 3b160 <_sk_srcover_bgra_8888_sse2_lowp+0x894>
+  .byte  15,133,87,1,0,0                     // jne           11491 <_sk_srcover_bgra_8888_avx+0x171>
+  .byte  196,65,125,16,12,144                // vmovupd       (%r8,%rdx,4),%ymm9
+  .byte  197,125,40,5,88,150,2,0             // vmovapd       0x29658(%rip),%ymm8        # 3a9a0 <_sk_srcover_bgra_8888_sse2_lowp+0x8a4>
   .byte  196,193,53,84,232                   // vandpd        %ymm8,%ymm9,%ymm5
   .byte  197,252,91,245                      // vcvtdq2ps     %ymm5,%ymm6
   .byte  196,193,81,114,209,8                // vpsrld        $0x8,%xmm9,%xmm5
@@ -16997,9 +16834,9 @@
   .byte  197,193,114,215,24                  // vpsrld        $0x18,%xmm7,%xmm7
   .byte  196,227,53,24,255,1                 // vinsertf128   $0x1,%xmm7,%ymm9,%ymm7
   .byte  197,252,91,255                      // vcvtdq2ps     %ymm7,%ymm7
-  .byte  196,98,125,24,13,160,148,2,0        // vbroadcastss  0x294a0(%rip),%ymm9        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,13,254,143,2,0        // vbroadcastss  0x28ffe(%rip),%ymm9        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,52,92,211                       // vsubps        %ymm3,%ymm9,%ymm10
-  .byte  196,98,125,24,13,191,148,2,0        // vbroadcastss  0x294bf(%rip),%ymm9        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,98,125,24,13,29,144,2,0         // vbroadcastss  0x2901d(%rip),%ymm9        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   .byte  196,193,124,89,193                  // vmulps        %ymm9,%ymm0,%ymm0
   .byte  197,44,89,220                       // vmulps        %ymm4,%ymm10,%ymm11
   .byte  196,193,124,88,195                  // vaddps        %ymm11,%ymm0,%ymm0
@@ -17040,69 +16877,69 @@
   .byte  196,65,37,86,192                    // vorpd         %ymm8,%ymm11,%ymm8
   .byte  196,65,45,86,192                    // vorpd         %ymm8,%ymm10,%ymm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,66                              // jne           117f7 <_sk_srcover_bgra_8888_avx+0x1af>
-  .byte  196,1,124,17,4,152                  // vmovups       %ymm8,(%r8,%r11,4)
+  .byte  117,59                              // jne           114c2 <_sk_srcover_bgra_8888_avx+0x1a2>
+  .byte  196,65,124,17,4,144                 // vmovups       %ymm8,(%r8,%rdx,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,150,254,255,255              // ja            1166e <_sk_srcover_bgra_8888_avx+0x26>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,5,1,0,0                   // lea           0x105(%rip),%r10        # 118e8 <_sk_srcover_bgra_8888_avx+0x2a0>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
-  .byte  255,224                             // jmpq          *%rax
-  .byte  196,1,122,16,12,152                 // vmovss        (%r8,%r11,4),%xmm9
-  .byte  233,119,254,255,255                 // jmpq          1166e <_sk_srcover_bgra_8888_avx+0x26>
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,180                             // ja            117bb <_sk_srcover_bgra_8888_avx+0x173>
-  .byte  65,15,182,193                       // movzbl        %r9b,%eax
-  .byte  76,141,13,242,0,0,0                 // lea           0xf2(%rip),%r9        # 11904 <_sk_srcover_bgra_8888_avx+0x2bc>
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  15,135,156,254,255,255              // ja            11340 <_sk_srcover_bgra_8888_avx+0x20>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,254,0,0,0                 // lea           0xfe(%rip),%r9        # 115ac <_sk_srcover_bgra_8888_avx+0x28c>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,1,121,126,4,152                 // vmovd         %xmm8,(%r8,%r11,4)
-  .byte  235,152                             // jmp           117bb <_sk_srcover_bgra_8888_avx+0x173>
-  .byte  196,129,121,110,100,152,8           // vmovd         0x8(%r8,%r11,4),%xmm4
+  .byte  196,65,122,16,12,144                // vmovss        (%r8,%rdx,4),%xmm9
+  .byte  233,126,254,255,255                 // jmpq          11340 <_sk_srcover_bgra_8888_avx+0x20>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,193                             // ja            1148d <_sk_srcover_bgra_8888_avx+0x16d>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,242,0,0,0                 // lea           0xf2(%rip),%r9        # 115c8 <_sk_srcover_bgra_8888_avx+0x2a8>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
+  .byte  255,224                             // jmpq          *%rax
+  .byte  196,65,121,126,4,144                // vmovd         %xmm8,(%r8,%rdx,4)
+  .byte  235,166                             // jmp           1148d <_sk_srcover_bgra_8888_avx+0x16d>
+  .byte  196,193,121,110,100,144,8           // vmovd         0x8(%r8,%rdx,4),%xmm4
   .byte  197,249,112,228,68                  // vpshufd       $0x44,%xmm4,%xmm4
   .byte  197,212,87,237                      // vxorps        %ymm5,%ymm5,%ymm5
   .byte  196,99,85,12,204,4                  // vblendps      $0x4,%ymm4,%ymm5,%ymm9
-  .byte  196,129,123,16,36,152               // vmovsd        (%r8,%r11,4),%xmm4
+  .byte  196,193,123,16,36,144               // vmovsd        (%r8,%rdx,4),%xmm4
   .byte  196,99,53,13,204,1                  // vblendpd      $0x1,%ymm4,%ymm9,%ymm9
-  .byte  233,36,254,255,255                  // jmpq          1166e <_sk_srcover_bgra_8888_avx+0x26>
-  .byte  196,129,121,110,100,152,24          // vmovd         0x18(%r8,%r11,4),%xmm4
+  .byte  233,50,254,255,255                  // jmpq          11340 <_sk_srcover_bgra_8888_avx+0x20>
+  .byte  196,193,121,110,100,144,24          // vmovd         0x18(%r8,%rdx,4),%xmm4
   .byte  197,249,112,228,68                  // vpshufd       $0x44,%xmm4,%xmm4
   .byte  196,227,125,24,228,1                // vinsertf128   $0x1,%xmm4,%ymm0,%ymm4
   .byte  197,212,87,237                      // vxorps        %ymm5,%ymm5,%ymm5
   .byte  196,99,85,12,204,64                 // vblendps      $0x40,%ymm4,%ymm5,%ymm9
   .byte  196,99,125,25,204,1                 // vextractf128  $0x1,%ymm9,%xmm4
-  .byte  196,131,89,34,100,152,20,1          // vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,20,1          // vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,99,53,24,204,1                  // vinsertf128   $0x1,%xmm4,%ymm9,%ymm9
   .byte  196,99,125,25,204,1                 // vextractf128  $0x1,%ymm9,%xmm4
-  .byte  196,131,89,34,100,152,16,0          // vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,16,0          // vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,99,53,24,204,1                  // vinsertf128   $0x1,%xmm4,%ymm9,%ymm9
-  .byte  196,129,121,16,36,152               // vmovupd       (%r8,%r11,4),%xmm4
+  .byte  196,193,121,16,36,144               // vmovupd       (%r8,%rdx,4),%xmm4
   .byte  196,67,93,13,201,12                 // vblendpd      $0xc,%ymm9,%ymm4,%ymm9
-  .byte  233,207,253,255,255                 // jmpq          1166e <_sk_srcover_bgra_8888_avx+0x26>
-  .byte  196,3,121,22,68,152,8,2             // vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
-  .byte  196,1,121,214,4,152                 // vmovq         %xmm8,(%r8,%r11,4)
-  .byte  233,9,255,255,255                   // jmpq          117bb <_sk_srcover_bgra_8888_avx+0x173>
+  .byte  233,221,253,255,255                 // jmpq          11340 <_sk_srcover_bgra_8888_avx+0x20>
+  .byte  196,67,121,22,68,144,8,2            // vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
+  .byte  196,65,121,214,4,144                // vmovq         %xmm8,(%r8,%rdx,4)
+  .byte  233,23,255,255,255                  // jmpq          1148d <_sk_srcover_bgra_8888_avx+0x16d>
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,24,2            // vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,24,2           // vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,20,1            // vpextrd       $0x1,%xmm9,0x14(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,20,1           // vpextrd       $0x1,%xmm9,0x14(%r8,%rdx,4)
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
-  .byte  196,1,121,126,76,152,16             // vmovd         %xmm9,0x10(%r8,%r11,4)
-  .byte  196,1,121,17,4,152                  // vmovupd       %xmm8,(%r8,%r11,4)
-  .byte  233,213,254,255,255                 // jmpq          117bb <_sk_srcover_bgra_8888_avx+0x173>
+  .byte  196,65,121,126,76,144,16            // vmovd         %xmm9,0x10(%r8,%rdx,4)
+  .byte  196,65,121,17,4,144                 // vmovupd       %xmm8,(%r8,%rdx,4)
+  .byte  233,227,254,255,255                 // jmpq          1148d <_sk_srcover_bgra_8888_avx+0x16d>
   .byte  102,144                             // xchg          %ax,%ax
-  .byte  4,255                               // add           $0xff,%al
+  .byte  11,255                              // or            %edi,%edi
   .byte  255                                 // (bad)
   .byte  255,81,255                          // callq         *-0x1(%rcx)
   .byte  255                                 // (bad)
@@ -17113,7 +16950,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  126,255                             // jle           118fd <_sk_srcover_bgra_8888_avx+0x2b5>
+  .byte  126,255                             // jle           115c1 <_sk_srcover_bgra_8888_avx+0x2a1>
   .byte  255                                 // (bad)
   .byte  255,98,255                          // jmpq          *-0x1(%rdx)
   .byte  255                                 // (bad)
@@ -17151,7 +16988,7 @@
 .globl _sk_clamp_1_avx
 FUNCTION(_sk_clamp_1_avx)
 _sk_clamp_1_avx:
-  .byte  196,98,125,24,5,54,146,2,0          // vbroadcastss  0x29236(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,162,141,2,0         // vbroadcastss  0x28da2(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  196,193,116,93,200                  // vminps        %ymm8,%ymm1,%ymm1
   .byte  196,193,108,93,208                  // vminps        %ymm8,%ymm2,%ymm2
@@ -17163,7 +17000,7 @@
 .globl _sk_clamp_a_avx
 FUNCTION(_sk_clamp_a_avx)
 _sk_clamp_a_avx:
-  .byte  196,98,125,24,5,21,146,2,0          // vbroadcastss  0x29215(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,129,141,2,0         // vbroadcastss  0x28d81(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,100,93,216                  // vminps        %ymm8,%ymm3,%ymm3
   .byte  197,252,93,195                      // vminps        %ymm3,%ymm0,%ymm0
   .byte  197,244,93,203                      // vminps        %ymm3,%ymm1,%ymm1
@@ -17175,7 +17012,7 @@
 .globl _sk_clamp_a_dst_avx
 FUNCTION(_sk_clamp_a_dst_avx)
 _sk_clamp_a_dst_avx:
-  .byte  196,98,125,24,5,247,145,2,0         // vbroadcastss  0x291f7(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,99,141,2,0          // vbroadcastss  0x28d63(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,68,93,248                   // vminps        %ymm8,%ymm7,%ymm7
   .byte  197,220,93,231                      // vminps        %ymm7,%ymm4,%ymm4
   .byte  197,212,93,239                      // vminps        %ymm7,%ymm5,%ymm5
@@ -17208,7 +17045,7 @@
 .globl _sk_invert_avx
 FUNCTION(_sk_invert_avx)
 _sk_invert_avx:
-  .byte  196,98,125,24,5,178,145,2,0         // vbroadcastss  0x291b2(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,30,141,2,0          // vbroadcastss  0x28d1e(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,188,92,192                      // vsubps        %ymm0,%ymm8,%ymm0
   .byte  197,188,92,201                      // vsubps        %ymm1,%ymm8,%ymm1
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
@@ -17262,9 +17099,9 @@
 .globl _sk_unpremul_avx
 FUNCTION(_sk_unpremul_avx)
 _sk_unpremul_avx:
-  .byte  196,98,125,24,5,77,145,2,0          // vbroadcastss  0x2914d(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,185,140,2,0         // vbroadcastss  0x28cb9(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,94,195                       // vdivps        %ymm3,%ymm8,%ymm8
-  .byte  196,98,125,24,13,112,145,2,0        // vbroadcastss  0x29170(%rip),%ymm9        # 3abac <_sk_srcover_bgra_8888_sse2_lowp+0x2e0>
+  .byte  196,98,125,24,13,220,140,2,0        // vbroadcastss  0x28cdc(%rip),%ymm9        # 3a3dc <_sk_srcover_bgra_8888_sse2_lowp+0x2e0>
   .byte  196,65,60,194,201,1                 // vcmpltps      %ymm9,%ymm8,%ymm9
   .byte  196,65,44,87,210                    // vxorps        %ymm10,%ymm10,%ymm10
   .byte  196,67,45,74,192,144                // vblendvps     %ymm9,%ymm8,%ymm10,%ymm8
@@ -17278,17 +17115,17 @@
 .globl _sk_from_srgb_avx
 FUNCTION(_sk_from_srgb_avx)
 _sk_from_srgb_avx:
-  .byte  196,98,125,24,5,74,145,2,0          // vbroadcastss  0x2914a(%rip),%ymm8        # 3abb0 <_sk_srcover_bgra_8888_sse2_lowp+0x2e4>
+  .byte  196,98,125,24,5,182,140,2,0         // vbroadcastss  0x28cb6(%rip),%ymm8        # 3a3e0 <_sk_srcover_bgra_8888_sse2_lowp+0x2e4>
   .byte  196,65,124,89,200                   // vmulps        %ymm8,%ymm0,%ymm9
   .byte  197,124,89,208                      // vmulps        %ymm0,%ymm0,%ymm10
-  .byte  196,98,125,24,29,36,145,2,0         // vbroadcastss  0x29124(%rip),%ymm11        # 3ab9c <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  .byte  196,98,125,24,29,144,140,2,0        // vbroadcastss  0x28c90(%rip),%ymm11        # 3a3cc <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
   .byte  196,65,124,89,227                   // vmulps        %ymm11,%ymm0,%ymm12
-  .byte  196,98,125,24,45,46,145,2,0         // vbroadcastss  0x2912e(%rip),%ymm13        # 3abb4 <_sk_srcover_bgra_8888_sse2_lowp+0x2e8>
+  .byte  196,98,125,24,45,154,140,2,0        // vbroadcastss  0x28c9a(%rip),%ymm13        # 3a3e4 <_sk_srcover_bgra_8888_sse2_lowp+0x2e8>
   .byte  196,65,28,88,229                    // vaddps        %ymm13,%ymm12,%ymm12
   .byte  196,65,44,89,212                    // vmulps        %ymm12,%ymm10,%ymm10
-  .byte  196,98,125,24,37,31,145,2,0         // vbroadcastss  0x2911f(%rip),%ymm12        # 3abb8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ec>
+  .byte  196,98,125,24,37,139,140,2,0        // vbroadcastss  0x28c8b(%rip),%ymm12        # 3a3e8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ec>
   .byte  196,65,44,88,212                    // vaddps        %ymm12,%ymm10,%ymm10
-  .byte  196,98,125,24,53,21,145,2,0         // vbroadcastss  0x29115(%rip),%ymm14        # 3abbc <_sk_srcover_bgra_8888_sse2_lowp+0x2f0>
+  .byte  196,98,125,24,53,129,140,2,0        // vbroadcastss  0x28c81(%rip),%ymm14        # 3a3ec <_sk_srcover_bgra_8888_sse2_lowp+0x2f0>
   .byte  196,193,124,194,198,1               // vcmpltps      %ymm14,%ymm0,%ymm0
   .byte  196,195,45,74,193,0                 // vblendvps     %ymm0,%ymm9,%ymm10,%ymm0
   .byte  196,65,116,89,200                   // vmulps        %ymm8,%ymm1,%ymm9
@@ -17314,17 +17151,17 @@
 .globl _sk_from_srgb_dst_avx
 FUNCTION(_sk_from_srgb_dst_avx)
 _sk_from_srgb_dst_avx:
-  .byte  196,98,125,24,5,158,144,2,0         // vbroadcastss  0x2909e(%rip),%ymm8        # 3abb0 <_sk_srcover_bgra_8888_sse2_lowp+0x2e4>
+  .byte  196,98,125,24,5,10,140,2,0          // vbroadcastss  0x28c0a(%rip),%ymm8        # 3a3e0 <_sk_srcover_bgra_8888_sse2_lowp+0x2e4>
   .byte  196,65,92,89,200                    // vmulps        %ymm8,%ymm4,%ymm9
   .byte  197,92,89,212                       // vmulps        %ymm4,%ymm4,%ymm10
-  .byte  196,98,125,24,29,120,144,2,0        // vbroadcastss  0x29078(%rip),%ymm11        # 3ab9c <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  .byte  196,98,125,24,29,228,139,2,0        // vbroadcastss  0x28be4(%rip),%ymm11        # 3a3cc <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
   .byte  196,65,92,89,227                    // vmulps        %ymm11,%ymm4,%ymm12
-  .byte  196,98,125,24,45,130,144,2,0        // vbroadcastss  0x29082(%rip),%ymm13        # 3abb4 <_sk_srcover_bgra_8888_sse2_lowp+0x2e8>
+  .byte  196,98,125,24,45,238,139,2,0        // vbroadcastss  0x28bee(%rip),%ymm13        # 3a3e4 <_sk_srcover_bgra_8888_sse2_lowp+0x2e8>
   .byte  196,65,28,88,229                    // vaddps        %ymm13,%ymm12,%ymm12
   .byte  196,65,44,89,212                    // vmulps        %ymm12,%ymm10,%ymm10
-  .byte  196,98,125,24,37,115,144,2,0        // vbroadcastss  0x29073(%rip),%ymm12        # 3abb8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ec>
+  .byte  196,98,125,24,37,223,139,2,0        // vbroadcastss  0x28bdf(%rip),%ymm12        # 3a3e8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ec>
   .byte  196,65,44,88,212                    // vaddps        %ymm12,%ymm10,%ymm10
-  .byte  196,98,125,24,53,105,144,2,0        // vbroadcastss  0x29069(%rip),%ymm14        # 3abbc <_sk_srcover_bgra_8888_sse2_lowp+0x2f0>
+  .byte  196,98,125,24,53,213,139,2,0        // vbroadcastss  0x28bd5(%rip),%ymm14        # 3a3ec <_sk_srcover_bgra_8888_sse2_lowp+0x2f0>
   .byte  196,193,92,194,230,1                // vcmpltps      %ymm14,%ymm4,%ymm4
   .byte  196,195,45,74,225,64                // vblendvps     %ymm4,%ymm9,%ymm10,%ymm4
   .byte  196,65,84,89,200                    // vmulps        %ymm8,%ymm5,%ymm9
@@ -17351,20 +17188,20 @@
 FUNCTION(_sk_to_srgb_avx)
 _sk_to_srgb_avx:
   .byte  197,124,82,200                      // vrsqrtps      %ymm0,%ymm9
-  .byte  196,98,125,24,5,254,143,2,0         // vbroadcastss  0x28ffe(%rip),%ymm8        # 3abc0 <_sk_srcover_bgra_8888_sse2_lowp+0x2f4>
+  .byte  196,98,125,24,5,106,139,2,0         // vbroadcastss  0x28b6a(%rip),%ymm8        # 3a3f0 <_sk_srcover_bgra_8888_sse2_lowp+0x2f4>
   .byte  196,65,124,89,208                   // vmulps        %ymm8,%ymm0,%ymm10
-  .byte  196,98,125,24,29,248,143,2,0        // vbroadcastss  0x28ff8(%rip),%ymm11        # 3abc8 <_sk_srcover_bgra_8888_sse2_lowp+0x2fc>
+  .byte  196,98,125,24,29,100,139,2,0        // vbroadcastss  0x28b64(%rip),%ymm11        # 3a3f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2fc>
   .byte  196,65,52,89,227                    // vmulps        %ymm11,%ymm9,%ymm12
-  .byte  196,98,125,24,45,230,143,2,0        // vbroadcastss  0x28fe6(%rip),%ymm13        # 3abc4 <_sk_srcover_bgra_8888_sse2_lowp+0x2f8>
+  .byte  196,98,125,24,45,82,139,2,0         // vbroadcastss  0x28b52(%rip),%ymm13        # 3a3f4 <_sk_srcover_bgra_8888_sse2_lowp+0x2f8>
   .byte  196,65,28,88,229                    // vaddps        %ymm13,%ymm12,%ymm12
   .byte  196,65,52,89,228                    // vmulps        %ymm12,%ymm9,%ymm12
-  .byte  196,98,125,24,53,3,145,2,0          // vbroadcastss  0x29103(%rip),%ymm14        # 3acf4 <_sk_srcover_bgra_8888_sse2_lowp+0x428>
+  .byte  196,98,125,24,53,111,140,2,0        // vbroadcastss  0x28c6f(%rip),%ymm14        # 3a524 <_sk_srcover_bgra_8888_sse2_lowp+0x428>
   .byte  196,65,28,88,230                    // vaddps        %ymm14,%ymm12,%ymm12
-  .byte  196,98,125,24,61,249,144,2,0        // vbroadcastss  0x290f9(%rip),%ymm15        # 3acf8 <_sk_srcover_bgra_8888_sse2_lowp+0x42c>
+  .byte  196,98,125,24,61,101,140,2,0        // vbroadcastss  0x28c65(%rip),%ymm15        # 3a528 <_sk_srcover_bgra_8888_sse2_lowp+0x42c>
   .byte  196,65,52,88,207                    // vaddps        %ymm15,%ymm9,%ymm9
   .byte  196,65,124,83,201                   // vrcpps        %ymm9,%ymm9
   .byte  196,65,52,89,204                    // vmulps        %ymm12,%ymm9,%ymm9
-  .byte  196,98,125,24,37,189,143,2,0        // vbroadcastss  0x28fbd(%rip),%ymm12        # 3abd4 <_sk_srcover_bgra_8888_sse2_lowp+0x308>
+  .byte  196,98,125,24,37,41,139,2,0         // vbroadcastss  0x28b29(%rip),%ymm12        # 3a404 <_sk_srcover_bgra_8888_sse2_lowp+0x308>
   .byte  196,193,124,194,196,1               // vcmpltps      %ymm12,%ymm0,%ymm0
   .byte  196,195,53,74,194,0                 // vblendvps     %ymm0,%ymm10,%ymm9,%ymm0
   .byte  197,124,82,201                      // vrsqrtps      %ymm1,%ymm9
@@ -17401,7 +17238,7 @@
   .byte  197,116,93,202                      // vminps        %ymm2,%ymm1,%ymm9
   .byte  196,65,124,93,201                   // vminps        %ymm9,%ymm0,%ymm9
   .byte  196,65,60,92,209                    // vsubps        %ymm9,%ymm8,%ymm10
-  .byte  196,98,125,24,29,197,142,2,0        // vbroadcastss  0x28ec5(%rip),%ymm11        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,29,49,138,2,0         // vbroadcastss  0x28a31(%rip),%ymm11        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,36,94,218                    // vdivps        %ymm10,%ymm11,%ymm11
   .byte  197,116,92,226                      // vsubps        %ymm2,%ymm1,%ymm12
   .byte  196,65,28,89,227                    // vmulps        %ymm11,%ymm12,%ymm12
@@ -17411,19 +17248,19 @@
   .byte  196,193,108,89,211                  // vmulps        %ymm11,%ymm2,%ymm2
   .byte  197,252,92,201                      // vsubps        %ymm1,%ymm0,%ymm1
   .byte  196,193,116,89,203                  // vmulps        %ymm11,%ymm1,%ymm1
-  .byte  196,98,125,24,29,246,142,2,0        // vbroadcastss  0x28ef6(%rip),%ymm11        # 3abe0 <_sk_srcover_bgra_8888_sse2_lowp+0x314>
+  .byte  196,98,125,24,29,98,138,2,0         // vbroadcastss  0x28a62(%rip),%ymm11        # 3a410 <_sk_srcover_bgra_8888_sse2_lowp+0x314>
   .byte  196,193,116,88,203                  // vaddps        %ymm11,%ymm1,%ymm1
-  .byte  196,98,125,24,29,228,142,2,0        // vbroadcastss  0x28ee4(%rip),%ymm11        # 3abdc <_sk_srcover_bgra_8888_sse2_lowp+0x310>
+  .byte  196,98,125,24,29,80,138,2,0         // vbroadcastss  0x28a50(%rip),%ymm11        # 3a40c <_sk_srcover_bgra_8888_sse2_lowp+0x310>
   .byte  196,193,108,88,211                  // vaddps        %ymm11,%ymm2,%ymm2
   .byte  196,227,117,74,202,224              // vblendvps     %ymm14,%ymm2,%ymm1,%ymm1
-  .byte  196,226,125,24,21,204,142,2,0       // vbroadcastss  0x28ecc(%rip),%ymm2        # 3abd8 <_sk_srcover_bgra_8888_sse2_lowp+0x30c>
+  .byte  196,226,125,24,21,56,138,2,0        // vbroadcastss  0x28a38(%rip),%ymm2        # 3a408 <_sk_srcover_bgra_8888_sse2_lowp+0x30c>
   .byte  196,65,12,87,246                    // vxorps        %ymm14,%ymm14,%ymm14
   .byte  196,227,13,74,210,208               // vblendvps     %ymm13,%ymm2,%ymm14,%ymm2
   .byte  197,188,194,192,0                   // vcmpeqps      %ymm0,%ymm8,%ymm0
   .byte  196,193,108,88,212                  // vaddps        %ymm12,%ymm2,%ymm2
   .byte  196,227,117,74,194,0                // vblendvps     %ymm0,%ymm2,%ymm1,%ymm0
   .byte  196,193,60,88,201                   // vaddps        %ymm9,%ymm8,%ymm1
-  .byte  196,98,125,24,37,67,142,2,0         // vbroadcastss  0x28e43(%rip),%ymm12        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,37,175,137,2,0        // vbroadcastss  0x289af(%rip),%ymm12        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,193,116,89,212                  // vmulps        %ymm12,%ymm1,%ymm2
   .byte  197,28,194,226,1                    // vcmpltps      %ymm2,%ymm12,%ymm12
   .byte  196,65,36,92,216                    // vsubps        %ymm8,%ymm11,%ymm11
@@ -17433,7 +17270,7 @@
   .byte  197,172,94,201                      // vdivps        %ymm1,%ymm10,%ymm1
   .byte  196,195,125,74,198,128              // vblendvps     %ymm8,%ymm14,%ymm0,%ymm0
   .byte  196,195,117,74,206,128              // vblendvps     %ymm8,%ymm14,%ymm1,%ymm1
-  .byte  196,98,125,24,5,118,142,2,0         // vbroadcastss  0x28e76(%rip),%ymm8        # 3abe4 <_sk_srcover_bgra_8888_sse2_lowp+0x318>
+  .byte  196,98,125,24,5,226,137,2,0         // vbroadcastss  0x289e2(%rip),%ymm8        # 3a414 <_sk_srcover_bgra_8888_sse2_lowp+0x318>
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -17450,7 +17287,7 @@
   .byte  197,252,17,92,36,128                // vmovups       %ymm3,-0x80(%rsp)
   .byte  197,252,40,225                      // vmovaps       %ymm1,%ymm4
   .byte  197,252,40,216                      // vmovaps       %ymm0,%ymm3
-  .byte  196,98,125,24,5,207,141,2,0         // vbroadcastss  0x28dcf(%rip),%ymm8        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,5,59,137,2,0          // vbroadcastss  0x2893b(%rip),%ymm8        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,60,194,202,2                    // vcmpleps      %ymm2,%ymm8,%ymm9
   .byte  197,92,89,210                       // vmulps        %ymm2,%ymm4,%ymm10
   .byte  196,65,92,92,218                    // vsubps        %ymm10,%ymm4,%ymm11
@@ -17458,23 +17295,23 @@
   .byte  197,52,88,210                       // vaddps        %ymm2,%ymm9,%ymm10
   .byte  197,108,88,202                      // vaddps        %ymm2,%ymm2,%ymm9
   .byte  196,65,52,92,202                    // vsubps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,29,21,142,2,0         // vbroadcastss  0x28e15(%rip),%ymm11        # 3abe8 <_sk_srcover_bgra_8888_sse2_lowp+0x31c>
+  .byte  196,98,125,24,29,129,137,2,0        // vbroadcastss  0x28981(%rip),%ymm11        # 3a418 <_sk_srcover_bgra_8888_sse2_lowp+0x31c>
   .byte  196,65,100,88,219                   // vaddps        %ymm11,%ymm3,%ymm11
   .byte  196,67,125,8,227,1                  // vroundps      $0x1,%ymm11,%ymm12
   .byte  196,65,36,92,252                    // vsubps        %ymm12,%ymm11,%ymm15
   .byte  196,65,44,92,217                    // vsubps        %ymm9,%ymm10,%ymm11
-  .byte  196,98,125,24,37,231,141,2,0        // vbroadcastss  0x28de7(%rip),%ymm12        # 3abd8 <_sk_srcover_bgra_8888_sse2_lowp+0x30c>
+  .byte  196,98,125,24,37,83,137,2,0         // vbroadcastss  0x28953(%rip),%ymm12        # 3a408 <_sk_srcover_bgra_8888_sse2_lowp+0x30c>
   .byte  196,193,4,89,196                    // vmulps        %ymm12,%ymm15,%ymm0
-  .byte  196,98,125,24,45,225,141,2,0        // vbroadcastss  0x28de1(%rip),%ymm13        # 3abe0 <_sk_srcover_bgra_8888_sse2_lowp+0x314>
+  .byte  196,98,125,24,45,77,137,2,0         // vbroadcastss  0x2894d(%rip),%ymm13        # 3a410 <_sk_srcover_bgra_8888_sse2_lowp+0x314>
   .byte  197,20,92,240                       // vsubps        %ymm0,%ymm13,%ymm14
   .byte  196,65,36,89,246                    // vmulps        %ymm14,%ymm11,%ymm14
   .byte  196,65,52,88,246                    // vaddps        %ymm14,%ymm9,%ymm14
-  .byte  196,226,125,24,13,214,141,2,0       // vbroadcastss  0x28dd6(%rip),%ymm1        # 3abec <_sk_srcover_bgra_8888_sse2_lowp+0x320>
+  .byte  196,226,125,24,13,66,137,2,0        // vbroadcastss  0x28942(%rip),%ymm1        # 3a41c <_sk_srcover_bgra_8888_sse2_lowp+0x320>
   .byte  196,193,116,194,255,2               // vcmpleps      %ymm15,%ymm1,%ymm7
   .byte  196,195,13,74,249,112               // vblendvps     %ymm7,%ymm9,%ymm14,%ymm7
   .byte  196,65,60,194,247,2                 // vcmpleps      %ymm15,%ymm8,%ymm14
   .byte  196,227,45,74,255,224               // vblendvps     %ymm14,%ymm7,%ymm10,%ymm7
-  .byte  196,98,125,24,53,173,141,2,0        // vbroadcastss  0x28dad(%rip),%ymm14        # 3abe4 <_sk_srcover_bgra_8888_sse2_lowp+0x318>
+  .byte  196,98,125,24,53,25,137,2,0         // vbroadcastss  0x28919(%rip),%ymm14        # 3a414 <_sk_srcover_bgra_8888_sse2_lowp+0x318>
   .byte  196,65,12,194,255,2                 // vcmpleps      %ymm15,%ymm14,%ymm15
   .byte  196,193,124,89,195                  // vmulps        %ymm11,%ymm0,%ymm0
   .byte  197,180,88,192                      // vaddps        %ymm0,%ymm9,%ymm0
@@ -17493,7 +17330,7 @@
   .byte  197,164,89,247                      // vmulps        %ymm7,%ymm11,%ymm6
   .byte  197,180,88,246                      // vaddps        %ymm6,%ymm9,%ymm6
   .byte  196,227,77,74,237,0                 // vblendvps     %ymm0,%ymm5,%ymm6,%ymm5
-  .byte  196,226,125,24,5,87,141,2,0         // vbroadcastss  0x28d57(%rip),%ymm0        # 3abf0 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  .byte  196,226,125,24,5,195,136,2,0        // vbroadcastss  0x288c3(%rip),%ymm0        # 3a420 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
   .byte  197,228,88,192                      // vaddps        %ymm0,%ymm3,%ymm0
   .byte  196,227,125,8,216,1                 // vroundps      $0x1,%ymm0,%ymm3
   .byte  197,252,92,195                      // vsubps        %ymm3,%ymm0,%ymm0
@@ -17541,21 +17378,19 @@
 FUNCTION(_sk_scale_u8_avx)
 _sk_scale_u8_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,75                              // jne           11f9f <_sk_scale_u8_avx+0x63>
-  .byte  196,2,121,48,4,24                   // vpmovzxbw     (%r8,%r11,1),%xmm8
-  .byte  197,57,219,5,174,149,2,0            // vpand         0x295ae(%rip),%xmm8,%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  117,75                              // jne           11c5d <_sk_scale_u8_avx+0x5d>
+  .byte  196,66,121,48,4,16                  // vpmovzxbw     (%r8,%rdx,1),%xmm8
+  .byte  197,57,219,5,48,145,2,0             // vpand         0x29130(%rip),%xmm8,%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  196,66,121,51,200                   // vpmovzxwd     %xmm8,%xmm9
   .byte  196,65,121,112,192,78               // vpshufd       $0x4e,%xmm8,%xmm8
   .byte  196,66,121,51,192                   // vpmovzxwd     %xmm8,%xmm8
   .byte  196,67,53,24,192,1                  // vinsertf128   $0x1,%xmm8,%ymm9,%ymm8
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  196,98,125,24,13,110,140,2,0        // vbroadcastss  0x28c6e(%rip),%ymm9        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,13,224,135,2,0        // vbroadcastss  0x287e0(%rip),%ymm9        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
   .byte  197,188,89,201                      // vmulps        %ymm1,%ymm8,%ymm1
@@ -17563,56 +17398,54 @@
   .byte  197,188,89,219                      // vmulps        %ymm3,%ymm8,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,166                             // ja            11f5a <_sk_scale_u8_avx+0x1e>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,121,0,0,0                 // lea           0x79(%rip),%r10        # 12038 <_sk_scale_u8_avx+0xfc>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,172                             // ja            11c18 <_sk_scale_u8_avx+0x18>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,122,0,0,0                 // lea           0x7a(%rip),%r9        # 11cf0 <_sk_scale_u8_avx+0xf0>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  235,135                             // jmp           11f5a <_sk_scale_u8_avx+0x1e>
-  .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
+  .byte  235,142                             // jmp           11c18 <_sk_scale_u8_avx+0x18>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  197,57,196,192,2                    // vpinsrw       $0x2,%eax,%xmm8,%xmm8
-  .byte  67,15,183,4,24                      // movzwl        (%r8,%r11,1),%eax
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  197,121,110,200                     // vmovd         %eax,%xmm9
   .byte  196,66,121,48,201                   // vpmovzxbw     %xmm9,%xmm9
   .byte  196,67,57,14,193,3                  // vpblendw      $0x3,%xmm9,%xmm8,%xmm8
-  .byte  233,94,255,255,255                  // jmpq          11f5a <_sk_scale_u8_avx+0x1e>
-  .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
+  .byte  233,101,255,255,255                 // jmpq          11c18 <_sk_scale_u8_avx+0x18>
+  .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  197,57,196,192,6                    // vpinsrw       $0x6,%eax,%xmm8,%xmm8
-  .byte  67,15,182,68,24,5                   // movzbl        0x5(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,5                   // movzbl        0x5(%r8,%rdx,1),%eax
   .byte  197,57,196,192,5                    // vpinsrw       $0x5,%eax,%xmm8,%xmm8
-  .byte  67,15,182,68,24,4                   // movzbl        0x4(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,4                   // movzbl        0x4(%r8,%rdx,1),%eax
   .byte  197,57,196,192,4                    // vpinsrw       $0x4,%eax,%xmm8,%xmm8
-  .byte  196,1,121,110,12,24                 // vmovd         (%r8,%r11,1),%xmm9
+  .byte  196,65,121,110,12,16                // vmovd         (%r8,%rdx,1),%xmm9
   .byte  196,66,121,48,201                   // vpmovzxbw     %xmm9,%xmm9
   .byte  196,67,49,14,192,240                // vpblendw      $0xf0,%xmm8,%xmm9,%xmm8
-  .byte  233,34,255,255,255                  // jmpq          11f5a <_sk_scale_u8_avx+0x1e>
+  .byte  233,41,255,255,255                  // jmpq          11c18 <_sk_scale_u8_avx+0x18>
   .byte  144                                 // nop
+  .byte  143                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,171,255,255,255,155             // ljmp          *-0x64000001(%rbx)
+  .byte  255,170,255,255,255,154             // ljmp          *-0x65000001(%rdx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  234                                 // (bad)
+  .byte  233,255,255,255,222                 // jmpq          ffffffffdf011d00 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffdefd7c04>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  223,255                             // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,212                             // callq         *%rsp
+  .byte  255,211                             // callq         *%rbx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,196                             // inc           %esp
+  .byte  255,195                             // inc           %ebx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -17622,33 +17455,31 @@
 FUNCTION(_sk_scale_565_avx)
 _sk_scale_565_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,178,0,0,0                    // jne           12125 <_sk_scale_565_avx+0xd1>
-  .byte  196,1,122,111,4,88                  // vmovdqu       (%r8,%r11,2),%xmm8
+  .byte  15,133,178,0,0,0                    // jne           11dd7 <_sk_scale_565_avx+0xcb>
+  .byte  196,65,122,111,4,80                 // vmovdqu       (%r8,%rdx,2),%xmm8
   .byte  196,66,121,51,200                   // vpmovzxwd     %xmm8,%xmm9
   .byte  196,65,121,112,192,78               // vpshufd       $0x4e,%xmm8,%xmm8
   .byte  196,66,121,51,192                   // vpmovzxwd     %xmm8,%xmm8
   .byte  196,67,53,24,192,1                  // vinsertf128   $0x1,%xmm8,%ymm9,%ymm8
-  .byte  196,98,125,24,13,96,139,2,0         // vbroadcastss  0x28b60(%rip),%ymm9        # 3abf8 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  .byte  196,98,125,24,13,222,134,2,0        // vbroadcastss  0x286de(%rip),%ymm9        # 3a428 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
   .byte  196,65,60,84,201                    // vandps        %ymm9,%ymm8,%ymm9
   .byte  196,65,124,91,201                   // vcvtdq2ps     %ymm9,%ymm9
-  .byte  196,98,125,24,21,81,139,2,0         // vbroadcastss  0x28b51(%rip),%ymm10        # 3abfc <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  .byte  196,98,125,24,21,207,134,2,0        // vbroadcastss  0x286cf(%rip),%ymm10        # 3a42c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
   .byte  196,65,52,89,202                    // vmulps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,21,71,139,2,0         // vbroadcastss  0x28b47(%rip),%ymm10        # 3ac00 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  .byte  196,98,125,24,21,197,134,2,0        // vbroadcastss  0x286c5(%rip),%ymm10        # 3a430 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
   .byte  196,65,60,84,210                    // vandps        %ymm10,%ymm8,%ymm10
   .byte  196,65,124,91,210                   // vcvtdq2ps     %ymm10,%ymm10
-  .byte  196,98,125,24,29,56,139,2,0         // vbroadcastss  0x28b38(%rip),%ymm11        # 3ac04 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  .byte  196,98,125,24,29,182,134,2,0        // vbroadcastss  0x286b6(%rip),%ymm11        # 3a434 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
   .byte  196,65,44,89,211                    // vmulps        %ymm11,%ymm10,%ymm10
-  .byte  196,98,125,24,29,46,139,2,0         // vbroadcastss  0x28b2e(%rip),%ymm11        # 3ac08 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  .byte  196,98,125,24,29,172,134,2,0        // vbroadcastss  0x286ac(%rip),%ymm11        # 3a438 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
   .byte  196,65,60,84,195                    // vandps        %ymm11,%ymm8,%ymm8
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  196,98,125,24,29,31,139,2,0         // vbroadcastss  0x28b1f(%rip),%ymm11        # 3ac0c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  .byte  196,98,125,24,29,157,134,2,0        // vbroadcastss  0x2869d(%rip),%ymm11        # 3a43c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
   .byte  196,65,60,89,195                    // vmulps        %ymm11,%ymm8,%ymm8
   .byte  197,100,194,223,1                   // vcmpltps      %ymm7,%ymm3,%ymm11
   .byte  196,65,44,93,224                    // vminps        %ymm8,%ymm10,%ymm12
@@ -17662,47 +17493,49 @@
   .byte  197,164,89,219                      // vmulps        %ymm3,%ymm11,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,59,255,255,255               // ja            12079 <_sk_scale_565_avx+0x25>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,99,0,0,0                  // lea           0x63(%rip),%r10        # 121ac <_sk_scale_565_avx+0x158>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  15,135,65,255,255,255               // ja            11d2b <_sk_scale_565_avx+0x1f>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,100,0,0,0                 // lea           0x64(%rip),%r9        # 11e58 <_sk_scale_565_avx+0x14c>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  233,25,255,255,255                  // jmpq          12079 <_sk_scale_565_avx+0x25>
+  .byte  233,32,255,255,255                  // jmpq          11d2b <_sk_scale_565_avx+0x1f>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,4,2              // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,1,121,110,12,88                 // vmovd         (%r8,%r11,2),%xmm9
+  .byte  196,65,57,196,68,80,4,2             // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,65,121,110,12,80                // vmovd         (%r8,%rdx,2),%xmm9
   .byte  196,67,57,14,193,3                  // vpblendw      $0x3,%xmm9,%xmm8,%xmm8
-  .byte  233,251,254,255,255                 // jmpq          12079 <_sk_scale_565_avx+0x25>
+  .byte  233,2,255,255,255                   // jmpq          11d2b <_sk_scale_565_avx+0x1f>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,12,6             // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,10,5             // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,8,4              // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,1,122,126,12,88                 // vmovq         (%r8,%r11,2),%xmm9
+  .byte  196,65,57,196,68,80,12,6            // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,65,57,196,68,80,10,5            // vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,65,57,196,68,80,8,4             // vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,65,122,126,12,80                // vmovq         (%r8,%rdx,2),%xmm9
   .byte  196,67,49,14,192,240                // vpblendw      $0xf0,%xmm8,%xmm9,%xmm8
-  .byte  233,205,254,255,255                 // jmpq          12079 <_sk_scale_565_avx+0x25>
-  .byte  166                                 // cmpsb         %es:(%rdi),%ds:(%rsi)
+  .byte  233,212,254,255,255                 // jmpq          11d2b <_sk_scale_565_avx+0x1f>
+  .byte  144                                 // nop
+  .byte  165                                 // movsl         %ds:(%rsi),%es:(%rdi)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,193                             // inc           %ecx
+  .byte  255,192                             // inc           %eax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,180,255,255,255,239,255         // pushq         -0x100001(%rdi,%rdi,8)
+  .byte  255,179,255,255,255,238             // pushq         -0x11000001(%rbx)
   .byte  255                                 // (bad)
-  .byte  255,231                             // jmpq          *%rdi
+  .byte  255                                 // (bad)
+  .byte  255,230                             // jmpq          *%rsi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  223,255                             // (bad)
+  .byte  222,255                             // fdivrp        %st,%st(7)
   .byte  255                                 // (bad)
-  .byte  255,210                             // callq         *%rdx
+  .byte  255,209                             // callq         *%rcx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -17733,21 +17566,19 @@
 FUNCTION(_sk_lerp_u8_avx)
 _sk_lerp_u8_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,111                             // jne           1228e <_sk_lerp_u8_avx+0x87>
-  .byte  196,2,121,48,4,24                   // vpmovzxbw     (%r8,%r11,1),%xmm8
-  .byte  197,57,219,5,227,146,2,0            // vpand         0x292e3(%rip),%xmm8,%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  117,111                             // jne           11f34 <_sk_lerp_u8_avx+0x81>
+  .byte  196,66,121,48,4,16                  // vpmovzxbw     (%r8,%rdx,1),%xmm8
+  .byte  197,57,219,5,125,142,2,0            // vpand         0x28e7d(%rip),%xmm8,%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  196,66,121,51,200                   // vpmovzxwd     %xmm8,%xmm9
   .byte  196,65,121,112,192,78               // vpshufd       $0x4e,%xmm8,%xmm8
   .byte  196,66,121,51,192                   // vpmovzxwd     %xmm8,%xmm8
   .byte  196,67,53,24,192,1                  // vinsertf128   $0x1,%xmm8,%ymm9,%ymm8
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  196,98,125,24,13,163,137,2,0        // vbroadcastss  0x289a3(%rip),%ymm9        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,13,45,133,2,0         // vbroadcastss  0x2852d(%rip),%ymm9        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
   .byte  197,252,92,196                      // vsubps        %ymm4,%ymm0,%ymm0
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
@@ -17763,53 +17594,55 @@
   .byte  197,228,88,223                      // vaddps        %ymm7,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,130                             // ja            12225 <_sk_lerp_u8_avx+0x1e>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,126,0,0,0                 // lea           0x7e(%rip),%r10        # 1232c <_sk_lerp_u8_avx+0x125>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,136                             // ja            11ecb <_sk_lerp_u8_avx+0x18>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,127,0,0,0                 // lea           0x7f(%rip),%r9        # 11fcc <_sk_lerp_u8_avx+0x119>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  233,96,255,255,255                  // jmpq          12225 <_sk_lerp_u8_avx+0x1e>
-  .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
+  .byte  233,103,255,255,255                 // jmpq          11ecb <_sk_lerp_u8_avx+0x18>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  197,57,196,192,2                    // vpinsrw       $0x2,%eax,%xmm8,%xmm8
-  .byte  67,15,183,4,24                      // movzwl        (%r8,%r11,1),%eax
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  197,121,110,200                     // vmovd         %eax,%xmm9
   .byte  196,66,121,48,201                   // vpmovzxbw     %xmm9,%xmm9
   .byte  196,67,57,14,193,3                  // vpblendw      $0x3,%xmm9,%xmm8,%xmm8
-  .byte  233,55,255,255,255                  // jmpq          12225 <_sk_lerp_u8_avx+0x1e>
-  .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
+  .byte  233,62,255,255,255                  // jmpq          11ecb <_sk_lerp_u8_avx+0x18>
+  .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  197,57,196,192,6                    // vpinsrw       $0x6,%eax,%xmm8,%xmm8
-  .byte  67,15,182,68,24,5                   // movzbl        0x5(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,5                   // movzbl        0x5(%r8,%rdx,1),%eax
   .byte  197,57,196,192,5                    // vpinsrw       $0x5,%eax,%xmm8,%xmm8
-  .byte  67,15,182,68,24,4                   // movzbl        0x4(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,4                   // movzbl        0x4(%r8,%rdx,1),%eax
   .byte  197,57,196,192,4                    // vpinsrw       $0x4,%eax,%xmm8,%xmm8
-  .byte  196,1,121,110,12,24                 // vmovd         (%r8,%r11,1),%xmm9
+  .byte  196,65,121,110,12,16                // vmovd         (%r8,%rdx,1),%xmm9
   .byte  196,66,121,48,201                   // vpmovzxbw     %xmm9,%xmm9
   .byte  196,67,49,14,192,240                // vpblendw      $0xf0,%xmm8,%xmm9,%xmm8
-  .byte  233,251,254,255,255                 // jmpq          12225 <_sk_lerp_u8_avx+0x1e>
-  .byte  102,144                             // xchg          %ax,%ax
-  .byte  139,255                             // mov           %edi,%edi
+  .byte  233,2,255,255,255                   // jmpq          11ecb <_sk_lerp_u8_avx+0x18>
+  .byte  15,31,0                             // nopl          (%rax)
+  .byte  138,255                             // mov           %bh,%bh
   .byte  255                                 // (bad)
-  .byte  255,169,255,255,255,153             // ljmp          *-0x66000001(%rcx)
+  .byte  255,168,255,255,255,152             // ljmp          *-0x67000001(%rax)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,231                             // jmpq          *%rdi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  232,255,255,255,221                 // callq         ffffffffde01233c <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddfd7a70>
+  .byte  220,255                             // fdivr         %st,%st(7)
+  .byte  255                                 // (bad)
+  .byte  255,209                             // callq         *%rcx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,210                             // callq         *%rdx
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,194                             // inc           %edx
+  .byte  255,193                             // inc           %ecx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -17819,33 +17652,31 @@
 FUNCTION(_sk_lerp_565_avx)
 _sk_lerp_565_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,214,0,0,0                    // jne           1243d <_sk_lerp_565_avx+0xf5>
-  .byte  196,1,122,111,4,88                  // vmovdqu       (%r8,%r11,2),%xmm8
+  .byte  15,133,214,0,0,0                    // jne           120d7 <_sk_lerp_565_avx+0xef>
+  .byte  196,65,122,111,4,80                 // vmovdqu       (%r8,%rdx,2),%xmm8
   .byte  196,66,121,51,200                   // vpmovzxwd     %xmm8,%xmm9
   .byte  196,65,121,112,192,78               // vpshufd       $0x4e,%xmm8,%xmm8
   .byte  196,66,121,51,192                   // vpmovzxwd     %xmm8,%xmm8
   .byte  196,67,53,24,192,1                  // vinsertf128   $0x1,%xmm8,%ymm9,%ymm8
-  .byte  196,98,125,24,13,108,136,2,0        // vbroadcastss  0x2886c(%rip),%ymm9        # 3abf8 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  .byte  196,98,125,24,13,2,132,2,0          // vbroadcastss  0x28402(%rip),%ymm9        # 3a428 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
   .byte  196,65,60,84,201                    // vandps        %ymm9,%ymm8,%ymm9
   .byte  196,65,124,91,201                   // vcvtdq2ps     %ymm9,%ymm9
-  .byte  196,98,125,24,21,93,136,2,0         // vbroadcastss  0x2885d(%rip),%ymm10        # 3abfc <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  .byte  196,98,125,24,21,243,131,2,0        // vbroadcastss  0x283f3(%rip),%ymm10        # 3a42c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
   .byte  196,65,52,89,202                    // vmulps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,21,83,136,2,0         // vbroadcastss  0x28853(%rip),%ymm10        # 3ac00 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  .byte  196,98,125,24,21,233,131,2,0        // vbroadcastss  0x283e9(%rip),%ymm10        # 3a430 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
   .byte  196,65,60,84,210                    // vandps        %ymm10,%ymm8,%ymm10
   .byte  196,65,124,91,210                   // vcvtdq2ps     %ymm10,%ymm10
-  .byte  196,98,125,24,29,68,136,2,0         // vbroadcastss  0x28844(%rip),%ymm11        # 3ac04 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  .byte  196,98,125,24,29,218,131,2,0        // vbroadcastss  0x283da(%rip),%ymm11        # 3a434 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
   .byte  196,65,44,89,211                    // vmulps        %ymm11,%ymm10,%ymm10
-  .byte  196,98,125,24,29,58,136,2,0         // vbroadcastss  0x2883a(%rip),%ymm11        # 3ac08 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  .byte  196,98,125,24,29,208,131,2,0        // vbroadcastss  0x283d0(%rip),%ymm11        # 3a438 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
   .byte  196,65,60,84,195                    // vandps        %ymm11,%ymm8,%ymm8
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  196,98,125,24,29,43,136,2,0         // vbroadcastss  0x2882b(%rip),%ymm11        # 3ac0c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  .byte  196,98,125,24,29,193,131,2,0        // vbroadcastss  0x283c1(%rip),%ymm11        # 3a43c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
   .byte  196,65,60,89,195                    // vmulps        %ymm11,%ymm8,%ymm8
   .byte  197,100,194,223,1                   // vcmpltps      %ymm7,%ymm3,%ymm11
   .byte  196,65,44,93,224                    // vminps        %ymm8,%ymm10,%ymm12
@@ -17867,47 +17698,49 @@
   .byte  197,228,88,223                      // vaddps        %ymm7,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,23,255,255,255               // ja            1236d <_sk_lerp_565_avx+0x25>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,99,0,0,0                  // lea           0x63(%rip),%r10        # 124c4 <_sk_lerp_565_avx+0x17c>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  15,135,29,255,255,255               // ja            12007 <_sk_lerp_565_avx+0x1f>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,100,0,0,0                 // lea           0x64(%rip),%r9        # 12158 <_sk_lerp_565_avx+0x170>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  233,245,254,255,255                 // jmpq          1236d <_sk_lerp_565_avx+0x25>
+  .byte  233,252,254,255,255                 // jmpq          12007 <_sk_lerp_565_avx+0x1f>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,4,2              // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,1,121,110,12,88                 // vmovd         (%r8,%r11,2),%xmm9
+  .byte  196,65,57,196,68,80,4,2             // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,65,121,110,12,80                // vmovd         (%r8,%rdx,2),%xmm9
   .byte  196,67,57,14,193,3                  // vpblendw      $0x3,%xmm9,%xmm8,%xmm8
-  .byte  233,215,254,255,255                 // jmpq          1236d <_sk_lerp_565_avx+0x25>
+  .byte  233,222,254,255,255                 // jmpq          12007 <_sk_lerp_565_avx+0x1f>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,12,6             // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,10,5             // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,1,57,196,68,88,8,4              // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm8,%xmm8
-  .byte  196,1,122,126,12,88                 // vmovq         (%r8,%r11,2),%xmm9
+  .byte  196,65,57,196,68,80,12,6            // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,65,57,196,68,80,10,5            // vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,65,57,196,68,80,8,4             // vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm8,%xmm8
+  .byte  196,65,122,126,12,80                // vmovq         (%r8,%rdx,2),%xmm9
   .byte  196,67,49,14,192,240                // vpblendw      $0xf0,%xmm8,%xmm9,%xmm8
-  .byte  233,169,254,255,255                 // jmpq          1236d <_sk_lerp_565_avx+0x25>
-  .byte  166                                 // cmpsb         %es:(%rdi),%ds:(%rsi)
+  .byte  233,176,254,255,255                 // jmpq          12007 <_sk_lerp_565_avx+0x1f>
+  .byte  144                                 // nop
+  .byte  165                                 // movsl         %ds:(%rsi),%es:(%rdi)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,193                             // inc           %ecx
+  .byte  255,192                             // inc           %eax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,180,255,255,255,239,255         // pushq         -0x100001(%rdi,%rdi,8)
+  .byte  255,179,255,255,255,238             // pushq         -0x11000001(%rbx)
   .byte  255                                 // (bad)
-  .byte  255,231                             // jmpq          *%rdi
+  .byte  255                                 // (bad)
+  .byte  255,230                             // jmpq          *%rsi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  223,255                             // (bad)
+  .byte  222,255                             // fdivrp        %st,%st(7)
   .byte  255                                 // (bad)
-  .byte  255,210                             // callq         *%rdx
+  .byte  255,209                             // callq         *%rcx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -17920,9 +17753,9 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,4,2,0,0                      // jne           126f8 <_sk_load_tables_avx+0x218>
+  .byte  15,133,4,2,0,0                      // jne           1238c <_sk_load_tables_avx+0x218>
   .byte  196,65,125,16,20,144                // vmovupd       (%r8,%rdx,4),%ymm10
-  .byte  197,125,40,13,126,140,2,0           // vmovapd       0x28c7e(%rip),%ymm9        # 3b180 <_sk_srcover_bgra_8888_sse2_lowp+0x8b4>
+  .byte  197,125,40,13,42,136,2,0            // vmovapd       0x2882a(%rip),%ymm9        # 3a9c0 <_sk_srcover_bgra_8888_sse2_lowp+0x8c4>
   .byte  196,193,45,84,201                   // vandpd        %ymm9,%ymm10,%ymm1
   .byte  196,227,125,25,200,1                // vextractf128  $0x1,%ymm1,%xmm0
   .byte  196,193,249,126,192                 // vmovq         %xmm0,%r8
@@ -18014,7 +17847,7 @@
   .byte  196,193,65,114,213,24               // vpsrld        $0x18,%xmm13,%xmm7
   .byte  196,227,101,24,223,1                // vinsertf128   $0x1,%xmm7,%ymm3,%ymm3
   .byte  197,252,91,219                      // vcvtdq2ps     %ymm3,%ymm3
-  .byte  196,226,125,24,61,10,133,2,0        // vbroadcastss  0x2850a(%rip),%ymm7        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,226,125,24,61,166,128,2,0       // vbroadcastss  0x280a6(%rip),%ymm7        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  197,228,89,223                      // vmulps        %ymm7,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,16,124,36,200               // vmovups       -0x38(%rsp),%ymm7
@@ -18024,21 +17857,21 @@
   .byte  196,65,44,87,210                    // vxorps        %ymm10,%ymm10,%ymm10
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,233,253,255,255              // ja            124fa <_sk_load_tables_avx+0x1a>
+  .byte  15,135,233,253,255,255              // ja            1218e <_sk_load_tables_avx+0x1a>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,148,0,0,0                 // lea           0x94(%rip),%r10        # 127b0 <_sk_load_tables_avx+0x2d0>
+  .byte  76,141,21,148,0,0,0                 // lea           0x94(%rip),%r10        # 12444 <_sk_load_tables_avx+0x2d0>
   .byte  79,99,12,138                        // movslq        (%r10,%r9,4),%r9
   .byte  77,1,209                            // add           %r10,%r9
   .byte  65,255,225                          // jmpq          *%r9
   .byte  196,65,122,16,20,144                // vmovss        (%r8,%rdx,4),%xmm10
-  .byte  233,201,253,255,255                 // jmpq          124fa <_sk_load_tables_avx+0x1a>
+  .byte  233,201,253,255,255                 // jmpq          1218e <_sk_load_tables_avx+0x1a>
   .byte  196,193,121,110,68,144,8            // vmovd         0x8(%r8,%rdx,4),%xmm0
   .byte  197,249,112,192,68                  // vpshufd       $0x44,%xmm0,%xmm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  196,99,117,12,208,4                 // vblendps      $0x4,%ymm0,%ymm1,%ymm10
   .byte  196,193,123,16,4,144                // vmovsd        (%r8,%rdx,4),%xmm0
   .byte  196,99,45,13,208,1                  // vblendpd      $0x1,%ymm0,%ymm10,%ymm10
-  .byte  233,162,253,255,255                 // jmpq          124fa <_sk_load_tables_avx+0x1a>
+  .byte  233,162,253,255,255                 // jmpq          1218e <_sk_load_tables_avx+0x1a>
   .byte  196,193,121,110,68,144,24           // vmovd         0x18(%r8,%rdx,4),%xmm0
   .byte  197,249,112,192,68                  // vpshufd       $0x44,%xmm0,%xmm0
   .byte  196,227,125,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
@@ -18052,9 +17885,9 @@
   .byte  196,99,45,24,208,1                  // vinsertf128   $0x1,%xmm0,%ymm10,%ymm10
   .byte  196,193,121,16,4,144                // vmovupd       (%r8,%rdx,4),%xmm0
   .byte  196,67,125,13,210,12                // vblendpd      $0xc,%ymm10,%ymm0,%ymm10
-  .byte  233,77,253,255,255                  // jmpq          124fa <_sk_load_tables_avx+0x1a>
+  .byte  233,77,253,255,255                  // jmpq          1218e <_sk_load_tables_avx+0x1a>
   .byte  15,31,0                             // nopl          (%rax)
-  .byte  118,255                             // jbe           127b1 <_sk_load_tables_avx+0x2d1>
+  .byte  118,255                             // jbe           12445 <_sk_load_tables_avx+0x2d1>
   .byte  255                                 // (bad)
   .byte  255,151,255,255,255,129             // callq         *-0x7e000001(%rdi)
   .byte  255                                 // (bad)
@@ -18084,7 +17917,7 @@
   .byte  72,133,255                          // test          %rdi,%rdi
   .byte  197,252,17,124,36,200               // vmovups       %ymm7,-0x38(%rsp)
   .byte  197,252,17,116,36,168               // vmovups       %ymm6,-0x58(%rsp)
-  .byte  15,133,75,2,0,0                     // jne           12a39 <_sk_load_tables_u16_be_avx+0x26d>
+  .byte  15,133,75,2,0,0                     // jne           126cd <_sk_load_tables_u16_be_avx+0x26d>
   .byte  196,1,121,16,4,72                   // vmovupd       (%r8,%r9,2),%xmm8
   .byte  196,129,121,16,84,72,16             // vmovupd       0x10(%r8,%r9,2),%xmm2
   .byte  196,129,121,16,92,72,32             // vmovupd       0x20(%r8,%r9,2),%xmm3
@@ -18100,7 +17933,7 @@
   .byte  197,177,108,208                     // vpunpcklqdq   %xmm0,%xmm9,%xmm2
   .byte  197,49,109,232                      // vpunpckhqdq   %xmm0,%xmm9,%xmm13
   .byte  196,65,57,108,212                   // vpunpcklqdq   %xmm12,%xmm8,%xmm10
-  .byte  197,121,111,29,208,140,2,0          // vmovdqa       0x28cd0(%rip),%xmm11        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  197,121,111,29,124,136,2,0          // vmovdqa       0x2887c(%rip),%xmm11        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  196,193,105,219,195                 // vpand         %xmm11,%xmm2,%xmm0
   .byte  197,249,112,208,78                  // vpshufd       $0x4e,%xmm0,%xmm2
   .byte  196,226,121,51,210                  // vpmovzxwd     %xmm2,%xmm2
@@ -18194,7 +18027,7 @@
   .byte  196,226,121,51,219                  // vpmovzxwd     %xmm3,%xmm3
   .byte  196,227,77,24,219,1                 // vinsertf128   $0x1,%xmm3,%ymm6,%ymm3
   .byte  197,252,91,219                      // vcvtdq2ps     %ymm3,%ymm3
-  .byte  196,226,125,24,53,235,129,2,0       // vbroadcastss  0x281eb(%rip),%ymm6        # 3ac10 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
+  .byte  196,226,125,24,53,135,125,2,0       // vbroadcastss  0x27d87(%rip),%ymm6        # 3a440 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
   .byte  197,228,89,222                      // vmulps        %ymm6,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,16,116,36,168               // vmovups       -0x58(%rsp),%ymm6
@@ -18203,29 +18036,29 @@
   .byte  196,1,123,16,4,72                   // vmovsd        (%r8,%r9,2),%xmm8
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,85                              // je            12a9f <_sk_load_tables_u16_be_avx+0x2d3>
+  .byte  116,85                              // je            12733 <_sk_load_tables_u16_be_avx+0x2d3>
   .byte  196,1,57,22,68,72,8                 // vmovhpd       0x8(%r8,%r9,2),%xmm8,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,72                              // jb            12a9f <_sk_load_tables_u16_be_avx+0x2d3>
+  .byte  114,72                              // jb            12733 <_sk_load_tables_u16_be_avx+0x2d3>
   .byte  196,129,123,16,84,72,16             // vmovsd        0x10(%r8,%r9,2),%xmm2
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  116,72                              // je            12aac <_sk_load_tables_u16_be_avx+0x2e0>
+  .byte  116,72                              // je            12740 <_sk_load_tables_u16_be_avx+0x2e0>
   .byte  196,129,105,22,84,72,24             // vmovhpd       0x18(%r8,%r9,2),%xmm2,%xmm2
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,59                              // jb            12aac <_sk_load_tables_u16_be_avx+0x2e0>
+  .byte  114,59                              // jb            12740 <_sk_load_tables_u16_be_avx+0x2e0>
   .byte  196,129,123,16,92,72,32             // vmovsd        0x20(%r8,%r9,2),%xmm3
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  15,132,135,253,255,255              // je            12809 <_sk_load_tables_u16_be_avx+0x3d>
+  .byte  15,132,135,253,255,255              // je            1249d <_sk_load_tables_u16_be_avx+0x3d>
   .byte  196,129,97,22,92,72,40              // vmovhpd       0x28(%r8,%r9,2),%xmm3,%xmm3
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,130,118,253,255,255              // jb            12809 <_sk_load_tables_u16_be_avx+0x3d>
+  .byte  15,130,118,253,255,255              // jb            1249d <_sk_load_tables_u16_be_avx+0x3d>
   .byte  196,1,122,126,76,72,48              // vmovq         0x30(%r8,%r9,2),%xmm9
-  .byte  233,106,253,255,255                 // jmpq          12809 <_sk_load_tables_u16_be_avx+0x3d>
+  .byte  233,106,253,255,255                 // jmpq          1249d <_sk_load_tables_u16_be_avx+0x3d>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
   .byte  197,233,87,210                      // vxorpd        %xmm2,%xmm2,%xmm2
-  .byte  233,93,253,255,255                  // jmpq          12809 <_sk_load_tables_u16_be_avx+0x3d>
+  .byte  233,93,253,255,255                  // jmpq          1249d <_sk_load_tables_u16_be_avx+0x3d>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
-  .byte  233,84,253,255,255                  // jmpq          12809 <_sk_load_tables_u16_be_avx+0x3d>
+  .byte  233,84,253,255,255                  // jmpq          1249d <_sk_load_tables_u16_be_avx+0x3d>
 
 HIDDEN _sk_load_tables_rgb_u16_be_avx
 .globl _sk_load_tables_rgb_u16_be_avx
@@ -18237,7 +18070,7 @@
   .byte  72,133,255                          // test          %rdi,%rdi
   .byte  197,252,17,124,36,200               // vmovups       %ymm7,-0x38(%rsp)
   .byte  197,252,17,116,36,168               // vmovups       %ymm6,-0x58(%rsp)
-  .byte  15,133,54,2,0,0                     // jne           12d09 <_sk_load_tables_rgb_u16_be_avx+0x254>
+  .byte  15,133,54,2,0,0                     // jne           1299d <_sk_load_tables_rgb_u16_be_avx+0x254>
   .byte  196,1,122,111,28,72                 // vmovdqu       (%r8,%r9,2),%xmm11
   .byte  196,129,122,111,92,72,12            // vmovdqu       0xc(%r8,%r9,2),%xmm3
   .byte  196,129,122,111,84,72,24            // vmovdqu       0x18(%r8,%r9,2),%xmm2
@@ -18258,7 +18091,7 @@
   .byte  197,105,108,216                     // vpunpcklqdq   %xmm0,%xmm2,%xmm11
   .byte  197,241,108,211                     // vpunpcklqdq   %xmm3,%xmm1,%xmm2
   .byte  197,241,109,203                     // vpunpckhqdq   %xmm3,%xmm1,%xmm1
-  .byte  197,121,111,53,208,137,2,0          // vmovdqa       0x289d0(%rip),%xmm14        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  197,121,111,53,124,133,2,0          // vmovdqa       0x2857c(%rip),%xmm14        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  196,193,105,219,214                 // vpand         %xmm14,%xmm2,%xmm2
   .byte  197,249,112,218,78                  // vpshufd       $0x4e,%xmm2,%xmm3
   .byte  196,226,121,51,219                  // vpmovzxwd     %xmm3,%xmm3
@@ -18344,7 +18177,7 @@
   .byte  196,227,105,33,215,48               // vinsertps     $0x30,%xmm7,%xmm2,%xmm2
   .byte  196,227,77,24,210,1                 // vinsertf128   $0x1,%xmm2,%ymm6,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,129,126,2,0       // vbroadcastss  0x27e81(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,29,122,2,0        // vbroadcastss  0x27a1d(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,252,16,116,36,168               // vmovups       -0x58(%rsp),%ymm6
   .byte  197,252,16,124,36,200               // vmovups       -0x38(%rsp),%ymm7
   .byte  255,224                             // jmpq          *%rax
@@ -18352,63 +18185,63 @@
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,1,121,196,92,72,4,2             // vpinsrw       $0x2,0x4(%r8,%r9,2),%xmm0,%xmm11
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,31                              // jne           12d41 <_sk_load_tables_rgb_u16_be_avx+0x28c>
+  .byte  117,31                              // jne           129d5 <_sk_load_tables_rgb_u16_be_avx+0x28c>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
   .byte  197,225,239,219                     // vpxor         %xmm3,%xmm3,%xmm3
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  233,199,253,255,255                 // jmpq          12b08 <_sk_load_tables_rgb_u16_be_avx+0x53>
+  .byte  233,199,253,255,255                 // jmpq          1279c <_sk_load_tables_rgb_u16_be_avx+0x53>
   .byte  196,129,121,110,68,72,6             // vmovd         0x6(%r8,%r9,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,1,121,196,68,72,10,2            // vpinsrw       $0x2,0xa(%r8,%r9,2),%xmm0,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,48                              // jb            12d8b <_sk_load_tables_rgb_u16_be_avx+0x2d6>
+  .byte  114,48                              // jb            12a1f <_sk_load_tables_rgb_u16_be_avx+0x2d6>
   .byte  196,129,121,110,68,72,12            // vmovd         0xc(%r8,%r9,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,129,121,196,92,72,16,2          // vpinsrw       $0x2,0x10(%r8,%r9,2),%xmm0,%xmm3
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  117,48                              // jne           12da5 <_sk_load_tables_rgb_u16_be_avx+0x2f0>
+  .byte  117,48                              // jne           12a39 <_sk_load_tables_rgb_u16_be_avx+0x2f0>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
-  .byte  233,125,253,255,255                 // jmpq          12b08 <_sk_load_tables_rgb_u16_be_avx+0x53>
+  .byte  233,125,253,255,255                 // jmpq          1279c <_sk_load_tables_rgb_u16_be_avx+0x53>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
   .byte  197,225,239,219                     // vpxor         %xmm3,%xmm3,%xmm3
-  .byte  233,99,253,255,255                  // jmpq          12b08 <_sk_load_tables_rgb_u16_be_avx+0x53>
+  .byte  233,99,253,255,255                  // jmpq          1279c <_sk_load_tables_rgb_u16_be_avx+0x53>
   .byte  196,129,121,110,68,72,18            // vmovd         0x12(%r8,%r9,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,1,121,196,84,72,22,2            // vpinsrw       $0x2,0x16(%r8,%r9,2),%xmm0,%xmm10
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,39                              // jb            12de6 <_sk_load_tables_rgb_u16_be_avx+0x331>
+  .byte  114,39                              // jb            12a7a <_sk_load_tables_rgb_u16_be_avx+0x331>
   .byte  196,129,121,110,68,72,24            // vmovd         0x18(%r8,%r9,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,129,121,196,84,72,28,2          // vpinsrw       $0x2,0x1c(%r8,%r9,2),%xmm0,%xmm2
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  117,30                              // jne           12df7 <_sk_load_tables_rgb_u16_be_avx+0x342>
+  .byte  117,30                              // jne           12a8b <_sk_load_tables_rgb_u16_be_avx+0x342>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
-  .byte  233,34,253,255,255                  // jmpq          12b08 <_sk_load_tables_rgb_u16_be_avx+0x53>
+  .byte  233,34,253,255,255                  // jmpq          1279c <_sk_load_tables_rgb_u16_be_avx+0x53>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
-  .byte  233,17,253,255,255                  // jmpq          12b08 <_sk_load_tables_rgb_u16_be_avx+0x53>
+  .byte  233,17,253,255,255                  // jmpq          1279c <_sk_load_tables_rgb_u16_be_avx+0x53>
   .byte  196,129,121,110,68,72,30            // vmovd         0x1e(%r8,%r9,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,129,121,196,76,72,34,2          // vpinsrw       $0x2,0x22(%r8,%r9,2),%xmm0,%xmm1
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,25                              // jb            12e2a <_sk_load_tables_rgb_u16_be_avx+0x375>
+  .byte  114,25                              // jb            12abe <_sk_load_tables_rgb_u16_be_avx+0x375>
   .byte  196,129,121,110,68,72,36            // vmovd         0x24(%r8,%r9,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,129,121,196,68,72,40,2          // vpinsrw       $0x2,0x28(%r8,%r9,2),%xmm0,%xmm0
-  .byte  233,222,252,255,255                 // jmpq          12b08 <_sk_load_tables_rgb_u16_be_avx+0x53>
+  .byte  233,222,252,255,255                 // jmpq          1279c <_sk_load_tables_rgb_u16_be_avx+0x53>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  233,213,252,255,255                 // jmpq          12b08 <_sk_load_tables_rgb_u16_be_avx+0x53>
+  .byte  233,213,252,255,255                 // jmpq          1279c <_sk_load_tables_rgb_u16_be_avx+0x53>
 
 HIDDEN _sk_byte_tables_avx
 .globl _sk_byte_tables_avx
@@ -18421,9 +18254,9 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
   .byte  197,180,95,192                      // vmaxps        %ymm0,%ymm9,%ymm0
-  .byte  196,98,125,24,5,35,125,2,0          // vbroadcastss  0x27d23(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,191,120,2,0         // vbroadcastss  0x278bf(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
-  .byte  196,98,125,24,21,65,125,2,0         // vbroadcastss  0x27d41(%rip),%ymm10        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,98,125,24,21,221,120,2,0        // vbroadcastss  0x278dd(%rip),%ymm10        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   .byte  196,193,124,89,194                  // vmulps        %ymm10,%ymm0,%ymm0
   .byte  197,125,91,216                      // vcvtps2dq     %ymm0,%ymm11
   .byte  196,65,249,126,216                  // vmovq         %xmm11,%r8
@@ -18561,7 +18394,7 @@
   .byte  196,194,121,49,205                  // vpmovzxbd     %xmm13,%xmm1
   .byte  196,227,125,24,193,1                // vinsertf128   $0x1,%xmm1,%ymm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,13,242,122,2,0        // vbroadcastss  0x27af2(%rip),%ymm9        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,13,142,118,2,0        // vbroadcastss  0x2768e(%rip),%ymm9        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,193,124,89,193                  // vmulps        %ymm9,%ymm0,%ymm0
   .byte  196,194,121,49,204                  // vpmovzxbd     %xmm12,%xmm1
   .byte  196,194,121,49,214                  // vpmovzxbd     %xmm14,%xmm2
@@ -18599,7 +18432,7 @@
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
   .byte  197,180,95,192                      // vmaxps        %ymm0,%ymm9,%ymm0
-  .byte  196,98,125,24,21,221,121,2,0        // vbroadcastss  0x279dd(%rip),%ymm10        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,21,121,117,2,0        // vbroadcastss  0x27579(%rip),%ymm10        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,124,93,194                  // vminps        %ymm10,%ymm0,%ymm0
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
   .byte  197,125,91,216                      // vcvtps2dq     %ymm0,%ymm11
@@ -18704,7 +18537,7 @@
   .byte  196,194,121,49,205                  // vpmovzxbd     %xmm13,%xmm1
   .byte  196,227,125,24,193,1                // vinsertf128   $0x1,%xmm1,%ymm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,13,91,120,2,0         // vbroadcastss  0x2785b(%rip),%ymm9        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,13,247,115,2,0        // vbroadcastss  0x273f7(%rip),%ymm9        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,193,124,89,193                  // vmulps        %ymm9,%ymm0,%ymm0
   .byte  196,194,121,49,204                  // vpmovzxbd     %xmm12,%xmm1
   .byte  196,194,121,49,214                  // vpmovzxbd     %xmm14,%xmm2
@@ -18738,7 +18571,7 @@
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
   .byte  197,180,95,192                      // vmaxps        %ymm0,%ymm9,%ymm0
-  .byte  196,98,125,24,13,106,119,2,0        // vbroadcastss  0x2776a(%rip),%ymm9        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,13,6,115,2,0          // vbroadcastss  0x27306(%rip),%ymm9        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,124,93,193                  // vminps        %ymm9,%ymm0,%ymm0
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
   .byte  197,253,91,192                      // vcvtps2dq     %ymm0,%ymm0
@@ -18793,7 +18626,7 @@
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
   .byte  197,180,95,201                      // vmaxps        %ymm1,%ymm9,%ymm1
-  .byte  196,98,125,24,13,145,118,2,0        // vbroadcastss  0x27691(%rip),%ymm9        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,13,45,114,2,0         // vbroadcastss  0x2722d(%rip),%ymm9        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,116,93,201                  // vminps        %ymm9,%ymm1,%ymm1
   .byte  196,193,116,89,200                  // vmulps        %ymm8,%ymm1,%ymm1
   .byte  197,253,91,201                      // vcvtps2dq     %ymm1,%ymm1
@@ -18848,7 +18681,7 @@
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
   .byte  197,180,95,210                      // vmaxps        %ymm2,%ymm9,%ymm2
-  .byte  196,98,125,24,13,184,117,2,0        // vbroadcastss  0x275b8(%rip),%ymm9        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,13,84,113,2,0         // vbroadcastss  0x27154(%rip),%ymm9        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,108,93,209                  // vminps        %ymm9,%ymm2,%ymm2
   .byte  196,193,108,89,208                  // vmulps        %ymm8,%ymm2,%ymm2
   .byte  197,253,91,210                      // vcvtps2dq     %ymm2,%ymm2
@@ -18903,7 +18736,7 @@
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
   .byte  197,180,95,219                      // vmaxps        %ymm3,%ymm9,%ymm3
-  .byte  196,98,125,24,13,223,116,2,0        // vbroadcastss  0x274df(%rip),%ymm9        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,13,123,112,2,0        // vbroadcastss  0x2707b(%rip),%ymm9        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,100,93,217                  // vminps        %ymm9,%ymm3,%ymm3
   .byte  196,193,100,89,216                  // vmulps        %ymm8,%ymm3,%ymm3
   .byte  197,253,91,219                      // vcvtps2dq     %ymm3,%ymm3
@@ -18959,36 +18792,36 @@
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
   .byte  197,36,194,208,0                    // vcmpeqps      %ymm0,%ymm11,%ymm10
   .byte  196,65,124,91,235                   // vcvtdq2ps     %ymm11,%ymm13
-  .byte  196,98,125,24,53,130,116,2,0        // vbroadcastss  0x27482(%rip),%ymm14        # 3ac14 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  .byte  196,98,125,24,53,30,112,2,0         // vbroadcastss  0x2701e(%rip),%ymm14        # 3a444 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
   .byte  196,65,20,89,238                    // vmulps        %ymm14,%ymm13,%ymm13
-  .byte  196,98,125,24,53,120,116,2,0        // vbroadcastss  0x27478(%rip),%ymm14        # 3ac18 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  .byte  196,98,125,24,53,20,112,2,0         // vbroadcastss  0x27014(%rip),%ymm14        # 3a448 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   .byte  196,65,36,84,222                    // vandps        %ymm14,%ymm11,%ymm11
-  .byte  196,98,125,24,53,202,115,2,0        // vbroadcastss  0x273ca(%rip),%ymm14        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,53,102,111,2,0        // vbroadcastss  0x26f66(%rip),%ymm14        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,65,36,86,222                    // vorps         %ymm14,%ymm11,%ymm11
-  .byte  196,98,125,24,53,96,116,2,0         // vbroadcastss  0x27460(%rip),%ymm14        # 3ac1c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  .byte  196,98,125,24,53,252,111,2,0        // vbroadcastss  0x26ffc(%rip),%ymm14        # 3a44c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   .byte  196,65,20,88,238                    // vaddps        %ymm14,%ymm13,%ymm13
-  .byte  196,98,125,24,53,86,116,2,0         // vbroadcastss  0x27456(%rip),%ymm14        # 3ac20 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  .byte  196,98,125,24,53,242,111,2,0        // vbroadcastss  0x26ff2(%rip),%ymm14        # 3a450 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   .byte  196,65,36,89,246                    // vmulps        %ymm14,%ymm11,%ymm14
   .byte  196,65,20,92,238                    // vsubps        %ymm14,%ymm13,%ymm13
-  .byte  196,98,125,24,53,71,116,2,0         // vbroadcastss  0x27447(%rip),%ymm14        # 3ac24 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  .byte  196,98,125,24,53,227,111,2,0        // vbroadcastss  0x26fe3(%rip),%ymm14        # 3a454 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   .byte  196,65,36,88,222                    // vaddps        %ymm14,%ymm11,%ymm11
-  .byte  196,98,125,24,53,61,116,2,0         // vbroadcastss  0x2743d(%rip),%ymm14        # 3ac28 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  .byte  196,98,125,24,53,217,111,2,0        // vbroadcastss  0x26fd9(%rip),%ymm14        # 3a458 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   .byte  196,65,12,94,219                    // vdivps        %ymm11,%ymm14,%ymm11
   .byte  196,65,20,92,219                    // vsubps        %ymm11,%ymm13,%ymm11
   .byte  196,65,28,89,219                    // vmulps        %ymm11,%ymm12,%ymm11
   .byte  196,67,125,8,227,1                  // vroundps      $0x1,%ymm11,%ymm12
   .byte  196,65,36,92,228                    // vsubps        %ymm12,%ymm11,%ymm12
-  .byte  196,98,125,24,45,30,116,2,0         // vbroadcastss  0x2741e(%rip),%ymm13        # 3ac2c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  .byte  196,98,125,24,45,186,111,2,0        // vbroadcastss  0x26fba(%rip),%ymm13        # 3a45c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   .byte  196,65,36,88,221                    // vaddps        %ymm13,%ymm11,%ymm11
-  .byte  196,98,125,24,45,20,116,2,0         // vbroadcastss  0x27414(%rip),%ymm13        # 3ac30 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  .byte  196,98,125,24,45,176,111,2,0        // vbroadcastss  0x26fb0(%rip),%ymm13        # 3a460 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   .byte  196,65,28,89,237                    // vmulps        %ymm13,%ymm12,%ymm13
   .byte  196,65,36,92,221                    // vsubps        %ymm13,%ymm11,%ymm11
-  .byte  196,98,125,24,45,5,116,2,0          // vbroadcastss  0x27405(%rip),%ymm13        # 3ac34 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  .byte  196,98,125,24,45,161,111,2,0        // vbroadcastss  0x26fa1(%rip),%ymm13        # 3a464 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   .byte  196,65,20,92,228                    // vsubps        %ymm12,%ymm13,%ymm12
-  .byte  196,98,125,24,45,251,115,2,0        // vbroadcastss  0x273fb(%rip),%ymm13        # 3ac38 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  .byte  196,98,125,24,45,151,111,2,0        // vbroadcastss  0x26f97(%rip),%ymm13        # 3a468 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   .byte  196,65,20,94,228                    // vdivps        %ymm12,%ymm13,%ymm12
   .byte  196,65,36,88,220                    // vaddps        %ymm12,%ymm11,%ymm11
-  .byte  196,98,125,24,37,236,115,2,0        // vbroadcastss  0x273ec(%rip),%ymm12        # 3ac3c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  .byte  196,98,125,24,37,136,111,2,0        // vbroadcastss  0x26f88(%rip),%ymm12        # 3a46c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   .byte  196,65,36,89,220                    // vmulps        %ymm12,%ymm11,%ymm11
   .byte  196,65,125,91,219                   // vcvtps2dq     %ymm11,%ymm11
   .byte  196,99,37,74,208,160                // vblendvps     %ymm10,%ymm0,%ymm11,%ymm10
@@ -18996,7 +18829,7 @@
   .byte  196,65,44,88,211                    // vaddps        %ymm11,%ymm10,%ymm10
   .byte  196,67,45,74,193,128                // vblendvps     %ymm8,%ymm9,%ymm10,%ymm8
   .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
-  .byte  196,98,125,24,5,254,114,2,0         // vbroadcastss  0x272fe(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,154,110,2,0         // vbroadcastss  0x26e9a(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -19020,36 +18853,36 @@
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  197,36,194,209,0                    // vcmpeqps      %ymm1,%ymm11,%ymm10
   .byte  196,65,124,91,235                   // vcvtdq2ps     %ymm11,%ymm13
-  .byte  196,98,125,24,53,57,115,2,0         // vbroadcastss  0x27339(%rip),%ymm14        # 3ac14 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  .byte  196,98,125,24,53,213,110,2,0        // vbroadcastss  0x26ed5(%rip),%ymm14        # 3a444 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
   .byte  196,65,20,89,238                    // vmulps        %ymm14,%ymm13,%ymm13
-  .byte  196,98,125,24,53,47,115,2,0         // vbroadcastss  0x2732f(%rip),%ymm14        # 3ac18 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  .byte  196,98,125,24,53,203,110,2,0        // vbroadcastss  0x26ecb(%rip),%ymm14        # 3a448 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   .byte  196,65,36,84,222                    // vandps        %ymm14,%ymm11,%ymm11
-  .byte  196,98,125,24,53,129,114,2,0        // vbroadcastss  0x27281(%rip),%ymm14        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,53,29,110,2,0         // vbroadcastss  0x26e1d(%rip),%ymm14        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,65,36,86,222                    // vorps         %ymm14,%ymm11,%ymm11
-  .byte  196,98,125,24,53,23,115,2,0         // vbroadcastss  0x27317(%rip),%ymm14        # 3ac1c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  .byte  196,98,125,24,53,179,110,2,0        // vbroadcastss  0x26eb3(%rip),%ymm14        # 3a44c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   .byte  196,65,20,88,238                    // vaddps        %ymm14,%ymm13,%ymm13
-  .byte  196,98,125,24,53,13,115,2,0         // vbroadcastss  0x2730d(%rip),%ymm14        # 3ac20 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  .byte  196,98,125,24,53,169,110,2,0        // vbroadcastss  0x26ea9(%rip),%ymm14        # 3a450 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   .byte  196,65,36,89,246                    // vmulps        %ymm14,%ymm11,%ymm14
   .byte  196,65,20,92,238                    // vsubps        %ymm14,%ymm13,%ymm13
-  .byte  196,98,125,24,53,254,114,2,0        // vbroadcastss  0x272fe(%rip),%ymm14        # 3ac24 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  .byte  196,98,125,24,53,154,110,2,0        // vbroadcastss  0x26e9a(%rip),%ymm14        # 3a454 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   .byte  196,65,36,88,222                    // vaddps        %ymm14,%ymm11,%ymm11
-  .byte  196,98,125,24,53,244,114,2,0        // vbroadcastss  0x272f4(%rip),%ymm14        # 3ac28 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  .byte  196,98,125,24,53,144,110,2,0        // vbroadcastss  0x26e90(%rip),%ymm14        # 3a458 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   .byte  196,65,12,94,219                    // vdivps        %ymm11,%ymm14,%ymm11
   .byte  196,65,20,92,219                    // vsubps        %ymm11,%ymm13,%ymm11
   .byte  196,65,28,89,219                    // vmulps        %ymm11,%ymm12,%ymm11
   .byte  196,67,125,8,227,1                  // vroundps      $0x1,%ymm11,%ymm12
   .byte  196,65,36,92,228                    // vsubps        %ymm12,%ymm11,%ymm12
-  .byte  196,98,125,24,45,213,114,2,0        // vbroadcastss  0x272d5(%rip),%ymm13        # 3ac2c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  .byte  196,98,125,24,45,113,110,2,0        // vbroadcastss  0x26e71(%rip),%ymm13        # 3a45c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   .byte  196,65,36,88,221                    // vaddps        %ymm13,%ymm11,%ymm11
-  .byte  196,98,125,24,45,203,114,2,0        // vbroadcastss  0x272cb(%rip),%ymm13        # 3ac30 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  .byte  196,98,125,24,45,103,110,2,0        // vbroadcastss  0x26e67(%rip),%ymm13        # 3a460 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   .byte  196,65,28,89,237                    // vmulps        %ymm13,%ymm12,%ymm13
   .byte  196,65,36,92,221                    // vsubps        %ymm13,%ymm11,%ymm11
-  .byte  196,98,125,24,45,188,114,2,0        // vbroadcastss  0x272bc(%rip),%ymm13        # 3ac34 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  .byte  196,98,125,24,45,88,110,2,0         // vbroadcastss  0x26e58(%rip),%ymm13        # 3a464 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   .byte  196,65,20,92,228                    // vsubps        %ymm12,%ymm13,%ymm12
-  .byte  196,98,125,24,45,178,114,2,0        // vbroadcastss  0x272b2(%rip),%ymm13        # 3ac38 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  .byte  196,98,125,24,45,78,110,2,0         // vbroadcastss  0x26e4e(%rip),%ymm13        # 3a468 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   .byte  196,65,20,94,228                    // vdivps        %ymm12,%ymm13,%ymm12
   .byte  196,65,36,88,220                    // vaddps        %ymm12,%ymm11,%ymm11
-  .byte  196,98,125,24,37,163,114,2,0        // vbroadcastss  0x272a3(%rip),%ymm12        # 3ac3c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  .byte  196,98,125,24,37,63,110,2,0         // vbroadcastss  0x26e3f(%rip),%ymm12        # 3a46c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   .byte  196,65,36,89,220                    // vmulps        %ymm12,%ymm11,%ymm11
   .byte  196,65,125,91,219                   // vcvtps2dq     %ymm11,%ymm11
   .byte  196,99,37,74,209,160                // vblendvps     %ymm10,%ymm1,%ymm11,%ymm10
@@ -19057,7 +18890,7 @@
   .byte  196,65,44,88,211                    // vaddps        %ymm11,%ymm10,%ymm10
   .byte  196,67,45,74,193,128                // vblendvps     %ymm8,%ymm9,%ymm10,%ymm8
   .byte  197,188,95,201                      // vmaxps        %ymm1,%ymm8,%ymm1
-  .byte  196,98,125,24,5,181,113,2,0         // vbroadcastss  0x271b5(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,81,109,2,0          // vbroadcastss  0x26d51(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,116,93,200                  // vminps        %ymm8,%ymm1,%ymm1
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -19081,36 +18914,36 @@
   .byte  197,236,87,210                      // vxorps        %ymm2,%ymm2,%ymm2
   .byte  197,36,194,210,0                    // vcmpeqps      %ymm2,%ymm11,%ymm10
   .byte  196,65,124,91,235                   // vcvtdq2ps     %ymm11,%ymm13
-  .byte  196,98,125,24,53,240,113,2,0        // vbroadcastss  0x271f0(%rip),%ymm14        # 3ac14 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  .byte  196,98,125,24,53,140,109,2,0        // vbroadcastss  0x26d8c(%rip),%ymm14        # 3a444 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
   .byte  196,65,20,89,238                    // vmulps        %ymm14,%ymm13,%ymm13
-  .byte  196,98,125,24,53,230,113,2,0        // vbroadcastss  0x271e6(%rip),%ymm14        # 3ac18 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  .byte  196,98,125,24,53,130,109,2,0        // vbroadcastss  0x26d82(%rip),%ymm14        # 3a448 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   .byte  196,65,36,84,222                    // vandps        %ymm14,%ymm11,%ymm11
-  .byte  196,98,125,24,53,56,113,2,0         // vbroadcastss  0x27138(%rip),%ymm14        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,53,212,108,2,0        // vbroadcastss  0x26cd4(%rip),%ymm14        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,65,36,86,222                    // vorps         %ymm14,%ymm11,%ymm11
-  .byte  196,98,125,24,53,206,113,2,0        // vbroadcastss  0x271ce(%rip),%ymm14        # 3ac1c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  .byte  196,98,125,24,53,106,109,2,0        // vbroadcastss  0x26d6a(%rip),%ymm14        # 3a44c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   .byte  196,65,20,88,238                    // vaddps        %ymm14,%ymm13,%ymm13
-  .byte  196,98,125,24,53,196,113,2,0        // vbroadcastss  0x271c4(%rip),%ymm14        # 3ac20 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  .byte  196,98,125,24,53,96,109,2,0         // vbroadcastss  0x26d60(%rip),%ymm14        # 3a450 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   .byte  196,65,36,89,246                    // vmulps        %ymm14,%ymm11,%ymm14
   .byte  196,65,20,92,238                    // vsubps        %ymm14,%ymm13,%ymm13
-  .byte  196,98,125,24,53,181,113,2,0        // vbroadcastss  0x271b5(%rip),%ymm14        # 3ac24 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  .byte  196,98,125,24,53,81,109,2,0         // vbroadcastss  0x26d51(%rip),%ymm14        # 3a454 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   .byte  196,65,36,88,222                    // vaddps        %ymm14,%ymm11,%ymm11
-  .byte  196,98,125,24,53,171,113,2,0        // vbroadcastss  0x271ab(%rip),%ymm14        # 3ac28 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  .byte  196,98,125,24,53,71,109,2,0         // vbroadcastss  0x26d47(%rip),%ymm14        # 3a458 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   .byte  196,65,12,94,219                    // vdivps        %ymm11,%ymm14,%ymm11
   .byte  196,65,20,92,219                    // vsubps        %ymm11,%ymm13,%ymm11
   .byte  196,65,28,89,219                    // vmulps        %ymm11,%ymm12,%ymm11
   .byte  196,67,125,8,227,1                  // vroundps      $0x1,%ymm11,%ymm12
   .byte  196,65,36,92,228                    // vsubps        %ymm12,%ymm11,%ymm12
-  .byte  196,98,125,24,45,140,113,2,0        // vbroadcastss  0x2718c(%rip),%ymm13        # 3ac2c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  .byte  196,98,125,24,45,40,109,2,0         // vbroadcastss  0x26d28(%rip),%ymm13        # 3a45c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   .byte  196,65,36,88,221                    // vaddps        %ymm13,%ymm11,%ymm11
-  .byte  196,98,125,24,45,130,113,2,0        // vbroadcastss  0x27182(%rip),%ymm13        # 3ac30 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  .byte  196,98,125,24,45,30,109,2,0         // vbroadcastss  0x26d1e(%rip),%ymm13        # 3a460 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   .byte  196,65,28,89,237                    // vmulps        %ymm13,%ymm12,%ymm13
   .byte  196,65,36,92,221                    // vsubps        %ymm13,%ymm11,%ymm11
-  .byte  196,98,125,24,45,115,113,2,0        // vbroadcastss  0x27173(%rip),%ymm13        # 3ac34 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  .byte  196,98,125,24,45,15,109,2,0         // vbroadcastss  0x26d0f(%rip),%ymm13        # 3a464 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   .byte  196,65,20,92,228                    // vsubps        %ymm12,%ymm13,%ymm12
-  .byte  196,98,125,24,45,105,113,2,0        // vbroadcastss  0x27169(%rip),%ymm13        # 3ac38 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  .byte  196,98,125,24,45,5,109,2,0          // vbroadcastss  0x26d05(%rip),%ymm13        # 3a468 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   .byte  196,65,20,94,228                    // vdivps        %ymm12,%ymm13,%ymm12
   .byte  196,65,36,88,220                    // vaddps        %ymm12,%ymm11,%ymm11
-  .byte  196,98,125,24,37,90,113,2,0         // vbroadcastss  0x2715a(%rip),%ymm12        # 3ac3c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  .byte  196,98,125,24,37,246,108,2,0        // vbroadcastss  0x26cf6(%rip),%ymm12        # 3a46c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   .byte  196,65,36,89,220                    // vmulps        %ymm12,%ymm11,%ymm11
   .byte  196,65,125,91,219                   // vcvtps2dq     %ymm11,%ymm11
   .byte  196,99,37,74,210,160                // vblendvps     %ymm10,%ymm2,%ymm11,%ymm10
@@ -19118,7 +18951,7 @@
   .byte  196,65,44,88,211                    // vaddps        %ymm11,%ymm10,%ymm10
   .byte  196,67,45,74,193,128                // vblendvps     %ymm8,%ymm9,%ymm10,%ymm8
   .byte  197,188,95,210                      // vmaxps        %ymm2,%ymm8,%ymm2
-  .byte  196,98,125,24,5,108,112,2,0         // vbroadcastss  0x2706c(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,8,108,2,0           // vbroadcastss  0x26c08(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,108,93,208                  // vminps        %ymm8,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -19142,36 +18975,36 @@
   .byte  197,228,87,219                      // vxorps        %ymm3,%ymm3,%ymm3
   .byte  197,36,194,211,0                    // vcmpeqps      %ymm3,%ymm11,%ymm10
   .byte  196,65,124,91,235                   // vcvtdq2ps     %ymm11,%ymm13
-  .byte  196,98,125,24,53,167,112,2,0        // vbroadcastss  0x270a7(%rip),%ymm14        # 3ac14 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  .byte  196,98,125,24,53,67,108,2,0         // vbroadcastss  0x26c43(%rip),%ymm14        # 3a444 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
   .byte  196,65,20,89,238                    // vmulps        %ymm14,%ymm13,%ymm13
-  .byte  196,98,125,24,53,157,112,2,0        // vbroadcastss  0x2709d(%rip),%ymm14        # 3ac18 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  .byte  196,98,125,24,53,57,108,2,0         // vbroadcastss  0x26c39(%rip),%ymm14        # 3a448 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   .byte  196,65,36,84,222                    // vandps        %ymm14,%ymm11,%ymm11
-  .byte  196,98,125,24,53,239,111,2,0        // vbroadcastss  0x26fef(%rip),%ymm14        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,53,139,107,2,0        // vbroadcastss  0x26b8b(%rip),%ymm14        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,65,36,86,222                    // vorps         %ymm14,%ymm11,%ymm11
-  .byte  196,98,125,24,53,133,112,2,0        // vbroadcastss  0x27085(%rip),%ymm14        # 3ac1c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  .byte  196,98,125,24,53,33,108,2,0         // vbroadcastss  0x26c21(%rip),%ymm14        # 3a44c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   .byte  196,65,20,88,238                    // vaddps        %ymm14,%ymm13,%ymm13
-  .byte  196,98,125,24,53,123,112,2,0        // vbroadcastss  0x2707b(%rip),%ymm14        # 3ac20 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  .byte  196,98,125,24,53,23,108,2,0         // vbroadcastss  0x26c17(%rip),%ymm14        # 3a450 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   .byte  196,65,36,89,246                    // vmulps        %ymm14,%ymm11,%ymm14
   .byte  196,65,20,92,238                    // vsubps        %ymm14,%ymm13,%ymm13
-  .byte  196,98,125,24,53,108,112,2,0        // vbroadcastss  0x2706c(%rip),%ymm14        # 3ac24 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  .byte  196,98,125,24,53,8,108,2,0          // vbroadcastss  0x26c08(%rip),%ymm14        # 3a454 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   .byte  196,65,36,88,222                    // vaddps        %ymm14,%ymm11,%ymm11
-  .byte  196,98,125,24,53,98,112,2,0         // vbroadcastss  0x27062(%rip),%ymm14        # 3ac28 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  .byte  196,98,125,24,53,254,107,2,0        // vbroadcastss  0x26bfe(%rip),%ymm14        # 3a458 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   .byte  196,65,12,94,219                    // vdivps        %ymm11,%ymm14,%ymm11
   .byte  196,65,20,92,219                    // vsubps        %ymm11,%ymm13,%ymm11
   .byte  196,65,28,89,219                    // vmulps        %ymm11,%ymm12,%ymm11
   .byte  196,67,125,8,227,1                  // vroundps      $0x1,%ymm11,%ymm12
   .byte  196,65,36,92,228                    // vsubps        %ymm12,%ymm11,%ymm12
-  .byte  196,98,125,24,45,67,112,2,0         // vbroadcastss  0x27043(%rip),%ymm13        # 3ac2c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  .byte  196,98,125,24,45,223,107,2,0        // vbroadcastss  0x26bdf(%rip),%ymm13        # 3a45c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   .byte  196,65,36,88,221                    // vaddps        %ymm13,%ymm11,%ymm11
-  .byte  196,98,125,24,45,57,112,2,0         // vbroadcastss  0x27039(%rip),%ymm13        # 3ac30 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  .byte  196,98,125,24,45,213,107,2,0        // vbroadcastss  0x26bd5(%rip),%ymm13        # 3a460 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   .byte  196,65,28,89,237                    // vmulps        %ymm13,%ymm12,%ymm13
   .byte  196,65,36,92,221                    // vsubps        %ymm13,%ymm11,%ymm11
-  .byte  196,98,125,24,45,42,112,2,0         // vbroadcastss  0x2702a(%rip),%ymm13        # 3ac34 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  .byte  196,98,125,24,45,198,107,2,0        // vbroadcastss  0x26bc6(%rip),%ymm13        # 3a464 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   .byte  196,65,20,92,228                    // vsubps        %ymm12,%ymm13,%ymm12
-  .byte  196,98,125,24,45,32,112,2,0         // vbroadcastss  0x27020(%rip),%ymm13        # 3ac38 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  .byte  196,98,125,24,45,188,107,2,0        // vbroadcastss  0x26bbc(%rip),%ymm13        # 3a468 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   .byte  196,65,20,94,228                    // vdivps        %ymm12,%ymm13,%ymm12
   .byte  196,65,36,88,220                    // vaddps        %ymm12,%ymm11,%ymm11
-  .byte  196,98,125,24,37,17,112,2,0         // vbroadcastss  0x27011(%rip),%ymm12        # 3ac3c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  .byte  196,98,125,24,37,173,107,2,0        // vbroadcastss  0x26bad(%rip),%ymm12        # 3a46c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   .byte  196,65,36,89,220                    // vmulps        %ymm12,%ymm11,%ymm11
   .byte  196,65,125,91,219                   // vcvtps2dq     %ymm11,%ymm11
   .byte  196,99,37,74,211,160                // vblendvps     %ymm10,%ymm3,%ymm11,%ymm10
@@ -19179,7 +19012,7 @@
   .byte  196,65,44,88,211                    // vaddps        %ymm11,%ymm10,%ymm10
   .byte  196,67,45,74,193,128                // vblendvps     %ymm8,%ymm9,%ymm10,%ymm8
   .byte  197,188,95,219                      // vmaxps        %ymm3,%ymm8,%ymm3
-  .byte  196,98,125,24,5,35,111,2,0          // vbroadcastss  0x26f23(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,191,106,2,0         // vbroadcastss  0x26abf(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,100,93,216                  // vminps        %ymm8,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -19198,22 +19031,22 @@
   .byte  197,252,17,76,36,128                // vmovups       %ymm1,-0x80(%rsp)
   .byte  197,252,40,224                      // vmovaps       %ymm0,%ymm4
   .byte  197,252,91,204                      // vcvtdq2ps     %ymm4,%ymm1
-  .byte  196,226,125,24,5,110,111,2,0        // vbroadcastss  0x26f6e(%rip),%ymm0        # 3ac14 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  .byte  196,226,125,24,5,10,107,2,0         // vbroadcastss  0x26b0a(%rip),%ymm0        # 3a444 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
   .byte  197,244,89,200                      // vmulps        %ymm0,%ymm1,%ymm1
   .byte  197,124,40,192                      // vmovaps       %ymm0,%ymm8
   .byte  197,124,17,68,36,160                // vmovups       %ymm8,-0x60(%rsp)
-  .byte  196,98,125,24,13,91,111,2,0         // vbroadcastss  0x26f5b(%rip),%ymm9        # 3ac18 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  .byte  196,98,125,24,13,247,106,2,0        // vbroadcastss  0x26af7(%rip),%ymm9        # 3a448 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   .byte  196,193,92,84,209                   // vandps        %ymm9,%ymm4,%ymm2
-  .byte  196,98,125,24,21,173,110,2,0        // vbroadcastss  0x26ead(%rip),%ymm10        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,21,73,106,2,0         // vbroadcastss  0x26a49(%rip),%ymm10        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,193,108,86,210                  // vorps         %ymm10,%ymm2,%ymm2
-  .byte  196,98,125,24,29,67,111,2,0         // vbroadcastss  0x26f43(%rip),%ymm11        # 3ac1c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  .byte  196,98,125,24,29,223,106,2,0        // vbroadcastss  0x26adf(%rip),%ymm11        # 3a44c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   .byte  196,193,116,88,203                  // vaddps        %ymm11,%ymm1,%ymm1
-  .byte  196,98,125,24,37,57,111,2,0         // vbroadcastss  0x26f39(%rip),%ymm12        # 3ac20 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  .byte  196,98,125,24,37,213,106,2,0        // vbroadcastss  0x26ad5(%rip),%ymm12        # 3a450 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   .byte  196,193,108,89,220                  // vmulps        %ymm12,%ymm2,%ymm3
   .byte  197,244,92,203                      // vsubps        %ymm3,%ymm1,%ymm1
-  .byte  196,98,125,24,45,43,111,2,0         // vbroadcastss  0x26f2b(%rip),%ymm13        # 3ac24 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  .byte  196,98,125,24,45,199,106,2,0        // vbroadcastss  0x26ac7(%rip),%ymm13        # 3a454 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   .byte  196,193,108,88,213                  // vaddps        %ymm13,%ymm2,%ymm2
-  .byte  196,98,125,24,53,33,111,2,0         // vbroadcastss  0x26f21(%rip),%ymm14        # 3ac28 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  .byte  196,98,125,24,53,189,106,2,0        // vbroadcastss  0x26abd(%rip),%ymm14        # 3a458 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   .byte  197,140,94,210                      // vdivps        %ymm2,%ymm14,%ymm2
   .byte  197,244,92,202                      // vsubps        %ymm2,%ymm1,%ymm1
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -19221,19 +19054,19 @@
   .byte  197,244,89,206                      // vmulps        %ymm6,%ymm1,%ymm1
   .byte  196,227,125,8,209,1                 // vroundps      $0x1,%ymm1,%ymm2
   .byte  197,244,92,234                      // vsubps        %ymm2,%ymm1,%ymm5
-  .byte  196,98,125,24,61,255,110,2,0        // vbroadcastss  0x26eff(%rip),%ymm15        # 3ac2c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  .byte  196,98,125,24,61,155,106,2,0        // vbroadcastss  0x26a9b(%rip),%ymm15        # 3a45c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   .byte  196,193,116,88,207                  // vaddps        %ymm15,%ymm1,%ymm1
-  .byte  196,226,125,24,61,245,110,2,0       // vbroadcastss  0x26ef5(%rip),%ymm7        # 3ac30 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  .byte  196,226,125,24,61,145,106,2,0       // vbroadcastss  0x26a91(%rip),%ymm7        # 3a460 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   .byte  197,212,89,215                      // vmulps        %ymm7,%ymm5,%ymm2
   .byte  197,244,92,194                      // vsubps        %ymm2,%ymm1,%ymm0
-  .byte  196,226,125,24,29,232,110,2,0       // vbroadcastss  0x26ee8(%rip),%ymm3        # 3ac34 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  .byte  196,226,125,24,29,132,106,2,0       // vbroadcastss  0x26a84(%rip),%ymm3        # 3a464 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   .byte  197,228,92,237                      // vsubps        %ymm5,%ymm3,%ymm5
-  .byte  196,226,125,24,21,223,110,2,0       // vbroadcastss  0x26edf(%rip),%ymm2        # 3ac38 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  .byte  196,226,125,24,21,123,106,2,0       // vbroadcastss  0x26a7b(%rip),%ymm2        # 3a468 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   .byte  197,236,94,237                      // vdivps        %ymm5,%ymm2,%ymm5
   .byte  197,252,88,197                      // vaddps        %ymm5,%ymm0,%ymm0
   .byte  197,212,87,237                      // vxorps        %ymm5,%ymm5,%ymm5
   .byte  197,220,194,205,0                   // vcmpeqps      %ymm5,%ymm4,%ymm1
-  .byte  196,226,125,24,37,201,110,2,0       // vbroadcastss  0x26ec9(%rip),%ymm4        # 3ac3c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  .byte  196,226,125,24,37,101,106,2,0       // vbroadcastss  0x26a65(%rip),%ymm4        # 3a46c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   .byte  197,252,89,196                      // vmulps        %ymm4,%ymm0,%ymm0
   .byte  197,253,91,192                      // vcvtps2dq     %ymm0,%ymm0
   .byte  196,227,125,74,197,16               // vblendvps     %ymm1,%ymm5,%ymm0,%ymm0
@@ -19315,23 +19148,23 @@
   .byte  197,252,17,76,36,96                 // vmovups       %ymm1,0x60(%rsp)
   .byte  197,252,17,68,36,64                 // vmovups       %ymm0,0x40(%rsp)
   .byte  197,252,91,196                      // vcvtdq2ps     %ymm4,%ymm0
-  .byte  196,226,125,24,29,30,109,2,0        // vbroadcastss  0x26d1e(%rip),%ymm3        # 3ac14 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  .byte  196,226,125,24,29,186,104,2,0       // vbroadcastss  0x268ba(%rip),%ymm3        # 3a444 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
   .byte  197,252,89,195                      // vmulps        %ymm3,%ymm0,%ymm0
-  .byte  196,226,125,24,13,21,109,2,0        // vbroadcastss  0x26d15(%rip),%ymm1        # 3ac18 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  .byte  196,226,125,24,13,177,104,2,0       // vbroadcastss  0x268b1(%rip),%ymm1        # 3a448 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   .byte  197,252,17,12,36                    // vmovups       %ymm1,(%rsp)
   .byte  197,220,84,201                      // vandps        %ymm1,%ymm4,%ymm1
-  .byte  196,226,125,24,21,99,108,2,0        // vbroadcastss  0x26c63(%rip),%ymm2        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,226,125,24,21,255,103,2,0       // vbroadcastss  0x267ff(%rip),%ymm2        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,252,17,84,36,224                // vmovups       %ymm2,-0x20(%rsp)
   .byte  197,244,86,202                      // vorps         %ymm2,%ymm1,%ymm1
-  .byte  196,226,125,24,21,244,108,2,0       // vbroadcastss  0x26cf4(%rip),%ymm2        # 3ac1c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  .byte  196,226,125,24,21,144,104,2,0       // vbroadcastss  0x26890(%rip),%ymm2        # 3a44c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   .byte  197,252,17,84,36,192                // vmovups       %ymm2,-0x40(%rsp)
   .byte  197,252,88,194                      // vaddps        %ymm2,%ymm0,%ymm0
-  .byte  196,98,125,24,37,229,108,2,0        // vbroadcastss  0x26ce5(%rip),%ymm12        # 3ac20 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  .byte  196,98,125,24,37,129,104,2,0        // vbroadcastss  0x26881(%rip),%ymm12        # 3a450 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   .byte  196,193,116,89,212                  // vmulps        %ymm12,%ymm1,%ymm2
   .byte  197,252,92,194                      // vsubps        %ymm2,%ymm0,%ymm0
-  .byte  196,98,125,24,45,215,108,2,0        // vbroadcastss  0x26cd7(%rip),%ymm13        # 3ac24 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  .byte  196,98,125,24,45,115,104,2,0        // vbroadcastss  0x26873(%rip),%ymm13        # 3a454 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   .byte  196,193,116,88,205                  // vaddps        %ymm13,%ymm1,%ymm1
-  .byte  196,98,125,24,53,205,108,2,0        // vbroadcastss  0x26ccd(%rip),%ymm14        # 3ac28 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  .byte  196,98,125,24,53,105,104,2,0        // vbroadcastss  0x26869(%rip),%ymm14        # 3a458 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   .byte  197,140,94,201                      // vdivps        %ymm1,%ymm14,%ymm1
   .byte  197,252,92,193                      // vsubps        %ymm1,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -19339,19 +19172,19 @@
   .byte  197,252,89,197                      // vmulps        %ymm5,%ymm0,%ymm0
   .byte  196,227,125,8,200,1                 // vroundps      $0x1,%ymm0,%ymm1
   .byte  197,252,92,201                      // vsubps        %ymm1,%ymm0,%ymm1
-  .byte  196,98,125,24,61,171,108,2,0        // vbroadcastss  0x26cab(%rip),%ymm15        # 3ac2c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  .byte  196,98,125,24,61,71,104,2,0         // vbroadcastss  0x26847(%rip),%ymm15        # 3a45c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   .byte  196,193,124,88,199                  // vaddps        %ymm15,%ymm0,%ymm0
-  .byte  196,98,125,24,29,161,108,2,0        // vbroadcastss  0x26ca1(%rip),%ymm11        # 3ac30 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  .byte  196,98,125,24,29,61,104,2,0         // vbroadcastss  0x2683d(%rip),%ymm11        # 3a460 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   .byte  196,193,116,89,211                  // vmulps        %ymm11,%ymm1,%ymm2
   .byte  197,252,92,194                      // vsubps        %ymm2,%ymm0,%ymm0
-  .byte  196,98,125,24,21,147,108,2,0        // vbroadcastss  0x26c93(%rip),%ymm10        # 3ac34 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  .byte  196,98,125,24,21,47,104,2,0         // vbroadcastss  0x2682f(%rip),%ymm10        # 3a464 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   .byte  197,172,92,241                      // vsubps        %ymm1,%ymm10,%ymm6
-  .byte  196,98,125,24,13,138,108,2,0        // vbroadcastss  0x26c8a(%rip),%ymm9        # 3ac38 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  .byte  196,98,125,24,13,38,104,2,0         // vbroadcastss  0x26826(%rip),%ymm9        # 3a468 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   .byte  197,180,94,246                      // vdivps        %ymm6,%ymm9,%ymm6
   .byte  197,252,88,198                      // vaddps        %ymm6,%ymm0,%ymm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  197,220,194,225,0                   // vcmpeqps      %ymm1,%ymm4,%ymm4
-  .byte  196,226,125,24,61,116,108,2,0       // vbroadcastss  0x26c74(%rip),%ymm7        # 3ac3c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  .byte  196,226,125,24,61,16,104,2,0        // vbroadcastss  0x26810(%rip),%ymm7        # 3a46c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   .byte  197,252,89,199                      // vmulps        %ymm7,%ymm0,%ymm0
   .byte  197,253,91,192                      // vcvtps2dq     %ymm0,%ymm0
   .byte  196,227,125,74,193,64               // vblendvps     %ymm4,%ymm1,%ymm0,%ymm0
@@ -19425,31 +19258,31 @@
 .globl _sk_lab_to_xyz_avx
 FUNCTION(_sk_lab_to_xyz_avx)
 _sk_lab_to_xyz_avx:
-  .byte  196,98,125,24,5,31,107,2,0          // vbroadcastss  0x26b1f(%rip),%ymm8        # 3ac40 <_sk_srcover_bgra_8888_sse2_lowp+0x374>
+  .byte  196,98,125,24,5,187,102,2,0         // vbroadcastss  0x266bb(%rip),%ymm8        # 3a470 <_sk_srcover_bgra_8888_sse2_lowp+0x374>
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
-  .byte  196,98,125,24,5,121,106,2,0         // vbroadcastss  0x26a79(%rip),%ymm8        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,98,125,24,5,21,102,2,0          // vbroadcastss  0x26615(%rip),%ymm8        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   .byte  196,193,116,89,200                  // vmulps        %ymm8,%ymm1,%ymm1
-  .byte  196,98,125,24,13,7,107,2,0          // vbroadcastss  0x26b07(%rip),%ymm9        # 3ac44 <_sk_srcover_bgra_8888_sse2_lowp+0x378>
+  .byte  196,98,125,24,13,163,102,2,0        // vbroadcastss  0x266a3(%rip),%ymm9        # 3a474 <_sk_srcover_bgra_8888_sse2_lowp+0x378>
   .byte  196,193,116,88,201                  // vaddps        %ymm9,%ymm1,%ymm1
   .byte  196,193,108,89,208                  // vmulps        %ymm8,%ymm2,%ymm2
   .byte  196,193,108,88,209                  // vaddps        %ymm9,%ymm2,%ymm2
-  .byte  196,98,125,24,5,243,106,2,0         // vbroadcastss  0x26af3(%rip),%ymm8        # 3ac48 <_sk_srcover_bgra_8888_sse2_lowp+0x37c>
+  .byte  196,98,125,24,5,143,102,2,0         // vbroadcastss  0x2668f(%rip),%ymm8        # 3a478 <_sk_srcover_bgra_8888_sse2_lowp+0x37c>
   .byte  196,193,124,88,192                  // vaddps        %ymm8,%ymm0,%ymm0
-  .byte  196,98,125,24,5,233,106,2,0         // vbroadcastss  0x26ae9(%rip),%ymm8        # 3ac4c <_sk_srcover_bgra_8888_sse2_lowp+0x380>
+  .byte  196,98,125,24,5,133,102,2,0         // vbroadcastss  0x26685(%rip),%ymm8        # 3a47c <_sk_srcover_bgra_8888_sse2_lowp+0x380>
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
-  .byte  196,98,125,24,5,223,106,2,0         // vbroadcastss  0x26adf(%rip),%ymm8        # 3ac50 <_sk_srcover_bgra_8888_sse2_lowp+0x384>
+  .byte  196,98,125,24,5,123,102,2,0         // vbroadcastss  0x2667b(%rip),%ymm8        # 3a480 <_sk_srcover_bgra_8888_sse2_lowp+0x384>
   .byte  196,193,116,89,200                  // vmulps        %ymm8,%ymm1,%ymm1
   .byte  197,252,88,201                      // vaddps        %ymm1,%ymm0,%ymm1
-  .byte  196,98,125,24,5,209,106,2,0         // vbroadcastss  0x26ad1(%rip),%ymm8        # 3ac54 <_sk_srcover_bgra_8888_sse2_lowp+0x388>
+  .byte  196,98,125,24,5,109,102,2,0         // vbroadcastss  0x2666d(%rip),%ymm8        # 3a484 <_sk_srcover_bgra_8888_sse2_lowp+0x388>
   .byte  196,193,108,89,208                  // vmulps        %ymm8,%ymm2,%ymm2
   .byte  197,252,92,210                      // vsubps        %ymm2,%ymm0,%ymm2
   .byte  197,116,89,193                      // vmulps        %ymm1,%ymm1,%ymm8
   .byte  196,65,116,89,192                   // vmulps        %ymm8,%ymm1,%ymm8
-  .byte  196,98,125,24,13,186,106,2,0        // vbroadcastss  0x26aba(%rip),%ymm9        # 3ac58 <_sk_srcover_bgra_8888_sse2_lowp+0x38c>
+  .byte  196,98,125,24,13,86,102,2,0         // vbroadcastss  0x26656(%rip),%ymm9        # 3a488 <_sk_srcover_bgra_8888_sse2_lowp+0x38c>
   .byte  196,65,52,194,208,1                 // vcmpltps      %ymm8,%ymm9,%ymm10
-  .byte  196,98,125,24,29,175,106,2,0        // vbroadcastss  0x26aaf(%rip),%ymm11        # 3ac5c <_sk_srcover_bgra_8888_sse2_lowp+0x390>
+  .byte  196,98,125,24,29,75,102,2,0         // vbroadcastss  0x2664b(%rip),%ymm11        # 3a48c <_sk_srcover_bgra_8888_sse2_lowp+0x390>
   .byte  196,193,116,88,203                  // vaddps        %ymm11,%ymm1,%ymm1
-  .byte  196,98,125,24,37,165,106,2,0        // vbroadcastss  0x26aa5(%rip),%ymm12        # 3ac60 <_sk_srcover_bgra_8888_sse2_lowp+0x394>
+  .byte  196,98,125,24,37,65,102,2,0         // vbroadcastss  0x26641(%rip),%ymm12        # 3a490 <_sk_srcover_bgra_8888_sse2_lowp+0x394>
   .byte  196,193,116,89,204                  // vmulps        %ymm12,%ymm1,%ymm1
   .byte  196,67,117,74,192,160               // vblendvps     %ymm10,%ymm8,%ymm1,%ymm8
   .byte  197,252,89,200                      // vmulps        %ymm0,%ymm0,%ymm1
@@ -19464,9 +19297,9 @@
   .byte  196,193,108,88,211                  // vaddps        %ymm11,%ymm2,%ymm2
   .byte  196,193,108,89,212                  // vmulps        %ymm12,%ymm2,%ymm2
   .byte  196,227,109,74,208,144              // vblendvps     %ymm9,%ymm0,%ymm2,%ymm2
-  .byte  196,226,125,24,5,91,106,2,0         // vbroadcastss  0x26a5b(%rip),%ymm0        # 3ac64 <_sk_srcover_bgra_8888_sse2_lowp+0x398>
+  .byte  196,226,125,24,5,247,101,2,0        // vbroadcastss  0x265f7(%rip),%ymm0        # 3a494 <_sk_srcover_bgra_8888_sse2_lowp+0x398>
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
-  .byte  196,98,125,24,5,82,106,2,0          // vbroadcastss  0x26a52(%rip),%ymm8        # 3ac68 <_sk_srcover_bgra_8888_sse2_lowp+0x39c>
+  .byte  196,98,125,24,5,238,101,2,0         // vbroadcastss  0x265ee(%rip),%ymm8        # 3a498 <_sk_srcover_bgra_8888_sse2_lowp+0x39c>
   .byte  196,193,108,89,208                  // vmulps        %ymm8,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -19476,60 +19309,135 @@
 FUNCTION(_sk_load_a8_avx)
 _sk_load_a8_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,68                              // jne           1427b <_sk_load_a8_avx+0x5c>
-  .byte  196,130,121,48,4,24                 // vpmovzxbw     (%r8,%r11,1),%xmm0
-  .byte  197,249,219,5,203,114,2,0           // vpand         0x272cb(%rip),%xmm0,%xmm0        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  117,68                              // jne           13f09 <_sk_load_a8_avx+0x56>
+  .byte  196,194,121,48,4,16                 // vpmovzxbw     (%r8,%rdx,1),%xmm0
+  .byte  197,249,219,5,125,110,2,0           // vpand         0x26e7d(%rip),%xmm0,%xmm0        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  196,226,121,51,200                  // vpmovzxwd     %xmm0,%xmm1
   .byte  197,249,112,192,78                  // vpshufd       $0x4e,%xmm0,%xmm0
   .byte  196,226,121,51,192                  // vpmovzxwd     %xmm0,%xmm0
   .byte  196,227,117,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,141,105,2,0       // vbroadcastss  0x2698d(%rip),%ymm1        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,226,125,24,13,47,101,2,0        // vbroadcastss  0x2652f(%rip),%ymm1        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  197,252,89,217                      // vmulps        %ymm1,%ymm0,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  197,236,87,210                      // vxorps        %ymm2,%ymm2,%ymm2
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,174                             // ja            1423d <_sk_load_a8_avx+0x1e>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,122,0,0,0                 // lea           0x7a(%rip),%r10        # 14314 <_sk_load_a8_avx+0xf5>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,180                             // ja            13ecb <_sk_load_a8_avx+0x18>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,119,0,0,0                 // lea           0x77(%rip),%r9        # 13f98 <_sk_load_a8_avx+0xe5>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  235,143                             // jmp           1423d <_sk_load_a8_avx+0x1e>
-  .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
+  .byte  235,150                             // jmp           13ecb <_sk_load_a8_avx+0x18>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,249,196,192,2                   // vpinsrw       $0x2,%eax,%xmm0,%xmm0
-  .byte  67,15,183,4,24                      // movzwl        (%r8,%r11,1),%eax
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  197,249,110,200                     // vmovd         %eax,%xmm1
   .byte  196,226,121,48,201                  // vpmovzxbw     %xmm1,%xmm1
   .byte  196,227,121,14,193,3                // vpblendw      $0x3,%xmm1,%xmm0,%xmm0
-  .byte  233,103,255,255,255                 // jmpq          1423d <_sk_load_a8_avx+0x1e>
-  .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
+  .byte  233,110,255,255,255                 // jmpq          13ecb <_sk_load_a8_avx+0x18>
+  .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,249,196,192,6                   // vpinsrw       $0x6,%eax,%xmm0,%xmm0
-  .byte  67,15,182,68,24,5                   // movzbl        0x5(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,5                   // movzbl        0x5(%r8,%rdx,1),%eax
   .byte  197,249,196,192,5                   // vpinsrw       $0x5,%eax,%xmm0,%xmm0
-  .byte  67,15,182,68,24,4                   // movzbl        0x4(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,4                   // movzbl        0x4(%r8,%rdx,1),%eax
   .byte  197,249,196,192,4                   // vpinsrw       $0x4,%eax,%xmm0,%xmm0
-  .byte  196,129,121,110,12,24               // vmovd         (%r8,%r11,1),%xmm1
+  .byte  196,193,121,110,12,16               // vmovd         (%r8,%rdx,1),%xmm1
   .byte  196,226,121,48,201                  // vpmovzxbw     %xmm1,%xmm1
   .byte  196,227,113,14,192,240              // vpblendw      $0xf0,%xmm0,%xmm1,%xmm0
-  .byte  233,44,255,255,255                  // jmpq          1423d <_sk_load_a8_avx+0x1e>
+  .byte  233,51,255,255,255                  // jmpq          13ecb <_sk_load_a8_avx+0x18>
+  .byte  146                                 // xchg          %eax,%edx
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,172,255,255,255,157,255         // ljmp          *-0x620001(%rdi,%rdi,8)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  234                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  223,255                             // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,212                             // callq         *%rsp
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,197                             // inc           %ebp
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255                                 // .byte         0xff
+
+HIDDEN _sk_load_a8_dst_avx
+.globl _sk_load_a8_dst_avx
+FUNCTION(_sk_load_a8_dst_avx)
+_sk_load_a8_dst_avx:
+  .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
+  .byte  76,3,0                              // add           (%rax),%r8
+  .byte  72,133,255                          // test          %rdi,%rdi
+  .byte  117,68                              // jne           1400a <_sk_load_a8_dst_avx+0x56>
+  .byte  196,194,121,48,36,16                // vpmovzxbw     (%r8,%rdx,1),%xmm4
+  .byte  197,217,219,37,124,109,2,0          // vpand         0x26d7c(%rip),%xmm4,%xmm4        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
+  .byte  196,226,121,51,236                  // vpmovzxwd     %xmm4,%xmm5
+  .byte  197,249,112,228,78                  // vpshufd       $0x4e,%xmm4,%xmm4
+  .byte  196,226,121,51,228                  // vpmovzxwd     %xmm4,%xmm4
+  .byte  196,227,85,24,228,1                 // vinsertf128   $0x1,%xmm4,%ymm5,%ymm4
+  .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
+  .byte  196,226,125,24,45,46,100,2,0        // vbroadcastss  0x2642e(%rip),%ymm5        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  197,220,89,253                      // vmulps        %ymm5,%ymm4,%ymm7
+  .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  197,220,87,228                      // vxorps        %ymm4,%ymm4,%ymm4
+  .byte  197,212,87,237                      // vxorps        %ymm5,%ymm5,%ymm5
+  .byte  197,204,87,246                      // vxorps        %ymm6,%ymm6,%ymm6
+  .byte  255,224                             // jmpq          *%rax
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,180                             // ja            13fcc <_sk_load_a8_dst_avx+0x18>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,122,0,0,0                 // lea           0x7a(%rip),%r9        # 1409c <_sk_load_a8_dst_avx+0xe8>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
+  .byte  255,224                             // jmpq          *%rax
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
+  .byte  197,249,110,224                     // vmovd         %eax,%xmm4
+  .byte  235,150                             // jmp           13fcc <_sk_load_a8_dst_avx+0x18>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
+  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
+  .byte  197,217,196,224,2                   // vpinsrw       $0x2,%eax,%xmm4,%xmm4
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
+  .byte  197,249,110,232                     // vmovd         %eax,%xmm5
+  .byte  196,226,121,48,237                  // vpmovzxbw     %xmm5,%xmm5
+  .byte  196,227,89,14,229,3                 // vpblendw      $0x3,%xmm5,%xmm4,%xmm4
+  .byte  233,110,255,255,255                 // jmpq          13fcc <_sk_load_a8_dst_avx+0x18>
+  .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
+  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
+  .byte  197,217,196,224,6                   // vpinsrw       $0x6,%eax,%xmm4,%xmm4
+  .byte  65,15,182,68,16,5                   // movzbl        0x5(%r8,%rdx,1),%eax
+  .byte  197,217,196,224,5                   // vpinsrw       $0x5,%eax,%xmm4,%xmm4
+  .byte  65,15,182,68,16,4                   // movzbl        0x4(%r8,%rdx,1),%eax
+  .byte  197,217,196,224,4                   // vpinsrw       $0x4,%eax,%xmm4,%xmm4
+  .byte  196,193,121,110,44,16               // vmovd         (%r8,%rdx,1),%xmm5
+  .byte  196,226,121,48,237                  // vpmovzxbw     %xmm5,%xmm5
+  .byte  196,227,81,14,228,240               // vpblendw      $0xf0,%xmm4,%xmm5,%xmm4
+  .byte  233,51,255,255,255                  // jmpq          13fcc <_sk_load_a8_dst_avx+0x18>
   .byte  15,31,0                             // nopl          (%rax)
   .byte  143                                 // (bad)
   .byte  255                                 // (bad)
@@ -19551,84 +19459,6 @@
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
-HIDDEN _sk_load_a8_dst_avx
-.globl _sk_load_a8_dst_avx
-FUNCTION(_sk_load_a8_dst_avx)
-_sk_load_a8_dst_avx:
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
-  .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,68                              // jne           1438c <_sk_load_a8_dst_avx+0x5c>
-  .byte  196,130,121,48,36,24                // vpmovzxbw     (%r8,%r11,1),%xmm4
-  .byte  197,217,219,37,186,113,2,0          // vpand         0x271ba(%rip),%xmm4,%xmm4        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
-  .byte  196,226,121,51,236                  // vpmovzxwd     %xmm4,%xmm5
-  .byte  197,249,112,228,78                  // vpshufd       $0x4e,%xmm4,%xmm4
-  .byte  196,226,121,51,228                  // vpmovzxwd     %xmm4,%xmm4
-  .byte  196,227,85,24,228,1                 // vinsertf128   $0x1,%xmm4,%ymm5,%ymm4
-  .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,226,125,24,45,124,104,2,0       // vbroadcastss  0x2687c(%rip),%ymm5        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
-  .byte  197,220,89,253                      // vmulps        %ymm5,%ymm4,%ymm7
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  197,220,87,228                      // vxorps        %ymm4,%ymm4,%ymm4
-  .byte  197,212,87,237                      // vxorps        %ymm5,%ymm5,%ymm5
-  .byte  197,204,87,246                      // vxorps        %ymm6,%ymm6,%ymm6
-  .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,174                             // ja            1434e <_sk_load_a8_dst_avx+0x1e>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,121,0,0,0                 // lea           0x79(%rip),%r10        # 14424 <_sk_load_a8_dst_avx+0xf4>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
-  .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
-  .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  235,143                             // jmp           1434e <_sk_load_a8_dst_avx+0x1e>
-  .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
-  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  197,217,196,224,2                   // vpinsrw       $0x2,%eax,%xmm4,%xmm4
-  .byte  67,15,183,4,24                      // movzwl        (%r8,%r11,1),%eax
-  .byte  197,249,110,232                     // vmovd         %eax,%xmm5
-  .byte  196,226,121,48,237                  // vpmovzxbw     %xmm5,%xmm5
-  .byte  196,227,89,14,229,3                 // vpblendw      $0x3,%xmm5,%xmm4,%xmm4
-  .byte  233,103,255,255,255                 // jmpq          1434e <_sk_load_a8_dst_avx+0x1e>
-  .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
-  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  197,217,196,224,6                   // vpinsrw       $0x6,%eax,%xmm4,%xmm4
-  .byte  67,15,182,68,24,5                   // movzbl        0x5(%r8,%r11,1),%eax
-  .byte  197,217,196,224,5                   // vpinsrw       $0x5,%eax,%xmm4,%xmm4
-  .byte  67,15,182,68,24,4                   // movzbl        0x4(%r8,%r11,1),%eax
-  .byte  197,217,196,224,4                   // vpinsrw       $0x4,%eax,%xmm4,%xmm4
-  .byte  196,129,121,110,44,24               // vmovd         (%r8,%r11,1),%xmm5
-  .byte  196,226,121,48,237                  // vpmovzxbw     %xmm5,%xmm5
-  .byte  196,227,81,14,228,240               // vpblendw      $0xf0,%xmm4,%xmm5,%xmm4
-  .byte  233,44,255,255,255                  // jmpq          1434e <_sk_load_a8_dst_avx+0x1e>
-  .byte  102,144                             // xchg          %ax,%ax
-  .byte  144                                 // nop
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,170,255,255,255,155             // ljmp          *-0x64000001(%rdx)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  232,255,255,255,221                 // callq         ffffffffde014434 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddfd9b68>
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,210                             // callq         *%rdx
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,195                             // inc           %ebx
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // .byte         0xff
-
 HIDDEN _sk_gather_a8_avx
 .globl _sk_gather_a8_avx
 FUNCTION(_sk_gather_a8_avx)
@@ -19698,7 +19528,7 @@
   .byte  196,226,121,49,201                  // vpmovzxbd     %xmm1,%xmm1
   .byte  196,227,125,24,193,1                // vinsertf128   $0x1,%xmm1,%ymm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,130,102,2,0       // vbroadcastss  0x26682(%rip),%ymm1        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,226,125,24,13,58,98,2,0         // vbroadcastss  0x2623a(%rip),%ymm1        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  197,252,89,217                      // vmulps        %ymm1,%ymm0,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
@@ -19716,66 +19546,64 @@
 FUNCTION(_sk_store_a8_avx)
 _sk_store_a8_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,60,95,195                       // vmaxps        %ymm3,%ymm8,%ymm8
-  .byte  196,98,125,24,13,201,101,2,0        // vbroadcastss  0x265c9(%rip),%ymm9        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,13,135,97,2,0         // vbroadcastss  0x26187(%rip),%ymm9        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,60,93,193                    // vminps        %ymm9,%ymm8,%ymm8
-  .byte  196,98,125,24,13,231,101,2,0        // vbroadcastss  0x265e7(%rip),%ymm9        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,98,125,24,13,165,97,2,0         // vbroadcastss  0x261a5(%rip),%ymm9        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
   .byte  196,65,125,91,192                   // vcvtps2dq     %ymm8,%ymm8
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
   .byte  196,66,57,43,193                    // vpackusdw     %xmm9,%xmm8,%xmm8
   .byte  197,57,103,192                      // vpackuswb     %xmm0,%xmm8,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           145e9 <_sk_store_a8_avx+0x5b>
-  .byte  196,1,121,214,4,24                  // vmovq         %xmm8,(%r8,%r11,1)
+  .byte  117,10                              // jne           1425b <_sk_store_a8_avx+0x55>
+  .byte  196,65,121,214,4,16                 // vmovq         %xmm8,(%r8,%rdx,1)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,236                             // ja            145e5 <_sk_store_a8_avx+0x57>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,242                             // ja            14257 <_sk_store_a8_avx+0x51>
   .byte  196,66,121,48,192                   // vpmovzxbw     %xmm8,%xmm8
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,87,0,0,0                  // lea           0x57(%rip),%r10        # 14660 <_sk_store_a8_avx+0xd2>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,88,0,0,0                  // lea           0x58(%rip),%r9        # 142cc <_sk_store_a8_avx+0xc6>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,3,121,20,4,24,0                 // vpextrb       $0x0,%xmm8,(%r8,%r11,1)
-  .byte  235,202                             // jmp           145e5 <_sk_store_a8_avx+0x57>
-  .byte  196,3,121,20,68,24,2,4              // vpextrb       $0x4,%xmm8,0x2(%r8,%r11,1)
-  .byte  196,98,57,0,5,244,110,2,0           // vpshufb       0x26ef4(%rip),%xmm8,%xmm8        # 3b520 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
-  .byte  196,3,121,21,4,24,0                 // vpextrw       $0x0,%xmm8,(%r8,%r11,1)
-  .byte  235,176                             // jmp           145e5 <_sk_store_a8_avx+0x57>
-  .byte  196,3,121,20,68,24,6,12             // vpextrb       $0xc,%xmm8,0x6(%r8,%r11,1)
-  .byte  196,3,121,20,68,24,5,10             // vpextrb       $0xa,%xmm8,0x5(%r8,%r11,1)
-  .byte  196,3,121,20,68,24,4,8              // vpextrb       $0x8,%xmm8,0x4(%r8,%r11,1)
-  .byte  196,98,57,0,5,218,110,2,0           // vpshufb       0x26eda(%rip),%xmm8,%xmm8        # 3b530 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
-  .byte  196,1,121,126,4,24                  // vmovd         %xmm8,(%r8,%r11,1)
-  .byte  235,135                             // jmp           145e5 <_sk_store_a8_avx+0x57>
-  .byte  102,144                             // xchg          %ax,%ax
-  .byte  178,255                             // mov           $0xff,%dl
+  .byte  196,67,121,20,4,16,0                // vpextrb       $0x0,%xmm8,(%r8,%rdx,1)
+  .byte  235,209                             // jmp           14257 <_sk_store_a8_avx+0x51>
+  .byte  196,67,121,20,68,16,2,4             // vpextrb       $0x4,%xmm8,0x2(%r8,%rdx,1)
+  .byte  196,98,57,0,5,201,106,2,0           // vpshufb       0x26ac9(%rip),%xmm8,%xmm8        # 3ad60 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  .byte  196,67,121,21,4,16,0                // vpextrw       $0x0,%xmm8,(%r8,%rdx,1)
+  .byte  235,183                             // jmp           14257 <_sk_store_a8_avx+0x51>
+  .byte  196,67,121,20,68,16,6,12            // vpextrb       $0xc,%xmm8,0x6(%r8,%rdx,1)
+  .byte  196,67,121,20,68,16,5,10            // vpextrb       $0xa,%xmm8,0x5(%r8,%rdx,1)
+  .byte  196,67,121,20,68,16,4,8             // vpextrb       $0x8,%xmm8,0x4(%r8,%rdx,1)
+  .byte  196,98,57,0,5,175,106,2,0           // vpshufb       0x26aaf(%rip),%xmm8,%xmm8        # 3ad70 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  .byte  196,65,121,126,4,16                 // vmovd         %xmm8,(%r8,%rdx,1)
+  .byte  235,142                             // jmp           14257 <_sk_store_a8_avx+0x51>
+  .byte  15,31,0                             // nopl          (%rax)
+  .byte  177,255                             // mov           $0xff,%cl
   .byte  255                                 // (bad)
-  .byte  255,195                             // inc           %ebx
+  .byte  255,194                             // inc           %edx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  187,255,255,255,237                 // mov           $0xedffffff,%ebx
+  .byte  186,255,255,255,236                 // mov           $0xecffffff,%edx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,229                             // jmpq          *%rbp
+  .byte  255,228                             // jmpq          *%rsp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  221,255                             // (bad)
+  .byte  220,255                             // fdivr         %st,%st(7)
   .byte  255                                 // (bad)
-  .byte  255,213                             // callq         *%rbp
+  .byte  255,212                             // callq         *%rsp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -19785,75 +19613,73 @@
 FUNCTION(_sk_load_g8_avx)
 _sk_load_g8_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,73                              // jne           146dd <_sk_load_g8_avx+0x61>
-  .byte  196,130,121,48,4,24                 // vpmovzxbw     (%r8,%r11,1),%xmm0
-  .byte  197,249,219,5,110,110,2,0           // vpand         0x26e6e(%rip),%xmm0,%xmm0        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  117,73                              // jne           14343 <_sk_load_g8_avx+0x5b>
+  .byte  196,194,121,48,4,16                 // vpmovzxbw     (%r8,%rdx,1),%xmm0
+  .byte  197,249,219,5,72,106,2,0            // vpand         0x26a48(%rip),%xmm0,%xmm0        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  196,226,121,51,200                  // vpmovzxwd     %xmm0,%xmm1
   .byte  197,249,112,192,78                  // vpshufd       $0x4e,%xmm0,%xmm0
   .byte  196,226,121,51,192                  // vpmovzxwd     %xmm0,%xmm0
   .byte  196,227,117,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,48,101,2,0        // vbroadcastss  0x26530(%rip),%ymm1        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,226,125,24,13,250,96,2,0        // vbroadcastss  0x260fa(%rip),%ymm1        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,169,100,2,0       // vbroadcastss  0x264a9(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,115,96,2,0        // vbroadcastss  0x26073(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,252,40,200                      // vmovaps       %ymm0,%ymm1
   .byte  197,252,40,208                      // vmovaps       %ymm0,%ymm2
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,169                             // ja            1469a <_sk_load_g8_avx+0x1e>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,120,0,0,0                 // lea           0x78(%rip),%r10        # 14774 <_sk_load_g8_avx+0xf8>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,175                             // ja            14300 <_sk_load_g8_avx+0x18>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,121,0,0,0                 // lea           0x79(%rip),%r9        # 143d4 <_sk_load_g8_avx+0xec>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  235,138                             // jmp           1469a <_sk_load_g8_avx+0x1e>
-  .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
+  .byte  235,145                             // jmp           14300 <_sk_load_g8_avx+0x18>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,249,196,192,2                   // vpinsrw       $0x2,%eax,%xmm0,%xmm0
-  .byte  67,15,183,4,24                      // movzwl        (%r8,%r11,1),%eax
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  197,249,110,200                     // vmovd         %eax,%xmm1
   .byte  196,226,121,48,201                  // vpmovzxbw     %xmm1,%xmm1
   .byte  196,227,121,14,193,3                // vpblendw      $0x3,%xmm1,%xmm0,%xmm0
-  .byte  233,98,255,255,255                  // jmpq          1469a <_sk_load_g8_avx+0x1e>
-  .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
+  .byte  233,105,255,255,255                 // jmpq          14300 <_sk_load_g8_avx+0x18>
+  .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,249,196,192,6                   // vpinsrw       $0x6,%eax,%xmm0,%xmm0
-  .byte  67,15,182,68,24,5                   // movzbl        0x5(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,5                   // movzbl        0x5(%r8,%rdx,1),%eax
   .byte  197,249,196,192,5                   // vpinsrw       $0x5,%eax,%xmm0,%xmm0
-  .byte  67,15,182,68,24,4                   // movzbl        0x4(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,4                   // movzbl        0x4(%r8,%rdx,1),%eax
   .byte  197,249,196,192,4                   // vpinsrw       $0x4,%eax,%xmm0,%xmm0
-  .byte  196,129,121,110,12,24               // vmovd         (%r8,%r11,1),%xmm1
+  .byte  196,193,121,110,12,16               // vmovd         (%r8,%rdx,1),%xmm1
   .byte  196,226,121,48,201                  // vpmovzxbw     %xmm1,%xmm1
   .byte  196,227,113,14,192,240              // vpblendw      $0xf0,%xmm0,%xmm1,%xmm0
-  .byte  233,39,255,255,255                  // jmpq          1469a <_sk_load_g8_avx+0x1e>
+  .byte  233,46,255,255,255                  // jmpq          14300 <_sk_load_g8_avx+0x18>
+  .byte  102,144                             // xchg          %ax,%ax
   .byte  144                                 // nop
-  .byte  145                                 // xchg          %eax,%ecx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,171,255,255,255,156             // ljmp          *-0x63000001(%rbx)
+  .byte  255,170,255,255,255,155             // ljmp          *-0x64000001(%rdx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  233,255,255,255,222                 // jmpq          ffffffffdf014784 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffdefd9eb8>
+  .byte  232,255,255,255,221                 // callq         ffffffffde0143e4 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddfda2e8>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,211                             // callq         *%rbx
+  .byte  255,210                             // callq         *%rdx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,196                             // inc           %esp
+  .byte  255,195                             // inc           %ebx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -19863,75 +19689,73 @@
 FUNCTION(_sk_load_g8_dst_avx)
 _sk_load_g8_dst_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,73                              // jne           147f1 <_sk_load_g8_dst_avx+0x61>
-  .byte  196,130,121,48,36,24                // vpmovzxbw     (%r8,%r11,1),%xmm4
-  .byte  197,217,219,37,90,109,2,0           // vpand         0x26d5a(%rip),%xmm4,%xmm4        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  117,73                              // jne           1444b <_sk_load_g8_dst_avx+0x5b>
+  .byte  196,194,121,48,36,16                // vpmovzxbw     (%r8,%rdx,1),%xmm4
+  .byte  197,217,219,37,64,105,2,0           // vpand         0x26940(%rip),%xmm4,%xmm4        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  196,226,121,51,236                  // vpmovzxwd     %xmm4,%xmm5
   .byte  197,249,112,228,78                  // vpshufd       $0x4e,%xmm4,%xmm4
   .byte  196,226,121,51,228                  // vpmovzxwd     %xmm4,%xmm4
   .byte  196,227,85,24,228,1                 // vinsertf128   $0x1,%xmm4,%ymm5,%ymm4
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,226,125,24,45,28,100,2,0        // vbroadcastss  0x2641c(%rip),%ymm5        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,226,125,24,45,242,95,2,0        // vbroadcastss  0x25ff2(%rip),%ymm5        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  197,220,89,229                      // vmulps        %ymm5,%ymm4,%ymm4
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,61,149,99,2,0        // vbroadcastss  0x26395(%rip),%ymm7        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,61,107,95,2,0        // vbroadcastss  0x25f6b(%rip),%ymm7        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,252,40,236                      // vmovaps       %ymm4,%ymm5
   .byte  197,252,40,244                      // vmovaps       %ymm4,%ymm6
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,169                             // ja            147ae <_sk_load_g8_dst_avx+0x1e>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,120,0,0,0                 // lea           0x78(%rip),%r10        # 14888 <_sk_load_g8_dst_avx+0xf8>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,175                             // ja            14408 <_sk_load_g8_dst_avx+0x18>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,121,0,0,0                 // lea           0x79(%rip),%r9        # 144dc <_sk_load_g8_dst_avx+0xec>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  235,138                             // jmp           147ae <_sk_load_g8_dst_avx+0x1e>
-  .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
+  .byte  235,145                             // jmp           14408 <_sk_load_g8_dst_avx+0x18>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  197,217,196,224,2                   // vpinsrw       $0x2,%eax,%xmm4,%xmm4
-  .byte  67,15,183,4,24                      // movzwl        (%r8,%r11,1),%eax
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  197,249,110,232                     // vmovd         %eax,%xmm5
   .byte  196,226,121,48,237                  // vpmovzxbw     %xmm5,%xmm5
   .byte  196,227,89,14,229,3                 // vpblendw      $0x3,%xmm5,%xmm4,%xmm4
-  .byte  233,98,255,255,255                  // jmpq          147ae <_sk_load_g8_dst_avx+0x1e>
-  .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
+  .byte  233,105,255,255,255                 // jmpq          14408 <_sk_load_g8_dst_avx+0x18>
+  .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  197,217,196,224,6                   // vpinsrw       $0x6,%eax,%xmm4,%xmm4
-  .byte  67,15,182,68,24,5                   // movzbl        0x5(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,5                   // movzbl        0x5(%r8,%rdx,1),%eax
   .byte  197,217,196,224,5                   // vpinsrw       $0x5,%eax,%xmm4,%xmm4
-  .byte  67,15,182,68,24,4                   // movzbl        0x4(%r8,%r11,1),%eax
+  .byte  65,15,182,68,16,4                   // movzbl        0x4(%r8,%rdx,1),%eax
   .byte  197,217,196,224,4                   // vpinsrw       $0x4,%eax,%xmm4,%xmm4
-  .byte  196,129,121,110,44,24               // vmovd         (%r8,%r11,1),%xmm5
+  .byte  196,193,121,110,44,16               // vmovd         (%r8,%rdx,1),%xmm5
   .byte  196,226,121,48,237                  // vpmovzxbw     %xmm5,%xmm5
   .byte  196,227,81,14,228,240               // vpblendw      $0xf0,%xmm4,%xmm5,%xmm4
-  .byte  233,39,255,255,255                  // jmpq          147ae <_sk_load_g8_dst_avx+0x1e>
+  .byte  233,46,255,255,255                  // jmpq          14408 <_sk_load_g8_dst_avx+0x18>
+  .byte  102,144                             // xchg          %ax,%ax
   .byte  144                                 // nop
-  .byte  145                                 // xchg          %eax,%ecx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,171,255,255,255,156             // ljmp          *-0x63000001(%rbx)
+  .byte  255,170,255,255,255,155             // ljmp          *-0x64000001(%rdx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  233,255,255,255,222                 // jmpq          ffffffffdf014898 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffdefd9fcc>
+  .byte  232,255,255,255,221                 // callq         ffffffffde0144ec <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddfda3f0>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,211                             // callq         *%rbx
+  .byte  255,210                             // callq         *%rdx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,196                             // inc           %esp
+  .byte  255,195                             // inc           %ebx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -20005,10 +19829,10 @@
   .byte  196,226,121,49,201                  // vpmovzxbd     %xmm1,%xmm1
   .byte  196,227,125,24,193,1                // vinsertf128   $0x1,%xmm1,%ymm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,30,98,2,0         // vbroadcastss  0x2621e(%rip),%ymm1        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,226,125,24,13,250,93,2,0        // vbroadcastss  0x25dfa(%rip),%ymm1        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,151,97,2,0        // vbroadcastss  0x26197(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,115,93,2,0        // vbroadcastss  0x25d73(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,252,40,200                      // vmovaps       %ymm0,%ymm1
   .byte  197,252,40,208                      // vmovaps       %ymm0,%ymm2
   .byte  91                                  // pop           %rbx
@@ -20023,63 +19847,142 @@
 FUNCTION(_sk_load_565_avx)
 _sk_load_565_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,130,0,0,0                    // jne           14a98 <_sk_load_565_avx+0xa1>
-  .byte  196,129,122,111,4,88                // vmovdqu       (%r8,%r11,2),%xmm0
+  .byte  15,133,130,0,0,0                    // jne           146e6 <_sk_load_565_avx+0x9b>
+  .byte  196,193,122,111,4,80                // vmovdqu       (%r8,%rdx,2),%xmm0
   .byte  196,226,121,51,200                  // vpmovzxwd     %xmm0,%xmm1
   .byte  197,249,112,192,78                  // vpshufd       $0x4e,%xmm0,%xmm0
   .byte  196,226,121,51,192                  // vpmovzxwd     %xmm0,%xmm0
   .byte  196,227,117,24,208,1                // vinsertf128   $0x1,%xmm0,%ymm1,%ymm2
-  .byte  196,226,125,24,5,190,97,2,0         // vbroadcastss  0x261be(%rip),%ymm0        # 3abf8 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  .byte  196,226,125,24,5,160,93,2,0         // vbroadcastss  0x25da0(%rip),%ymm0        # 3a428 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
   .byte  197,236,84,192                      // vandps        %ymm0,%ymm2,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,177,97,2,0        // vbroadcastss  0x261b1(%rip),%ymm1        # 3abfc <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  .byte  196,226,125,24,13,147,93,2,0        // vbroadcastss  0x25d93(%rip),%ymm1        # 3a42c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
-  .byte  196,226,125,24,13,168,97,2,0        // vbroadcastss  0x261a8(%rip),%ymm1        # 3ac00 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  .byte  196,226,125,24,13,138,93,2,0        // vbroadcastss  0x25d8a(%rip),%ymm1        # 3a430 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
   .byte  197,236,84,201                      // vandps        %ymm1,%ymm2,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  196,226,125,24,29,155,97,2,0        // vbroadcastss  0x2619b(%rip),%ymm3        # 3ac04 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  .byte  196,226,125,24,29,125,93,2,0        // vbroadcastss  0x25d7d(%rip),%ymm3        # 3a434 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
   .byte  197,244,89,203                      // vmulps        %ymm3,%ymm1,%ymm1
-  .byte  196,226,125,24,29,146,97,2,0        // vbroadcastss  0x26192(%rip),%ymm3        # 3ac08 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  .byte  196,226,125,24,29,116,93,2,0        // vbroadcastss  0x25d74(%rip),%ymm3        # 3a438 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
   .byte  197,236,84,211                      // vandps        %ymm3,%ymm2,%ymm2
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
-  .byte  196,226,125,24,29,133,97,2,0        // vbroadcastss  0x26185(%rip),%ymm3        # 3ac0c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  .byte  196,226,125,24,29,103,93,2,0        // vbroadcastss  0x25d67(%rip),%ymm3        # 3a43c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
   .byte  197,236,89,211                      // vmulps        %ymm3,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,230,96,2,0        // vbroadcastss  0x260e6(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,200,92,2,0        // vbroadcastss  0x25cc8(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,108,255,255,255              // ja            14a1c <_sk_load_565_avx+0x25>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,97,0,0,0                  // lea           0x61(%rip),%r10        # 14b1c <_sk_load_565_avx+0x125>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  15,135,114,255,255,255              // ja            1466a <_sk_load_565_avx+0x1f>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,98,0,0,0                  // lea           0x62(%rip),%r9        # 14764 <_sk_load_565_avx+0x119>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  233,74,255,255,255                  // jmpq          14a1c <_sk_load_565_avx+0x25>
+  .byte  233,81,255,255,255                  // jmpq          1466a <_sk_load_565_avx+0x1f>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,4,2           // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,129,121,110,12,88               // vmovd         (%r8,%r11,2),%xmm1
+  .byte  196,193,121,196,68,80,4,2           // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,193,121,110,12,80               // vmovd         (%r8,%rdx,2),%xmm1
   .byte  196,227,121,14,193,3                // vpblendw      $0x3,%xmm1,%xmm0,%xmm0
-  .byte  233,45,255,255,255                  // jmpq          14a1c <_sk_load_565_avx+0x25>
+  .byte  233,52,255,255,255                  // jmpq          1466a <_sk_load_565_avx+0x1f>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,12,6          // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,10,5          // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,8,4           // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,129,122,126,12,88               // vmovq         (%r8,%r11,2),%xmm1
+  .byte  196,193,121,196,68,80,12,6          // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,193,121,196,68,80,10,5          // vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,193,121,196,68,80,8,4           // vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,193,122,126,12,80               // vmovq         (%r8,%rdx,2),%xmm1
   .byte  196,227,113,14,192,240              // vpblendw      $0xf0,%xmm0,%xmm1,%xmm0
-  .byte  233,0,255,255,255                   // jmpq          14a1c <_sk_load_565_avx+0x25>
+  .byte  233,7,255,255,255                   // jmpq          1466a <_sk_load_565_avx+0x1f>
+  .byte  144                                 // nop
+  .byte  167                                 // cmpsl         %es:(%rdi),%ds:(%rsi)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,193                             // inc           %ecx
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,181,255,255,255,238             // pushq         -0x11000001(%rbp)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,230                             // jmpq          *%rsi
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  222,255                             // fdivrp        %st,%st(7)
+  .byte  255                                 // (bad)
+  .byte  255,210                             // callq         *%rdx
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255                                 // .byte         0xff
+
+HIDDEN _sk_load_565_dst_avx
+.globl _sk_load_565_dst_avx
+FUNCTION(_sk_load_565_dst_avx)
+_sk_load_565_dst_avx:
+  .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
+  .byte  77,1,192                            // add           %r8,%r8
+  .byte  76,3,0                              // add           (%rax),%r8
+  .byte  72,133,255                          // test          %rdi,%rdi
+  .byte  15,133,130,0,0,0                    // jne           1481b <_sk_load_565_dst_avx+0x9b>
+  .byte  196,193,122,111,36,80               // vmovdqu       (%r8,%rdx,2),%xmm4
+  .byte  196,226,121,51,236                  // vpmovzxwd     %xmm4,%xmm5
+  .byte  197,249,112,228,78                  // vpshufd       $0x4e,%xmm4,%xmm4
+  .byte  196,226,121,51,228                  // vpmovzxwd     %xmm4,%xmm4
+  .byte  196,227,85,24,244,1                 // vinsertf128   $0x1,%xmm4,%ymm5,%ymm6
+  .byte  196,226,125,24,37,107,92,2,0        // vbroadcastss  0x25c6b(%rip),%ymm4        # 3a428 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  .byte  197,204,84,228                      // vandps        %ymm4,%ymm6,%ymm4
+  .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
+  .byte  196,226,125,24,45,94,92,2,0         // vbroadcastss  0x25c5e(%rip),%ymm5        # 3a42c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  .byte  197,220,89,229                      // vmulps        %ymm5,%ymm4,%ymm4
+  .byte  196,226,125,24,45,85,92,2,0         // vbroadcastss  0x25c55(%rip),%ymm5        # 3a430 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  .byte  197,204,84,237                      // vandps        %ymm5,%ymm6,%ymm5
+  .byte  197,252,91,237                      // vcvtdq2ps     %ymm5,%ymm5
+  .byte  196,226,125,24,61,72,92,2,0         // vbroadcastss  0x25c48(%rip),%ymm7        # 3a434 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  .byte  197,212,89,239                      // vmulps        %ymm7,%ymm5,%ymm5
+  .byte  196,226,125,24,61,63,92,2,0         // vbroadcastss  0x25c3f(%rip),%ymm7        # 3a438 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  .byte  197,204,84,247                      // vandps        %ymm7,%ymm6,%ymm6
+  .byte  197,252,91,246                      // vcvtdq2ps     %ymm6,%ymm6
+  .byte  196,226,125,24,61,50,92,2,0         // vbroadcastss  0x25c32(%rip),%ymm7        # 3a43c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  .byte  197,204,89,247                      // vmulps        %ymm7,%ymm6,%ymm6
+  .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  196,226,125,24,61,147,91,2,0        // vbroadcastss  0x25b93(%rip),%ymm7        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  255,224                             // jmpq          *%rax
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  15,135,114,255,255,255              // ja            1479f <_sk_load_565_dst_avx+0x1f>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,97,0,0,0                  // lea           0x61(%rip),%r9        # 14898 <_sk_load_565_dst_avx+0x118>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
+  .byte  255,224                             // jmpq          *%rax
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
+  .byte  197,249,110,224                     // vmovd         %eax,%xmm4
+  .byte  233,81,255,255,255                  // jmpq          1479f <_sk_load_565_dst_avx+0x1f>
+  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
+  .byte  196,193,89,196,100,80,4,2           // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,193,121,110,44,80               // vmovd         (%r8,%rdx,2),%xmm5
+  .byte  196,227,89,14,229,3                 // vpblendw      $0x3,%xmm5,%xmm4,%xmm4
+  .byte  233,52,255,255,255                  // jmpq          1479f <_sk_load_565_dst_avx+0x1f>
+  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
+  .byte  196,193,89,196,100,80,12,6          // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,193,89,196,100,80,10,5          // vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,193,89,196,100,80,8,4           // vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,193,122,126,44,80               // vmovq         (%r8,%rdx,2),%xmm5
+  .byte  196,227,81,14,228,240               // vpblendw      $0xf0,%xmm4,%xmm5,%xmm4
+  .byte  233,7,255,255,255                   // jmpq          1479f <_sk_load_565_dst_avx+0x1f>
   .byte  168,255                             // test          $0xff,%al
   .byte  255                                 // (bad)
   .byte  255,194                             // inc           %edx
@@ -20099,91 +20002,6 @@
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
-HIDDEN _sk_load_565_dst_avx
-.globl _sk_load_565_dst_avx
-FUNCTION(_sk_load_565_dst_avx)
-_sk_load_565_dst_avx:
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
-  .byte  77,1,192                            // add           %r8,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
-  .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,130,0,0,0                    // jne           14bd9 <_sk_load_565_dst_avx+0xa1>
-  .byte  196,129,122,111,36,88               // vmovdqu       (%r8,%r11,2),%xmm4
-  .byte  196,226,121,51,236                  // vpmovzxwd     %xmm4,%xmm5
-  .byte  197,249,112,228,78                  // vpshufd       $0x4e,%xmm4,%xmm4
-  .byte  196,226,121,51,228                  // vpmovzxwd     %xmm4,%xmm4
-  .byte  196,227,85,24,244,1                 // vinsertf128   $0x1,%xmm4,%ymm5,%ymm6
-  .byte  196,226,125,24,37,125,96,2,0        // vbroadcastss  0x2607d(%rip),%ymm4        # 3abf8 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
-  .byte  197,204,84,228                      // vandps        %ymm4,%ymm6,%ymm4
-  .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,226,125,24,45,112,96,2,0        // vbroadcastss  0x26070(%rip),%ymm5        # 3abfc <_sk_srcover_bgra_8888_sse2_lowp+0x330>
-  .byte  197,220,89,229                      // vmulps        %ymm5,%ymm4,%ymm4
-  .byte  196,226,125,24,45,103,96,2,0        // vbroadcastss  0x26067(%rip),%ymm5        # 3ac00 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
-  .byte  197,204,84,237                      // vandps        %ymm5,%ymm6,%ymm5
-  .byte  197,252,91,237                      // vcvtdq2ps     %ymm5,%ymm5
-  .byte  196,226,125,24,61,90,96,2,0         // vbroadcastss  0x2605a(%rip),%ymm7        # 3ac04 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
-  .byte  197,212,89,239                      // vmulps        %ymm7,%ymm5,%ymm5
-  .byte  196,226,125,24,61,81,96,2,0         // vbroadcastss  0x26051(%rip),%ymm7        # 3ac08 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
-  .byte  197,204,84,247                      // vandps        %ymm7,%ymm6,%ymm6
-  .byte  197,252,91,246                      // vcvtdq2ps     %ymm6,%ymm6
-  .byte  196,226,125,24,61,68,96,2,0         // vbroadcastss  0x26044(%rip),%ymm7        # 3ac0c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
-  .byte  197,204,89,247                      // vmulps        %ymm7,%ymm6,%ymm6
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,61,165,95,2,0        // vbroadcastss  0x25fa5(%rip),%ymm7        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
-  .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,108,255,255,255              // ja            14b5d <_sk_load_565_dst_avx+0x25>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,100,0,0,0                 // lea           0x64(%rip),%r10        # 14c60 <_sk_load_565_dst_avx+0x128>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
-  .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
-  .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  233,74,255,255,255                  // jmpq          14b5d <_sk_load_565_dst_avx+0x25>
-  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,4,2           // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,129,121,110,44,88               // vmovd         (%r8,%r11,2),%xmm5
-  .byte  196,227,89,14,229,3                 // vpblendw      $0x3,%xmm5,%xmm4,%xmm4
-  .byte  233,45,255,255,255                  // jmpq          14b5d <_sk_load_565_dst_avx+0x25>
-  .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,12,6          // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,10,5          // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,8,4           // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,129,122,126,44,88               // vmovq         (%r8,%r11,2),%xmm5
-  .byte  196,227,81,14,228,240               // vpblendw      $0xf0,%xmm4,%xmm5,%xmm4
-  .byte  233,0,255,255,255                   // jmpq          14b5d <_sk_load_565_dst_avx+0x25>
-  .byte  15,31,0                             // nopl          (%rax)
-  .byte  165                                 // movsl         %ds:(%rsi),%es:(%rdi)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  191,255,255,255,179                 // mov           $0xb3ffffff,%edi
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  236                                 // in            (%dx),%al
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,228                             // jmpq          *%rsp
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  220,255                             // fdivr         %st,%st(7)
-  .byte  255                                 // (bad)
-  .byte  255,208                             // callq         *%rax
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // .byte         0xff
-
 HIDDEN _sk_gather_565_avx
 .globl _sk_gather_565_avx
 FUNCTION(_sk_gather_565_avx)
@@ -20253,23 +20071,23 @@
   .byte  197,249,112,192,78                  // vpshufd       $0x4e,%xmm0,%xmm0
   .byte  196,226,121,51,192                  // vpmovzxwd     %xmm0,%xmm0
   .byte  196,227,117,24,208,1                // vinsertf128   $0x1,%xmm0,%ymm1,%ymm2
-  .byte  196,226,125,24,5,77,94,2,0          // vbroadcastss  0x25e4d(%rip),%ymm0        # 3abf8 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  .byte  196,226,125,24,5,69,90,2,0          // vbroadcastss  0x25a45(%rip),%ymm0        # 3a428 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
   .byte  197,236,84,192                      // vandps        %ymm0,%ymm2,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,64,94,2,0         // vbroadcastss  0x25e40(%rip),%ymm1        # 3abfc <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  .byte  196,226,125,24,13,56,90,2,0         // vbroadcastss  0x25a38(%rip),%ymm1        # 3a42c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
-  .byte  196,226,125,24,13,55,94,2,0         // vbroadcastss  0x25e37(%rip),%ymm1        # 3ac00 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  .byte  196,226,125,24,13,47,90,2,0         // vbroadcastss  0x25a2f(%rip),%ymm1        # 3a430 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
   .byte  197,236,84,201                      // vandps        %ymm1,%ymm2,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  196,226,125,24,29,42,94,2,0         // vbroadcastss  0x25e2a(%rip),%ymm3        # 3ac04 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  .byte  196,226,125,24,29,34,90,2,0         // vbroadcastss  0x25a22(%rip),%ymm3        # 3a434 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
   .byte  197,244,89,203                      // vmulps        %ymm3,%ymm1,%ymm1
-  .byte  196,226,125,24,29,33,94,2,0         // vbroadcastss  0x25e21(%rip),%ymm3        # 3ac08 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  .byte  196,226,125,24,29,25,90,2,0         // vbroadcastss  0x25a19(%rip),%ymm3        # 3a438 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
   .byte  197,236,84,211                      // vandps        %ymm3,%ymm2,%ymm2
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
-  .byte  196,226,125,24,29,20,94,2,0         // vbroadcastss  0x25e14(%rip),%ymm3        # 3ac0c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  .byte  196,226,125,24,29,12,90,2,0         // vbroadcastss  0x25a0c(%rip),%ymm3        # 3a43c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
   .byte  197,236,89,211                      // vmulps        %ymm3,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,117,93,2,0        // vbroadcastss  0x25d75(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,109,89,2,0        // vbroadcastss  0x2596d(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  91                                  // pop           %rbx
   .byte  65,92                               // pop           %r12
   .byte  65,94                               // pop           %r14
@@ -20282,17 +20100,15 @@
 FUNCTION(_sk_store_565_avx)
 _sk_store_565_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,60,95,200                       // vmaxps        %ymm0,%ymm8,%ymm9
-  .byte  196,98,125,24,21,67,93,2,0          // vbroadcastss  0x25d43(%rip),%ymm10        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,21,65,89,2,0          // vbroadcastss  0x25941(%rip),%ymm10        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,52,93,202                    // vminps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,29,37,94,2,0          // vbroadcastss  0x25e25(%rip),%ymm11        # 3ac6c <_sk_srcover_bgra_8888_sse2_lowp+0x3a0>
+  .byte  196,98,125,24,29,35,90,2,0          // vbroadcastss  0x25a23(%rip),%ymm11        # 3a49c <_sk_srcover_bgra_8888_sse2_lowp+0x3a0>
   .byte  196,65,52,89,203                    // vmulps        %ymm11,%ymm9,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  196,193,25,114,241,11               // vpslld        $0xb,%xmm9,%xmm12
@@ -20301,7 +20117,7 @@
   .byte  196,67,29,24,201,1                  // vinsertf128   $0x1,%xmm9,%ymm12,%ymm9
   .byte  197,60,95,225                       // vmaxps        %ymm1,%ymm8,%ymm12
   .byte  196,65,28,93,226                    // vminps        %ymm10,%ymm12,%ymm12
-  .byte  196,98,125,24,45,245,93,2,0         // vbroadcastss  0x25df5(%rip),%ymm13        # 3ac70 <_sk_srcover_bgra_8888_sse2_lowp+0x3a4>
+  .byte  196,98,125,24,45,243,89,2,0         // vbroadcastss  0x259f3(%rip),%ymm13        # 3a4a0 <_sk_srcover_bgra_8888_sse2_lowp+0x3a4>
   .byte  196,65,28,89,229                    // vmulps        %ymm13,%ymm12,%ymm12
   .byte  196,65,125,91,228                   // vcvtps2dq     %ymm12,%ymm12
   .byte  196,193,17,114,244,5                // vpslld        $0x5,%xmm12,%xmm13
@@ -20317,52 +20133,49 @@
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
   .byte  196,66,57,43,193                    // vpackusdw     %xmm9,%xmm8,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           14ed4 <_sk_store_565_avx+0xc3>
-  .byte  196,1,122,127,4,88                  // vmovdqu       %xmm8,(%r8,%r11,2)
+  .byte  117,10                              // jne           14b06 <_sk_store_565_avx+0xbd>
+  .byte  196,65,122,127,4,80                 // vmovdqu       %xmm8,(%r8,%rdx,2)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,236                             // ja            14ed0 <_sk_store_565_avx+0xbf>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,69,0,0,0                  // lea           0x45(%rip),%r10        # 14f34 <_sk_store_565_avx+0x123>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,242                             // ja            14b02 <_sk_store_565_avx+0xb9>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,66,0,0,0                  // lea           0x42(%rip),%r9        # 14b5c <_sk_store_565_avx+0x113>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,3,121,21,4,88,0                 // vpextrw       $0x0,%xmm8,(%r8,%r11,2)
-  .byte  235,207                             // jmp           14ed0 <_sk_store_565_avx+0xbf>
-  .byte  196,3,121,21,68,88,4,2              // vpextrw       $0x2,%xmm8,0x4(%r8,%r11,2)
-  .byte  196,1,121,126,4,88                  // vmovd         %xmm8,(%r8,%r11,2)
-  .byte  235,191                             // jmp           14ed0 <_sk_store_565_avx+0xbf>
-  .byte  196,3,121,21,68,88,12,6             // vpextrw       $0x6,%xmm8,0xc(%r8,%r11,2)
-  .byte  196,3,121,21,68,88,10,5             // vpextrw       $0x5,%xmm8,0xa(%r8,%r11,2)
-  .byte  196,3,121,21,68,88,8,4              // vpextrw       $0x4,%xmm8,0x8(%r8,%r11,2)
-  .byte  196,1,121,214,4,88                  // vmovq         %xmm8,(%r8,%r11,2)
-  .byte  235,159                             // jmp           14ed0 <_sk_store_565_avx+0xbf>
-  .byte  15,31,0                             // nopl          (%rax)
-  .byte  196                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,213                             // callq         *%rbp
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,205                             // dec           %ebp
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,245                             // push          %rbp
+  .byte  196,67,121,21,4,80,0                // vpextrw       $0x0,%xmm8,(%r8,%rdx,2)
+  .byte  235,214                             // jmp           14b02 <_sk_store_565_avx+0xb9>
+  .byte  196,67,121,21,68,80,4,2             // vpextrw       $0x2,%xmm8,0x4(%r8,%rdx,2)
+  .byte  196,65,121,126,4,80                 // vmovd         %xmm8,(%r8,%rdx,2)
+  .byte  235,198                             // jmp           14b02 <_sk_store_565_avx+0xb9>
+  .byte  196,67,121,21,68,80,12,6            // vpextrw       $0x6,%xmm8,0xc(%r8,%rdx,2)
+  .byte  196,67,121,21,68,80,10,5            // vpextrw       $0x5,%xmm8,0xa(%r8,%rdx,2)
+  .byte  196,67,121,21,68,80,8,4             // vpextrw       $0x4,%xmm8,0x8(%r8,%rdx,2)
+  .byte  196,65,121,214,4,80                 // vmovq         %xmm8,(%r8,%rdx,2)
+  .byte  235,166                             // jmp           14b02 <_sk_store_565_avx+0xb9>
+  .byte  199                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  237                                 // in            (%dx),%eax
+  .byte  216,255                             // fdivr         %st(7),%st
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,229                             // jmpq          *%rbp
+  .byte  255,208                             // callq         *%rax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  221,255                             // (bad)
+  .byte  248                                 // clc
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,240                             // push          %rax
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  232,255,255,255,224                 // callq         ffffffffe1014b74 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffe0fdaa78>
+  .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
@@ -20371,86 +20184,80 @@
 FUNCTION(_sk_load_4444_avx)
 _sk_load_4444_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,154,0,0,0                    // jne           15009 <_sk_load_4444_avx+0xb9>
-  .byte  196,129,122,111,4,88                // vmovdqu       (%r8,%r11,2),%xmm0
+  .byte  15,133,154,0,0,0                    // jne           14c2b <_sk_load_4444_avx+0xb3>
+  .byte  196,193,122,111,4,80                // vmovdqu       (%r8,%rdx,2),%xmm0
   .byte  196,226,121,51,200                  // vpmovzxwd     %xmm0,%xmm1
   .byte  197,249,112,192,78                  // vpshufd       $0x4e,%xmm0,%xmm0
   .byte  196,226,121,51,192                  // vpmovzxwd     %xmm0,%xmm0
   .byte  196,227,117,24,216,1                // vinsertf128   $0x1,%xmm0,%ymm1,%ymm3
-  .byte  196,226,125,24,5,225,92,2,0         // vbroadcastss  0x25ce1(%rip),%ymm0        # 3ac74 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
+  .byte  196,226,125,24,5,239,88,2,0         // vbroadcastss  0x258ef(%rip),%ymm0        # 3a4a4 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
   .byte  197,228,84,192                      // vandps        %ymm0,%ymm3,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,212,92,2,0        // vbroadcastss  0x25cd4(%rip),%ymm1        # 3ac78 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
+  .byte  196,226,125,24,13,226,88,2,0        // vbroadcastss  0x258e2(%rip),%ymm1        # 3a4a8 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
-  .byte  196,226,125,24,13,203,92,2,0        // vbroadcastss  0x25ccb(%rip),%ymm1        # 3ac7c <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
+  .byte  196,226,125,24,13,217,88,2,0        // vbroadcastss  0x258d9(%rip),%ymm1        # 3a4ac <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
   .byte  197,228,84,201                      // vandps        %ymm1,%ymm3,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  196,226,125,24,21,190,92,2,0        // vbroadcastss  0x25cbe(%rip),%ymm2        # 3ac80 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
+  .byte  196,226,125,24,21,204,88,2,0        // vbroadcastss  0x258cc(%rip),%ymm2        # 3a4b0 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
   .byte  197,244,89,202                      // vmulps        %ymm2,%ymm1,%ymm1
-  .byte  196,226,125,24,21,181,92,2,0        // vbroadcastss  0x25cb5(%rip),%ymm2        # 3ac84 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
+  .byte  196,226,125,24,21,195,88,2,0        // vbroadcastss  0x258c3(%rip),%ymm2        # 3a4b4 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
   .byte  197,228,84,210                      // vandps        %ymm2,%ymm3,%ymm2
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
-  .byte  196,98,125,24,5,168,92,2,0          // vbroadcastss  0x25ca8(%rip),%ymm8        # 3ac88 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
+  .byte  196,98,125,24,5,182,88,2,0          // vbroadcastss  0x258b6(%rip),%ymm8        # 3a4b8 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
   .byte  196,193,108,89,208                  // vmulps        %ymm8,%ymm2,%ymm2
-  .byte  196,98,125,24,5,158,92,2,0          // vbroadcastss  0x25c9e(%rip),%ymm8        # 3ac8c <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
+  .byte  196,98,125,24,5,172,88,2,0          // vbroadcastss  0x258ac(%rip),%ymm8        # 3a4bc <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
   .byte  196,193,100,84,216                  // vandps        %ymm8,%ymm3,%ymm3
   .byte  197,252,91,219                      // vcvtdq2ps     %ymm3,%ymm3
-  .byte  196,98,125,24,5,144,92,2,0          // vbroadcastss  0x25c90(%rip),%ymm8        # 3ac90 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
+  .byte  196,98,125,24,5,158,88,2,0          // vbroadcastss  0x2589e(%rip),%ymm8        # 3a4c0 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
   .byte  196,193,100,89,216                  // vmulps        %ymm8,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,84,255,255,255               // ja            14f75 <_sk_load_4444_avx+0x25>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,100,0,0,0                 // lea           0x64(%rip),%r10        # 15090 <_sk_load_4444_avx+0x140>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  15,135,90,255,255,255               // ja            14b97 <_sk_load_4444_avx+0x1f>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,97,0,0,0                  // lea           0x61(%rip),%r9        # 14ca8 <_sk_load_4444_avx+0x130>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  233,50,255,255,255                  // jmpq          14f75 <_sk_load_4444_avx+0x25>
+  .byte  233,57,255,255,255                  // jmpq          14b97 <_sk_load_4444_avx+0x1f>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,4,2           // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,129,121,110,12,88               // vmovd         (%r8,%r11,2),%xmm1
+  .byte  196,193,121,196,68,80,4,2           // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,193,121,110,12,80               // vmovd         (%r8,%rdx,2),%xmm1
   .byte  196,227,121,14,193,3                // vpblendw      $0x3,%xmm1,%xmm0,%xmm0
-  .byte  233,21,255,255,255                  // jmpq          14f75 <_sk_load_4444_avx+0x25>
+  .byte  233,28,255,255,255                  // jmpq          14b97 <_sk_load_4444_avx+0x1f>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,12,6          // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,10,5          // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,129,121,196,68,88,8,4           // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
-  .byte  196,129,122,126,12,88               // vmovq         (%r8,%r11,2),%xmm1
+  .byte  196,193,121,196,68,80,12,6          // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,193,121,196,68,80,10,5          // vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,193,121,196,68,80,8,4           // vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm0,%xmm0
+  .byte  196,193,122,126,12,80               // vmovq         (%r8,%rdx,2),%xmm1
   .byte  196,227,113,14,192,240              // vpblendw      $0xf0,%xmm0,%xmm1,%xmm0
-  .byte  233,232,254,255,255                 // jmpq          14f75 <_sk_load_4444_avx+0x25>
-  .byte  15,31,0                             // nopl          (%rax)
-  .byte  165                                 // movsl         %ds:(%rsi),%es:(%rdi)
+  .byte  233,239,254,255,255                 // jmpq          14b97 <_sk_load_4444_avx+0x1f>
+  .byte  168,255                             // test          $0xff,%al
+  .byte  255                                 // (bad)
+  .byte  255,194                             // inc           %edx
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,182,255,255,255,239             // pushq         -0x10000001(%rsi)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,231                             // jmpq          *%rdi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  191,255,255,255,179                 // mov           $0xb3ffffff,%edi
+  .byte  223,255                             // (bad)
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  236                                 // in            (%dx),%al
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,228                             // jmpq          *%rsp
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  220,255                             // fdivr         %st,%st(7)
-  .byte  255                                 // (bad)
-  .byte  255,208                             // callq         *%rax
+  .byte  255,211                             // callq         *%rbx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -20460,86 +20267,80 @@
 FUNCTION(_sk_load_4444_dst_avx)
 _sk_load_4444_dst_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,154,0,0,0                    // jne           15165 <_sk_load_4444_dst_avx+0xb9>
-  .byte  196,129,122,111,36,88               // vmovdqu       (%r8,%r11,2),%xmm4
+  .byte  15,133,154,0,0,0                    // jne           14d77 <_sk_load_4444_dst_avx+0xb3>
+  .byte  196,193,122,111,36,80               // vmovdqu       (%r8,%rdx,2),%xmm4
   .byte  196,226,121,51,236                  // vpmovzxwd     %xmm4,%xmm5
   .byte  197,249,112,228,78                  // vpshufd       $0x4e,%xmm4,%xmm4
   .byte  196,226,121,51,228                  // vpmovzxwd     %xmm4,%xmm4
   .byte  196,227,85,24,252,1                 // vinsertf128   $0x1,%xmm4,%ymm5,%ymm7
-  .byte  196,226,125,24,37,133,91,2,0        // vbroadcastss  0x25b85(%rip),%ymm4        # 3ac74 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
+  .byte  196,226,125,24,37,163,87,2,0        // vbroadcastss  0x257a3(%rip),%ymm4        # 3a4a4 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
   .byte  197,196,84,228                      // vandps        %ymm4,%ymm7,%ymm4
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,226,125,24,45,120,91,2,0        // vbroadcastss  0x25b78(%rip),%ymm5        # 3ac78 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
+  .byte  196,226,125,24,45,150,87,2,0        // vbroadcastss  0x25796(%rip),%ymm5        # 3a4a8 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
   .byte  197,220,89,229                      // vmulps        %ymm5,%ymm4,%ymm4
-  .byte  196,226,125,24,45,111,91,2,0        // vbroadcastss  0x25b6f(%rip),%ymm5        # 3ac7c <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
+  .byte  196,226,125,24,45,141,87,2,0        // vbroadcastss  0x2578d(%rip),%ymm5        # 3a4ac <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
   .byte  197,196,84,237                      // vandps        %ymm5,%ymm7,%ymm5
   .byte  197,252,91,237                      // vcvtdq2ps     %ymm5,%ymm5
-  .byte  196,226,125,24,53,98,91,2,0         // vbroadcastss  0x25b62(%rip),%ymm6        # 3ac80 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
+  .byte  196,226,125,24,53,128,87,2,0        // vbroadcastss  0x25780(%rip),%ymm6        # 3a4b0 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
   .byte  197,212,89,238                      // vmulps        %ymm6,%ymm5,%ymm5
-  .byte  196,226,125,24,53,89,91,2,0         // vbroadcastss  0x25b59(%rip),%ymm6        # 3ac84 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
+  .byte  196,226,125,24,53,119,87,2,0        // vbroadcastss  0x25777(%rip),%ymm6        # 3a4b4 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
   .byte  197,196,84,246                      // vandps        %ymm6,%ymm7,%ymm6
   .byte  197,252,91,246                      // vcvtdq2ps     %ymm6,%ymm6
-  .byte  196,98,125,24,5,76,91,2,0           // vbroadcastss  0x25b4c(%rip),%ymm8        # 3ac88 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
+  .byte  196,98,125,24,5,106,87,2,0          // vbroadcastss  0x2576a(%rip),%ymm8        # 3a4b8 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
   .byte  196,193,76,89,240                   // vmulps        %ymm8,%ymm6,%ymm6
-  .byte  196,98,125,24,5,66,91,2,0           // vbroadcastss  0x25b42(%rip),%ymm8        # 3ac8c <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
+  .byte  196,98,125,24,5,96,87,2,0           // vbroadcastss  0x25760(%rip),%ymm8        # 3a4bc <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
   .byte  196,193,68,84,248                   // vandps        %ymm8,%ymm7,%ymm7
   .byte  197,252,91,255                      // vcvtdq2ps     %ymm7,%ymm7
-  .byte  196,98,125,24,5,52,91,2,0           // vbroadcastss  0x25b34(%rip),%ymm8        # 3ac90 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
+  .byte  196,98,125,24,5,82,87,2,0           // vbroadcastss  0x25752(%rip),%ymm8        # 3a4c0 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
   .byte  196,193,68,89,248                   // vmulps        %ymm8,%ymm7,%ymm7
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,84,255,255,255               // ja            150d1 <_sk_load_4444_dst_avx+0x25>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,100,0,0,0                 // lea           0x64(%rip),%r10        # 151ec <_sk_load_4444_dst_avx+0x140>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  15,135,90,255,255,255               // ja            14ce3 <_sk_load_4444_dst_avx+0x1f>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,97,0,0,0                  // lea           0x61(%rip),%r9        # 14df4 <_sk_load_4444_dst_avx+0x130>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  233,50,255,255,255                  // jmpq          150d1 <_sk_load_4444_dst_avx+0x25>
+  .byte  233,57,255,255,255                  // jmpq          14ce3 <_sk_load_4444_dst_avx+0x1f>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,4,2           // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,129,121,110,44,88               // vmovd         (%r8,%r11,2),%xmm5
+  .byte  196,193,89,196,100,80,4,2           // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,193,121,110,44,80               // vmovd         (%r8,%rdx,2),%xmm5
   .byte  196,227,89,14,229,3                 // vpblendw      $0x3,%xmm5,%xmm4,%xmm4
-  .byte  233,21,255,255,255                  // jmpq          150d1 <_sk_load_4444_dst_avx+0x25>
+  .byte  233,28,255,255,255                  // jmpq          14ce3 <_sk_load_4444_dst_avx+0x1f>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,12,6          // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,10,5          // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,129,89,196,100,88,8,4           // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
-  .byte  196,129,122,126,44,88               // vmovq         (%r8,%r11,2),%xmm5
+  .byte  196,193,89,196,100,80,12,6          // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,193,89,196,100,80,10,5          // vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,193,89,196,100,80,8,4           // vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm4,%xmm4
+  .byte  196,193,122,126,44,80               // vmovq         (%r8,%rdx,2),%xmm5
   .byte  196,227,81,14,228,240               // vpblendw      $0xf0,%xmm4,%xmm5,%xmm4
-  .byte  233,232,254,255,255                 // jmpq          150d1 <_sk_load_4444_dst_avx+0x25>
-  .byte  15,31,0                             // nopl          (%rax)
-  .byte  165                                 // movsl         %ds:(%rsi),%es:(%rdi)
+  .byte  233,239,254,255,255                 // jmpq          14ce3 <_sk_load_4444_dst_avx+0x1f>
+  .byte  168,255                             // test          $0xff,%al
+  .byte  255                                 // (bad)
+  .byte  255,194                             // inc           %edx
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,182,255,255,255,239             // pushq         -0x10000001(%rsi)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,231                             // jmpq          *%rdi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  191,255,255,255,179                 // mov           $0xb3ffffff,%edi
+  .byte  223,255                             // (bad)
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  236                                 // in            (%dx),%al
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,228                             // jmpq          *%rsp
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  220,255                             // fdivr         %st,%st(7)
-  .byte  255                                 // (bad)
-  .byte  255,208                             // callq         *%rax
+  .byte  255,211                             // callq         *%rbx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -20613,25 +20414,25 @@
   .byte  197,249,112,192,78                  // vpshufd       $0x4e,%xmm0,%xmm0
   .byte  196,226,121,51,192                  // vpmovzxwd     %xmm0,%xmm0
   .byte  196,227,117,24,216,1                // vinsertf128   $0x1,%xmm0,%ymm1,%ymm3
-  .byte  196,226,125,24,5,61,89,2,0          // vbroadcastss  0x2593d(%rip),%ymm0        # 3ac74 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
+  .byte  196,226,125,24,5,101,85,2,0         // vbroadcastss  0x25565(%rip),%ymm0        # 3a4a4 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
   .byte  197,228,84,192                      // vandps        %ymm0,%ymm3,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,48,89,2,0         // vbroadcastss  0x25930(%rip),%ymm1        # 3ac78 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
+  .byte  196,226,125,24,13,88,85,2,0         // vbroadcastss  0x25558(%rip),%ymm1        # 3a4a8 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
-  .byte  196,226,125,24,13,39,89,2,0         // vbroadcastss  0x25927(%rip),%ymm1        # 3ac7c <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
+  .byte  196,226,125,24,13,79,85,2,0         // vbroadcastss  0x2554f(%rip),%ymm1        # 3a4ac <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
   .byte  197,228,84,201                      // vandps        %ymm1,%ymm3,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  196,226,125,24,21,26,89,2,0         // vbroadcastss  0x2591a(%rip),%ymm2        # 3ac80 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
+  .byte  196,226,125,24,21,66,85,2,0         // vbroadcastss  0x25542(%rip),%ymm2        # 3a4b0 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
   .byte  197,244,89,202                      // vmulps        %ymm2,%ymm1,%ymm1
-  .byte  196,226,125,24,21,17,89,2,0         // vbroadcastss  0x25911(%rip),%ymm2        # 3ac84 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
+  .byte  196,226,125,24,21,57,85,2,0         // vbroadcastss  0x25539(%rip),%ymm2        # 3a4b4 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
   .byte  197,228,84,210                      // vandps        %ymm2,%ymm3,%ymm2
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
-  .byte  196,98,125,24,5,4,89,2,0            // vbroadcastss  0x25904(%rip),%ymm8        # 3ac88 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
+  .byte  196,98,125,24,5,44,85,2,0           // vbroadcastss  0x2552c(%rip),%ymm8        # 3a4b8 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
   .byte  196,193,108,89,208                  // vmulps        %ymm8,%ymm2,%ymm2
-  .byte  196,98,125,24,5,250,88,2,0          // vbroadcastss  0x258fa(%rip),%ymm8        # 3ac8c <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
+  .byte  196,98,125,24,5,34,85,2,0           // vbroadcastss  0x25522(%rip),%ymm8        # 3a4bc <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
   .byte  196,193,100,84,216                  // vandps        %ymm8,%ymm3,%ymm3
   .byte  197,252,91,219                      // vcvtdq2ps     %ymm3,%ymm3
-  .byte  196,98,125,24,5,236,88,2,0          // vbroadcastss  0x258ec(%rip),%ymm8        # 3ac90 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
+  .byte  196,98,125,24,5,20,85,2,0           // vbroadcastss  0x25514(%rip),%ymm8        # 3a4c0 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
   .byte  196,193,100,89,216                  // vmulps        %ymm8,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  91                                  // pop           %rbx
@@ -20646,17 +20447,15 @@
 FUNCTION(_sk_store_4444_avx)
 _sk_store_4444_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,60,95,208                       // vmaxps        %ymm0,%ymm8,%ymm10
-  .byte  196,98,125,24,13,159,87,2,0         // vbroadcastss  0x2579f(%rip),%ymm9        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,13,205,83,2,0         // vbroadcastss  0x253cd(%rip),%ymm9        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,44,93,209                    // vminps        %ymm9,%ymm10,%ymm10
-  .byte  196,98,125,24,29,169,88,2,0         // vbroadcastss  0x258a9(%rip),%ymm11        # 3ac94 <_sk_srcover_bgra_8888_sse2_lowp+0x3c8>
+  .byte  196,98,125,24,29,215,84,2,0         // vbroadcastss  0x254d7(%rip),%ymm11        # 3a4c4 <_sk_srcover_bgra_8888_sse2_lowp+0x3c8>
   .byte  196,65,44,89,211                    // vmulps        %ymm11,%ymm10,%ymm10
   .byte  196,65,125,91,210                   // vcvtps2dq     %ymm10,%ymm10
   .byte  196,193,25,114,242,12               // vpslld        $0xc,%xmm10,%xmm12
@@ -20689,49 +20488,52 @@
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
   .byte  196,66,57,43,193                    // vpackusdw     %xmm9,%xmm8,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           1549f <_sk_store_4444_avx+0xea>
-  .byte  196,1,122,127,4,88                  // vmovdqu       %xmm8,(%r8,%r11,2)
+  .byte  117,10                              // jne           150a1 <_sk_store_4444_avx+0xe4>
+  .byte  196,65,122,127,4,80                 // vmovdqu       %xmm8,(%r8,%rdx,2)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,236                             // ja            1549b <_sk_store_4444_avx+0xe6>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,66,0,0,0                  // lea           0x42(%rip),%r10        # 154fc <_sk_store_4444_avx+0x147>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,242                             // ja            1509d <_sk_store_4444_avx+0xe0>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,67,0,0,0                  // lea           0x43(%rip),%r9        # 150f8 <_sk_store_4444_avx+0x13b>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,3,121,21,4,88,0                 // vpextrw       $0x0,%xmm8,(%r8,%r11,2)
-  .byte  235,207                             // jmp           1549b <_sk_store_4444_avx+0xe6>
-  .byte  196,3,121,21,68,88,4,2              // vpextrw       $0x2,%xmm8,0x4(%r8,%r11,2)
-  .byte  196,1,121,126,4,88                  // vmovd         %xmm8,(%r8,%r11,2)
-  .byte  235,191                             // jmp           1549b <_sk_store_4444_avx+0xe6>
-  .byte  196,3,121,21,68,88,12,6             // vpextrw       $0x6,%xmm8,0xc(%r8,%r11,2)
-  .byte  196,3,121,21,68,88,10,5             // vpextrw       $0x5,%xmm8,0xa(%r8,%r11,2)
-  .byte  196,3,121,21,68,88,8,4              // vpextrw       $0x4,%xmm8,0x8(%r8,%r11,2)
-  .byte  196,1,121,214,4,88                  // vmovq         %xmm8,(%r8,%r11,2)
-  .byte  235,159                             // jmp           1549b <_sk_store_4444_avx+0xe6>
-  .byte  199                                 // (bad)
+  .byte  196,67,121,21,4,80,0                // vpextrw       $0x0,%xmm8,(%r8,%rdx,2)
+  .byte  235,214                             // jmp           1509d <_sk_store_4444_avx+0xe0>
+  .byte  196,67,121,21,68,80,4,2             // vpextrw       $0x2,%xmm8,0x4(%r8,%rdx,2)
+  .byte  196,65,121,126,4,80                 // vmovd         %xmm8,(%r8,%rdx,2)
+  .byte  235,198                             // jmp           1509d <_sk_store_4444_avx+0xe0>
+  .byte  196,67,121,21,68,80,12,6            // vpextrw       $0x6,%xmm8,0xc(%r8,%rdx,2)
+  .byte  196,67,121,21,68,80,10,5            // vpextrw       $0x5,%xmm8,0xa(%r8,%rdx,2)
+  .byte  196,67,121,21,68,80,8,4             // vpextrw       $0x4,%xmm8,0x8(%r8,%rdx,2)
+  .byte  196,65,121,214,4,80                 // vmovq         %xmm8,(%r8,%rdx,2)
+  .byte  235,166                             // jmp           1509d <_sk_store_4444_avx+0xe0>
+  .byte  144                                 // nop
+  .byte  198                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,215                             // callq         *%rdi
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,207                             // dec           %edi
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,247                             // push          %rdi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  216,255                             // fdivr         %st(7),%st
+  .byte  239                                 // out           %eax,(%dx)
   .byte  255                                 // (bad)
-  .byte  255,208                             // callq         *%rax
+  .byte  255                                 // (bad)
+  .byte  255,231                             // jmpq          *%rdi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  248                                 // clc
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,240                             // push          %rax
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  232,255,255,255,224                 // callq         ffffffffe1015514 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffe0fdac48>
-  .byte  255                                 // (bad)
+  .byte  223,255                             // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
@@ -20740,19 +20542,17 @@
 FUNCTION(_sk_load_8888_avx)
 _sk_load_8888_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,135,0,0,0                    // jne           155bf <_sk_load_8888_avx+0xa7>
-  .byte  196,1,125,16,12,152                 // vmovupd       (%r8,%r11,4),%ymm9
-  .byte  197,125,40,21,90,92,2,0             // vmovapd       0x25c5a(%rip),%ymm10        # 3b1a0 <_sk_srcover_bgra_8888_sse2_lowp+0x8d4>
+  .byte  15,133,135,0,0,0                    // jne           151b5 <_sk_load_8888_avx+0xa1>
+  .byte  196,65,125,16,12,144                // vmovupd       (%r8,%rdx,4),%ymm9
+  .byte  197,125,40,21,164,88,2,0            // vmovapd       0x258a4(%rip),%ymm10        # 3a9e0 <_sk_srcover_bgra_8888_sse2_lowp+0x8e4>
   .byte  196,193,53,84,194                   // vandpd        %ymm10,%ymm9,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,5,156,86,2,0          // vbroadcastss  0x2569c(%rip),%ymm8        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,5,214,82,2,0          // vbroadcastss  0x252d6(%rip),%ymm8        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
   .byte  196,193,113,114,209,8               // vpsrld        $0x8,%xmm9,%xmm1
   .byte  196,99,125,25,203,1                 // vextractf128  $0x1,%ymm9,%xmm3
@@ -20774,58 +20574,58 @@
   .byte  196,193,100,89,216                  // vmulps        %ymm8,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,102,255,255,255              // ja            1553e <_sk_load_8888_avx+0x26>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,145,0,0,0                 // lea           0x91(%rip),%r10        # 15674 <_sk_load_8888_avx+0x15c>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  15,135,108,255,255,255              // ja            15134 <_sk_load_8888_avx+0x20>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,146,0,0,0                 // lea           0x92(%rip),%r9        # 15264 <_sk_load_8888_avx+0x150>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,1,122,16,12,152                 // vmovss        (%r8,%r11,4),%xmm9
-  .byte  233,71,255,255,255                  // jmpq          1553e <_sk_load_8888_avx+0x26>
-  .byte  196,129,121,110,68,152,8            // vmovd         0x8(%r8,%r11,4),%xmm0
+  .byte  196,65,122,16,12,144                // vmovss        (%r8,%rdx,4),%xmm9
+  .byte  233,78,255,255,255                  // jmpq          15134 <_sk_load_8888_avx+0x20>
+  .byte  196,193,121,110,68,144,8            // vmovd         0x8(%r8,%rdx,4),%xmm0
   .byte  197,249,112,192,68                  // vpshufd       $0x44,%xmm0,%xmm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  196,99,117,12,200,4                 // vblendps      $0x4,%ymm0,%ymm1,%ymm9
-  .byte  196,129,123,16,4,152                // vmovsd        (%r8,%r11,4),%xmm0
+  .byte  196,193,123,16,4,144                // vmovsd        (%r8,%rdx,4),%xmm0
   .byte  196,99,53,13,200,1                  // vblendpd      $0x1,%ymm0,%ymm9,%ymm9
-  .byte  233,32,255,255,255                  // jmpq          1553e <_sk_load_8888_avx+0x26>
-  .byte  196,129,121,110,68,152,24           // vmovd         0x18(%r8,%r11,4),%xmm0
+  .byte  233,39,255,255,255                  // jmpq          15134 <_sk_load_8888_avx+0x20>
+  .byte  196,193,121,110,68,144,24           // vmovd         0x18(%r8,%rdx,4),%xmm0
   .byte  197,249,112,192,68                  // vpshufd       $0x44,%xmm0,%xmm0
   .byte  196,227,125,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  196,99,117,12,200,64                // vblendps      $0x40,%ymm0,%ymm1,%ymm9
   .byte  196,99,125,25,200,1                 // vextractf128  $0x1,%ymm9,%xmm0
-  .byte  196,131,121,34,68,152,20,1          // vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm0,%xmm0
+  .byte  196,195,121,34,68,144,20,1          // vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm0,%xmm0
   .byte  196,99,53,24,200,1                  // vinsertf128   $0x1,%xmm0,%ymm9,%ymm9
   .byte  196,99,125,25,200,1                 // vextractf128  $0x1,%ymm9,%xmm0
-  .byte  196,131,121,34,68,152,16,0          // vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm0,%xmm0
+  .byte  196,195,121,34,68,144,16,0          // vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm0,%xmm0
   .byte  196,99,53,24,200,1                  // vinsertf128   $0x1,%xmm0,%ymm9,%ymm9
-  .byte  196,129,121,16,4,152                // vmovupd       (%r8,%r11,4),%xmm0
+  .byte  196,193,121,16,4,144                // vmovupd       (%r8,%rdx,4),%xmm0
   .byte  196,67,125,13,201,12                // vblendpd      $0xc,%ymm9,%ymm0,%ymm9
-  .byte  233,203,254,255,255                 // jmpq          1553e <_sk_load_8888_avx+0x26>
-  .byte  144                                 // nop
-  .byte  120,255                             // js            15675 <_sk_load_8888_avx+0x15d>
+  .byte  233,210,254,255,255                 // jmpq          15134 <_sk_load_8888_avx+0x20>
+  .byte  102,144                             // xchg          %ax,%ax
+  .byte  119,255                             // ja            15265 <_sk_load_8888_avx+0x151>
   .byte  255                                 // (bad)
-  .byte  255,153,255,255,255,131             // lcall         *-0x7c000001(%rcx)
+  .byte  255,152,255,255,255,130             // lcall         *-0x7d000001(%rax)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  238                                 // out           %al,(%dx)
+  .byte  237                                 // in            (%dx),%eax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  218,255                             // (bad)
+  .byte  217,255                             // fcos
   .byte  255                                 // (bad)
-  .byte  255,198                             // inc           %esi
+  .byte  255,197                             // inc           %ebp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
-  .byte  170                                 // stos          %al,%es:(%rdi)
+  .byte  169                                 // .byte         0xa9
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -20835,19 +20635,17 @@
 FUNCTION(_sk_load_8888_dst_avx)
 _sk_load_8888_dst_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,135,0,0,0                    // jne           15737 <_sk_load_8888_dst_avx+0xa7>
-  .byte  196,1,125,16,12,152                 // vmovupd       (%r8,%r11,4),%ymm9
-  .byte  197,125,40,21,2,91,2,0              // vmovapd       0x25b02(%rip),%ymm10        # 3b1c0 <_sk_srcover_bgra_8888_sse2_lowp+0x8f4>
+  .byte  15,133,135,0,0,0                    // jne           15321 <_sk_load_8888_dst_avx+0xa1>
+  .byte  196,65,125,16,12,144                // vmovupd       (%r8,%rdx,4),%ymm9
+  .byte  197,125,40,21,88,87,2,0             // vmovapd       0x25758(%rip),%ymm10        # 3aa00 <_sk_srcover_bgra_8888_sse2_lowp+0x904>
   .byte  196,193,53,84,226                   // vandpd        %ymm10,%ymm9,%ymm4
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,98,125,24,5,36,85,2,0           // vbroadcastss  0x25524(%rip),%ymm8        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,5,106,81,2,0          // vbroadcastss  0x2516a(%rip),%ymm8        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,193,92,89,224                   // vmulps        %ymm8,%ymm4,%ymm4
   .byte  196,193,81,114,209,8                // vpsrld        $0x8,%xmm9,%xmm5
   .byte  196,99,125,25,207,1                 // vextractf128  $0x1,%ymm9,%xmm7
@@ -20869,58 +20667,58 @@
   .byte  196,193,68,89,248                   // vmulps        %ymm8,%ymm7,%ymm7
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,102,255,255,255              // ja            156b6 <_sk_load_8888_dst_avx+0x26>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,145,0,0,0                 // lea           0x91(%rip),%r10        # 157ec <_sk_load_8888_dst_avx+0x15c>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  15,135,108,255,255,255              // ja            152a0 <_sk_load_8888_dst_avx+0x20>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,146,0,0,0                 // lea           0x92(%rip),%r9        # 153d0 <_sk_load_8888_dst_avx+0x150>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,1,122,16,12,152                 // vmovss        (%r8,%r11,4),%xmm9
-  .byte  233,71,255,255,255                  // jmpq          156b6 <_sk_load_8888_dst_avx+0x26>
-  .byte  196,129,121,110,100,152,8           // vmovd         0x8(%r8,%r11,4),%xmm4
+  .byte  196,65,122,16,12,144                // vmovss        (%r8,%rdx,4),%xmm9
+  .byte  233,78,255,255,255                  // jmpq          152a0 <_sk_load_8888_dst_avx+0x20>
+  .byte  196,193,121,110,100,144,8           // vmovd         0x8(%r8,%rdx,4),%xmm4
   .byte  197,249,112,228,68                  // vpshufd       $0x44,%xmm4,%xmm4
   .byte  197,212,87,237                      // vxorps        %ymm5,%ymm5,%ymm5
   .byte  196,99,85,12,204,4                  // vblendps      $0x4,%ymm4,%ymm5,%ymm9
-  .byte  196,129,123,16,36,152               // vmovsd        (%r8,%r11,4),%xmm4
+  .byte  196,193,123,16,36,144               // vmovsd        (%r8,%rdx,4),%xmm4
   .byte  196,99,53,13,204,1                  // vblendpd      $0x1,%ymm4,%ymm9,%ymm9
-  .byte  233,32,255,255,255                  // jmpq          156b6 <_sk_load_8888_dst_avx+0x26>
-  .byte  196,129,121,110,100,152,24          // vmovd         0x18(%r8,%r11,4),%xmm4
+  .byte  233,39,255,255,255                  // jmpq          152a0 <_sk_load_8888_dst_avx+0x20>
+  .byte  196,193,121,110,100,144,24          // vmovd         0x18(%r8,%rdx,4),%xmm4
   .byte  197,249,112,228,68                  // vpshufd       $0x44,%xmm4,%xmm4
   .byte  196,227,125,24,228,1                // vinsertf128   $0x1,%xmm4,%ymm0,%ymm4
   .byte  197,212,87,237                      // vxorps        %ymm5,%ymm5,%ymm5
   .byte  196,99,85,12,204,64                 // vblendps      $0x40,%ymm4,%ymm5,%ymm9
   .byte  196,99,125,25,204,1                 // vextractf128  $0x1,%ymm9,%xmm4
-  .byte  196,131,89,34,100,152,20,1          // vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,20,1          // vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,99,53,24,204,1                  // vinsertf128   $0x1,%xmm4,%ymm9,%ymm9
   .byte  196,99,125,25,204,1                 // vextractf128  $0x1,%ymm9,%xmm4
-  .byte  196,131,89,34,100,152,16,0          // vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,16,0          // vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,99,53,24,204,1                  // vinsertf128   $0x1,%xmm4,%ymm9,%ymm9
-  .byte  196,129,121,16,36,152               // vmovupd       (%r8,%r11,4),%xmm4
+  .byte  196,193,121,16,36,144               // vmovupd       (%r8,%rdx,4),%xmm4
   .byte  196,67,93,13,201,12                 // vblendpd      $0xc,%ymm9,%ymm4,%ymm9
-  .byte  233,203,254,255,255                 // jmpq          156b6 <_sk_load_8888_dst_avx+0x26>
-  .byte  144                                 // nop
-  .byte  120,255                             // js            157ed <_sk_load_8888_dst_avx+0x15d>
+  .byte  233,210,254,255,255                 // jmpq          152a0 <_sk_load_8888_dst_avx+0x20>
+  .byte  102,144                             // xchg          %ax,%ax
+  .byte  119,255                             // ja            153d1 <_sk_load_8888_dst_avx+0x151>
   .byte  255                                 // (bad)
-  .byte  255,153,255,255,255,131             // lcall         *-0x7c000001(%rcx)
+  .byte  255,152,255,255,255,130             // lcall         *-0x7d000001(%rax)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  238                                 // out           %al,(%dx)
+  .byte  237                                 // in            (%dx),%eax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  218,255                             // (bad)
+  .byte  217,255                             // fcos
   .byte  255                                 // (bad)
-  .byte  255,198                             // inc           %esi
+  .byte  255,197                             // inc           %ebp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
-  .byte  170                                 // stos          %al,%es:(%rdi)
+  .byte  169                                 // .byte         0xa9
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -20982,10 +20780,10 @@
   .byte  196,131,121,34,4,176,2              // vpinsrd       $0x2,(%r8,%r14,4),%xmm0,%xmm0
   .byte  196,195,121,34,28,152,3             // vpinsrd       $0x3,(%r8,%rbx,4),%xmm0,%xmm3
   .byte  196,227,61,24,195,1                 // vinsertf128   $0x1,%xmm3,%ymm8,%ymm0
-  .byte  197,124,40,21,212,88,2,0            // vmovaps       0x258d4(%rip),%ymm10        # 3b1e0 <_sk_srcover_bgra_8888_sse2_lowp+0x914>
+  .byte  197,124,40,21,48,85,2,0             // vmovaps       0x25530(%rip),%ymm10        # 3aa20 <_sk_srcover_bgra_8888_sse2_lowp+0x924>
   .byte  196,193,124,84,194                  // vandps        %ymm10,%ymm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,13,214,82,2,0         // vbroadcastss  0x252d6(%rip),%ymm9        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,13,34,79,2,0          // vbroadcastss  0x24f22(%rip),%ymm9        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,193,124,89,193                  // vmulps        %ymm9,%ymm0,%ymm0
   .byte  196,193,113,114,208,8               // vpsrld        $0x8,%xmm8,%xmm1
   .byte  197,233,114,211,8                   // vpsrld        $0x8,%xmm3,%xmm2
@@ -21016,17 +20814,15 @@
 FUNCTION(_sk_store_8888_avx)
 _sk_store_8888_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,60,95,200                       // vmaxps        %ymm0,%ymm8,%ymm9
-  .byte  196,98,125,24,21,205,81,2,0         // vbroadcastss  0x251cd(%rip),%ymm10        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,21,31,78,2,0          // vbroadcastss  0x24e1f(%rip),%ymm10        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,52,93,202                    // vminps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,29,235,81,2,0         // vbroadcastss  0x251eb(%rip),%ymm11        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,98,125,24,29,61,78,2,0          // vbroadcastss  0x24e3d(%rip),%ymm11        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   .byte  196,65,52,89,203                    // vmulps        %ymm11,%ymm9,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  197,60,95,225                       // vmaxps        %ymm1,%ymm8,%ymm12
@@ -21057,51 +20853,48 @@
   .byte  196,65,29,86,192                    // vorpd         %ymm8,%ymm12,%ymm8
   .byte  196,65,53,86,192                    // vorpd         %ymm8,%ymm9,%ymm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           15a66 <_sk_store_8888_avx+0xe0>
-  .byte  196,1,124,17,4,152                  // vmovups       %ymm8,(%r8,%r11,4)
+  .byte  117,10                              // jne           15644 <_sk_store_8888_avx+0xda>
+  .byte  196,65,124,17,4,144                 // vmovups       %ymm8,(%r8,%rdx,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,236                             // ja            15a62 <_sk_store_8888_avx+0xdc>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,83,0,0,0                  // lea           0x53(%rip),%r10        # 15ad4 <_sk_store_8888_avx+0x14e>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,242                             // ja            15640 <_sk_store_8888_avx+0xd6>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,84,0,0,0                  // lea           0x54(%rip),%r9        # 156ac <_sk_store_8888_avx+0x142>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,1,121,126,4,152                 // vmovd         %xmm8,(%r8,%r11,4)
-  .byte  235,208                             // jmp           15a62 <_sk_store_8888_avx+0xdc>
-  .byte  196,3,121,22,68,152,8,2             // vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
-  .byte  196,1,121,214,4,152                 // vmovq         %xmm8,(%r8,%r11,4)
-  .byte  235,192                             // jmp           15a62 <_sk_store_8888_avx+0xdc>
+  .byte  196,65,121,126,4,144                // vmovd         %xmm8,(%r8,%rdx,4)
+  .byte  235,215                             // jmp           15640 <_sk_store_8888_avx+0xd6>
+  .byte  196,67,121,22,68,144,8,2            // vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
+  .byte  196,65,121,214,4,144                // vmovq         %xmm8,(%r8,%rdx,4)
+  .byte  235,199                             // jmp           15640 <_sk_store_8888_avx+0xd6>
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,24,2            // vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,24,2           // vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,20,1            // vpextrd       $0x1,%xmm9,0x14(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,20,1           // vpextrd       $0x1,%xmm9,0x14(%r8,%rdx,4)
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
-  .byte  196,1,122,17,76,152,16              // vmovss        %xmm9,0x10(%r8,%r11,4)
-  .byte  196,1,121,17,4,152                  // vmovupd       %xmm8,(%r8,%r11,4)
-  .byte  235,143                             // jmp           15a62 <_sk_store_8888_avx+0xdc>
-  .byte  144                                 // nop
-  .byte  182,255                             // mov           $0xff,%dh
+  .byte  196,65,122,17,76,144,16             // vmovss        %xmm9,0x10(%r8,%rdx,4)
+  .byte  196,65,121,17,4,144                 // vmovupd       %xmm8,(%r8,%rdx,4)
+  .byte  235,150                             // jmp           15640 <_sk_store_8888_avx+0xd6>
+  .byte  102,144                             // xchg          %ax,%ax
+  .byte  181,255                             // mov           $0xff,%ch
   .byte  255                                 // (bad)
-  .byte  255,198                             // inc           %esi
+  .byte  255,197                             // inc           %ebp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  190,255,255,255,247                 // mov           $0xf7ffffff,%esi
+  .byte  189,255,255,255,246                 // mov           $0xf6ffffff,%ebp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  234                                 // (bad)
+  .byte  233,255,255,255,219                 // jmpq          ffffffffdc0156c0 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffdbfdb5c4>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  220,255                             // fdivr         %st,%st(7)
-  .byte  255                                 // (bad)
-  .byte  255,206                             // dec           %esi
+  .byte  255,205                             // dec           %ebp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -21111,19 +20904,17 @@
 FUNCTION(_sk_load_bgra_avx)
 _sk_load_bgra_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,135,0,0,0                    // jne           15b97 <_sk_load_bgra_avx+0xa7>
-  .byte  196,1,125,16,12,152                 // vmovupd       (%r8,%r11,4),%ymm9
-  .byte  197,125,40,21,226,86,2,0            // vmovapd       0x256e2(%rip),%ymm10        # 3b200 <_sk_srcover_bgra_8888_sse2_lowp+0x934>
+  .byte  15,133,135,0,0,0                    // jne           15769 <_sk_load_bgra_avx+0xa1>
+  .byte  196,65,125,16,12,144                // vmovupd       (%r8,%rdx,4),%ymm9
+  .byte  197,125,40,21,80,83,2,0             // vmovapd       0x25350(%rip),%ymm10        # 3aa40 <_sk_srcover_bgra_8888_sse2_lowp+0x944>
   .byte  196,193,53,84,202                   // vandpd        %ymm10,%ymm9,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  196,98,125,24,5,196,80,2,0          // vbroadcastss  0x250c4(%rip),%ymm8        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,5,34,77,2,0           // vbroadcastss  0x24d22(%rip),%ymm8        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,193,116,89,208                  // vmulps        %ymm8,%ymm1,%ymm2
   .byte  196,193,113,114,209,8               // vpsrld        $0x8,%xmm9,%xmm1
   .byte  196,99,125,25,203,1                 // vextractf128  $0x1,%ymm9,%xmm3
@@ -21145,58 +20936,58 @@
   .byte  196,193,100,89,216                  // vmulps        %ymm8,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,102,255,255,255              // ja            15b16 <_sk_load_bgra_avx+0x26>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,145,0,0,0                 // lea           0x91(%rip),%r10        # 15c4c <_sk_load_bgra_avx+0x15c>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  15,135,108,255,255,255              // ja            156e8 <_sk_load_bgra_avx+0x20>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,146,0,0,0                 // lea           0x92(%rip),%r9        # 15818 <_sk_load_bgra_avx+0x150>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,1,122,16,12,152                 // vmovss        (%r8,%r11,4),%xmm9
-  .byte  233,71,255,255,255                  // jmpq          15b16 <_sk_load_bgra_avx+0x26>
-  .byte  196,129,121,110,68,152,8            // vmovd         0x8(%r8,%r11,4),%xmm0
+  .byte  196,65,122,16,12,144                // vmovss        (%r8,%rdx,4),%xmm9
+  .byte  233,78,255,255,255                  // jmpq          156e8 <_sk_load_bgra_avx+0x20>
+  .byte  196,193,121,110,68,144,8            // vmovd         0x8(%r8,%rdx,4),%xmm0
   .byte  197,249,112,192,68                  // vpshufd       $0x44,%xmm0,%xmm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  196,99,117,12,200,4                 // vblendps      $0x4,%ymm0,%ymm1,%ymm9
-  .byte  196,129,123,16,4,152                // vmovsd        (%r8,%r11,4),%xmm0
+  .byte  196,193,123,16,4,144                // vmovsd        (%r8,%rdx,4),%xmm0
   .byte  196,99,53,13,200,1                  // vblendpd      $0x1,%ymm0,%ymm9,%ymm9
-  .byte  233,32,255,255,255                  // jmpq          15b16 <_sk_load_bgra_avx+0x26>
-  .byte  196,129,121,110,68,152,24           // vmovd         0x18(%r8,%r11,4),%xmm0
+  .byte  233,39,255,255,255                  // jmpq          156e8 <_sk_load_bgra_avx+0x20>
+  .byte  196,193,121,110,68,144,24           // vmovd         0x18(%r8,%rdx,4),%xmm0
   .byte  197,249,112,192,68                  // vpshufd       $0x44,%xmm0,%xmm0
   .byte  196,227,125,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  196,99,117,12,200,64                // vblendps      $0x40,%ymm0,%ymm1,%ymm9
   .byte  196,99,125,25,200,1                 // vextractf128  $0x1,%ymm9,%xmm0
-  .byte  196,131,121,34,68,152,20,1          // vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm0,%xmm0
+  .byte  196,195,121,34,68,144,20,1          // vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm0,%xmm0
   .byte  196,99,53,24,200,1                  // vinsertf128   $0x1,%xmm0,%ymm9,%ymm9
   .byte  196,99,125,25,200,1                 // vextractf128  $0x1,%ymm9,%xmm0
-  .byte  196,131,121,34,68,152,16,0          // vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm0,%xmm0
+  .byte  196,195,121,34,68,144,16,0          // vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm0,%xmm0
   .byte  196,99,53,24,200,1                  // vinsertf128   $0x1,%xmm0,%ymm9,%ymm9
-  .byte  196,129,121,16,4,152                // vmovupd       (%r8,%r11,4),%xmm0
+  .byte  196,193,121,16,4,144                // vmovupd       (%r8,%rdx,4),%xmm0
   .byte  196,67,125,13,201,12                // vblendpd      $0xc,%ymm9,%ymm0,%ymm9
-  .byte  233,203,254,255,255                 // jmpq          15b16 <_sk_load_bgra_avx+0x26>
-  .byte  144                                 // nop
-  .byte  120,255                             // js            15c4d <_sk_load_bgra_avx+0x15d>
+  .byte  233,210,254,255,255                 // jmpq          156e8 <_sk_load_bgra_avx+0x20>
+  .byte  102,144                             // xchg          %ax,%ax
+  .byte  119,255                             // ja            15819 <_sk_load_bgra_avx+0x151>
   .byte  255                                 // (bad)
-  .byte  255,153,255,255,255,131             // lcall         *-0x7c000001(%rcx)
+  .byte  255,152,255,255,255,130             // lcall         *-0x7d000001(%rax)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  238                                 // out           %al,(%dx)
+  .byte  237                                 // in            (%dx),%eax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  218,255                             // (bad)
+  .byte  217,255                             // fcos
   .byte  255                                 // (bad)
-  .byte  255,198                             // inc           %esi
+  .byte  255,197                             // inc           %ebp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
-  .byte  170                                 // stos          %al,%es:(%rdi)
+  .byte  169                                 // .byte         0xa9
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -21206,19 +20997,17 @@
 FUNCTION(_sk_load_bgra_dst_avx)
 _sk_load_bgra_dst_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,135,0,0,0                    // jne           15d0f <_sk_load_bgra_dst_avx+0xa7>
-  .byte  196,1,125,16,12,152                 // vmovupd       (%r8,%r11,4),%ymm9
-  .byte  197,125,40,21,138,85,2,0            // vmovapd       0x2558a(%rip),%ymm10        # 3b220 <_sk_srcover_bgra_8888_sse2_lowp+0x954>
+  .byte  15,133,135,0,0,0                    // jne           158d5 <_sk_load_bgra_dst_avx+0xa1>
+  .byte  196,65,125,16,12,144                // vmovupd       (%r8,%rdx,4),%ymm9
+  .byte  197,125,40,21,4,82,2,0              // vmovapd       0x25204(%rip),%ymm10        # 3aa60 <_sk_srcover_bgra_8888_sse2_lowp+0x964>
   .byte  196,193,53,84,234                   // vandpd        %ymm10,%ymm9,%ymm5
   .byte  197,252,91,237                      // vcvtdq2ps     %ymm5,%ymm5
-  .byte  196,98,125,24,5,76,79,2,0           // vbroadcastss  0x24f4c(%rip),%ymm8        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,5,182,75,2,0          // vbroadcastss  0x24bb6(%rip),%ymm8        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,193,84,89,240                   // vmulps        %ymm8,%ymm5,%ymm6
   .byte  196,193,81,114,209,8                // vpsrld        $0x8,%xmm9,%xmm5
   .byte  196,99,125,25,207,1                 // vextractf128  $0x1,%ymm9,%xmm7
@@ -21240,58 +21029,58 @@
   .byte  196,193,68,89,248                   // vmulps        %ymm8,%ymm7,%ymm7
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,102,255,255,255              // ja            15c8e <_sk_load_bgra_dst_avx+0x26>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,145,0,0,0                 // lea           0x91(%rip),%r10        # 15dc4 <_sk_load_bgra_dst_avx+0x15c>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  15,135,108,255,255,255              // ja            15854 <_sk_load_bgra_dst_avx+0x20>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,146,0,0,0                 // lea           0x92(%rip),%r9        # 15984 <_sk_load_bgra_dst_avx+0x150>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,1,122,16,12,152                 // vmovss        (%r8,%r11,4),%xmm9
-  .byte  233,71,255,255,255                  // jmpq          15c8e <_sk_load_bgra_dst_avx+0x26>
-  .byte  196,129,121,110,100,152,8           // vmovd         0x8(%r8,%r11,4),%xmm4
+  .byte  196,65,122,16,12,144                // vmovss        (%r8,%rdx,4),%xmm9
+  .byte  233,78,255,255,255                  // jmpq          15854 <_sk_load_bgra_dst_avx+0x20>
+  .byte  196,193,121,110,100,144,8           // vmovd         0x8(%r8,%rdx,4),%xmm4
   .byte  197,249,112,228,68                  // vpshufd       $0x44,%xmm4,%xmm4
   .byte  197,212,87,237                      // vxorps        %ymm5,%ymm5,%ymm5
   .byte  196,99,85,12,204,4                  // vblendps      $0x4,%ymm4,%ymm5,%ymm9
-  .byte  196,129,123,16,36,152               // vmovsd        (%r8,%r11,4),%xmm4
+  .byte  196,193,123,16,36,144               // vmovsd        (%r8,%rdx,4),%xmm4
   .byte  196,99,53,13,204,1                  // vblendpd      $0x1,%ymm4,%ymm9,%ymm9
-  .byte  233,32,255,255,255                  // jmpq          15c8e <_sk_load_bgra_dst_avx+0x26>
-  .byte  196,129,121,110,100,152,24          // vmovd         0x18(%r8,%r11,4),%xmm4
+  .byte  233,39,255,255,255                  // jmpq          15854 <_sk_load_bgra_dst_avx+0x20>
+  .byte  196,193,121,110,100,144,24          // vmovd         0x18(%r8,%rdx,4),%xmm4
   .byte  197,249,112,228,68                  // vpshufd       $0x44,%xmm4,%xmm4
   .byte  196,227,125,24,228,1                // vinsertf128   $0x1,%xmm4,%ymm0,%ymm4
   .byte  197,212,87,237                      // vxorps        %ymm5,%ymm5,%ymm5
   .byte  196,99,85,12,204,64                 // vblendps      $0x40,%ymm4,%ymm5,%ymm9
   .byte  196,99,125,25,204,1                 // vextractf128  $0x1,%ymm9,%xmm4
-  .byte  196,131,89,34,100,152,20,1          // vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,20,1          // vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,99,53,24,204,1                  // vinsertf128   $0x1,%xmm4,%ymm9,%ymm9
   .byte  196,99,125,25,204,1                 // vextractf128  $0x1,%ymm9,%xmm4
-  .byte  196,131,89,34,100,152,16,0          // vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm4,%xmm4
+  .byte  196,195,89,34,100,144,16,0          // vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm4,%xmm4
   .byte  196,99,53,24,204,1                  // vinsertf128   $0x1,%xmm4,%ymm9,%ymm9
-  .byte  196,129,121,16,36,152               // vmovupd       (%r8,%r11,4),%xmm4
+  .byte  196,193,121,16,36,144               // vmovupd       (%r8,%rdx,4),%xmm4
   .byte  196,67,93,13,201,12                 // vblendpd      $0xc,%ymm9,%ymm4,%ymm9
-  .byte  233,203,254,255,255                 // jmpq          15c8e <_sk_load_bgra_dst_avx+0x26>
-  .byte  144                                 // nop
-  .byte  120,255                             // js            15dc5 <_sk_load_bgra_dst_avx+0x15d>
+  .byte  233,210,254,255,255                 // jmpq          15854 <_sk_load_bgra_dst_avx+0x20>
+  .byte  102,144                             // xchg          %ax,%ax
+  .byte  119,255                             // ja            15985 <_sk_load_bgra_dst_avx+0x151>
   .byte  255                                 // (bad)
-  .byte  255,153,255,255,255,131             // lcall         *-0x7c000001(%rcx)
+  .byte  255,152,255,255,255,130             // lcall         *-0x7d000001(%rax)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  238                                 // out           %al,(%dx)
+  .byte  237                                 // in            (%dx),%eax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  218,255                             // (bad)
+  .byte  217,255                             // fcos
   .byte  255                                 // (bad)
-  .byte  255,198                             // inc           %esi
+  .byte  255,197                             // inc           %ebp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
-  .byte  170                                 // stos          %al,%es:(%rdi)
+  .byte  169                                 // .byte         0xa9
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -21353,10 +21142,10 @@
   .byte  196,131,121,34,4,176,2              // vpinsrd       $0x2,(%r8,%r14,4),%xmm0,%xmm0
   .byte  196,195,121,34,28,152,3             // vpinsrd       $0x3,(%r8,%rbx,4),%xmm0,%xmm3
   .byte  196,227,61,24,195,1                 // vinsertf128   $0x1,%xmm3,%ymm8,%ymm0
-  .byte  197,124,40,13,92,83,2,0             // vmovaps       0x2535c(%rip),%ymm9        # 3b240 <_sk_srcover_bgra_8888_sse2_lowp+0x974>
+  .byte  197,124,40,13,220,79,2,0            // vmovaps       0x24fdc(%rip),%ymm9        # 3aa80 <_sk_srcover_bgra_8888_sse2_lowp+0x984>
   .byte  196,193,124,84,193                  // vandps        %ymm9,%ymm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,21,254,76,2,0         // vbroadcastss  0x24cfe(%rip),%ymm10        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  196,98,125,24,21,110,73,2,0         // vbroadcastss  0x2496e(%rip),%ymm10        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  196,193,124,89,210                  // vmulps        %ymm10,%ymm0,%ymm2
   .byte  196,193,121,114,208,8               // vpsrld        $0x8,%xmm8,%xmm0
   .byte  197,241,114,211,8                   // vpsrld        $0x8,%xmm3,%xmm1
@@ -21387,17 +21176,15 @@
 FUNCTION(_sk_store_bgra_avx)
 _sk_store_bgra_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,218                           // movslq        %edx,%r11
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,60,95,202                       // vmaxps        %ymm2,%ymm8,%ymm9
-  .byte  196,98,125,24,21,245,75,2,0         // vbroadcastss  0x24bf5(%rip),%ymm10        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,21,107,72,2,0         // vbroadcastss  0x2486b(%rip),%ymm10        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,52,93,202                    // vminps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,29,19,76,2,0          // vbroadcastss  0x24c13(%rip),%ymm11        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,98,125,24,29,137,72,2,0         // vbroadcastss  0x24889(%rip),%ymm11        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   .byte  196,65,52,89,203                    // vmulps        %ymm11,%ymm9,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  197,60,95,225                       // vmaxps        %ymm1,%ymm8,%ymm12
@@ -21428,51 +21215,48 @@
   .byte  196,65,29,86,192                    // vorpd         %ymm8,%ymm12,%ymm8
   .byte  196,65,53,86,192                    // vorpd         %ymm8,%ymm9,%ymm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           1603e <_sk_store_bgra_avx+0xe0>
-  .byte  196,1,124,17,4,152                  // vmovups       %ymm8,(%r8,%r11,4)
+  .byte  117,10                              // jne           15bf8 <_sk_store_bgra_avx+0xda>
+  .byte  196,65,124,17,4,144                 // vmovups       %ymm8,(%r8,%rdx,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,7                        // and           $0x7,%r9b
-  .byte  65,254,201                          // dec           %r9b
-  .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,236                             // ja            1603a <_sk_store_bgra_avx+0xdc>
-  .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,83,0,0,0                  // lea           0x53(%rip),%r10        # 160ac <_sk_store_bgra_avx+0x14e>
-  .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
-  .byte  76,1,208                            // add           %r10,%rax
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,7                                // and           $0x7,%al
+  .byte  254,200                             // dec           %al
+  .byte  60,6                                // cmp           $0x6,%al
+  .byte  119,242                             // ja            15bf4 <_sk_store_bgra_avx+0xd6>
+  .byte  15,182,192                          // movzbl        %al,%eax
+  .byte  76,141,13,84,0,0,0                  // lea           0x54(%rip),%r9        # 15c60 <_sk_store_bgra_avx+0x142>
+  .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
+  .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,1,121,126,4,152                 // vmovd         %xmm8,(%r8,%r11,4)
-  .byte  235,208                             // jmp           1603a <_sk_store_bgra_avx+0xdc>
-  .byte  196,3,121,22,68,152,8,2             // vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
-  .byte  196,1,121,214,4,152                 // vmovq         %xmm8,(%r8,%r11,4)
-  .byte  235,192                             // jmp           1603a <_sk_store_bgra_avx+0xdc>
+  .byte  196,65,121,126,4,144                // vmovd         %xmm8,(%r8,%rdx,4)
+  .byte  235,215                             // jmp           15bf4 <_sk_store_bgra_avx+0xd6>
+  .byte  196,67,121,22,68,144,8,2            // vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
+  .byte  196,65,121,214,4,144                // vmovq         %xmm8,(%r8,%rdx,4)
+  .byte  235,199                             // jmp           15bf4 <_sk_store_bgra_avx+0xd6>
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,24,2            // vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,24,2           // vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
-  .byte  196,3,121,22,76,152,20,1            // vpextrd       $0x1,%xmm9,0x14(%r8,%r11,4)
+  .byte  196,67,121,22,76,144,20,1           // vpextrd       $0x1,%xmm9,0x14(%r8,%rdx,4)
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
-  .byte  196,1,122,17,76,152,16              // vmovss        %xmm9,0x10(%r8,%r11,4)
-  .byte  196,1,121,17,4,152                  // vmovupd       %xmm8,(%r8,%r11,4)
-  .byte  235,143                             // jmp           1603a <_sk_store_bgra_avx+0xdc>
-  .byte  144                                 // nop
-  .byte  182,255                             // mov           $0xff,%dh
+  .byte  196,65,122,17,76,144,16             // vmovss        %xmm9,0x10(%r8,%rdx,4)
+  .byte  196,65,121,17,4,144                 // vmovupd       %xmm8,(%r8,%rdx,4)
+  .byte  235,150                             // jmp           15bf4 <_sk_store_bgra_avx+0xd6>
+  .byte  102,144                             // xchg          %ax,%ax
+  .byte  181,255                             // mov           $0xff,%ch
   .byte  255                                 // (bad)
-  .byte  255,198                             // inc           %esi
+  .byte  255,197                             // inc           %ebp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  190,255,255,255,247                 // mov           $0xf7ffffff,%esi
+  .byte  189,255,255,255,246                 // mov           $0xf6ffffff,%ebp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  234                                 // (bad)
+  .byte  233,255,255,255,219                 // jmpq          ffffffffdc015c74 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffdbfdbb78>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  220,255                             // fdivr         %st,%st(7)
-  .byte  255                                 // (bad)
-  .byte  255,206                             // dec           %esi
+  .byte  255,205                             // dec           %ebp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -21483,22 +21267,20 @@
 _sk_load_f16_avx:
   .byte  72,131,236,24                       // sub           $0x18,%rsp
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,3                        // shl           $0x3,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
   .byte  197,252,17,124,36,224               // vmovups       %ymm7,-0x20(%rsp)
   .byte  197,252,17,116,36,192               // vmovups       %ymm6,-0x40(%rsp)
   .byte  197,252,17,108,36,160               // vmovups       %ymm5,-0x60(%rsp)
   .byte  197,252,17,100,36,128               // vmovups       %ymm4,-0x80(%rsp)
-  .byte  15,133,31,2,0,0                     // jne           16323 <_sk_load_f16_avx+0x25b>
-  .byte  196,65,121,16,4,192                 // vmovupd       (%r8,%rax,8),%xmm8
-  .byte  196,193,121,16,84,192,16            // vmovupd       0x10(%r8,%rax,8),%xmm2
-  .byte  196,193,121,16,92,192,32            // vmovupd       0x20(%r8,%rax,8),%xmm3
-  .byte  196,65,122,111,76,192,48            // vmovdqu       0x30(%r8,%rax,8),%xmm9
+  .byte  15,133,31,2,0,0                     // jne           15ed1 <_sk_load_f16_avx+0x255>
+  .byte  196,65,121,16,4,208                 // vmovupd       (%r8,%rdx,8),%xmm8
+  .byte  196,193,121,16,84,208,16            // vmovupd       0x10(%r8,%rdx,8),%xmm2
+  .byte  196,193,121,16,92,208,32            // vmovupd       0x20(%r8,%rdx,8),%xmm3
+  .byte  196,65,122,111,76,208,48            // vmovdqu       0x30(%r8,%rdx,8),%xmm9
   .byte  197,185,97,194                      // vpunpcklwd    %xmm2,%xmm8,%xmm0
   .byte  197,185,105,210                     // vpunpckhwd    %xmm2,%xmm8,%xmm2
   .byte  196,193,97,97,201                   // vpunpcklwd    %xmm9,%xmm3,%xmm1
@@ -21511,14 +21293,14 @@
   .byte  196,226,121,51,200                  // vpmovzxwd     %xmm0,%xmm1
   .byte  197,249,112,192,78                  // vpshufd       $0x4e,%xmm0,%xmm0
   .byte  196,226,121,51,192                  // vpmovzxwd     %xmm0,%xmm0
-  .byte  197,123,18,21,43,92,2,0             // vmovddup      0x25c2b(%rip),%xmm10        # 3bd88 <_sk_srcover_bgra_8888_sse2_lowp+0x14bc>
+  .byte  197,123,18,21,189,88,2,0            // vmovddup      0x258bd(%rip),%xmm10        # 3b5c8 <_sk_srcover_bgra_8888_sse2_lowp+0x14cc>
   .byte  196,193,121,219,218                 // vpand         %xmm10,%xmm0,%xmm3
-  .byte  196,98,121,24,29,149,75,2,0         // vbroadcastss  0x24b95(%rip),%xmm11        # 3ad00 <_sk_srcover_bgra_8888_sse2_lowp+0x434>
+  .byte  196,98,121,24,29,23,72,2,0          // vbroadcastss  0x24817(%rip),%xmm11        # 3a530 <_sk_srcover_bgra_8888_sse2_lowp+0x434>
   .byte  197,33,102,227                      // vpcmpgtd      %xmm3,%xmm11,%xmm12
   .byte  196,193,113,219,210                 // vpand         %xmm10,%xmm1,%xmm2
   .byte  197,33,102,234                      // vpcmpgtd      %xmm2,%xmm11,%xmm13
   .byte  196,195,21,24,252,1                 // vinsertf128   $0x1,%xmm12,%ymm13,%ymm7
-  .byte  197,123,18,37,10,92,2,0             // vmovddup      0x25c0a(%rip),%xmm12        # 3bd90 <_sk_srcover_bgra_8888_sse2_lowp+0x14c4>
+  .byte  197,123,18,37,156,88,2,0            // vmovddup      0x2589c(%rip),%xmm12        # 3b5d0 <_sk_srcover_bgra_8888_sse2_lowp+0x14d4>
   .byte  196,193,113,219,204                 // vpand         %xmm12,%xmm1,%xmm1
   .byte  197,241,114,241,16                  // vpslld        $0x10,%xmm1,%xmm1
   .byte  196,193,121,219,196                 // vpand         %xmm12,%xmm0,%xmm0
@@ -21527,7 +21309,7 @@
   .byte  197,241,235,202                     // vpor          %xmm2,%xmm1,%xmm1
   .byte  197,233,114,243,13                  // vpslld        $0xd,%xmm3,%xmm2
   .byte  197,249,235,194                     // vpor          %xmm2,%xmm0,%xmm0
-  .byte  196,226,121,24,29,79,75,2,0         // vbroadcastss  0x24b4f(%rip),%xmm3        # 3ad04 <_sk_srcover_bgra_8888_sse2_lowp+0x438>
+  .byte  196,226,121,24,29,209,71,2,0        // vbroadcastss  0x247d1(%rip),%xmm3        # 3a534 <_sk_srcover_bgra_8888_sse2_lowp+0x438>
   .byte  197,249,254,195                     // vpaddd        %xmm3,%xmm0,%xmm0
   .byte  197,241,254,203                     // vpaddd        %xmm3,%xmm1,%xmm1
   .byte  196,227,117,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
@@ -21603,32 +21385,32 @@
   .byte  197,252,16,124,36,224               // vmovups       -0x20(%rsp),%ymm7
   .byte  72,131,196,24                       // add           $0x18,%rsp
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,65,123,16,4,192                 // vmovsd        (%r8,%rax,8),%xmm8
+  .byte  196,65,123,16,4,208                 // vmovsd        (%r8,%rdx,8),%xmm8
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,85                              // je            16389 <_sk_load_f16_avx+0x2c1>
-  .byte  196,65,57,22,68,192,8               // vmovhpd       0x8(%r8,%rax,8),%xmm8,%xmm8
+  .byte  116,85                              // je            15f37 <_sk_load_f16_avx+0x2bb>
+  .byte  196,65,57,22,68,208,8               // vmovhpd       0x8(%r8,%rdx,8),%xmm8,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,72                              // jb            16389 <_sk_load_f16_avx+0x2c1>
-  .byte  196,193,123,16,84,192,16            // vmovsd        0x10(%r8,%rax,8),%xmm2
+  .byte  114,72                              // jb            15f37 <_sk_load_f16_avx+0x2bb>
+  .byte  196,193,123,16,84,208,16            // vmovsd        0x10(%r8,%rdx,8),%xmm2
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  116,72                              // je            16396 <_sk_load_f16_avx+0x2ce>
-  .byte  196,193,105,22,84,192,24            // vmovhpd       0x18(%r8,%rax,8),%xmm2,%xmm2
+  .byte  116,72                              // je            15f44 <_sk_load_f16_avx+0x2c8>
+  .byte  196,193,105,22,84,208,24            // vmovhpd       0x18(%r8,%rdx,8),%xmm2,%xmm2
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,59                              // jb            16396 <_sk_load_f16_avx+0x2ce>
-  .byte  196,193,123,16,92,192,32            // vmovsd        0x20(%r8,%rax,8),%xmm3
+  .byte  114,59                              // jb            15f44 <_sk_load_f16_avx+0x2c8>
+  .byte  196,193,123,16,92,208,32            // vmovsd        0x20(%r8,%rdx,8),%xmm3
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  15,132,179,253,255,255              // je            1611f <_sk_load_f16_avx+0x57>
-  .byte  196,193,97,22,92,192,40             // vmovhpd       0x28(%r8,%rax,8),%xmm3,%xmm3
+  .byte  15,132,179,253,255,255              // je            15ccd <_sk_load_f16_avx+0x51>
+  .byte  196,193,97,22,92,208,40             // vmovhpd       0x28(%r8,%rdx,8),%xmm3,%xmm3
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,130,162,253,255,255              // jb            1611f <_sk_load_f16_avx+0x57>
-  .byte  196,65,122,126,76,192,48            // vmovq         0x30(%r8,%rax,8),%xmm9
-  .byte  233,150,253,255,255                 // jmpq          1611f <_sk_load_f16_avx+0x57>
+  .byte  15,130,162,253,255,255              // jb            15ccd <_sk_load_f16_avx+0x51>
+  .byte  196,65,122,126,76,208,48            // vmovq         0x30(%r8,%rdx,8),%xmm9
+  .byte  233,150,253,255,255                 // jmpq          15ccd <_sk_load_f16_avx+0x51>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
   .byte  197,233,87,210                      // vxorpd        %xmm2,%xmm2,%xmm2
-  .byte  233,137,253,255,255                 // jmpq          1611f <_sk_load_f16_avx+0x57>
+  .byte  233,137,253,255,255                 // jmpq          15ccd <_sk_load_f16_avx+0x51>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
-  .byte  233,128,253,255,255                 // jmpq          1611f <_sk_load_f16_avx+0x57>
+  .byte  233,128,253,255,255                 // jmpq          15ccd <_sk_load_f16_avx+0x51>
 
 HIDDEN _sk_load_f16_dst_avx
 .globl _sk_load_f16_dst_avx
@@ -21636,22 +21418,20 @@
 _sk_load_f16_dst_avx:
   .byte  72,131,236,24                       // sub           $0x18,%rsp
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,3                        // shl           $0x3,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
   .byte  197,252,17,92,36,224                // vmovups       %ymm3,-0x20(%rsp)
   .byte  197,252,17,84,36,192                // vmovups       %ymm2,-0x40(%rsp)
   .byte  197,252,17,76,36,160                // vmovups       %ymm1,-0x60(%rsp)
   .byte  197,252,17,68,36,128                // vmovups       %ymm0,-0x80(%rsp)
-  .byte  15,133,31,2,0,0                     // jne           165fa <_sk_load_f16_dst_avx+0x25b>
-  .byte  196,65,121,16,4,192                 // vmovupd       (%r8,%rax,8),%xmm8
-  .byte  196,193,121,16,116,192,16           // vmovupd       0x10(%r8,%rax,8),%xmm6
-  .byte  196,193,121,16,124,192,32           // vmovupd       0x20(%r8,%rax,8),%xmm7
-  .byte  196,65,122,111,76,192,48            // vmovdqu       0x30(%r8,%rax,8),%xmm9
+  .byte  15,133,31,2,0,0                     // jne           161a2 <_sk_load_f16_dst_avx+0x255>
+  .byte  196,65,121,16,4,208                 // vmovupd       (%r8,%rdx,8),%xmm8
+  .byte  196,193,121,16,116,208,16           // vmovupd       0x10(%r8,%rdx,8),%xmm6
+  .byte  196,193,121,16,124,208,32           // vmovupd       0x20(%r8,%rdx,8),%xmm7
+  .byte  196,65,122,111,76,208,48            // vmovdqu       0x30(%r8,%rdx,8),%xmm9
   .byte  197,185,97,230                      // vpunpcklwd    %xmm6,%xmm8,%xmm4
   .byte  197,185,105,246                     // vpunpckhwd    %xmm6,%xmm8,%xmm6
   .byte  196,193,65,97,233                   // vpunpcklwd    %xmm9,%xmm7,%xmm5
@@ -21664,14 +21444,14 @@
   .byte  196,226,121,51,236                  // vpmovzxwd     %xmm4,%xmm5
   .byte  197,249,112,228,78                  // vpshufd       $0x4e,%xmm4,%xmm4
   .byte  196,226,121,51,228                  // vpmovzxwd     %xmm4,%xmm4
-  .byte  197,123,18,21,84,89,2,0             // vmovddup      0x25954(%rip),%xmm10        # 3bd88 <_sk_srcover_bgra_8888_sse2_lowp+0x14bc>
+  .byte  197,123,18,21,236,85,2,0            // vmovddup      0x255ec(%rip),%xmm10        # 3b5c8 <_sk_srcover_bgra_8888_sse2_lowp+0x14cc>
   .byte  196,193,89,219,250                  // vpand         %xmm10,%xmm4,%xmm7
-  .byte  196,98,121,24,29,190,72,2,0         // vbroadcastss  0x248be(%rip),%xmm11        # 3ad00 <_sk_srcover_bgra_8888_sse2_lowp+0x434>
+  .byte  196,98,121,24,29,70,69,2,0          // vbroadcastss  0x24546(%rip),%xmm11        # 3a530 <_sk_srcover_bgra_8888_sse2_lowp+0x434>
   .byte  197,33,102,231                      // vpcmpgtd      %xmm7,%xmm11,%xmm12
   .byte  196,193,81,219,242                  // vpand         %xmm10,%xmm5,%xmm6
   .byte  197,33,102,238                      // vpcmpgtd      %xmm6,%xmm11,%xmm13
   .byte  196,195,21,24,220,1                 // vinsertf128   $0x1,%xmm12,%ymm13,%ymm3
-  .byte  197,123,18,37,51,89,2,0             // vmovddup      0x25933(%rip),%xmm12        # 3bd90 <_sk_srcover_bgra_8888_sse2_lowp+0x14c4>
+  .byte  197,123,18,37,203,85,2,0            // vmovddup      0x255cb(%rip),%xmm12        # 3b5d0 <_sk_srcover_bgra_8888_sse2_lowp+0x14d4>
   .byte  196,193,81,219,236                  // vpand         %xmm12,%xmm5,%xmm5
   .byte  197,209,114,245,16                  // vpslld        $0x10,%xmm5,%xmm5
   .byte  196,193,89,219,228                  // vpand         %xmm12,%xmm4,%xmm4
@@ -21680,7 +21460,7 @@
   .byte  197,209,235,238                     // vpor          %xmm6,%xmm5,%xmm5
   .byte  197,201,114,247,13                  // vpslld        $0xd,%xmm7,%xmm6
   .byte  197,217,235,230                     // vpor          %xmm6,%xmm4,%xmm4
-  .byte  196,226,121,24,61,120,72,2,0        // vbroadcastss  0x24878(%rip),%xmm7        # 3ad04 <_sk_srcover_bgra_8888_sse2_lowp+0x438>
+  .byte  196,226,121,24,61,0,69,2,0          // vbroadcastss  0x24500(%rip),%xmm7        # 3a534 <_sk_srcover_bgra_8888_sse2_lowp+0x438>
   .byte  197,217,254,231                     // vpaddd        %xmm7,%xmm4,%xmm4
   .byte  197,209,254,239                     // vpaddd        %xmm7,%xmm5,%xmm5
   .byte  196,227,85,24,228,1                 // vinsertf128   $0x1,%xmm4,%ymm5,%ymm4
@@ -21756,32 +21536,32 @@
   .byte  197,252,16,92,36,224                // vmovups       -0x20(%rsp),%ymm3
   .byte  72,131,196,24                       // add           $0x18,%rsp
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,65,123,16,4,192                 // vmovsd        (%r8,%rax,8),%xmm8
+  .byte  196,65,123,16,4,208                 // vmovsd        (%r8,%rdx,8),%xmm8
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,85                              // je            16660 <_sk_load_f16_dst_avx+0x2c1>
-  .byte  196,65,57,22,68,192,8               // vmovhpd       0x8(%r8,%rax,8),%xmm8,%xmm8
+  .byte  116,85                              // je            16208 <_sk_load_f16_dst_avx+0x2bb>
+  .byte  196,65,57,22,68,208,8               // vmovhpd       0x8(%r8,%rdx,8),%xmm8,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,72                              // jb            16660 <_sk_load_f16_dst_avx+0x2c1>
-  .byte  196,193,123,16,116,192,16           // vmovsd        0x10(%r8,%rax,8),%xmm6
+  .byte  114,72                              // jb            16208 <_sk_load_f16_dst_avx+0x2bb>
+  .byte  196,193,123,16,116,208,16           // vmovsd        0x10(%r8,%rdx,8),%xmm6
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  116,72                              // je            1666d <_sk_load_f16_dst_avx+0x2ce>
-  .byte  196,193,73,22,116,192,24            // vmovhpd       0x18(%r8,%rax,8),%xmm6,%xmm6
+  .byte  116,72                              // je            16215 <_sk_load_f16_dst_avx+0x2c8>
+  .byte  196,193,73,22,116,208,24            // vmovhpd       0x18(%r8,%rdx,8),%xmm6,%xmm6
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,59                              // jb            1666d <_sk_load_f16_dst_avx+0x2ce>
-  .byte  196,193,123,16,124,192,32           // vmovsd        0x20(%r8,%rax,8),%xmm7
+  .byte  114,59                              // jb            16215 <_sk_load_f16_dst_avx+0x2c8>
+  .byte  196,193,123,16,124,208,32           // vmovsd        0x20(%r8,%rdx,8),%xmm7
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  15,132,179,253,255,255              // je            163f6 <_sk_load_f16_dst_avx+0x57>
-  .byte  196,193,65,22,124,192,40            // vmovhpd       0x28(%r8,%rax,8),%xmm7,%xmm7
+  .byte  15,132,179,253,255,255              // je            15f9e <_sk_load_f16_dst_avx+0x51>
+  .byte  196,193,65,22,124,208,40            // vmovhpd       0x28(%r8,%rdx,8),%xmm7,%xmm7
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,130,162,253,255,255              // jb            163f6 <_sk_load_f16_dst_avx+0x57>
-  .byte  196,65,122,126,76,192,48            // vmovq         0x30(%r8,%rax,8),%xmm9
-  .byte  233,150,253,255,255                 // jmpq          163f6 <_sk_load_f16_dst_avx+0x57>
+  .byte  15,130,162,253,255,255              // jb            15f9e <_sk_load_f16_dst_avx+0x51>
+  .byte  196,65,122,126,76,208,48            // vmovq         0x30(%r8,%rdx,8),%xmm9
+  .byte  233,150,253,255,255                 // jmpq          15f9e <_sk_load_f16_dst_avx+0x51>
   .byte  197,193,87,255                      // vxorpd        %xmm7,%xmm7,%xmm7
   .byte  197,201,87,246                      // vxorpd        %xmm6,%xmm6,%xmm6
-  .byte  233,137,253,255,255                 // jmpq          163f6 <_sk_load_f16_dst_avx+0x57>
+  .byte  233,137,253,255,255                 // jmpq          15f9e <_sk_load_f16_dst_avx+0x51>
   .byte  197,193,87,255                      // vxorpd        %xmm7,%xmm7,%xmm7
-  .byte  233,128,253,255,255                 // jmpq          163f6 <_sk_load_f16_dst_avx+0x57>
+  .byte  233,128,253,255,255                 // jmpq          15f9e <_sk_load_f16_dst_avx+0x51>
 
 HIDDEN _sk_gather_f16_avx
 .globl _sk_gather_f16_avx
@@ -21860,14 +21640,14 @@
   .byte  196,226,121,51,208                  // vpmovzxwd     %xmm0,%xmm2
   .byte  197,249,112,192,78                  // vpshufd       $0x4e,%xmm0,%xmm0
   .byte  196,226,121,51,192                  // vpmovzxwd     %xmm0,%xmm0
-  .byte  197,123,18,29,186,85,2,0            // vmovddup      0x255ba(%rip),%xmm11        # 3bd88 <_sk_srcover_bgra_8888_sse2_lowp+0x14bc>
+  .byte  197,123,18,29,82,82,2,0             // vmovddup      0x25252(%rip),%xmm11        # 3b5c8 <_sk_srcover_bgra_8888_sse2_lowp+0x14cc>
   .byte  196,193,121,219,219                 // vpand         %xmm11,%xmm0,%xmm3
-  .byte  196,98,121,24,37,36,69,2,0          // vbroadcastss  0x24524(%rip),%xmm12        # 3ad00 <_sk_srcover_bgra_8888_sse2_lowp+0x434>
+  .byte  196,98,121,24,37,172,65,2,0         // vbroadcastss  0x241ac(%rip),%xmm12        # 3a530 <_sk_srcover_bgra_8888_sse2_lowp+0x434>
   .byte  197,25,102,235                      // vpcmpgtd      %xmm3,%xmm12,%xmm13
   .byte  196,193,105,219,203                 // vpand         %xmm11,%xmm2,%xmm1
   .byte  197,25,102,193                      // vpcmpgtd      %xmm1,%xmm12,%xmm8
   .byte  196,67,61,24,197,1                  // vinsertf128   $0x1,%xmm13,%ymm8,%ymm8
-  .byte  197,123,18,45,153,85,2,0            // vmovddup      0x25599(%rip),%xmm13        # 3bd90 <_sk_srcover_bgra_8888_sse2_lowp+0x14c4>
+  .byte  197,123,18,45,49,82,2,0             // vmovddup      0x25231(%rip),%xmm13        # 3b5d0 <_sk_srcover_bgra_8888_sse2_lowp+0x14d4>
   .byte  196,193,105,219,213                 // vpand         %xmm13,%xmm2,%xmm2
   .byte  197,233,114,242,16                  // vpslld        $0x10,%xmm2,%xmm2
   .byte  197,241,114,241,13                  // vpslld        $0xd,%xmm1,%xmm1
@@ -21876,7 +21656,7 @@
   .byte  197,249,114,240,16                  // vpslld        $0x10,%xmm0,%xmm0
   .byte  197,233,114,243,13                  // vpslld        $0xd,%xmm3,%xmm2
   .byte  197,249,235,194                     // vpor          %xmm2,%xmm0,%xmm0
-  .byte  196,226,121,24,29,222,68,2,0        // vbroadcastss  0x244de(%rip),%xmm3        # 3ad04 <_sk_srcover_bgra_8888_sse2_lowp+0x438>
+  .byte  196,226,121,24,29,102,65,2,0        // vbroadcastss  0x24166(%rip),%xmm3        # 3a534 <_sk_srcover_bgra_8888_sse2_lowp+0x438>
   .byte  197,249,254,195                     // vpaddd        %xmm3,%xmm0,%xmm0
   .byte  197,241,254,203                     // vpaddd        %xmm3,%xmm1,%xmm1
   .byte  196,227,117,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
@@ -21966,12 +21746,12 @@
   .byte  197,252,17,108,36,192               // vmovups       %ymm5,-0x40(%rsp)
   .byte  197,252,17,100,36,160               // vmovups       %ymm4,-0x60(%rsp)
   .byte  197,252,40,225                      // vmovaps       %ymm1,%ymm4
-  .byte  196,98,125,24,5,252,66,2,0          // vbroadcastss  0x242fc(%rip),%ymm8        # 3acbc <_sk_srcover_bgra_8888_sse2_lowp+0x3f0>
+  .byte  196,98,125,24,5,132,63,2,0          // vbroadcastss  0x23f84(%rip),%ymm8        # 3a4ec <_sk_srcover_bgra_8888_sse2_lowp+0x3f0>
   .byte  196,65,124,84,216                   // vandps        %ymm8,%ymm0,%ymm11
-  .byte  196,98,125,24,21,58,67,2,0          // vbroadcastss  0x2433a(%rip),%ymm10        # 3ad08 <_sk_srcover_bgra_8888_sse2_lowp+0x43c>
+  .byte  196,98,125,24,21,194,63,2,0         // vbroadcastss  0x23fc2(%rip),%ymm10        # 3a538 <_sk_srcover_bgra_8888_sse2_lowp+0x43c>
   .byte  196,65,124,84,226                   // vandps        %ymm10,%ymm0,%ymm12
   .byte  196,67,125,25,229,1                 // vextractf128  $0x1,%ymm12,%xmm13
-  .byte  196,98,121,24,13,42,67,2,0          // vbroadcastss  0x2432a(%rip),%xmm9        # 3ad0c <_sk_srcover_bgra_8888_sse2_lowp+0x440>
+  .byte  196,98,121,24,13,178,63,2,0         // vbroadcastss  0x23fb2(%rip),%xmm9        # 3a53c <_sk_srcover_bgra_8888_sse2_lowp+0x440>
   .byte  196,65,49,102,245                   // vpcmpgtd      %xmm13,%xmm9,%xmm14
   .byte  196,65,49,102,252                   // vpcmpgtd      %xmm12,%xmm9,%xmm15
   .byte  196,67,5,24,246,1                   // vinsertf128   $0x1,%xmm14,%ymm15,%ymm14
@@ -21982,7 +21762,7 @@
   .byte  196,65,17,254,239                   // vpaddd        %xmm15,%xmm13,%xmm13
   .byte  196,193,25,114,212,13               // vpsrld        $0xd,%xmm12,%xmm12
   .byte  196,65,25,254,227                   // vpaddd        %xmm11,%xmm12,%xmm12
-  .byte  196,98,121,24,29,237,66,2,0         // vbroadcastss  0x242ed(%rip),%xmm11        # 3ad10 <_sk_srcover_bgra_8888_sse2_lowp+0x444>
+  .byte  196,98,121,24,29,117,63,2,0         // vbroadcastss  0x23f75(%rip),%xmm11        # 3a540 <_sk_srcover_bgra_8888_sse2_lowp+0x444>
   .byte  196,65,17,254,235                   // vpaddd        %xmm11,%xmm13,%xmm13
   .byte  196,65,25,254,227                   // vpaddd        %xmm11,%xmm12,%xmm12
   .byte  196,67,29,24,237,1                  // vinsertf128   $0x1,%xmm13,%ymm12,%ymm13
@@ -22058,18 +21838,16 @@
   .byte  197,105,98,201                      // vpunpckldq    %xmm1,%xmm2,%xmm9
   .byte  197,105,106,193                     // vpunpckhdq    %xmm1,%xmm2,%xmm8
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,3                        // shl           $0x3,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,68                              // jne           16bfa <_sk_store_f16_avx+0x262>
-  .byte  196,65,122,127,28,192               // vmovdqu       %xmm11,(%r8,%rax,8)
-  .byte  196,65,122,127,84,192,16            // vmovdqu       %xmm10,0x10(%r8,%rax,8)
-  .byte  196,65,122,127,76,192,32            // vmovdqu       %xmm9,0x20(%r8,%rax,8)
-  .byte  196,65,122,127,68,192,48            // vmovdqu       %xmm8,0x30(%r8,%rax,8)
+  .byte  117,68                              // jne           1679c <_sk_store_f16_avx+0x25c>
+  .byte  196,65,122,127,28,208               // vmovdqu       %xmm11,(%r8,%rdx,8)
+  .byte  196,65,122,127,84,208,16            // vmovdqu       %xmm10,0x10(%r8,%rdx,8)
+  .byte  196,65,122,127,76,208,32            // vmovdqu       %xmm9,0x20(%r8,%rdx,8)
+  .byte  196,65,122,127,68,208,48            // vmovdqu       %xmm8,0x30(%r8,%rdx,8)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,16,76,36,128                // vmovups       -0x80(%rsp),%ymm1
   .byte  197,124,41,250                      // vmovaps       %ymm15,%ymm2
@@ -22079,43 +21857,41 @@
   .byte  197,252,16,60,36                    // vmovups       (%rsp),%ymm7
   .byte  72,131,196,56                       // add           $0x38,%rsp
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,65,121,214,28,192               // vmovq         %xmm11,(%r8,%rax,8)
+  .byte  196,65,121,214,28,208               // vmovq         %xmm11,(%r8,%rdx,8)
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,203                             // je            16bd1 <_sk_store_f16_avx+0x239>
-  .byte  196,65,121,23,92,192,8              // vmovhpd       %xmm11,0x8(%r8,%rax,8)
+  .byte  116,203                             // je            16773 <_sk_store_f16_avx+0x233>
+  .byte  196,65,121,23,92,208,8              // vmovhpd       %xmm11,0x8(%r8,%rdx,8)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,190                             // jb            16bd1 <_sk_store_f16_avx+0x239>
-  .byte  196,65,121,214,84,192,16            // vmovq         %xmm10,0x10(%r8,%rax,8)
-  .byte  116,181                             // je            16bd1 <_sk_store_f16_avx+0x239>
-  .byte  196,65,121,23,84,192,24             // vmovhpd       %xmm10,0x18(%r8,%rax,8)
+  .byte  114,190                             // jb            16773 <_sk_store_f16_avx+0x233>
+  .byte  196,65,121,214,84,208,16            // vmovq         %xmm10,0x10(%r8,%rdx,8)
+  .byte  116,181                             // je            16773 <_sk_store_f16_avx+0x233>
+  .byte  196,65,121,23,84,208,24             // vmovhpd       %xmm10,0x18(%r8,%rdx,8)
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,168                             // jb            16bd1 <_sk_store_f16_avx+0x239>
-  .byte  196,65,121,214,76,192,32            // vmovq         %xmm9,0x20(%r8,%rax,8)
-  .byte  116,159                             // je            16bd1 <_sk_store_f16_avx+0x239>
-  .byte  196,65,121,23,76,192,40             // vmovhpd       %xmm9,0x28(%r8,%rax,8)
+  .byte  114,168                             // jb            16773 <_sk_store_f16_avx+0x233>
+  .byte  196,65,121,214,76,208,32            // vmovq         %xmm9,0x20(%r8,%rdx,8)
+  .byte  116,159                             // je            16773 <_sk_store_f16_avx+0x233>
+  .byte  196,65,121,23,76,208,40             // vmovhpd       %xmm9,0x28(%r8,%rdx,8)
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,146                             // jb            16bd1 <_sk_store_f16_avx+0x239>
-  .byte  196,65,121,214,68,192,48            // vmovq         %xmm8,0x30(%r8,%rax,8)
-  .byte  235,137                             // jmp           16bd1 <_sk_store_f16_avx+0x239>
+  .byte  114,146                             // jb            16773 <_sk_store_f16_avx+0x233>
+  .byte  196,65,121,214,68,208,48            // vmovq         %xmm8,0x30(%r8,%rdx,8)
+  .byte  235,137                             // jmp           16773 <_sk_store_f16_avx+0x233>
 
 HIDDEN _sk_load_u16_be_avx
 .globl _sk_load_u16_be_avx
 FUNCTION(_sk_load_u16_be_avx)
 _sk_load_u16_be_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
-  .byte  77,1,192                            // add           %r8,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  73,99,193                           // movslq        %r9d,%rax
+  .byte  76,141,4,149,0,0,0,0                // lea           0x0(,%rdx,4),%r8
+  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  77,1,201                            // add           %r9,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,12,1,0,0                     // jne           16d7b <_sk_load_u16_be_avx+0x133>
-  .byte  196,65,121,16,4,64                  // vmovupd       (%r8,%rax,2),%xmm8
-  .byte  196,193,121,16,84,64,16             // vmovupd       0x10(%r8,%rax,2),%xmm2
-  .byte  196,193,121,16,92,64,32             // vmovupd       0x20(%r8,%rax,2),%xmm3
-  .byte  196,65,122,111,76,64,48             // vmovdqu       0x30(%r8,%rax,2),%xmm9
+  .byte  15,133,12,1,0,0                     // jne           16917 <_sk_load_u16_be_avx+0x12d>
+  .byte  196,1,121,16,4,65                   // vmovupd       (%r9,%r8,2),%xmm8
+  .byte  196,129,121,16,84,65,16             // vmovupd       0x10(%r9,%r8,2),%xmm2
+  .byte  196,129,121,16,92,65,32             // vmovupd       0x20(%r9,%r8,2),%xmm3
+  .byte  196,1,122,111,76,65,48              // vmovdqu       0x30(%r9,%r8,2),%xmm9
   .byte  197,185,97,194                      // vpunpcklwd    %xmm2,%xmm8,%xmm0
   .byte  197,185,105,210                     // vpunpckhwd    %xmm2,%xmm8,%xmm2
   .byte  196,193,97,97,201                   // vpunpcklwd    %xmm9,%xmm3,%xmm1
@@ -22133,7 +21909,7 @@
   .byte  196,226,121,51,192                  // vpmovzxwd     %xmm0,%xmm0
   .byte  196,227,117,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,13,48,63,2,0          // vbroadcastss  0x23f30(%rip),%ymm9        # 3ac10 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
+  .byte  196,98,125,24,13,196,59,2,0         // vbroadcastss  0x23bc4(%rip),%ymm9        # 3a440 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
   .byte  196,193,124,89,193                  // vmulps        %ymm9,%ymm0,%ymm0
   .byte  197,169,109,202                     // vpunpckhqdq   %xmm2,%xmm10,%xmm1
   .byte  197,233,113,241,8                   // vpsllw        $0x8,%xmm1,%xmm2
@@ -22167,53 +21943,49 @@
   .byte  196,193,100,89,217                  // vmulps        %ymm9,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,65,123,16,4,64                  // vmovsd        (%r8,%rax,2),%xmm8
+  .byte  196,1,123,16,4,65                   // vmovsd        (%r9,%r8,2),%xmm8
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,85                              // je            16de1 <_sk_load_u16_be_avx+0x199>
-  .byte  196,65,57,22,68,64,8                // vmovhpd       0x8(%r8,%rax,2),%xmm8,%xmm8
+  .byte  116,85                              // je            1697d <_sk_load_u16_be_avx+0x193>
+  .byte  196,1,57,22,68,65,8                 // vmovhpd       0x8(%r9,%r8,2),%xmm8,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,72                              // jb            16de1 <_sk_load_u16_be_avx+0x199>
-  .byte  196,193,123,16,84,64,16             // vmovsd        0x10(%r8,%rax,2),%xmm2
+  .byte  114,72                              // jb            1697d <_sk_load_u16_be_avx+0x193>
+  .byte  196,129,123,16,84,65,16             // vmovsd        0x10(%r9,%r8,2),%xmm2
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  116,72                              // je            16dee <_sk_load_u16_be_avx+0x1a6>
-  .byte  196,193,105,22,84,64,24             // vmovhpd       0x18(%r8,%rax,2),%xmm2,%xmm2
+  .byte  116,72                              // je            1698a <_sk_load_u16_be_avx+0x1a0>
+  .byte  196,129,105,22,84,65,24             // vmovhpd       0x18(%r9,%r8,2),%xmm2,%xmm2
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,59                              // jb            16dee <_sk_load_u16_be_avx+0x1a6>
-  .byte  196,193,123,16,92,64,32             // vmovsd        0x20(%r8,%rax,2),%xmm3
+  .byte  114,59                              // jb            1698a <_sk_load_u16_be_avx+0x1a0>
+  .byte  196,129,123,16,92,65,32             // vmovsd        0x20(%r9,%r8,2),%xmm3
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  15,132,198,254,255,255              // je            16c8a <_sk_load_u16_be_avx+0x42>
-  .byte  196,193,97,22,92,64,40              // vmovhpd       0x28(%r8,%rax,2),%xmm3,%xmm3
+  .byte  15,132,198,254,255,255              // je            16826 <_sk_load_u16_be_avx+0x3c>
+  .byte  196,129,97,22,92,65,40              // vmovhpd       0x28(%r9,%r8,2),%xmm3,%xmm3
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,130,181,254,255,255              // jb            16c8a <_sk_load_u16_be_avx+0x42>
-  .byte  196,65,122,126,76,64,48             // vmovq         0x30(%r8,%rax,2),%xmm9
-  .byte  233,169,254,255,255                 // jmpq          16c8a <_sk_load_u16_be_avx+0x42>
+  .byte  15,130,181,254,255,255              // jb            16826 <_sk_load_u16_be_avx+0x3c>
+  .byte  196,1,122,126,76,65,48              // vmovq         0x30(%r9,%r8,2),%xmm9
+  .byte  233,169,254,255,255                 // jmpq          16826 <_sk_load_u16_be_avx+0x3c>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
   .byte  197,233,87,210                      // vxorpd        %xmm2,%xmm2,%xmm2
-  .byte  233,156,254,255,255                 // jmpq          16c8a <_sk_load_u16_be_avx+0x42>
+  .byte  233,156,254,255,255                 // jmpq          16826 <_sk_load_u16_be_avx+0x3c>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
-  .byte  233,147,254,255,255                 // jmpq          16c8a <_sk_load_u16_be_avx+0x42>
+  .byte  233,147,254,255,255                 // jmpq          16826 <_sk_load_u16_be_avx+0x3c>
 
 HIDDEN _sk_load_rgb_u16_be_avx
 .globl _sk_load_rgb_u16_be_avx
 FUNCTION(_sk_load_rgb_u16_be_avx)
 _sk_load_rgb_u16_be_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  76,141,4,82                         // lea           (%rdx,%rdx,2),%r8
   .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
-  .byte  77,1,192                            // add           %r8,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,137,208                          // mov           %rdx,%rax
-  .byte  72,193,224,32                       // shl           $0x20,%rax
-  .byte  72,141,4,64                         // lea           (%rax,%rax,2),%rax
-  .byte  72,193,248,32                       // sar           $0x20,%rax
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  77,1,201                            // add           %r9,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,253,0,0,0                    // jne           16f1f <_sk_load_rgb_u16_be_avx+0x128>
-  .byte  196,65,122,111,28,64                // vmovdqu       (%r8,%rax,2),%xmm11
-  .byte  196,193,122,111,92,64,12            // vmovdqu       0xc(%r8,%rax,2),%xmm3
-  .byte  196,193,122,111,84,64,24            // vmovdqu       0x18(%r8,%rax,2),%xmm2
-  .byte  196,193,122,111,68,64,32            // vmovdqu       0x20(%r8,%rax,2),%xmm0
+  .byte  15,133,253,0,0,0                    // jne           16aad <_sk_load_rgb_u16_be_avx+0x11a>
+  .byte  196,1,122,111,28,65                 // vmovdqu       (%r9,%r8,2),%xmm11
+  .byte  196,129,122,111,92,65,12            // vmovdqu       0xc(%r9,%r8,2),%xmm3
+  .byte  196,129,122,111,84,65,24            // vmovdqu       0x18(%r9,%r8,2),%xmm2
+  .byte  196,129,122,111,68,65,32            // vmovdqu       0x20(%r9,%r8,2),%xmm0
   .byte  197,249,115,216,4                   // vpsrldq       $0x4,%xmm0,%xmm0
   .byte  196,193,57,115,219,6                // vpsrldq       $0x6,%xmm11,%xmm8
   .byte  197,169,115,219,6                   // vpsrldq       $0x6,%xmm3,%xmm10
@@ -22237,7 +22009,7 @@
   .byte  196,226,121,51,192                  // vpmovzxwd     %xmm0,%xmm0
   .byte  196,227,117,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,13,95,61,2,0          // vbroadcastss  0x23d5f(%rip),%ymm9        # 3ac10 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
+  .byte  196,98,125,24,13,1,58,2,0           // vbroadcastss  0x23a01(%rip),%ymm9        # 3a440 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
   .byte  196,193,124,89,193                  // vmulps        %ymm9,%ymm0,%ymm0
   .byte  197,185,109,203                     // vpunpckhqdq   %xmm3,%xmm8,%xmm1
   .byte  197,225,113,241,8                   // vpsllw        $0x8,%xmm1,%xmm3
@@ -22259,87 +22031,85 @@
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
   .byte  196,193,108,89,209                  // vmulps        %ymm9,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,95,60,2,0         // vbroadcastss  0x23c5f(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,1,57,2,0          // vbroadcastss  0x23901(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,193,121,110,4,64                // vmovd         (%r8,%rax,2),%xmm0
+  .byte  196,129,121,110,4,65                // vmovd         (%r9,%r8,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
-  .byte  196,65,121,196,92,64,4,2            // vpinsrw       $0x2,0x4(%r8,%rax,2),%xmm0,%xmm11
+  .byte  196,1,121,196,92,65,4,2             // vpinsrw       $0x2,0x4(%r9,%r8,2),%xmm0,%xmm11
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,31                              // jne           16f57 <_sk_load_rgb_u16_be_avx+0x160>
+  .byte  117,31                              // jne           16ae5 <_sk_load_rgb_u16_be_avx+0x152>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
   .byte  197,225,239,219                     // vpxor         %xmm3,%xmm3,%xmm3
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  233,0,255,255,255                   // jmpq          16e57 <_sk_load_rgb_u16_be_avx+0x60>
-  .byte  196,193,121,110,68,64,6             // vmovd         0x6(%r8,%rax,2),%xmm0
+  .byte  233,0,255,255,255                   // jmpq          169e5 <_sk_load_rgb_u16_be_avx+0x52>
+  .byte  196,129,121,110,68,65,6             // vmovd         0x6(%r9,%r8,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
-  .byte  196,65,121,196,68,64,10,2           // vpinsrw       $0x2,0xa(%r8,%rax,2),%xmm0,%xmm8
+  .byte  196,1,121,196,68,65,10,2            // vpinsrw       $0x2,0xa(%r9,%r8,2),%xmm0,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,48                              // jb            16fa1 <_sk_load_rgb_u16_be_avx+0x1aa>
-  .byte  196,193,121,110,68,64,12            // vmovd         0xc(%r8,%rax,2),%xmm0
+  .byte  114,48                              // jb            16b2f <_sk_load_rgb_u16_be_avx+0x19c>
+  .byte  196,129,121,110,68,65,12            // vmovd         0xc(%r9,%r8,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
-  .byte  196,193,121,196,92,64,16,2          // vpinsrw       $0x2,0x10(%r8,%rax,2),%xmm0,%xmm3
+  .byte  196,129,121,196,92,65,16,2          // vpinsrw       $0x2,0x10(%r9,%r8,2),%xmm0,%xmm3
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  117,48                              // jne           16fbb <_sk_load_rgb_u16_be_avx+0x1c4>
+  .byte  117,48                              // jne           16b49 <_sk_load_rgb_u16_be_avx+0x1b6>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
-  .byte  233,182,254,255,255                 // jmpq          16e57 <_sk_load_rgb_u16_be_avx+0x60>
+  .byte  233,182,254,255,255                 // jmpq          169e5 <_sk_load_rgb_u16_be_avx+0x52>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
   .byte  197,225,239,219                     // vpxor         %xmm3,%xmm3,%xmm3
-  .byte  233,156,254,255,255                 // jmpq          16e57 <_sk_load_rgb_u16_be_avx+0x60>
-  .byte  196,193,121,110,68,64,18            // vmovd         0x12(%r8,%rax,2),%xmm0
+  .byte  233,156,254,255,255                 // jmpq          169e5 <_sk_load_rgb_u16_be_avx+0x52>
+  .byte  196,129,121,110,68,65,18            // vmovd         0x12(%r9,%r8,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
-  .byte  196,65,121,196,84,64,22,2           // vpinsrw       $0x2,0x16(%r8,%rax,2),%xmm0,%xmm10
+  .byte  196,1,121,196,84,65,22,2            // vpinsrw       $0x2,0x16(%r9,%r8,2),%xmm0,%xmm10
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,39                              // jb            16ffc <_sk_load_rgb_u16_be_avx+0x205>
-  .byte  196,193,121,110,68,64,24            // vmovd         0x18(%r8,%rax,2),%xmm0
+  .byte  114,39                              // jb            16b8a <_sk_load_rgb_u16_be_avx+0x1f7>
+  .byte  196,129,121,110,68,65,24            // vmovd         0x18(%r9,%r8,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
-  .byte  196,193,121,196,84,64,28,2          // vpinsrw       $0x2,0x1c(%r8,%rax,2),%xmm0,%xmm2
+  .byte  196,129,121,196,84,65,28,2          // vpinsrw       $0x2,0x1c(%r9,%r8,2),%xmm0,%xmm2
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  117,30                              // jne           1700d <_sk_load_rgb_u16_be_avx+0x216>
+  .byte  117,30                              // jne           16b9b <_sk_load_rgb_u16_be_avx+0x208>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
-  .byte  233,91,254,255,255                  // jmpq          16e57 <_sk_load_rgb_u16_be_avx+0x60>
+  .byte  233,91,254,255,255                  // jmpq          169e5 <_sk_load_rgb_u16_be_avx+0x52>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
-  .byte  233,74,254,255,255                  // jmpq          16e57 <_sk_load_rgb_u16_be_avx+0x60>
-  .byte  196,193,121,110,68,64,30            // vmovd         0x1e(%r8,%rax,2),%xmm0
+  .byte  233,74,254,255,255                  // jmpq          169e5 <_sk_load_rgb_u16_be_avx+0x52>
+  .byte  196,129,121,110,68,65,30            // vmovd         0x1e(%r9,%r8,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
-  .byte  196,193,121,196,76,64,34,2          // vpinsrw       $0x2,0x22(%r8,%rax,2),%xmm0,%xmm1
+  .byte  196,129,121,196,76,65,34,2          // vpinsrw       $0x2,0x22(%r9,%r8,2),%xmm0,%xmm1
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,25                              // jb            17040 <_sk_load_rgb_u16_be_avx+0x249>
-  .byte  196,193,121,110,68,64,36            // vmovd         0x24(%r8,%rax,2),%xmm0
+  .byte  114,25                              // jb            16bce <_sk_load_rgb_u16_be_avx+0x23b>
+  .byte  196,129,121,110,68,65,36            // vmovd         0x24(%r9,%r8,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
-  .byte  196,193,121,196,68,64,40,2          // vpinsrw       $0x2,0x28(%r8,%rax,2),%xmm0,%xmm0
-  .byte  233,23,254,255,255                  // jmpq          16e57 <_sk_load_rgb_u16_be_avx+0x60>
+  .byte  196,129,121,196,68,65,40,2          // vpinsrw       $0x2,0x28(%r9,%r8,2),%xmm0,%xmm0
+  .byte  233,23,254,255,255                  // jmpq          169e5 <_sk_load_rgb_u16_be_avx+0x52>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  233,14,254,255,255                  // jmpq          16e57 <_sk_load_rgb_u16_be_avx+0x60>
+  .byte  233,14,254,255,255                  // jmpq          169e5 <_sk_load_rgb_u16_be_avx+0x52>
 
 HIDDEN _sk_store_u16_be_avx
 .globl _sk_store_u16_be_avx
 FUNCTION(_sk_store_u16_be_avx)
 _sk_store_u16_be_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
-  .byte  77,1,192                            // add           %r8,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  73,99,193                           // movslq        %r9d,%rax
+  .byte  76,141,4,149,0,0,0,0                // lea           0x0(,%rdx,4),%r8
+  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  77,1,201                            // add           %r9,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,60,95,200                       // vmaxps        %ymm0,%ymm8,%ymm9
-  .byte  196,98,125,24,21,3,59,2,0           // vbroadcastss  0x23b03(%rip),%ymm10        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,21,171,55,2,0         // vbroadcastss  0x237ab(%rip),%ymm10        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,65,52,93,202                    // vminps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,29,17,60,2,0          // vbroadcastss  0x23c11(%rip),%ymm11        # 3ac98 <_sk_srcover_bgra_8888_sse2_lowp+0x3cc>
+  .byte  196,98,125,24,29,185,56,2,0         // vbroadcastss  0x238b9(%rip),%ymm11        # 3a4c8 <_sk_srcover_bgra_8888_sse2_lowp+0x3cc>
   .byte  196,65,52,89,203                    // vmulps        %ymm11,%ymm9,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  196,67,125,25,204,1                 // vextractf128  $0x1,%ymm9,%xmm12
@@ -22383,31 +22153,31 @@
   .byte  196,65,25,98,200                    // vpunpckldq    %xmm8,%xmm12,%xmm9
   .byte  196,65,25,106,192                   // vpunpckhdq    %xmm8,%xmm12,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,31                              // jne           17186 <_sk_store_u16_be_avx+0x13d>
-  .byte  196,65,122,127,28,64                // vmovdqu       %xmm11,(%r8,%rax,2)
-  .byte  196,65,122,127,84,64,16             // vmovdqu       %xmm10,0x10(%r8,%rax,2)
-  .byte  196,65,122,127,76,64,32             // vmovdqu       %xmm9,0x20(%r8,%rax,2)
-  .byte  196,65,122,127,68,64,48             // vmovdqu       %xmm8,0x30(%r8,%rax,2)
+  .byte  117,31                              // jne           16d0e <_sk_store_u16_be_avx+0x137>
+  .byte  196,1,122,127,28,65                 // vmovdqu       %xmm11,(%r9,%r8,2)
+  .byte  196,1,122,127,84,65,16              // vmovdqu       %xmm10,0x10(%r9,%r8,2)
+  .byte  196,1,122,127,76,65,32              // vmovdqu       %xmm9,0x20(%r9,%r8,2)
+  .byte  196,1,122,127,68,65,48              // vmovdqu       %xmm8,0x30(%r9,%r8,2)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,65,121,214,28,64                // vmovq         %xmm11,(%r8,%rax,2)
+  .byte  196,1,121,214,28,65                 // vmovq         %xmm11,(%r9,%r8,2)
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,240                             // je            17182 <_sk_store_u16_be_avx+0x139>
-  .byte  196,65,121,23,92,64,8               // vmovhpd       %xmm11,0x8(%r8,%rax,2)
+  .byte  116,240                             // je            16d0a <_sk_store_u16_be_avx+0x133>
+  .byte  196,1,121,23,92,65,8                // vmovhpd       %xmm11,0x8(%r9,%r8,2)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,227                             // jb            17182 <_sk_store_u16_be_avx+0x139>
-  .byte  196,65,121,214,84,64,16             // vmovq         %xmm10,0x10(%r8,%rax,2)
-  .byte  116,218                             // je            17182 <_sk_store_u16_be_avx+0x139>
-  .byte  196,65,121,23,84,64,24              // vmovhpd       %xmm10,0x18(%r8,%rax,2)
+  .byte  114,227                             // jb            16d0a <_sk_store_u16_be_avx+0x133>
+  .byte  196,1,121,214,84,65,16              // vmovq         %xmm10,0x10(%r9,%r8,2)
+  .byte  116,218                             // je            16d0a <_sk_store_u16_be_avx+0x133>
+  .byte  196,1,121,23,84,65,24               // vmovhpd       %xmm10,0x18(%r9,%r8,2)
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,205                             // jb            17182 <_sk_store_u16_be_avx+0x139>
-  .byte  196,65,121,214,76,64,32             // vmovq         %xmm9,0x20(%r8,%rax,2)
-  .byte  116,196                             // je            17182 <_sk_store_u16_be_avx+0x139>
-  .byte  196,65,121,23,76,64,40              // vmovhpd       %xmm9,0x28(%r8,%rax,2)
+  .byte  114,205                             // jb            16d0a <_sk_store_u16_be_avx+0x133>
+  .byte  196,1,121,214,76,65,32              // vmovq         %xmm9,0x20(%r9,%r8,2)
+  .byte  116,196                             // je            16d0a <_sk_store_u16_be_avx+0x133>
+  .byte  196,1,121,23,76,65,40               // vmovhpd       %xmm9,0x28(%r9,%r8,2)
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,183                             // jb            17182 <_sk_store_u16_be_avx+0x139>
-  .byte  196,65,121,214,68,64,48             // vmovq         %xmm8,0x30(%r8,%rax,2)
-  .byte  235,174                             // jmp           17182 <_sk_store_u16_be_avx+0x139>
+  .byte  114,183                             // jb            16d0a <_sk_store_u16_be_avx+0x133>
+  .byte  196,1,121,214,68,65,48              // vmovq         %xmm8,0x30(%r9,%r8,2)
+  .byte  235,174                             // jmp           16d0a <_sk_store_u16_be_avx+0x133>
 
 HIDDEN _sk_load_f32_avx
 .globl _sk_load_f32_avx
@@ -22416,20 +22186,18 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,253,87,192                      // vxorpd        %ymm0,%ymm0,%ymm0
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,135,97,1,0,0                     // ja            17345 <_sk_load_f32_avx+0x171>
+  .byte  15,135,91,1,0,0                     // ja            16ec7 <_sk_load_f32_avx+0x16b>
   .byte  72,131,236,24                       // sub           $0x18,%rsp
   .byte  197,253,17,100,36,128               // vmovupd       %ymm4,-0x80(%rsp)
   .byte  197,253,17,108,36,160               // vmovupd       %ymm5,-0x60(%rsp)
   .byte  197,253,17,116,36,192               // vmovupd       %ymm6,-0x40(%rsp)
   .byte  197,253,17,124,36,224               // vmovupd       %ymm7,-0x20(%rsp)
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
-  .byte  73,193,224,2                        // shl           $0x2,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  77,99,201                           // movslq        %r9d,%r9
-  .byte  76,141,21,48,1,0,0                  // lea           0x130(%rip),%r10        # 17354 <_sk_load_f32_avx+0x180>
+  .byte  76,141,4,149,0,0,0,0                // lea           0x0(,%rdx,4),%r8
+  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  73,193,225,2                        // shl           $0x2,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
+  .byte  76,141,21,50,1,0,0                  // lea           0x132(%rip),%r10        # 16ed8 <_sk_load_f32_avx+0x17c>
   .byte  73,99,4,186                         // movslq        (%r10,%rdi,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  197,221,87,228                      // vxorpd        %ymm4,%ymm4,%ymm4
@@ -22448,31 +22216,31 @@
   .byte  196,65,45,87,210                    // vxorpd        %ymm10,%ymm10,%ymm10
   .byte  197,197,87,255                      // vxorpd        %ymm7,%ymm7,%ymm7
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,129,121,16,68,136,112           // vmovupd       0x70(%r8,%r9,4),%xmm0
+  .byte  196,129,121,16,68,129,112           // vmovupd       0x70(%r9,%r8,4),%xmm0
   .byte  196,227,125,6,192,40                // vperm2f128    $0x28,%ymm0,%ymm0,%ymm0
-  .byte  196,129,121,16,76,136,96            // vmovupd       0x60(%r8,%r9,4),%xmm1
+  .byte  196,129,121,16,76,129,96            // vmovupd       0x60(%r9,%r8,4),%xmm1
   .byte  196,227,125,6,225,40                // vperm2f128    $0x28,%ymm1,%ymm0,%ymm4
-  .byte  196,129,121,16,76,136,80            // vmovupd       0x50(%r8,%r9,4),%xmm1
+  .byte  196,129,121,16,76,129,80            // vmovupd       0x50(%r9,%r8,4),%xmm1
   .byte  196,227,125,6,209,40                // vperm2f128    $0x28,%ymm1,%ymm0,%ymm2
   .byte  197,125,40,204                      // vmovapd       %ymm4,%ymm9
-  .byte  196,129,121,16,76,136,64            // vmovupd       0x40(%r8,%r9,4),%xmm1
+  .byte  196,129,121,16,76,129,64            // vmovupd       0x40(%r9,%r8,4),%xmm1
   .byte  196,99,125,6,193,40                 // vperm2f128    $0x28,%ymm1,%ymm0,%ymm8
   .byte  196,65,125,40,217                   // vmovapd       %ymm9,%ymm11
   .byte  197,125,40,226                      // vmovapd       %ymm2,%ymm12
-  .byte  196,129,121,16,76,136,48            // vmovupd       0x30(%r8,%r9,4),%xmm1
+  .byte  196,129,121,16,76,129,48            // vmovupd       0x30(%r9,%r8,4),%xmm1
   .byte  196,227,117,13,192,12               // vblendpd      $0xc,%ymm0,%ymm1,%ymm0
   .byte  196,65,125,40,243                   // vmovapd       %ymm11,%ymm14
   .byte  197,125,41,230                      // vmovapd       %ymm12,%ymm6
   .byte  196,65,125,40,248                   // vmovapd       %ymm8,%ymm15
-  .byte  196,129,121,16,76,136,32            // vmovupd       0x20(%r8,%r9,4),%xmm1
+  .byte  196,129,121,16,76,129,32            // vmovupd       0x20(%r9,%r8,4),%xmm1
   .byte  196,195,117,13,206,12               // vblendpd      $0xc,%ymm14,%ymm1,%ymm1
   .byte  197,125,40,238                      // vmovapd       %ymm6,%ymm13
   .byte  197,125,41,253                      // vmovapd       %ymm15,%ymm5
-  .byte  196,129,121,16,84,136,16            // vmovupd       0x10(%r8,%r9,4),%xmm2
+  .byte  196,129,121,16,84,129,16            // vmovupd       0x10(%r9,%r8,4),%xmm2
   .byte  196,67,109,13,213,12                // vblendpd      $0xc,%ymm13,%ymm2,%ymm10
   .byte  197,253,40,217                      // vmovapd       %ymm1,%ymm3
   .byte  197,253,40,253                      // vmovapd       %ymm5,%ymm7
-  .byte  196,129,121,16,12,136               // vmovupd       (%r8,%r9,4),%xmm1
+  .byte  196,129,121,16,12,129               // vmovupd       (%r9,%r8,4),%xmm1
   .byte  196,227,117,13,207,12               // vblendpd      $0xc,%ymm7,%ymm1,%ymm1
   .byte  197,252,16,124,36,224               // vmovups       -0x20(%rsp),%ymm7
   .byte  197,252,16,116,36,192               // vmovups       -0x40(%rsp),%ymm6
@@ -22492,21 +22260,19 @@
   .byte  197,229,87,219                      // vxorpd        %ymm3,%ymm3,%ymm3
   .byte  196,65,45,87,210                    // vxorpd        %ymm10,%ymm10,%ymm10
   .byte  197,245,87,201                      // vxorpd        %ymm1,%ymm1,%ymm1
-  .byte  235,203                             // jmp           1731f <_sk_load_f32_avx+0x14b>
-  .byte  29,255,255,255,163                  // sbb           $0xa3ffffff,%eax
+  .byte  235,203                             // jmp           16ea1 <_sk_load_f32_avx+0x145>
+  .byte  102,144                             // xchg          %ax,%ax
+  .byte  27,255                              // sbb           %edi,%edi
+  .byte  255                                 // (bad)
+  .byte  255,161,255,255,255,140             // jmpq          *-0x73000001(%rcx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,142,255,255,255,121             // decl          0x79ffffff(%rsi)
+  .byte  255,119,255                         // pushq         -0x1(%rdi)
   .byte  255                                 // (bad)
+  .byte  255,92,255,255                      // lcall         *-0x1(%rdi,%rdi,8)
+  .byte  255,70,255                          // incl          -0x1(%rsi)
   .byte  255                                 // (bad)
-  .byte  255,94,255                          // lcall         *-0x1(%rsi)
-  .byte  255                                 // (bad)
-  .byte  255,72,255                          // decl          -0x1(%rax)
-  .byte  255                                 // (bad)
-  .byte  255,55                              // pushq         (%rdi)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,42                              // ljmp          *(%rdx)
+  .byte  255,53,255,255,255,40               // pushq         0x28ffffff(%rip)        # 29016ef4 <_sk_srcover_bgra_8888_sse2_lowp+0x28fdcdf8>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -22518,20 +22284,18 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,221,87,228                      // vxorpd        %ymm4,%ymm4,%ymm4
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,135,97,1,0,0                     // ja            174e5 <_sk_load_f32_dst_avx+0x171>
+  .byte  15,135,91,1,0,0                     // ja            17063 <_sk_load_f32_dst_avx+0x16b>
   .byte  72,131,236,24                       // sub           $0x18,%rsp
   .byte  197,253,17,68,36,128                // vmovupd       %ymm0,-0x80(%rsp)
   .byte  197,253,17,76,36,160                // vmovupd       %ymm1,-0x60(%rsp)
   .byte  197,253,17,84,36,192                // vmovupd       %ymm2,-0x40(%rsp)
   .byte  197,253,17,92,36,224                // vmovupd       %ymm3,-0x20(%rsp)
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
-  .byte  73,193,224,2                        // shl           $0x2,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  77,99,201                           // movslq        %r9d,%r9
-  .byte  76,141,21,48,1,0,0                  // lea           0x130(%rip),%r10        # 174f4 <_sk_load_f32_dst_avx+0x180>
+  .byte  76,141,4,149,0,0,0,0                // lea           0x0(,%rdx,4),%r8
+  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  73,193,225,2                        // shl           $0x2,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
+  .byte  76,141,21,50,1,0,0                  // lea           0x132(%rip),%r10        # 17074 <_sk_load_f32_dst_avx+0x17c>
   .byte  73,99,4,186                         // movslq        (%r10,%rdi,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  197,253,87,192                      // vxorpd        %ymm0,%ymm0,%ymm0
@@ -22550,31 +22314,31 @@
   .byte  196,65,45,87,210                    // vxorpd        %ymm10,%ymm10,%ymm10
   .byte  197,229,87,219                      // vxorpd        %ymm3,%ymm3,%ymm3
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,129,121,16,68,136,112           // vmovupd       0x70(%r8,%r9,4),%xmm0
+  .byte  196,129,121,16,68,129,112           // vmovupd       0x70(%r9,%r8,4),%xmm0
   .byte  196,227,125,6,224,40                // vperm2f128    $0x28,%ymm0,%ymm0,%ymm4
-  .byte  196,129,121,16,68,136,96            // vmovupd       0x60(%r8,%r9,4),%xmm0
+  .byte  196,129,121,16,68,129,96            // vmovupd       0x60(%r9,%r8,4),%xmm0
   .byte  196,227,125,6,192,40                // vperm2f128    $0x28,%ymm0,%ymm0,%ymm0
-  .byte  196,129,121,16,76,136,80            // vmovupd       0x50(%r8,%r9,4),%xmm1
+  .byte  196,129,121,16,76,129,80            // vmovupd       0x50(%r9,%r8,4),%xmm1
   .byte  196,227,125,6,241,40                // vperm2f128    $0x28,%ymm1,%ymm0,%ymm6
   .byte  197,125,40,200                      // vmovapd       %ymm0,%ymm9
-  .byte  196,129,121,16,68,136,64            // vmovupd       0x40(%r8,%r9,4),%xmm0
+  .byte  196,129,121,16,68,129,64            // vmovupd       0x40(%r9,%r8,4),%xmm0
   .byte  196,99,125,6,192,40                 // vperm2f128    $0x28,%ymm0,%ymm0,%ymm8
   .byte  196,65,125,40,217                   // vmovapd       %ymm9,%ymm11
   .byte  197,125,40,230                      // vmovapd       %ymm6,%ymm12
-  .byte  196,129,121,16,68,136,48            // vmovupd       0x30(%r8,%r9,4),%xmm0
+  .byte  196,129,121,16,68,129,48            // vmovupd       0x30(%r9,%r8,4),%xmm0
   .byte  196,227,125,13,228,12               // vblendpd      $0xc,%ymm4,%ymm0,%ymm4
   .byte  196,65,125,40,243                   // vmovapd       %ymm11,%ymm14
   .byte  197,125,41,226                      // vmovapd       %ymm12,%ymm2
   .byte  196,65,125,40,248                   // vmovapd       %ymm8,%ymm15
-  .byte  196,129,121,16,68,136,32            // vmovupd       0x20(%r8,%r9,4),%xmm0
+  .byte  196,129,121,16,68,129,32            // vmovupd       0x20(%r9,%r8,4),%xmm0
   .byte  196,195,125,13,238,12               // vblendpd      $0xc,%ymm14,%ymm0,%ymm5
   .byte  197,125,40,234                      // vmovapd       %ymm2,%ymm13
   .byte  197,125,41,249                      // vmovapd       %ymm15,%ymm1
-  .byte  196,129,121,16,68,136,16            // vmovupd       0x10(%r8,%r9,4),%xmm0
+  .byte  196,129,121,16,68,129,16            // vmovupd       0x10(%r9,%r8,4),%xmm0
   .byte  196,67,125,13,213,12                // vblendpd      $0xc,%ymm13,%ymm0,%ymm10
   .byte  197,253,40,253                      // vmovapd       %ymm5,%ymm7
   .byte  197,253,40,217                      // vmovapd       %ymm1,%ymm3
-  .byte  196,129,121,16,4,136                // vmovupd       (%r8,%r9,4),%xmm0
+  .byte  196,129,121,16,4,129                // vmovupd       (%r9,%r8,4),%xmm0
   .byte  196,227,125,13,235,12               // vblendpd      $0xc,%ymm3,%ymm0,%ymm5
   .byte  197,252,16,92,36,224                // vmovups       -0x20(%rsp),%ymm3
   .byte  197,252,16,84,36,192                // vmovups       -0x40(%rsp),%ymm2
@@ -22594,21 +22358,19 @@
   .byte  197,197,87,255                      // vxorpd        %ymm7,%ymm7,%ymm7
   .byte  196,65,45,87,210                    // vxorpd        %ymm10,%ymm10,%ymm10
   .byte  197,213,87,237                      // vxorpd        %ymm5,%ymm5,%ymm5
-  .byte  235,203                             // jmp           174bf <_sk_load_f32_dst_avx+0x14b>
-  .byte  29,255,255,255,163                  // sbb           $0xa3ffffff,%eax
+  .byte  235,203                             // jmp           1703d <_sk_load_f32_dst_avx+0x145>
+  .byte  102,144                             // xchg          %ax,%ax
+  .byte  27,255                              // sbb           %edi,%edi
+  .byte  255                                 // (bad)
+  .byte  255,161,255,255,255,140             // jmpq          *-0x73000001(%rcx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,142,255,255,255,121             // decl          0x79ffffff(%rsi)
+  .byte  255,119,255                         // pushq         -0x1(%rdi)
   .byte  255                                 // (bad)
+  .byte  255,92,255,255                      // lcall         *-0x1(%rdi,%rdi,8)
+  .byte  255,70,255                          // incl          -0x1(%rsi)
   .byte  255                                 // (bad)
-  .byte  255,94,255                          // lcall         *-0x1(%rsi)
-  .byte  255                                 // (bad)
-  .byte  255,72,255                          // decl          -0x1(%rax)
-  .byte  255                                 // (bad)
-  .byte  255,55                              // pushq         (%rdi)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,42                              // ljmp          *(%rdx)
+  .byte  255,53,255,255,255,40               // pushq         0x28ffffff(%rip)        # 29017090 <_sk_srcover_bgra_8888_sse2_lowp+0x28fdcf94>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -22618,13 +22380,11 @@
 FUNCTION(_sk_store_f32_avx)
 _sk_store_f32_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
-  .byte  73,193,224,2                        // shl           $0x2,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  73,99,193                           // movslq        %r9d,%rax
+  .byte  76,141,4,149,0,0,0,0                // lea           0x0(,%rdx,4),%r8
+  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  73,193,225,2                        // shl           $0x2,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
   .byte  197,124,20,193                      // vunpcklps     %ymm1,%ymm0,%ymm8
   .byte  197,124,21,217                      // vunpckhps     %ymm1,%ymm0,%ymm11
   .byte  197,108,20,203                      // vunpcklps     %ymm3,%ymm2,%ymm9
@@ -22634,35 +22394,35 @@
   .byte  196,65,37,20,196                    // vunpcklpd     %ymm12,%ymm11,%ymm8
   .byte  196,65,37,21,220                    // vunpckhpd     %ymm12,%ymm11,%ymm11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,55                              // jne           17593 <_sk_store_f32_avx+0x7f>
+  .byte  117,55                              // jne           1710d <_sk_store_f32_avx+0x79>
   .byte  196,67,45,24,225,1                  // vinsertf128   $0x1,%xmm9,%ymm10,%ymm12
   .byte  196,67,61,24,235,1                  // vinsertf128   $0x1,%xmm11,%ymm8,%ymm13
   .byte  196,67,45,6,201,49                  // vperm2f128    $0x31,%ymm9,%ymm10,%ymm9
   .byte  196,67,61,6,195,49                  // vperm2f128    $0x31,%ymm11,%ymm8,%ymm8
-  .byte  196,65,124,17,36,128                // vmovups       %ymm12,(%r8,%rax,4)
-  .byte  196,65,124,17,108,128,32            // vmovups       %ymm13,0x20(%r8,%rax,4)
-  .byte  196,65,125,17,76,128,64             // vmovupd       %ymm9,0x40(%r8,%rax,4)
-  .byte  196,65,125,17,68,128,96             // vmovupd       %ymm8,0x60(%r8,%rax,4)
+  .byte  196,1,124,17,36,129                 // vmovups       %ymm12,(%r9,%r8,4)
+  .byte  196,1,124,17,108,129,32             // vmovups       %ymm13,0x20(%r9,%r8,4)
+  .byte  196,1,125,17,76,129,64              // vmovupd       %ymm9,0x40(%r9,%r8,4)
+  .byte  196,1,125,17,68,129,96              // vmovupd       %ymm8,0x60(%r9,%r8,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  196,65,121,17,20,128                // vmovupd       %xmm10,(%r8,%rax,4)
+  .byte  196,1,121,17,20,129                 // vmovupd       %xmm10,(%r9,%r8,4)
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,240                             // je            1758f <_sk_store_f32_avx+0x7b>
-  .byte  196,65,121,17,76,128,16             // vmovupd       %xmm9,0x10(%r8,%rax,4)
+  .byte  116,240                             // je            17109 <_sk_store_f32_avx+0x75>
+  .byte  196,1,121,17,76,129,16              // vmovupd       %xmm9,0x10(%r9,%r8,4)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,227                             // jb            1758f <_sk_store_f32_avx+0x7b>
-  .byte  196,65,121,17,68,128,32             // vmovupd       %xmm8,0x20(%r8,%rax,4)
-  .byte  116,218                             // je            1758f <_sk_store_f32_avx+0x7b>
-  .byte  196,65,121,17,92,128,48             // vmovupd       %xmm11,0x30(%r8,%rax,4)
+  .byte  114,227                             // jb            17109 <_sk_store_f32_avx+0x75>
+  .byte  196,1,121,17,68,129,32              // vmovupd       %xmm8,0x20(%r9,%r8,4)
+  .byte  116,218                             // je            17109 <_sk_store_f32_avx+0x75>
+  .byte  196,1,121,17,92,129,48              // vmovupd       %xmm11,0x30(%r9,%r8,4)
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,205                             // jb            1758f <_sk_store_f32_avx+0x7b>
-  .byte  196,67,125,25,84,128,64,1           // vextractf128  $0x1,%ymm10,0x40(%r8,%rax,4)
-  .byte  116,195                             // je            1758f <_sk_store_f32_avx+0x7b>
-  .byte  196,67,125,25,76,128,80,1           // vextractf128  $0x1,%ymm9,0x50(%r8,%rax,4)
+  .byte  114,205                             // jb            17109 <_sk_store_f32_avx+0x75>
+  .byte  196,3,125,25,84,129,64,1            // vextractf128  $0x1,%ymm10,0x40(%r9,%r8,4)
+  .byte  116,195                             // je            17109 <_sk_store_f32_avx+0x75>
+  .byte  196,3,125,25,76,129,80,1            // vextractf128  $0x1,%ymm9,0x50(%r9,%r8,4)
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,181                             // jb            1758f <_sk_store_f32_avx+0x7b>
-  .byte  196,67,125,25,68,128,96,1           // vextractf128  $0x1,%ymm8,0x60(%r8,%rax,4)
-  .byte  235,171                             // jmp           1758f <_sk_store_f32_avx+0x7b>
+  .byte  114,181                             // jb            17109 <_sk_store_f32_avx+0x75>
+  .byte  196,3,125,25,68,129,96,1            // vextractf128  $0x1,%ymm8,0x60(%r9,%r8,4)
+  .byte  235,171                             // jmp           17109 <_sk_store_f32_avx+0x75>
 
 HIDDEN _sk_repeat_x_avx
 .globl _sk_repeat_x_avx
@@ -22705,7 +22465,7 @@
   .byte  196,193,58,88,192                   // vaddss        %xmm8,%xmm8,%xmm0
   .byte  196,227,121,4,192,0                 // vpermilps     $0x0,%xmm0,%xmm0
   .byte  196,99,125,24,192,1                 // vinsertf128   $0x1,%xmm0,%ymm0,%ymm8
-  .byte  197,178,89,5,21,53,2,0              // vmulss        0x23515(%rip),%xmm9,%xmm0        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  197,178,89,5,203,49,2,0             // vmulss        0x231cb(%rip),%xmm9,%xmm0        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,227,121,4,192,0                 // vpermilps     $0x0,%xmm0,%xmm0
   .byte  196,227,125,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
   .byte  197,164,89,192                      // vmulps        %ymm0,%ymm11,%ymm0
@@ -22732,7 +22492,7 @@
   .byte  196,193,58,88,200                   // vaddss        %xmm8,%xmm8,%xmm1
   .byte  196,227,121,4,201,0                 // vpermilps     $0x0,%xmm1,%xmm1
   .byte  196,99,117,24,193,1                 // vinsertf128   $0x1,%xmm1,%ymm1,%ymm8
-  .byte  197,178,89,13,171,52,2,0            // vmulss        0x234ab(%rip),%xmm9,%xmm1        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  197,178,89,13,97,49,2,0             // vmulss        0x23161(%rip),%xmm9,%xmm1        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,227,121,4,201,0                 // vpermilps     $0x0,%xmm1,%xmm1
   .byte  196,227,117,24,201,1                // vinsertf128   $0x1,%xmm1,%ymm1,%ymm1
   .byte  197,164,89,201                      // vmulps        %ymm1,%ymm11,%ymm1
@@ -22752,7 +22512,7 @@
 _sk_clamp_x_1_avx:
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
-  .byte  196,98,125,24,5,104,52,2,0          // vbroadcastss  0x23468(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,30,49,2,0           // vbroadcastss  0x2311e(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -22765,7 +22525,7 @@
   .byte  196,193,124,92,192                  // vsubps        %ymm8,%ymm0,%ymm0
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
-  .byte  196,98,125,24,5,66,52,2,0           // vbroadcastss  0x23442(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,248,48,2,0          // vbroadcastss  0x230f8(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -22774,9 +22534,9 @@
 .globl _sk_mirror_x_1_avx
 FUNCTION(_sk_mirror_x_1_avx)
 _sk_mirror_x_1_avx:
-  .byte  196,98,125,24,5,72,52,2,0           // vbroadcastss  0x23448(%rip),%ymm8        # 3ab94 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
+  .byte  196,98,125,24,5,254,48,2,0          // vbroadcastss  0x230fe(%rip),%ymm8        # 3a3c4 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
   .byte  196,193,124,88,192                  // vaddps        %ymm8,%ymm0,%ymm0
-  .byte  196,98,125,24,13,30,52,2,0          // vbroadcastss  0x2341e(%rip),%ymm9        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,13,212,48,2,0         // vbroadcastss  0x230d4(%rip),%ymm9        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,65,124,89,201                   // vmulps        %ymm9,%ymm0,%ymm9
   .byte  196,67,125,8,201,1                  // vroundps      $0x1,%ymm9,%ymm9
   .byte  196,65,52,88,201                    // vaddps        %ymm9,%ymm9,%ymm9
@@ -22786,7 +22546,7 @@
   .byte  197,60,92,200                       // vsubps        %ymm0,%ymm8,%ymm9
   .byte  197,180,84,192                      // vandps        %ymm0,%ymm9,%ymm0
   .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
-  .byte  196,98,125,24,5,238,51,2,0          // vbroadcastss  0x233ee(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,164,48,2,0          // vbroadcastss  0x230a4(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -22795,12 +22555,12 @@
 .globl _sk_luminance_to_alpha_avx
 FUNCTION(_sk_luminance_to_alpha_avx)
 _sk_luminance_to_alpha_avx:
-  .byte  196,226,125,24,29,0,53,2,0          // vbroadcastss  0x23500(%rip),%ymm3        # 3aca0 <_sk_srcover_bgra_8888_sse2_lowp+0x3d4>
+  .byte  196,226,125,24,29,182,49,2,0        // vbroadcastss  0x231b6(%rip),%ymm3        # 3a4d0 <_sk_srcover_bgra_8888_sse2_lowp+0x3d4>
   .byte  197,252,89,195                      // vmulps        %ymm3,%ymm0,%ymm0
-  .byte  196,226,125,24,29,239,52,2,0        // vbroadcastss  0x234ef(%rip),%ymm3        # 3ac9c <_sk_srcover_bgra_8888_sse2_lowp+0x3d0>
+  .byte  196,226,125,24,29,165,49,2,0        // vbroadcastss  0x231a5(%rip),%ymm3        # 3a4cc <_sk_srcover_bgra_8888_sse2_lowp+0x3d0>
   .byte  197,244,89,203                      // vmulps        %ymm3,%ymm1,%ymm1
   .byte  197,252,88,193                      // vaddps        %ymm1,%ymm0,%ymm0
-  .byte  196,226,125,24,13,230,52,2,0        // vbroadcastss  0x234e6(%rip),%ymm1        # 3aca4 <_sk_srcover_bgra_8888_sse2_lowp+0x3d8>
+  .byte  196,226,125,24,13,156,49,2,0        // vbroadcastss  0x2319c(%rip),%ymm1        # 3a4d4 <_sk_srcover_bgra_8888_sse2_lowp+0x3d8>
   .byte  197,236,89,201                      // vmulps        %ymm1,%ymm2,%ymm1
   .byte  197,252,88,217                      // vaddps        %ymm1,%ymm0,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -23048,9 +22808,9 @@
   .byte  72,139,24                           // mov           (%rax),%rbx
   .byte  72,139,104,8                        // mov           0x8(%rax),%rbp
   .byte  72,255,203                          // dec           %rbx
-  .byte  120,7                               // js            17b62 <_sk_evenly_spaced_gradient_avx+0x25>
+  .byte  120,7                               // js            176dc <_sk_evenly_spaced_gradient_avx+0x25>
   .byte  196,225,242,42,203                  // vcvtsi2ss     %rbx,%xmm1,%xmm1
-  .byte  235,21                              // jmp           17b77 <_sk_evenly_spaced_gradient_avx+0x3a>
+  .byte  235,21                              // jmp           176f1 <_sk_evenly_spaced_gradient_avx+0x3a>
   .byte  73,137,216                          // mov           %rbx,%r8
   .byte  73,209,232                          // shr           %r8
   .byte  131,227,1                           // and           $0x1,%ebx
@@ -23218,12 +22978,12 @@
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  73,131,248,2                        // cmp           $0x2,%r8
-  .byte  114,81                              // jb            17f11 <_sk_gradient_avx+0x6f>
+  .byte  114,81                              // jb            17a8b <_sk_gradient_avx+0x6f>
   .byte  72,139,88,72                        // mov           0x48(%rax),%rbx
   .byte  73,255,200                          // dec           %r8
   .byte  72,131,195,4                        // add           $0x4,%rbx
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
-  .byte  196,98,125,24,21,167,44,2,0         // vbroadcastss  0x22ca7(%rip),%ymm10        # 3ab80 <_sk_srcover_bgra_8888_sse2_lowp+0x2b4>
+  .byte  196,98,125,24,21,93,41,2,0          // vbroadcastss  0x2295d(%rip),%ymm10        # 3a3b0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b4>
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  196,98,125,24,3                     // vbroadcastss  (%rbx),%ymm8
   .byte  197,60,194,192,2                    // vcmpleps      %ymm0,%ymm8,%ymm8
@@ -23235,7 +22995,7 @@
   .byte  196,227,117,24,202,1                // vinsertf128   $0x1,%xmm2,%ymm1,%ymm1
   .byte  72,131,195,4                        // add           $0x4,%rbx
   .byte  73,255,200                          // dec           %r8
-  .byte  117,204                             // jne           17edd <_sk_gradient_avx+0x3b>
+  .byte  117,204                             // jne           17a57 <_sk_gradient_avx+0x3b>
   .byte  196,195,249,22,200,1                // vpextrq       $0x1,%xmm1,%r8
   .byte  69,137,193                          // mov           %r8d,%r9d
   .byte  73,193,232,32                       // shr           $0x20,%r8
@@ -23417,27 +23177,27 @@
   .byte  196,65,52,95,226                    // vmaxps        %ymm10,%ymm9,%ymm12
   .byte  196,65,36,94,220                    // vdivps        %ymm12,%ymm11,%ymm11
   .byte  196,65,36,89,227                    // vmulps        %ymm11,%ymm11,%ymm12
-  .byte  196,98,125,24,45,193,41,2,0         // vbroadcastss  0x229c1(%rip),%ymm13        # 3aca8 <_sk_srcover_bgra_8888_sse2_lowp+0x3dc>
+  .byte  196,98,125,24,45,119,38,2,0         // vbroadcastss  0x22677(%rip),%ymm13        # 3a4d8 <_sk_srcover_bgra_8888_sse2_lowp+0x3dc>
   .byte  196,65,28,89,237                    // vmulps        %ymm13,%ymm12,%ymm13
-  .byte  196,98,125,24,53,183,41,2,0         // vbroadcastss  0x229b7(%rip),%ymm14        # 3acac <_sk_srcover_bgra_8888_sse2_lowp+0x3e0>
+  .byte  196,98,125,24,53,109,38,2,0         // vbroadcastss  0x2266d(%rip),%ymm14        # 3a4dc <_sk_srcover_bgra_8888_sse2_lowp+0x3e0>
   .byte  196,65,20,88,238                    // vaddps        %ymm14,%ymm13,%ymm13
   .byte  196,65,28,89,237                    // vmulps        %ymm13,%ymm12,%ymm13
-  .byte  196,98,125,24,53,168,41,2,0         // vbroadcastss  0x229a8(%rip),%ymm14        # 3acb0 <_sk_srcover_bgra_8888_sse2_lowp+0x3e4>
+  .byte  196,98,125,24,53,94,38,2,0          // vbroadcastss  0x2265e(%rip),%ymm14        # 3a4e0 <_sk_srcover_bgra_8888_sse2_lowp+0x3e4>
   .byte  196,65,20,88,238                    // vaddps        %ymm14,%ymm13,%ymm13
   .byte  196,65,28,89,229                    // vmulps        %ymm13,%ymm12,%ymm12
-  .byte  196,98,125,24,45,153,41,2,0         // vbroadcastss  0x22999(%rip),%ymm13        # 3acb4 <_sk_srcover_bgra_8888_sse2_lowp+0x3e8>
+  .byte  196,98,125,24,45,79,38,2,0          // vbroadcastss  0x2264f(%rip),%ymm13        # 3a4e4 <_sk_srcover_bgra_8888_sse2_lowp+0x3e8>
   .byte  196,65,28,88,229                    // vaddps        %ymm13,%ymm12,%ymm12
   .byte  196,65,36,89,220                    // vmulps        %ymm12,%ymm11,%ymm11
   .byte  196,65,52,194,202,1                 // vcmpltps      %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,21,132,41,2,0         // vbroadcastss  0x22984(%rip),%ymm10        # 3acb8 <_sk_srcover_bgra_8888_sse2_lowp+0x3ec>
+  .byte  196,98,125,24,21,58,38,2,0          // vbroadcastss  0x2263a(%rip),%ymm10        # 3a4e8 <_sk_srcover_bgra_8888_sse2_lowp+0x3ec>
   .byte  196,65,44,92,211                    // vsubps        %ymm11,%ymm10,%ymm10
   .byte  196,67,37,74,202,144                // vblendvps     %ymm9,%ymm10,%ymm11,%ymm9
   .byte  196,193,124,194,192,1               // vcmpltps      %ymm8,%ymm0,%ymm0
-  .byte  196,98,125,24,21,42,40,2,0          // vbroadcastss  0x2282a(%rip),%ymm10        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,21,224,36,2,0         // vbroadcastss  0x224e0(%rip),%ymm10        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,65,44,92,209                    // vsubps        %ymm9,%ymm10,%ymm10
   .byte  196,195,53,74,194,0                 // vblendvps     %ymm0,%ymm10,%ymm9,%ymm0
   .byte  196,65,116,194,200,1                // vcmpltps      %ymm8,%ymm1,%ymm9
-  .byte  196,98,125,24,21,20,40,2,0          // vbroadcastss  0x22814(%rip),%ymm10        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,21,202,36,2,0         // vbroadcastss  0x224ca(%rip),%ymm10        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,44,92,208                       // vsubps        %ymm0,%ymm10,%ymm10
   .byte  196,195,125,74,194,144              // vblendvps     %ymm9,%ymm10,%ymm0,%ymm0
   .byte  196,65,124,194,200,3                // vcmpunordps   %ymm8,%ymm0,%ymm9
@@ -23460,7 +23220,7 @@
 .globl _sk_negate_x_avx
 FUNCTION(_sk_negate_x_avx)
 _sk_negate_x_avx:
-  .byte  196,98,125,24,5,28,41,2,0           // vbroadcastss  0x2291c(%rip),%ymm8        # 3acbc <_sk_srcover_bgra_8888_sse2_lowp+0x3f0>
+  .byte  196,98,125,24,5,210,37,2,0          // vbroadcastss  0x225d2(%rip),%ymm8        # 3a4ec <_sk_srcover_bgra_8888_sse2_lowp+0x3f0>
   .byte  196,193,124,87,192                  // vxorps        %ymm8,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -23527,7 +23287,7 @@
   .byte  197,116,89,201                      // vmulps        %ymm1,%ymm1,%ymm9
   .byte  196,65,60,92,193                    // vsubps        %ymm9,%ymm8,%ymm8
   .byte  196,65,124,81,192                   // vsqrtps       %ymm8,%ymm8
-  .byte  196,98,125,24,13,124,40,2,0         // vbroadcastss  0x2287c(%rip),%ymm9        # 3acbc <_sk_srcover_bgra_8888_sse2_lowp+0x3f0>
+  .byte  196,98,125,24,13,50,37,2,0          // vbroadcastss  0x22532(%rip),%ymm9        # 3a4ec <_sk_srcover_bgra_8888_sse2_lowp+0x3f0>
   .byte  196,65,60,87,193                    // vxorps        %ymm9,%ymm8,%ymm8
   .byte  196,98,125,24,72,64                 // vbroadcastss  0x40(%rax),%ymm9
   .byte  197,180,89,192                      // vmulps        %ymm0,%ymm9,%ymm0
@@ -23549,7 +23309,7 @@
 .globl _sk_alter_2pt_conical_unswap_avx
 FUNCTION(_sk_alter_2pt_conical_unswap_avx)
 _sk_alter_2pt_conical_unswap_avx:
-  .byte  196,98,125,24,5,12,39,2,0           // vbroadcastss  0x2270c(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,194,35,2,0          // vbroadcastss  0x223c2(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,188,92,192                      // vsubps        %ymm0,%ymm8,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -23600,7 +23360,7 @@
 FUNCTION(_sk_save_xy_avx)
 _sk_save_xy_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,98,125,24,5,142,38,2,0          // vbroadcastss  0x2268e(%rip),%ymm8        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,5,68,35,2,0           // vbroadcastss  0x22344(%rip),%ymm8        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,65,124,88,200                   // vaddps        %ymm8,%ymm0,%ymm9
   .byte  196,67,125,8,209,1                  // vroundps      $0x1,%ymm9,%ymm10
   .byte  196,65,52,92,202                    // vsubps        %ymm10,%ymm9,%ymm9
@@ -23637,9 +23397,9 @@
 FUNCTION(_sk_bilinear_nx_avx)
 _sk_bilinear_nx_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,88,39,2,0          // vbroadcastss  0x22758(%rip),%ymm0        # 3acc0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  .byte  196,226,125,24,5,14,36,2,0          // vbroadcastss  0x2240e(%rip),%ymm0        # 3a4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   .byte  197,252,88,0                        // vaddps        (%rax),%ymm0,%ymm0
-  .byte  196,98,125,24,5,7,38,2,0            // vbroadcastss  0x22607(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,189,34,2,0          // vbroadcastss  0x222bd(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,128,128,0,0,0             // vsubps        0x80(%rax),%ymm8,%ymm8
   .byte  197,124,17,128,0,1,0,0              // vmovups       %ymm8,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -23650,7 +23410,7 @@
 FUNCTION(_sk_bilinear_px_avx)
 _sk_bilinear_px_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,228,37,2,0         // vbroadcastss  0x225e4(%rip),%ymm0        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,226,125,24,5,154,34,2,0         // vbroadcastss  0x2229a(%rip),%ymm0        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,252,88,0                        // vaddps        (%rax),%ymm0,%ymm0
   .byte  197,124,16,128,128,0,0,0            // vmovups       0x80(%rax),%ymm8
   .byte  197,124,17,128,0,1,0,0              // vmovups       %ymm8,0x100(%rax)
@@ -23662,9 +23422,9 @@
 FUNCTION(_sk_bilinear_ny_avx)
 _sk_bilinear_ny_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,13,9,39,2,0          // vbroadcastss  0x22709(%rip),%ymm1        # 3acc0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  .byte  196,226,125,24,13,191,35,2,0        // vbroadcastss  0x223bf(%rip),%ymm1        # 3a4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   .byte  197,244,88,72,64                    // vaddps        0x40(%rax),%ymm1,%ymm1
-  .byte  196,98,125,24,5,183,37,2,0          // vbroadcastss  0x225b7(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,109,34,2,0          // vbroadcastss  0x2226d(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,128,192,0,0,0             // vsubps        0xc0(%rax),%ymm8,%ymm8
   .byte  197,124,17,128,64,1,0,0             // vmovups       %ymm8,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -23675,7 +23435,7 @@
 FUNCTION(_sk_bilinear_py_avx)
 _sk_bilinear_py_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,13,148,37,2,0        // vbroadcastss  0x22594(%rip),%ymm1        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,226,125,24,13,74,34,2,0         // vbroadcastss  0x2224a(%rip),%ymm1        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,244,88,72,64                    // vaddps        0x40(%rax),%ymm1,%ymm1
   .byte  197,124,16,128,192,0,0,0            // vmovups       0xc0(%rax),%ymm8
   .byte  197,124,17,128,64,1,0,0             // vmovups       %ymm8,0x140(%rax)
@@ -23687,14 +23447,14 @@
 FUNCTION(_sk_bicubic_n3x_avx)
 _sk_bicubic_n3x_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,188,38,2,0         // vbroadcastss  0x226bc(%rip),%ymm0        # 3acc4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f8>
+  .byte  196,226,125,24,5,114,35,2,0         // vbroadcastss  0x22372(%rip),%ymm0        # 3a4f4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f8>
   .byte  197,252,88,0                        // vaddps        (%rax),%ymm0,%ymm0
-  .byte  196,98,125,24,5,103,37,2,0          // vbroadcastss  0x22567(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,29,34,2,0           // vbroadcastss  0x2221d(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,128,128,0,0,0             // vsubps        0x80(%rax),%ymm8,%ymm8
   .byte  196,65,60,89,200                    // vmulps        %ymm8,%ymm8,%ymm9
-  .byte  196,98,125,24,21,157,38,2,0         // vbroadcastss  0x2269d(%rip),%ymm10        # 3acc8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
+  .byte  196,98,125,24,21,83,35,2,0          // vbroadcastss  0x22353(%rip),%ymm10        # 3a4f8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
   .byte  196,65,60,89,194                    // vmulps        %ymm10,%ymm8,%ymm8
-  .byte  196,98,125,24,21,183,37,2,0         // vbroadcastss  0x225b7(%rip),%ymm10        # 3abf0 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  .byte  196,98,125,24,21,109,34,2,0         // vbroadcastss  0x2226d(%rip),%ymm10        # 3a420 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
   .byte  196,65,60,88,194                    // vaddps        %ymm10,%ymm8,%ymm8
   .byte  196,65,52,89,192                    // vmulps        %ymm8,%ymm9,%ymm8
   .byte  197,124,17,128,0,1,0,0              // vmovups       %ymm8,0x100(%rax)
@@ -23706,19 +23466,19 @@
 FUNCTION(_sk_bicubic_n1x_avx)
 _sk_bicubic_n1x_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,102,38,2,0         // vbroadcastss  0x22666(%rip),%ymm0        # 3acc0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  .byte  196,226,125,24,5,28,35,2,0          // vbroadcastss  0x2231c(%rip),%ymm0        # 3a4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   .byte  197,252,88,0                        // vaddps        (%rax),%ymm0,%ymm0
-  .byte  196,98,125,24,5,21,37,2,0           // vbroadcastss  0x22515(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,203,33,2,0          // vbroadcastss  0x221cb(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,128,128,0,0,0             // vsubps        0x80(%rax),%ymm8,%ymm8
-  .byte  196,98,125,24,13,84,38,2,0          // vbroadcastss  0x22654(%rip),%ymm9        # 3accc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  .byte  196,98,125,24,13,10,35,2,0          // vbroadcastss  0x2230a(%rip),%ymm9        # 3a4fc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
   .byte  196,65,60,89,201                    // vmulps        %ymm9,%ymm8,%ymm9
-  .byte  196,98,125,24,21,74,38,2,0          // vbroadcastss  0x2264a(%rip),%ymm10        # 3acd0 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  .byte  196,98,125,24,21,0,35,2,0           // vbroadcastss  0x22300(%rip),%ymm10        # 3a500 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
   .byte  196,65,52,88,202                    // vaddps        %ymm10,%ymm9,%ymm9
   .byte  196,65,60,89,201                    // vmulps        %ymm9,%ymm8,%ymm9
-  .byte  196,98,125,24,21,223,36,2,0         // vbroadcastss  0x224df(%rip),%ymm10        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,21,149,33,2,0         // vbroadcastss  0x22195(%rip),%ymm10        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,65,52,88,202                    // vaddps        %ymm10,%ymm9,%ymm9
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
-  .byte  196,98,125,24,13,40,38,2,0          // vbroadcastss  0x22628(%rip),%ymm9        # 3acd4 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
+  .byte  196,98,125,24,13,222,34,2,0         // vbroadcastss  0x222de(%rip),%ymm9        # 3a504 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
   .byte  196,65,60,88,193                    // vaddps        %ymm9,%ymm8,%ymm8
   .byte  197,124,17,128,0,1,0,0              // vmovups       %ymm8,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -23729,17 +23489,17 @@
 FUNCTION(_sk_bicubic_p1x_avx)
 _sk_bicubic_p1x_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,98,125,24,5,176,36,2,0          // vbroadcastss  0x224b0(%rip),%ymm8        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,5,102,33,2,0          // vbroadcastss  0x22166(%rip),%ymm8        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,188,88,0                        // vaddps        (%rax),%ymm8,%ymm0
   .byte  197,124,16,136,128,0,0,0            // vmovups       0x80(%rax),%ymm9
-  .byte  196,98,125,24,21,239,37,2,0         // vbroadcastss  0x225ef(%rip),%ymm10        # 3accc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  .byte  196,98,125,24,21,165,34,2,0         // vbroadcastss  0x222a5(%rip),%ymm10        # 3a4fc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
   .byte  196,65,52,89,210                    // vmulps        %ymm10,%ymm9,%ymm10
-  .byte  196,98,125,24,29,229,37,2,0         // vbroadcastss  0x225e5(%rip),%ymm11        # 3acd0 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  .byte  196,98,125,24,29,155,34,2,0         // vbroadcastss  0x2229b(%rip),%ymm11        # 3a500 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
   .byte  196,65,44,88,211                    // vaddps        %ymm11,%ymm10,%ymm10
   .byte  196,65,52,89,210                    // vmulps        %ymm10,%ymm9,%ymm10
   .byte  196,65,44,88,192                    // vaddps        %ymm8,%ymm10,%ymm8
   .byte  196,65,52,89,192                    // vmulps        %ymm8,%ymm9,%ymm8
-  .byte  196,98,125,24,13,204,37,2,0         // vbroadcastss  0x225cc(%rip),%ymm9        # 3acd4 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
+  .byte  196,98,125,24,13,130,34,2,0         // vbroadcastss  0x22282(%rip),%ymm9        # 3a504 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
   .byte  196,65,60,88,193                    // vaddps        %ymm9,%ymm8,%ymm8
   .byte  197,124,17,128,0,1,0,0              // vmovups       %ymm8,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -23750,13 +23510,13 @@
 FUNCTION(_sk_bicubic_p3x_avx)
 _sk_bicubic_p3x_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,172,37,2,0         // vbroadcastss  0x225ac(%rip),%ymm0        # 3acd0 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  .byte  196,226,125,24,5,98,34,2,0          // vbroadcastss  0x22262(%rip),%ymm0        # 3a500 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
   .byte  197,252,88,0                        // vaddps        (%rax),%ymm0,%ymm0
   .byte  197,124,16,128,128,0,0,0            // vmovups       0x80(%rax),%ymm8
   .byte  196,65,60,89,200                    // vmulps        %ymm8,%ymm8,%ymm9
-  .byte  196,98,125,24,21,138,37,2,0         // vbroadcastss  0x2258a(%rip),%ymm10        # 3acc8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
+  .byte  196,98,125,24,21,64,34,2,0          // vbroadcastss  0x22240(%rip),%ymm10        # 3a4f8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
   .byte  196,65,60,89,194                    // vmulps        %ymm10,%ymm8,%ymm8
-  .byte  196,98,125,24,21,164,36,2,0         // vbroadcastss  0x224a4(%rip),%ymm10        # 3abf0 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  .byte  196,98,125,24,21,90,33,2,0          // vbroadcastss  0x2215a(%rip),%ymm10        # 3a420 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
   .byte  196,65,60,88,194                    // vaddps        %ymm10,%ymm8,%ymm8
   .byte  196,65,52,89,192                    // vmulps        %ymm8,%ymm9,%ymm8
   .byte  197,124,17,128,0,1,0,0              // vmovups       %ymm8,0x100(%rax)
@@ -23768,14 +23528,14 @@
 FUNCTION(_sk_bicubic_n3y_avx)
 _sk_bicubic_n3y_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,13,87,37,2,0         // vbroadcastss  0x22557(%rip),%ymm1        # 3acc4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f8>
+  .byte  196,226,125,24,13,13,34,2,0         // vbroadcastss  0x2220d(%rip),%ymm1        # 3a4f4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f8>
   .byte  197,244,88,72,64                    // vaddps        0x40(%rax),%ymm1,%ymm1
-  .byte  196,98,125,24,5,1,36,2,0            // vbroadcastss  0x22401(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,183,32,2,0          // vbroadcastss  0x220b7(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,128,192,0,0,0             // vsubps        0xc0(%rax),%ymm8,%ymm8
   .byte  196,65,60,89,200                    // vmulps        %ymm8,%ymm8,%ymm9
-  .byte  196,98,125,24,21,55,37,2,0          // vbroadcastss  0x22537(%rip),%ymm10        # 3acc8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
+  .byte  196,98,125,24,21,237,33,2,0         // vbroadcastss  0x221ed(%rip),%ymm10        # 3a4f8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
   .byte  196,65,60,89,194                    // vmulps        %ymm10,%ymm8,%ymm8
-  .byte  196,98,125,24,21,81,36,2,0          // vbroadcastss  0x22451(%rip),%ymm10        # 3abf0 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  .byte  196,98,125,24,21,7,33,2,0           // vbroadcastss  0x22107(%rip),%ymm10        # 3a420 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
   .byte  196,65,60,88,194                    // vaddps        %ymm10,%ymm8,%ymm8
   .byte  196,65,52,89,192                    // vmulps        %ymm8,%ymm9,%ymm8
   .byte  197,124,17,128,64,1,0,0             // vmovups       %ymm8,0x140(%rax)
@@ -23787,19 +23547,19 @@
 FUNCTION(_sk_bicubic_n1y_avx)
 _sk_bicubic_n1y_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,13,0,37,2,0          // vbroadcastss  0x22500(%rip),%ymm1        # 3acc0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  .byte  196,226,125,24,13,182,33,2,0        // vbroadcastss  0x221b6(%rip),%ymm1        # 3a4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   .byte  197,244,88,72,64                    // vaddps        0x40(%rax),%ymm1,%ymm1
-  .byte  196,98,125,24,5,174,35,2,0          // vbroadcastss  0x223ae(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,100,32,2,0          // vbroadcastss  0x22064(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,128,192,0,0,0             // vsubps        0xc0(%rax),%ymm8,%ymm8
-  .byte  196,98,125,24,13,237,36,2,0         // vbroadcastss  0x224ed(%rip),%ymm9        # 3accc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  .byte  196,98,125,24,13,163,33,2,0         // vbroadcastss  0x221a3(%rip),%ymm9        # 3a4fc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
   .byte  196,65,60,89,201                    // vmulps        %ymm9,%ymm8,%ymm9
-  .byte  196,98,125,24,21,227,36,2,0         // vbroadcastss  0x224e3(%rip),%ymm10        # 3acd0 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  .byte  196,98,125,24,21,153,33,2,0         // vbroadcastss  0x22199(%rip),%ymm10        # 3a500 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
   .byte  196,65,52,88,202                    // vaddps        %ymm10,%ymm9,%ymm9
   .byte  196,65,60,89,201                    // vmulps        %ymm9,%ymm8,%ymm9
-  .byte  196,98,125,24,21,120,35,2,0         // vbroadcastss  0x22378(%rip),%ymm10        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,21,46,32,2,0          // vbroadcastss  0x2202e(%rip),%ymm10        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,65,52,88,202                    // vaddps        %ymm10,%ymm9,%ymm9
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
-  .byte  196,98,125,24,13,193,36,2,0         // vbroadcastss  0x224c1(%rip),%ymm9        # 3acd4 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
+  .byte  196,98,125,24,13,119,33,2,0         // vbroadcastss  0x22177(%rip),%ymm9        # 3a504 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
   .byte  196,65,60,88,193                    // vaddps        %ymm9,%ymm8,%ymm8
   .byte  197,124,17,128,64,1,0,0             // vmovups       %ymm8,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -23810,17 +23570,17 @@
 FUNCTION(_sk_bicubic_p1y_avx)
 _sk_bicubic_p1y_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,98,125,24,5,73,35,2,0           // vbroadcastss  0x22349(%rip),%ymm8        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,5,255,31,2,0          // vbroadcastss  0x21fff(%rip),%ymm8        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,188,88,72,64                    // vaddps        0x40(%rax),%ymm8,%ymm1
   .byte  197,124,16,136,192,0,0,0            // vmovups       0xc0(%rax),%ymm9
-  .byte  196,98,125,24,21,135,36,2,0         // vbroadcastss  0x22487(%rip),%ymm10        # 3accc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  .byte  196,98,125,24,21,61,33,2,0          // vbroadcastss  0x2213d(%rip),%ymm10        # 3a4fc <_sk_srcover_bgra_8888_sse2_lowp+0x400>
   .byte  196,65,52,89,210                    // vmulps        %ymm10,%ymm9,%ymm10
-  .byte  196,98,125,24,29,125,36,2,0         // vbroadcastss  0x2247d(%rip),%ymm11        # 3acd0 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  .byte  196,98,125,24,29,51,33,2,0          // vbroadcastss  0x22133(%rip),%ymm11        # 3a500 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
   .byte  196,65,44,88,211                    // vaddps        %ymm11,%ymm10,%ymm10
   .byte  196,65,52,89,210                    // vmulps        %ymm10,%ymm9,%ymm10
   .byte  196,65,44,88,192                    // vaddps        %ymm8,%ymm10,%ymm8
   .byte  196,65,52,89,192                    // vmulps        %ymm8,%ymm9,%ymm8
-  .byte  196,98,125,24,13,100,36,2,0         // vbroadcastss  0x22464(%rip),%ymm9        # 3acd4 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
+  .byte  196,98,125,24,13,26,33,2,0          // vbroadcastss  0x2211a(%rip),%ymm9        # 3a504 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
   .byte  196,65,60,88,193                    // vaddps        %ymm9,%ymm8,%ymm8
   .byte  197,124,17,128,64,1,0,0             // vmovups       %ymm8,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -23831,13 +23591,13 @@
 FUNCTION(_sk_bicubic_p3y_avx)
 _sk_bicubic_p3y_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,13,68,36,2,0         // vbroadcastss  0x22444(%rip),%ymm1        # 3acd0 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  .byte  196,226,125,24,13,250,32,2,0        // vbroadcastss  0x220fa(%rip),%ymm1        # 3a500 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
   .byte  197,244,88,72,64                    // vaddps        0x40(%rax),%ymm1,%ymm1
   .byte  197,124,16,128,192,0,0,0            // vmovups       0xc0(%rax),%ymm8
   .byte  196,65,60,89,200                    // vmulps        %ymm8,%ymm8,%ymm9
-  .byte  196,98,125,24,21,33,36,2,0          // vbroadcastss  0x22421(%rip),%ymm10        # 3acc8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
+  .byte  196,98,125,24,21,215,32,2,0         // vbroadcastss  0x220d7(%rip),%ymm10        # 3a4f8 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
   .byte  196,65,60,89,194                    // vmulps        %ymm10,%ymm8,%ymm8
-  .byte  196,98,125,24,21,59,35,2,0          // vbroadcastss  0x2233b(%rip),%ymm10        # 3abf0 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  .byte  196,98,125,24,21,241,31,2,0         // vbroadcastss  0x21ff1(%rip),%ymm10        # 3a420 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
   .byte  196,65,60,88,194                    // vaddps        %ymm10,%ymm8,%ymm8
   .byte  196,65,52,89,192                    // vmulps        %ymm8,%ymm9,%ymm8
   .byte  197,124,17,128,64,1,0,0             // vmovups       %ymm8,0x140(%rax)
@@ -23985,7 +23745,7 @@
   .byte  72,139,0                            // mov           (%rax),%rax
   .byte  197,217,254,207                     // vpaddd        %xmm7,%xmm4,%xmm1
   .byte  197,249,254,193                     // vpaddd        %xmm1,%xmm0,%xmm0
-  .byte  196,226,121,24,37,185,33,2,0        // vbroadcastss  0x221b9(%rip),%xmm4        # 3acdc <_sk_srcover_bgra_8888_sse2_lowp+0x410>
+  .byte  196,226,121,24,37,111,30,2,0        // vbroadcastss  0x21e6f(%rip),%xmm4        # 3a50c <_sk_srcover_bgra_8888_sse2_lowp+0x410>
   .byte  196,98,121,64,228                   // vpmulld       %xmm4,%xmm0,%xmm12
   .byte  196,226,49,64,198                   // vpmulld       %xmm6,%xmm9,%xmm0
   .byte  197,249,127,132,36,128,0,0,0        // vmovdqa       %xmm0,0x80(%rsp)
@@ -24039,7 +23799,7 @@
   .byte  196,161,122,16,60,128               // vmovss        (%rax,%r8,4),%xmm7
   .byte  196,227,73,33,247,48                // vinsertps     $0x30,%xmm7,%xmm6,%xmm6
   .byte  196,227,77,24,237,1                 // vinsertf128   $0x1,%xmm5,%ymm6,%ymm5
-  .byte  196,98,121,24,21,58,31,2,0          // vbroadcastss  0x21f3a(%rip),%xmm10        # 3ab88 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
+  .byte  196,98,121,24,21,240,27,2,0         // vbroadcastss  0x21bf0(%rip),%xmm10        # 3a3b8 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
   .byte  196,193,105,254,210                 // vpaddd        %xmm10,%xmm2,%xmm2
   .byte  196,195,249,22,208,1                // vpextrq       $0x1,%xmm2,%r8
   .byte  196,193,249,126,209                 // vmovq         %xmm2,%r9
@@ -24067,7 +23827,7 @@
   .byte  196,161,122,16,60,128               // vmovss        (%rax,%r8,4),%xmm7
   .byte  196,227,73,33,247,48                // vinsertps     $0x30,%xmm7,%xmm6,%xmm6
   .byte  196,227,77,24,210,1                 // vinsertf128   $0x1,%xmm2,%ymm6,%ymm2
-  .byte  196,226,125,24,61,246,31,2,0        // vbroadcastss  0x21ff6(%rip),%ymm7        # 3acd8 <_sk_srcover_bgra_8888_sse2_lowp+0x40c>
+  .byte  196,226,125,24,61,172,28,2,0        // vbroadcastss  0x21cac(%rip),%ymm7        # 3a508 <_sk_srcover_bgra_8888_sse2_lowp+0x40c>
   .byte  197,148,88,247                      // vaddps        %ymm7,%ymm13,%ymm6
   .byte  197,124,40,231                      // vmovaps       %ymm7,%ymm12
   .byte  197,124,17,36,36                    // vmovups       %ymm12,(%rsp)
@@ -24810,7 +24570,7 @@
   .byte  197,249,127,68,36,32                // vmovdqa       %xmm0,0x20(%rsp)
   .byte  197,225,254,216                     // vpaddd        %xmm0,%xmm3,%xmm3
   .byte  197,233,254,195                     // vpaddd        %xmm3,%xmm2,%xmm0
-  .byte  196,98,121,24,13,186,16,2,0         // vbroadcastss  0x210ba(%rip),%xmm9        # 3acdc <_sk_srcover_bgra_8888_sse2_lowp+0x410>
+  .byte  196,98,121,24,13,112,13,2,0         // vbroadcastss  0x20d70(%rip),%xmm9        # 3a50c <_sk_srcover_bgra_8888_sse2_lowp+0x410>
   .byte  196,194,121,64,209                  // vpmulld       %xmm9,%xmm0,%xmm2
   .byte  196,226,81,64,199                   // vpmulld       %xmm7,%xmm5,%xmm0
   .byte  197,249,127,132,36,96,1,0,0         // vmovdqa       %xmm0,0x160(%rsp)
@@ -24867,7 +24627,7 @@
   .byte  196,161,122,16,60,128               // vmovss        (%rax,%r8,4),%xmm7
   .byte  196,227,73,33,247,48                // vinsertps     $0x30,%xmm7,%xmm6,%xmm6
   .byte  196,227,77,24,237,1                 // vinsertf128   $0x1,%xmm5,%ymm6,%ymm5
-  .byte  196,98,121,24,21,43,14,2,0          // vbroadcastss  0x20e2b(%rip),%xmm10        # 3ab88 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
+  .byte  196,98,121,24,21,225,10,2,0         // vbroadcastss  0x20ae1(%rip),%xmm10        # 3a3b8 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
   .byte  196,193,121,254,194                 // vpaddd        %xmm10,%xmm0,%xmm0
   .byte  196,195,249,22,192,1                // vpextrq       $0x1,%xmm0,%r8
   .byte  196,193,249,126,193                 // vmovq         %xmm0,%r9
@@ -24895,7 +24655,7 @@
   .byte  196,161,122,16,52,128               // vmovss        (%rax,%r8,4),%xmm6
   .byte  196,227,105,33,214,48               // vinsertps     $0x30,%xmm6,%xmm2,%xmm2
   .byte  196,227,109,24,208,1                // vinsertf128   $0x1,%xmm0,%ymm2,%ymm2
-  .byte  196,98,125,24,37,231,14,2,0         // vbroadcastss  0x20ee7(%rip),%ymm12        # 3acd8 <_sk_srcover_bgra_8888_sse2_lowp+0x40c>
+  .byte  196,98,125,24,37,157,11,2,0         // vbroadcastss  0x20b9d(%rip),%ymm12        # 3a508 <_sk_srcover_bgra_8888_sse2_lowp+0x40c>
   .byte  196,193,4,88,196                    // vaddps        %ymm12,%ymm15,%ymm0
   .byte  197,124,17,36,36                    // vmovups       %ymm12,(%rsp)
   .byte  197,254,91,192                      // vcvttps2dq    %ymm0,%ymm0
@@ -26293,7 +26053,7 @@
   .byte  197,228,89,210                      // vmulps        %ymm2,%ymm3,%ymm2
   .byte  197,220,88,210                      // vaddps        %ymm2,%ymm4,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,76,240,1,0        // vbroadcastss  0x1f04c(%rip),%ymm3        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,29,2,237,1,0         // vbroadcastss  0x1ed02(%rip),%ymm3        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,252,16,164,36,64,2,0,0          // vmovups       0x240(%rsp),%ymm4
   .byte  197,252,16,172,36,96,2,0,0          // vmovups       0x260(%rsp),%ymm5
   .byte  197,252,16,180,36,128,2,0,0         // vmovups       0x280(%rsp),%ymm6
@@ -26309,18 +26069,18 @@
 .globl _sk_gauss_a_to_rgba_avx
 FUNCTION(_sk_gauss_a_to_rgba_avx)
 _sk_gauss_a_to_rgba_avx:
-  .byte  196,226,125,24,5,115,241,1,0        // vbroadcastss  0x1f173(%rip),%ymm0        # 3ace0 <_sk_srcover_bgra_8888_sse2_lowp+0x414>
+  .byte  196,226,125,24,5,41,238,1,0         // vbroadcastss  0x1ee29(%rip),%ymm0        # 3a510 <_sk_srcover_bgra_8888_sse2_lowp+0x414>
   .byte  197,228,89,192                      // vmulps        %ymm0,%ymm3,%ymm0
-  .byte  196,226,125,24,13,106,241,1,0       // vbroadcastss  0x1f16a(%rip),%ymm1        # 3ace4 <_sk_srcover_bgra_8888_sse2_lowp+0x418>
+  .byte  196,226,125,24,13,32,238,1,0        // vbroadcastss  0x1ee20(%rip),%ymm1        # 3a514 <_sk_srcover_bgra_8888_sse2_lowp+0x418>
   .byte  197,252,88,193                      // vaddps        %ymm1,%ymm0,%ymm0
   .byte  197,252,89,195                      // vmulps        %ymm3,%ymm0,%ymm0
-  .byte  196,226,125,24,13,93,241,1,0        // vbroadcastss  0x1f15d(%rip),%ymm1        # 3ace8 <_sk_srcover_bgra_8888_sse2_lowp+0x41c>
+  .byte  196,226,125,24,13,19,238,1,0        // vbroadcastss  0x1ee13(%rip),%ymm1        # 3a518 <_sk_srcover_bgra_8888_sse2_lowp+0x41c>
   .byte  197,252,88,193                      // vaddps        %ymm1,%ymm0,%ymm0
   .byte  197,252,89,195                      // vmulps        %ymm3,%ymm0,%ymm0
-  .byte  196,226,125,24,13,80,241,1,0        // vbroadcastss  0x1f150(%rip),%ymm1        # 3acec <_sk_srcover_bgra_8888_sse2_lowp+0x420>
+  .byte  196,226,125,24,13,6,238,1,0         // vbroadcastss  0x1ee06(%rip),%ymm1        # 3a51c <_sk_srcover_bgra_8888_sse2_lowp+0x420>
   .byte  197,252,88,193                      // vaddps        %ymm1,%ymm0,%ymm0
   .byte  197,252,89,195                      // vmulps        %ymm3,%ymm0,%ymm0
-  .byte  196,226,125,24,13,67,241,1,0        // vbroadcastss  0x1f143(%rip),%ymm1        # 3acf0 <_sk_srcover_bgra_8888_sse2_lowp+0x424>
+  .byte  196,226,125,24,13,249,237,1,0       // vbroadcastss  0x1edf9(%rip),%ymm1        # 3a520 <_sk_srcover_bgra_8888_sse2_lowp+0x424>
   .byte  197,252,88,193                      // vaddps        %ymm1,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,40,200                      // vmovaps       %ymm0,%ymm1
@@ -26342,7 +26102,7 @@
   .byte  197,252,17,108,36,224               // vmovups       %ymm5,-0x20(%rsp)
   .byte  197,252,17,100,36,192               // vmovups       %ymm4,-0x40(%rsp)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,135,239,1,0       // vbroadcastss  0x1ef87(%rip),%ymm3        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,226,125,24,29,61,236,1,0        // vbroadcastss  0x1ec3d(%rip),%ymm3        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,252,17,132,36,64,1,0,0          // vmovups       %ymm0,0x140(%rsp)
   .byte  197,252,88,195                      // vaddps        %ymm3,%ymm0,%ymm0
   .byte  196,227,125,8,208,1                 // vroundps      $0x1,%ymm0,%ymm2
@@ -26351,7 +26111,7 @@
   .byte  197,244,88,203                      // vaddps        %ymm3,%ymm1,%ymm1
   .byte  196,227,125,8,209,1                 // vroundps      $0x1,%ymm1,%ymm2
   .byte  197,244,92,210                      // vsubps        %ymm2,%ymm1,%ymm2
-  .byte  196,226,125,24,13,84,239,1,0        // vbroadcastss  0x1ef54(%rip),%ymm1        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,226,125,24,13,10,236,1,0        // vbroadcastss  0x1ec0a(%rip),%ymm1        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,252,17,132,36,32,1,0,0          // vmovups       %ymm0,0x120(%rsp)
   .byte  197,244,92,192                      // vsubps        %ymm0,%ymm1,%ymm0
   .byte  197,252,17,132,36,224,0,0,0         // vmovups       %ymm0,0xe0(%rsp)
@@ -26374,9 +26134,9 @@
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  196,226,125,24,64,8                 // vbroadcastss  0x8(%rax),%ymm0
   .byte  197,252,17,68,36,96                 // vmovups       %ymm0,0x60(%rsp)
-  .byte  197,250,16,5,14,240,1,0             // vmovss        0x1f00e(%rip),%xmm0        # 3acc0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
-  .byte  197,124,40,53,166,245,1,0           // vmovaps       0x1f5a6(%rip),%ymm14        # 3b260 <_sk_srcover_bgra_8888_sse2_lowp+0x994>
-  .byte  196,98,125,24,45,49,239,1,0         // vbroadcastss  0x1ef31(%rip),%ymm13        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  .byte  197,250,16,5,196,236,1,0            // vmovss        0x1ecc4(%rip),%xmm0        # 3a4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  .byte  197,124,40,53,108,242,1,0           // vmovaps       0x1f26c(%rip),%ymm14        # 3aaa0 <_sk_srcover_bgra_8888_sse2_lowp+0x9a4>
+  .byte  196,98,125,24,45,231,235,1,0        // vbroadcastss  0x1ebe7(%rip),%ymm13        # 3a424 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   .byte  197,228,87,219                      // vxorps        %ymm3,%ymm3,%ymm3
   .byte  197,236,87,210                      // vxorps        %ymm2,%ymm2,%ymm2
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
@@ -26388,10 +26148,10 @@
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
   .byte  197,252,95,201                      // vmaxps        %ymm1,%ymm0,%ymm1
   .byte  197,248,41,100,36,144               // vmovaps       %xmm4,-0x70(%rsp)
-  .byte  197,248,46,37,248,239,1,0           // vucomiss      0x1eff8(%rip),%xmm4        # 3acfc <_sk_srcover_bgra_8888_sse2_lowp+0x430>
+  .byte  197,248,46,37,174,236,1,0           // vucomiss      0x1ecae(%rip),%xmm4        # 3a52c <_sk_srcover_bgra_8888_sse2_lowp+0x430>
   .byte  197,252,16,132,36,160,0,0,0         // vmovups       0xa0(%rsp),%ymm0
   .byte  197,252,17,68,36,160                // vmovups       %ymm0,-0x60(%rsp)
-  .byte  119,12                              // ja            1bd21 <_sk_bilerp_clamp_8888_avx+0x160>
+  .byte  119,12                              // ja            1b89b <_sk_bilerp_clamp_8888_avx+0x160>
   .byte  197,252,16,68,36,64                 // vmovups       0x40(%rsp),%ymm0
   .byte  197,252,17,68,36,160                // vmovups       %ymm0,-0x60(%rsp)
   .byte  197,244,93,140,36,128,0,0,0         // vminps        0x80(%rsp),%ymm1,%ymm1
@@ -26402,7 +26162,7 @@
   .byte  196,226,73,64,237                   // vpmulld       %xmm5,%xmm6,%xmm5
   .byte  196,226,121,64,201                  // vpmulld       %xmm1,%xmm0,%xmm1
   .byte  196,99,117,24,253,1                 // vinsertf128   $0x1,%xmm5,%ymm1,%ymm15
-  .byte  197,122,16,37,104,239,1,0           // vmovss        0x1ef68(%rip),%xmm12        # 3acc0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  .byte  197,122,16,37,30,236,1,0            // vmovss        0x1ec1e(%rip),%xmm12        # 3a4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   .byte  196,195,121,4,204,0                 // vpermilps     $0x0,%xmm12,%xmm1
   .byte  196,227,117,24,201,1                // vinsertf128   $0x1,%xmm1,%ymm1,%ymm1
   .byte  197,244,88,140,36,64,1,0,0          // vaddps        0x140(%rsp),%ymm1,%ymm1
@@ -26455,9 +26215,9 @@
   .byte  196,227,117,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
   .byte  196,193,124,89,205                  // vmulps        %ymm13,%ymm0,%ymm1
-  .byte  197,120,46,37,141,238,1,0           // vucomiss      0x1ee8d(%rip),%xmm12        # 3acfc <_sk_srcover_bgra_8888_sse2_lowp+0x430>
+  .byte  197,120,46,37,67,235,1,0            // vucomiss      0x1eb43(%rip),%xmm12        # 3a52c <_sk_srcover_bgra_8888_sse2_lowp+0x430>
   .byte  197,124,16,148,36,32,1,0,0          // vmovups       0x120(%rsp),%ymm10
-  .byte  119,9                               // ja            1be83 <_sk_bilerp_clamp_8888_avx+0x2c2>
+  .byte  119,9                               // ja            1b9fd <_sk_bilerp_clamp_8888_avx+0x2c2>
   .byte  197,124,16,148,36,224,0,0,0         // vmovups       0xe0(%rsp),%ymm10
   .byte  197,172,89,68,36,160                // vmulps        -0x60(%rsp),%ymm10,%ymm0
   .byte  197,252,89,230                      // vmulps        %ymm6,%ymm0,%ymm4
@@ -26468,15 +26228,15 @@
   .byte  197,236,88,212                      // vaddps        %ymm4,%ymm2,%ymm2
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
   .byte  197,228,88,216                      // vaddps        %ymm0,%ymm3,%ymm3
-  .byte  197,26,88,37,202,236,1,0            // vaddss        0x1ecca(%rip),%xmm12,%xmm12        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
-  .byte  197,250,16,5,190,236,1,0            // vmovss        0x1ecbe(%rip),%xmm0        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  197,26,88,37,128,233,1,0            // vaddss        0x1e980(%rip),%xmm12,%xmm12        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  197,250,16,5,116,233,1,0            // vmovss        0x1e974(%rip),%xmm0        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,193,120,46,196                  // vucomiss      %xmm12,%xmm0
-  .byte  15,131,147,254,255,255              // jae           1bd58 <_sk_bilerp_clamp_8888_avx+0x197>
+  .byte  15,131,147,254,255,255              // jae           1b8d2 <_sk_bilerp_clamp_8888_avx+0x197>
   .byte  197,248,40,100,36,144               // vmovaps       -0x70(%rsp),%xmm4
-  .byte  197,218,88,37,169,236,1,0           // vaddss        0x1eca9(%rip),%xmm4,%xmm4        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
-  .byte  197,250,16,5,157,236,1,0            // vmovss        0x1ec9d(%rip),%xmm0        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  197,218,88,37,95,233,1,0            // vaddss        0x1e95f(%rip),%xmm4,%xmm4        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  197,250,16,5,83,233,1,0             // vmovss        0x1e953(%rip),%xmm0        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,248,46,196                      // vucomiss      %xmm4,%xmm0
-  .byte  15,131,244,253,255,255              // jae           1bcd9 <_sk_bilerp_clamp_8888_avx+0x118>
+  .byte  15,131,244,253,255,255              // jae           1b853 <_sk_bilerp_clamp_8888_avx+0x118>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,124,41,200                      // vmovaps       %ymm9,%ymm0
   .byte  197,124,41,193                      // vmovaps       %ymm8,%ymm1
@@ -26512,13 +26272,13 @@
   .byte  73,137,246                          // mov           %rsi,%r14
   .byte  72,137,77,192                       // mov           %rcx,-0x40(%rbp)
   .byte  72,57,203                           // cmp           %rcx,%rbx
-  .byte  15,131,131,0,0,0                    // jae           1bfcc <_sk_start_pipeline_sse41+0xb6>
+  .byte  15,131,131,0,0,0                    // jae           1bb46 <_sk_start_pipeline_sse41+0xb6>
   .byte  72,139,69,208                       // mov           -0x30(%rbp),%rax
   .byte  72,141,64,4                         // lea           0x4(%rax),%rax
   .byte  72,137,69,200                       // mov           %rax,-0x38(%rbp)
   .byte  76,57,125,200                       // cmp           %r15,-0x38(%rbp)
   .byte  72,139,85,208                       // mov           -0x30(%rbp),%rdx
-  .byte  119,59                              // ja            1bf9a <_sk_start_pipeline_sse41+0x84>
+  .byte  119,59                              // ja            1bb14 <_sk_start_pipeline_sse41+0x84>
   .byte  76,139,101,208                      // mov           -0x30(%rbp),%r12
   .byte  49,255                              // xor           %edi,%edi
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
@@ -26537,10 +26297,10 @@
   .byte  73,131,196,8                        // add           $0x8,%r12
   .byte  77,57,252                           // cmp           %r15,%r12
   .byte  73,137,212                          // mov           %rdx,%r12
-  .byte  118,201                             // jbe           1bf63 <_sk_start_pipeline_sse41+0x4d>
+  .byte  118,201                             // jbe           1badd <_sk_start_pipeline_sse41+0x4d>
   .byte  76,137,255                          // mov           %r15,%rdi
   .byte  72,41,215                           // sub           %rdx,%rdi
-  .byte  116,33                              // je            1bfc3 <_sk_start_pipeline_sse41+0xad>
+  .byte  116,33                              // je            1bb3d <_sk_start_pipeline_sse41+0xad>
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  15,87,201                           // xorps         %xmm1,%xmm1
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
@@ -26554,7 +26314,7 @@
   .byte  65,255,213                          // callq         *%r13
   .byte  72,255,195                          // inc           %rbx
   .byte  72,59,93,192                        // cmp           -0x40(%rbp),%rbx
-  .byte  117,137                             // jne           1bf55 <_sk_start_pipeline_sse41+0x3f>
+  .byte  117,137                             // jne           1bacf <_sk_start_pipeline_sse41+0x3f>
   .byte  72,131,196,24                       // add           $0x18,%rsp
   .byte  91                                  // pop           %rbx
   .byte  65,92                               // pop           %r12
@@ -26583,9 +26343,9 @@
   .byte  102,15,110,201                      // movd          %ecx,%xmm1
   .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
-  .byte  15,88,13,93,245,1,0                 // addps         0x1f55d(%rip),%xmm1        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  15,88,13,35,242,1,0                 // addps         0x1f223(%rip),%xmm1        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,21,100,245,1,0                // movaps        0x1f564(%rip),%xmm2        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,21,42,242,1,0                 // movaps        0x1f22a(%rip),%xmm2        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
   .byte  15,87,228                           // xorps         %xmm4,%xmm4
   .byte  15,87,237                           // xorps         %xmm5,%xmm5
@@ -26600,18 +26360,18 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  102,68,15,110,194                   // movd          %edx,%xmm8
   .byte  102,69,15,112,192,0                 // pshufd        $0x0,%xmm8,%xmm8
-  .byte  102,68,15,254,5,13,245,1,0          // paddd         0x1f50d(%rip),%xmm8        # 3b540 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  .byte  102,68,15,254,5,211,241,1,0         // paddd         0x1f1d3(%rip),%xmm8        # 3ad80 <_sk_srcover_bgra_8888_sse2_lowp+0xc84>
   .byte  102,68,15,110,201                   // movd          %ecx,%xmm9
   .byte  102,69,15,112,201,0                 // pshufd        $0x0,%xmm9,%xmm9
   .byte  102,69,15,239,200                   // pxor          %xmm8,%xmm9
-  .byte  102,68,15,111,21,52,245,1,0         // movdqa        0x1f534(%rip),%xmm10        # 3b580 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
+  .byte  102,68,15,111,21,250,241,1,0        // movdqa        0x1f1fa(%rip),%xmm10        # 3adc0 <_sk_srcover_bgra_8888_sse2_lowp+0xcc4>
   .byte  102,69,15,111,217                   // movdqa        %xmm9,%xmm11
   .byte  102,69,15,219,218                   // pand          %xmm10,%xmm11
   .byte  102,65,15,114,243,5                 // pslld         $0x5,%xmm11
   .byte  102,69,15,219,208                   // pand          %xmm8,%xmm10
   .byte  102,65,15,114,242,4                 // pslld         $0x4,%xmm10
-  .byte  102,68,15,111,37,32,245,1,0         // movdqa        0x1f520(%rip),%xmm12        # 3b590 <_sk_srcover_bgra_8888_sse2_lowp+0xcc4>
-  .byte  102,68,15,111,45,39,245,1,0         // movdqa        0x1f527(%rip),%xmm13        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,68,15,111,37,230,241,1,0        // movdqa        0x1f1e6(%rip),%xmm12        # 3add0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,68,15,111,45,237,241,1,0        // movdqa        0x1f1ed(%rip),%xmm13        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,69,15,111,241                   // movdqa        %xmm9,%xmm14
   .byte  102,69,15,219,245                   // pand          %xmm13,%xmm14
   .byte  102,65,15,114,246,2                 // pslld         $0x2,%xmm14
@@ -26627,8 +26387,8 @@
   .byte  102,69,15,235,198                   // por           %xmm14,%xmm8
   .byte  102,69,15,235,193                   // por           %xmm9,%xmm8
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
-  .byte  68,15,89,5,226,244,1,0              // mulps         0x1f4e2(%rip),%xmm8        # 3b5b0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
-  .byte  68,15,88,5,234,244,1,0              // addps         0x1f4ea(%rip),%xmm8        # 3b5c0 <_sk_srcover_bgra_8888_sse2_lowp+0xcf4>
+  .byte  68,15,89,5,168,241,1,0              // mulps         0x1f1a8(%rip),%xmm8        # 3adf0 <_sk_srcover_bgra_8888_sse2_lowp+0xcf4>
+  .byte  68,15,88,5,176,241,1,0              // addps         0x1f1b0(%rip),%xmm8        # 3ae00 <_sk_srcover_bgra_8888_sse2_lowp+0xd04>
   .byte  243,68,15,16,16                     // movss         (%rax),%xmm10
   .byte  69,15,198,210,0                     // shufps        $0x0,%xmm10,%xmm10
   .byte  69,15,89,208                        // mulps         %xmm8,%xmm10
@@ -26670,7 +26430,7 @@
 FUNCTION(_sk_black_color_sse41)
 _sk_black_color_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,32,244,1,0                 // movaps        0x1f420(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,29,230,240,1,0                // movaps        0x1f0e6(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  15,87,201                           // xorps         %xmm1,%xmm1
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
@@ -26681,7 +26441,7 @@
 FUNCTION(_sk_white_color_sse41)
 _sk_white_color_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,5,12,244,1,0                  // movaps        0x1f40c(%rip),%xmm0        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,5,210,240,1,0                 // movaps        0x1f0d2(%rip),%xmm0        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  15,40,216                           // movaps        %xmm0,%xmm3
@@ -26727,7 +26487,7 @@
 FUNCTION(_sk_srcatop_sse41)
 _sk_srcatop_sse41:
   .byte  15,89,199                           // mulps         %xmm7,%xmm0
-  .byte  68,15,40,5,188,243,1,0              // movaps        0x1f3bc(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,130,240,1,0              // movaps        0x1f082(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,92,195                        // subps         %xmm3,%xmm8
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  68,15,89,204                        // mulps         %xmm4,%xmm9
@@ -26752,7 +26512,7 @@
 _sk_dstatop_sse41:
   .byte  68,15,40,195                        // movaps        %xmm3,%xmm8
   .byte  68,15,89,196                        // mulps         %xmm4,%xmm8
-  .byte  68,15,40,13,111,243,1,0             // movaps        0x1f36f(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,13,53,240,1,0              // movaps        0x1f035(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,92,207                        // subps         %xmm7,%xmm9
   .byte  65,15,89,193                        // mulps         %xmm9,%xmm0
   .byte  65,15,88,192                        // addps         %xmm8,%xmm0
@@ -26799,7 +26559,7 @@
 .globl _sk_srcout_sse41
 FUNCTION(_sk_srcout_sse41)
 _sk_srcout_sse41:
-  .byte  68,15,40,5,3,243,1,0                // movaps        0x1f303(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,201,239,1,0              // movaps        0x1efc9(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,92,199                        // subps         %xmm7,%xmm8
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  65,15,89,200                        // mulps         %xmm8,%xmm1
@@ -26812,7 +26572,7 @@
 .globl _sk_dstout_sse41
 FUNCTION(_sk_dstout_sse41)
 _sk_dstout_sse41:
-  .byte  68,15,40,5,227,242,1,0              // movaps        0x1f2e3(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,169,239,1,0              // movaps        0x1efa9(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,92,195                        // subps         %xmm3,%xmm8
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  15,89,196                           // mulps         %xmm4,%xmm0
@@ -26829,7 +26589,7 @@
 .globl _sk_srcover_sse41
 FUNCTION(_sk_srcover_sse41)
 _sk_srcover_sse41:
-  .byte  68,15,40,5,182,242,1,0              // movaps        0x1f2b6(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,124,239,1,0              // movaps        0x1ef7c(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,92,195                        // subps         %xmm3,%xmm8
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  68,15,89,204                        // mulps         %xmm4,%xmm9
@@ -26849,7 +26609,7 @@
 .globl _sk_dstover_sse41
 FUNCTION(_sk_dstover_sse41)
 _sk_dstover_sse41:
-  .byte  68,15,40,5,122,242,1,0              // movaps        0x1f27a(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,64,239,1,0               // movaps        0x1ef40(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,92,199                        // subps         %xmm7,%xmm8
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  15,88,196                           // addps         %xmm4,%xmm0
@@ -26877,7 +26637,7 @@
 .globl _sk_multiply_sse41
 FUNCTION(_sk_multiply_sse41)
 _sk_multiply_sse41:
-  .byte  68,15,40,5,62,242,1,0               // movaps        0x1f23e(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,4,239,1,0                // movaps        0x1ef04(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  68,15,92,207                        // subps         %xmm7,%xmm9
   .byte  69,15,40,209                        // movaps        %xmm9,%xmm10
@@ -26915,7 +26675,7 @@
 FUNCTION(_sk_plus__sse41)
 _sk_plus__sse41:
   .byte  15,88,196                           // addps         %xmm4,%xmm0
-  .byte  68,15,40,5,191,241,1,0              // movaps        0x1f1bf(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,133,238,1,0              // movaps        0x1ee85(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  65,15,93,192                        // minps         %xmm8,%xmm0
   .byte  15,88,205                           // addps         %xmm5,%xmm1
   .byte  65,15,93,200                        // minps         %xmm8,%xmm1
@@ -26957,7 +26717,7 @@
 FUNCTION(_sk_xor__sse41)
 _sk_xor__sse41:
   .byte  68,15,40,195                        // movaps        %xmm3,%xmm8
-  .byte  15,40,29,75,241,1,0                 // movaps        0x1f14b(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,29,17,238,1,0                 // movaps        0x1ee11(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,40,203                        // movaps        %xmm3,%xmm9
   .byte  68,15,92,207                        // subps         %xmm7,%xmm9
   .byte  65,15,89,193                        // mulps         %xmm9,%xmm0
@@ -27005,7 +26765,7 @@
   .byte  68,15,89,206                        // mulps         %xmm6,%xmm9
   .byte  65,15,95,209                        // maxps         %xmm9,%xmm2
   .byte  68,15,92,194                        // subps         %xmm2,%xmm8
-  .byte  15,40,21,166,240,1,0                // movaps        0x1f0a6(%rip),%xmm2        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,21,108,237,1,0                // movaps        0x1ed6c(%rip),%xmm2        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,92,211                           // subps         %xmm3,%xmm2
   .byte  15,89,215                           // mulps         %xmm7,%xmm2
   .byte  15,88,218                           // addps         %xmm2,%xmm3
@@ -27039,7 +26799,7 @@
   .byte  68,15,89,206                        // mulps         %xmm6,%xmm9
   .byte  65,15,93,209                        // minps         %xmm9,%xmm2
   .byte  68,15,92,194                        // subps         %xmm2,%xmm8
-  .byte  15,40,21,59,240,1,0                 // movaps        0x1f03b(%rip),%xmm2        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,21,1,237,1,0                  // movaps        0x1ed01(%rip),%xmm2        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,92,211                           // subps         %xmm3,%xmm2
   .byte  15,89,215                           // mulps         %xmm7,%xmm2
   .byte  15,88,218                           // addps         %xmm2,%xmm3
@@ -27076,7 +26836,7 @@
   .byte  65,15,93,209                        // minps         %xmm9,%xmm2
   .byte  15,88,210                           // addps         %xmm2,%xmm2
   .byte  68,15,92,194                        // subps         %xmm2,%xmm8
-  .byte  15,40,21,197,239,1,0                // movaps        0x1efc5(%rip),%xmm2        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,21,139,236,1,0                // movaps        0x1ec8b(%rip),%xmm2        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,92,211                           // subps         %xmm3,%xmm2
   .byte  15,89,215                           // mulps         %xmm7,%xmm2
   .byte  15,88,218                           // addps         %xmm2,%xmm3
@@ -27104,7 +26864,7 @@
   .byte  15,89,214                           // mulps         %xmm6,%xmm2
   .byte  15,88,210                           // addps         %xmm2,%xmm2
   .byte  68,15,92,194                        // subps         %xmm2,%xmm8
-  .byte  15,40,21,117,239,1,0                // movaps        0x1ef75(%rip),%xmm2        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,21,59,236,1,0                 // movaps        0x1ec3b(%rip),%xmm2        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,92,211                           // subps         %xmm3,%xmm2
   .byte  15,89,215                           // mulps         %xmm7,%xmm2
   .byte  15,88,218                           // addps         %xmm2,%xmm3
@@ -27116,7 +26876,7 @@
 .globl _sk_colorburn_sse41
 FUNCTION(_sk_colorburn_sse41)
 _sk_colorburn_sse41:
-  .byte  68,15,40,29,92,239,1,0              // movaps        0x1ef5c(%rip),%xmm11        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,29,34,236,1,0              // movaps        0x1ec22(%rip),%xmm11        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,40,227                        // movaps        %xmm11,%xmm12
   .byte  68,15,92,231                        // subps         %xmm7,%xmm12
   .byte  69,15,40,204                        // movaps        %xmm12,%xmm9
@@ -27200,7 +26960,7 @@
 FUNCTION(_sk_colordodge_sse41)
 _sk_colordodge_sse41:
   .byte  68,15,40,192                        // movaps        %xmm0,%xmm8
-  .byte  68,15,40,21,38,238,1,0              // movaps        0x1ee26(%rip),%xmm10        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,21,236,234,1,0             // movaps        0x1eaec(%rip),%xmm10        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,40,218                        // movaps        %xmm10,%xmm11
   .byte  68,15,92,223                        // subps         %xmm7,%xmm11
   .byte  69,15,40,227                        // movaps        %xmm11,%xmm12
@@ -27282,7 +27042,7 @@
   .byte  15,40,244                           // movaps        %xmm4,%xmm6
   .byte  15,40,227                           // movaps        %xmm3,%xmm4
   .byte  68,15,40,200                        // movaps        %xmm0,%xmm9
-  .byte  68,15,40,21,241,236,1,0             // movaps        0x1ecf1(%rip),%xmm10        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,21,183,233,1,0             // movaps        0x1e9b7(%rip),%xmm10        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  65,15,40,234                        // movaps        %xmm10,%xmm5
   .byte  15,92,239                           // subps         %xmm7,%xmm5
   .byte  15,40,197                           // movaps        %xmm5,%xmm0
@@ -27365,7 +27125,7 @@
 _sk_overlay_sse41:
   .byte  68,15,40,201                        // movaps        %xmm1,%xmm9
   .byte  68,15,40,240                        // movaps        %xmm0,%xmm14
-  .byte  68,15,40,21,198,235,1,0             // movaps        0x1ebc6(%rip),%xmm10        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,21,140,232,1,0             // movaps        0x1e88c(%rip),%xmm10        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,40,218                        // movaps        %xmm10,%xmm11
   .byte  68,15,92,223                        // subps         %xmm7,%xmm11
   .byte  65,15,40,195                        // movaps        %xmm11,%xmm0
@@ -27450,7 +27210,7 @@
   .byte  15,40,198                           // movaps        %xmm6,%xmm0
   .byte  15,94,199                           // divps         %xmm7,%xmm0
   .byte  65,15,84,193                        // andps         %xmm9,%xmm0
-  .byte  15,40,13,141,234,1,0                // movaps        0x1ea8d(%rip),%xmm1        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,13,83,231,1,0                 // movaps        0x1e753(%rip),%xmm1        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,40,209                        // movaps        %xmm1,%xmm10
   .byte  68,15,92,208                        // subps         %xmm0,%xmm10
   .byte  68,15,40,240                        // movaps        %xmm0,%xmm14
@@ -27463,10 +27223,10 @@
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  15,89,210                           // mulps         %xmm2,%xmm2
   .byte  15,88,208                           // addps         %xmm0,%xmm2
-  .byte  68,15,40,45,187,234,1,0             // movaps        0x1eabb(%rip),%xmm13        # 3b5d0 <_sk_srcover_bgra_8888_sse2_lowp+0xd04>
+  .byte  68,15,40,45,129,231,1,0             // movaps        0x1e781(%rip),%xmm13        # 3ae10 <_sk_srcover_bgra_8888_sse2_lowp+0xd14>
   .byte  69,15,88,245                        // addps         %xmm13,%xmm14
   .byte  68,15,89,242                        // mulps         %xmm2,%xmm14
-  .byte  68,15,40,37,187,234,1,0             // movaps        0x1eabb(%rip),%xmm12        # 3b5e0 <_sk_srcover_bgra_8888_sse2_lowp+0xd14>
+  .byte  68,15,40,37,129,231,1,0             // movaps        0x1e781(%rip),%xmm12        # 3ae20 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
   .byte  69,15,89,252                        // mulps         %xmm12,%xmm15
   .byte  69,15,88,254                        // addps         %xmm14,%xmm15
   .byte  15,40,198                           // movaps        %xmm6,%xmm0
@@ -27652,12 +27412,12 @@
   .byte  68,15,84,208                        // andps         %xmm0,%xmm10
   .byte  15,84,200                           // andps         %xmm0,%xmm1
   .byte  68,15,84,232                        // andps         %xmm0,%xmm13
-  .byte  15,40,5,38,232,1,0                  // movaps        0x1e826(%rip),%xmm0        # 3b5f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  .byte  15,40,5,236,228,1,0                 // movaps        0x1e4ec(%rip),%xmm0        # 3ae30 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
   .byte  68,15,89,224                        // mulps         %xmm0,%xmm12
-  .byte  15,40,21,43,232,1,0                 // movaps        0x1e82b(%rip),%xmm2        # 3b600 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
+  .byte  15,40,21,241,228,1,0                // movaps        0x1e4f1(%rip),%xmm2        # 3ae40 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
   .byte  15,89,250                           // mulps         %xmm2,%xmm7
   .byte  65,15,88,252                        // addps         %xmm12,%xmm7
-  .byte  68,15,40,53,44,232,1,0              // movaps        0x1e82c(%rip),%xmm14        # 3b610 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
+  .byte  68,15,40,53,242,228,1,0             // movaps        0x1e4f2(%rip),%xmm14        # 3ae50 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
   .byte  68,15,40,252                        // movaps        %xmm4,%xmm15
   .byte  69,15,89,254                        // mulps         %xmm14,%xmm15
   .byte  68,15,88,255                        // addps         %xmm7,%xmm15
@@ -27740,7 +27500,7 @@
   .byte  65,15,88,214                        // addps         %xmm14,%xmm2
   .byte  15,40,196                           // movaps        %xmm4,%xmm0
   .byte  102,15,56,20,202                    // blendvps      %xmm0,%xmm2,%xmm1
-  .byte  68,15,40,13,64,230,1,0              // movaps        0x1e640(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,13,6,227,1,0               // movaps        0x1e306(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  65,15,40,225                        // movaps        %xmm9,%xmm4
   .byte  15,92,229                           // subps         %xmm5,%xmm4
   .byte  15,40,68,36,200                     // movaps        -0x38(%rsp),%xmm0
@@ -27834,14 +27594,14 @@
   .byte  68,15,84,215                        // andps         %xmm7,%xmm10
   .byte  68,15,84,223                        // andps         %xmm7,%xmm11
   .byte  68,15,84,199                        // andps         %xmm7,%xmm8
-  .byte  15,40,21,106,229,1,0                // movaps        0x1e56a(%rip),%xmm2        # 3b5f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  .byte  15,40,21,48,226,1,0                 // movaps        0x1e230(%rip),%xmm2        # 3ae30 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
   .byte  15,40,221                           // movaps        %xmm5,%xmm3
   .byte  15,89,218                           // mulps         %xmm2,%xmm3
-  .byte  15,40,13,109,229,1,0                // movaps        0x1e56d(%rip),%xmm1        # 3b600 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
+  .byte  15,40,13,51,226,1,0                 // movaps        0x1e233(%rip),%xmm1        # 3ae40 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
   .byte  15,40,254                           // movaps        %xmm6,%xmm7
   .byte  15,89,249                           // mulps         %xmm1,%xmm7
   .byte  15,88,251                           // addps         %xmm3,%xmm7
-  .byte  68,15,40,45,108,229,1,0             // movaps        0x1e56c(%rip),%xmm13        # 3b610 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
+  .byte  68,15,40,45,50,226,1,0              // movaps        0x1e232(%rip),%xmm13        # 3ae50 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
   .byte  69,15,89,245                        // mulps         %xmm13,%xmm14
   .byte  68,15,88,247                        // addps         %xmm7,%xmm14
   .byte  65,15,40,218                        // movaps        %xmm10,%xmm3
@@ -27922,7 +27682,7 @@
   .byte  65,15,88,253                        // addps         %xmm13,%xmm7
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  102,68,15,56,20,223                 // blendvps      %xmm0,%xmm7,%xmm11
-  .byte  68,15,40,13,130,227,1,0             // movaps        0x1e382(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,13,72,224,1,0              // movaps        0x1e048(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,40,193                        // movaps        %xmm9,%xmm8
   .byte  68,15,92,204                        // subps         %xmm4,%xmm9
   .byte  15,40,124,36,168                    // movaps        -0x58(%rsp),%xmm7
@@ -27977,14 +27737,14 @@
   .byte  15,40,231                           // movaps        %xmm7,%xmm4
   .byte  68,15,89,244                        // mulps         %xmm4,%xmm14
   .byte  15,89,204                           // mulps         %xmm4,%xmm1
-  .byte  68,15,40,13,61,227,1,0              // movaps        0x1e33d(%rip),%xmm9        # 3b5f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  .byte  68,15,40,13,3,224,1,0               // movaps        0x1e003(%rip),%xmm9        # 3ae30 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
   .byte  65,15,40,250                        // movaps        %xmm10,%xmm7
   .byte  65,15,89,249                        // mulps         %xmm9,%xmm7
-  .byte  68,15,40,21,61,227,1,0              // movaps        0x1e33d(%rip),%xmm10        # 3b600 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
+  .byte  68,15,40,21,3,224,1,0               // movaps        0x1e003(%rip),%xmm10        # 3ae40 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
   .byte  65,15,40,219                        // movaps        %xmm11,%xmm3
   .byte  65,15,89,218                        // mulps         %xmm10,%xmm3
   .byte  15,88,223                           // addps         %xmm7,%xmm3
-  .byte  68,15,40,29,58,227,1,0              // movaps        0x1e33a(%rip),%xmm11        # 3b610 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
+  .byte  68,15,40,29,0,224,1,0               // movaps        0x1e000(%rip),%xmm11        # 3ae50 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
   .byte  69,15,40,236                        // movaps        %xmm12,%xmm13
   .byte  69,15,89,235                        // mulps         %xmm11,%xmm13
   .byte  68,15,88,235                        // addps         %xmm3,%xmm13
@@ -28069,7 +27829,7 @@
   .byte  65,15,88,251                        // addps         %xmm11,%xmm7
   .byte  65,15,40,194                        // movaps        %xmm10,%xmm0
   .byte  102,15,56,20,207                    // blendvps      %xmm0,%xmm7,%xmm1
-  .byte  68,15,40,13,70,225,1,0              // movaps        0x1e146(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,13,12,222,1,0              // movaps        0x1de0c(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
   .byte  15,92,196                           // subps         %xmm4,%xmm0
   .byte  68,15,89,192                        // mulps         %xmm0,%xmm8
@@ -28121,13 +27881,13 @@
   .byte  69,15,89,216                        // mulps         %xmm8,%xmm11
   .byte  68,15,40,203                        // movaps        %xmm3,%xmm9
   .byte  68,15,89,205                        // mulps         %xmm5,%xmm9
-  .byte  68,15,40,5,14,225,1,0               // movaps        0x1e10e(%rip),%xmm8        # 3b5f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  .byte  68,15,40,5,212,221,1,0              // movaps        0x1ddd4(%rip),%xmm8        # 3ae30 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
-  .byte  68,15,40,21,18,225,1,0              // movaps        0x1e112(%rip),%xmm10        # 3b600 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
+  .byte  68,15,40,21,216,221,1,0             // movaps        0x1ddd8(%rip),%xmm10        # 3ae40 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
   .byte  15,40,233                           // movaps        %xmm1,%xmm5
   .byte  65,15,89,234                        // mulps         %xmm10,%xmm5
   .byte  15,88,232                           // addps         %xmm0,%xmm5
-  .byte  68,15,40,37,16,225,1,0              // movaps        0x1e110(%rip),%xmm12        # 3b610 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
+  .byte  68,15,40,37,214,221,1,0             // movaps        0x1ddd6(%rip),%xmm12        # 3ae50 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
   .byte  68,15,40,242                        // movaps        %xmm2,%xmm14
   .byte  69,15,89,244                        // mulps         %xmm12,%xmm14
   .byte  68,15,88,245                        // addps         %xmm5,%xmm14
@@ -28212,7 +27972,7 @@
   .byte  65,15,88,244                        // addps         %xmm12,%xmm6
   .byte  65,15,40,195                        // movaps        %xmm11,%xmm0
   .byte  102,68,15,56,20,206                 // blendvps      %xmm0,%xmm6,%xmm9
-  .byte  15,40,5,22,223,1,0                  // movaps        0x1df16(%rip),%xmm0        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,5,220,219,1,0                 // movaps        0x1dbdc(%rip),%xmm0        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  15,92,215                           // subps         %xmm7,%xmm2
   .byte  15,89,226                           // mulps         %xmm2,%xmm4
@@ -28251,31 +28011,29 @@
 _sk_srcover_rgba_8888_sse41:
   .byte  102,68,15,111,200                   // movdqa        %xmm0,%xmm9
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,0,1,0,0                      // jne           1d7ec <_sk_srcover_rgba_8888_sse41+0x125>
-  .byte  243,65,15,111,4,128                 // movdqu        (%r8,%rax,4),%xmm0
+  .byte  15,133,0,1,0,0                      // jne           1d360 <_sk_srcover_rgba_8888_sse41+0x11f>
+  .byte  243,65,15,111,4,144                 // movdqu        (%r8,%rdx,4),%xmm0
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  102,15,111,37,35,223,1,0            // movdqa        0x1df23(%rip),%xmm4        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  102,15,111,37,239,219,1,0           // movdqa        0x1dbef(%rip),%xmm4        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  102,15,219,224                      // pand          %xmm0,%xmm4
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
   .byte  102,15,111,232                      // movdqa        %xmm0,%xmm5
-  .byte  102,15,56,0,45,31,223,1,0           // pshufb        0x1df1f(%rip),%xmm5        # 3b630 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
+  .byte  102,15,56,0,45,235,219,1,0          // pshufb        0x1dbeb(%rip),%xmm5        # 3ae70 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
   .byte  15,91,237                           // cvtdq2ps      %xmm5,%xmm5
   .byte  102,15,111,240                      // movdqa        %xmm0,%xmm6
-  .byte  102,15,56,0,53,31,223,1,0           // pshufb        0x1df1f(%rip),%xmm6        # 3b640 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
+  .byte  102,15,56,0,53,235,219,1,0          // pshufb        0x1dbeb(%rip),%xmm6        # 3ae80 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
   .byte  69,15,87,219                        // xorps         %xmm11,%xmm11
   .byte  15,91,246                           // cvtdq2ps      %xmm6,%xmm6
   .byte  102,15,114,208,24                   // psrld         $0x18,%xmm0
   .byte  15,91,248                           // cvtdq2ps      %xmm0,%xmm7
-  .byte  68,15,40,5,56,222,1,0               // movaps        0x1de38(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,4,219,1,0                // movaps        0x1db04(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,92,195                        // subps         %xmm3,%xmm8
-  .byte  68,15,40,37,12,223,1,0              // movaps        0x1df0c(%rip),%xmm12        # 3b650 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  .byte  68,15,40,37,216,219,1,0             // movaps        0x1dbd8(%rip),%xmm12        # 3ae90 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
   .byte  69,15,89,204                        // mulps         %xmm12,%xmm9
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  15,89,196                           // mulps         %xmm4,%xmm0
@@ -28312,42 +28070,42 @@
   .byte  102,15,114,241,24                   // pslld         $0x18,%xmm1
   .byte  102,15,235,203                      // por           %xmm3,%xmm1
   .byte  102,15,235,202                      // por           %xmm2,%xmm1
-  .byte  117,84                              // jne           1d82a <_sk_srcover_rgba_8888_sse41+0x163>
-  .byte  243,65,15,127,12,128                // movdqu        %xmm1,(%r8,%rax,4)
+  .byte  117,75                              // jne           1d395 <_sk_srcover_rgba_8888_sse41+0x154>
+  .byte  243,65,15,127,12,144                // movdqu        %xmm1,(%r8,%rdx,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,201                        // movaps        %xmm9,%xmm1
   .byte  65,15,40,210                        // movaps        %xmm10,%xmm2
   .byte  65,15,40,216                        // movaps        %xmm8,%xmm3
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,91                              // je            1d854 <_sk_srcover_rgba_8888_sse41+0x18d>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,78                              // je            1d3b6 <_sk_srcover_rgba_8888_sse41+0x175>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,22                              // je            1d819 <_sk_srcover_rgba_8888_sse41+0x152>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  15,133,229,254,255,255              // jne           1d6f2 <_sk_srcover_rgba_8888_sse41+0x2b>
-  .byte  102,65,15,110,68,128,8              // movd          0x8(%r8,%rax,4),%xmm0
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,20                              // je            1d384 <_sk_srcover_rgba_8888_sse41+0x143>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  15,133,238,254,255,255              // jne           1d266 <_sk_srcover_rgba_8888_sse41+0x25>
+  .byte  102,65,15,110,68,144,8              // movd          0x8(%r8,%rdx,4),%xmm0
   .byte  102,15,112,192,69                   // pshufd        $0x45,%xmm0,%xmm0
-  .byte  243,65,15,126,36,128                // movq          (%r8,%rax,4),%xmm4
+  .byte  243,65,15,126,36,144                // movq          (%r8,%rdx,4),%xmm4
   .byte  102,15,58,14,196,15                 // pblendw       $0xf,%xmm4,%xmm0
-  .byte  233,200,254,255,255                 // jmpq          1d6f2 <_sk_srcover_rgba_8888_sse41+0x2b>
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,40                              // je            1d85f <_sk_srcover_rgba_8888_sse41+0x198>
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,15                              // je            1d84c <_sk_srcover_rgba_8888_sse41+0x185>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,153                             // jne           1d7dc <_sk_srcover_rgba_8888_sse41+0x115>
-  .byte  102,65,15,58,22,76,128,8,2          // pextrd        $0x2,%xmm1,0x8(%r8,%rax,4)
-  .byte  102,65,15,214,12,128                // movq          %xmm1,(%r8,%rax,4)
-  .byte  235,136                             // jmp           1d7dc <_sk_srcover_rgba_8888_sse41+0x115>
-  .byte  102,65,15,110,4,128                 // movd          (%r8,%rax,4),%xmm0
-  .byte  233,147,254,255,255                 // jmpq          1d6f2 <_sk_srcover_rgba_8888_sse41+0x2b>
-  .byte  102,65,15,126,12,128                // movd          %xmm1,(%r8,%rax,4)
-  .byte  233,114,255,255,255                 // jmpq          1d7dc <_sk_srcover_rgba_8888_sse41+0x115>
+  .byte  233,209,254,255,255                 // jmpq          1d266 <_sk_srcover_rgba_8888_sse41+0x25>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,36                              // je            1d3c1 <_sk_srcover_rgba_8888_sse41+0x180>
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,13                              // je            1d3ae <_sk_srcover_rgba_8888_sse41+0x16d>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,171                             // jne           1d350 <_sk_srcover_rgba_8888_sse41+0x10f>
+  .byte  102,65,15,58,22,76,144,8,2          // pextrd        $0x2,%xmm1,0x8(%r8,%rdx,4)
+  .byte  102,65,15,214,12,144                // movq          %xmm1,(%r8,%rdx,4)
+  .byte  235,154                             // jmp           1d350 <_sk_srcover_rgba_8888_sse41+0x10f>
+  .byte  102,65,15,110,4,144                 // movd          (%r8,%rdx,4),%xmm0
+  .byte  233,165,254,255,255                 // jmpq          1d266 <_sk_srcover_rgba_8888_sse41+0x25>
+  .byte  102,65,15,126,12,144                // movd          %xmm1,(%r8,%rdx,4)
+  .byte  235,135                             // jmp           1d350 <_sk_srcover_rgba_8888_sse41+0x10f>
 
 HIDDEN _sk_srcover_bgra_8888_sse41
 .globl _sk_srcover_bgra_8888_sse41
@@ -28355,31 +28113,29 @@
 _sk_srcover_bgra_8888_sse41:
   .byte  102,68,15,111,200                   // movdqa        %xmm0,%xmm9
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,0,1,0,0                      // jne           1d98f <_sk_srcover_bgra_8888_sse41+0x125>
-  .byte  243,65,15,111,4,128                 // movdqu        (%r8,%rax,4),%xmm0
+  .byte  15,133,0,1,0,0                      // jne           1d4e8 <_sk_srcover_bgra_8888_sse41+0x11f>
+  .byte  243,65,15,111,4,144                 // movdqu        (%r8,%rdx,4),%xmm0
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  102,15,111,37,128,221,1,0           // movdqa        0x1dd80(%rip),%xmm4        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  102,15,111,37,103,218,1,0           // movdqa        0x1da67(%rip),%xmm4        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  102,15,219,224                      // pand          %xmm0,%xmm4
   .byte  15,91,244                           // cvtdq2ps      %xmm4,%xmm6
   .byte  102,15,111,224                      // movdqa        %xmm0,%xmm4
-  .byte  102,15,56,0,37,124,221,1,0          // pshufb        0x1dd7c(%rip),%xmm4        # 3b630 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
+  .byte  102,15,56,0,37,99,218,1,0           // pshufb        0x1da63(%rip),%xmm4        # 3ae70 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
   .byte  15,91,236                           // cvtdq2ps      %xmm4,%xmm5
   .byte  102,15,111,224                      // movdqa        %xmm0,%xmm4
-  .byte  102,15,56,0,37,124,221,1,0          // pshufb        0x1dd7c(%rip),%xmm4        # 3b640 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
+  .byte  102,15,56,0,37,99,218,1,0           // pshufb        0x1da63(%rip),%xmm4        # 3ae80 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
   .byte  69,15,87,219                        // xorps         %xmm11,%xmm11
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
   .byte  102,15,114,208,24                   // psrld         $0x18,%xmm0
   .byte  15,91,248                           // cvtdq2ps      %xmm0,%xmm7
-  .byte  68,15,40,5,149,220,1,0              // movaps        0x1dc95(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,124,217,1,0              // movaps        0x1d97c(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,92,195                        // subps         %xmm3,%xmm8
-  .byte  68,15,40,37,105,221,1,0             // movaps        0x1dd69(%rip),%xmm12        # 3b650 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  .byte  68,15,40,37,80,218,1,0              // movaps        0x1da50(%rip),%xmm12        # 3ae90 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
   .byte  69,15,89,204                        // mulps         %xmm12,%xmm9
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  15,89,196                           // mulps         %xmm4,%xmm0
@@ -28416,42 +28172,42 @@
   .byte  102,15,114,241,24                   // pslld         $0x18,%xmm1
   .byte  102,15,235,203                      // por           %xmm3,%xmm1
   .byte  102,15,235,202                      // por           %xmm2,%xmm1
-  .byte  117,84                              // jne           1d9cd <_sk_srcover_bgra_8888_sse41+0x163>
-  .byte  243,65,15,127,12,128                // movdqu        %xmm1,(%r8,%rax,4)
+  .byte  117,75                              // jne           1d51d <_sk_srcover_bgra_8888_sse41+0x154>
+  .byte  243,65,15,127,12,144                // movdqu        %xmm1,(%r8,%rdx,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,201                        // movaps        %xmm9,%xmm1
   .byte  65,15,40,210                        // movaps        %xmm10,%xmm2
   .byte  65,15,40,216                        // movaps        %xmm8,%xmm3
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,91                              // je            1d9f7 <_sk_srcover_bgra_8888_sse41+0x18d>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,78                              // je            1d53e <_sk_srcover_bgra_8888_sse41+0x175>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,22                              // je            1d9bc <_sk_srcover_bgra_8888_sse41+0x152>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  15,133,229,254,255,255              // jne           1d895 <_sk_srcover_bgra_8888_sse41+0x2b>
-  .byte  102,65,15,110,68,128,8              // movd          0x8(%r8,%rax,4),%xmm0
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,20                              // je            1d50c <_sk_srcover_bgra_8888_sse41+0x143>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  15,133,238,254,255,255              // jne           1d3ee <_sk_srcover_bgra_8888_sse41+0x25>
+  .byte  102,65,15,110,68,144,8              // movd          0x8(%r8,%rdx,4),%xmm0
   .byte  102,15,112,192,69                   // pshufd        $0x45,%xmm0,%xmm0
-  .byte  243,65,15,126,36,128                // movq          (%r8,%rax,4),%xmm4
+  .byte  243,65,15,126,36,144                // movq          (%r8,%rdx,4),%xmm4
   .byte  102,15,58,14,196,15                 // pblendw       $0xf,%xmm4,%xmm0
-  .byte  233,200,254,255,255                 // jmpq          1d895 <_sk_srcover_bgra_8888_sse41+0x2b>
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,40                              // je            1da02 <_sk_srcover_bgra_8888_sse41+0x198>
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,15                              // je            1d9ef <_sk_srcover_bgra_8888_sse41+0x185>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,153                             // jne           1d97f <_sk_srcover_bgra_8888_sse41+0x115>
-  .byte  102,65,15,58,22,76,128,8,2          // pextrd        $0x2,%xmm1,0x8(%r8,%rax,4)
-  .byte  102,65,15,214,12,128                // movq          %xmm1,(%r8,%rax,4)
-  .byte  235,136                             // jmp           1d97f <_sk_srcover_bgra_8888_sse41+0x115>
-  .byte  102,65,15,110,4,128                 // movd          (%r8,%rax,4),%xmm0
-  .byte  233,147,254,255,255                 // jmpq          1d895 <_sk_srcover_bgra_8888_sse41+0x2b>
-  .byte  102,65,15,126,12,128                // movd          %xmm1,(%r8,%rax,4)
-  .byte  233,114,255,255,255                 // jmpq          1d97f <_sk_srcover_bgra_8888_sse41+0x115>
+  .byte  233,209,254,255,255                 // jmpq          1d3ee <_sk_srcover_bgra_8888_sse41+0x25>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,36                              // je            1d549 <_sk_srcover_bgra_8888_sse41+0x180>
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,13                              // je            1d536 <_sk_srcover_bgra_8888_sse41+0x16d>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,171                             // jne           1d4d8 <_sk_srcover_bgra_8888_sse41+0x10f>
+  .byte  102,65,15,58,22,76,144,8,2          // pextrd        $0x2,%xmm1,0x8(%r8,%rdx,4)
+  .byte  102,65,15,214,12,144                // movq          %xmm1,(%r8,%rdx,4)
+  .byte  235,154                             // jmp           1d4d8 <_sk_srcover_bgra_8888_sse41+0x10f>
+  .byte  102,65,15,110,4,144                 // movd          (%r8,%rdx,4),%xmm0
+  .byte  233,165,254,255,255                 // jmpq          1d3ee <_sk_srcover_bgra_8888_sse41+0x25>
+  .byte  102,65,15,126,12,144                // movd          %xmm1,(%r8,%rdx,4)
+  .byte  235,135                             // jmp           1d4d8 <_sk_srcover_bgra_8888_sse41+0x10f>
 
 HIDDEN _sk_clamp_0_sse41
 .globl _sk_clamp_0_sse41
@@ -28469,7 +28225,7 @@
 .globl _sk_clamp_1_sse41
 FUNCTION(_sk_clamp_1_sse41)
 _sk_clamp_1_sse41:
-  .byte  68,15,40,5,67,219,1,0               // movaps        0x1db43(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,63,216,1,0               // movaps        0x1d83f(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  65,15,93,192                        // minps         %xmm8,%xmm0
   .byte  65,15,93,200                        // minps         %xmm8,%xmm1
   .byte  65,15,93,208                        // minps         %xmm8,%xmm2
@@ -28481,7 +28237,7 @@
 .globl _sk_clamp_a_sse41
 FUNCTION(_sk_clamp_a_sse41)
 _sk_clamp_a_sse41:
-  .byte  15,93,29,40,219,1,0                 // minps         0x1db28(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,93,29,36,216,1,0                 // minps         0x1d824(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,93,195                           // minps         %xmm3,%xmm0
   .byte  15,93,203                           // minps         %xmm3,%xmm1
   .byte  15,93,211                           // minps         %xmm3,%xmm2
@@ -28492,7 +28248,7 @@
 .globl _sk_clamp_a_dst_sse41
 FUNCTION(_sk_clamp_a_dst_sse41)
 _sk_clamp_a_dst_sse41:
-  .byte  15,93,61,20,219,1,0                 // minps         0x1db14(%rip),%xmm7        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,93,61,16,216,1,0                 // minps         0x1d810(%rip),%xmm7        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,93,231                           // minps         %xmm7,%xmm4
   .byte  15,93,239                           // minps         %xmm7,%xmm5
   .byte  15,93,247                           // minps         %xmm7,%xmm6
@@ -28527,7 +28283,7 @@
 .globl _sk_invert_sse41
 FUNCTION(_sk_invert_sse41)
 _sk_invert_sse41:
-  .byte  68,15,40,5,208,218,1,0              // movaps        0x1dad0(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,204,215,1,0              // movaps        0x1d7cc(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  68,15,92,200                        // subps         %xmm0,%xmm9
   .byte  69,15,40,208                        // movaps        %xmm8,%xmm10
@@ -28588,10 +28344,10 @@
 .globl _sk_unpremul_sse41
 FUNCTION(_sk_unpremul_sse41)
 _sk_unpremul_sse41:
-  .byte  68,15,40,5,94,218,1,0               // movaps        0x1da5e(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,90,215,1,0               // movaps        0x1d75a(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,94,195                        // divps         %xmm3,%xmm8
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
-  .byte  68,15,194,13,61,219,1,0,1           // cmpltps       0x1db3d(%rip),%xmm9        # 3b660 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
+  .byte  68,15,194,13,57,216,1,0,1           // cmpltps       0x1d839(%rip),%xmm9        # 3aea0 <_sk_srcover_bgra_8888_sse2_lowp+0xda4>
   .byte  69,15,84,200                        // andps         %xmm8,%xmm9
   .byte  65,15,89,193                        // mulps         %xmm9,%xmm0
   .byte  65,15,89,201                        // mulps         %xmm9,%xmm1
@@ -28603,20 +28359,20 @@
 .globl _sk_from_srgb_sse41
 FUNCTION(_sk_from_srgb_sse41)
 _sk_from_srgb_sse41:
-  .byte  68,15,40,29,49,219,1,0              // movaps        0x1db31(%rip),%xmm11        # 3b670 <_sk_srcover_bgra_8888_sse2_lowp+0xda4>
+  .byte  68,15,40,29,45,216,1,0              // movaps        0x1d82d(%rip),%xmm11        # 3aeb0 <_sk_srcover_bgra_8888_sse2_lowp+0xdb4>
   .byte  68,15,40,200                        // movaps        %xmm0,%xmm9
   .byte  69,15,89,203                        // mulps         %xmm11,%xmm9
   .byte  68,15,40,208                        // movaps        %xmm0,%xmm10
   .byte  69,15,89,210                        // mulps         %xmm10,%xmm10
-  .byte  68,15,40,37,153,218,1,0             // movaps        0x1da99(%rip),%xmm12        # 3b5f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  .byte  68,15,40,37,149,215,1,0             // movaps        0x1d795(%rip),%xmm12        # 3ae30 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
   .byte  68,15,40,192                        // movaps        %xmm0,%xmm8
   .byte  69,15,89,196                        // mulps         %xmm12,%xmm8
-  .byte  68,15,40,45,25,219,1,0              // movaps        0x1db19(%rip),%xmm13        # 3b680 <_sk_srcover_bgra_8888_sse2_lowp+0xdb4>
+  .byte  68,15,40,45,21,216,1,0              // movaps        0x1d815(%rip),%xmm13        # 3aec0 <_sk_srcover_bgra_8888_sse2_lowp+0xdc4>
   .byte  69,15,88,197                        // addps         %xmm13,%xmm8
   .byte  69,15,89,194                        // mulps         %xmm10,%xmm8
-  .byte  68,15,40,53,25,219,1,0              // movaps        0x1db19(%rip),%xmm14        # 3b690 <_sk_srcover_bgra_8888_sse2_lowp+0xdc4>
+  .byte  68,15,40,53,21,216,1,0              // movaps        0x1d815(%rip),%xmm14        # 3aed0 <_sk_srcover_bgra_8888_sse2_lowp+0xdd4>
   .byte  69,15,88,198                        // addps         %xmm14,%xmm8
-  .byte  68,15,40,61,29,219,1,0              // movaps        0x1db1d(%rip),%xmm15        # 3b6a0 <_sk_srcover_bgra_8888_sse2_lowp+0xdd4>
+  .byte  68,15,40,61,25,216,1,0              // movaps        0x1d819(%rip),%xmm15        # 3aee0 <_sk_srcover_bgra_8888_sse2_lowp+0xde4>
   .byte  65,15,194,199,1                     // cmpltps       %xmm15,%xmm0
   .byte  102,69,15,56,20,193                 // blendvps      %xmm0,%xmm9,%xmm8
   .byte  68,15,40,209                        // movaps        %xmm1,%xmm10
@@ -28653,19 +28409,19 @@
 _sk_from_srgb_dst_sse41:
   .byte  68,15,40,204                        // movaps        %xmm4,%xmm9
   .byte  68,15,40,192                        // movaps        %xmm0,%xmm8
-  .byte  68,15,40,29,104,218,1,0             // movaps        0x1da68(%rip),%xmm11        # 3b670 <_sk_srcover_bgra_8888_sse2_lowp+0xda4>
+  .byte  68,15,40,29,100,215,1,0             // movaps        0x1d764(%rip),%xmm11        # 3aeb0 <_sk_srcover_bgra_8888_sse2_lowp+0xdb4>
   .byte  69,15,40,209                        // movaps        %xmm9,%xmm10
   .byte  69,15,89,211                        // mulps         %xmm11,%xmm10
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
   .byte  15,89,192                           // mulps         %xmm0,%xmm0
-  .byte  68,15,40,37,209,217,1,0             // movaps        0x1d9d1(%rip),%xmm12        # 3b5f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  .byte  68,15,40,37,205,214,1,0             // movaps        0x1d6cd(%rip),%xmm12        # 3ae30 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
   .byte  65,15,89,228                        // mulps         %xmm12,%xmm4
-  .byte  68,15,40,45,85,218,1,0              // movaps        0x1da55(%rip),%xmm13        # 3b680 <_sk_srcover_bgra_8888_sse2_lowp+0xdb4>
+  .byte  68,15,40,45,81,215,1,0              // movaps        0x1d751(%rip),%xmm13        # 3aec0 <_sk_srcover_bgra_8888_sse2_lowp+0xdc4>
   .byte  65,15,88,229                        // addps         %xmm13,%xmm4
   .byte  15,89,224                           // mulps         %xmm0,%xmm4
-  .byte  68,15,40,53,86,218,1,0              // movaps        0x1da56(%rip),%xmm14        # 3b690 <_sk_srcover_bgra_8888_sse2_lowp+0xdc4>
+  .byte  68,15,40,53,82,215,1,0              // movaps        0x1d752(%rip),%xmm14        # 3aed0 <_sk_srcover_bgra_8888_sse2_lowp+0xdd4>
   .byte  65,15,88,230                        // addps         %xmm14,%xmm4
-  .byte  68,15,40,61,90,218,1,0              // movaps        0x1da5a(%rip),%xmm15        # 3b6a0 <_sk_srcover_bgra_8888_sse2_lowp+0xdd4>
+  .byte  68,15,40,61,86,215,1,0              // movaps        0x1d756(%rip),%xmm15        # 3aee0 <_sk_srcover_bgra_8888_sse2_lowp+0xde4>
   .byte  69,15,194,207,1                     // cmpltps       %xmm15,%xmm9
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
   .byte  102,65,15,56,20,226                 // blendvps      %xmm0,%xmm10,%xmm4
@@ -28709,22 +28465,22 @@
   .byte  15,40,218                           // movaps        %xmm2,%xmm3
   .byte  15,40,209                           // movaps        %xmm1,%xmm2
   .byte  68,15,82,192                        // rsqrtps       %xmm0,%xmm8
-  .byte  68,15,40,29,206,217,1,0             // movaps        0x1d9ce(%rip),%xmm11        # 3b6b0 <_sk_srcover_bgra_8888_sse2_lowp+0xde4>
+  .byte  68,15,40,29,202,214,1,0             // movaps        0x1d6ca(%rip),%xmm11        # 3aef0 <_sk_srcover_bgra_8888_sse2_lowp+0xdf4>
   .byte  68,15,40,200                        // movaps        %xmm0,%xmm9
   .byte  69,15,89,203                        // mulps         %xmm11,%xmm9
-  .byte  68,15,40,37,206,217,1,0             // movaps        0x1d9ce(%rip),%xmm12        # 3b6c0 <_sk_srcover_bgra_8888_sse2_lowp+0xdf4>
+  .byte  68,15,40,37,202,214,1,0             // movaps        0x1d6ca(%rip),%xmm12        # 3af00 <_sk_srcover_bgra_8888_sse2_lowp+0xe04>
   .byte  69,15,40,248                        // movaps        %xmm8,%xmm15
   .byte  69,15,89,252                        // mulps         %xmm12,%xmm15
-  .byte  68,15,40,21,206,217,1,0             // movaps        0x1d9ce(%rip),%xmm10        # 3b6d0 <_sk_srcover_bgra_8888_sse2_lowp+0xe04>
+  .byte  68,15,40,21,202,214,1,0             // movaps        0x1d6ca(%rip),%xmm10        # 3af10 <_sk_srcover_bgra_8888_sse2_lowp+0xe14>
   .byte  69,15,88,250                        // addps         %xmm10,%xmm15
   .byte  69,15,89,248                        // mulps         %xmm8,%xmm15
-  .byte  68,15,40,45,206,217,1,0             // movaps        0x1d9ce(%rip),%xmm13        # 3b6e0 <_sk_srcover_bgra_8888_sse2_lowp+0xe14>
+  .byte  68,15,40,45,202,214,1,0             // movaps        0x1d6ca(%rip),%xmm13        # 3af20 <_sk_srcover_bgra_8888_sse2_lowp+0xe24>
   .byte  69,15,88,253                        // addps         %xmm13,%xmm15
-  .byte  68,15,40,53,210,217,1,0             // movaps        0x1d9d2(%rip),%xmm14        # 3b6f0 <_sk_srcover_bgra_8888_sse2_lowp+0xe24>
+  .byte  68,15,40,53,206,214,1,0             // movaps        0x1d6ce(%rip),%xmm14        # 3af30 <_sk_srcover_bgra_8888_sse2_lowp+0xe34>
   .byte  69,15,88,198                        // addps         %xmm14,%xmm8
   .byte  69,15,83,192                        // rcpps         %xmm8,%xmm8
   .byte  69,15,89,199                        // mulps         %xmm15,%xmm8
-  .byte  68,15,40,61,206,217,1,0             // movaps        0x1d9ce(%rip),%xmm15        # 3b700 <_sk_srcover_bgra_8888_sse2_lowp+0xe34>
+  .byte  68,15,40,61,202,214,1,0             // movaps        0x1d6ca(%rip),%xmm15        # 3af40 <_sk_srcover_bgra_8888_sse2_lowp+0xe44>
   .byte  65,15,194,199,1                     // cmpltps       %xmm15,%xmm0
   .byte  102,69,15,56,20,193                 // blendvps      %xmm0,%xmm9,%xmm8
   .byte  68,15,82,202                        // rsqrtps       %xmm2,%xmm9
@@ -28779,7 +28535,7 @@
   .byte  68,15,93,224                        // minps         %xmm0,%xmm12
   .byte  65,15,40,203                        // movaps        %xmm11,%xmm1
   .byte  65,15,92,204                        // subps         %xmm12,%xmm1
-  .byte  68,15,40,53,117,215,1,0             // movaps        0x1d775(%rip),%xmm14        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,53,113,212,1,0             // movaps        0x1d471(%rip),%xmm14        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,94,241                        // divps         %xmm1,%xmm14
   .byte  69,15,40,211                        // movaps        %xmm11,%xmm10
   .byte  69,15,194,208,0                     // cmpeqps       %xmm8,%xmm10
@@ -28788,27 +28544,27 @@
   .byte  65,15,89,198                        // mulps         %xmm14,%xmm0
   .byte  69,15,40,249                        // movaps        %xmm9,%xmm15
   .byte  68,15,194,250,1                     // cmpltps       %xmm2,%xmm15
-  .byte  68,15,84,61,236,216,1,0             // andps         0x1d8ec(%rip),%xmm15        # 3b710 <_sk_srcover_bgra_8888_sse2_lowp+0xe44>
+  .byte  68,15,84,61,232,213,1,0             // andps         0x1d5e8(%rip),%xmm15        # 3af50 <_sk_srcover_bgra_8888_sse2_lowp+0xe54>
   .byte  68,15,88,248                        // addps         %xmm0,%xmm15
   .byte  65,15,40,195                        // movaps        %xmm11,%xmm0
   .byte  65,15,194,193,0                     // cmpeqps       %xmm9,%xmm0
   .byte  65,15,92,208                        // subps         %xmm8,%xmm2
   .byte  65,15,89,214                        // mulps         %xmm14,%xmm2
-  .byte  68,15,40,45,223,216,1,0             // movaps        0x1d8df(%rip),%xmm13        # 3b720 <_sk_srcover_bgra_8888_sse2_lowp+0xe54>
+  .byte  68,15,40,45,219,213,1,0             // movaps        0x1d5db(%rip),%xmm13        # 3af60 <_sk_srcover_bgra_8888_sse2_lowp+0xe64>
   .byte  65,15,88,213                        // addps         %xmm13,%xmm2
   .byte  69,15,92,193                        // subps         %xmm9,%xmm8
   .byte  69,15,89,198                        // mulps         %xmm14,%xmm8
-  .byte  68,15,88,5,219,216,1,0              // addps         0x1d8db(%rip),%xmm8        # 3b730 <_sk_srcover_bgra_8888_sse2_lowp+0xe64>
+  .byte  68,15,88,5,215,213,1,0              // addps         0x1d5d7(%rip),%xmm8        # 3af70 <_sk_srcover_bgra_8888_sse2_lowp+0xe74>
   .byte  102,68,15,56,20,194                 // blendvps      %xmm0,%xmm2,%xmm8
   .byte  65,15,40,194                        // movaps        %xmm10,%xmm0
   .byte  102,69,15,56,20,199                 // blendvps      %xmm0,%xmm15,%xmm8
-  .byte  68,15,89,5,211,216,1,0              // mulps         0x1d8d3(%rip),%xmm8        # 3b740 <_sk_srcover_bgra_8888_sse2_lowp+0xe74>
+  .byte  68,15,89,5,207,213,1,0              // mulps         0x1d5cf(%rip),%xmm8        # 3af80 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
   .byte  69,15,40,203                        // movaps        %xmm11,%xmm9
   .byte  69,15,194,204,4                     // cmpneqps      %xmm12,%xmm9
   .byte  69,15,84,193                        // andps         %xmm9,%xmm8
   .byte  69,15,92,235                        // subps         %xmm11,%xmm13
   .byte  69,15,88,220                        // addps         %xmm12,%xmm11
-  .byte  15,40,5,215,214,1,0                 // movaps        0x1d6d7(%rip),%xmm0        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  15,40,5,211,211,1,0                 // movaps        0x1d3d3(%rip),%xmm0        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  65,15,40,211                        // movaps        %xmm11,%xmm2
   .byte  15,89,208                           // mulps         %xmm0,%xmm2
   .byte  15,194,194,1                        // cmpltps       %xmm2,%xmm0
@@ -28830,7 +28586,7 @@
   .byte  15,41,100,36,184                    // movaps        %xmm4,-0x48(%rsp)
   .byte  15,41,92,36,168                     // movaps        %xmm3,-0x58(%rsp)
   .byte  68,15,40,208                        // movaps        %xmm0,%xmm10
-  .byte  68,15,40,13,141,214,1,0             // movaps        0x1d68d(%rip),%xmm9        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  68,15,40,13,137,211,1,0             // movaps        0x1d389(%rip),%xmm9        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
   .byte  15,194,194,2                        // cmpleps       %xmm2,%xmm0
   .byte  15,40,217                           // movaps        %xmm1,%xmm3
@@ -28843,19 +28599,19 @@
   .byte  15,41,84,36,152                     // movaps        %xmm2,-0x68(%rsp)
   .byte  69,15,88,192                        // addps         %xmm8,%xmm8
   .byte  68,15,92,197                        // subps         %xmm5,%xmm8
-  .byte  68,15,40,53,72,216,1,0              // movaps        0x1d848(%rip),%xmm14        # 3b750 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  .byte  68,15,40,53,68,213,1,0              // movaps        0x1d544(%rip),%xmm14        # 3af90 <_sk_srcover_bgra_8888_sse2_lowp+0xe94>
   .byte  69,15,88,242                        // addps         %xmm10,%xmm14
   .byte  102,65,15,58,8,198,1                // roundps       $0x1,%xmm14,%xmm0
   .byte  68,15,92,240                        // subps         %xmm0,%xmm14
-  .byte  68,15,40,29,65,216,1,0              // movaps        0x1d841(%rip),%xmm11        # 3b760 <_sk_srcover_bgra_8888_sse2_lowp+0xe94>
+  .byte  68,15,40,29,61,213,1,0              // movaps        0x1d53d(%rip),%xmm11        # 3afa0 <_sk_srcover_bgra_8888_sse2_lowp+0xea4>
   .byte  65,15,40,195                        // movaps        %xmm11,%xmm0
   .byte  65,15,194,198,2                     // cmpleps       %xmm14,%xmm0
   .byte  15,40,245                           // movaps        %xmm5,%xmm6
   .byte  65,15,92,240                        // subps         %xmm8,%xmm6
-  .byte  15,40,61,218,215,1,0                // movaps        0x1d7da(%rip),%xmm7        # 3b710 <_sk_srcover_bgra_8888_sse2_lowp+0xe44>
+  .byte  15,40,61,214,212,1,0                // movaps        0x1d4d6(%rip),%xmm7        # 3af50 <_sk_srcover_bgra_8888_sse2_lowp+0xe54>
   .byte  69,15,40,238                        // movaps        %xmm14,%xmm13
   .byte  68,15,89,239                        // mulps         %xmm7,%xmm13
-  .byte  15,40,29,235,215,1,0                // movaps        0x1d7eb(%rip),%xmm3        # 3b730 <_sk_srcover_bgra_8888_sse2_lowp+0xe64>
+  .byte  15,40,29,231,212,1,0                // movaps        0x1d4e7(%rip),%xmm3        # 3af70 <_sk_srcover_bgra_8888_sse2_lowp+0xe74>
   .byte  68,15,40,227                        // movaps        %xmm3,%xmm12
   .byte  69,15,92,229                        // subps         %xmm13,%xmm12
   .byte  68,15,89,230                        // mulps         %xmm6,%xmm12
@@ -28865,7 +28621,7 @@
   .byte  65,15,194,198,2                     // cmpleps       %xmm14,%xmm0
   .byte  68,15,40,253                        // movaps        %xmm5,%xmm15
   .byte  102,69,15,56,20,252                 // blendvps      %xmm0,%xmm12,%xmm15
-  .byte  68,15,40,37,202,215,1,0             // movaps        0x1d7ca(%rip),%xmm12        # 3b740 <_sk_srcover_bgra_8888_sse2_lowp+0xe74>
+  .byte  68,15,40,37,198,212,1,0             // movaps        0x1d4c6(%rip),%xmm12        # 3af80 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
   .byte  65,15,40,196                        // movaps        %xmm12,%xmm0
   .byte  65,15,194,198,2                     // cmpleps       %xmm14,%xmm0
   .byte  68,15,89,238                        // mulps         %xmm6,%xmm13
@@ -28899,7 +28655,7 @@
   .byte  65,15,40,198                        // movaps        %xmm14,%xmm0
   .byte  15,40,84,36,152                     // movaps        -0x68(%rsp),%xmm2
   .byte  102,15,56,20,202                    // blendvps      %xmm0,%xmm2,%xmm1
-  .byte  68,15,88,21,98,215,1,0              // addps         0x1d762(%rip),%xmm10        # 3b770 <_sk_srcover_bgra_8888_sse2_lowp+0xea4>
+  .byte  68,15,88,21,94,212,1,0              // addps         0x1d45e(%rip),%xmm10        # 3afb0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
   .byte  102,65,15,58,8,194,1                // roundps       $0x1,%xmm10,%xmm0
   .byte  68,15,92,208                        // subps         %xmm0,%xmm10
   .byte  69,15,194,218,2                     // cmpleps       %xmm10,%xmm11
@@ -28948,17 +28704,15 @@
 FUNCTION(_sk_scale_u8_sse41)
 _sk_scale_u8_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,52                              // jne           1e0f5 <_sk_scale_u8_sse41+0x4c>
-  .byte  102,71,15,56,49,4,16                // pmovzxbd      (%r8,%r10,1),%xmm8
-  .byte  102,68,15,219,5,79,213,1,0          // pand          0x1d54f(%rip),%xmm8        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  117,52                              // jne           1dc33 <_sk_scale_u8_sse41+0x46>
+  .byte  102,69,15,56,49,4,16                // pmovzxbd      (%r8,%rdx,1),%xmm8
+  .byte  102,68,15,219,5,81,210,1,0          // pand          0x1d251(%rip),%xmm8        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
-  .byte  68,15,89,5,163,214,1,0              // mulps         0x1d6a3(%rip),%xmm8        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  68,15,89,5,165,211,1,0              // mulps         0x1d3a5(%rip),%xmm8        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  65,15,89,200                        // mulps         %xmm8,%xmm1
   .byte  65,15,89,208                        // mulps         %xmm8,%xmm2
@@ -28966,26 +28720,26 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,216                        // movaps        %xmm8,%xmm3
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,59                              // je            1e13d <_sk_scale_u8_sse41+0x94>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,55                              // je            1dc72 <_sk_scale_u8_sse41+0x85>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,23                              // je            1e124 <_sk_scale_u8_sse41+0x7b>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,181                             // jne           1e0c8 <_sk_scale_u8_sse41+0x1f>
-  .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,21                              // je            1dc59 <_sk_scale_u8_sse41+0x6c>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,190                             // jne           1dc06 <_sk_scale_u8_sse41+0x19>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  102,69,15,112,192,69                // pshufd        $0x45,%xmm8,%xmm8
-  .byte  67,15,183,4,16                      // movzwl        (%r8,%r10,1),%eax
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  102,68,15,110,200                   // movd          %eax,%xmm9
   .byte  102,69,15,56,49,201                 // pmovzxbd      %xmm9,%xmm9
   .byte  102,69,15,58,14,193,15              // pblendw       $0xf,%xmm9,%xmm8
-  .byte  235,139                             // jmp           1e0c8 <_sk_scale_u8_sse41+0x1f>
-  .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
+  .byte  235,148                             // jmp           1dc06 <_sk_scale_u8_sse41+0x19>
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
-  .byte  233,124,255,255,255                 // jmpq          1e0c8 <_sk_scale_u8_sse41+0x1f>
+  .byte  235,136                             // jmp           1dc06 <_sk_scale_u8_sse41+0x19>
 
 HIDDEN _sk_scale_565_sse41
 .globl _sk_scale_565_sse41
@@ -28993,26 +28747,24 @@
 _sk_scale_565_sse41:
   .byte  102,68,15,111,192                   // movdqa        %xmm0,%xmm8
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,159,0,0,0                    // jne           1e20f <_sk_scale_565_sse41+0xc3>
-  .byte  102,71,15,56,51,28,80               // pmovzxwd      (%r8,%r10,2),%xmm11
-  .byte  102,15,111,5,17,214,1,0             // movdqa        0x1d611(%rip),%xmm0        # 3b790 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
+  .byte  15,133,159,0,0,0                    // jne           1dd3b <_sk_scale_565_sse41+0xbd>
+  .byte  102,69,15,56,51,28,80               // pmovzxwd      (%r8,%rdx,2),%xmm11
+  .byte  102,15,111,5,37,211,1,0             // movdqa        0x1d325(%rip),%xmm0        # 3afd0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
   .byte  102,65,15,219,195                   // pand          %xmm11,%xmm0
   .byte  68,15,91,200                        // cvtdq2ps      %xmm0,%xmm9
-  .byte  68,15,89,13,16,214,1,0              // mulps         0x1d610(%rip),%xmm9        # 3b7a0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
-  .byte  102,15,111,5,24,214,1,0             // movdqa        0x1d618(%rip),%xmm0        # 3b7b0 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  .byte  68,15,89,13,36,211,1,0              // mulps         0x1d324(%rip),%xmm9        # 3afe0 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  .byte  102,15,111,5,44,211,1,0             // movdqa        0x1d32c(%rip),%xmm0        # 3aff0 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
   .byte  102,65,15,219,195                   // pand          %xmm11,%xmm0
   .byte  68,15,91,208                        // cvtdq2ps      %xmm0,%xmm10
-  .byte  68,15,89,21,23,214,1,0              // mulps         0x1d617(%rip),%xmm10        # 3b7c0 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
-  .byte  102,68,15,219,29,30,214,1,0         // pand          0x1d61e(%rip),%xmm11        # 3b7d0 <_sk_srcover_bgra_8888_sse2_lowp+0xf04>
+  .byte  68,15,89,21,43,211,1,0              // mulps         0x1d32b(%rip),%xmm10        # 3b000 <_sk_srcover_bgra_8888_sse2_lowp+0xf04>
+  .byte  102,68,15,219,29,50,211,1,0         // pand          0x1d332(%rip),%xmm11        # 3b010 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
   .byte  69,15,91,219                        // cvtdq2ps      %xmm11,%xmm11
-  .byte  68,15,89,29,34,214,1,0              // mulps         0x1d622(%rip),%xmm11        # 3b7e0 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
+  .byte  68,15,89,29,54,211,1,0              // mulps         0x1d336(%rip),%xmm11        # 3b020 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
   .byte  15,40,195                           // movaps        %xmm3,%xmm0
   .byte  15,194,199,1                        // cmpltps       %xmm7,%xmm0
   .byte  69,15,40,226                        // movaps        %xmm10,%xmm12
@@ -29034,25 +28786,25 @@
   .byte  65,15,40,211                        // movaps        %xmm11,%xmm2
   .byte  65,15,40,220                        // movaps        %xmm12,%xmm3
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,60                              // je            1e258 <_sk_scale_565_sse41+0x10c>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,56                              // je            1dd7b <_sk_scale_565_sse41+0xfd>
   .byte  102,69,15,239,219                   // pxor          %xmm11,%xmm11
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,26                              // je            1e241 <_sk_scale_565_sse41+0xf5>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  15,133,70,255,255,255               // jne           1e177 <_sk_scale_565_sse41+0x2b>
-  .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,24                              // je            1dd64 <_sk_scale_565_sse41+0xe6>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  15,133,79,255,255,255               // jne           1dca3 <_sk_scale_565_sse41+0x25>
+  .byte  65,15,183,68,80,4                   // movzwl        0x4(%r8,%rdx,2),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,68,15,112,216,69                // pshufd        $0x45,%xmm0,%xmm11
-  .byte  102,67,15,110,4,80                  // movd          (%r8,%r10,2),%xmm0
+  .byte  102,65,15,110,4,80                  // movd          (%r8,%rdx,2),%xmm0
   .byte  102,15,56,51,192                    // pmovzxwd      %xmm0,%xmm0
   .byte  102,68,15,58,14,216,15              // pblendw       $0xf,%xmm0,%xmm11
-  .byte  233,31,255,255,255                  // jmpq          1e177 <_sk_scale_565_sse41+0x2b>
-  .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
+  .byte  233,40,255,255,255                  // jmpq          1dca3 <_sk_scale_565_sse41+0x25>
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,68,15,110,216                   // movd          %eax,%xmm11
-  .byte  233,16,255,255,255                  // jmpq          1e177 <_sk_scale_565_sse41+0x2b>
+  .byte  233,25,255,255,255                  // jmpq          1dca3 <_sk_scale_565_sse41+0x25>
 
 HIDDEN _sk_lerp_1_float_sse41
 .globl _sk_lerp_1_float_sse41
@@ -29081,17 +28833,15 @@
 FUNCTION(_sk_lerp_u8_sse41)
 _sk_lerp_u8_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,72                              // jne           1e2ff <_sk_lerp_u8_sse41+0x60>
-  .byte  102,71,15,56,49,4,16                // pmovzxbd      (%r8,%r10,1),%xmm8
-  .byte  102,68,15,219,5,89,211,1,0          // pand          0x1d359(%rip),%xmm8        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  117,72                              // jne           1de1c <_sk_lerp_u8_sse41+0x5a>
+  .byte  102,69,15,56,49,4,16                // pmovzxbd      (%r8,%rdx,1),%xmm8
+  .byte  102,68,15,219,5,124,208,1,0         // pand          0x1d07c(%rip),%xmm8        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
-  .byte  68,15,89,5,173,212,1,0              // mulps         0x1d4ad(%rip),%xmm8        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  68,15,89,5,208,209,1,0              // mulps         0x1d1d0(%rip),%xmm8        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  15,92,196                           // subps         %xmm4,%xmm0
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  15,88,196                           // addps         %xmm4,%xmm0
@@ -29106,26 +28856,26 @@
   .byte  15,88,223                           // addps         %xmm7,%xmm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,62                              // je            1e34a <_sk_lerp_u8_sse41+0xab>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,55                              // je            1de5b <_sk_lerp_u8_sse41+0x99>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,23                              // je            1e32e <_sk_lerp_u8_sse41+0x8f>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,161                             // jne           1e2be <_sk_lerp_u8_sse41+0x1f>
-  .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,21                              // je            1de42 <_sk_lerp_u8_sse41+0x80>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,170                             // jne           1dddb <_sk_lerp_u8_sse41+0x19>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  102,69,15,112,192,69                // pshufd        $0x45,%xmm8,%xmm8
-  .byte  67,15,183,4,16                      // movzwl        (%r8,%r10,1),%eax
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  102,68,15,110,200                   // movd          %eax,%xmm9
   .byte  102,69,15,56,49,201                 // pmovzxbd      %xmm9,%xmm9
   .byte  102,69,15,58,14,193,15              // pblendw       $0xf,%xmm9,%xmm8
-  .byte  233,116,255,255,255                 // jmpq          1e2be <_sk_lerp_u8_sse41+0x1f>
-  .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
+  .byte  235,128                             // jmp           1dddb <_sk_lerp_u8_sse41+0x19>
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
-  .byte  233,101,255,255,255                 // jmpq          1e2be <_sk_lerp_u8_sse41+0x1f>
+  .byte  233,113,255,255,255                 // jmpq          1dddb <_sk_lerp_u8_sse41+0x19>
 
 HIDDEN _sk_lerp_565_sse41
 .globl _sk_lerp_565_sse41
@@ -29133,26 +28883,24 @@
 _sk_lerp_565_sse41:
   .byte  102,68,15,111,192                   // movdqa        %xmm0,%xmm8
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,165,0,0,0                    // jne           1e422 <_sk_lerp_565_sse41+0xc9>
-  .byte  102,71,15,56,51,20,80               // pmovzxwd      (%r8,%r10,2),%xmm10
-  .byte  102,15,111,5,4,212,1,0              // movdqa        0x1d404(%rip),%xmm0        # 3b790 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
+  .byte  15,133,165,0,0,0                    // jne           1df2d <_sk_lerp_565_sse41+0xc3>
+  .byte  102,69,15,56,51,20,80               // pmovzxwd      (%r8,%rdx,2),%xmm10
+  .byte  102,15,111,5,57,209,1,0             // movdqa        0x1d139(%rip),%xmm0        # 3afd0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
   .byte  102,65,15,219,194                   // pand          %xmm10,%xmm0
   .byte  68,15,91,200                        // cvtdq2ps      %xmm0,%xmm9
-  .byte  68,15,89,13,3,212,1,0               // mulps         0x1d403(%rip),%xmm9        # 3b7a0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
-  .byte  102,15,111,5,11,212,1,0             // movdqa        0x1d40b(%rip),%xmm0        # 3b7b0 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  .byte  68,15,89,13,56,209,1,0              // mulps         0x1d138(%rip),%xmm9        # 3afe0 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  .byte  102,15,111,5,64,209,1,0             // movdqa        0x1d140(%rip),%xmm0        # 3aff0 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
   .byte  102,65,15,219,194                   // pand          %xmm10,%xmm0
   .byte  68,15,91,216                        // cvtdq2ps      %xmm0,%xmm11
-  .byte  68,15,89,29,10,212,1,0              // mulps         0x1d40a(%rip),%xmm11        # 3b7c0 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
-  .byte  102,68,15,219,21,17,212,1,0         // pand          0x1d411(%rip),%xmm10        # 3b7d0 <_sk_srcover_bgra_8888_sse2_lowp+0xf04>
+  .byte  68,15,89,29,63,209,1,0              // mulps         0x1d13f(%rip),%xmm11        # 3b000 <_sk_srcover_bgra_8888_sse2_lowp+0xf04>
+  .byte  102,68,15,219,21,70,209,1,0         // pand          0x1d146(%rip),%xmm10        # 3b010 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
   .byte  69,15,91,210                        // cvtdq2ps      %xmm10,%xmm10
-  .byte  68,15,89,21,21,212,1,0              // mulps         0x1d415(%rip),%xmm10        # 3b7e0 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
+  .byte  68,15,89,21,74,209,1,0              // mulps         0x1d14a(%rip),%xmm10        # 3b020 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
   .byte  15,40,195                           // movaps        %xmm3,%xmm0
   .byte  15,194,199,1                        // cmpltps       %xmm7,%xmm0
   .byte  69,15,40,227                        // movaps        %xmm11,%xmm12
@@ -29177,25 +28925,25 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,60                              // je            1e46b <_sk_lerp_565_sse41+0x112>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,56                              // je            1df6d <_sk_lerp_565_sse41+0x103>
   .byte  102,69,15,239,210                   // pxor          %xmm10,%xmm10
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,26                              // je            1e454 <_sk_lerp_565_sse41+0xfb>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  15,133,64,255,255,255               // jne           1e384 <_sk_lerp_565_sse41+0x2b>
-  .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,24                              // je            1df56 <_sk_lerp_565_sse41+0xec>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  15,133,73,255,255,255               // jne           1de8f <_sk_lerp_565_sse41+0x25>
+  .byte  65,15,183,68,80,4                   // movzwl        0x4(%r8,%rdx,2),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,68,15,112,208,69                // pshufd        $0x45,%xmm0,%xmm10
-  .byte  102,67,15,110,4,80                  // movd          (%r8,%r10,2),%xmm0
+  .byte  102,65,15,110,4,80                  // movd          (%r8,%rdx,2),%xmm0
   .byte  102,15,56,51,192                    // pmovzxwd      %xmm0,%xmm0
   .byte  102,68,15,58,14,208,15              // pblendw       $0xf,%xmm0,%xmm10
-  .byte  233,25,255,255,255                  // jmpq          1e384 <_sk_lerp_565_sse41+0x2b>
-  .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
+  .byte  233,34,255,255,255                  // jmpq          1de8f <_sk_lerp_565_sse41+0x25>
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,68,15,110,208                   // movd          %eax,%xmm10
-  .byte  233,10,255,255,255                  // jmpq          1e384 <_sk_lerp_565_sse41+0x2b>
+  .byte  233,19,255,255,255                  // jmpq          1de8f <_sk_lerp_565_sse41+0x25>
 
 HIDDEN _sk_load_tables_sse41
 .globl _sk_load_tables_sse41
@@ -29204,11 +28952,11 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,20,1,0,0                     // jne           1e59c <_sk_load_tables_sse41+0x122>
+  .byte  15,133,20,1,0,0                     // jne           1e09e <_sk_load_tables_sse41+0x122>
   .byte  243,69,15,111,4,144                 // movdqu        (%r8,%rdx,4),%xmm8
   .byte  65,86                               // push          %r14
   .byte  83                                  // push          %rbx
-  .byte  102,15,111,5,135,209,1,0            // movdqa        0x1d187(%rip),%xmm0        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  102,15,111,5,197,206,1,0            // movdqa        0x1cec5(%rip),%xmm0        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  102,65,15,219,192                   // pand          %xmm8,%xmm0
   .byte  102,73,15,58,22,192,1               // pextrq        $0x1,%xmm0,%r8
   .byte  102,73,15,126,193                   // movq          %xmm0,%r9
@@ -29223,7 +28971,7 @@
   .byte  102,66,15,58,33,4,155,32            // insertps      $0x20,(%rbx,%r11,4),%xmm0
   .byte  102,66,15,58,33,4,3,48              // insertps      $0x30,(%rbx,%r8,1),%xmm0
   .byte  102,65,15,111,200                   // movdqa        %xmm8,%xmm1
-  .byte  102,15,56,0,13,66,209,1,0           // pshufb        0x1d142(%rip),%xmm1        # 3b630 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
+  .byte  102,15,56,0,13,128,206,1,0          // pshufb        0x1ce80(%rip),%xmm1        # 3ae70 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
   .byte  102,73,15,58,22,200,1               // pextrq        $0x1,%xmm1,%r8
   .byte  102,72,15,126,203                   // movq          %xmm1,%rbx
   .byte  68,15,182,203                       // movzbl        %bl,%r9d
@@ -29238,7 +28986,7 @@
   .byte  102,15,58,33,202,48                 // insertps      $0x30,%xmm2,%xmm1
   .byte  76,139,64,24                        // mov           0x18(%rax),%r8
   .byte  102,65,15,111,208                   // movdqa        %xmm8,%xmm2
-  .byte  102,15,56,0,21,254,208,1,0          // pshufb        0x1d0fe(%rip),%xmm2        # 3b640 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
+  .byte  102,15,56,0,21,60,206,1,0           // pshufb        0x1ce3c(%rip),%xmm2        # 3ae80 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
   .byte  102,72,15,58,22,211,1               // pextrq        $0x1,%xmm2,%rbx
   .byte  102,72,15,126,208                   // movq          %xmm2,%rax
   .byte  68,15,182,200                       // movzbl        %al,%r9d
@@ -29253,7 +29001,7 @@
   .byte  102,15,58,33,211,48                 // insertps      $0x30,%xmm3,%xmm2
   .byte  102,65,15,114,208,24                // psrld         $0x18,%xmm8
   .byte  65,15,91,216                        // cvtdq2ps      %xmm8,%xmm3
-  .byte  15,89,29,235,209,1,0                // mulps         0x1d1eb(%rip),%xmm3        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  15,89,29,41,207,1,0                 // mulps         0x1cf29(%rip),%xmm3        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  91                                  // pop           %rbx
   .byte  65,94                               // pop           %r14
@@ -29261,19 +29009,19 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,52                              // je            1e5dd <_sk_load_tables_sse41+0x163>
+  .byte  116,52                              // je            1e0df <_sk_load_tables_sse41+0x163>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,23                              // je            1e5cb <_sk_load_tables_sse41+0x151>
+  .byte  116,23                              // je            1e0cd <_sk_load_tables_sse41+0x151>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  15,133,208,254,255,255              // jne           1e48e <_sk_load_tables_sse41+0x14>
+  .byte  15,133,208,254,255,255              // jne           1df90 <_sk_load_tables_sse41+0x14>
   .byte  102,65,15,110,68,144,8              // movd          0x8(%r8,%rdx,4),%xmm0
   .byte  102,68,15,112,192,69                // pshufd        $0x45,%xmm0,%xmm8
   .byte  243,65,15,126,4,144                 // movq          (%r8,%rdx,4),%xmm0
   .byte  102,68,15,58,14,192,15              // pblendw       $0xf,%xmm0,%xmm8
-  .byte  233,177,254,255,255                 // jmpq          1e48e <_sk_load_tables_sse41+0x14>
+  .byte  233,177,254,255,255                 // jmpq          1df90 <_sk_load_tables_sse41+0x14>
   .byte  102,69,15,110,4,144                 // movd          (%r8,%rdx,4),%xmm8
-  .byte  233,166,254,255,255                 // jmpq          1e48e <_sk_load_tables_sse41+0x14>
+  .byte  233,166,254,255,255                 // jmpq          1df90 <_sk_load_tables_sse41+0x14>
 
 HIDDEN _sk_load_tables_u16_be_sse41
 .globl _sk_load_tables_u16_be_sse41
@@ -29283,7 +29031,7 @@
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  76,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,95,1,0,0                     // jne           1e75d <_sk_load_tables_u16_be_sse41+0x175>
+  .byte  15,133,95,1,0,0                     // jne           1e25f <_sk_load_tables_u16_be_sse41+0x175>
   .byte  102,67,15,16,4,72                   // movupd        (%r8,%r9,2),%xmm0
   .byte  243,67,15,111,76,72,16              // movdqu        0x10(%r8,%r9,2),%xmm1
   .byte  65,86                               // push          %r14
@@ -29294,7 +29042,7 @@
   .byte  102,65,15,111,201                   // movdqa        %xmm9,%xmm1
   .byte  102,15,97,200                       // punpcklwd     %xmm0,%xmm1
   .byte  102,68,15,105,200                   // punpckhwd     %xmm0,%xmm9
-  .byte  102,68,15,111,5,189,209,1,0         // movdqa        0x1d1bd(%rip),%xmm8        # 3b7f0 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
+  .byte  102,68,15,111,5,251,206,1,0         // movdqa        0x1cefb(%rip),%xmm8        # 3b030 <_sk_srcover_bgra_8888_sse2_lowp+0xf34>
   .byte  102,15,111,193                      // movdqa        %xmm1,%xmm0
   .byte  102,65,15,219,192                   // pand          %xmm8,%xmm0
   .byte  102,15,56,51,192                    // pmovzxwd      %xmm0,%xmm0
@@ -29312,7 +29060,7 @@
   .byte  102,15,58,33,194,32                 // insertps      $0x20,%xmm2,%xmm0
   .byte  243,66,15,16,20,3                   // movss         (%rbx,%r8,1),%xmm2
   .byte  102,15,58,33,194,48                 // insertps      $0x30,%xmm2,%xmm0
-  .byte  102,15,56,0,13,108,209,1,0          // pshufb        0x1d16c(%rip),%xmm1        # 3b800 <_sk_srcover_bgra_8888_sse2_lowp+0xf34>
+  .byte  102,15,56,0,13,170,206,1,0          // pshufb        0x1ceaa(%rip),%xmm1        # 3b040 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
   .byte  102,15,56,51,201                    // pmovzxwd      %xmm1,%xmm1
   .byte  102,73,15,58,22,200,1               // pextrq        $0x1,%xmm1,%r8
   .byte  102,72,15,126,203                   // movq          %xmm1,%rbx
@@ -29348,23 +29096,23 @@
   .byte  102,65,15,235,216                   // por           %xmm8,%xmm3
   .byte  102,15,56,51,219                    // pmovzxwd      %xmm3,%xmm3
   .byte  15,91,219                           // cvtdq2ps      %xmm3,%xmm3
-  .byte  15,89,29,186,208,1,0                // mulps         0x1d0ba(%rip),%xmm3        # 3b810 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
+  .byte  15,89,29,248,205,1,0                // mulps         0x1cdf8(%rip),%xmm3        # 3b050 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  91                                  // pop           %rbx
   .byte  65,94                               // pop           %r14
   .byte  255,224                             // jmpq          *%rax
   .byte  242,67,15,16,4,72                   // movsd         (%r8,%r9,2),%xmm0
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,13                              // jne           1e776 <_sk_load_tables_u16_be_sse41+0x18e>
+  .byte  117,13                              // jne           1e278 <_sk_load_tables_u16_be_sse41+0x18e>
   .byte  243,15,126,192                      // movq          %xmm0,%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  233,149,254,255,255                 // jmpq          1e60b <_sk_load_tables_u16_be_sse41+0x23>
+  .byte  233,149,254,255,255                 // jmpq          1e10d <_sk_load_tables_u16_be_sse41+0x23>
   .byte  102,67,15,22,68,72,8                // movhpd        0x8(%r8,%r9,2),%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  15,130,128,254,255,255              // jb            1e60b <_sk_load_tables_u16_be_sse41+0x23>
+  .byte  15,130,128,254,255,255              // jb            1e10d <_sk_load_tables_u16_be_sse41+0x23>
   .byte  243,67,15,126,76,72,16              // movq          0x10(%r8,%r9,2),%xmm1
-  .byte  233,116,254,255,255                 // jmpq          1e60b <_sk_load_tables_u16_be_sse41+0x23>
+  .byte  233,116,254,255,255                 // jmpq          1e10d <_sk_load_tables_u16_be_sse41+0x23>
 
 HIDDEN _sk_load_tables_rgb_u16_be_sse41
 .globl _sk_load_tables_rgb_u16_be_sse41
@@ -29374,7 +29122,7 @@
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  76,141,12,82                        // lea           (%rdx,%rdx,2),%r9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,79,1,0,0                     // jne           1e8f8 <_sk_load_tables_rgb_u16_be_sse41+0x161>
+  .byte  15,133,79,1,0,0                     // jne           1e3fa <_sk_load_tables_rgb_u16_be_sse41+0x161>
   .byte  243,67,15,111,20,72                 // movdqu        (%r8,%r9,2),%xmm2
   .byte  243,67,15,111,76,72,8               // movdqu        0x8(%r8,%r9,2),%xmm1
   .byte  102,15,115,217,4                    // psrldq        $0x4,%xmm1
@@ -29388,7 +29136,7 @@
   .byte  102,15,97,209                       // punpcklwd     %xmm1,%xmm2
   .byte  102,15,111,202                      // movdqa        %xmm2,%xmm1
   .byte  102,65,15,97,201                    // punpcklwd     %xmm9,%xmm1
-  .byte  102,68,15,111,5,3,208,1,0           // movdqa        0x1d003(%rip),%xmm8        # 3b7f0 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
+  .byte  102,68,15,111,5,65,205,1,0          // movdqa        0x1cd41(%rip),%xmm8        # 3b030 <_sk_srcover_bgra_8888_sse2_lowp+0xf34>
   .byte  102,15,111,193                      // movdqa        %xmm1,%xmm0
   .byte  102,65,15,219,192                   // pand          %xmm8,%xmm0
   .byte  102,15,56,51,192                    // pmovzxwd      %xmm0,%xmm0
@@ -29406,7 +29154,7 @@
   .byte  102,15,58,33,195,32                 // insertps      $0x20,%xmm3,%xmm0
   .byte  243,66,15,16,28,3                   // movss         (%rbx,%r8,1),%xmm3
   .byte  102,15,58,33,195,48                 // insertps      $0x30,%xmm3,%xmm0
-  .byte  102,15,56,0,13,178,207,1,0          // pshufb        0x1cfb2(%rip),%xmm1        # 3b800 <_sk_srcover_bgra_8888_sse2_lowp+0xf34>
+  .byte  102,15,56,0,13,240,204,1,0          // pshufb        0x1ccf0(%rip),%xmm1        # 3b040 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
   .byte  102,15,56,51,201                    // pmovzxwd      %xmm1,%xmm1
   .byte  102,73,15,58,22,200,1               // pextrq        $0x1,%xmm1,%r8
   .byte  102,72,15,126,203                   // movq          %xmm1,%rbx
@@ -29437,7 +29185,7 @@
   .byte  243,65,15,16,28,24                  // movss         (%r8,%rbx,1),%xmm3
   .byte  102,15,58,33,211,48                 // insertps      $0x30,%xmm3,%xmm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,125,204,1,0                // movaps        0x1cc7d(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,29,187,201,1,0                // movaps        0x1c9bb(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  91                                  // pop           %rbx
   .byte  65,94                               // pop           %r14
   .byte  255,224                             // jmpq          *%rax
@@ -29445,21 +29193,21 @@
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,67,15,196,84,72,4,2             // pinsrw        $0x2,0x4(%r8,%r9,2),%xmm2
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,14                              // jne           1e91e <_sk_load_tables_rgb_u16_be_sse41+0x187>
+  .byte  117,14                              // jne           1e420 <_sk_load_tables_rgb_u16_be_sse41+0x187>
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
-  .byte  233,177,254,255,255                 // jmpq          1e7cf <_sk_load_tables_rgb_u16_be_sse41+0x38>
+  .byte  233,177,254,255,255                 // jmpq          1e2d1 <_sk_load_tables_rgb_u16_be_sse41+0x38>
   .byte  102,71,15,110,76,72,6               // movd          0x6(%r8,%r9,2),%xmm9
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,71,15,196,76,72,10,2            // pinsrw        $0x2,0xa(%r8,%r9,2),%xmm9
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,24                              // jb            1e94f <_sk_load_tables_rgb_u16_be_sse41+0x1b8>
+  .byte  114,24                              // jb            1e451 <_sk_load_tables_rgb_u16_be_sse41+0x1b8>
   .byte  102,67,15,110,76,72,12              // movd          0xc(%r8,%r9,2),%xmm1
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,67,15,196,76,72,16,2            // pinsrw        $0x2,0x10(%r8,%r9,2),%xmm1
-  .byte  233,128,254,255,255                 // jmpq          1e7cf <_sk_load_tables_rgb_u16_be_sse41+0x38>
+  .byte  233,128,254,255,255                 // jmpq          1e2d1 <_sk_load_tables_rgb_u16_be_sse41+0x38>
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  233,119,254,255,255                 // jmpq          1e7cf <_sk_load_tables_rgb_u16_be_sse41+0x38>
+  .byte  233,119,254,255,255                 // jmpq          1e2d1 <_sk_load_tables_rgb_u16_be_sse41+0x38>
 
 HIDDEN _sk_byte_tables_sse41
 .globl _sk_byte_tables_sse41
@@ -29472,9 +29220,9 @@
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  69,15,87,219                        // xorps         %xmm11,%xmm11
   .byte  68,15,95,216                        // maxps         %xmm0,%xmm11
-  .byte  68,15,40,13,254,203,1,0             // movaps        0x1cbfe(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,13,60,201,1,0              // movaps        0x1c93c(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,93,217                        // minps         %xmm9,%xmm11
-  .byte  68,15,40,21,210,204,1,0             // movaps        0x1ccd2(%rip),%xmm10        # 3b650 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  .byte  68,15,40,21,16,202,1,0              // movaps        0x1ca10(%rip),%xmm10        # 3ae90 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
   .byte  69,15,89,218                        // mulps         %xmm10,%xmm11
   .byte  102,65,15,91,195                    // cvtps2dq      %xmm11,%xmm0
   .byte  102,73,15,58,22,192,1               // pextrq        $0x1,%xmm0,%r8
@@ -29497,7 +29245,7 @@
   .byte  102,15,58,32,197,3                  // pinsrb        $0x3,%ebp,%xmm0
   .byte  102,15,56,49,192                    // pmovzxbd      %xmm0,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  68,15,40,29,151,205,1,0             // movaps        0x1cd97(%rip),%xmm11        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  68,15,40,29,213,202,1,0             // movaps        0x1cad5(%rip),%xmm11        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  65,15,89,195                        // mulps         %xmm11,%xmm0
   .byte  69,15,87,228                        // xorps         %xmm12,%xmm12
   .byte  68,15,95,225                        // maxps         %xmm1,%xmm12
@@ -29588,7 +29336,7 @@
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  69,15,87,219                        // xorps         %xmm11,%xmm11
   .byte  68,15,95,216                        // maxps         %xmm0,%xmm11
-  .byte  68,15,40,21,22,202,1,0              // movaps        0x1ca16(%rip),%xmm10        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,21,84,199,1,0              // movaps        0x1c754(%rip),%xmm10        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,93,218                        // minps         %xmm10,%xmm11
   .byte  69,15,89,216                        // mulps         %xmm8,%xmm11
   .byte  102,65,15,91,195                    // cvtps2dq      %xmm11,%xmm0
@@ -29612,7 +29360,7 @@
   .byte  102,15,58,32,197,3                  // pinsrb        $0x3,%ebp,%xmm0
   .byte  102,15,56,49,192                    // pmovzxbd      %xmm0,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  68,15,40,29,183,203,1,0             // movaps        0x1cbb7(%rip),%xmm11        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  68,15,40,29,245,200,1,0             // movaps        0x1c8f5(%rip),%xmm11        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  65,15,89,195                        // mulps         %xmm11,%xmm0
   .byte  69,15,87,228                        // xorps         %xmm12,%xmm12
   .byte  68,15,95,225                        // maxps         %xmm1,%xmm12
@@ -29677,7 +29425,7 @@
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  68,15,95,200                        // maxps         %xmm0,%xmm9
-  .byte  68,15,93,13,167,200,1,0             // minps         0x1c8a7(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,93,13,229,197,1,0             // minps         0x1c5e5(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  102,65,15,91,193                    // cvtps2dq      %xmm9,%xmm0
   .byte  102,72,15,58,22,192,1               // pextrq        $0x1,%xmm0,%rax
@@ -29708,7 +29456,7 @@
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  68,15,95,201                        // maxps         %xmm1,%xmm9
-  .byte  68,15,93,13,47,200,1,0              // minps         0x1c82f(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,93,13,109,197,1,0             // minps         0x1c56d(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  102,65,15,91,201                    // cvtps2dq      %xmm9,%xmm1
   .byte  102,72,15,58,22,200,1               // pextrq        $0x1,%xmm1,%rax
@@ -29739,7 +29487,7 @@
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  68,15,95,202                        // maxps         %xmm2,%xmm9
-  .byte  68,15,93,13,183,199,1,0             // minps         0x1c7b7(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,93,13,245,196,1,0             // minps         0x1c4f5(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  102,65,15,91,209                    // cvtps2dq      %xmm9,%xmm2
   .byte  102,72,15,58,22,208,1               // pextrq        $0x1,%xmm2,%rax
@@ -29770,7 +29518,7 @@
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  68,15,95,203                        // maxps         %xmm3,%xmm9
-  .byte  68,15,93,13,63,199,1,0              // minps         0x1c73f(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,93,13,125,196,1,0             // minps         0x1c47d(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  102,65,15,91,217                    // cvtps2dq      %xmm9,%xmm3
   .byte  102,72,15,58,22,216,1               // pextrq        $0x1,%xmm3,%rax
@@ -29812,32 +29560,32 @@
   .byte  69,15,198,228,0                     // shufps        $0x0,%xmm12,%xmm12
   .byte  69,15,87,219                        // xorps         %xmm11,%xmm11
   .byte  69,15,91,194                        // cvtdq2ps      %xmm10,%xmm8
-  .byte  68,15,89,5,56,201,1,0               // mulps         0x1c938(%rip),%xmm8        # 3b820 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
-  .byte  68,15,40,45,64,201,1,0              // movaps        0x1c940(%rip),%xmm13        # 3b830 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  .byte  68,15,89,5,118,198,1,0              // mulps         0x1c676(%rip),%xmm8        # 3b060 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  .byte  68,15,40,45,126,198,1,0             // movaps        0x1c67e(%rip),%xmm13        # 3b070 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
   .byte  69,15,84,234                        // andps         %xmm10,%xmm13
-  .byte  68,15,86,45,100,198,1,0             // orps          0x1c664(%rip),%xmm13        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
-  .byte  68,15,88,5,60,201,1,0               // addps         0x1c93c(%rip),%xmm8        # 3b840 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
-  .byte  68,15,40,53,68,201,1,0              // movaps        0x1c944(%rip),%xmm14        # 3b850 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  68,15,86,45,162,195,1,0             // orps          0x1c3a2(%rip),%xmm13        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,88,5,122,198,1,0              // addps         0x1c67a(%rip),%xmm8        # 3b080 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  68,15,40,53,130,198,1,0             // movaps        0x1c682(%rip),%xmm14        # 3b090 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
   .byte  69,15,89,245                        // mulps         %xmm13,%xmm14
   .byte  69,15,92,198                        // subps         %xmm14,%xmm8
-  .byte  68,15,88,45,68,201,1,0              // addps         0x1c944(%rip),%xmm13        # 3b860 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
-  .byte  68,15,40,53,76,201,1,0              // movaps        0x1c94c(%rip),%xmm14        # 3b870 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  .byte  68,15,88,45,130,198,1,0             // addps         0x1c682(%rip),%xmm13        # 3b0a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  .byte  68,15,40,53,138,198,1,0             // movaps        0x1c68a(%rip),%xmm14        # 3b0b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
   .byte  69,15,94,245                        // divps         %xmm13,%xmm14
   .byte  69,15,92,198                        // subps         %xmm14,%xmm8
   .byte  69,15,89,196                        // mulps         %xmm12,%xmm8
   .byte  102,69,15,58,8,224,1                // roundps       $0x1,%xmm8,%xmm12
   .byte  69,15,40,232                        // movaps        %xmm8,%xmm13
   .byte  69,15,92,236                        // subps         %xmm12,%xmm13
-  .byte  68,15,88,5,57,201,1,0               // addps         0x1c939(%rip),%xmm8        # 3b880 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
-  .byte  68,15,40,37,65,201,1,0              // movaps        0x1c941(%rip),%xmm12        # 3b890 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  68,15,88,5,119,198,1,0              // addps         0x1c677(%rip),%xmm8        # 3b0c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  68,15,40,37,127,198,1,0             // movaps        0x1c67f(%rip),%xmm12        # 3b0d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
   .byte  69,15,89,229                        // mulps         %xmm13,%xmm12
   .byte  69,15,92,196                        // subps         %xmm12,%xmm8
-  .byte  68,15,40,37,65,201,1,0              // movaps        0x1c941(%rip),%xmm12        # 3b8a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
+  .byte  68,15,40,37,127,198,1,0             // movaps        0x1c67f(%rip),%xmm12        # 3b0e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
   .byte  69,15,92,229                        // subps         %xmm13,%xmm12
-  .byte  68,15,40,45,69,201,1,0              // movaps        0x1c945(%rip),%xmm13        # 3b8b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
+  .byte  68,15,40,45,131,198,1,0             // movaps        0x1c683(%rip),%xmm13        # 3b0f0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
   .byte  69,15,94,236                        // divps         %xmm12,%xmm13
   .byte  69,15,88,232                        // addps         %xmm8,%xmm13
-  .byte  68,15,89,45,69,201,1,0              // mulps         0x1c945(%rip),%xmm13        # 3b8c0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
+  .byte  68,15,89,45,131,198,1,0             // mulps         0x1c683(%rip),%xmm13        # 3b100 <_sk_srcover_bgra_8888_sse2_lowp+0x1004>
   .byte  102,69,15,91,197                    // cvtps2dq      %xmm13,%xmm8
   .byte  69,15,194,211,4                     // cmpneqps      %xmm11,%xmm10
   .byte  69,15,84,208                        // andps         %xmm8,%xmm10
@@ -29846,7 +29594,7 @@
   .byte  69,15,88,194                        // addps         %xmm10,%xmm8
   .byte  102,69,15,56,20,193                 // blendvps      %xmm0,%xmm9,%xmm8
   .byte  69,15,95,195                        // maxps         %xmm11,%xmm8
-  .byte  68,15,93,5,198,197,1,0              // minps         0x1c5c6(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,93,5,4,195,1,0                // minps         0x1c304(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  255,224                             // jmpq          *%rax
@@ -29877,32 +29625,32 @@
   .byte  69,15,198,228,0                     // shufps        $0x0,%xmm12,%xmm12
   .byte  69,15,87,219                        // xorps         %xmm11,%xmm11
   .byte  69,15,91,242                        // cvtdq2ps      %xmm10,%xmm14
-  .byte  68,15,89,53,3,200,1,0               // mulps         0x1c803(%rip),%xmm14        # 3b820 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
-  .byte  68,15,40,45,11,200,1,0              // movaps        0x1c80b(%rip),%xmm13        # 3b830 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  .byte  68,15,89,53,65,197,1,0              // mulps         0x1c541(%rip),%xmm14        # 3b060 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  .byte  68,15,40,45,73,197,1,0              // movaps        0x1c549(%rip),%xmm13        # 3b070 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
   .byte  69,15,84,234                        // andps         %xmm10,%xmm13
-  .byte  68,15,86,45,47,197,1,0              // orps          0x1c52f(%rip),%xmm13        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
-  .byte  68,15,88,53,7,200,1,0               // addps         0x1c807(%rip),%xmm14        # 3b840 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
-  .byte  15,40,13,16,200,1,0                 // movaps        0x1c810(%rip),%xmm1        # 3b850 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  68,15,86,45,109,194,1,0             // orps          0x1c26d(%rip),%xmm13        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,88,53,69,197,1,0              // addps         0x1c545(%rip),%xmm14        # 3b080 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  15,40,13,78,197,1,0                 // movaps        0x1c54e(%rip),%xmm1        # 3b090 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
   .byte  65,15,89,205                        // mulps         %xmm13,%xmm1
   .byte  68,15,92,241                        // subps         %xmm1,%xmm14
-  .byte  68,15,88,45,16,200,1,0              // addps         0x1c810(%rip),%xmm13        # 3b860 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
-  .byte  15,40,13,25,200,1,0                 // movaps        0x1c819(%rip),%xmm1        # 3b870 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  .byte  68,15,88,45,78,197,1,0              // addps         0x1c54e(%rip),%xmm13        # 3b0a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  .byte  15,40,13,87,197,1,0                 // movaps        0x1c557(%rip),%xmm1        # 3b0b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
   .byte  65,15,94,205                        // divps         %xmm13,%xmm1
   .byte  68,15,92,241                        // subps         %xmm1,%xmm14
   .byte  69,15,89,244                        // mulps         %xmm12,%xmm14
   .byte  102,69,15,58,8,230,1                // roundps       $0x1,%xmm14,%xmm12
   .byte  69,15,40,238                        // movaps        %xmm14,%xmm13
   .byte  69,15,92,236                        // subps         %xmm12,%xmm13
-  .byte  68,15,88,53,6,200,1,0               // addps         0x1c806(%rip),%xmm14        # 3b880 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
-  .byte  15,40,13,15,200,1,0                 // movaps        0x1c80f(%rip),%xmm1        # 3b890 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  68,15,88,53,68,197,1,0              // addps         0x1c544(%rip),%xmm14        # 3b0c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  15,40,13,77,197,1,0                 // movaps        0x1c54d(%rip),%xmm1        # 3b0d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
   .byte  65,15,89,205                        // mulps         %xmm13,%xmm1
   .byte  68,15,92,241                        // subps         %xmm1,%xmm14
-  .byte  68,15,40,37,15,200,1,0              // movaps        0x1c80f(%rip),%xmm12        # 3b8a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
+  .byte  68,15,40,37,77,197,1,0              // movaps        0x1c54d(%rip),%xmm12        # 3b0e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
   .byte  69,15,92,229                        // subps         %xmm13,%xmm12
-  .byte  15,40,13,20,200,1,0                 // movaps        0x1c814(%rip),%xmm1        # 3b8b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
+  .byte  15,40,13,82,197,1,0                 // movaps        0x1c552(%rip),%xmm1        # 3b0f0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
   .byte  65,15,94,204                        // divps         %xmm12,%xmm1
   .byte  65,15,88,206                        // addps         %xmm14,%xmm1
-  .byte  15,89,13,21,200,1,0                 // mulps         0x1c815(%rip),%xmm1        # 3b8c0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
+  .byte  15,89,13,83,197,1,0                 // mulps         0x1c553(%rip),%xmm1        # 3b100 <_sk_srcover_bgra_8888_sse2_lowp+0x1004>
   .byte  102,15,91,201                       // cvtps2dq      %xmm1,%xmm1
   .byte  69,15,194,211,4                     // cmpneqps      %xmm11,%xmm10
   .byte  68,15,84,209                        // andps         %xmm1,%xmm10
@@ -29911,7 +29659,7 @@
   .byte  65,15,88,202                        // addps         %xmm10,%xmm1
   .byte  102,65,15,56,20,201                 // blendvps      %xmm0,%xmm9,%xmm1
   .byte  65,15,95,203                        // maxps         %xmm11,%xmm1
-  .byte  15,93,13,154,196,1,0                // minps         0x1c49a(%rip),%xmm1        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,93,13,216,193,1,0                // minps         0x1c1d8(%rip),%xmm1        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  255,224                             // jmpq          *%rax
@@ -29942,32 +29690,32 @@
   .byte  69,15,198,228,0                     // shufps        $0x0,%xmm12,%xmm12
   .byte  69,15,87,219                        // xorps         %xmm11,%xmm11
   .byte  69,15,91,242                        // cvtdq2ps      %xmm10,%xmm14
-  .byte  68,15,89,53,215,198,1,0             // mulps         0x1c6d7(%rip),%xmm14        # 3b820 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
-  .byte  68,15,40,45,223,198,1,0             // movaps        0x1c6df(%rip),%xmm13        # 3b830 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  .byte  68,15,89,53,21,196,1,0              // mulps         0x1c415(%rip),%xmm14        # 3b060 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  .byte  68,15,40,45,29,196,1,0              // movaps        0x1c41d(%rip),%xmm13        # 3b070 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
   .byte  69,15,84,234                        // andps         %xmm10,%xmm13
-  .byte  68,15,86,45,3,196,1,0               // orps          0x1c403(%rip),%xmm13        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
-  .byte  68,15,88,53,219,198,1,0             // addps         0x1c6db(%rip),%xmm14        # 3b840 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
-  .byte  15,40,21,228,198,1,0                // movaps        0x1c6e4(%rip),%xmm2        # 3b850 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  68,15,86,45,65,193,1,0              // orps          0x1c141(%rip),%xmm13        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,88,53,25,196,1,0              // addps         0x1c419(%rip),%xmm14        # 3b080 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  15,40,21,34,196,1,0                 // movaps        0x1c422(%rip),%xmm2        # 3b090 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
   .byte  65,15,89,213                        // mulps         %xmm13,%xmm2
   .byte  68,15,92,242                        // subps         %xmm2,%xmm14
-  .byte  68,15,88,45,228,198,1,0             // addps         0x1c6e4(%rip),%xmm13        # 3b860 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
-  .byte  15,40,21,237,198,1,0                // movaps        0x1c6ed(%rip),%xmm2        # 3b870 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  .byte  68,15,88,45,34,196,1,0              // addps         0x1c422(%rip),%xmm13        # 3b0a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  .byte  15,40,21,43,196,1,0                 // movaps        0x1c42b(%rip),%xmm2        # 3b0b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
   .byte  65,15,94,213                        // divps         %xmm13,%xmm2
   .byte  68,15,92,242                        // subps         %xmm2,%xmm14
   .byte  69,15,89,244                        // mulps         %xmm12,%xmm14
   .byte  102,69,15,58,8,230,1                // roundps       $0x1,%xmm14,%xmm12
   .byte  69,15,40,238                        // movaps        %xmm14,%xmm13
   .byte  69,15,92,236                        // subps         %xmm12,%xmm13
-  .byte  68,15,88,53,218,198,1,0             // addps         0x1c6da(%rip),%xmm14        # 3b880 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
-  .byte  15,40,21,227,198,1,0                // movaps        0x1c6e3(%rip),%xmm2        # 3b890 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  68,15,88,53,24,196,1,0              // addps         0x1c418(%rip),%xmm14        # 3b0c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  15,40,21,33,196,1,0                 // movaps        0x1c421(%rip),%xmm2        # 3b0d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
   .byte  65,15,89,213                        // mulps         %xmm13,%xmm2
   .byte  68,15,92,242                        // subps         %xmm2,%xmm14
-  .byte  68,15,40,37,227,198,1,0             // movaps        0x1c6e3(%rip),%xmm12        # 3b8a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
+  .byte  68,15,40,37,33,196,1,0              // movaps        0x1c421(%rip),%xmm12        # 3b0e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
   .byte  69,15,92,229                        // subps         %xmm13,%xmm12
-  .byte  15,40,21,232,198,1,0                // movaps        0x1c6e8(%rip),%xmm2        # 3b8b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
+  .byte  15,40,21,38,196,1,0                 // movaps        0x1c426(%rip),%xmm2        # 3b0f0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
   .byte  65,15,94,212                        // divps         %xmm12,%xmm2
   .byte  65,15,88,214                        // addps         %xmm14,%xmm2
-  .byte  15,89,21,233,198,1,0                // mulps         0x1c6e9(%rip),%xmm2        # 3b8c0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
+  .byte  15,89,21,39,196,1,0                 // mulps         0x1c427(%rip),%xmm2        # 3b100 <_sk_srcover_bgra_8888_sse2_lowp+0x1004>
   .byte  102,15,91,210                       // cvtps2dq      %xmm2,%xmm2
   .byte  69,15,194,211,4                     // cmpneqps      %xmm11,%xmm10
   .byte  68,15,84,210                        // andps         %xmm2,%xmm10
@@ -29976,7 +29724,7 @@
   .byte  65,15,88,210                        // addps         %xmm10,%xmm2
   .byte  102,65,15,56,20,209                 // blendvps      %xmm0,%xmm9,%xmm2
   .byte  65,15,95,211                        // maxps         %xmm11,%xmm2
-  .byte  15,93,21,110,195,1,0                // minps         0x1c36e(%rip),%xmm2        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,93,21,172,192,1,0                // minps         0x1c0ac(%rip),%xmm2        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  255,224                             // jmpq          *%rax
@@ -30007,32 +29755,32 @@
   .byte  69,15,198,228,0                     // shufps        $0x0,%xmm12,%xmm12
   .byte  69,15,87,219                        // xorps         %xmm11,%xmm11
   .byte  69,15,91,242                        // cvtdq2ps      %xmm10,%xmm14
-  .byte  68,15,89,53,171,197,1,0             // mulps         0x1c5ab(%rip),%xmm14        # 3b820 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
-  .byte  68,15,40,45,179,197,1,0             // movaps        0x1c5b3(%rip),%xmm13        # 3b830 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  .byte  68,15,89,53,233,194,1,0             // mulps         0x1c2e9(%rip),%xmm14        # 3b060 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  .byte  68,15,40,45,241,194,1,0             // movaps        0x1c2f1(%rip),%xmm13        # 3b070 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
   .byte  69,15,84,234                        // andps         %xmm10,%xmm13
-  .byte  68,15,86,45,215,194,1,0             // orps          0x1c2d7(%rip),%xmm13        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
-  .byte  68,15,88,53,175,197,1,0             // addps         0x1c5af(%rip),%xmm14        # 3b840 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
-  .byte  15,40,29,184,197,1,0                // movaps        0x1c5b8(%rip),%xmm3        # 3b850 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  68,15,86,45,21,192,1,0              // orps          0x1c015(%rip),%xmm13        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,88,53,237,194,1,0             // addps         0x1c2ed(%rip),%xmm14        # 3b080 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  15,40,29,246,194,1,0                // movaps        0x1c2f6(%rip),%xmm3        # 3b090 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
   .byte  65,15,89,221                        // mulps         %xmm13,%xmm3
   .byte  68,15,92,243                        // subps         %xmm3,%xmm14
-  .byte  68,15,88,45,184,197,1,0             // addps         0x1c5b8(%rip),%xmm13        # 3b860 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
-  .byte  15,40,29,193,197,1,0                // movaps        0x1c5c1(%rip),%xmm3        # 3b870 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  .byte  68,15,88,45,246,194,1,0             // addps         0x1c2f6(%rip),%xmm13        # 3b0a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  .byte  15,40,29,255,194,1,0                // movaps        0x1c2ff(%rip),%xmm3        # 3b0b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
   .byte  65,15,94,221                        // divps         %xmm13,%xmm3
   .byte  68,15,92,243                        // subps         %xmm3,%xmm14
   .byte  69,15,89,244                        // mulps         %xmm12,%xmm14
   .byte  102,69,15,58,8,230,1                // roundps       $0x1,%xmm14,%xmm12
   .byte  69,15,40,238                        // movaps        %xmm14,%xmm13
   .byte  69,15,92,236                        // subps         %xmm12,%xmm13
-  .byte  68,15,88,53,174,197,1,0             // addps         0x1c5ae(%rip),%xmm14        # 3b880 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
-  .byte  15,40,29,183,197,1,0                // movaps        0x1c5b7(%rip),%xmm3        # 3b890 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  68,15,88,53,236,194,1,0             // addps         0x1c2ec(%rip),%xmm14        # 3b0c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  15,40,29,245,194,1,0                // movaps        0x1c2f5(%rip),%xmm3        # 3b0d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
   .byte  65,15,89,221                        // mulps         %xmm13,%xmm3
   .byte  68,15,92,243                        // subps         %xmm3,%xmm14
-  .byte  68,15,40,37,183,197,1,0             // movaps        0x1c5b7(%rip),%xmm12        # 3b8a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
+  .byte  68,15,40,37,245,194,1,0             // movaps        0x1c2f5(%rip),%xmm12        # 3b0e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
   .byte  69,15,92,229                        // subps         %xmm13,%xmm12
-  .byte  15,40,29,188,197,1,0                // movaps        0x1c5bc(%rip),%xmm3        # 3b8b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
+  .byte  15,40,29,250,194,1,0                // movaps        0x1c2fa(%rip),%xmm3        # 3b0f0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
   .byte  65,15,94,220                        // divps         %xmm12,%xmm3
   .byte  65,15,88,222                        // addps         %xmm14,%xmm3
-  .byte  15,89,29,189,197,1,0                // mulps         0x1c5bd(%rip),%xmm3        # 3b8c0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
+  .byte  15,89,29,251,194,1,0                // mulps         0x1c2fb(%rip),%xmm3        # 3b100 <_sk_srcover_bgra_8888_sse2_lowp+0x1004>
   .byte  102,15,91,219                       // cvtps2dq      %xmm3,%xmm3
   .byte  69,15,194,211,4                     // cmpneqps      %xmm11,%xmm10
   .byte  68,15,84,211                        // andps         %xmm3,%xmm10
@@ -30041,7 +29789,7 @@
   .byte  65,15,88,218                        // addps         %xmm10,%xmm3
   .byte  102,65,15,56,20,217                 // blendvps      %xmm0,%xmm9,%xmm3
   .byte  65,15,95,219                        // maxps         %xmm11,%xmm3
-  .byte  15,93,29,66,194,1,0                 // minps         0x1c242(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,93,29,128,191,1,0                // minps         0x1bf80(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  255,224                             // jmpq          *%rax
@@ -30059,21 +29807,21 @@
   .byte  68,15,40,209                        // movaps        %xmm1,%xmm10
   .byte  15,40,224                           // movaps        %xmm0,%xmm4
   .byte  15,91,244                           // cvtdq2ps      %xmm4,%xmm6
-  .byte  15,40,5,188,196,1,0                 // movaps        0x1c4bc(%rip),%xmm0        # 3b820 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
+  .byte  15,40,5,250,193,1,0                 // movaps        0x1c1fa(%rip),%xmm0        # 3b060 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
   .byte  15,89,240                           // mulps         %xmm0,%xmm6
   .byte  15,40,232                           // movaps        %xmm0,%xmm5
-  .byte  68,15,40,5,190,196,1,0              // movaps        0x1c4be(%rip),%xmm8        # 3b830 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  .byte  68,15,40,5,252,193,1,0              // movaps        0x1c1fc(%rip),%xmm8        # 3b070 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
   .byte  15,40,196                           // movaps        %xmm4,%xmm0
   .byte  65,15,84,192                        // andps         %xmm8,%xmm0
-  .byte  15,86,5,224,193,1,0                 // orps          0x1c1e0(%rip),%xmm0        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
-  .byte  15,88,53,185,196,1,0                // addps         0x1c4b9(%rip),%xmm6        # 3b840 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
-  .byte  68,15,40,29,193,196,1,0             // movaps        0x1c4c1(%rip),%xmm11        # 3b850 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  15,86,5,30,191,1,0                  // orps          0x1bf1e(%rip),%xmm0        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,88,53,247,193,1,0                // addps         0x1c1f7(%rip),%xmm6        # 3b080 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  68,15,40,29,255,193,1,0             // movaps        0x1c1ff(%rip),%xmm11        # 3b090 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  65,15,89,203                        // mulps         %xmm11,%xmm1
   .byte  15,92,241                           // subps         %xmm1,%xmm6
-  .byte  68,15,40,61,191,196,1,0             // movaps        0x1c4bf(%rip),%xmm15        # 3b860 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
+  .byte  68,15,40,61,253,193,1,0             // movaps        0x1c1fd(%rip),%xmm15        # 3b0a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
   .byte  65,15,88,199                        // addps         %xmm15,%xmm0
-  .byte  68,15,40,53,195,196,1,0             // movaps        0x1c4c3(%rip),%xmm14        # 3b870 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  .byte  68,15,40,53,1,194,1,0               // movaps        0x1c201(%rip),%xmm14        # 3b0b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
   .byte  65,15,40,206                        // movaps        %xmm14,%xmm1
   .byte  15,94,200                           // divps         %xmm0,%xmm1
   .byte  15,92,241                           // subps         %xmm1,%xmm6
@@ -30084,19 +29832,19 @@
   .byte  102,15,58,8,198,1                   // roundps       $0x1,%xmm6,%xmm0
   .byte  15,40,206                           // movaps        %xmm6,%xmm1
   .byte  15,92,200                           // subps         %xmm0,%xmm1
-  .byte  15,88,53,169,196,1,0                // addps         0x1c4a9(%rip),%xmm6        # 3b880 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
-  .byte  15,40,29,194,196,1,0                // movaps        0x1c4c2(%rip),%xmm3        # 3b8a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
+  .byte  15,88,53,231,193,1,0                // addps         0x1c1e7(%rip),%xmm6        # 3b0c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  15,40,29,0,194,1,0                  // movaps        0x1c200(%rip),%xmm3        # 3b0e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
   .byte  68,15,40,203                        // movaps        %xmm3,%xmm9
   .byte  68,15,92,201                        // subps         %xmm1,%xmm9
   .byte  15,40,193                           // movaps        %xmm1,%xmm0
-  .byte  15,40,13,160,196,1,0                // movaps        0x1c4a0(%rip),%xmm1        # 3b890 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  15,40,13,222,193,1,0                // movaps        0x1c1de(%rip),%xmm1        # 3b0d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
   .byte  15,89,193                           // mulps         %xmm1,%xmm0
   .byte  15,92,240                           // subps         %xmm0,%xmm6
-  .byte  68,15,40,45,178,196,1,0             // movaps        0x1c4b2(%rip),%xmm13        # 3b8b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
+  .byte  68,15,40,45,240,193,1,0             // movaps        0x1c1f0(%rip),%xmm13        # 3b0f0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
   .byte  65,15,40,197                        // movaps        %xmm13,%xmm0
   .byte  65,15,94,193                        // divps         %xmm9,%xmm0
   .byte  15,88,198                           // addps         %xmm6,%xmm0
-  .byte  68,15,40,13,175,196,1,0             // movaps        0x1c4af(%rip),%xmm9        # 3b8c0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
+  .byte  68,15,40,13,237,193,1,0             // movaps        0x1c1ed(%rip),%xmm9        # 3b100 <_sk_srcover_bgra_8888_sse2_lowp+0x1004>
   .byte  65,15,89,193                        // mulps         %xmm9,%xmm0
   .byte  102,15,91,192                       // cvtps2dq      %xmm0,%xmm0
   .byte  15,87,246                           // xorps         %xmm6,%xmm6
@@ -30106,9 +29854,9 @@
   .byte  15,89,197                           // mulps         %xmm5,%xmm0
   .byte  65,15,40,250                        // movaps        %xmm10,%xmm7
   .byte  65,15,84,248                        // andps         %xmm8,%xmm7
-  .byte  15,40,53,39,193,1,0                 // movaps        0x1c127(%rip),%xmm6        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  15,40,53,101,190,1,0                // movaps        0x1be65(%rip),%xmm6        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  15,86,254                           // orps          %xmm6,%xmm7
-  .byte  15,88,5,253,195,1,0                 // addps         0x1c3fd(%rip),%xmm0        # 3b840 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
+  .byte  15,88,5,59,193,1,0                  // addps         0x1c13b(%rip),%xmm0        # 3b080 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
   .byte  15,40,239                           // movaps        %xmm7,%xmm5
   .byte  65,15,89,235                        // mulps         %xmm11,%xmm5
   .byte  15,92,197                           // subps         %xmm5,%xmm0
@@ -30120,7 +29868,7 @@
   .byte  102,15,58,8,232,1                   // roundps       $0x1,%xmm0,%xmm5
   .byte  15,40,248                           // movaps        %xmm0,%xmm7
   .byte  15,92,253                           // subps         %xmm5,%xmm7
-  .byte  68,15,40,61,14,196,1,0              // movaps        0x1c40e(%rip),%xmm15        # 3b880 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
+  .byte  68,15,40,61,76,193,1,0              // movaps        0x1c14c(%rip),%xmm15        # 3b0c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
   .byte  65,15,88,199                        // addps         %xmm15,%xmm0
   .byte  15,40,235                           // movaps        %xmm3,%xmm5
   .byte  15,92,239                           // subps         %xmm7,%xmm5
@@ -30135,13 +29883,13 @@
   .byte  68,15,194,215,4                     // cmpneqps      %xmm7,%xmm10
   .byte  68,15,84,208                        // andps         %xmm0,%xmm10
   .byte  65,15,91,196                        // cvtdq2ps      %xmm12,%xmm0
-  .byte  15,89,5,117,195,1,0                 // mulps         0x1c375(%rip),%xmm0        # 3b820 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
+  .byte  15,89,5,179,192,1,0                 // mulps         0x1c0b3(%rip),%xmm0        # 3b060 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
   .byte  69,15,84,196                        // andps         %xmm12,%xmm8
   .byte  68,15,86,198                        // orps          %xmm6,%xmm8
-  .byte  15,88,5,134,195,1,0                 // addps         0x1c386(%rip),%xmm0        # 3b840 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
+  .byte  15,88,5,196,192,1,0                 // addps         0x1c0c4(%rip),%xmm0        # 3b080 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
   .byte  69,15,89,216                        // mulps         %xmm8,%xmm11
   .byte  65,15,92,195                        // subps         %xmm11,%xmm0
-  .byte  68,15,88,5,150,195,1,0              // addps         0x1c396(%rip),%xmm8        # 3b860 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
+  .byte  68,15,88,5,212,192,1,0              // addps         0x1c0d4(%rip),%xmm8        # 3b0a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
   .byte  69,15,94,240                        // divps         %xmm8,%xmm14
   .byte  65,15,92,198                        // subps         %xmm14,%xmm0
   .byte  15,89,194                           // mulps         %xmm2,%xmm0
@@ -30182,21 +29930,21 @@
   .byte  15,41,76,36,184                     // movaps        %xmm1,-0x48(%rsp)
   .byte  15,41,68,36,168                     // movaps        %xmm0,-0x58(%rsp)
   .byte  15,91,221                           // cvtdq2ps      %xmm5,%xmm3
-  .byte  15,40,5,194,194,1,0                 // movaps        0x1c2c2(%rip),%xmm0        # 3b820 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
+  .byte  15,40,5,0,192,1,0                   // movaps        0x1c000(%rip),%xmm0        # 3b060 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
   .byte  15,89,216                           // mulps         %xmm0,%xmm3
   .byte  15,40,240                           // movaps        %xmm0,%xmm6
-  .byte  68,15,40,5,196,194,1,0              // movaps        0x1c2c4(%rip),%xmm8        # 3b830 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  .byte  68,15,40,5,2,192,1,0                // movaps        0x1c002(%rip),%xmm8        # 3b070 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
   .byte  15,40,197                           // movaps        %xmm5,%xmm0
   .byte  65,15,84,192                        // andps         %xmm8,%xmm0
-  .byte  15,86,5,230,191,1,0                 // orps          0x1bfe6(%rip),%xmm0        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
-  .byte  15,88,29,191,194,1,0                // addps         0x1c2bf(%rip),%xmm3        # 3b840 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
-  .byte  68,15,40,29,199,194,1,0             // movaps        0x1c2c7(%rip),%xmm11        # 3b850 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  15,86,5,36,189,1,0                  // orps          0x1bd24(%rip),%xmm0        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,88,29,253,191,1,0                // addps         0x1bffd(%rip),%xmm3        # 3b080 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  68,15,40,29,5,192,1,0               // movaps        0x1c005(%rip),%xmm11        # 3b090 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  65,15,89,203                        // mulps         %xmm11,%xmm1
   .byte  15,92,217                           // subps         %xmm1,%xmm3
-  .byte  68,15,40,61,197,194,1,0             // movaps        0x1c2c5(%rip),%xmm15        # 3b860 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
+  .byte  68,15,40,61,3,192,1,0               // movaps        0x1c003(%rip),%xmm15        # 3b0a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
   .byte  65,15,88,199                        // addps         %xmm15,%xmm0
-  .byte  68,15,40,53,201,194,1,0             // movaps        0x1c2c9(%rip),%xmm14        # 3b870 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  .byte  68,15,40,53,7,192,1,0               // movaps        0x1c007(%rip),%xmm14        # 3b0b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
   .byte  65,15,40,206                        // movaps        %xmm14,%xmm1
   .byte  15,94,200                           // divps         %xmm0,%xmm1
   .byte  15,92,217                           // subps         %xmm1,%xmm3
@@ -30207,19 +29955,19 @@
   .byte  102,15,58,8,195,1                   // roundps       $0x1,%xmm3,%xmm0
   .byte  15,40,203                           // movaps        %xmm3,%xmm1
   .byte  15,92,200                           // subps         %xmm0,%xmm1
-  .byte  15,88,29,175,194,1,0                // addps         0x1c2af(%rip),%xmm3        # 3b880 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
-  .byte  15,40,37,200,194,1,0                // movaps        0x1c2c8(%rip),%xmm4        # 3b8a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
+  .byte  15,88,29,237,191,1,0                // addps         0x1bfed(%rip),%xmm3        # 3b0c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  15,40,37,6,192,1,0                  // movaps        0x1c006(%rip),%xmm4        # 3b0e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
   .byte  68,15,40,204                        // movaps        %xmm4,%xmm9
   .byte  68,15,92,201                        // subps         %xmm1,%xmm9
   .byte  15,40,193                           // movaps        %xmm1,%xmm0
-  .byte  15,40,13,166,194,1,0                // movaps        0x1c2a6(%rip),%xmm1        # 3b890 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  15,40,13,228,191,1,0                // movaps        0x1bfe4(%rip),%xmm1        # 3b0d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
   .byte  15,89,193                           // mulps         %xmm1,%xmm0
   .byte  15,92,216                           // subps         %xmm0,%xmm3
-  .byte  68,15,40,45,184,194,1,0             // movaps        0x1c2b8(%rip),%xmm13        # 3b8b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
+  .byte  68,15,40,45,246,191,1,0             // movaps        0x1bff6(%rip),%xmm13        # 3b0f0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
   .byte  65,15,40,197                        // movaps        %xmm13,%xmm0
   .byte  65,15,94,193                        // divps         %xmm9,%xmm0
   .byte  15,88,195                           // addps         %xmm3,%xmm0
-  .byte  68,15,40,13,181,194,1,0             // movaps        0x1c2b5(%rip),%xmm9        # 3b8c0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
+  .byte  68,15,40,13,243,191,1,0             // movaps        0x1bff3(%rip),%xmm9        # 3b100 <_sk_srcover_bgra_8888_sse2_lowp+0x1004>
   .byte  65,15,89,193                        // mulps         %xmm9,%xmm0
   .byte  102,15,91,192                       // cvtps2dq      %xmm0,%xmm0
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
@@ -30229,9 +29977,9 @@
   .byte  15,89,198                           // mulps         %xmm6,%xmm0
   .byte  65,15,40,250                        // movaps        %xmm10,%xmm7
   .byte  65,15,84,248                        // andps         %xmm8,%xmm7
-  .byte  15,40,29,45,191,1,0                 // movaps        0x1bf2d(%rip),%xmm3        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  15,40,29,107,188,1,0                // movaps        0x1bc6b(%rip),%xmm3        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  15,86,251                           // orps          %xmm3,%xmm7
-  .byte  15,88,5,3,194,1,0                   // addps         0x1c203(%rip),%xmm0        # 3b840 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
+  .byte  15,88,5,65,191,1,0                  // addps         0x1bf41(%rip),%xmm0        # 3b080 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
   .byte  15,40,247                           // movaps        %xmm7,%xmm6
   .byte  65,15,89,243                        // mulps         %xmm11,%xmm6
   .byte  15,92,198                           // subps         %xmm6,%xmm0
@@ -30243,7 +29991,7 @@
   .byte  102,15,58,8,240,1                   // roundps       $0x1,%xmm0,%xmm6
   .byte  15,40,248                           // movaps        %xmm0,%xmm7
   .byte  15,92,254                           // subps         %xmm6,%xmm7
-  .byte  68,15,40,61,20,194,1,0              // movaps        0x1c214(%rip),%xmm15        # 3b880 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
+  .byte  68,15,40,61,82,191,1,0              // movaps        0x1bf52(%rip),%xmm15        # 3b0c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
   .byte  65,15,88,199                        // addps         %xmm15,%xmm0
   .byte  15,40,244                           // movaps        %xmm4,%xmm6
   .byte  15,92,247                           // subps         %xmm7,%xmm6
@@ -30258,13 +30006,13 @@
   .byte  68,15,194,215,4                     // cmpneqps      %xmm7,%xmm10
   .byte  68,15,84,208                        // andps         %xmm0,%xmm10
   .byte  65,15,91,196                        // cvtdq2ps      %xmm12,%xmm0
-  .byte  15,89,5,123,193,1,0                 // mulps         0x1c17b(%rip),%xmm0        # 3b820 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
+  .byte  15,89,5,185,190,1,0                 // mulps         0x1beb9(%rip),%xmm0        # 3b060 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
   .byte  69,15,84,196                        // andps         %xmm12,%xmm8
   .byte  68,15,86,195                        // orps          %xmm3,%xmm8
-  .byte  15,88,5,140,193,1,0                 // addps         0x1c18c(%rip),%xmm0        # 3b840 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
+  .byte  15,88,5,202,190,1,0                 // addps         0x1beca(%rip),%xmm0        # 3b080 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
   .byte  69,15,89,216                        // mulps         %xmm8,%xmm11
   .byte  65,15,92,195                        // subps         %xmm11,%xmm0
-  .byte  68,15,88,5,156,193,1,0              // addps         0x1c19c(%rip),%xmm8        # 3b860 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
+  .byte  68,15,88,5,218,190,1,0              // addps         0x1beda(%rip),%xmm8        # 3b0a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
   .byte  69,15,94,240                        // divps         %xmm8,%xmm14
   .byte  65,15,92,198                        // subps         %xmm14,%xmm0
   .byte  15,89,194                           // mulps         %xmm2,%xmm0
@@ -30297,29 +30045,29 @@
 FUNCTION(_sk_lab_to_xyz_sse41)
 _sk_lab_to_xyz_sse41:
   .byte  68,15,40,192                        // movaps        %xmm0,%xmm8
-  .byte  68,15,89,5,154,193,1,0              // mulps         0x1c19a(%rip),%xmm8        # 3b8d0 <_sk_srcover_bgra_8888_sse2_lowp+0x1004>
-  .byte  68,15,40,13,18,191,1,0              // movaps        0x1bf12(%rip),%xmm9        # 3b650 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  .byte  68,15,89,5,216,190,1,0              // mulps         0x1bed8(%rip),%xmm8        # 3b110 <_sk_srcover_bgra_8888_sse2_lowp+0x1014>
+  .byte  68,15,40,13,80,188,1,0              // movaps        0x1bc50(%rip),%xmm9        # 3ae90 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
   .byte  65,15,89,201                        // mulps         %xmm9,%xmm1
-  .byte  15,40,5,151,193,1,0                 // movaps        0x1c197(%rip),%xmm0        # 3b8e0 <_sk_srcover_bgra_8888_sse2_lowp+0x1014>
+  .byte  15,40,5,213,190,1,0                 // movaps        0x1bed5(%rip),%xmm0        # 3b120 <_sk_srcover_bgra_8888_sse2_lowp+0x1024>
   .byte  15,88,200                           // addps         %xmm0,%xmm1
   .byte  65,15,89,209                        // mulps         %xmm9,%xmm2
   .byte  15,88,208                           // addps         %xmm0,%xmm2
-  .byte  68,15,88,5,149,193,1,0              // addps         0x1c195(%rip),%xmm8        # 3b8f0 <_sk_srcover_bgra_8888_sse2_lowp+0x1024>
-  .byte  68,15,89,5,157,193,1,0              // mulps         0x1c19d(%rip),%xmm8        # 3b900 <_sk_srcover_bgra_8888_sse2_lowp+0x1034>
-  .byte  15,89,13,166,193,1,0                // mulps         0x1c1a6(%rip),%xmm1        # 3b910 <_sk_srcover_bgra_8888_sse2_lowp+0x1044>
+  .byte  68,15,88,5,211,190,1,0              // addps         0x1bed3(%rip),%xmm8        # 3b130 <_sk_srcover_bgra_8888_sse2_lowp+0x1034>
+  .byte  68,15,89,5,219,190,1,0              // mulps         0x1bedb(%rip),%xmm8        # 3b140 <_sk_srcover_bgra_8888_sse2_lowp+0x1044>
+  .byte  15,89,13,228,190,1,0                // mulps         0x1bee4(%rip),%xmm1        # 3b150 <_sk_srcover_bgra_8888_sse2_lowp+0x1054>
   .byte  65,15,88,200                        // addps         %xmm8,%xmm1
-  .byte  15,89,21,171,193,1,0                // mulps         0x1c1ab(%rip),%xmm2        # 3b920 <_sk_srcover_bgra_8888_sse2_lowp+0x1054>
+  .byte  15,89,21,233,190,1,0                // mulps         0x1bee9(%rip),%xmm2        # 3b160 <_sk_srcover_bgra_8888_sse2_lowp+0x1064>
   .byte  69,15,40,208                        // movaps        %xmm8,%xmm10
   .byte  68,15,92,210                        // subps         %xmm2,%xmm10
   .byte  68,15,40,217                        // movaps        %xmm1,%xmm11
   .byte  69,15,89,219                        // mulps         %xmm11,%xmm11
   .byte  68,15,89,217                        // mulps         %xmm1,%xmm11
-  .byte  68,15,40,13,159,193,1,0             // movaps        0x1c19f(%rip),%xmm9        # 3b930 <_sk_srcover_bgra_8888_sse2_lowp+0x1064>
+  .byte  68,15,40,13,221,190,1,0             // movaps        0x1bedd(%rip),%xmm9        # 3b170 <_sk_srcover_bgra_8888_sse2_lowp+0x1074>
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
   .byte  65,15,194,195,1                     // cmpltps       %xmm11,%xmm0
-  .byte  15,40,21,159,193,1,0                // movaps        0x1c19f(%rip),%xmm2        # 3b940 <_sk_srcover_bgra_8888_sse2_lowp+0x1074>
+  .byte  15,40,21,221,190,1,0                // movaps        0x1bedd(%rip),%xmm2        # 3b180 <_sk_srcover_bgra_8888_sse2_lowp+0x1084>
   .byte  15,88,202                           // addps         %xmm2,%xmm1
-  .byte  68,15,40,37,164,193,1,0             // movaps        0x1c1a4(%rip),%xmm12        # 3b950 <_sk_srcover_bgra_8888_sse2_lowp+0x1084>
+  .byte  68,15,40,37,226,190,1,0             // movaps        0x1bee2(%rip),%xmm12        # 3b190 <_sk_srcover_bgra_8888_sse2_lowp+0x1094>
   .byte  65,15,89,204                        // mulps         %xmm12,%xmm1
   .byte  102,65,15,56,20,203                 // blendvps      %xmm0,%xmm11,%xmm1
   .byte  69,15,40,216                        // movaps        %xmm8,%xmm11
@@ -30338,8 +30086,8 @@
   .byte  65,15,89,212                        // mulps         %xmm12,%xmm2
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
   .byte  102,65,15,56,20,211                 // blendvps      %xmm0,%xmm11,%xmm2
-  .byte  15,89,13,93,193,1,0                 // mulps         0x1c15d(%rip),%xmm1        # 3b960 <_sk_srcover_bgra_8888_sse2_lowp+0x1094>
-  .byte  15,89,21,102,193,1,0                // mulps         0x1c166(%rip),%xmm2        # 3b970 <_sk_srcover_bgra_8888_sse2_lowp+0x10a4>
+  .byte  15,89,13,155,190,1,0                // mulps         0x1be9b(%rip),%xmm1        # 3b1a0 <_sk_srcover_bgra_8888_sse2_lowp+0x10a4>
+  .byte  15,89,21,164,190,1,0                // mulps         0x1bea4(%rip),%xmm2        # 3b1b0 <_sk_srcover_bgra_8888_sse2_lowp+0x10b4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,40,193                           // movaps        %xmm1,%xmm0
   .byte  65,15,40,200                        // movaps        %xmm8,%xmm1
@@ -30350,84 +30098,80 @@
 FUNCTION(_sk_load_a8_sse41)
 _sk_load_a8_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,39                              // jne           1f854 <_sk_load_a8_sse41+0x3f>
-  .byte  102,67,15,56,49,4,16                // pmovzxbd      (%r8,%r10,1),%xmm0
-  .byte  102,15,219,5,228,189,1,0            // pand          0x1bde4(%rip),%xmm0        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  117,39                              // jne           1f350 <_sk_load_a8_sse41+0x39>
+  .byte  102,65,15,56,49,4,16                // pmovzxbd      (%r8,%rdx,1),%xmm0
+  .byte  102,15,219,5,40,187,1,0             // pand          0x1bb28(%rip),%xmm0        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  15,91,216                           // cvtdq2ps      %xmm0,%xmm3
-  .byte  15,89,29,58,191,1,0                 // mulps         0x1bf3a(%rip),%xmm3        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  15,89,29,126,188,1,0                // mulps         0x1bc7e(%rip),%xmm3        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,53                              // je            1f896 <_sk_load_a8_sse41+0x81>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,49                              // je            1f389 <_sk_load_a8_sse41+0x72>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            1f880 <_sk_load_a8_sse41+0x6b>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,195                             // jne           1f834 <_sk_load_a8_sse41+0x1f>
-  .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,19                              // je            1f373 <_sk_load_a8_sse41+0x5c>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,204                             // jne           1f330 <_sk_load_a8_sse41+0x19>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,15,112,192,69                   // pshufd        $0x45,%xmm0,%xmm0
-  .byte  67,15,183,4,16                      // movzwl        (%r8,%r10,1),%eax
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  102,15,110,200                      // movd          %eax,%xmm1
   .byte  102,15,56,49,201                    // pmovzxbd      %xmm1,%xmm1
   .byte  102,15,58,14,193,15                 // pblendw       $0xf,%xmm1,%xmm0
-  .byte  235,158                             // jmp           1f834 <_sk_load_a8_sse41+0x1f>
-  .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
+  .byte  235,167                             // jmp           1f330 <_sk_load_a8_sse41+0x19>
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
-  .byte  235,147                             // jmp           1f834 <_sk_load_a8_sse41+0x1f>
+  .byte  235,156                             // jmp           1f330 <_sk_load_a8_sse41+0x19>
 
 HIDDEN _sk_load_a8_dst_sse41
 .globl _sk_load_a8_dst_sse41
 FUNCTION(_sk_load_a8_dst_sse41)
 _sk_load_a8_dst_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,39                              // jne           1f8e0 <_sk_load_a8_dst_sse41+0x3f>
-  .byte  102,67,15,56,49,36,16               // pmovzxbd      (%r8,%r10,1),%xmm4
-  .byte  102,15,219,37,88,189,1,0            // pand          0x1bd58(%rip),%xmm4        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  117,39                              // jne           1f3cd <_sk_load_a8_dst_sse41+0x39>
+  .byte  102,65,15,56,49,36,16               // pmovzxbd      (%r8,%rdx,1),%xmm4
+  .byte  102,15,219,37,171,186,1,0           // pand          0x1baab(%rip),%xmm4        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  15,91,252                           // cvtdq2ps      %xmm4,%xmm7
-  .byte  15,89,61,174,190,1,0                // mulps         0x1beae(%rip),%xmm7        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  15,89,61,1,188,1,0                  // mulps         0x1bc01(%rip),%xmm7        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,87,228                           // xorps         %xmm4,%xmm4
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  15,87,246                           // xorps         %xmm6,%xmm6
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,53                              // je            1f922 <_sk_load_a8_dst_sse41+0x81>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,49                              // je            1f406 <_sk_load_a8_dst_sse41+0x72>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            1f90c <_sk_load_a8_dst_sse41+0x6b>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,195                             // jne           1f8c0 <_sk_load_a8_dst_sse41+0x1f>
-  .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,19                              // je            1f3f0 <_sk_load_a8_dst_sse41+0x5c>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,204                             // jne           1f3ad <_sk_load_a8_dst_sse41+0x19>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
   .byte  102,15,112,228,69                   // pshufd        $0x45,%xmm4,%xmm4
-  .byte  67,15,183,4,16                      // movzwl        (%r8,%r10,1),%eax
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  102,15,110,232                      // movd          %eax,%xmm5
   .byte  102,15,56,49,237                    // pmovzxbd      %xmm5,%xmm5
   .byte  102,15,58,14,229,15                 // pblendw       $0xf,%xmm5,%xmm4
-  .byte  235,158                             // jmp           1f8c0 <_sk_load_a8_dst_sse41+0x1f>
-  .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
+  .byte  235,167                             // jmp           1f3ad <_sk_load_a8_dst_sse41+0x19>
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
-  .byte  235,147                             // jmp           1f8c0 <_sk_load_a8_dst_sse41+0x1f>
+  .byte  235,156                             // jmp           1f3ad <_sk_load_a8_dst_sse41+0x19>
 
 HIDDEN _sk_gather_a8_sse41
 .globl _sk_gather_a8_sse41
@@ -30470,7 +30214,7 @@
   .byte  102,15,58,32,192,3                  // pinsrb        $0x3,%eax,%xmm0
   .byte  102,15,56,49,192                    // pmovzxbd      %xmm0,%xmm0
   .byte  15,91,216                           // cvtdq2ps      %xmm0,%xmm3
-  .byte  15,89,29,166,189,1,0                // mulps         0x1bda6(%rip),%xmm3        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  15,89,29,2,187,1,0                  // mulps         0x1bb02(%rip),%xmm3        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
@@ -30482,123 +30226,117 @@
 FUNCTION(_sk_store_a8_sse41)
 _sk_store_a8_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  68,15,95,195                        // maxps         %xmm3,%xmm8
-  .byte  68,15,93,5,101,187,1,0              // minps         0x1bb65(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
-  .byte  68,15,89,5,61,188,1,0               // mulps         0x1bc3d(%rip),%xmm8        # 3b650 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  .byte  68,15,93,5,199,184,1,0              // minps         0x1b8c7(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
+  .byte  68,15,89,5,159,185,1,0              // mulps         0x1b99f(%rip),%xmm8        # 3ae90 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
   .byte  102,69,15,91,192                    // cvtps2dq      %xmm8,%xmm8
   .byte  102,68,15,56,43,192                 // packusdw      %xmm0,%xmm8
   .byte  102,68,15,103,192                   // packuswb      %xmm0,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,13                              // jne           1fa35 <_sk_store_a8_sse41+0x4d>
+  .byte  117,13                              // jne           1f513 <_sk_store_a8_sse41+0x47>
   .byte  102,68,15,126,192                   // movd          %xmm8,%eax
-  .byte  67,137,4,16                         // mov           %eax,(%r8,%r10,1)
+  .byte  65,137,4,16                         // mov           %eax,(%r8,%rdx,1)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,69,15,56,49,192                 // pmovzxbd      %xmm8,%xmm8
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,41                              // je            1fa71 <_sk_store_a8_sse41+0x89>
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,15                              // je            1fa5d <_sk_store_a8_sse41+0x75>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,221                             // jne           1fa31 <_sk_store_a8_sse41+0x49>
-  .byte  102,71,15,58,20,68,16,2,8           // pextrb        $0x8,%xmm8,0x2(%r8,%r10,1)
-  .byte  102,68,15,56,0,5,25,191,1,0         // pshufb        0x1bf19(%rip),%xmm8        # 3b980 <_sk_srcover_bgra_8888_sse2_lowp+0x10b4>
-  .byte  102,71,15,58,21,4,16,0              // pextrw        $0x0,%xmm8,(%r8,%r10,1)
-  .byte  235,192                             // jmp           1fa31 <_sk_store_a8_sse41+0x49>
-  .byte  102,71,15,58,20,4,16,0              // pextrb        $0x0,%xmm8,(%r8,%r10,1)
-  .byte  235,182                             // jmp           1fa31 <_sk_store_a8_sse41+0x49>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,37                              // je            1f546 <_sk_store_a8_sse41+0x7a>
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,13                              // je            1f532 <_sk_store_a8_sse41+0x66>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,230                             // jne           1f50f <_sk_store_a8_sse41+0x43>
+  .byte  102,69,15,58,20,68,16,2,8           // pextrb        $0x8,%xmm8,0x2(%r8,%rdx,1)
+  .byte  102,68,15,56,0,5,132,188,1,0        // pshufb        0x1bc84(%rip),%xmm8        # 3b1c0 <_sk_srcover_bgra_8888_sse2_lowp+0x10c4>
+  .byte  102,69,15,58,21,4,16,0              // pextrw        $0x0,%xmm8,(%r8,%rdx,1)
+  .byte  235,201                             // jmp           1f50f <_sk_store_a8_sse41+0x43>
+  .byte  102,69,15,58,20,4,16,0              // pextrb        $0x0,%xmm8,(%r8,%rdx,1)
+  .byte  235,191                             // jmp           1f50f <_sk_store_a8_sse41+0x43>
 
 HIDDEN _sk_load_g8_sse41
 .globl _sk_load_g8_sse41
 FUNCTION(_sk_load_g8_sse41)
 _sk_load_g8_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,42                              // jne           1fabd <_sk_load_g8_sse41+0x42>
-  .byte  102,67,15,56,49,4,16                // pmovzxbd      (%r8,%r10,1),%xmm0
-  .byte  102,15,219,5,126,187,1,0            // pand          0x1bb7e(%rip),%xmm0        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  117,42                              // jne           1f58c <_sk_load_g8_sse41+0x3c>
+  .byte  102,65,15,56,49,4,16                // pmovzxbd      (%r8,%rdx,1),%xmm0
+  .byte  102,15,219,5,239,184,1,0            // pand          0x1b8ef(%rip),%xmm0        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,212,188,1,0                 // mulps         0x1bcd4(%rip),%xmm0        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  15,89,5,69,186,1,0                  // mulps         0x1ba45(%rip),%xmm0        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,187,186,1,0                // movaps        0x1babb(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,29,44,184,1,0                 // movaps        0x1b82c(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,53                              // je            1faff <_sk_load_g8_sse41+0x84>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,49                              // je            1f5c5 <_sk_load_g8_sse41+0x75>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            1fae9 <_sk_load_g8_sse41+0x6e>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,192                             // jne           1fa9a <_sk_load_g8_sse41+0x1f>
-  .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,19                              // je            1f5af <_sk_load_g8_sse41+0x5f>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,201                             // jne           1f569 <_sk_load_g8_sse41+0x19>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,15,112,192,69                   // pshufd        $0x45,%xmm0,%xmm0
-  .byte  67,15,183,4,16                      // movzwl        (%r8,%r10,1),%eax
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  102,15,110,200                      // movd          %eax,%xmm1
   .byte  102,15,56,49,201                    // pmovzxbd      %xmm1,%xmm1
   .byte  102,15,58,14,193,15                 // pblendw       $0xf,%xmm1,%xmm0
-  .byte  235,155                             // jmp           1fa9a <_sk_load_g8_sse41+0x1f>
-  .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
+  .byte  235,164                             // jmp           1f569 <_sk_load_g8_sse41+0x19>
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
-  .byte  235,144                             // jmp           1fa9a <_sk_load_g8_sse41+0x1f>
+  .byte  235,153                             // jmp           1f569 <_sk_load_g8_sse41+0x19>
 
 HIDDEN _sk_load_g8_dst_sse41
 .globl _sk_load_g8_dst_sse41
 FUNCTION(_sk_load_g8_dst_sse41)
 _sk_load_g8_dst_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,42                              // jne           1fb4c <_sk_load_g8_dst_sse41+0x42>
-  .byte  102,67,15,56,49,36,16               // pmovzxbd      (%r8,%r10,1),%xmm4
-  .byte  102,15,219,37,239,186,1,0           // pand          0x1baef(%rip),%xmm4        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  117,42                              // jne           1f60c <_sk_load_g8_dst_sse41+0x3c>
+  .byte  102,65,15,56,49,36,16               // pmovzxbd      (%r8,%rdx,1),%xmm4
+  .byte  102,15,219,37,111,184,1,0           // pand          0x1b86f(%rip),%xmm4        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
-  .byte  15,89,37,69,188,1,0                 // mulps         0x1bc45(%rip),%xmm4        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  15,89,37,197,185,1,0                // mulps         0x1b9c5(%rip),%xmm4        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,61,44,186,1,0                 // movaps        0x1ba2c(%rip),%xmm7        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,61,172,183,1,0                // movaps        0x1b7ac(%rip),%xmm7        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,40,236                           // movaps        %xmm4,%xmm5
   .byte  15,40,244                           // movaps        %xmm4,%xmm6
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,53                              // je            1fb8e <_sk_load_g8_dst_sse41+0x84>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,49                              // je            1f645 <_sk_load_g8_dst_sse41+0x75>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            1fb78 <_sk_load_g8_dst_sse41+0x6e>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,192                             // jne           1fb29 <_sk_load_g8_dst_sse41+0x1f>
-  .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,19                              // je            1f62f <_sk_load_g8_dst_sse41+0x5f>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,201                             // jne           1f5e9 <_sk_load_g8_dst_sse41+0x19>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
   .byte  102,15,112,228,69                   // pshufd        $0x45,%xmm4,%xmm4
-  .byte  67,15,183,4,16                      // movzwl        (%r8,%r10,1),%eax
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  102,15,110,232                      // movd          %eax,%xmm5
   .byte  102,15,56,49,237                    // pmovzxbd      %xmm5,%xmm5
   .byte  102,15,58,14,229,15                 // pblendw       $0xf,%xmm5,%xmm4
-  .byte  235,155                             // jmp           1fb29 <_sk_load_g8_dst_sse41+0x1f>
-  .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
+  .byte  235,164                             // jmp           1f5e9 <_sk_load_g8_dst_sse41+0x19>
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
-  .byte  235,144                             // jmp           1fb29 <_sk_load_g8_dst_sse41+0x1f>
+  .byte  235,153                             // jmp           1f5e9 <_sk_load_g8_dst_sse41+0x19>
 
 HIDDEN _sk_gather_g8_sse41
 .globl _sk_gather_g8_sse41
@@ -30641,9 +30379,9 @@
   .byte  102,15,58,32,192,3                  // pinsrb        $0x3,%eax,%xmm0
   .byte  102,15,56,49,192                    // pmovzxbd      %xmm0,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,58,187,1,0                  // mulps         0x1bb3a(%rip),%xmm0        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  15,89,5,195,184,1,0                 // mulps         0x1b8c3(%rip),%xmm0        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,33,185,1,0                 // movaps        0x1b921(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,29,170,182,1,0                // movaps        0x1b6aa(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  255,224                             // jmpq          *%rax
@@ -30653,96 +30391,92 @@
 FUNCTION(_sk_load_565_sse41)
 _sk_load_565_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,80                              // jne           1fcc2 <_sk_load_565_sse41+0x6b>
-  .byte  102,67,15,56,51,20,80               // pmovzxwd      (%r8,%r10,2),%xmm2
-  .byte  102,15,111,5,15,187,1,0             // movdqa        0x1bb0f(%rip),%xmm0        # 3b790 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
+  .byte  117,80                              // jne           1f773 <_sk_load_565_sse41+0x65>
+  .byte  102,65,15,56,51,20,80               // pmovzxwd      (%r8,%rdx,2),%xmm2
+  .byte  102,15,111,5,158,184,1,0            // movdqa        0x1b89e(%rip),%xmm0        # 3afd0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
   .byte  102,15,219,194                      // pand          %xmm2,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,17,187,1,0                  // mulps         0x1bb11(%rip),%xmm0        # 3b7a0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
-  .byte  102,15,111,13,25,187,1,0            // movdqa        0x1bb19(%rip),%xmm1        # 3b7b0 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  .byte  15,89,5,160,184,1,0                 // mulps         0x1b8a0(%rip),%xmm0        # 3afe0 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  .byte  102,15,111,13,168,184,1,0           // movdqa        0x1b8a8(%rip),%xmm1        # 3aff0 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
   .byte  102,15,219,202                      // pand          %xmm2,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
-  .byte  15,89,13,27,187,1,0                 // mulps         0x1bb1b(%rip),%xmm1        # 3b7c0 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
-  .byte  102,15,219,21,35,187,1,0            // pand          0x1bb23(%rip),%xmm2        # 3b7d0 <_sk_srcover_bgra_8888_sse2_lowp+0xf04>
+  .byte  15,89,13,170,184,1,0                // mulps         0x1b8aa(%rip),%xmm1        # 3b000 <_sk_srcover_bgra_8888_sse2_lowp+0xf04>
+  .byte  102,15,219,21,178,184,1,0           // pand          0x1b8b2(%rip),%xmm2        # 3b010 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
-  .byte  15,89,21,41,187,1,0                 // mulps         0x1bb29(%rip),%xmm2        # 3b7e0 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
+  .byte  15,89,21,184,184,1,0                // mulps         0x1b8b8(%rip),%xmm2        # 3b020 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,176,184,1,0                // movaps        0x1b8b0(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,29,63,182,1,0                 // movaps        0x1b63f(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,53                              // je            1fd04 <_sk_load_565_sse41+0xad>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,46                              // je            1f7a9 <_sk_load_565_sse41+0x9b>
   .byte  102,15,239,210                      // pxor          %xmm2,%xmm2
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            1fcee <_sk_load_565_sse41+0x97>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,154                             // jne           1fc79 <_sk_load_565_sse41+0x22>
-  .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,19                              // je            1f796 <_sk_load_565_sse41+0x88>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,163                             // jne           1f72a <_sk_load_565_sse41+0x1c>
+  .byte  65,15,183,68,80,4                   // movzwl        0x4(%r8,%rdx,2),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,15,112,208,69                   // pshufd        $0x45,%xmm0,%xmm2
-  .byte  102,67,15,110,4,80                  // movd          (%r8,%r10,2),%xmm0
+  .byte  102,65,15,110,4,80                  // movd          (%r8,%rdx,2),%xmm0
   .byte  102,15,56,51,192                    // pmovzxwd      %xmm0,%xmm0
   .byte  102,15,58,14,208,15                 // pblendw       $0xf,%xmm0,%xmm2
-  .byte  233,117,255,255,255                 // jmpq          1fc79 <_sk_load_565_sse41+0x22>
-  .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
+  .byte  235,129                             // jmp           1f72a <_sk_load_565_sse41+0x1c>
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,15,110,208                      // movd          %eax,%xmm2
-  .byte  233,103,255,255,255                 // jmpq          1fc79 <_sk_load_565_sse41+0x22>
+  .byte  233,115,255,255,255                 // jmpq          1f72a <_sk_load_565_sse41+0x1c>
 
 HIDDEN _sk_load_565_dst_sse41
 .globl _sk_load_565_dst_sse41
 FUNCTION(_sk_load_565_dst_sse41)
 _sk_load_565_dst_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,80                              // jne           1fd7d <_sk_load_565_dst_sse41+0x6b>
-  .byte  102,67,15,56,51,52,80               // pmovzxwd      (%r8,%r10,2),%xmm6
-  .byte  102,15,111,37,84,186,1,0            // movdqa        0x1ba54(%rip),%xmm4        # 3b790 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
+  .byte  117,80                              // jne           1f81c <_sk_load_565_dst_sse41+0x65>
+  .byte  102,65,15,56,51,52,80               // pmovzxwd      (%r8,%rdx,2),%xmm6
+  .byte  102,15,111,37,245,183,1,0           // movdqa        0x1b7f5(%rip),%xmm4        # 3afd0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
   .byte  102,15,219,230                      // pand          %xmm6,%xmm4
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
-  .byte  15,89,37,86,186,1,0                 // mulps         0x1ba56(%rip),%xmm4        # 3b7a0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
-  .byte  102,15,111,45,94,186,1,0            // movdqa        0x1ba5e(%rip),%xmm5        # 3b7b0 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  .byte  15,89,37,247,183,1,0                // mulps         0x1b7f7(%rip),%xmm4        # 3afe0 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  .byte  102,15,111,45,255,183,1,0           // movdqa        0x1b7ff(%rip),%xmm5        # 3aff0 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
   .byte  102,15,219,238                      // pand          %xmm6,%xmm5
   .byte  15,91,237                           // cvtdq2ps      %xmm5,%xmm5
-  .byte  15,89,45,96,186,1,0                 // mulps         0x1ba60(%rip),%xmm5        # 3b7c0 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
-  .byte  102,15,219,53,104,186,1,0           // pand          0x1ba68(%rip),%xmm6        # 3b7d0 <_sk_srcover_bgra_8888_sse2_lowp+0xf04>
+  .byte  15,89,45,1,184,1,0                  // mulps         0x1b801(%rip),%xmm5        # 3b000 <_sk_srcover_bgra_8888_sse2_lowp+0xf04>
+  .byte  102,15,219,53,9,184,1,0             // pand          0x1b809(%rip),%xmm6        # 3b010 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
   .byte  15,91,246                           // cvtdq2ps      %xmm6,%xmm6
-  .byte  15,89,53,110,186,1,0                // mulps         0x1ba6e(%rip),%xmm6        # 3b7e0 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
+  .byte  15,89,53,15,184,1,0                 // mulps         0x1b80f(%rip),%xmm6        # 3b020 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,61,245,183,1,0                // movaps        0x1b7f5(%rip),%xmm7        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,61,150,181,1,0                // movaps        0x1b596(%rip),%xmm7        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,53                              // je            1fdbf <_sk_load_565_dst_sse41+0xad>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,46                              // je            1f852 <_sk_load_565_dst_sse41+0x9b>
   .byte  102,15,239,246                      // pxor          %xmm6,%xmm6
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            1fda9 <_sk_load_565_dst_sse41+0x97>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,154                             // jne           1fd34 <_sk_load_565_dst_sse41+0x22>
-  .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,19                              // je            1f83f <_sk_load_565_dst_sse41+0x88>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,163                             // jne           1f7d3 <_sk_load_565_dst_sse41+0x1c>
+  .byte  65,15,183,68,80,4                   // movzwl        0x4(%r8,%rdx,2),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
   .byte  102,15,112,244,69                   // pshufd        $0x45,%xmm4,%xmm6
-  .byte  102,67,15,110,36,80                 // movd          (%r8,%r10,2),%xmm4
+  .byte  102,65,15,110,36,80                 // movd          (%r8,%rdx,2),%xmm4
   .byte  102,15,56,51,228                    // pmovzxwd      %xmm4,%xmm4
   .byte  102,15,58,14,244,15                 // pblendw       $0xf,%xmm4,%xmm6
-  .byte  233,117,255,255,255                 // jmpq          1fd34 <_sk_load_565_dst_sse41+0x22>
-  .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
+  .byte  235,129                             // jmp           1f7d3 <_sk_load_565_dst_sse41+0x1c>
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,15,110,240                      // movd          %eax,%xmm6
-  .byte  233,103,255,255,255                 // jmpq          1fd34 <_sk_load_565_dst_sse41+0x22>
+  .byte  233,115,255,255,255                 // jmpq          1f7d3 <_sk_load_565_dst_sse41+0x1c>
 
 HIDDEN _sk_gather_565_sse41
 .globl _sk_gather_565_sse41
@@ -30784,19 +30518,19 @@
   .byte  65,15,183,4,64                      // movzwl        (%r8,%rax,2),%eax
   .byte  102,15,196,192,3                    // pinsrw        $0x3,%eax,%xmm0
   .byte  102,15,56,51,208                    // pmovzxwd      %xmm0,%xmm2
-  .byte  102,15,111,5,27,185,1,0             // movdqa        0x1b91b(%rip),%xmm0        # 3b790 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
+  .byte  102,15,111,5,200,182,1,0            // movdqa        0x1b6c8(%rip),%xmm0        # 3afd0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
   .byte  102,15,219,194                      // pand          %xmm2,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,29,185,1,0                  // mulps         0x1b91d(%rip),%xmm0        # 3b7a0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
-  .byte  102,15,111,13,37,185,1,0            // movdqa        0x1b925(%rip),%xmm1        # 3b7b0 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  .byte  15,89,5,202,182,1,0                 // mulps         0x1b6ca(%rip),%xmm0        # 3afe0 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  .byte  102,15,111,13,210,182,1,0           // movdqa        0x1b6d2(%rip),%xmm1        # 3aff0 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
   .byte  102,15,219,202                      // pand          %xmm2,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
-  .byte  15,89,13,39,185,1,0                 // mulps         0x1b927(%rip),%xmm1        # 3b7c0 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
-  .byte  102,15,219,21,47,185,1,0            // pand          0x1b92f(%rip),%xmm2        # 3b7d0 <_sk_srcover_bgra_8888_sse2_lowp+0xf04>
+  .byte  15,89,13,212,182,1,0                // mulps         0x1b6d4(%rip),%xmm1        # 3b000 <_sk_srcover_bgra_8888_sse2_lowp+0xf04>
+  .byte  102,15,219,21,220,182,1,0           // pand          0x1b6dc(%rip),%xmm2        # 3b010 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
-  .byte  15,89,21,53,185,1,0                 // mulps         0x1b935(%rip),%xmm2        # 3b7e0 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
+  .byte  15,89,21,226,182,1,0                // mulps         0x1b6e2(%rip),%xmm2        # 3b020 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,188,182,1,0                // movaps        0x1b6bc(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,29,105,180,1,0                // movaps        0x1b469(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  255,224                             // jmpq          *%rax
 
 HIDDEN _sk_store_565_sse41
@@ -30804,25 +30538,23 @@
 FUNCTION(_sk_store_565_sse41)
 _sk_store_565_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  68,15,95,200                        // maxps         %xmm0,%xmm9
-  .byte  68,15,40,21,144,182,1,0             // movaps        0x1b690(%rip),%xmm10        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,21,67,180,1,0              // movaps        0x1b443(%rip),%xmm10        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,93,202                        // minps         %xmm10,%xmm9
-  .byte  68,15,40,29,164,186,1,0             // movaps        0x1baa4(%rip),%xmm11        # 3b990 <_sk_srcover_bgra_8888_sse2_lowp+0x10c4>
+  .byte  68,15,40,29,87,184,1,0              // movaps        0x1b857(%rip),%xmm11        # 3b1d0 <_sk_srcover_bgra_8888_sse2_lowp+0x10d4>
   .byte  69,15,89,203                        // mulps         %xmm11,%xmm9
   .byte  102,69,15,91,201                    // cvtps2dq      %xmm9,%xmm9
   .byte  102,65,15,114,241,11                // pslld         $0xb,%xmm9
   .byte  69,15,87,228                        // xorps         %xmm12,%xmm12
   .byte  68,15,95,225                        // maxps         %xmm1,%xmm12
   .byte  69,15,93,226                        // minps         %xmm10,%xmm12
-  .byte  68,15,89,37,145,186,1,0             // mulps         0x1ba91(%rip),%xmm12        # 3b9a0 <_sk_srcover_bgra_8888_sse2_lowp+0x10d4>
+  .byte  68,15,89,37,68,184,1,0              // mulps         0x1b844(%rip),%xmm12        # 3b1e0 <_sk_srcover_bgra_8888_sse2_lowp+0x10e4>
   .byte  102,69,15,91,228                    // cvtps2dq      %xmm12,%xmm12
   .byte  102,65,15,114,244,5                 // pslld         $0x5,%xmm12
   .byte  68,15,95,194                        // maxps         %xmm2,%xmm8
@@ -30833,127 +30565,123 @@
   .byte  102,69,15,86,196                    // orpd          %xmm12,%xmm8
   .byte  102,68,15,56,43,192                 // packusdw      %xmm0,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           1ff4a <_sk_store_565_sse41+0x94>
-  .byte  102,69,15,214,4,64                  // movq          %xmm8,(%r8,%rax,2)
+  .byte  117,10                              // jne           1f9d7 <_sk_store_565_sse41+0x8e>
+  .byte  102,69,15,214,4,80                  // movq          %xmm8,(%r8,%rdx,2)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,69,15,56,51,192                 // pmovzxwd      %xmm8,%xmm8
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,35                              // je            1ff80 <_sk_store_565_sse41+0xca>
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,15                              // je            1ff72 <_sk_store_565_sse41+0xbc>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,221                             // jne           1ff46 <_sk_store_565_sse41+0x90>
-  .byte  102,69,15,58,21,68,64,4,4           // pextrw        $0x4,%xmm8,0x4(%r8,%rax,2)
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,31                              // je            1fa04 <_sk_store_565_sse41+0xbb>
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,13                              // je            1f9f6 <_sk_store_565_sse41+0xad>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,230                             // jne           1f9d3 <_sk_store_565_sse41+0x8a>
+  .byte  102,69,15,58,21,68,80,4,4           // pextrw        $0x4,%xmm8,0x4(%r8,%rdx,2)
   .byte  242,69,15,112,192,232               // pshuflw       $0xe8,%xmm8,%xmm8
-  .byte  102,69,15,126,4,64                  // movd          %xmm8,(%r8,%rax,2)
-  .byte  235,198                             // jmp           1ff46 <_sk_store_565_sse41+0x90>
-  .byte  102,69,15,58,21,4,64,0              // pextrw        $0x0,%xmm8,(%r8,%rax,2)
-  .byte  235,188                             // jmp           1ff46 <_sk_store_565_sse41+0x90>
+  .byte  102,69,15,126,4,80                  // movd          %xmm8,(%r8,%rdx,2)
+  .byte  235,207                             // jmp           1f9d3 <_sk_store_565_sse41+0x8a>
+  .byte  102,69,15,58,21,4,80,0              // pextrw        $0x0,%xmm8,(%r8,%rdx,2)
+  .byte  235,197                             // jmp           1f9d3 <_sk_store_565_sse41+0x8a>
 
 HIDDEN _sk_load_4444_sse41
 .globl _sk_load_4444_sse41
 FUNCTION(_sk_load_4444_sse41)
 _sk_load_4444_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,95                              // jne           20004 <_sk_load_4444_sse41+0x7a>
-  .byte  102,67,15,56,51,28,80               // pmovzxwd      (%r8,%r10,2),%xmm3
-  .byte  102,15,111,5,252,185,1,0            // movdqa        0x1b9fc(%rip),%xmm0        # 3b9b0 <_sk_srcover_bgra_8888_sse2_lowp+0x10e4>
+  .byte  117,95                              // jne           1fa82 <_sk_load_4444_sse41+0x74>
+  .byte  102,65,15,56,51,28,80               // pmovzxwd      (%r8,%rdx,2),%xmm3
+  .byte  102,15,111,5,190,183,1,0            // movdqa        0x1b7be(%rip),%xmm0        # 3b1f0 <_sk_srcover_bgra_8888_sse2_lowp+0x10f4>
   .byte  102,15,219,195                      // pand          %xmm3,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,254,185,1,0                 // mulps         0x1b9fe(%rip),%xmm0        # 3b9c0 <_sk_srcover_bgra_8888_sse2_lowp+0x10f4>
-  .byte  102,15,111,13,6,186,1,0             // movdqa        0x1ba06(%rip),%xmm1        # 3b9d0 <_sk_srcover_bgra_8888_sse2_lowp+0x1104>
+  .byte  15,89,5,192,183,1,0                 // mulps         0x1b7c0(%rip),%xmm0        # 3b200 <_sk_srcover_bgra_8888_sse2_lowp+0x1104>
+  .byte  102,15,111,13,200,183,1,0           // movdqa        0x1b7c8(%rip),%xmm1        # 3b210 <_sk_srcover_bgra_8888_sse2_lowp+0x1114>
   .byte  102,15,219,203                      // pand          %xmm3,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
-  .byte  15,89,13,8,186,1,0                  // mulps         0x1ba08(%rip),%xmm1        # 3b9e0 <_sk_srcover_bgra_8888_sse2_lowp+0x1114>
-  .byte  102,15,111,21,16,186,1,0            // movdqa        0x1ba10(%rip),%xmm2        # 3b9f0 <_sk_srcover_bgra_8888_sse2_lowp+0x1124>
+  .byte  15,89,13,202,183,1,0                // mulps         0x1b7ca(%rip),%xmm1        # 3b220 <_sk_srcover_bgra_8888_sse2_lowp+0x1124>
+  .byte  102,15,111,21,210,183,1,0           // movdqa        0x1b7d2(%rip),%xmm2        # 3b230 <_sk_srcover_bgra_8888_sse2_lowp+0x1134>
   .byte  102,15,219,211                      // pand          %xmm3,%xmm2
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
-  .byte  15,89,21,18,186,1,0                 // mulps         0x1ba12(%rip),%xmm2        # 3ba00 <_sk_srcover_bgra_8888_sse2_lowp+0x1134>
-  .byte  102,15,219,29,26,186,1,0            // pand          0x1ba1a(%rip),%xmm3        # 3ba10 <_sk_srcover_bgra_8888_sse2_lowp+0x1144>
+  .byte  15,89,21,212,183,1,0                // mulps         0x1b7d4(%rip),%xmm2        # 3b240 <_sk_srcover_bgra_8888_sse2_lowp+0x1144>
+  .byte  102,15,219,29,220,183,1,0           // pand          0x1b7dc(%rip),%xmm3        # 3b250 <_sk_srcover_bgra_8888_sse2_lowp+0x1154>
   .byte  15,91,219                           // cvtdq2ps      %xmm3,%xmm3
-  .byte  15,89,29,32,186,1,0                 // mulps         0x1ba20(%rip),%xmm3        # 3ba20 <_sk_srcover_bgra_8888_sse2_lowp+0x1154>
+  .byte  15,89,29,226,183,1,0                // mulps         0x1b7e2(%rip),%xmm3        # 3b260 <_sk_srcover_bgra_8888_sse2_lowp+0x1164>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,53                              // je            20046 <_sk_load_4444_sse41+0xbc>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,49                              // je            1fabb <_sk_load_4444_sse41+0xad>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            20030 <_sk_load_4444_sse41+0xa6>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,139                             // jne           1ffac <_sk_load_4444_sse41+0x22>
-  .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,19                              // je            1faa5 <_sk_load_4444_sse41+0x97>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,148                             // jne           1fa2a <_sk_load_4444_sse41+0x1c>
+  .byte  65,15,183,68,80,4                   // movzwl        0x4(%r8,%rdx,2),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,15,112,216,69                   // pshufd        $0x45,%xmm0,%xmm3
-  .byte  102,67,15,110,4,80                  // movd          (%r8,%r10,2),%xmm0
+  .byte  102,65,15,110,4,80                  // movd          (%r8,%rdx,2),%xmm0
   .byte  102,15,56,51,192                    // pmovzxwd      %xmm0,%xmm0
   .byte  102,15,58,14,216,15                 // pblendw       $0xf,%xmm0,%xmm3
-  .byte  233,102,255,255,255                 // jmpq          1ffac <_sk_load_4444_sse41+0x22>
-  .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
+  .byte  233,111,255,255,255                 // jmpq          1fa2a <_sk_load_4444_sse41+0x1c>
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,15,110,216                      // movd          %eax,%xmm3
-  .byte  233,88,255,255,255                  // jmpq          1ffac <_sk_load_4444_sse41+0x22>
+  .byte  233,97,255,255,255                  // jmpq          1fa2a <_sk_load_4444_sse41+0x1c>
 
 HIDDEN _sk_load_4444_dst_sse41
 .globl _sk_load_4444_dst_sse41
 FUNCTION(_sk_load_4444_dst_sse41)
 _sk_load_4444_dst_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,95                              // jne           200ce <_sk_load_4444_dst_sse41+0x7a>
-  .byte  102,67,15,56,51,60,80               // pmovzxwd      (%r8,%r10,2),%xmm7
-  .byte  102,15,111,37,50,185,1,0            // movdqa        0x1b932(%rip),%xmm4        # 3b9b0 <_sk_srcover_bgra_8888_sse2_lowp+0x10e4>
+  .byte  117,95                              // jne           1fb3d <_sk_load_4444_dst_sse41+0x74>
+  .byte  102,65,15,56,51,60,80               // pmovzxwd      (%r8,%rdx,2),%xmm7
+  .byte  102,15,111,37,3,183,1,0             // movdqa        0x1b703(%rip),%xmm4        # 3b1f0 <_sk_srcover_bgra_8888_sse2_lowp+0x10f4>
   .byte  102,15,219,231                      // pand          %xmm7,%xmm4
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
-  .byte  15,89,37,52,185,1,0                 // mulps         0x1b934(%rip),%xmm4        # 3b9c0 <_sk_srcover_bgra_8888_sse2_lowp+0x10f4>
-  .byte  102,15,111,45,60,185,1,0            // movdqa        0x1b93c(%rip),%xmm5        # 3b9d0 <_sk_srcover_bgra_8888_sse2_lowp+0x1104>
+  .byte  15,89,37,5,183,1,0                  // mulps         0x1b705(%rip),%xmm4        # 3b200 <_sk_srcover_bgra_8888_sse2_lowp+0x1104>
+  .byte  102,15,111,45,13,183,1,0            // movdqa        0x1b70d(%rip),%xmm5        # 3b210 <_sk_srcover_bgra_8888_sse2_lowp+0x1114>
   .byte  102,15,219,239                      // pand          %xmm7,%xmm5
   .byte  15,91,237                           // cvtdq2ps      %xmm5,%xmm5
-  .byte  15,89,45,62,185,1,0                 // mulps         0x1b93e(%rip),%xmm5        # 3b9e0 <_sk_srcover_bgra_8888_sse2_lowp+0x1114>
-  .byte  102,15,111,53,70,185,1,0            // movdqa        0x1b946(%rip),%xmm6        # 3b9f0 <_sk_srcover_bgra_8888_sse2_lowp+0x1124>
+  .byte  15,89,45,15,183,1,0                 // mulps         0x1b70f(%rip),%xmm5        # 3b220 <_sk_srcover_bgra_8888_sse2_lowp+0x1124>
+  .byte  102,15,111,53,23,183,1,0            // movdqa        0x1b717(%rip),%xmm6        # 3b230 <_sk_srcover_bgra_8888_sse2_lowp+0x1134>
   .byte  102,15,219,247                      // pand          %xmm7,%xmm6
   .byte  15,91,246                           // cvtdq2ps      %xmm6,%xmm6
-  .byte  15,89,53,72,185,1,0                 // mulps         0x1b948(%rip),%xmm6        # 3ba00 <_sk_srcover_bgra_8888_sse2_lowp+0x1134>
-  .byte  102,15,219,61,80,185,1,0            // pand          0x1b950(%rip),%xmm7        # 3ba10 <_sk_srcover_bgra_8888_sse2_lowp+0x1144>
+  .byte  15,89,53,25,183,1,0                 // mulps         0x1b719(%rip),%xmm6        # 3b240 <_sk_srcover_bgra_8888_sse2_lowp+0x1144>
+  .byte  102,15,219,61,33,183,1,0            // pand          0x1b721(%rip),%xmm7        # 3b250 <_sk_srcover_bgra_8888_sse2_lowp+0x1154>
   .byte  15,91,255                           // cvtdq2ps      %xmm7,%xmm7
-  .byte  15,89,61,86,185,1,0                 // mulps         0x1b956(%rip),%xmm7        # 3ba20 <_sk_srcover_bgra_8888_sse2_lowp+0x1154>
+  .byte  15,89,61,39,183,1,0                 // mulps         0x1b727(%rip),%xmm7        # 3b260 <_sk_srcover_bgra_8888_sse2_lowp+0x1164>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,53                              // je            20110 <_sk_load_4444_dst_sse41+0xbc>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,49                              // je            1fb76 <_sk_load_4444_dst_sse41+0xad>
   .byte  102,15,239,255                      // pxor          %xmm7,%xmm7
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            200fa <_sk_load_4444_dst_sse41+0xa6>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,139                             // jne           20076 <_sk_load_4444_dst_sse41+0x22>
-  .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,19                              // je            1fb60 <_sk_load_4444_dst_sse41+0x97>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,148                             // jne           1fae5 <_sk_load_4444_dst_sse41+0x1c>
+  .byte  65,15,183,68,80,4                   // movzwl        0x4(%r8,%rdx,2),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
   .byte  102,15,112,252,69                   // pshufd        $0x45,%xmm4,%xmm7
-  .byte  102,67,15,110,36,80                 // movd          (%r8,%r10,2),%xmm4
+  .byte  102,65,15,110,36,80                 // movd          (%r8,%rdx,2),%xmm4
   .byte  102,15,56,51,228                    // pmovzxwd      %xmm4,%xmm4
   .byte  102,15,58,14,252,15                 // pblendw       $0xf,%xmm4,%xmm7
-  .byte  233,102,255,255,255                 // jmpq          20076 <_sk_load_4444_dst_sse41+0x22>
-  .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
+  .byte  233,111,255,255,255                 // jmpq          1fae5 <_sk_load_4444_dst_sse41+0x1c>
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,15,110,248                      // movd          %eax,%xmm7
-  .byte  233,88,255,255,255                  // jmpq          20076 <_sk_load_4444_dst_sse41+0x22>
+  .byte  233,97,255,255,255                  // jmpq          1fae5 <_sk_load_4444_dst_sse41+0x1c>
 
 HIDDEN _sk_gather_4444_sse41
 .globl _sk_gather_4444_sse41
@@ -30995,21 +30723,21 @@
   .byte  65,15,183,4,64                      // movzwl        (%r8,%rax,2),%eax
   .byte  102,15,196,192,3                    // pinsrw        $0x3,%eax,%xmm0
   .byte  102,15,56,51,216                    // pmovzxwd      %xmm0,%xmm3
-  .byte  102,15,111,5,234,183,1,0            // movdqa        0x1b7ea(%rip),%xmm0        # 3b9b0 <_sk_srcover_bgra_8888_sse2_lowp+0x10e4>
+  .byte  102,15,111,5,196,181,1,0            // movdqa        0x1b5c4(%rip),%xmm0        # 3b1f0 <_sk_srcover_bgra_8888_sse2_lowp+0x10f4>
   .byte  102,15,219,195                      // pand          %xmm3,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,236,183,1,0                 // mulps         0x1b7ec(%rip),%xmm0        # 3b9c0 <_sk_srcover_bgra_8888_sse2_lowp+0x10f4>
-  .byte  102,15,111,13,244,183,1,0           // movdqa        0x1b7f4(%rip),%xmm1        # 3b9d0 <_sk_srcover_bgra_8888_sse2_lowp+0x1104>
+  .byte  15,89,5,198,181,1,0                 // mulps         0x1b5c6(%rip),%xmm0        # 3b200 <_sk_srcover_bgra_8888_sse2_lowp+0x1104>
+  .byte  102,15,111,13,206,181,1,0           // movdqa        0x1b5ce(%rip),%xmm1        # 3b210 <_sk_srcover_bgra_8888_sse2_lowp+0x1114>
   .byte  102,15,219,203                      // pand          %xmm3,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
-  .byte  15,89,13,246,183,1,0                // mulps         0x1b7f6(%rip),%xmm1        # 3b9e0 <_sk_srcover_bgra_8888_sse2_lowp+0x1114>
-  .byte  102,15,111,21,254,183,1,0           // movdqa        0x1b7fe(%rip),%xmm2        # 3b9f0 <_sk_srcover_bgra_8888_sse2_lowp+0x1124>
+  .byte  15,89,13,208,181,1,0                // mulps         0x1b5d0(%rip),%xmm1        # 3b220 <_sk_srcover_bgra_8888_sse2_lowp+0x1124>
+  .byte  102,15,111,21,216,181,1,0           // movdqa        0x1b5d8(%rip),%xmm2        # 3b230 <_sk_srcover_bgra_8888_sse2_lowp+0x1134>
   .byte  102,15,219,211                      // pand          %xmm3,%xmm2
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
-  .byte  15,89,21,0,184,1,0                  // mulps         0x1b800(%rip),%xmm2        # 3ba00 <_sk_srcover_bgra_8888_sse2_lowp+0x1134>
-  .byte  102,15,219,29,8,184,1,0             // pand          0x1b808(%rip),%xmm3        # 3ba10 <_sk_srcover_bgra_8888_sse2_lowp+0x1144>
+  .byte  15,89,21,218,181,1,0                // mulps         0x1b5da(%rip),%xmm2        # 3b240 <_sk_srcover_bgra_8888_sse2_lowp+0x1144>
+  .byte  102,15,219,29,226,181,1,0           // pand          0x1b5e2(%rip),%xmm3        # 3b250 <_sk_srcover_bgra_8888_sse2_lowp+0x1154>
   .byte  15,91,219                           // cvtdq2ps      %xmm3,%xmm3
-  .byte  15,89,29,14,184,1,0                 // mulps         0x1b80e(%rip),%xmm3        # 3ba20 <_sk_srcover_bgra_8888_sse2_lowp+0x1154>
+  .byte  15,89,29,232,181,1,0                // mulps         0x1b5e8(%rip),%xmm3        # 3b260 <_sk_srcover_bgra_8888_sse2_lowp+0x1164>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -31018,18 +30746,16 @@
 FUNCTION(_sk_store_4444_sse41)
 _sk_store_4444_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  68,15,95,200                        // maxps         %xmm0,%xmm9
-  .byte  68,15,40,21,48,179,1,0              // movaps        0x1b330(%rip),%xmm10        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,21,16,177,1,0              // movaps        0x1b110(%rip),%xmm10        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,93,202                        // minps         %xmm10,%xmm9
-  .byte  68,15,40,29,228,183,1,0             // movaps        0x1b7e4(%rip),%xmm11        # 3ba30 <_sk_srcover_bgra_8888_sse2_lowp+0x1164>
+  .byte  68,15,40,29,196,181,1,0             // movaps        0x1b5c4(%rip),%xmm11        # 3b270 <_sk_srcover_bgra_8888_sse2_lowp+0x1174>
   .byte  69,15,89,203                        // mulps         %xmm11,%xmm9
   .byte  102,69,15,91,201                    // cvtps2dq      %xmm9,%xmm9
   .byte  102,65,15,114,241,12                // pslld         $0xc,%xmm9
@@ -31054,51 +30780,49 @@
   .byte  102,69,15,86,196                    // orpd          %xmm12,%xmm8
   .byte  102,68,15,56,43,192                 // packusdw      %xmm0,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           202c7 <_sk_store_4444_sse41+0xb1>
-  .byte  102,69,15,214,4,64                  // movq          %xmm8,(%r8,%rax,2)
+  .byte  117,10                              // jne           1fd27 <_sk_store_4444_sse41+0xab>
+  .byte  102,69,15,214,4,80                  // movq          %xmm8,(%r8,%rdx,2)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,69,15,56,51,192                 // pmovzxwd      %xmm8,%xmm8
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,35                              // je            202fd <_sk_store_4444_sse41+0xe7>
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,15                              // je            202ef <_sk_store_4444_sse41+0xd9>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,221                             // jne           202c3 <_sk_store_4444_sse41+0xad>
-  .byte  102,69,15,58,21,68,64,4,4           // pextrw        $0x4,%xmm8,0x4(%r8,%rax,2)
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,31                              // je            1fd54 <_sk_store_4444_sse41+0xd8>
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,13                              // je            1fd46 <_sk_store_4444_sse41+0xca>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,230                             // jne           1fd23 <_sk_store_4444_sse41+0xa7>
+  .byte  102,69,15,58,21,68,80,4,4           // pextrw        $0x4,%xmm8,0x4(%r8,%rdx,2)
   .byte  242,69,15,112,192,232               // pshuflw       $0xe8,%xmm8,%xmm8
-  .byte  102,69,15,126,4,64                  // movd          %xmm8,(%r8,%rax,2)
-  .byte  235,198                             // jmp           202c3 <_sk_store_4444_sse41+0xad>
-  .byte  102,69,15,58,21,4,64,0              // pextrw        $0x0,%xmm8,(%r8,%rax,2)
-  .byte  235,188                             // jmp           202c3 <_sk_store_4444_sse41+0xad>
+  .byte  102,69,15,126,4,80                  // movd          %xmm8,(%r8,%rdx,2)
+  .byte  235,207                             // jmp           1fd23 <_sk_store_4444_sse41+0xa7>
+  .byte  102,69,15,58,21,4,80,0              // pextrw        $0x0,%xmm8,(%r8,%rdx,2)
+  .byte  235,197                             // jmp           1fd23 <_sk_store_4444_sse41+0xa7>
 
 HIDDEN _sk_load_8888_sse41
 .globl _sk_load_8888_sse41
 FUNCTION(_sk_load_8888_sse41)
 _sk_load_8888_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,89                              // jne           2037c <_sk_load_8888_sse41+0x75>
-  .byte  243,65,15,111,28,128                // movdqu        (%r8,%rax,4),%xmm3
-  .byte  102,15,111,5,239,178,1,0            // movdqa        0x1b2ef(%rip),%xmm0        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  117,89                              // jne           1fdcd <_sk_load_8888_sse41+0x6f>
+  .byte  243,65,15,111,28,144                // movdqu        (%r8,%rdx,4),%xmm3
+  .byte  102,15,111,5,222,176,1,0            // movdqa        0x1b0de(%rip),%xmm0        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  102,15,219,195                      // pand          %xmm3,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  68,15,40,5,64,180,1,0               // movaps        0x1b440(%rip),%xmm8        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  68,15,40,5,47,178,1,0               // movaps        0x1b22f(%rip),%xmm8        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  102,15,111,203                      // movdqa        %xmm3,%xmm1
-  .byte  102,15,56,0,13,223,178,1,0          // pshufb        0x1b2df(%rip),%xmm1        # 3b630 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
+  .byte  102,15,56,0,13,206,176,1,0          // pshufb        0x1b0ce(%rip),%xmm1        # 3ae70 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
   .byte  65,15,89,200                        // mulps         %xmm8,%xmm1
   .byte  102,15,111,211                      // movdqa        %xmm3,%xmm2
-  .byte  102,15,56,0,21,219,178,1,0          // pshufb        0x1b2db(%rip),%xmm2        # 3b640 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
+  .byte  102,15,56,0,21,202,176,1,0          // pshufb        0x1b0ca(%rip),%xmm2        # 3ae80 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
   .byte  65,15,89,208                        // mulps         %xmm8,%xmm2
   .byte  102,15,114,211,24                   // psrld         $0x18,%xmm3
@@ -31106,48 +30830,46 @@
   .byte  65,15,89,216                        // mulps         %xmm8,%xmm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,45                              // je            203b6 <_sk_load_8888_sse41+0xaf>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,41                              // je            1fdfe <_sk_load_8888_sse41+0xa0>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,18                              // je            203a5 <_sk_load_8888_sse41+0x9e>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,144                             // jne           20329 <_sk_load_8888_sse41+0x22>
-  .byte  102,65,15,110,68,128,8              // movd          0x8(%r8,%rax,4),%xmm0
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,16                              // je            1fded <_sk_load_8888_sse41+0x8f>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,153                             // jne           1fd7a <_sk_load_8888_sse41+0x1c>
+  .byte  102,65,15,110,68,144,8              // movd          0x8(%r8,%rdx,4),%xmm0
   .byte  102,15,112,216,69                   // pshufd        $0x45,%xmm0,%xmm3
-  .byte  243,65,15,126,4,128                 // movq          (%r8,%rax,4),%xmm0
+  .byte  243,65,15,126,4,144                 // movq          (%r8,%rdx,4),%xmm0
   .byte  102,15,58,14,216,15                 // pblendw       $0xf,%xmm0,%xmm3
-  .byte  233,115,255,255,255                 // jmpq          20329 <_sk_load_8888_sse41+0x22>
-  .byte  102,65,15,110,28,128                // movd          (%r8,%rax,4),%xmm3
-  .byte  233,104,255,255,255                 // jmpq          20329 <_sk_load_8888_sse41+0x22>
+  .byte  233,124,255,255,255                 // jmpq          1fd7a <_sk_load_8888_sse41+0x1c>
+  .byte  102,65,15,110,28,144                // movd          (%r8,%rdx,4),%xmm3
+  .byte  233,113,255,255,255                 // jmpq          1fd7a <_sk_load_8888_sse41+0x1c>
 
 HIDDEN _sk_load_8888_dst_sse41
 .globl _sk_load_8888_dst_sse41
 FUNCTION(_sk_load_8888_dst_sse41)
 _sk_load_8888_dst_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,89                              // jne           20436 <_sk_load_8888_dst_sse41+0x75>
-  .byte  243,65,15,111,60,128                // movdqu        (%r8,%rax,4),%xmm7
-  .byte  102,15,111,37,53,178,1,0            // movdqa        0x1b235(%rip),%xmm4        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  117,89                              // jne           1fe78 <_sk_load_8888_dst_sse41+0x6f>
+  .byte  243,65,15,111,60,144                // movdqu        (%r8,%rdx,4),%xmm7
+  .byte  102,15,111,37,51,176,1,0            // movdqa        0x1b033(%rip),%xmm4        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  102,15,219,231                      // pand          %xmm7,%xmm4
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
-  .byte  68,15,40,5,134,179,1,0              // movaps        0x1b386(%rip),%xmm8        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  68,15,40,5,132,177,1,0              // movaps        0x1b184(%rip),%xmm8        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  65,15,89,224                        // mulps         %xmm8,%xmm4
   .byte  102,15,111,239                      // movdqa        %xmm7,%xmm5
-  .byte  102,15,56,0,45,37,178,1,0           // pshufb        0x1b225(%rip),%xmm5        # 3b630 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
+  .byte  102,15,56,0,45,35,176,1,0           // pshufb        0x1b023(%rip),%xmm5        # 3ae70 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
   .byte  15,91,237                           // cvtdq2ps      %xmm5,%xmm5
   .byte  65,15,89,232                        // mulps         %xmm8,%xmm5
   .byte  102,15,111,247                      // movdqa        %xmm7,%xmm6
-  .byte  102,15,56,0,53,33,178,1,0           // pshufb        0x1b221(%rip),%xmm6        # 3b640 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
+  .byte  102,15,56,0,53,31,176,1,0           // pshufb        0x1b01f(%rip),%xmm6        # 3ae80 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
   .byte  15,91,246                           // cvtdq2ps      %xmm6,%xmm6
   .byte  65,15,89,240                        // mulps         %xmm8,%xmm6
   .byte  102,15,114,215,24                   // psrld         $0x18,%xmm7
@@ -31155,22 +30877,22 @@
   .byte  65,15,89,248                        // mulps         %xmm8,%xmm7
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,45                              // je            20470 <_sk_load_8888_dst_sse41+0xaf>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,41                              // je            1fea9 <_sk_load_8888_dst_sse41+0xa0>
   .byte  102,15,239,255                      // pxor          %xmm7,%xmm7
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,18                              // je            2045f <_sk_load_8888_dst_sse41+0x9e>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,144                             // jne           203e3 <_sk_load_8888_dst_sse41+0x22>
-  .byte  102,65,15,110,100,128,8             // movd          0x8(%r8,%rax,4),%xmm4
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,16                              // je            1fe98 <_sk_load_8888_dst_sse41+0x8f>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,153                             // jne           1fe25 <_sk_load_8888_dst_sse41+0x1c>
+  .byte  102,65,15,110,100,144,8             // movd          0x8(%r8,%rdx,4),%xmm4
   .byte  102,15,112,252,69                   // pshufd        $0x45,%xmm4,%xmm7
-  .byte  243,65,15,126,36,128                // movq          (%r8,%rax,4),%xmm4
+  .byte  243,65,15,126,36,144                // movq          (%r8,%rdx,4),%xmm4
   .byte  102,15,58,14,252,15                 // pblendw       $0xf,%xmm4,%xmm7
-  .byte  233,115,255,255,255                 // jmpq          203e3 <_sk_load_8888_dst_sse41+0x22>
-  .byte  102,65,15,110,60,128                // movd          (%r8,%rax,4),%xmm7
-  .byte  233,104,255,255,255                 // jmpq          203e3 <_sk_load_8888_dst_sse41+0x22>
+  .byte  233,124,255,255,255                 // jmpq          1fe25 <_sk_load_8888_dst_sse41+0x1c>
+  .byte  102,65,15,110,60,144                // movd          (%r8,%rdx,4),%xmm7
+  .byte  233,113,255,255,255                 // jmpq          1fe25 <_sk_load_8888_dst_sse41+0x1c>
 
 HIDDEN _sk_gather_8888_sse41
 .globl _sk_gather_8888_sse41
@@ -31207,17 +30929,17 @@
   .byte  102,65,15,58,34,28,128,1            // pinsrd        $0x1,(%r8,%rax,4),%xmm3
   .byte  102,67,15,58,34,28,152,2            // pinsrd        $0x2,(%r8,%r11,4),%xmm3
   .byte  102,67,15,58,34,28,144,3            // pinsrd        $0x3,(%r8,%r10,4),%xmm3
-  .byte  102,15,111,5,14,177,1,0             // movdqa        0x1b10e(%rip),%xmm0        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  102,15,111,5,21,175,1,0             // movdqa        0x1af15(%rip),%xmm0        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  102,15,219,195                      // pand          %xmm3,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  68,15,40,5,95,178,1,0               // movaps        0x1b25f(%rip),%xmm8        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  68,15,40,5,102,176,1,0              // movaps        0x1b066(%rip),%xmm8        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  102,15,111,203                      // movdqa        %xmm3,%xmm1
-  .byte  102,15,56,0,13,254,176,1,0          // pshufb        0x1b0fe(%rip),%xmm1        # 3b630 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
+  .byte  102,15,56,0,13,5,175,1,0            // pshufb        0x1af05(%rip),%xmm1        # 3ae70 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
   .byte  65,15,89,200                        // mulps         %xmm8,%xmm1
   .byte  102,15,111,211                      // movdqa        %xmm3,%xmm2
-  .byte  102,15,56,0,21,250,176,1,0          // pshufb        0x1b0fa(%rip),%xmm2        # 3b640 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
+  .byte  102,15,56,0,21,1,175,1,0            // pshufb        0x1af01(%rip),%xmm2        # 3ae80 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
   .byte  65,15,89,208                        // mulps         %xmm8,%xmm2
   .byte  102,15,114,211,24                   // psrld         $0x18,%xmm3
@@ -31231,18 +30953,16 @@
 FUNCTION(_sk_store_8888_sse41)
 _sk_store_8888_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  68,15,95,200                        // maxps         %xmm0,%xmm9
-  .byte  68,15,40,21,232,175,1,0             // movaps        0x1afe8(%rip),%xmm10        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,21,245,173,1,0             // movaps        0x1adf5(%rip),%xmm10        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,93,202                        // minps         %xmm10,%xmm9
-  .byte  68,15,40,29,188,176,1,0             // movaps        0x1b0bc(%rip),%xmm11        # 3b650 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  .byte  68,15,40,29,201,174,1,0             // movaps        0x1aec9(%rip),%xmm11        # 3ae90 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
   .byte  69,15,89,203                        // mulps         %xmm11,%xmm9
   .byte  102,69,15,91,201                    // cvtps2dq      %xmm9,%xmm9
   .byte  69,15,87,228                        // xorps         %xmm12,%xmm12
@@ -31266,49 +30986,47 @@
   .byte  102,69,15,235,193                   // por           %xmm9,%xmm8
   .byte  102,69,15,235,196                   // por           %xmm12,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           20609 <_sk_store_8888_sse41+0xac>
-  .byte  243,69,15,127,4,128                 // movdqu        %xmm8,(%r8,%rax,4)
+  .byte  117,10                              // jne           2003c <_sk_store_8888_sse41+0xa6>
+  .byte  243,69,15,127,4,144                 // movdqu        %xmm8,(%r8,%rdx,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,29                              // je            20633 <_sk_store_8888_sse41+0xd6>
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,15                              // je            2062b <_sk_store_8888_sse41+0xce>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,227                             // jne           20605 <_sk_store_8888_sse41+0xa8>
-  .byte  102,69,15,58,22,68,128,8,2          // pextrd        $0x2,%xmm8,0x8(%r8,%rax,4)
-  .byte  102,69,15,214,4,128                 // movq          %xmm8,(%r8,%rax,4)
-  .byte  235,210                             // jmp           20605 <_sk_store_8888_sse41+0xa8>
-  .byte  102,69,15,126,4,128                 // movd          %xmm8,(%r8,%rax,4)
-  .byte  235,202                             // jmp           20605 <_sk_store_8888_sse41+0xa8>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,25                              // je            2005d <_sk_store_8888_sse41+0xc7>
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,13                              // je            20055 <_sk_store_8888_sse41+0xbf>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,236                             // jne           20038 <_sk_store_8888_sse41+0xa2>
+  .byte  102,69,15,58,22,68,144,8,2          // pextrd        $0x2,%xmm8,0x8(%r8,%rdx,4)
+  .byte  102,69,15,214,4,144                 // movq          %xmm8,(%r8,%rdx,4)
+  .byte  235,219                             // jmp           20038 <_sk_store_8888_sse41+0xa2>
+  .byte  102,69,15,126,4,144                 // movd          %xmm8,(%r8,%rdx,4)
+  .byte  235,211                             // jmp           20038 <_sk_store_8888_sse41+0xa2>
 
 HIDDEN _sk_load_bgra_sse41
 .globl _sk_load_bgra_sse41
 FUNCTION(_sk_load_bgra_sse41)
 _sk_load_bgra_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,89                              // jne           206b0 <_sk_load_bgra_sse41+0x75>
-  .byte  243,65,15,111,28,128                // movdqu        (%r8,%rax,4),%xmm3
-  .byte  102,15,111,5,187,175,1,0            // movdqa        0x1afbb(%rip),%xmm0        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  117,89                              // jne           200d4 <_sk_load_bgra_sse41+0x6f>
+  .byte  243,65,15,111,28,144                // movdqu        (%r8,%rdx,4),%xmm3
+  .byte  102,15,111,5,215,173,1,0            // movdqa        0x1add7(%rip),%xmm0        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  102,15,219,195                      // pand          %xmm3,%xmm0
   .byte  15,91,208                           // cvtdq2ps      %xmm0,%xmm2
-  .byte  68,15,40,5,12,177,1,0               // movaps        0x1b10c(%rip),%xmm8        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  68,15,40,5,40,175,1,0               // movaps        0x1af28(%rip),%xmm8        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  65,15,89,208                        // mulps         %xmm8,%xmm2
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
-  .byte  102,15,56,0,5,171,175,1,0           // pshufb        0x1afab(%rip),%xmm0        # 3b630 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
+  .byte  102,15,56,0,5,199,173,1,0           // pshufb        0x1adc7(%rip),%xmm0        # 3ae70 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
   .byte  15,91,200                           // cvtdq2ps      %xmm0,%xmm1
   .byte  65,15,89,200                        // mulps         %xmm8,%xmm1
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
-  .byte  102,15,56,0,5,167,175,1,0           // pshufb        0x1afa7(%rip),%xmm0        # 3b640 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
+  .byte  102,15,56,0,5,195,173,1,0           // pshufb        0x1adc3(%rip),%xmm0        # 3ae80 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  102,15,114,211,24                   // psrld         $0x18,%xmm3
@@ -31316,48 +31034,46 @@
   .byte  65,15,89,216                        // mulps         %xmm8,%xmm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,45                              // je            206ea <_sk_load_bgra_sse41+0xaf>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,41                              // je            20105 <_sk_load_bgra_sse41+0xa0>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,18                              // je            206d9 <_sk_load_bgra_sse41+0x9e>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,144                             // jne           2065d <_sk_load_bgra_sse41+0x22>
-  .byte  102,65,15,110,68,128,8              // movd          0x8(%r8,%rax,4),%xmm0
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,16                              // je            200f4 <_sk_load_bgra_sse41+0x8f>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,153                             // jne           20081 <_sk_load_bgra_sse41+0x1c>
+  .byte  102,65,15,110,68,144,8              // movd          0x8(%r8,%rdx,4),%xmm0
   .byte  102,15,112,216,69                   // pshufd        $0x45,%xmm0,%xmm3
-  .byte  243,65,15,126,4,128                 // movq          (%r8,%rax,4),%xmm0
+  .byte  243,65,15,126,4,144                 // movq          (%r8,%rdx,4),%xmm0
   .byte  102,15,58,14,216,15                 // pblendw       $0xf,%xmm0,%xmm3
-  .byte  233,115,255,255,255                 // jmpq          2065d <_sk_load_bgra_sse41+0x22>
-  .byte  102,65,15,110,28,128                // movd          (%r8,%rax,4),%xmm3
-  .byte  233,104,255,255,255                 // jmpq          2065d <_sk_load_bgra_sse41+0x22>
+  .byte  233,124,255,255,255                 // jmpq          20081 <_sk_load_bgra_sse41+0x1c>
+  .byte  102,65,15,110,28,144                // movd          (%r8,%rdx,4),%xmm3
+  .byte  233,113,255,255,255                 // jmpq          20081 <_sk_load_bgra_sse41+0x1c>
 
 HIDDEN _sk_load_bgra_dst_sse41
 .globl _sk_load_bgra_dst_sse41
 FUNCTION(_sk_load_bgra_dst_sse41)
 _sk_load_bgra_dst_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,89                              // jne           2076a <_sk_load_bgra_dst_sse41+0x75>
-  .byte  243,65,15,111,60,128                // movdqu        (%r8,%rax,4),%xmm7
-  .byte  102,15,111,37,1,175,1,0             // movdqa        0x1af01(%rip),%xmm4        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  117,89                              // jne           2017f <_sk_load_bgra_dst_sse41+0x6f>
+  .byte  243,65,15,111,60,144                // movdqu        (%r8,%rdx,4),%xmm7
+  .byte  102,15,111,37,44,173,1,0            // movdqa        0x1ad2c(%rip),%xmm4        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  102,15,219,231                      // pand          %xmm7,%xmm4
   .byte  15,91,244                           // cvtdq2ps      %xmm4,%xmm6
-  .byte  68,15,40,5,82,176,1,0               // movaps        0x1b052(%rip),%xmm8        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  68,15,40,5,125,174,1,0              // movaps        0x1ae7d(%rip),%xmm8        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  65,15,89,240                        // mulps         %xmm8,%xmm6
   .byte  102,15,111,231                      // movdqa        %xmm7,%xmm4
-  .byte  102,15,56,0,37,241,174,1,0          // pshufb        0x1aef1(%rip),%xmm4        # 3b630 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
+  .byte  102,15,56,0,37,28,173,1,0           // pshufb        0x1ad1c(%rip),%xmm4        # 3ae70 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
   .byte  15,91,236                           // cvtdq2ps      %xmm4,%xmm5
   .byte  65,15,89,232                        // mulps         %xmm8,%xmm5
   .byte  102,15,111,231                      // movdqa        %xmm7,%xmm4
-  .byte  102,15,56,0,37,237,174,1,0          // pshufb        0x1aeed(%rip),%xmm4        # 3b640 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
+  .byte  102,15,56,0,37,24,173,1,0           // pshufb        0x1ad18(%rip),%xmm4        # 3ae80 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
   .byte  65,15,89,224                        // mulps         %xmm8,%xmm4
   .byte  102,15,114,215,24                   // psrld         $0x18,%xmm7
@@ -31365,22 +31081,22 @@
   .byte  65,15,89,248                        // mulps         %xmm8,%xmm7
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,45                              // je            207a4 <_sk_load_bgra_dst_sse41+0xaf>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,41                              // je            201b0 <_sk_load_bgra_dst_sse41+0xa0>
   .byte  102,15,239,255                      // pxor          %xmm7,%xmm7
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,18                              // je            20793 <_sk_load_bgra_dst_sse41+0x9e>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,144                             // jne           20717 <_sk_load_bgra_dst_sse41+0x22>
-  .byte  102,65,15,110,100,128,8             // movd          0x8(%r8,%rax,4),%xmm4
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,16                              // je            2019f <_sk_load_bgra_dst_sse41+0x8f>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,153                             // jne           2012c <_sk_load_bgra_dst_sse41+0x1c>
+  .byte  102,65,15,110,100,144,8             // movd          0x8(%r8,%rdx,4),%xmm4
   .byte  102,15,112,252,69                   // pshufd        $0x45,%xmm4,%xmm7
-  .byte  243,65,15,126,36,128                // movq          (%r8,%rax,4),%xmm4
+  .byte  243,65,15,126,36,144                // movq          (%r8,%rdx,4),%xmm4
   .byte  102,15,58,14,252,15                 // pblendw       $0xf,%xmm4,%xmm7
-  .byte  233,115,255,255,255                 // jmpq          20717 <_sk_load_bgra_dst_sse41+0x22>
-  .byte  102,65,15,110,60,128                // movd          (%r8,%rax,4),%xmm7
-  .byte  233,104,255,255,255                 // jmpq          20717 <_sk_load_bgra_dst_sse41+0x22>
+  .byte  233,124,255,255,255                 // jmpq          2012c <_sk_load_bgra_dst_sse41+0x1c>
+  .byte  102,65,15,110,60,144                // movd          (%r8,%rdx,4),%xmm7
+  .byte  233,113,255,255,255                 // jmpq          2012c <_sk_load_bgra_dst_sse41+0x1c>
 
 HIDDEN _sk_gather_bgra_sse41
 .globl _sk_gather_bgra_sse41
@@ -31417,17 +31133,17 @@
   .byte  102,65,15,58,34,28,128,1            // pinsrd        $0x1,(%r8,%rax,4),%xmm3
   .byte  102,67,15,58,34,28,152,2            // pinsrd        $0x2,(%r8,%r11,4),%xmm3
   .byte  102,67,15,58,34,28,144,3            // pinsrd        $0x3,(%r8,%r10,4),%xmm3
-  .byte  102,15,111,5,218,173,1,0            // movdqa        0x1adda(%rip),%xmm0        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  102,15,111,5,14,172,1,0             // movdqa        0x1ac0e(%rip),%xmm0        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  102,15,219,195                      // pand          %xmm3,%xmm0
   .byte  15,91,208                           // cvtdq2ps      %xmm0,%xmm2
-  .byte  68,15,40,5,43,175,1,0               // movaps        0x1af2b(%rip),%xmm8        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  68,15,40,5,95,173,1,0               // movaps        0x1ad5f(%rip),%xmm8        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  65,15,89,208                        // mulps         %xmm8,%xmm2
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
-  .byte  102,15,56,0,5,202,173,1,0           // pshufb        0x1adca(%rip),%xmm0        # 3b630 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
+  .byte  102,15,56,0,5,254,171,1,0           // pshufb        0x1abfe(%rip),%xmm0        # 3ae70 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
   .byte  15,91,200                           // cvtdq2ps      %xmm0,%xmm1
   .byte  65,15,89,200                        // mulps         %xmm8,%xmm1
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
-  .byte  102,15,56,0,5,198,173,1,0           // pshufb        0x1adc6(%rip),%xmm0        # 3b640 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
+  .byte  102,15,56,0,5,250,171,1,0           // pshufb        0x1abfa(%rip),%xmm0        # 3ae80 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  102,15,114,211,24                   // psrld         $0x18,%xmm3
@@ -31441,18 +31157,16 @@
 FUNCTION(_sk_store_bgra_sse41)
 _sk_store_bgra_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  68,15,95,202                        // maxps         %xmm2,%xmm9
-  .byte  68,15,40,21,180,172,1,0             // movaps        0x1acb4(%rip),%xmm10        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,21,238,170,1,0             // movaps        0x1aaee(%rip),%xmm10        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,93,202                        // minps         %xmm10,%xmm9
-  .byte  68,15,40,29,136,173,1,0             // movaps        0x1ad88(%rip),%xmm11        # 3b650 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  .byte  68,15,40,29,194,171,1,0             // movaps        0x1abc2(%rip),%xmm11        # 3ae90 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
   .byte  69,15,89,203                        // mulps         %xmm11,%xmm9
   .byte  102,69,15,91,201                    // cvtps2dq      %xmm9,%xmm9
   .byte  69,15,87,228                        // xorps         %xmm12,%xmm12
@@ -31476,39 +31190,37 @@
   .byte  102,69,15,235,193                   // por           %xmm9,%xmm8
   .byte  102,69,15,235,196                   // por           %xmm12,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           2093d <_sk_store_bgra_sse41+0xac>
-  .byte  243,69,15,127,4,128                 // movdqu        %xmm8,(%r8,%rax,4)
+  .byte  117,10                              // jne           20343 <_sk_store_bgra_sse41+0xa6>
+  .byte  243,69,15,127,4,144                 // movdqu        %xmm8,(%r8,%rdx,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,29                              // je            20967 <_sk_store_bgra_sse41+0xd6>
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,15                              // je            2095f <_sk_store_bgra_sse41+0xce>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,227                             // jne           20939 <_sk_store_bgra_sse41+0xa8>
-  .byte  102,69,15,58,22,68,128,8,2          // pextrd        $0x2,%xmm8,0x8(%r8,%rax,4)
-  .byte  102,69,15,214,4,128                 // movq          %xmm8,(%r8,%rax,4)
-  .byte  235,210                             // jmp           20939 <_sk_store_bgra_sse41+0xa8>
-  .byte  102,69,15,126,4,128                 // movd          %xmm8,(%r8,%rax,4)
-  .byte  235,202                             // jmp           20939 <_sk_store_bgra_sse41+0xa8>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,25                              // je            20364 <_sk_store_bgra_sse41+0xc7>
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,13                              // je            2035c <_sk_store_bgra_sse41+0xbf>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,236                             // jne           2033f <_sk_store_bgra_sse41+0xa2>
+  .byte  102,69,15,58,22,68,144,8,2          // pextrd        $0x2,%xmm8,0x8(%r8,%rdx,4)
+  .byte  102,69,15,214,4,144                 // movq          %xmm8,(%r8,%rdx,4)
+  .byte  235,219                             // jmp           2033f <_sk_store_bgra_sse41+0xa2>
+  .byte  102,69,15,126,4,144                 // movd          %xmm8,(%r8,%rdx,4)
+  .byte  235,211                             // jmp           2033f <_sk_store_bgra_sse41+0xa2>
 
 HIDDEN _sk_load_f16_sse41
 .globl _sk_load_f16_sse41
 FUNCTION(_sk_load_f16_sse41)
 _sk_load_f16_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,3                        // shl           $0x3,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,68,1,0,0                     // jne           20ad3 <_sk_load_f16_sse41+0x164>
-  .byte  102,65,15,16,4,192                  // movupd        (%r8,%rax,8),%xmm0
-  .byte  243,65,15,111,76,192,16             // movdqu        0x10(%r8,%rax,8),%xmm1
+  .byte  15,133,68,1,0,0                     // jne           204ca <_sk_load_f16_sse41+0x15e>
+  .byte  102,65,15,16,4,208                  // movupd        (%r8,%rdx,8),%xmm0
+  .byte  243,65,15,111,76,208,16             // movdqu        0x10(%r8,%rdx,8),%xmm1
   .byte  102,68,15,40,200                    // movapd        %xmm0,%xmm9
   .byte  102,68,15,97,201                    // punpcklwd     %xmm1,%xmm9
   .byte  102,15,105,193                      // punpckhwd     %xmm1,%xmm0
@@ -31516,19 +31228,19 @@
   .byte  102,68,15,97,224                    // punpcklwd     %xmm0,%xmm12
   .byte  102,68,15,105,200                   // punpckhwd     %xmm0,%xmm9
   .byte  102,65,15,56,51,212                 // pmovzxwd      %xmm12,%xmm2
-  .byte  102,68,15,111,5,120,176,1,0         // movdqa        0x1b078(%rip),%xmm8        # 3ba40 <_sk_srcover_bgra_8888_sse2_lowp+0x1174>
+  .byte  102,68,15,111,5,193,174,1,0         // movdqa        0x1aec1(%rip),%xmm8        # 3b280 <_sk_srcover_bgra_8888_sse2_lowp+0x1184>
   .byte  102,15,111,202                      // movdqa        %xmm2,%xmm1
   .byte  102,65,15,219,200                   // pand          %xmm8,%xmm1
-  .byte  102,68,15,111,21,118,176,1,0        // movdqa        0x1b076(%rip),%xmm10        # 3ba50 <_sk_srcover_bgra_8888_sse2_lowp+0x1184>
+  .byte  102,68,15,111,21,191,174,1,0        // movdqa        0x1aebf(%rip),%xmm10        # 3b290 <_sk_srcover_bgra_8888_sse2_lowp+0x1194>
   .byte  102,65,15,219,210                   // pand          %xmm10,%xmm2
-  .byte  102,15,111,29,121,176,1,0           // movdqa        0x1b079(%rip),%xmm3        # 3ba60 <_sk_srcover_bgra_8888_sse2_lowp+0x1194>
+  .byte  102,15,111,29,194,174,1,0           // movdqa        0x1aec2(%rip),%xmm3        # 3b2a0 <_sk_srcover_bgra_8888_sse2_lowp+0x11a4>
   .byte  102,15,114,241,16                   // pslld         $0x10,%xmm1
   .byte  102,15,111,194                      // movdqa        %xmm2,%xmm0
   .byte  102,15,56,63,195                    // pmaxud        %xmm3,%xmm0
   .byte  102,15,118,194                      // pcmpeqd       %xmm2,%xmm0
   .byte  102,15,114,242,13                   // pslld         $0xd,%xmm2
   .byte  102,15,235,209                      // por           %xmm1,%xmm2
-  .byte  102,68,15,111,29,101,176,1,0        // movdqa        0x1b065(%rip),%xmm11        # 3ba70 <_sk_srcover_bgra_8888_sse2_lowp+0x11a4>
+  .byte  102,68,15,111,29,174,174,1,0        // movdqa        0x1aeae(%rip),%xmm11        # 3b2b0 <_sk_srcover_bgra_8888_sse2_lowp+0x11b4>
   .byte  102,65,15,254,211                   // paddd         %xmm11,%xmm2
   .byte  102,15,219,194                      // pand          %xmm2,%xmm0
   .byte  102,65,15,112,204,238               // pshufd        $0xee,%xmm12,%xmm1
@@ -31569,34 +31281,32 @@
   .byte  102,65,15,219,217                   // pand          %xmm9,%xmm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  242,65,15,16,4,192                  // movsd         (%r8,%rax,8),%xmm0
+  .byte  242,65,15,16,4,208                  // movsd         (%r8,%rdx,8),%xmm0
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,13                              // jne           20aec <_sk_load_f16_sse41+0x17d>
+  .byte  117,13                              // jne           204e3 <_sk_load_f16_sse41+0x177>
   .byte  243,15,126,192                      // movq          %xmm0,%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  233,176,254,255,255                 // jmpq          2099c <_sk_load_f16_sse41+0x2d>
-  .byte  102,65,15,22,68,192,8               // movhpd        0x8(%r8,%rax,8),%xmm0
+  .byte  233,176,254,255,255                 // jmpq          20393 <_sk_load_f16_sse41+0x27>
+  .byte  102,65,15,22,68,208,8               // movhpd        0x8(%r8,%rdx,8),%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  15,130,155,254,255,255              // jb            2099c <_sk_load_f16_sse41+0x2d>
-  .byte  243,65,15,126,76,192,16             // movq          0x10(%r8,%rax,8),%xmm1
-  .byte  233,143,254,255,255                 // jmpq          2099c <_sk_load_f16_sse41+0x2d>
+  .byte  15,130,155,254,255,255              // jb            20393 <_sk_load_f16_sse41+0x27>
+  .byte  243,65,15,126,76,208,16             // movq          0x10(%r8,%rdx,8),%xmm1
+  .byte  233,143,254,255,255                 // jmpq          20393 <_sk_load_f16_sse41+0x27>
 
 HIDDEN _sk_load_f16_dst_sse41
 .globl _sk_load_f16_dst_sse41
 FUNCTION(_sk_load_f16_dst_sse41)
 _sk_load_f16_dst_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,3                        // shl           $0x3,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,68,1,0,0                     // jne           20c71 <_sk_load_f16_dst_sse41+0x164>
-  .byte  102,65,15,16,36,192                 // movupd        (%r8,%rax,8),%xmm4
-  .byte  243,65,15,111,108,192,16            // movdqu        0x10(%r8,%rax,8),%xmm5
+  .byte  15,133,68,1,0,0                     // jne           20662 <_sk_load_f16_dst_sse41+0x15e>
+  .byte  102,65,15,16,36,208                 // movupd        (%r8,%rdx,8),%xmm4
+  .byte  243,65,15,111,108,208,16            // movdqu        0x10(%r8,%rdx,8),%xmm5
   .byte  102,68,15,40,204                    // movapd        %xmm4,%xmm9
   .byte  102,68,15,97,205                    // punpcklwd     %xmm5,%xmm9
   .byte  102,15,105,229                      // punpckhwd     %xmm5,%xmm4
@@ -31604,19 +31314,19 @@
   .byte  102,68,15,97,228                    // punpcklwd     %xmm4,%xmm12
   .byte  102,68,15,105,204                   // punpckhwd     %xmm4,%xmm9
   .byte  102,65,15,56,51,244                 // pmovzxwd      %xmm12,%xmm6
-  .byte  102,68,15,111,5,218,174,1,0         // movdqa        0x1aeda(%rip),%xmm8        # 3ba40 <_sk_srcover_bgra_8888_sse2_lowp+0x1174>
+  .byte  102,68,15,111,5,41,173,1,0          // movdqa        0x1ad29(%rip),%xmm8        # 3b280 <_sk_srcover_bgra_8888_sse2_lowp+0x1184>
   .byte  102,15,111,238                      // movdqa        %xmm6,%xmm5
   .byte  102,65,15,219,232                   // pand          %xmm8,%xmm5
-  .byte  102,68,15,111,21,216,174,1,0        // movdqa        0x1aed8(%rip),%xmm10        # 3ba50 <_sk_srcover_bgra_8888_sse2_lowp+0x1184>
+  .byte  102,68,15,111,21,39,173,1,0         // movdqa        0x1ad27(%rip),%xmm10        # 3b290 <_sk_srcover_bgra_8888_sse2_lowp+0x1194>
   .byte  102,65,15,219,242                   // pand          %xmm10,%xmm6
-  .byte  102,15,111,61,219,174,1,0           // movdqa        0x1aedb(%rip),%xmm7        # 3ba60 <_sk_srcover_bgra_8888_sse2_lowp+0x1194>
+  .byte  102,15,111,61,42,173,1,0            // movdqa        0x1ad2a(%rip),%xmm7        # 3b2a0 <_sk_srcover_bgra_8888_sse2_lowp+0x11a4>
   .byte  102,15,114,245,16                   // pslld         $0x10,%xmm5
   .byte  102,15,111,230                      // movdqa        %xmm6,%xmm4
   .byte  102,15,56,63,231                    // pmaxud        %xmm7,%xmm4
   .byte  102,15,118,230                      // pcmpeqd       %xmm6,%xmm4
   .byte  102,15,114,246,13                   // pslld         $0xd,%xmm6
   .byte  102,15,235,245                      // por           %xmm5,%xmm6
-  .byte  102,68,15,111,29,199,174,1,0        // movdqa        0x1aec7(%rip),%xmm11        # 3ba70 <_sk_srcover_bgra_8888_sse2_lowp+0x11a4>
+  .byte  102,68,15,111,29,22,173,1,0         // movdqa        0x1ad16(%rip),%xmm11        # 3b2b0 <_sk_srcover_bgra_8888_sse2_lowp+0x11b4>
   .byte  102,65,15,254,243                   // paddd         %xmm11,%xmm6
   .byte  102,15,219,230                      // pand          %xmm6,%xmm4
   .byte  102,65,15,112,236,238               // pshufd        $0xee,%xmm12,%xmm5
@@ -31657,18 +31367,18 @@
   .byte  102,65,15,219,249                   // pand          %xmm9,%xmm7
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  242,65,15,16,36,192                 // movsd         (%r8,%rax,8),%xmm4
+  .byte  242,65,15,16,36,208                 // movsd         (%r8,%rdx,8),%xmm4
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,13                              // jne           20c8a <_sk_load_f16_dst_sse41+0x17d>
+  .byte  117,13                              // jne           2067b <_sk_load_f16_dst_sse41+0x177>
   .byte  243,15,126,228                      // movq          %xmm4,%xmm4
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
-  .byte  233,176,254,255,255                 // jmpq          20b3a <_sk_load_f16_dst_sse41+0x2d>
-  .byte  102,65,15,22,100,192,8              // movhpd        0x8(%r8,%rax,8),%xmm4
+  .byte  233,176,254,255,255                 // jmpq          2052b <_sk_load_f16_dst_sse41+0x27>
+  .byte  102,65,15,22,100,208,8              // movhpd        0x8(%r8,%rdx,8),%xmm4
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  15,130,155,254,255,255              // jb            20b3a <_sk_load_f16_dst_sse41+0x2d>
-  .byte  243,65,15,126,108,192,16            // movq          0x10(%r8,%rax,8),%xmm5
-  .byte  233,143,254,255,255                 // jmpq          20b3a <_sk_load_f16_dst_sse41+0x2d>
+  .byte  15,130,155,254,255,255              // jb            2052b <_sk_load_f16_dst_sse41+0x27>
+  .byte  243,65,15,126,108,208,16            // movq          0x10(%r8,%rdx,8),%xmm5
+  .byte  233,143,254,255,255                 // jmpq          2052b <_sk_load_f16_dst_sse41+0x27>
 
 HIDDEN _sk_gather_f16_sse41
 .globl _sk_gather_f16_sse41
@@ -31714,19 +31424,19 @@
   .byte  102,68,15,97,226                    // punpcklwd     %xmm2,%xmm12
   .byte  102,68,15,105,202                   // punpckhwd     %xmm2,%xmm9
   .byte  102,65,15,56,51,212                 // pmovzxwd      %xmm12,%xmm2
-  .byte  102,68,15,111,5,216,172,1,0         // movdqa        0x1acd8(%rip),%xmm8        # 3ba40 <_sk_srcover_bgra_8888_sse2_lowp+0x1174>
+  .byte  102,68,15,111,5,39,171,1,0          // movdqa        0x1ab27(%rip),%xmm8        # 3b280 <_sk_srcover_bgra_8888_sse2_lowp+0x1184>
   .byte  102,15,111,202                      // movdqa        %xmm2,%xmm1
   .byte  102,65,15,219,200                   // pand          %xmm8,%xmm1
-  .byte  102,68,15,111,21,214,172,1,0        // movdqa        0x1acd6(%rip),%xmm10        # 3ba50 <_sk_srcover_bgra_8888_sse2_lowp+0x1184>
+  .byte  102,68,15,111,21,37,171,1,0         // movdqa        0x1ab25(%rip),%xmm10        # 3b290 <_sk_srcover_bgra_8888_sse2_lowp+0x1194>
   .byte  102,65,15,219,210                   // pand          %xmm10,%xmm2
-  .byte  102,15,111,29,217,172,1,0           // movdqa        0x1acd9(%rip),%xmm3        # 3ba60 <_sk_srcover_bgra_8888_sse2_lowp+0x1194>
+  .byte  102,15,111,29,40,171,1,0            // movdqa        0x1ab28(%rip),%xmm3        # 3b2a0 <_sk_srcover_bgra_8888_sse2_lowp+0x11a4>
   .byte  102,15,114,241,16                   // pslld         $0x10,%xmm1
   .byte  102,15,111,194                      // movdqa        %xmm2,%xmm0
   .byte  102,15,56,63,195                    // pmaxud        %xmm3,%xmm0
   .byte  102,15,118,194                      // pcmpeqd       %xmm2,%xmm0
   .byte  102,15,114,242,13                   // pslld         $0xd,%xmm2
   .byte  102,15,235,209                      // por           %xmm1,%xmm2
-  .byte  102,68,15,111,29,197,172,1,0        // movdqa        0x1acc5(%rip),%xmm11        # 3ba70 <_sk_srcover_bgra_8888_sse2_lowp+0x11a4>
+  .byte  102,68,15,111,29,20,171,1,0         // movdqa        0x1ab14(%rip),%xmm11        # 3b2b0 <_sk_srcover_bgra_8888_sse2_lowp+0x11b4>
   .byte  102,65,15,254,211                   // paddd         %xmm11,%xmm2
   .byte  102,15,219,194                      // pand          %xmm2,%xmm0
   .byte  102,65,15,112,204,238               // pshufd        $0xee,%xmm12,%xmm1
@@ -31773,26 +31483,24 @@
 FUNCTION(_sk_store_f16_sse41)
 _sk_store_f16_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,3                        // shl           $0x3,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
-  .byte  102,68,15,111,13,237,171,1,0        // movdqa        0x1abed(%rip),%xmm9        # 3ba80 <_sk_srcover_bgra_8888_sse2_lowp+0x11b4>
+  .byte  102,68,15,111,13,66,170,1,0         // movdqa        0x1aa42(%rip),%xmm9        # 3b2c0 <_sk_srcover_bgra_8888_sse2_lowp+0x11c4>
   .byte  102,68,15,111,224                   // movdqa        %xmm0,%xmm12
   .byte  102,69,15,219,225                   // pand          %xmm9,%xmm12
-  .byte  102,68,15,111,29,234,171,1,0        // movdqa        0x1abea(%rip),%xmm11        # 3ba90 <_sk_srcover_bgra_8888_sse2_lowp+0x11c4>
+  .byte  102,68,15,111,29,63,170,1,0         // movdqa        0x1aa3f(%rip),%xmm11        # 3b2d0 <_sk_srcover_bgra_8888_sse2_lowp+0x11d4>
   .byte  102,68,15,111,232                   // movdqa        %xmm0,%xmm13
   .byte  102,69,15,219,235                   // pand          %xmm11,%xmm13
-  .byte  102,68,15,111,21,231,171,1,0        // movdqa        0x1abe7(%rip),%xmm10        # 3baa0 <_sk_srcover_bgra_8888_sse2_lowp+0x11d4>
+  .byte  102,68,15,111,21,60,170,1,0         // movdqa        0x1aa3c(%rip),%xmm10        # 3b2e0 <_sk_srcover_bgra_8888_sse2_lowp+0x11e4>
   .byte  102,65,15,114,212,16                // psrld         $0x10,%xmm12
   .byte  102,69,15,111,197                   // movdqa        %xmm13,%xmm8
   .byte  102,69,15,56,63,194                 // pmaxud        %xmm10,%xmm8
   .byte  102,69,15,118,197                   // pcmpeqd       %xmm13,%xmm8
   .byte  102,65,15,114,213,13                // psrld         $0xd,%xmm13
   .byte  102,69,15,254,236                   // paddd         %xmm12,%xmm13
-  .byte  102,68,15,111,37,205,171,1,0        // movdqa        0x1abcd(%rip),%xmm12        # 3bab0 <_sk_srcover_bgra_8888_sse2_lowp+0x11e4>
+  .byte  102,68,15,111,37,34,170,1,0         // movdqa        0x1aa22(%rip),%xmm12        # 3b2f0 <_sk_srcover_bgra_8888_sse2_lowp+0x11f4>
   .byte  102,69,15,254,236                   // paddd         %xmm12,%xmm13
   .byte  102,69,15,219,197                   // pand          %xmm13,%xmm8
   .byte  102,68,15,56,43,192                 // packusdw      %xmm0,%xmm8
@@ -31837,38 +31545,36 @@
   .byte  102,69,15,111,200                   // movdqa        %xmm8,%xmm9
   .byte  102,69,15,98,205                    // punpckldq     %xmm13,%xmm9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,21                              // jne           20fe1 <_sk_store_f16_sse41+0x16e>
-  .byte  69,15,17,12,192                     // movups        %xmm9,(%r8,%rax,8)
+  .byte  117,21                              // jne           209cc <_sk_store_f16_sse41+0x168>
+  .byte  69,15,17,12,208                     // movups        %xmm9,(%r8,%rdx,8)
   .byte  102,69,15,106,197                   // punpckhdq     %xmm13,%xmm8
-  .byte  243,69,15,127,68,192,16             // movdqu        %xmm8,0x10(%r8,%rax,8)
+  .byte  243,69,15,127,68,208,16             // movdqu        %xmm8,0x10(%r8,%rdx,8)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  102,69,15,214,12,192                // movq          %xmm9,(%r8,%rax,8)
+  .byte  102,69,15,214,12,208                // movq          %xmm9,(%r8,%rdx,8)
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,240                             // je            20fdd <_sk_store_f16_sse41+0x16a>
-  .byte  102,69,15,23,76,192,8               // movhpd        %xmm9,0x8(%r8,%rax,8)
+  .byte  116,240                             // je            209c8 <_sk_store_f16_sse41+0x164>
+  .byte  102,69,15,23,76,208,8               // movhpd        %xmm9,0x8(%r8,%rdx,8)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,227                             // jb            20fdd <_sk_store_f16_sse41+0x16a>
+  .byte  114,227                             // jb            209c8 <_sk_store_f16_sse41+0x164>
   .byte  102,69,15,106,197                   // punpckhdq     %xmm13,%xmm8
-  .byte  102,69,15,214,68,192,16             // movq          %xmm8,0x10(%r8,%rax,8)
-  .byte  235,213                             // jmp           20fdd <_sk_store_f16_sse41+0x16a>
+  .byte  102,69,15,214,68,208,16             // movq          %xmm8,0x10(%r8,%rdx,8)
+  .byte  235,213                             // jmp           209c8 <_sk_store_f16_sse41+0x164>
 
 HIDDEN _sk_load_u16_be_sse41
 .globl _sk_load_u16_be_sse41
 FUNCTION(_sk_load_u16_be_sse41)
 _sk_load_u16_be_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
-  .byte  77,1,192                            // add           %r8,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  73,99,193                           // movslq        %r9d,%rax
+  .byte  76,141,4,149,0,0,0,0                // lea           0x0(,%rdx,4),%r8
+  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  77,1,201                            // add           %r9,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,185,0,0,0                    // jne           210e8 <_sk_load_u16_be_sse41+0xe0>
-  .byte  102,65,15,16,4,64                   // movupd        (%r8,%rax,2),%xmm0
-  .byte  243,65,15,111,76,64,16              // movdqu        0x10(%r8,%rax,2),%xmm1
+  .byte  15,133,185,0,0,0                    // jne           20acd <_sk_load_u16_be_sse41+0xda>
+  .byte  102,67,15,16,4,65                   // movupd        (%r9,%r8,2),%xmm0
+  .byte  243,67,15,111,76,65,16              // movdqu        0x10(%r9,%r8,2),%xmm1
   .byte  102,15,40,208                       // movapd        %xmm0,%xmm2
   .byte  102,15,97,209                       // punpcklwd     %xmm1,%xmm2
   .byte  102,15,105,193                      // punpckhwd     %xmm1,%xmm0
@@ -31882,7 +31588,7 @@
   .byte  102,15,235,200                      // por           %xmm0,%xmm1
   .byte  102,15,56,51,193                    // pmovzxwd      %xmm1,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  68,15,40,5,149,167,1,0              // movaps        0x1a795(%rip),%xmm8        # 3b810 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
+  .byte  68,15,40,5,240,165,1,0              // movaps        0x1a5f0(%rip),%xmm8        # 3b050 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  102,15,111,203                      // movdqa        %xmm3,%xmm1
   .byte  102,15,113,241,8                    // psllw         $0x8,%xmm1
@@ -31908,37 +31614,33 @@
   .byte  65,15,89,216                        // mulps         %xmm8,%xmm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  242,65,15,16,4,64                   // movsd         (%r8,%rax,2),%xmm0
+  .byte  242,67,15,16,4,65                   // movsd         (%r9,%r8,2),%xmm0
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,13                              // jne           21101 <_sk_load_u16_be_sse41+0xf9>
+  .byte  117,13                              // jne           20ae6 <_sk_load_u16_be_sse41+0xf3>
   .byte  243,15,126,192                      // movq          %xmm0,%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  233,59,255,255,255                  // jmpq          2103c <_sk_load_u16_be_sse41+0x34>
-  .byte  102,65,15,22,68,64,8                // movhpd        0x8(%r8,%rax,2),%xmm0
+  .byte  233,59,255,255,255                  // jmpq          20a21 <_sk_load_u16_be_sse41+0x2e>
+  .byte  102,67,15,22,68,65,8                // movhpd        0x8(%r9,%r8,2),%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  15,130,38,255,255,255               // jb            2103c <_sk_load_u16_be_sse41+0x34>
-  .byte  243,65,15,126,76,64,16              // movq          0x10(%r8,%rax,2),%xmm1
-  .byte  233,26,255,255,255                  // jmpq          2103c <_sk_load_u16_be_sse41+0x34>
+  .byte  15,130,38,255,255,255               // jb            20a21 <_sk_load_u16_be_sse41+0x2e>
+  .byte  243,67,15,126,76,65,16              // movq          0x10(%r9,%r8,2),%xmm1
+  .byte  233,26,255,255,255                  // jmpq          20a21 <_sk_load_u16_be_sse41+0x2e>
 
 HIDDEN _sk_load_rgb_u16_be_sse41
 .globl _sk_load_rgb_u16_be_sse41
 FUNCTION(_sk_load_rgb_u16_be_sse41)
 _sk_load_rgb_u16_be_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  76,141,4,82                         // lea           (%rdx,%rdx,2),%r8
   .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
-  .byte  77,1,192                            // add           %r8,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,137,208                          // mov           %rdx,%rax
-  .byte  72,193,224,32                       // shl           $0x20,%rax
-  .byte  72,141,4,64                         // lea           (%rax,%rax,2),%rax
-  .byte  72,193,248,32                       // sar           $0x20,%rax
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  77,1,201                            // add           %r9,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,170,0,0,0                    // jne           211f7 <_sk_load_rgb_u16_be_sse41+0xd5>
-  .byte  243,65,15,111,20,64                 // movdqu        (%r8,%rax,2),%xmm2
-  .byte  243,65,15,111,92,64,8               // movdqu        0x8(%r8,%rax,2),%xmm3
+  .byte  15,133,170,0,0,0                    // jne           20bce <_sk_load_rgb_u16_be_sse41+0xc7>
+  .byte  243,67,15,111,20,65                 // movdqu        (%r9,%r8,2),%xmm2
+  .byte  243,67,15,111,92,65,8               // movdqu        0x8(%r9,%r8,2),%xmm3
   .byte  102,15,115,219,4                    // psrldq        $0x4,%xmm3
   .byte  102,15,111,194                      // movdqa        %xmm2,%xmm0
   .byte  102,15,115,216,6                    // psrldq        $0x6,%xmm0
@@ -31956,7 +31658,7 @@
   .byte  102,15,235,200                      // por           %xmm0,%xmm1
   .byte  102,15,56,51,193                    // pmovzxwd      %xmm1,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  68,15,40,5,100,166,1,0              // movaps        0x1a664(%rip),%xmm8        # 3b810 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
+  .byte  68,15,40,5,205,164,1,0              // movaps        0x1a4cd(%rip),%xmm8        # 3b050 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  102,15,111,203                      // movdqa        %xmm3,%xmm1
   .byte  102,15,113,241,8                    // psllw         $0x8,%xmm1
@@ -31973,46 +31675,44 @@
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
   .byte  65,15,89,208                        // mulps         %xmm8,%xmm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,123,163,1,0                // movaps        0x1a37b(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,29,228,161,1,0                // movaps        0x1a1e4(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  255,224                             // jmpq          *%rax
-  .byte  102,65,15,110,20,64                 // movd          (%r8,%rax,2),%xmm2
+  .byte  102,67,15,110,20,65                 // movd          (%r9,%r8,2),%xmm2
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  102,65,15,196,84,64,4,2             // pinsrw        $0x2,0x4(%r8,%rax,2),%xmm2
+  .byte  102,67,15,196,84,65,4,2             // pinsrw        $0x2,0x4(%r9,%r8,2),%xmm2
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,13                              // jne           2121c <_sk_load_rgb_u16_be_sse41+0xfa>
+  .byte  117,13                              // jne           20bf3 <_sk_load_rgb_u16_be_sse41+0xec>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
-  .byte  233,85,255,255,255                  // jmpq          21171 <_sk_load_rgb_u16_be_sse41+0x4f>
-  .byte  102,65,15,110,68,64,6               // movd          0x6(%r8,%rax,2),%xmm0
+  .byte  233,85,255,255,255                  // jmpq          20b48 <_sk_load_rgb_u16_be_sse41+0x41>
+  .byte  102,67,15,110,68,65,6               // movd          0x6(%r9,%r8,2),%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  102,65,15,196,68,64,10,2            // pinsrw        $0x2,0xa(%r8,%rax,2),%xmm0
+  .byte  102,67,15,196,68,65,10,2            // pinsrw        $0x2,0xa(%r9,%r8,2),%xmm0
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,24                              // jb            2124d <_sk_load_rgb_u16_be_sse41+0x12b>
-  .byte  102,65,15,110,92,64,12              // movd          0xc(%r8,%rax,2),%xmm3
+  .byte  114,24                              // jb            20c24 <_sk_load_rgb_u16_be_sse41+0x11d>
+  .byte  102,67,15,110,92,65,12              // movd          0xc(%r9,%r8,2),%xmm3
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  102,65,15,196,92,64,16,2            // pinsrw        $0x2,0x10(%r8,%rax,2),%xmm3
-  .byte  233,36,255,255,255                  // jmpq          21171 <_sk_load_rgb_u16_be_sse41+0x4f>
+  .byte  102,67,15,196,92,65,16,2            // pinsrw        $0x2,0x10(%r9,%r8,2),%xmm3
+  .byte  233,36,255,255,255                  // jmpq          20b48 <_sk_load_rgb_u16_be_sse41+0x41>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
-  .byte  233,27,255,255,255                  // jmpq          21171 <_sk_load_rgb_u16_be_sse41+0x4f>
+  .byte  233,27,255,255,255                  // jmpq          20b48 <_sk_load_rgb_u16_be_sse41+0x41>
 
 HIDDEN _sk_store_u16_be_sse41
 .globl _sk_store_u16_be_sse41
 FUNCTION(_sk_store_u16_be_sse41)
 _sk_store_u16_be_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
-  .byte  77,1,192                            // add           %r8,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  73,99,193                           // movslq        %r9d,%rax
+  .byte  76,141,4,149,0,0,0,0                // lea           0x0(,%rdx,4),%r8
+  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  77,1,201                            // add           %r9,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  68,15,95,192                        // maxps         %xmm0,%xmm8
-  .byte  68,15,40,21,232,162,1,0             // movaps        0x1a2e8(%rip),%xmm10        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,21,87,161,1,0              // movaps        0x1a157(%rip),%xmm10        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,93,194                        // minps         %xmm10,%xmm8
-  .byte  68,15,40,29,44,168,1,0              // movaps        0x1a82c(%rip),%xmm11        # 3bac0 <_sk_srcover_bgra_8888_sse2_lowp+0x11f4>
+  .byte  68,15,40,29,155,166,1,0             // movaps        0x1a69b(%rip),%xmm11        # 3b300 <_sk_srcover_bgra_8888_sse2_lowp+0x1204>
   .byte  69,15,89,195                        // mulps         %xmm11,%xmm8
   .byte  102,69,15,91,192                    // cvtps2dq      %xmm8,%xmm8
   .byte  102,68,15,56,43,192                 // packusdw      %xmm0,%xmm8
@@ -32054,40 +31754,40 @@
   .byte  102,69,15,111,200                   // movdqa        %xmm8,%xmm9
   .byte  102,69,15,98,204                    // punpckldq     %xmm12,%xmm9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,21                              // jne           21378 <_sk_store_u16_be_sse41+0x122>
-  .byte  69,15,17,12,64                      // movups        %xmm9,(%r8,%rax,2)
+  .byte  117,21                              // jne           20d49 <_sk_store_u16_be_sse41+0x11c>
+  .byte  71,15,17,12,65                      // movups        %xmm9,(%r9,%r8,2)
   .byte  102,69,15,106,196                   // punpckhdq     %xmm12,%xmm8
-  .byte  243,69,15,127,68,64,16              // movdqu        %xmm8,0x10(%r8,%rax,2)
+  .byte  243,71,15,127,68,65,16              // movdqu        %xmm8,0x10(%r9,%r8,2)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  102,69,15,214,12,64                 // movq          %xmm9,(%r8,%rax,2)
+  .byte  102,71,15,214,12,65                 // movq          %xmm9,(%r9,%r8,2)
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,240                             // je            21374 <_sk_store_u16_be_sse41+0x11e>
-  .byte  102,69,15,23,76,64,8                // movhpd        %xmm9,0x8(%r8,%rax,2)
+  .byte  116,240                             // je            20d45 <_sk_store_u16_be_sse41+0x118>
+  .byte  102,71,15,23,76,65,8                // movhpd        %xmm9,0x8(%r9,%r8,2)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,227                             // jb            21374 <_sk_store_u16_be_sse41+0x11e>
+  .byte  114,227                             // jb            20d45 <_sk_store_u16_be_sse41+0x118>
   .byte  102,69,15,106,196                   // punpckhdq     %xmm12,%xmm8
-  .byte  102,69,15,214,68,64,16              // movq          %xmm8,0x10(%r8,%rax,2)
-  .byte  235,213                             // jmp           21374 <_sk_store_u16_be_sse41+0x11e>
+  .byte  102,71,15,214,68,65,16              // movq          %xmm8,0x10(%r9,%r8,2)
+  .byte  235,213                             // jmp           20d45 <_sk_store_u16_be_sse41+0x118>
 
 HIDDEN _sk_load_f32_sse41
 .globl _sk_load_f32_sse41
 FUNCTION(_sk_load_f32_sse41)
 _sk_load_f32_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
-  .byte  73,193,224,2                        // shl           $0x2,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  73,99,193                           // movslq        %r9d,%rax
-  .byte  69,15,16,4,128                      // movups        (%r8,%rax,4),%xmm8
+  .byte  76,141,4,149,0,0,0,0                // lea           0x0(,%rdx,4),%r8
+  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  73,193,225,2                        // shl           $0x2,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
+  .byte  72,137,208                          // mov           %rdx,%rax
+  .byte  72,193,224,4                        // shl           $0x4,%rax
+  .byte  70,15,16,4,8                        // movups        (%rax,%r9,1),%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,66                              // jne           2140a <_sk_load_f32_sse41+0x6b>
-  .byte  65,15,16,68,128,16                  // movups        0x10(%r8,%rax,4),%xmm0
-  .byte  65,15,16,92,128,32                  // movups        0x20(%r8,%rax,4),%xmm3
-  .byte  69,15,16,76,128,48                  // movups        0x30(%r8,%rax,4),%xmm9
+  .byte  117,66                              // jne           20ddc <_sk_load_f32_sse41+0x6c>
+  .byte  67,15,16,68,129,16                  // movups        0x10(%r9,%r8,4),%xmm0
+  .byte  67,15,16,92,129,32                  // movups        0x20(%r9,%r8,4),%xmm3
+  .byte  71,15,16,76,129,48                  // movups        0x30(%r9,%r8,4),%xmm9
   .byte  65,15,40,208                        // movaps        %xmm8,%xmm2
   .byte  15,20,208                           // unpcklps      %xmm0,%xmm2
   .byte  15,40,203                           // movaps        %xmm3,%xmm1
@@ -32104,36 +31804,36 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,8                               // jne           2141c <_sk_load_f32_sse41+0x7d>
+  .byte  117,8                               // jne           20dee <_sk_load_f32_sse41+0x7e>
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
-  .byte  235,190                             // jmp           213da <_sk_load_f32_sse41+0x3b>
-  .byte  65,15,16,68,128,16                  // movups        0x10(%r8,%rax,4),%xmm0
+  .byte  235,190                             // jmp           20dac <_sk_load_f32_sse41+0x3c>
+  .byte  67,15,16,68,129,16                  // movups        0x10(%r9,%r8,4),%xmm0
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,8                               // jb            21430 <_sk_load_f32_sse41+0x91>
-  .byte  65,15,16,92,128,32                  // movups        0x20(%r8,%rax,4),%xmm3
-  .byte  235,170                             // jmp           213da <_sk_load_f32_sse41+0x3b>
+  .byte  114,8                               // jb            20e02 <_sk_load_f32_sse41+0x92>
+  .byte  67,15,16,92,129,32                  // movups        0x20(%r9,%r8,4),%xmm3
+  .byte  235,170                             // jmp           20dac <_sk_load_f32_sse41+0x3c>
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
-  .byte  235,165                             // jmp           213da <_sk_load_f32_sse41+0x3b>
+  .byte  235,165                             // jmp           20dac <_sk_load_f32_sse41+0x3c>
 
 HIDDEN _sk_load_f32_dst_sse41
 .globl _sk_load_f32_dst_sse41
 FUNCTION(_sk_load_f32_dst_sse41)
 _sk_load_f32_dst_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
-  .byte  73,193,224,2                        // shl           $0x2,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  73,99,193                           // movslq        %r9d,%rax
-  .byte  69,15,16,4,128                      // movups        (%r8,%rax,4),%xmm8
+  .byte  76,141,4,149,0,0,0,0                // lea           0x0(,%rdx,4),%r8
+  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  73,193,225,2                        // shl           $0x2,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
+  .byte  72,137,208                          // mov           %rdx,%rax
+  .byte  72,193,224,4                        // shl           $0x4,%rax
+  .byte  70,15,16,4,8                        // movups        (%rax,%r9,1),%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,66                              // jne           214a0 <_sk_load_f32_dst_sse41+0x6b>
-  .byte  65,15,16,100,128,16                 // movups        0x10(%r8,%rax,4),%xmm4
-  .byte  65,15,16,124,128,32                 // movups        0x20(%r8,%rax,4),%xmm7
-  .byte  69,15,16,76,128,48                  // movups        0x30(%r8,%rax,4),%xmm9
+  .byte  117,66                              // jne           20e73 <_sk_load_f32_dst_sse41+0x6c>
+  .byte  67,15,16,100,129,16                 // movups        0x10(%r9,%r8,4),%xmm4
+  .byte  67,15,16,124,129,32                 // movups        0x20(%r9,%r8,4),%xmm7
+  .byte  71,15,16,76,129,48                  // movups        0x30(%r9,%r8,4),%xmm9
   .byte  65,15,40,240                        // movaps        %xmm8,%xmm6
   .byte  15,20,244                           // unpcklps      %xmm4,%xmm6
   .byte  15,40,239                           // movaps        %xmm7,%xmm5
@@ -32150,30 +31850,30 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,8                               // jne           214b2 <_sk_load_f32_dst_sse41+0x7d>
+  .byte  117,8                               // jne           20e85 <_sk_load_f32_dst_sse41+0x7e>
   .byte  15,87,255                           // xorps         %xmm7,%xmm7
   .byte  15,87,228                           // xorps         %xmm4,%xmm4
-  .byte  235,190                             // jmp           21470 <_sk_load_f32_dst_sse41+0x3b>
-  .byte  65,15,16,100,128,16                 // movups        0x10(%r8,%rax,4),%xmm4
+  .byte  235,190                             // jmp           20e43 <_sk_load_f32_dst_sse41+0x3c>
+  .byte  67,15,16,100,129,16                 // movups        0x10(%r9,%r8,4),%xmm4
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,8                               // jb            214c6 <_sk_load_f32_dst_sse41+0x91>
-  .byte  65,15,16,124,128,32                 // movups        0x20(%r8,%rax,4),%xmm7
-  .byte  235,170                             // jmp           21470 <_sk_load_f32_dst_sse41+0x3b>
+  .byte  114,8                               // jb            20e99 <_sk_load_f32_dst_sse41+0x92>
+  .byte  67,15,16,124,129,32                 // movups        0x20(%r9,%r8,4),%xmm7
+  .byte  235,170                             // jmp           20e43 <_sk_load_f32_dst_sse41+0x3c>
   .byte  15,87,255                           // xorps         %xmm7,%xmm7
-  .byte  235,165                             // jmp           21470 <_sk_load_f32_dst_sse41+0x3b>
+  .byte  235,165                             // jmp           20e43 <_sk_load_f32_dst_sse41+0x3c>
 
 HIDDEN _sk_store_f32_sse41
 .globl _sk_store_f32_sse41
 FUNCTION(_sk_store_f32_sse41)
 _sk_store_f32_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
-  .byte  73,193,224,2                        // shl           $0x2,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  73,99,193                           // movslq        %r9d,%rax
+  .byte  76,141,4,149,0,0,0,0                // lea           0x0(,%rdx,4),%r8
+  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  73,193,225,2                        // shl           $0x2,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
+  .byte  72,137,208                          // mov           %rdx,%rax
+  .byte  72,193,224,4                        // shl           $0x4,%rax
   .byte  68,15,40,200                        // movaps        %xmm0,%xmm9
   .byte  68,15,20,201                        // unpcklps      %xmm1,%xmm9
   .byte  68,15,40,194                        // movaps        %xmm2,%xmm8
@@ -32187,22 +31887,22 @@
   .byte  69,15,18,193                        // movhlps       %xmm9,%xmm8
   .byte  69,15,40,202                        // movaps        %xmm10,%xmm9
   .byte  102,69,15,20,203                    // unpcklpd      %xmm11,%xmm9
-  .byte  102,69,15,17,36,128                 // movupd        %xmm12,(%r8,%rax,4)
+  .byte  102,70,15,17,36,8                   // movupd        %xmm12,(%rax,%r9,1)
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,29                              // jne           21548 <_sk_store_f32_sse41+0x7d>
+  .byte  117,29                              // jne           20f1c <_sk_store_f32_sse41+0x7e>
   .byte  102,69,15,21,211                    // unpckhpd      %xmm11,%xmm10
-  .byte  69,15,17,68,128,16                  // movups        %xmm8,0x10(%r8,%rax,4)
-  .byte  102,69,15,17,76,128,32              // movupd        %xmm9,0x20(%r8,%rax,4)
-  .byte  102,69,15,17,84,128,48              // movupd        %xmm10,0x30(%r8,%rax,4)
+  .byte  71,15,17,68,129,16                  // movups        %xmm8,0x10(%r9,%r8,4)
+  .byte  102,71,15,17,76,129,32              // movupd        %xmm9,0x20(%r9,%r8,4)
+  .byte  102,71,15,17,84,129,48              // movupd        %xmm10,0x30(%r9,%r8,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,246                             // je            21544 <_sk_store_f32_sse41+0x79>
-  .byte  69,15,17,68,128,16                  // movups        %xmm8,0x10(%r8,%rax,4)
+  .byte  116,246                             // je            20f18 <_sk_store_f32_sse41+0x7a>
+  .byte  71,15,17,68,129,16                  // movups        %xmm8,0x10(%r9,%r8,4)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,234                             // jb            21544 <_sk_store_f32_sse41+0x79>
-  .byte  102,69,15,17,76,128,32              // movupd        %xmm9,0x20(%r8,%rax,4)
-  .byte  235,225                             // jmp           21544 <_sk_store_f32_sse41+0x79>
+  .byte  114,234                             // jb            20f18 <_sk_store_f32_sse41+0x7a>
+  .byte  102,71,15,17,76,129,32              // movupd        %xmm9,0x20(%r9,%r8,4)
+  .byte  235,225                             // jmp           20f18 <_sk_store_f32_sse41+0x7a>
 
 HIDDEN _sk_repeat_x_sse41
 .globl _sk_repeat_x_sse41
@@ -32248,7 +31948,7 @@
   .byte  65,15,92,194                        // subps         %xmm10,%xmm0
   .byte  243,69,15,88,192                    // addss         %xmm8,%xmm8
   .byte  69,15,198,192,0                     // shufps        $0x0,%xmm8,%xmm8
-  .byte  243,68,15,89,13,140,149,1,0         // mulss         0x1958c(%rip),%xmm9        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  243,68,15,89,13,232,147,1,0         // mulss         0x193e8(%rip),%xmm9        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
   .byte  68,15,89,200                        // mulps         %xmm0,%xmm9
   .byte  102,69,15,58,8,201,1                // roundps       $0x1,%xmm9,%xmm9
@@ -32273,7 +31973,7 @@
   .byte  65,15,92,202                        // subps         %xmm10,%xmm1
   .byte  243,69,15,88,192                    // addss         %xmm8,%xmm8
   .byte  69,15,198,192,0                     // shufps        $0x0,%xmm8,%xmm8
-  .byte  243,68,15,89,13,51,149,1,0          // mulss         0x19533(%rip),%xmm9        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  243,68,15,89,13,143,147,1,0         // mulss         0x1938f(%rip),%xmm9        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
   .byte  68,15,89,201                        // mulps         %xmm1,%xmm9
   .byte  102,69,15,58,8,201,1                // roundps       $0x1,%xmm9,%xmm9
@@ -32292,7 +31992,7 @@
 _sk_clamp_x_1_sse41:
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  68,15,95,192                        // maxps         %xmm0,%xmm8
-  .byte  68,15,93,5,239,158,1,0              // minps         0x19eef(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,93,5,91,157,1,0               // minps         0x19d5b(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  255,224                             // jmpq          *%rax
@@ -32305,7 +32005,7 @@
   .byte  65,15,92,192                        // subps         %xmm8,%xmm0
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  68,15,95,192                        // maxps         %xmm0,%xmm8
-  .byte  68,15,93,5,204,158,1,0              // minps         0x19ecc(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,93,5,56,157,1,0               // minps         0x19d38(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  255,224                             // jmpq          *%rax
@@ -32314,9 +32014,9 @@
 .globl _sk_mirror_x_1_sse41
 FUNCTION(_sk_mirror_x_1_sse41)
 _sk_mirror_x_1_sse41:
-  .byte  68,15,40,5,28,159,1,0               // movaps        0x19f1c(%rip),%xmm8        # 3b5d0 <_sk_srcover_bgra_8888_sse2_lowp+0xd04>
+  .byte  68,15,40,5,136,157,1,0              // movaps        0x19d88(%rip),%xmm8        # 3ae10 <_sk_srcover_bgra_8888_sse2_lowp+0xd14>
   .byte  65,15,88,192                        // addps         %xmm8,%xmm0
-  .byte  68,15,40,13,160,158,1,0             // movaps        0x19ea0(%rip),%xmm9        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  68,15,40,13,12,157,1,0              // movaps        0x19d0c(%rip),%xmm9        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  68,15,89,200                        // mulps         %xmm0,%xmm9
   .byte  102,69,15,58,8,201,1                // roundps       $0x1,%xmm9,%xmm9
   .byte  69,15,88,201                        // addps         %xmm9,%xmm9
@@ -32327,7 +32027,7 @@
   .byte  68,15,92,200                        // subps         %xmm0,%xmm9
   .byte  68,15,84,200                        // andps         %xmm0,%xmm9
   .byte  69,15,95,193                        // maxps         %xmm9,%xmm8
-  .byte  68,15,93,5,125,158,1,0              // minps         0x19e7d(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,93,5,233,156,1,0              // minps         0x19ce9(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  255,224                             // jmpq          *%rax
@@ -32337,10 +32037,10 @@
 FUNCTION(_sk_luminance_to_alpha_sse41)
 _sk_luminance_to_alpha_sse41:
   .byte  15,40,218                           // movaps        %xmm2,%xmm3
-  .byte  15,89,5,203,163,1,0                 // mulps         0x1a3cb(%rip),%xmm0        # 3bad0 <_sk_srcover_bgra_8888_sse2_lowp+0x1204>
-  .byte  15,89,13,212,163,1,0                // mulps         0x1a3d4(%rip),%xmm1        # 3bae0 <_sk_srcover_bgra_8888_sse2_lowp+0x1214>
+  .byte  15,89,5,55,162,1,0                  // mulps         0x1a237(%rip),%xmm0        # 3b310 <_sk_srcover_bgra_8888_sse2_lowp+0x1214>
+  .byte  15,89,13,64,162,1,0                 // mulps         0x1a240(%rip),%xmm1        # 3b320 <_sk_srcover_bgra_8888_sse2_lowp+0x1224>
   .byte  15,88,200                           // addps         %xmm0,%xmm1
-  .byte  15,89,29,218,163,1,0                // mulps         0x1a3da(%rip),%xmm3        # 3baf0 <_sk_srcover_bgra_8888_sse2_lowp+0x1224>
+  .byte  15,89,29,70,162,1,0                 // mulps         0x1a246(%rip),%xmm3        # 3b330 <_sk_srcover_bgra_8888_sse2_lowp+0x1234>
   .byte  15,88,217                           // addps         %xmm1,%xmm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
@@ -32652,9 +32352,9 @@
   .byte  72,139,24                           // mov           (%rax),%rbx
   .byte  76,139,112,8                        // mov           0x8(%rax),%r14
   .byte  72,255,203                          // dec           %rbx
-  .byte  120,7                               // js            21bb6 <_sk_evenly_spaced_gradient_sse41+0x18>
+  .byte  120,7                               // js            2158a <_sk_evenly_spaced_gradient_sse41+0x18>
   .byte  243,72,15,42,203                    // cvtsi2ss      %rbx,%xmm1
-  .byte  235,21                              // jmp           21bcb <_sk_evenly_spaced_gradient_sse41+0x2d>
+  .byte  235,21                              // jmp           2159f <_sk_evenly_spaced_gradient_sse41+0x2d>
   .byte  73,137,216                          // mov           %rbx,%r8
   .byte  73,209,232                          // shr           %r8
   .byte  131,227,1                           // and           $0x1,%ebx
@@ -32747,7 +32447,7 @@
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  73,131,248,2                        // cmp           $0x2,%r8
-  .byte  114,41                              // jb            21da8 <_sk_gradient_sse41+0x38>
+  .byte  114,41                              // jb            2177c <_sk_gradient_sse41+0x38>
   .byte  76,139,72,72                        // mov           0x48(%rax),%r9
   .byte  73,255,200                          // dec           %r8
   .byte  73,131,193,4                        // add           $0x4,%r9
@@ -32758,7 +32458,7 @@
   .byte  102,15,250,202                      // psubd         %xmm2,%xmm1
   .byte  73,131,193,4                        // add           $0x4,%r9
   .byte  73,255,200                          // dec           %r8
-  .byte  117,230                             // jne           21d8e <_sk_gradient_sse41+0x1e>
+  .byte  117,230                             // jne           21762 <_sk_gradient_sse41+0x1e>
   .byte  65,86                               // push          %r14
   .byte  83                                  // push          %rbx
   .byte  102,73,15,58,22,200,1               // pextrq        $0x1,%xmm1,%r8
@@ -32889,26 +32589,26 @@
   .byte  69,15,94,226                        // divps         %xmm10,%xmm12
   .byte  69,15,40,236                        // movaps        %xmm12,%xmm13
   .byte  69,15,89,237                        // mulps         %xmm13,%xmm13
-  .byte  68,15,40,21,4,155,1,0               // movaps        0x19b04(%rip),%xmm10        # 3bb00 <_sk_srcover_bgra_8888_sse2_lowp+0x1234>
+  .byte  68,15,40,21,112,153,1,0             // movaps        0x19970(%rip),%xmm10        # 3b340 <_sk_srcover_bgra_8888_sse2_lowp+0x1244>
   .byte  69,15,89,213                        // mulps         %xmm13,%xmm10
-  .byte  68,15,88,21,8,155,1,0               // addps         0x19b08(%rip),%xmm10        # 3bb10 <_sk_srcover_bgra_8888_sse2_lowp+0x1244>
+  .byte  68,15,88,21,116,153,1,0             // addps         0x19974(%rip),%xmm10        # 3b350 <_sk_srcover_bgra_8888_sse2_lowp+0x1254>
   .byte  69,15,89,213                        // mulps         %xmm13,%xmm10
-  .byte  68,15,88,21,12,155,1,0              // addps         0x19b0c(%rip),%xmm10        # 3bb20 <_sk_srcover_bgra_8888_sse2_lowp+0x1254>
+  .byte  68,15,88,21,120,153,1,0             // addps         0x19978(%rip),%xmm10        # 3b360 <_sk_srcover_bgra_8888_sse2_lowp+0x1264>
   .byte  69,15,89,213                        // mulps         %xmm13,%xmm10
-  .byte  68,15,88,21,16,155,1,0              // addps         0x19b10(%rip),%xmm10        # 3bb30 <_sk_srcover_bgra_8888_sse2_lowp+0x1264>
+  .byte  68,15,88,21,124,153,1,0             // addps         0x1997c(%rip),%xmm10        # 3b370 <_sk_srcover_bgra_8888_sse2_lowp+0x1274>
   .byte  69,15,89,212                        // mulps         %xmm12,%xmm10
   .byte  65,15,194,195,1                     // cmpltps       %xmm11,%xmm0
-  .byte  68,15,40,29,15,155,1,0              // movaps        0x19b0f(%rip),%xmm11        # 3bb40 <_sk_srcover_bgra_8888_sse2_lowp+0x1274>
+  .byte  68,15,40,29,123,153,1,0             // movaps        0x1997b(%rip),%xmm11        # 3b380 <_sk_srcover_bgra_8888_sse2_lowp+0x1284>
   .byte  69,15,92,218                        // subps         %xmm10,%xmm11
   .byte  102,69,15,56,20,211                 // blendvps      %xmm0,%xmm11,%xmm10
   .byte  69,15,194,200,1                     // cmpltps       %xmm8,%xmm9
-  .byte  68,15,40,29,24,149,1,0              // movaps        0x19518(%rip),%xmm11        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  68,15,40,29,132,147,1,0             // movaps        0x19384(%rip),%xmm11        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  69,15,92,218                        // subps         %xmm10,%xmm11
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
   .byte  102,69,15,56,20,211                 // blendvps      %xmm0,%xmm11,%xmm10
   .byte  15,40,193                           // movaps        %xmm1,%xmm0
   .byte  65,15,194,192,1                     // cmpltps       %xmm8,%xmm0
-  .byte  68,15,40,13,10,149,1,0              // movaps        0x1950a(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,13,118,147,1,0             // movaps        0x19376(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,92,202                        // subps         %xmm10,%xmm9
   .byte  102,69,15,56,20,209                 // blendvps      %xmm0,%xmm9,%xmm10
   .byte  69,15,194,194,7                     // cmpordps      %xmm10,%xmm8
@@ -32933,7 +32633,7 @@
 .globl _sk_negate_x_sse41
 FUNCTION(_sk_negate_x_sse41)
 _sk_negate_x_sse41:
-  .byte  15,87,5,225,153,1,0                 // xorps         0x199e1(%rip),%xmm0        # 3ba80 <_sk_srcover_bgra_8888_sse2_lowp+0x11b4>
+  .byte  15,87,5,77,152,1,0                  // xorps         0x1984d(%rip),%xmm0        # 3b2c0 <_sk_srcover_bgra_8888_sse2_lowp+0x11c4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -33010,7 +32710,7 @@
   .byte  69,15,89,201                        // mulps         %xmm9,%xmm9
   .byte  65,15,92,193                        // subps         %xmm9,%xmm0
   .byte  15,81,192                           // sqrtps        %xmm0,%xmm0
-  .byte  15,87,5,35,153,1,0                  // xorps         0x19923(%rip),%xmm0        # 3ba80 <_sk_srcover_bgra_8888_sse2_lowp+0x11b4>
+  .byte  15,87,5,143,151,1,0                 // xorps         0x1978f(%rip),%xmm0        # 3b2c0 <_sk_srcover_bgra_8888_sse2_lowp+0x11c4>
   .byte  65,15,92,192                        // subps         %xmm8,%xmm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -33030,7 +32730,7 @@
 .globl _sk_alter_2pt_conical_unswap_sse41
 FUNCTION(_sk_alter_2pt_conical_unswap_sse41)
 _sk_alter_2pt_conical_unswap_sse41:
-  .byte  68,15,40,5,238,147,1,0              // movaps        0x193ee(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,90,146,1,0               // movaps        0x1925a(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,92,192                        // subps         %xmm0,%xmm8
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
@@ -33079,7 +32779,7 @@
 FUNCTION(_sk_save_xy_sse41)
 _sk_save_xy_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,15,40,5,124,147,1,0              // movaps        0x1937c(%rip),%xmm8        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  68,15,40,5,232,145,1,0              // movaps        0x191e8(%rip),%xmm8        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  15,17,0                             // movups        %xmm0,(%rax)
   .byte  68,15,40,200                        // movaps        %xmm0,%xmm9
   .byte  69,15,88,200                        // addps         %xmm8,%xmm9
@@ -33123,8 +32823,8 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,128,128,0,0,0              // movups        0x80(%rax),%xmm8
-  .byte  15,88,5,213,152,1,0                 // addps         0x198d5(%rip),%xmm0        # 3bb50 <_sk_srcover_bgra_8888_sse2_lowp+0x1284>
-  .byte  68,15,40,13,237,146,1,0             // movaps        0x192ed(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,88,5,65,151,1,0                  // addps         0x19741(%rip),%xmm0        # 3b390 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
+  .byte  68,15,40,13,89,145,1,0              // movaps        0x19159(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
   .byte  68,15,17,136,0,1,0,0                // movups        %xmm9,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -33137,7 +32837,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,128,128,0,0,0              // movups        0x80(%rax),%xmm8
-  .byte  15,88,5,185,146,1,0                 // addps         0x192b9(%rip),%xmm0        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  15,88,5,37,145,1,0                  // addps         0x19125(%rip),%xmm0        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  68,15,17,128,0,1,0,0                // movups        %xmm8,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -33149,8 +32849,8 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,72,64                         // movups        0x40(%rax),%xmm1
   .byte  68,15,16,128,192,0,0,0              // movups        0xc0(%rax),%xmm8
-  .byte  15,88,13,136,152,1,0                // addps         0x19888(%rip),%xmm1        # 3bb50 <_sk_srcover_bgra_8888_sse2_lowp+0x1284>
-  .byte  68,15,40,13,160,146,1,0             // movaps        0x192a0(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,88,13,244,150,1,0                // addps         0x196f4(%rip),%xmm1        # 3b390 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
+  .byte  68,15,40,13,12,145,1,0              // movaps        0x1910c(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
   .byte  68,15,17,136,64,1,0,0               // movups        %xmm9,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -33163,7 +32863,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,72,64                         // movups        0x40(%rax),%xmm1
   .byte  68,15,16,128,192,0,0,0              // movups        0xc0(%rax),%xmm8
-  .byte  15,88,13,107,146,1,0                // addps         0x1926b(%rip),%xmm1        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  15,88,13,215,144,1,0                // addps         0x190d7(%rip),%xmm1        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  68,15,17,128,64,1,0,0               // movups        %xmm8,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -33175,13 +32875,13 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,128,128,0,0,0              // movups        0x80(%rax),%xmm8
-  .byte  15,88,5,75,152,1,0                  // addps         0x1984b(%rip),%xmm0        # 3bb60 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
-  .byte  68,15,40,13,83,146,1,0              // movaps        0x19253(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,88,5,183,150,1,0                 // addps         0x196b7(%rip),%xmm0        # 3b3a0 <_sk_srcover_bgra_8888_sse2_lowp+0x12a4>
+  .byte  68,15,40,13,191,144,1,0             // movaps        0x190bf(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
   .byte  69,15,40,193                        // movaps        %xmm9,%xmm8
   .byte  69,15,89,192                        // mulps         %xmm8,%xmm8
-  .byte  68,15,89,13,63,152,1,0              // mulps         0x1983f(%rip),%xmm9        # 3bb70 <_sk_srcover_bgra_8888_sse2_lowp+0x12a4>
-  .byte  68,15,88,13,55,148,1,0              // addps         0x19437(%rip),%xmm9        # 3b770 <_sk_srcover_bgra_8888_sse2_lowp+0xea4>
+  .byte  68,15,89,13,171,150,1,0             // mulps         0x196ab(%rip),%xmm9        # 3b3b0 <_sk_srcover_bgra_8888_sse2_lowp+0x12b4>
+  .byte  68,15,88,13,163,146,1,0             // addps         0x192a3(%rip),%xmm9        # 3afb0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  68,15,17,136,0,1,0,0                // movups        %xmm9,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -33194,16 +32894,16 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,128,128,0,0,0              // movups        0x80(%rax),%xmm8
-  .byte  15,88,5,243,151,1,0                 // addps         0x197f3(%rip),%xmm0        # 3bb50 <_sk_srcover_bgra_8888_sse2_lowp+0x1284>
-  .byte  68,15,40,13,11,146,1,0              // movaps        0x1920b(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,88,5,95,150,1,0                  // addps         0x1965f(%rip),%xmm0        # 3b390 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
+  .byte  68,15,40,13,119,144,1,0             // movaps        0x19077(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
-  .byte  68,15,40,5,15,152,1,0               // movaps        0x1980f(%rip),%xmm8        # 3bb80 <_sk_srcover_bgra_8888_sse2_lowp+0x12b4>
+  .byte  68,15,40,5,123,150,1,0              // movaps        0x1967b(%rip),%xmm8        # 3b3c0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,19,152,1,0               // addps         0x19813(%rip),%xmm8        # 3bb90 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  .byte  68,15,88,5,127,150,1,0              // addps         0x1967f(%rip),%xmm8        # 3b3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,215,145,1,0              // addps         0x191d7(%rip),%xmm8        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  68,15,88,5,67,144,1,0               // addps         0x19043(%rip),%xmm8        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,11,152,1,0               // addps         0x1980b(%rip),%xmm8        # 3bba0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
+  .byte  68,15,88,5,119,150,1,0              // addps         0x19677(%rip),%xmm8        # 3b3e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e4>
   .byte  68,15,17,128,0,1,0,0                // movups        %xmm8,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -33213,17 +32913,17 @@
 FUNCTION(_sk_bicubic_p1x_sse41)
 _sk_bicubic_p1x_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,15,40,5,181,145,1,0              // movaps        0x191b5(%rip),%xmm8        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  68,15,40,5,33,144,1,0               // movaps        0x19021(%rip),%xmm8        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,136,128,0,0,0              // movups        0x80(%rax),%xmm9
   .byte  65,15,88,192                        // addps         %xmm8,%xmm0
-  .byte  68,15,40,21,190,151,1,0             // movaps        0x197be(%rip),%xmm10        # 3bb80 <_sk_srcover_bgra_8888_sse2_lowp+0x12b4>
+  .byte  68,15,40,21,42,150,1,0              // movaps        0x1962a(%rip),%xmm10        # 3b3c0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
-  .byte  68,15,88,21,194,151,1,0             // addps         0x197c2(%rip),%xmm10        # 3bb90 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  .byte  68,15,88,21,46,150,1,0              // addps         0x1962e(%rip),%xmm10        # 3b3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
   .byte  69,15,88,208                        // addps         %xmm8,%xmm10
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
-  .byte  68,15,88,21,190,151,1,0             // addps         0x197be(%rip),%xmm10        # 3bba0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
+  .byte  68,15,88,21,42,150,1,0              // addps         0x1962a(%rip),%xmm10        # 3b3e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e4>
   .byte  68,15,17,144,0,1,0,0                // movups        %xmm10,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -33235,11 +32935,11 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,128,128,0,0,0              // movups        0x80(%rax),%xmm8
-  .byte  15,88,5,142,151,1,0                 // addps         0x1978e(%rip),%xmm0        # 3bb90 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  .byte  15,88,5,250,149,1,0                 // addps         0x195fa(%rip),%xmm0        # 3b3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  69,15,89,201                        // mulps         %xmm9,%xmm9
-  .byte  68,15,89,5,94,151,1,0               // mulps         0x1975e(%rip),%xmm8        # 3bb70 <_sk_srcover_bgra_8888_sse2_lowp+0x12a4>
-  .byte  68,15,88,5,86,147,1,0               // addps         0x19356(%rip),%xmm8        # 3b770 <_sk_srcover_bgra_8888_sse2_lowp+0xea4>
+  .byte  68,15,89,5,202,149,1,0              // mulps         0x195ca(%rip),%xmm8        # 3b3b0 <_sk_srcover_bgra_8888_sse2_lowp+0x12b4>
+  .byte  68,15,88,5,194,145,1,0              // addps         0x191c2(%rip),%xmm8        # 3afb0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
   .byte  68,15,17,128,0,1,0,0                // movups        %xmm8,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -33252,13 +32952,13 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,72,64                         // movups        0x40(%rax),%xmm1
   .byte  68,15,16,128,192,0,0,0              // movups        0xc0(%rax),%xmm8
-  .byte  15,88,13,33,151,1,0                 // addps         0x19721(%rip),%xmm1        # 3bb60 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
-  .byte  68,15,40,13,41,145,1,0              // movaps        0x19129(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,88,13,141,149,1,0                // addps         0x1958d(%rip),%xmm1        # 3b3a0 <_sk_srcover_bgra_8888_sse2_lowp+0x12a4>
+  .byte  68,15,40,13,149,143,1,0             // movaps        0x18f95(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
   .byte  69,15,40,193                        // movaps        %xmm9,%xmm8
   .byte  69,15,89,192                        // mulps         %xmm8,%xmm8
-  .byte  68,15,89,13,21,151,1,0              // mulps         0x19715(%rip),%xmm9        # 3bb70 <_sk_srcover_bgra_8888_sse2_lowp+0x12a4>
-  .byte  68,15,88,13,13,147,1,0              // addps         0x1930d(%rip),%xmm9        # 3b770 <_sk_srcover_bgra_8888_sse2_lowp+0xea4>
+  .byte  68,15,89,13,129,149,1,0             // mulps         0x19581(%rip),%xmm9        # 3b3b0 <_sk_srcover_bgra_8888_sse2_lowp+0x12b4>
+  .byte  68,15,88,13,121,145,1,0             // addps         0x19179(%rip),%xmm9        # 3afb0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  68,15,17,136,64,1,0,0               // movups        %xmm9,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -33271,16 +32971,16 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,72,64                         // movups        0x40(%rax),%xmm1
   .byte  68,15,16,128,192,0,0,0              // movups        0xc0(%rax),%xmm8
-  .byte  15,88,13,200,150,1,0                // addps         0x196c8(%rip),%xmm1        # 3bb50 <_sk_srcover_bgra_8888_sse2_lowp+0x1284>
-  .byte  68,15,40,13,224,144,1,0             // movaps        0x190e0(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,88,13,52,149,1,0                 // addps         0x19534(%rip),%xmm1        # 3b390 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
+  .byte  68,15,40,13,76,143,1,0              // movaps        0x18f4c(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
-  .byte  68,15,40,5,228,150,1,0              // movaps        0x196e4(%rip),%xmm8        # 3bb80 <_sk_srcover_bgra_8888_sse2_lowp+0x12b4>
+  .byte  68,15,40,5,80,149,1,0               // movaps        0x19550(%rip),%xmm8        # 3b3c0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,232,150,1,0              // addps         0x196e8(%rip),%xmm8        # 3bb90 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  .byte  68,15,88,5,84,149,1,0               // addps         0x19554(%rip),%xmm8        # 3b3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,172,144,1,0              // addps         0x190ac(%rip),%xmm8        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  68,15,88,5,24,143,1,0               // addps         0x18f18(%rip),%xmm8        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,224,150,1,0              // addps         0x196e0(%rip),%xmm8        # 3bba0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
+  .byte  68,15,88,5,76,149,1,0               // addps         0x1954c(%rip),%xmm8        # 3b3e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e4>
   .byte  68,15,17,128,64,1,0,0               // movups        %xmm8,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -33290,17 +32990,17 @@
 FUNCTION(_sk_bicubic_p1y_sse41)
 _sk_bicubic_p1y_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,15,40,5,138,144,1,0              // movaps        0x1908a(%rip),%xmm8        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  68,15,40,5,246,142,1,0              // movaps        0x18ef6(%rip),%xmm8        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  15,16,72,64                         // movups        0x40(%rax),%xmm1
   .byte  68,15,16,136,192,0,0,0              // movups        0xc0(%rax),%xmm9
   .byte  65,15,88,200                        // addps         %xmm8,%xmm1
-  .byte  68,15,40,21,146,150,1,0             // movaps        0x19692(%rip),%xmm10        # 3bb80 <_sk_srcover_bgra_8888_sse2_lowp+0x12b4>
+  .byte  68,15,40,21,254,148,1,0             // movaps        0x194fe(%rip),%xmm10        # 3b3c0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
-  .byte  68,15,88,21,150,150,1,0             // addps         0x19696(%rip),%xmm10        # 3bb90 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  .byte  68,15,88,21,2,149,1,0               // addps         0x19502(%rip),%xmm10        # 3b3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
   .byte  69,15,88,208                        // addps         %xmm8,%xmm10
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
-  .byte  68,15,88,21,146,150,1,0             // addps         0x19692(%rip),%xmm10        # 3bba0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
+  .byte  68,15,88,21,254,148,1,0             // addps         0x194fe(%rip),%xmm10        # 3b3e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e4>
   .byte  68,15,17,144,64,1,0,0               // movups        %xmm10,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -33312,11 +33012,11 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,72,64                         // movups        0x40(%rax),%xmm1
   .byte  68,15,16,128,192,0,0,0              // movups        0xc0(%rax),%xmm8
-  .byte  15,88,13,97,150,1,0                 // addps         0x19661(%rip),%xmm1        # 3bb90 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  .byte  15,88,13,205,148,1,0                // addps         0x194cd(%rip),%xmm1        # 3b3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  69,15,89,201                        // mulps         %xmm9,%xmm9
-  .byte  68,15,89,5,49,150,1,0               // mulps         0x19631(%rip),%xmm8        # 3bb70 <_sk_srcover_bgra_8888_sse2_lowp+0x12a4>
-  .byte  68,15,88,5,41,146,1,0               // addps         0x19229(%rip),%xmm8        # 3b770 <_sk_srcover_bgra_8888_sse2_lowp+0xea4>
+  .byte  68,15,89,5,157,148,1,0              // mulps         0x1949d(%rip),%xmm8        # 3b3b0 <_sk_srcover_bgra_8888_sse2_lowp+0x12b4>
+  .byte  68,15,88,5,149,144,1,0              // addps         0x19095(%rip),%xmm8        # 3afb0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
   .byte  68,15,17,128,64,1,0,0               // movups        %xmm8,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -33427,7 +33127,7 @@
   .byte  15,89,194                           // mulps         %xmm2,%xmm0
   .byte  15,41,68,36,208                     // movaps        %xmm0,-0x30(%rsp)
   .byte  243,15,91,240                       // cvttps2dq     %xmm0,%xmm6
-  .byte  15,40,37,28,149,1,0                 // movaps        0x1951c(%rip),%xmm4        # 3bbb0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e4>
+  .byte  15,40,37,136,147,1,0                // movaps        0x19388(%rip),%xmm4        # 3b3f0 <_sk_srcover_bgra_8888_sse2_lowp+0x12f4>
   .byte  15,88,196                           // addps         %xmm4,%xmm0
   .byte  15,41,68,36,176                     // movaps        %xmm0,-0x50(%rsp)
   .byte  102,65,15,110,208                   // movd          %r8d,%xmm2
@@ -33466,7 +33166,7 @@
   .byte  102,68,15,56,64,192                 // pmulld        %xmm0,%xmm8
   .byte  102,65,15,111,216                   // movdqa        %xmm8,%xmm3
   .byte  102,15,254,218                      // paddd         %xmm2,%xmm3
-  .byte  102,68,15,111,37,115,148,1,0        // movdqa        0x19473(%rip),%xmm12        # 3bbc0 <_sk_srcover_bgra_8888_sse2_lowp+0x12f4>
+  .byte  102,68,15,111,37,223,146,1,0        // movdqa        0x192df(%rip),%xmm12        # 3b400 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
   .byte  102,65,15,56,64,220                 // pmulld        %xmm12,%xmm3
   .byte  102,15,118,228                      // pcmpeqd       %xmm4,%xmm4
   .byte  102,15,111,203                      // movdqa        %xmm3,%xmm1
@@ -33489,7 +33189,7 @@
   .byte  102,65,15,58,22,217,1               // pextrd        $0x1,%xmm3,%r9d
   .byte  102,65,15,58,22,218,2               // pextrd        $0x2,%xmm3,%r10d
   .byte  102,65,15,58,22,219,3               // pextrd        $0x3,%xmm3,%r11d
-  .byte  102,15,111,37,215,141,1,0           // movdqa        0x18dd7(%rip),%xmm4        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,15,111,37,67,140,1,0            // movdqa        0x18c43(%rip),%xmm4        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,15,254,220                      // paddd         %xmm4,%xmm3
   .byte  102,15,111,252                      // movdqa        %xmm4,%xmm7
   .byte  102,73,15,58,22,222,1               // pextrq        $0x1,%xmm3,%r14
@@ -33662,7 +33362,7 @@
   .byte  102,68,15,254,202                   // paddd         %xmm2,%xmm9
   .byte  102,65,15,111,192                   // movdqa        %xmm8,%xmm0
   .byte  102,65,15,254,193                   // paddd         %xmm9,%xmm0
-  .byte  102,15,111,45,130,144,1,0           // movdqa        0x19082(%rip),%xmm5        # 3bbc0 <_sk_srcover_bgra_8888_sse2_lowp+0x12f4>
+  .byte  102,15,111,45,238,142,1,0           // movdqa        0x18eee(%rip),%xmm5        # 3b400 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
   .byte  102,15,56,64,197                    // pmulld        %xmm5,%xmm0
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
   .byte  102,15,118,246                      // pcmpeqd       %xmm6,%xmm6
@@ -33683,7 +33383,7 @@
   .byte  102,65,15,58,22,193,1               // pextrd        $0x1,%xmm0,%r9d
   .byte  102,65,15,58,22,194,2               // pextrd        $0x2,%xmm0,%r10d
   .byte  102,65,15,58,22,195,3               // pextrd        $0x3,%xmm0,%r11d
-  .byte  102,15,111,61,243,137,1,0           // movdqa        0x189f3(%rip),%xmm7        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,15,111,61,95,136,1,0            // movdqa        0x1885f(%rip),%xmm7        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,15,254,199                      // paddd         %xmm7,%xmm0
   .byte  102,72,15,58,22,193,1               // pextrq        $0x1,%xmm0,%rcx
   .byte  102,72,15,126,195                   // movq          %xmm0,%rbx
@@ -33749,7 +33449,7 @@
   .byte  15,88,248                           // addps         %xmm0,%xmm7
   .byte  102,68,15,254,210                   // paddd         %xmm2,%xmm10
   .byte  102,69,15,254,194                   // paddd         %xmm10,%xmm8
-  .byte  102,15,111,13,190,142,1,0           // movdqa        0x18ebe(%rip),%xmm1        # 3bbc0 <_sk_srcover_bgra_8888_sse2_lowp+0x12f4>
+  .byte  102,15,111,13,42,141,1,0            // movdqa        0x18d2a(%rip),%xmm1        # 3b400 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
   .byte  102,68,15,56,64,193                 // pmulld        %xmm1,%xmm8
   .byte  102,65,15,111,192                   // movdqa        %xmm8,%xmm0
   .byte  102,15,118,237                      // pcmpeqd       %xmm5,%xmm5
@@ -33770,7 +33470,7 @@
   .byte  102,69,15,58,22,193,1               // pextrd        $0x1,%xmm8,%r9d
   .byte  102,69,15,58,22,194,2               // pextrd        $0x2,%xmm8,%r10d
   .byte  102,69,15,58,22,195,3               // pextrd        $0x3,%xmm8,%r11d
-  .byte  102,15,111,21,41,136,1,0            // movdqa        0x18829(%rip),%xmm2        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,15,111,21,149,134,1,0           // movdqa        0x18695(%rip),%xmm2        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,68,15,254,194                   // paddd         %xmm2,%xmm8
   .byte  102,76,15,58,22,193,1               // pextrq        $0x1,%xmm8,%rcx
   .byte  102,76,15,126,195                   // movq          %xmm8,%rbx
@@ -33897,7 +33597,7 @@
   .byte  15,89,203                           // mulps         %xmm3,%xmm1
   .byte  15,41,76,36,48                      // movaps        %xmm1,0x30(%rsp)
   .byte  243,15,91,249                       // cvttps2dq     %xmm1,%xmm7
-  .byte  15,40,29,28,140,1,0                 // movaps        0x18c1c(%rip),%xmm3        # 3bbb0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e4>
+  .byte  15,40,29,136,138,1,0                // movaps        0x18a88(%rip),%xmm3        # 3b3f0 <_sk_srcover_bgra_8888_sse2_lowp+0x12f4>
   .byte  15,88,203                           // addps         %xmm3,%xmm1
   .byte  15,41,76,36,160                     // movaps        %xmm1,-0x60(%rsp)
   .byte  102,65,15,110,232                   // movd          %r8d,%xmm5
@@ -33954,7 +33654,7 @@
   .byte  102,68,15,56,64,253                 // pmulld        %xmm5,%xmm15
   .byte  102,65,15,111,223                   // movdqa        %xmm15,%xmm3
   .byte  102,15,254,217                      // paddd         %xmm1,%xmm3
-  .byte  102,68,15,111,29,27,139,1,0         // movdqa        0x18b1b(%rip),%xmm11        # 3bbc0 <_sk_srcover_bgra_8888_sse2_lowp+0x12f4>
+  .byte  102,68,15,111,29,135,137,1,0        // movdqa        0x18987(%rip),%xmm11        # 3b400 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
   .byte  102,65,15,56,64,219                 // pmulld        %xmm11,%xmm3
   .byte  102,15,118,192                      // pcmpeqd       %xmm0,%xmm0
   .byte  102,15,111,243                      // movdqa        %xmm3,%xmm6
@@ -33976,7 +33676,7 @@
   .byte  102,65,15,58,22,217,1               // pextrd        $0x1,%xmm3,%r9d
   .byte  102,65,15,58,22,218,2               // pextrd        $0x2,%xmm3,%r10d
   .byte  102,65,15,58,22,219,3               // pextrd        $0x3,%xmm3,%r11d
-  .byte  102,68,15,111,21,131,132,1,0        // movdqa        0x18483(%rip),%xmm10        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,68,15,111,21,239,130,1,0        // movdqa        0x182ef(%rip),%xmm10        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,65,15,254,218                   // paddd         %xmm10,%xmm3
   .byte  102,73,15,58,22,222,1               // pextrq        $0x1,%xmm3,%r14
   .byte  102,72,15,126,219                   // movq          %xmm3,%rbx
@@ -33994,7 +33694,7 @@
   .byte  102,65,15,254,201                   // paddd         %xmm9,%xmm1
   .byte  102,65,15,56,64,203                 // pmulld        %xmm11,%xmm1
   .byte  102,15,111,217                      // movdqa        %xmm1,%xmm3
-  .byte  102,15,250,29,81,138,1,0            // psubd         0x18a51(%rip),%xmm3        # 3bbd0 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
+  .byte  102,15,250,29,189,136,1,0           // psubd         0x188bd(%rip),%xmm3        # 3b410 <_sk_srcover_bgra_8888_sse2_lowp+0x1314>
   .byte  102,73,15,58,22,222,1               // pextrq        $0x1,%xmm3,%r14
   .byte  102,72,15,126,219                   // movq          %xmm3,%rbx
   .byte  65,137,223                          // mov           %ebx,%r15d
@@ -34049,7 +33749,7 @@
   .byte  102,65,15,254,199                   // paddd         %xmm15,%xmm0
   .byte  102,65,15,56,64,195                 // pmulld        %xmm11,%xmm0
   .byte  102,15,111,232                      // movdqa        %xmm0,%xmm5
-  .byte  102,15,250,45,49,137,1,0            // psubd         0x18931(%rip),%xmm5        # 3bbd0 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
+  .byte  102,15,250,45,157,135,1,0           // psubd         0x1879d(%rip),%xmm5        # 3b410 <_sk_srcover_bgra_8888_sse2_lowp+0x1314>
   .byte  102,69,15,118,192                   // pcmpeqd       %xmm8,%xmm8
   .byte  102,72,15,58,22,233,1               // pextrq        $0x1,%xmm5,%rcx
   .byte  102,72,15,126,237                   // movq          %xmm5,%rbp
@@ -34174,7 +33874,7 @@
   .byte  72,193,233,32                       // shr           $0x20,%rcx
   .byte  243,15,16,36,136                    // movss         (%rax,%rcx,4),%xmm4
   .byte  102,68,15,58,33,220,48              // insertps      $0x30,%xmm4,%xmm11
-  .byte  102,15,111,61,117,128,1,0           // movdqa        0x18075(%rip),%xmm7        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,15,111,61,225,126,1,0           // movdqa        0x17ee1(%rip),%xmm7        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,15,254,223                      // paddd         %xmm7,%xmm3
   .byte  102,72,15,58,22,217,1               // pextrq        $0x1,%xmm3,%rcx
   .byte  102,72,15,126,221                   // movq          %xmm3,%rbp
@@ -34260,7 +33960,7 @@
   .byte  102,65,15,58,22,201,1               // pextrd        $0x1,%xmm1,%r9d
   .byte  102,65,15,58,22,202,2               // pextrd        $0x2,%xmm1,%r10d
   .byte  102,65,15,58,22,203,3               // pextrd        $0x3,%xmm1,%r11d
-  .byte  102,68,15,111,21,185,126,1,0        // movdqa        0x17eb9(%rip),%xmm10        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,68,15,111,21,37,125,1,0         // movdqa        0x17d25(%rip),%xmm10        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,65,15,254,202                   // paddd         %xmm10,%xmm1
   .byte  102,72,15,58,22,201,1               // pextrq        $0x1,%xmm1,%rcx
   .byte  102,72,15,126,203                   // movq          %xmm1,%rbx
@@ -34356,7 +34056,7 @@
   .byte  102,15,111,124,36,192               // movdqa        -0x40(%rsp),%xmm7
   .byte  102,15,111,199                      // movdqa        %xmm7,%xmm0
   .byte  102,15,254,195                      // paddd         %xmm3,%xmm0
-  .byte  102,15,111,21,243,130,1,0           // movdqa        0x182f3(%rip),%xmm2        # 3bbc0 <_sk_srcover_bgra_8888_sse2_lowp+0x12f4>
+  .byte  102,15,111,21,95,129,1,0            // movdqa        0x1815f(%rip),%xmm2        # 3b400 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
   .byte  102,15,56,64,194                    // pmulld        %xmm2,%xmm0
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
   .byte  102,69,15,118,192                   // pcmpeqd       %xmm8,%xmm8
@@ -34377,7 +34077,7 @@
   .byte  102,65,15,58,22,193,1               // pextrd        $0x1,%xmm0,%r9d
   .byte  102,65,15,58,22,194,2               // pextrd        $0x2,%xmm0,%r10d
   .byte  102,65,15,58,22,195,3               // pextrd        $0x3,%xmm0,%r11d
-  .byte  102,15,111,37,98,124,1,0            // movdqa        0x17c62(%rip),%xmm4        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,15,111,37,206,122,1,0           // movdqa        0x17ace(%rip),%xmm4        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,15,254,196                      // paddd         %xmm4,%xmm0
   .byte  102,72,15,58,22,193,1               // pextrq        $0x1,%xmm0,%rcx
   .byte  102,72,15,126,195                   // movq          %xmm0,%rbx
@@ -34449,7 +34149,7 @@
   .byte  102,68,15,111,226                   // movdqa        %xmm2,%xmm12
   .byte  102,65,15,56,64,204                 // pmulld        %xmm12,%xmm1
   .byte  102,15,111,209                      // movdqa        %xmm1,%xmm2
-  .byte  102,15,250,21,30,129,1,0            // psubd         0x1811e(%rip),%xmm2        # 3bbd0 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
+  .byte  102,15,250,21,138,127,1,0           // psubd         0x17f8a(%rip),%xmm2        # 3b410 <_sk_srcover_bgra_8888_sse2_lowp+0x1314>
   .byte  102,72,15,58,22,209,1               // pextrq        $0x1,%xmm2,%rcx
   .byte  102,72,15,126,213                   // movq          %xmm2,%rbp
   .byte  137,235                             // mov           %ebp,%ebx
@@ -34483,7 +34183,7 @@
   .byte  102,65,15,111,249                   // movdqa        %xmm9,%xmm7
   .byte  102,69,15,56,64,236                 // pmulld        %xmm12,%xmm13
   .byte  102,65,15,111,205                   // movdqa        %xmm13,%xmm1
-  .byte  102,15,250,13,106,128,1,0           // psubd         0x1806a(%rip),%xmm1        # 3bbd0 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
+  .byte  102,15,250,13,214,126,1,0           // psubd         0x17ed6(%rip),%xmm1        # 3b410 <_sk_srcover_bgra_8888_sse2_lowp+0x1314>
   .byte  102,72,15,58,22,201,1               // pextrq        $0x1,%xmm1,%rcx
   .byte  102,72,15,126,203                   // movq          %xmm1,%rbx
   .byte  137,221                             // mov           %ebx,%ebp
@@ -34548,7 +34248,7 @@
   .byte  102,65,15,111,206                   // movdqa        %xmm14,%xmm1
   .byte  102,15,111,108,36,192               // movdqa        -0x40(%rsp),%xmm5
   .byte  102,15,254,205                      // paddd         %xmm5,%xmm1
-  .byte  102,15,111,37,1,127,1,0             // movdqa        0x17f01(%rip),%xmm4        # 3bbc0 <_sk_srcover_bgra_8888_sse2_lowp+0x12f4>
+  .byte  102,15,111,37,109,125,1,0           // movdqa        0x17d6d(%rip),%xmm4        # 3b400 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
   .byte  102,15,56,64,204                    // pmulld        %xmm4,%xmm1
   .byte  102,15,111,193                      // movdqa        %xmm1,%xmm0
   .byte  102,15,118,246                      // pcmpeqd       %xmm6,%xmm6
@@ -34569,7 +34269,7 @@
   .byte  102,65,15,58,22,201,1               // pextrd        $0x1,%xmm1,%r9d
   .byte  102,65,15,58,22,202,2               // pextrd        $0x2,%xmm1,%r10d
   .byte  102,65,15,58,22,203,3               // pextrd        $0x3,%xmm1,%r11d
-  .byte  102,15,111,29,114,120,1,0           // movdqa        0x17872(%rip),%xmm3        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,15,111,29,222,118,1,0           // movdqa        0x176de(%rip),%xmm3        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,15,254,203                      // paddd         %xmm3,%xmm1
   .byte  102,72,15,58,22,201,1               // pextrq        $0x1,%xmm1,%rcx
   .byte  102,72,15,126,203                   // movq          %xmm1,%rbx
@@ -34641,7 +34341,7 @@
   .byte  102,15,56,64,239                    // pmulld        %xmm7,%xmm5
   .byte  102,15,111,205                      // movdqa        %xmm5,%xmm1
   .byte  102,15,111,193                      // movdqa        %xmm1,%xmm0
-  .byte  102,15,250,5,50,125,1,0             // psubd         0x17d32(%rip),%xmm0        # 3bbd0 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
+  .byte  102,15,250,5,158,123,1,0            // psubd         0x17b9e(%rip),%xmm0        # 3b410 <_sk_srcover_bgra_8888_sse2_lowp+0x1314>
   .byte  102,72,15,58,22,193,1               // pextrq        $0x1,%xmm0,%rcx
   .byte  102,72,15,126,197                   // movq          %xmm0,%rbp
   .byte  137,235                             // mov           %ebp,%ebx
@@ -34659,7 +34359,7 @@
   .byte  102,65,15,58,22,193,1               // pextrd        $0x1,%xmm0,%r9d
   .byte  102,65,15,58,22,194,2               // pextrd        $0x2,%xmm0,%r10d
   .byte  102,65,15,58,22,195,3               // pextrd        $0x3,%xmm0,%r11d
-  .byte  102,15,254,5,160,118,1,0            // paddd         0x176a0(%rip),%xmm0        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,15,254,5,12,117,1,0             // paddd         0x1750c(%rip),%xmm0        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,72,15,58,22,193,1               // pextrq        $0x1,%xmm0,%rcx
   .byte  102,72,15,126,195                   // movq          %xmm0,%rbx
   .byte  137,221                             // mov           %ebx,%ebp
@@ -34675,7 +34375,7 @@
   .byte  102,15,254,84,36,176                // paddd         -0x50(%rsp),%xmm2
   .byte  102,15,56,64,215                    // pmulld        %xmm7,%xmm2
   .byte  102,15,111,194                      // movdqa        %xmm2,%xmm0
-  .byte  102,15,250,5,121,124,1,0            // psubd         0x17c79(%rip),%xmm0        # 3bbd0 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
+  .byte  102,15,250,5,229,122,1,0            // psubd         0x17ae5(%rip),%xmm0        # 3b410 <_sk_srcover_bgra_8888_sse2_lowp+0x1314>
   .byte  102,72,15,58,22,193,1               // pextrq        $0x1,%xmm0,%rcx
   .byte  102,72,15,126,195                   // movq          %xmm0,%rbx
   .byte  137,221                             // mov           %ebx,%ebp
@@ -34693,7 +34393,7 @@
   .byte  102,65,15,58,22,199,1               // pextrd        $0x1,%xmm0,%r15d
   .byte  102,65,15,58,22,196,2               // pextrd        $0x2,%xmm0,%r12d
   .byte  102,65,15,58,22,198,3               // pextrd        $0x3,%xmm0,%r14d
-  .byte  102,15,254,5,231,117,1,0            // paddd         0x175e7(%rip),%xmm0        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,15,254,5,83,116,1,0             // paddd         0x17453(%rip),%xmm0        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,72,15,58,22,195,1               // pextrq        $0x1,%xmm0,%rbx
   .byte  102,72,15,126,197                   // movq          %xmm0,%rbp
   .byte  137,233                             // mov           %ebp,%ecx
@@ -34756,7 +34456,7 @@
   .byte  15,89,212                           // mulps         %xmm4,%xmm2
   .byte  65,15,88,211                        // addps         %xmm11,%xmm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,164,116,1,0                // movaps        0x174a4(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,29,16,115,1,0                 // movaps        0x17310(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  72,139,76,36,248                    // mov           -0x8(%rsp),%rcx
   .byte  15,40,100,36,64                     // movaps        0x40(%rsp),%xmm4
   .byte  15,40,108,36,80                     // movaps        0x50(%rsp),%xmm5
@@ -34775,15 +34475,15 @@
 .globl _sk_gauss_a_to_rgba_sse41
 FUNCTION(_sk_gauss_a_to_rgba_sse41)
 _sk_gauss_a_to_rgba_sse41:
-  .byte  15,40,5,225,122,1,0                 // movaps        0x17ae1(%rip),%xmm0        # 3bbe0 <_sk_srcover_bgra_8888_sse2_lowp+0x1314>
+  .byte  15,40,5,77,121,1,0                  // movaps        0x1794d(%rip),%xmm0        # 3b420 <_sk_srcover_bgra_8888_sse2_lowp+0x1324>
   .byte  15,89,195                           // mulps         %xmm3,%xmm0
-  .byte  15,88,5,231,122,1,0                 // addps         0x17ae7(%rip),%xmm0        # 3bbf0 <_sk_srcover_bgra_8888_sse2_lowp+0x1324>
+  .byte  15,88,5,83,121,1,0                  // addps         0x17953(%rip),%xmm0        # 3b430 <_sk_srcover_bgra_8888_sse2_lowp+0x1334>
   .byte  15,89,195                           // mulps         %xmm3,%xmm0
-  .byte  15,88,5,237,122,1,0                 // addps         0x17aed(%rip),%xmm0        # 3bc00 <_sk_srcover_bgra_8888_sse2_lowp+0x1334>
+  .byte  15,88,5,89,121,1,0                  // addps         0x17959(%rip),%xmm0        # 3b440 <_sk_srcover_bgra_8888_sse2_lowp+0x1344>
   .byte  15,89,195                           // mulps         %xmm3,%xmm0
-  .byte  15,88,5,243,122,1,0                 // addps         0x17af3(%rip),%xmm0        # 3bc10 <_sk_srcover_bgra_8888_sse2_lowp+0x1344>
+  .byte  15,88,5,95,121,1,0                  // addps         0x1795f(%rip),%xmm0        # 3b450 <_sk_srcover_bgra_8888_sse2_lowp+0x1354>
   .byte  15,89,195                           // mulps         %xmm3,%xmm0
-  .byte  15,88,5,249,122,1,0                 // addps         0x17af9(%rip),%xmm0        # 3bc20 <_sk_srcover_bgra_8888_sse2_lowp+0x1354>
+  .byte  15,88,5,101,121,1,0                 // addps         0x17965(%rip),%xmm0        # 3b460 <_sk_srcover_bgra_8888_sse2_lowp+0x1364>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
@@ -34800,7 +34500,7 @@
   .byte  15,41,108,36,144                    // movaps        %xmm5,-0x70(%rsp)
   .byte  15,41,100,36,128                    // movaps        %xmm4,-0x80(%rsp)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,11,116,1,0                 // movaps        0x1740b(%rip),%xmm3        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  15,40,29,119,114,1,0                // movaps        0x17277(%rip),%xmm3        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  68,15,40,208                        // movaps        %xmm0,%xmm10
   .byte  68,15,88,211                        // addps         %xmm3,%xmm10
   .byte  102,65,15,58,8,210,1                // roundps       $0x1,%xmm10,%xmm2
@@ -34809,7 +34509,7 @@
   .byte  15,88,217                           // addps         %xmm1,%xmm3
   .byte  102,15,58,8,203,1                   // roundps       $0x1,%xmm3,%xmm1
   .byte  15,92,217                           // subps         %xmm1,%xmm3
-  .byte  15,40,13,241,115,1,0                // movaps        0x173f1(%rip),%xmm1        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,13,93,114,1,0                 // movaps        0x1725d(%rip),%xmm1        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,40,209                           // movaps        %xmm1,%xmm2
   .byte  65,15,92,210                        // subps         %xmm10,%xmm2
   .byte  15,41,84,36,32                      // movaps        %xmm2,0x20(%rsp)
@@ -34828,9 +34528,9 @@
   .byte  102,15,110,72,8                     // movd          0x8(%rax),%xmm1
   .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
   .byte  102,15,127,76,36,208                // movdqa        %xmm1,-0x30(%rsp)
-  .byte  243,15,16,13,230,106,1,0            // movss         0x16ae6(%rip),%xmm1        # 3acc0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  .byte  243,15,16,13,66,105,1,0             // movss         0x16942(%rip),%xmm1        # 3a4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
-  .byte  15,40,37,156,117,1,0                // movaps        0x1759c(%rip),%xmm4        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  15,40,37,8,116,1,0                  // movaps        0x17408(%rip),%xmm4        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  102,15,239,210                      // pxor          %xmm2,%xmm2
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
@@ -34841,14 +34541,14 @@
   .byte  15,87,201                           // xorps         %xmm1,%xmm1
   .byte  15,95,205                           // maxps         %xmm5,%xmm1
   .byte  15,41,116,36,16                     // movaps        %xmm6,0x10(%rsp)
-  .byte  15,46,53,236,106,1,0                // ucomiss       0x16aec(%rip),%xmm6        # 3acfc <_sk_srcover_bgra_8888_sse2_lowp+0x430>
+  .byte  15,46,53,72,105,1,0                 // ucomiss       0x16948(%rip),%xmm6        # 3a52c <_sk_srcover_bgra_8888_sse2_lowp+0x430>
   .byte  68,15,40,124,36,240                 // movaps        -0x10(%rsp),%xmm15
-  .byte  119,6                               // ja            2421e <_sk_bilerp_clamp_8888_sse41+0xea>
+  .byte  119,6                               // ja            23bf2 <_sk_bilerp_clamp_8888_sse41+0xea>
   .byte  68,15,40,124,36,192                 // movaps        -0x40(%rsp),%xmm15
   .byte  15,93,76,36,224                     // minps         -0x20(%rsp),%xmm1
   .byte  243,68,15,91,233                    // cvttps2dq     %xmm1,%xmm13
   .byte  102,68,15,56,64,108,36,208          // pmulld        -0x30(%rsp),%xmm13
-  .byte  243,15,16,45,136,106,1,0            // movss         0x16a88(%rip),%xmm5        # 3acc0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  .byte  243,15,16,45,228,104,1,0            // movss         0x168e4(%rip),%xmm5        # 3a4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   .byte  15,40,205                           // movaps        %xmm5,%xmm1
   .byte  15,198,201,0                        // shufps        $0x0,%xmm1,%xmm1
   .byte  15,88,200                           // addps         %xmm0,%xmm1
@@ -34868,23 +34568,23 @@
   .byte  102,67,15,58,34,12,136,2            // pinsrd        $0x2,(%r8,%r9,4),%xmm1
   .byte  102,65,15,58,34,12,128,3            // pinsrd        $0x3,(%r8,%rax,4),%xmm1
   .byte  102,15,111,241                      // movdqa        %xmm1,%xmm6
-  .byte  102,15,219,53,135,115,1,0           // pand          0x17387(%rip),%xmm6        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  102,15,219,53,243,113,1,0           // pand          0x171f3(%rip),%xmm6        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  15,91,254                           // cvtdq2ps      %xmm6,%xmm7
   .byte  15,89,252                           // mulps         %xmm4,%xmm7
   .byte  102,15,111,241                      // movdqa        %xmm1,%xmm6
-  .byte  102,15,56,0,53,132,115,1,0          // pshufb        0x17384(%rip),%xmm6        # 3b630 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
+  .byte  102,15,56,0,53,240,113,1,0          // pshufb        0x171f0(%rip),%xmm6        # 3ae70 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
   .byte  68,15,91,230                        // cvtdq2ps      %xmm6,%xmm12
   .byte  68,15,89,228                        // mulps         %xmm4,%xmm12
   .byte  102,15,111,241                      // movdqa        %xmm1,%xmm6
-  .byte  102,15,56,0,53,127,115,1,0          // pshufb        0x1737f(%rip),%xmm6        # 3b640 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
+  .byte  102,15,56,0,53,235,113,1,0          // pshufb        0x171eb(%rip),%xmm6        # 3ae80 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
   .byte  15,91,246                           // cvtdq2ps      %xmm6,%xmm6
   .byte  15,89,244                           // mulps         %xmm4,%xmm6
   .byte  102,15,114,209,24                   // psrld         $0x18,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
   .byte  15,89,204                           // mulps         %xmm4,%xmm1
-  .byte  15,46,45,35,106,1,0                 // ucomiss       0x16a23(%rip),%xmm5        # 3acfc <_sk_srcover_bgra_8888_sse2_lowp+0x430>
+  .byte  15,46,45,127,104,1,0                // ucomiss       0x1687f(%rip),%xmm5        # 3a52c <_sk_srcover_bgra_8888_sse2_lowp+0x430>
   .byte  69,15,40,218                        // movaps        %xmm10,%xmm11
-  .byte  119,6                               // ja            242e5 <_sk_bilerp_clamp_8888_sse41+0x1b1>
+  .byte  119,6                               // ja            23cb9 <_sk_bilerp_clamp_8888_sse41+0x1b1>
   .byte  68,15,40,92,36,32                   // movaps        0x20(%rsp),%xmm11
   .byte  69,15,89,223                        // mulps         %xmm15,%xmm11
   .byte  65,15,89,251                        // mulps         %xmm11,%xmm7
@@ -34895,15 +34595,15 @@
   .byte  15,88,214                           // addps         %xmm6,%xmm2
   .byte  68,15,89,217                        // mulps         %xmm1,%xmm11
   .byte  65,15,88,219                        // addps         %xmm11,%xmm3
-  .byte  243,15,88,45,108,104,1,0            // addss         0x1686c(%rip),%xmm5        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
-  .byte  243,15,16,13,96,104,1,0             // movss         0x16860(%rip),%xmm1        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  243,15,88,45,200,102,1,0            // addss         0x166c8(%rip),%xmm5        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  243,15,16,13,188,102,1,0            // movss         0x166bc(%rip),%xmm1        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  15,46,205                           // ucomiss       %xmm5,%xmm1
-  .byte  15,131,23,255,255,255               // jae           24238 <_sk_bilerp_clamp_8888_sse41+0x104>
+  .byte  15,131,23,255,255,255               // jae           23c0c <_sk_bilerp_clamp_8888_sse41+0x104>
   .byte  15,40,116,36,16                     // movaps        0x10(%rsp),%xmm6
-  .byte  243,15,88,53,78,104,1,0             // addss         0x1684e(%rip),%xmm6        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
-  .byte  243,15,16,13,66,104,1,0             // movss         0x16842(%rip),%xmm1        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  243,15,88,53,170,102,1,0            // addss         0x166aa(%rip),%xmm6        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  243,15,16,13,158,102,1,0            // movss         0x1669e(%rip),%xmm1        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  15,46,206                           // ucomiss       %xmm6,%xmm1
-  .byte  15,131,180,254,255,255              // jae           241f3 <_sk_bilerp_clamp_8888_sse41+0xbf>
+  .byte  15,131,180,254,255,255              // jae           23bc7 <_sk_bilerp_clamp_8888_sse41+0xbf>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
   .byte  65,15,40,200                        // movaps        %xmm8,%xmm1
@@ -34935,13 +34635,13 @@
   .byte  73,137,246                          // mov           %rsi,%r14
   .byte  72,137,77,192                       // mov           %rcx,-0x40(%rbp)
   .byte  72,57,203                           // cmp           %rcx,%rbx
-  .byte  15,131,131,0,0,0                    // jae           24419 <_sk_start_pipeline_sse2+0xb6>
+  .byte  15,131,131,0,0,0                    // jae           23ded <_sk_start_pipeline_sse2+0xb6>
   .byte  72,139,69,208                       // mov           -0x30(%rbp),%rax
   .byte  72,141,64,4                         // lea           0x4(%rax),%rax
   .byte  72,137,69,200                       // mov           %rax,-0x38(%rbp)
   .byte  76,57,125,200                       // cmp           %r15,-0x38(%rbp)
   .byte  72,139,85,208                       // mov           -0x30(%rbp),%rdx
-  .byte  119,59                              // ja            243e7 <_sk_start_pipeline_sse2+0x84>
+  .byte  119,59                              // ja            23dbb <_sk_start_pipeline_sse2+0x84>
   .byte  76,139,101,208                      // mov           -0x30(%rbp),%r12
   .byte  49,255                              // xor           %edi,%edi
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
@@ -34960,10 +34660,10 @@
   .byte  73,131,196,8                        // add           $0x8,%r12
   .byte  77,57,252                           // cmp           %r15,%r12
   .byte  73,137,212                          // mov           %rdx,%r12
-  .byte  118,201                             // jbe           243b0 <_sk_start_pipeline_sse2+0x4d>
+  .byte  118,201                             // jbe           23d84 <_sk_start_pipeline_sse2+0x4d>
   .byte  76,137,255                          // mov           %r15,%rdi
   .byte  72,41,215                           // sub           %rdx,%rdi
-  .byte  116,33                              // je            24410 <_sk_start_pipeline_sse2+0xad>
+  .byte  116,33                              // je            23de4 <_sk_start_pipeline_sse2+0xad>
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  15,87,201                           // xorps         %xmm1,%xmm1
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
@@ -34977,7 +34677,7 @@
   .byte  65,255,213                          // callq         *%r13
   .byte  72,255,195                          // inc           %rbx
   .byte  72,59,93,192                        // cmp           -0x40(%rbp),%rbx
-  .byte  117,137                             // jne           243a2 <_sk_start_pipeline_sse2+0x3f>
+  .byte  117,137                             // jne           23d76 <_sk_start_pipeline_sse2+0x3f>
   .byte  72,131,196,24                       // add           $0x18,%rsp
   .byte  91                                  // pop           %rbx
   .byte  65,92                               // pop           %r12
@@ -35006,9 +34706,9 @@
   .byte  102,15,110,201                      // movd          %ecx,%xmm1
   .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
-  .byte  15,88,13,16,113,1,0                 // addps         0x17110(%rip),%xmm1        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  15,88,13,124,111,1,0                // addps         0x16f7c(%rip),%xmm1        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,21,23,113,1,0                 // movaps        0x17117(%rip),%xmm2        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,21,131,111,1,0                // movaps        0x16f83(%rip),%xmm2        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
   .byte  15,87,228                           // xorps         %xmm4,%xmm4
   .byte  15,87,237                           // xorps         %xmm5,%xmm5
@@ -35023,18 +34723,18 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  102,68,15,110,194                   // movd          %edx,%xmm8
   .byte  102,69,15,112,192,0                 // pshufd        $0x0,%xmm8,%xmm8
-  .byte  102,68,15,254,5,192,112,1,0         // paddd         0x170c0(%rip),%xmm8        # 3b540 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  .byte  102,68,15,254,5,44,111,1,0          // paddd         0x16f2c(%rip),%xmm8        # 3ad80 <_sk_srcover_bgra_8888_sse2_lowp+0xc84>
   .byte  102,68,15,110,201                   // movd          %ecx,%xmm9
   .byte  102,69,15,112,201,0                 // pshufd        $0x0,%xmm9,%xmm9
   .byte  102,69,15,239,200                   // pxor          %xmm8,%xmm9
-  .byte  102,68,15,111,21,231,112,1,0        // movdqa        0x170e7(%rip),%xmm10        # 3b580 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
+  .byte  102,68,15,111,21,83,111,1,0         // movdqa        0x16f53(%rip),%xmm10        # 3adc0 <_sk_srcover_bgra_8888_sse2_lowp+0xcc4>
   .byte  102,69,15,111,217                   // movdqa        %xmm9,%xmm11
   .byte  102,69,15,219,218                   // pand          %xmm10,%xmm11
   .byte  102,65,15,114,243,5                 // pslld         $0x5,%xmm11
   .byte  102,69,15,219,208                   // pand          %xmm8,%xmm10
   .byte  102,65,15,114,242,4                 // pslld         $0x4,%xmm10
-  .byte  102,68,15,111,37,211,112,1,0        // movdqa        0x170d3(%rip),%xmm12        # 3b590 <_sk_srcover_bgra_8888_sse2_lowp+0xcc4>
-  .byte  102,68,15,111,45,218,112,1,0        // movdqa        0x170da(%rip),%xmm13        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,68,15,111,37,63,111,1,0         // movdqa        0x16f3f(%rip),%xmm12        # 3add0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,68,15,111,45,70,111,1,0         // movdqa        0x16f46(%rip),%xmm13        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,69,15,111,241                   // movdqa        %xmm9,%xmm14
   .byte  102,69,15,219,245                   // pand          %xmm13,%xmm14
   .byte  102,65,15,114,246,2                 // pslld         $0x2,%xmm14
@@ -35050,8 +34750,8 @@
   .byte  102,69,15,235,198                   // por           %xmm14,%xmm8
   .byte  102,69,15,235,193                   // por           %xmm9,%xmm8
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
-  .byte  68,15,89,5,149,112,1,0              // mulps         0x17095(%rip),%xmm8        # 3b5b0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
-  .byte  68,15,88,5,157,112,1,0              // addps         0x1709d(%rip),%xmm8        # 3b5c0 <_sk_srcover_bgra_8888_sse2_lowp+0xcf4>
+  .byte  68,15,89,5,1,111,1,0                // mulps         0x16f01(%rip),%xmm8        # 3adf0 <_sk_srcover_bgra_8888_sse2_lowp+0xcf4>
+  .byte  68,15,88,5,9,111,1,0                // addps         0x16f09(%rip),%xmm8        # 3ae00 <_sk_srcover_bgra_8888_sse2_lowp+0xd04>
   .byte  243,68,15,16,16                     // movss         (%rax),%xmm10
   .byte  69,15,198,210,0                     // shufps        $0x0,%xmm10,%xmm10
   .byte  69,15,89,208                        // mulps         %xmm8,%xmm10
@@ -35093,7 +34793,7 @@
 FUNCTION(_sk_black_color_sse2)
 _sk_black_color_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,211,111,1,0                // movaps        0x16fd3(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,29,63,110,1,0                 // movaps        0x16e3f(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  15,87,201                           // xorps         %xmm1,%xmm1
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
@@ -35104,7 +34804,7 @@
 FUNCTION(_sk_white_color_sse2)
 _sk_white_color_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,5,191,111,1,0                 // movaps        0x16fbf(%rip),%xmm0        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,5,43,110,1,0                  // movaps        0x16e2b(%rip),%xmm0        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  15,40,216                           // movaps        %xmm0,%xmm3
@@ -35150,7 +34850,7 @@
 FUNCTION(_sk_srcatop_sse2)
 _sk_srcatop_sse2:
   .byte  15,89,199                           // mulps         %xmm7,%xmm0
-  .byte  68,15,40,5,111,111,1,0              // movaps        0x16f6f(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,219,109,1,0              // movaps        0x16ddb(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,92,195                        // subps         %xmm3,%xmm8
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  68,15,89,204                        // mulps         %xmm4,%xmm9
@@ -35175,7 +34875,7 @@
 _sk_dstatop_sse2:
   .byte  68,15,40,195                        // movaps        %xmm3,%xmm8
   .byte  68,15,89,196                        // mulps         %xmm4,%xmm8
-  .byte  68,15,40,13,34,111,1,0              // movaps        0x16f22(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,13,142,109,1,0             // movaps        0x16d8e(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,92,207                        // subps         %xmm7,%xmm9
   .byte  65,15,89,193                        // mulps         %xmm9,%xmm0
   .byte  65,15,88,192                        // addps         %xmm8,%xmm0
@@ -35222,7 +34922,7 @@
 .globl _sk_srcout_sse2
 FUNCTION(_sk_srcout_sse2)
 _sk_srcout_sse2:
-  .byte  68,15,40,5,182,110,1,0              // movaps        0x16eb6(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,34,109,1,0               // movaps        0x16d22(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,92,199                        // subps         %xmm7,%xmm8
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  65,15,89,200                        // mulps         %xmm8,%xmm1
@@ -35235,7 +34935,7 @@
 .globl _sk_dstout_sse2
 FUNCTION(_sk_dstout_sse2)
 _sk_dstout_sse2:
-  .byte  68,15,40,5,150,110,1,0              // movaps        0x16e96(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,2,109,1,0                // movaps        0x16d02(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,92,195                        // subps         %xmm3,%xmm8
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  15,89,196                           // mulps         %xmm4,%xmm0
@@ -35252,7 +34952,7 @@
 .globl _sk_srcover_sse2
 FUNCTION(_sk_srcover_sse2)
 _sk_srcover_sse2:
-  .byte  68,15,40,5,105,110,1,0              // movaps        0x16e69(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,213,108,1,0              // movaps        0x16cd5(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,92,195                        // subps         %xmm3,%xmm8
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  68,15,89,204                        // mulps         %xmm4,%xmm9
@@ -35272,7 +34972,7 @@
 .globl _sk_dstover_sse2
 FUNCTION(_sk_dstover_sse2)
 _sk_dstover_sse2:
-  .byte  68,15,40,5,45,110,1,0               // movaps        0x16e2d(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,153,108,1,0              // movaps        0x16c99(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,92,199                        // subps         %xmm7,%xmm8
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  15,88,196                           // addps         %xmm4,%xmm0
@@ -35300,7 +35000,7 @@
 .globl _sk_multiply_sse2
 FUNCTION(_sk_multiply_sse2)
 _sk_multiply_sse2:
-  .byte  68,15,40,5,241,109,1,0              // movaps        0x16df1(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,93,108,1,0               // movaps        0x16c5d(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  68,15,92,207                        // subps         %xmm7,%xmm9
   .byte  69,15,40,209                        // movaps        %xmm9,%xmm10
@@ -35338,7 +35038,7 @@
 FUNCTION(_sk_plus__sse2)
 _sk_plus__sse2:
   .byte  15,88,196                           // addps         %xmm4,%xmm0
-  .byte  68,15,40,5,114,109,1,0              // movaps        0x16d72(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,222,107,1,0              // movaps        0x16bde(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  65,15,93,192                        // minps         %xmm8,%xmm0
   .byte  15,88,205                           // addps         %xmm5,%xmm1
   .byte  65,15,93,200                        // minps         %xmm8,%xmm1
@@ -35380,7 +35080,7 @@
 FUNCTION(_sk_xor__sse2)
 _sk_xor__sse2:
   .byte  68,15,40,195                        // movaps        %xmm3,%xmm8
-  .byte  15,40,29,254,108,1,0                // movaps        0x16cfe(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,29,106,107,1,0                // movaps        0x16b6a(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,40,203                        // movaps        %xmm3,%xmm9
   .byte  68,15,92,207                        // subps         %xmm7,%xmm9
   .byte  65,15,89,193                        // mulps         %xmm9,%xmm0
@@ -35428,7 +35128,7 @@
   .byte  68,15,89,206                        // mulps         %xmm6,%xmm9
   .byte  65,15,95,209                        // maxps         %xmm9,%xmm2
   .byte  68,15,92,194                        // subps         %xmm2,%xmm8
-  .byte  15,40,21,89,108,1,0                 // movaps        0x16c59(%rip),%xmm2        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,21,197,106,1,0                // movaps        0x16ac5(%rip),%xmm2        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,92,211                           // subps         %xmm3,%xmm2
   .byte  15,89,215                           // mulps         %xmm7,%xmm2
   .byte  15,88,218                           // addps         %xmm2,%xmm3
@@ -35462,7 +35162,7 @@
   .byte  68,15,89,206                        // mulps         %xmm6,%xmm9
   .byte  65,15,93,209                        // minps         %xmm9,%xmm2
   .byte  68,15,92,194                        // subps         %xmm2,%xmm8
-  .byte  15,40,21,238,107,1,0                // movaps        0x16bee(%rip),%xmm2        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,21,90,106,1,0                 // movaps        0x16a5a(%rip),%xmm2        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,92,211                           // subps         %xmm3,%xmm2
   .byte  15,89,215                           // mulps         %xmm7,%xmm2
   .byte  15,88,218                           // addps         %xmm2,%xmm3
@@ -35499,7 +35199,7 @@
   .byte  65,15,93,209                        // minps         %xmm9,%xmm2
   .byte  15,88,210                           // addps         %xmm2,%xmm2
   .byte  68,15,92,194                        // subps         %xmm2,%xmm8
-  .byte  15,40,21,120,107,1,0                // movaps        0x16b78(%rip),%xmm2        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,21,228,105,1,0                // movaps        0x169e4(%rip),%xmm2        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,92,211                           // subps         %xmm3,%xmm2
   .byte  15,89,215                           // mulps         %xmm7,%xmm2
   .byte  15,88,218                           // addps         %xmm2,%xmm3
@@ -35527,7 +35227,7 @@
   .byte  15,89,214                           // mulps         %xmm6,%xmm2
   .byte  15,88,210                           // addps         %xmm2,%xmm2
   .byte  68,15,92,194                        // subps         %xmm2,%xmm8
-  .byte  15,40,21,40,107,1,0                 // movaps        0x16b28(%rip),%xmm2        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,21,148,105,1,0                // movaps        0x16994(%rip),%xmm2        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,92,211                           // subps         %xmm3,%xmm2
   .byte  15,89,215                           // mulps         %xmm7,%xmm2
   .byte  15,88,218                           // addps         %xmm2,%xmm3
@@ -35540,7 +35240,7 @@
 FUNCTION(_sk_colorburn_sse2)
 _sk_colorburn_sse2:
   .byte  68,15,40,192                        // movaps        %xmm0,%xmm8
-  .byte  68,15,40,13,11,107,1,0              // movaps        0x16b0b(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,13,119,105,1,0             // movaps        0x16977(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,40,209                        // movaps        %xmm9,%xmm10
   .byte  68,15,92,215                        // subps         %xmm7,%xmm10
   .byte  69,15,40,218                        // movaps        %xmm10,%xmm11
@@ -35635,7 +35335,7 @@
 FUNCTION(_sk_colordodge_sse2)
 _sk_colordodge_sse2:
   .byte  68,15,40,200                        // movaps        %xmm0,%xmm9
-  .byte  68,15,40,21,179,105,1,0             // movaps        0x169b3(%rip),%xmm10        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,21,31,104,1,0              // movaps        0x1681f(%rip),%xmm10        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,40,218                        // movaps        %xmm10,%xmm11
   .byte  68,15,92,223                        // subps         %xmm7,%xmm11
   .byte  65,15,40,195                        // movaps        %xmm11,%xmm0
@@ -35727,7 +35427,7 @@
   .byte  15,41,116,36,232                    // movaps        %xmm6,-0x18(%rsp)
   .byte  15,40,245                           // movaps        %xmm5,%xmm6
   .byte  15,40,236                           // movaps        %xmm4,%xmm5
-  .byte  68,15,40,29,92,104,1,0              // movaps        0x1685c(%rip),%xmm11        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,29,200,102,1,0             // movaps        0x166c8(%rip),%xmm11        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,40,211                        // movaps        %xmm11,%xmm10
   .byte  68,15,92,215                        // subps         %xmm7,%xmm10
   .byte  69,15,40,194                        // movaps        %xmm10,%xmm8
@@ -35815,7 +35515,7 @@
 _sk_overlay_sse2:
   .byte  68,15,40,193                        // movaps        %xmm1,%xmm8
   .byte  68,15,40,232                        // movaps        %xmm0,%xmm13
-  .byte  68,15,40,13,26,103,1,0              // movaps        0x1671a(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,13,134,101,1,0             // movaps        0x16586(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,40,209                        // movaps        %xmm9,%xmm10
   .byte  68,15,92,215                        // subps         %xmm7,%xmm10
   .byte  69,15,40,218                        // movaps        %xmm10,%xmm11
@@ -35906,7 +35606,7 @@
   .byte  68,15,40,213                        // movaps        %xmm5,%xmm10
   .byte  68,15,94,215                        // divps         %xmm7,%xmm10
   .byte  69,15,84,212                        // andps         %xmm12,%xmm10
-  .byte  68,15,40,13,199,101,1,0             // movaps        0x165c7(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,13,51,100,1,0              // movaps        0x16433(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,40,249                        // movaps        %xmm9,%xmm15
   .byte  69,15,92,250                        // subps         %xmm10,%xmm15
   .byte  69,15,40,218                        // movaps        %xmm10,%xmm11
@@ -35919,10 +35619,10 @@
   .byte  65,15,40,194                        // movaps        %xmm10,%xmm0
   .byte  15,89,192                           // mulps         %xmm0,%xmm0
   .byte  65,15,88,194                        // addps         %xmm10,%xmm0
-  .byte  68,15,40,53,241,101,1,0             // movaps        0x165f1(%rip),%xmm14        # 3b5d0 <_sk_srcover_bgra_8888_sse2_lowp+0xd04>
+  .byte  68,15,40,53,93,100,1,0              // movaps        0x1645d(%rip),%xmm14        # 3ae10 <_sk_srcover_bgra_8888_sse2_lowp+0xd14>
   .byte  69,15,88,222                        // addps         %xmm14,%xmm11
   .byte  68,15,89,216                        // mulps         %xmm0,%xmm11
-  .byte  68,15,40,21,241,101,1,0             // movaps        0x165f1(%rip),%xmm10        # 3b5e0 <_sk_srcover_bgra_8888_sse2_lowp+0xd14>
+  .byte  68,15,40,21,93,100,1,0              // movaps        0x1645d(%rip),%xmm10        # 3ae20 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
   .byte  69,15,89,234                        // mulps         %xmm10,%xmm13
   .byte  69,15,88,235                        // addps         %xmm11,%xmm13
   .byte  15,88,228                           // addps         %xmm4,%xmm4
@@ -36067,7 +35767,7 @@
   .byte  68,15,40,209                        // movaps        %xmm1,%xmm10
   .byte  68,15,40,225                        // movaps        %xmm1,%xmm12
   .byte  68,15,89,211                        // mulps         %xmm3,%xmm10
-  .byte  68,15,40,5,132,99,1,0               // movaps        0x16384(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,240,97,1,0               // movaps        0x161f0(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,40,216                        // movaps        %xmm8,%xmm11
   .byte  15,40,207                           // movaps        %xmm7,%xmm1
   .byte  68,15,92,217                        // subps         %xmm1,%xmm11
@@ -36115,12 +35815,12 @@
   .byte  69,15,84,206                        // andps         %xmm14,%xmm9
   .byte  69,15,84,214                        // andps         %xmm14,%xmm10
   .byte  65,15,84,214                        // andps         %xmm14,%xmm2
-  .byte  68,15,40,61,65,99,1,0               // movaps        0x16341(%rip),%xmm15        # 3b5f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  .byte  68,15,40,61,173,97,1,0              // movaps        0x161ad(%rip),%xmm15        # 3ae30 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
   .byte  65,15,89,231                        // mulps         %xmm15,%xmm4
-  .byte  15,40,5,70,99,1,0                   // movaps        0x16346(%rip),%xmm0        # 3b600 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
+  .byte  15,40,5,178,97,1,0                  // movaps        0x161b2(%rip),%xmm0        # 3ae40 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
   .byte  15,89,240                           // mulps         %xmm0,%xmm6
   .byte  15,88,244                           // addps         %xmm4,%xmm6
-  .byte  68,15,40,53,72,99,1,0               // movaps        0x16348(%rip),%xmm14        # 3b610 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
+  .byte  68,15,40,53,180,97,1,0              // movaps        0x161b4(%rip),%xmm14        # 3ae50 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
   .byte  68,15,40,239                        // movaps        %xmm7,%xmm13
   .byte  69,15,89,238                        // mulps         %xmm14,%xmm13
   .byte  68,15,88,238                        // addps         %xmm6,%xmm13
@@ -36298,14 +35998,14 @@
   .byte  68,15,84,211                        // andps         %xmm3,%xmm10
   .byte  68,15,84,203                        // andps         %xmm3,%xmm9
   .byte  15,84,195                           // andps         %xmm3,%xmm0
-  .byte  68,15,40,5,154,96,1,0               // movaps        0x1609a(%rip),%xmm8        # 3b5f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  .byte  68,15,40,5,6,95,1,0                 // movaps        0x15f06(%rip),%xmm8        # 3ae30 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
   .byte  15,40,214                           // movaps        %xmm6,%xmm2
   .byte  65,15,89,208                        // mulps         %xmm8,%xmm2
-  .byte  15,40,13,156,96,1,0                 // movaps        0x1609c(%rip),%xmm1        # 3b600 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
+  .byte  15,40,13,8,95,1,0                   // movaps        0x15f08(%rip),%xmm1        # 3ae40 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
   .byte  15,40,221                           // movaps        %xmm5,%xmm3
   .byte  15,89,217                           // mulps         %xmm1,%xmm3
   .byte  15,88,218                           // addps         %xmm2,%xmm3
-  .byte  68,15,40,37,155,96,1,0              // movaps        0x1609b(%rip),%xmm12        # 3b610 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
+  .byte  68,15,40,37,7,95,1,0                // movaps        0x15f07(%rip),%xmm12        # 3ae50 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
   .byte  69,15,89,236                        // mulps         %xmm12,%xmm13
   .byte  68,15,88,235                        // addps         %xmm3,%xmm13
   .byte  65,15,40,210                        // movaps        %xmm10,%xmm2
@@ -36350,7 +36050,7 @@
   .byte  15,40,223                           // movaps        %xmm7,%xmm3
   .byte  15,40,236                           // movaps        %xmm4,%xmm5
   .byte  15,89,221                           // mulps         %xmm5,%xmm3
-  .byte  68,15,40,5,80,95,1,0                // movaps        0x15f50(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,188,93,1,0               // movaps        0x15dbc(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  65,15,40,224                        // movaps        %xmm8,%xmm4
   .byte  68,15,92,199                        // subps         %xmm7,%xmm8
   .byte  15,88,253                           // addps         %xmm5,%xmm7
@@ -36451,14 +36151,14 @@
   .byte  68,15,40,213                        // movaps        %xmm5,%xmm10
   .byte  69,15,89,208                        // mulps         %xmm8,%xmm10
   .byte  65,15,40,208                        // movaps        %xmm8,%xmm2
-  .byte  68,15,40,45,94,94,1,0               // movaps        0x15e5e(%rip),%xmm13        # 3b5f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  .byte  68,15,40,45,202,92,1,0              // movaps        0x15cca(%rip),%xmm13        # 3ae30 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
   .byte  68,15,40,198                        // movaps        %xmm6,%xmm8
   .byte  69,15,89,197                        // mulps         %xmm13,%xmm8
-  .byte  68,15,40,53,94,94,1,0               // movaps        0x15e5e(%rip),%xmm14        # 3b600 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
+  .byte  68,15,40,53,202,92,1,0              // movaps        0x15cca(%rip),%xmm14        # 3ae40 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
   .byte  65,15,40,195                        // movaps        %xmm11,%xmm0
   .byte  65,15,89,198                        // mulps         %xmm14,%xmm0
   .byte  65,15,88,192                        // addps         %xmm8,%xmm0
-  .byte  68,15,40,29,90,94,1,0               // movaps        0x15e5a(%rip),%xmm11        # 3b610 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
+  .byte  68,15,40,29,198,92,1,0              // movaps        0x15cc6(%rip),%xmm11        # 3ae50 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
   .byte  69,15,89,227                        // mulps         %xmm11,%xmm12
   .byte  68,15,88,224                        // addps         %xmm0,%xmm12
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
@@ -36466,7 +36166,7 @@
   .byte  69,15,40,250                        // movaps        %xmm10,%xmm15
   .byte  69,15,89,254                        // mulps         %xmm14,%xmm15
   .byte  68,15,88,248                        // addps         %xmm0,%xmm15
-  .byte  68,15,40,5,150,93,1,0               // movaps        0x15d96(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,2,92,1,0                 // movaps        0x15c02(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  65,15,40,224                        // movaps        %xmm8,%xmm4
   .byte  15,92,226                           // subps         %xmm2,%xmm4
   .byte  15,89,252                           // mulps         %xmm4,%xmm7
@@ -36602,15 +36302,15 @@
   .byte  68,15,40,205                        // movaps        %xmm5,%xmm9
   .byte  68,15,89,204                        // mulps         %xmm4,%xmm9
   .byte  15,89,222                           // mulps         %xmm6,%xmm3
-  .byte  68,15,40,37,29,92,1,0               // movaps        0x15c1d(%rip),%xmm12        # 3b5f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  .byte  68,15,40,37,137,90,1,0              // movaps        0x15a89(%rip),%xmm12        # 3ae30 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
   .byte  68,15,40,199                        // movaps        %xmm7,%xmm8
   .byte  69,15,89,196                        // mulps         %xmm12,%xmm8
-  .byte  68,15,40,45,29,92,1,0               // movaps        0x15c1d(%rip),%xmm13        # 3b600 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
+  .byte  68,15,40,45,137,90,1,0              // movaps        0x15a89(%rip),%xmm13        # 3ae40 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
   .byte  68,15,40,241                        // movaps        %xmm1,%xmm14
   .byte  69,15,89,245                        // mulps         %xmm13,%xmm14
   .byte  69,15,88,240                        // addps         %xmm8,%xmm14
-  .byte  68,15,40,29,25,92,1,0               // movaps        0x15c19(%rip),%xmm11        # 3b610 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
-  .byte  68,15,40,5,113,91,1,0               // movaps        0x15b71(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,29,133,90,1,0              // movaps        0x15a85(%rip),%xmm11        # 3ae50 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  68,15,40,5,221,89,1,0               // movaps        0x159dd(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,40,248                        // movaps        %xmm8,%xmm15
   .byte  65,15,40,194                        // movaps        %xmm10,%xmm0
   .byte  68,15,92,248                        // subps         %xmm0,%xmm15
@@ -36745,17 +36445,15 @@
 _sk_srcover_rgba_8888_sse2:
   .byte  102,68,15,111,200                   // movdqa        %xmm0,%xmm9
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,4,1,0,0                      // jne           25d0f <_sk_srcover_rgba_8888_sse2+0x129>
-  .byte  243,65,15,111,4,128                 // movdqu        (%r8,%rax,4),%xmm0
+  .byte  15,133,4,1,0,0                      // jne           256dd <_sk_srcover_rgba_8888_sse2+0x123>
+  .byte  243,65,15,111,4,144                 // movdqu        (%r8,%rdx,4),%xmm0
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  102,15,111,53,4,90,1,0              // movdqa        0x15a04(%rip),%xmm6        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  102,15,111,53,118,88,1,0            // movdqa        0x15876(%rip),%xmm6        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  102,15,111,224                      // movdqa        %xmm0,%xmm4
   .byte  102,15,219,230                      // pand          %xmm6,%xmm4
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
@@ -36770,9 +36468,9 @@
   .byte  15,91,247                           // cvtdq2ps      %xmm7,%xmm6
   .byte  102,15,114,208,24                   // psrld         $0x18,%xmm0
   .byte  15,91,248                           // cvtdq2ps      %xmm0,%xmm7
-  .byte  68,15,40,5,21,89,1,0                // movaps        0x15915(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,135,87,1,0               // movaps        0x15787(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,92,195                        // subps         %xmm3,%xmm8
-  .byte  68,15,40,37,233,89,1,0              // movaps        0x159e9(%rip),%xmm12        # 3b650 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  .byte  68,15,40,37,91,88,1,0               // movaps        0x1585b(%rip),%xmm12        # 3ae90 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
   .byte  69,15,89,204                        // mulps         %xmm12,%xmm9
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  15,89,196                           // mulps         %xmm4,%xmm0
@@ -36809,42 +36507,42 @@
   .byte  102,15,114,241,24                   // pslld         $0x18,%xmm1
   .byte  102,15,235,203                      // por           %xmm3,%xmm1
   .byte  102,15,235,202                      // por           %xmm2,%xmm1
-  .byte  117,78                              // jne           25d47 <_sk_srcover_rgba_8888_sse2+0x161>
-  .byte  243,65,15,127,12,128                // movdqu        %xmm1,(%r8,%rax,4)
+  .byte  117,69                              // jne           2570c <_sk_srcover_rgba_8888_sse2+0x152>
+  .byte  243,65,15,127,12,144                // movdqu        %xmm1,(%r8,%rdx,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,201                        // movaps        %xmm9,%xmm1
   .byte  65,15,40,210                        // movaps        %xmm10,%xmm2
   .byte  65,15,40,216                        // movaps        %xmm8,%xmm3
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,88                              // je            25d74 <_sk_srcover_rgba_8888_sse2+0x18e>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,75                              // je            25730 <_sk_srcover_rgba_8888_sse2+0x176>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,22                              // je            25d3c <_sk_srcover_rgba_8888_sse2+0x156>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  15,133,225,254,255,255              // jne           25c11 <_sk_srcover_rgba_8888_sse2+0x2b>
-  .byte  102,65,15,110,68,128,8              // movd          0x8(%r8,%rax,4),%xmm0
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,20                              // je            25701 <_sk_srcover_rgba_8888_sse2+0x147>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  15,133,234,254,255,255              // jne           255df <_sk_srcover_rgba_8888_sse2+0x25>
+  .byte  102,65,15,110,68,144,8              // movd          0x8(%r8,%rdx,4),%xmm0
   .byte  102,15,112,192,69                   // pshufd        $0x45,%xmm0,%xmm0
-  .byte  102,65,15,18,4,128                  // movlpd        (%r8,%rax,4),%xmm0
-  .byte  233,202,254,255,255                 // jmpq          25c11 <_sk_srcover_rgba_8888_sse2+0x2b>
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,43                              // je            25d7f <_sk_srcover_rgba_8888_sse2+0x199>
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,18                              // je            25d6c <_sk_srcover_rgba_8888_sse2+0x186>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,159                             // jne           25cff <_sk_srcover_rgba_8888_sse2+0x119>
+  .byte  102,65,15,18,4,144                  // movlpd        (%r8,%rdx,4),%xmm0
+  .byte  233,211,254,255,255                 // jmpq          255df <_sk_srcover_rgba_8888_sse2+0x25>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,39                              // je            2573b <_sk_srcover_rgba_8888_sse2+0x181>
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,16                              // je            25728 <_sk_srcover_rgba_8888_sse2+0x16e>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,177                             // jne           256cd <_sk_srcover_rgba_8888_sse2+0x113>
   .byte  102,15,112,209,78                   // pshufd        $0x4e,%xmm1,%xmm2
-  .byte  102,65,15,126,84,128,8              // movd          %xmm2,0x8(%r8,%rax,4)
-  .byte  102,65,15,214,12,128                // movq          %xmm1,(%r8,%rax,4)
-  .byte  235,139                             // jmp           25cff <_sk_srcover_rgba_8888_sse2+0x119>
-  .byte  102,65,15,110,4,128                 // movd          (%r8,%rax,4),%xmm0
-  .byte  233,146,254,255,255                 // jmpq          25c11 <_sk_srcover_rgba_8888_sse2+0x2b>
-  .byte  102,65,15,126,12,128                // movd          %xmm1,(%r8,%rax,4)
-  .byte  233,117,255,255,255                 // jmpq          25cff <_sk_srcover_rgba_8888_sse2+0x119>
+  .byte  102,65,15,126,84,144,8              // movd          %xmm2,0x8(%r8,%rdx,4)
+  .byte  102,65,15,214,12,144                // movq          %xmm1,(%r8,%rdx,4)
+  .byte  235,157                             // jmp           256cd <_sk_srcover_rgba_8888_sse2+0x113>
+  .byte  102,65,15,110,4,144                 // movd          (%r8,%rdx,4),%xmm0
+  .byte  233,164,254,255,255                 // jmpq          255df <_sk_srcover_rgba_8888_sse2+0x25>
+  .byte  102,65,15,126,12,144                // movd          %xmm1,(%r8,%rdx,4)
+  .byte  235,138                             // jmp           256cd <_sk_srcover_rgba_8888_sse2+0x113>
 
 HIDDEN _sk_srcover_bgra_8888_sse2
 .globl _sk_srcover_bgra_8888_sse2
@@ -36852,17 +36550,15 @@
 _sk_srcover_bgra_8888_sse2:
   .byte  102,68,15,111,200                   // movdqa        %xmm0,%xmm9
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,4,1,0,0                      // jne           25eb3 <_sk_srcover_bgra_8888_sse2+0x129>
-  .byte  243,65,15,111,4,128                 // movdqu        (%r8,%rax,4),%xmm0
+  .byte  15,133,4,1,0,0                      // jne           25866 <_sk_srcover_bgra_8888_sse2+0x123>
+  .byte  243,65,15,111,4,144                 // movdqu        (%r8,%rdx,4),%xmm0
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  102,15,111,37,96,88,1,0             // movdqa        0x15860(%rip),%xmm4        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  102,15,111,37,237,86,1,0            // movdqa        0x156ed(%rip),%xmm4        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  102,15,111,232                      // movdqa        %xmm0,%xmm5
   .byte  102,15,219,236                      // pand          %xmm4,%xmm5
   .byte  15,91,245                           // cvtdq2ps      %xmm5,%xmm6
@@ -36877,9 +36573,9 @@
   .byte  15,91,231                           // cvtdq2ps      %xmm7,%xmm4
   .byte  102,15,114,208,24                   // psrld         $0x18,%xmm0
   .byte  15,91,248                           // cvtdq2ps      %xmm0,%xmm7
-  .byte  68,15,40,5,113,87,1,0               // movaps        0x15771(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,254,85,1,0               // movaps        0x155fe(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,92,195                        // subps         %xmm3,%xmm8
-  .byte  68,15,40,37,69,88,1,0               // movaps        0x15845(%rip),%xmm12        # 3b650 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  .byte  68,15,40,37,210,86,1,0              // movaps        0x156d2(%rip),%xmm12        # 3ae90 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
   .byte  69,15,89,204                        // mulps         %xmm12,%xmm9
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  15,89,196                           // mulps         %xmm4,%xmm0
@@ -36916,42 +36612,42 @@
   .byte  102,15,114,241,24                   // pslld         $0x18,%xmm1
   .byte  102,15,235,203                      // por           %xmm3,%xmm1
   .byte  102,15,235,202                      // por           %xmm2,%xmm1
-  .byte  117,78                              // jne           25eeb <_sk_srcover_bgra_8888_sse2+0x161>
-  .byte  243,65,15,127,12,128                // movdqu        %xmm1,(%r8,%rax,4)
+  .byte  117,69                              // jne           25895 <_sk_srcover_bgra_8888_sse2+0x152>
+  .byte  243,65,15,127,12,144                // movdqu        %xmm1,(%r8,%rdx,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,201                        // movaps        %xmm9,%xmm1
   .byte  65,15,40,210                        // movaps        %xmm10,%xmm2
   .byte  65,15,40,216                        // movaps        %xmm8,%xmm3
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,88                              // je            25f18 <_sk_srcover_bgra_8888_sse2+0x18e>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,75                              // je            258b9 <_sk_srcover_bgra_8888_sse2+0x176>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,22                              // je            25ee0 <_sk_srcover_bgra_8888_sse2+0x156>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  15,133,225,254,255,255              // jne           25db5 <_sk_srcover_bgra_8888_sse2+0x2b>
-  .byte  102,65,15,110,68,128,8              // movd          0x8(%r8,%rax,4),%xmm0
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,20                              // je            2588a <_sk_srcover_bgra_8888_sse2+0x147>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  15,133,234,254,255,255              // jne           25768 <_sk_srcover_bgra_8888_sse2+0x25>
+  .byte  102,65,15,110,68,144,8              // movd          0x8(%r8,%rdx,4),%xmm0
   .byte  102,15,112,192,69                   // pshufd        $0x45,%xmm0,%xmm0
-  .byte  102,65,15,18,4,128                  // movlpd        (%r8,%rax,4),%xmm0
-  .byte  233,202,254,255,255                 // jmpq          25db5 <_sk_srcover_bgra_8888_sse2+0x2b>
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,43                              // je            25f23 <_sk_srcover_bgra_8888_sse2+0x199>
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,18                              // je            25f10 <_sk_srcover_bgra_8888_sse2+0x186>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,159                             // jne           25ea3 <_sk_srcover_bgra_8888_sse2+0x119>
+  .byte  102,65,15,18,4,144                  // movlpd        (%r8,%rdx,4),%xmm0
+  .byte  233,211,254,255,255                 // jmpq          25768 <_sk_srcover_bgra_8888_sse2+0x25>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,39                              // je            258c4 <_sk_srcover_bgra_8888_sse2+0x181>
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,16                              // je            258b1 <_sk_srcover_bgra_8888_sse2+0x16e>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,177                             // jne           25856 <_sk_srcover_bgra_8888_sse2+0x113>
   .byte  102,15,112,209,78                   // pshufd        $0x4e,%xmm1,%xmm2
-  .byte  102,65,15,126,84,128,8              // movd          %xmm2,0x8(%r8,%rax,4)
-  .byte  102,65,15,214,12,128                // movq          %xmm1,(%r8,%rax,4)
-  .byte  235,139                             // jmp           25ea3 <_sk_srcover_bgra_8888_sse2+0x119>
-  .byte  102,65,15,110,4,128                 // movd          (%r8,%rax,4),%xmm0
-  .byte  233,146,254,255,255                 // jmpq          25db5 <_sk_srcover_bgra_8888_sse2+0x2b>
-  .byte  102,65,15,126,12,128                // movd          %xmm1,(%r8,%rax,4)
-  .byte  233,117,255,255,255                 // jmpq          25ea3 <_sk_srcover_bgra_8888_sse2+0x119>
+  .byte  102,65,15,126,84,144,8              // movd          %xmm2,0x8(%r8,%rdx,4)
+  .byte  102,65,15,214,12,144                // movq          %xmm1,(%r8,%rdx,4)
+  .byte  235,157                             // jmp           25856 <_sk_srcover_bgra_8888_sse2+0x113>
+  .byte  102,65,15,110,4,144                 // movd          (%r8,%rdx,4),%xmm0
+  .byte  233,164,254,255,255                 // jmpq          25768 <_sk_srcover_bgra_8888_sse2+0x25>
+  .byte  102,65,15,126,12,144                // movd          %xmm1,(%r8,%rdx,4)
+  .byte  235,138                             // jmp           25856 <_sk_srcover_bgra_8888_sse2+0x113>
 
 HIDDEN _sk_clamp_0_sse2
 .globl _sk_clamp_0_sse2
@@ -36969,7 +36665,7 @@
 .globl _sk_clamp_1_sse2
 FUNCTION(_sk_clamp_1_sse2)
 _sk_clamp_1_sse2:
-  .byte  68,15,40,5,34,86,1,0                // movaps        0x15622(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,196,84,1,0               // movaps        0x154c4(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  65,15,93,192                        // minps         %xmm8,%xmm0
   .byte  65,15,93,200                        // minps         %xmm8,%xmm1
   .byte  65,15,93,208                        // minps         %xmm8,%xmm2
@@ -36981,7 +36677,7 @@
 .globl _sk_clamp_a_sse2
 FUNCTION(_sk_clamp_a_sse2)
 _sk_clamp_a_sse2:
-  .byte  15,93,29,7,86,1,0                   // minps         0x15607(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,93,29,169,84,1,0                 // minps         0x154a9(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,93,195                           // minps         %xmm3,%xmm0
   .byte  15,93,203                           // minps         %xmm3,%xmm1
   .byte  15,93,211                           // minps         %xmm3,%xmm2
@@ -36992,7 +36688,7 @@
 .globl _sk_clamp_a_dst_sse2
 FUNCTION(_sk_clamp_a_dst_sse2)
 _sk_clamp_a_dst_sse2:
-  .byte  15,93,61,243,85,1,0                 // minps         0x155f3(%rip),%xmm7        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,93,61,149,84,1,0                 // minps         0x15495(%rip),%xmm7        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,93,231                           // minps         %xmm7,%xmm4
   .byte  15,93,239                           // minps         %xmm7,%xmm5
   .byte  15,93,247                           // minps         %xmm7,%xmm6
@@ -37027,7 +36723,7 @@
 .globl _sk_invert_sse2
 FUNCTION(_sk_invert_sse2)
 _sk_invert_sse2:
-  .byte  68,15,40,5,175,85,1,0               // movaps        0x155af(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,81,84,1,0                // movaps        0x15451(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  68,15,92,200                        // subps         %xmm0,%xmm9
   .byte  69,15,40,208                        // movaps        %xmm8,%xmm10
@@ -37088,10 +36784,10 @@
 .globl _sk_unpremul_sse2
 FUNCTION(_sk_unpremul_sse2)
 _sk_unpremul_sse2:
-  .byte  68,15,40,5,61,85,1,0                // movaps        0x1553d(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,223,83,1,0               // movaps        0x153df(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,94,195                        // divps         %xmm3,%xmm8
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
-  .byte  68,15,194,13,28,86,1,0,1            // cmpltps       0x1561c(%rip),%xmm9        # 3b660 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
+  .byte  68,15,194,13,190,84,1,0,1           // cmpltps       0x154be(%rip),%xmm9        # 3aea0 <_sk_srcover_bgra_8888_sse2_lowp+0xda4>
   .byte  69,15,84,200                        // andps         %xmm8,%xmm9
   .byte  65,15,89,193                        // mulps         %xmm9,%xmm0
   .byte  65,15,89,201                        // mulps         %xmm9,%xmm1
@@ -37103,20 +36799,20 @@
 .globl _sk_from_srgb_sse2
 FUNCTION(_sk_from_srgb_sse2)
 _sk_from_srgb_sse2:
-  .byte  68,15,40,5,16,86,1,0                // movaps        0x15610(%rip),%xmm8        # 3b670 <_sk_srcover_bgra_8888_sse2_lowp+0xda4>
+  .byte  68,15,40,5,178,84,1,0               // movaps        0x154b2(%rip),%xmm8        # 3aeb0 <_sk_srcover_bgra_8888_sse2_lowp+0xdb4>
   .byte  68,15,40,232                        // movaps        %xmm0,%xmm13
   .byte  69,15,89,232                        // mulps         %xmm8,%xmm13
   .byte  68,15,40,216                        // movaps        %xmm0,%xmm11
   .byte  69,15,89,219                        // mulps         %xmm11,%xmm11
-  .byte  68,15,40,13,120,85,1,0              // movaps        0x15578(%rip),%xmm9        # 3b5f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  .byte  68,15,40,13,26,84,1,0               // movaps        0x1541a(%rip),%xmm9        # 3ae30 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
   .byte  68,15,40,240                        // movaps        %xmm0,%xmm14
   .byte  69,15,89,241                        // mulps         %xmm9,%xmm14
-  .byte  68,15,40,21,248,85,1,0              // movaps        0x155f8(%rip),%xmm10        # 3b680 <_sk_srcover_bgra_8888_sse2_lowp+0xdb4>
+  .byte  68,15,40,21,154,84,1,0              // movaps        0x1549a(%rip),%xmm10        # 3aec0 <_sk_srcover_bgra_8888_sse2_lowp+0xdc4>
   .byte  69,15,88,242                        // addps         %xmm10,%xmm14
   .byte  69,15,89,243                        // mulps         %xmm11,%xmm14
-  .byte  68,15,40,29,248,85,1,0              // movaps        0x155f8(%rip),%xmm11        # 3b690 <_sk_srcover_bgra_8888_sse2_lowp+0xdc4>
+  .byte  68,15,40,29,154,84,1,0              // movaps        0x1549a(%rip),%xmm11        # 3aed0 <_sk_srcover_bgra_8888_sse2_lowp+0xdd4>
   .byte  69,15,88,243                        // addps         %xmm11,%xmm14
-  .byte  68,15,40,37,252,85,1,0              // movaps        0x155fc(%rip),%xmm12        # 3b6a0 <_sk_srcover_bgra_8888_sse2_lowp+0xdd4>
+  .byte  68,15,40,37,158,84,1,0              // movaps        0x1549e(%rip),%xmm12        # 3aee0 <_sk_srcover_bgra_8888_sse2_lowp+0xde4>
   .byte  65,15,194,196,1                     // cmpltps       %xmm12,%xmm0
   .byte  68,15,84,232                        // andps         %xmm0,%xmm13
   .byte  65,15,85,198                        // andnps        %xmm14,%xmm0
@@ -37152,20 +36848,20 @@
 .globl _sk_from_srgb_dst_sse2
 FUNCTION(_sk_from_srgb_dst_sse2)
 _sk_from_srgb_dst_sse2:
-  .byte  68,15,40,5,77,85,1,0                // movaps        0x1554d(%rip),%xmm8        # 3b670 <_sk_srcover_bgra_8888_sse2_lowp+0xda4>
+  .byte  68,15,40,5,239,83,1,0               // movaps        0x153ef(%rip),%xmm8        # 3aeb0 <_sk_srcover_bgra_8888_sse2_lowp+0xdb4>
   .byte  68,15,40,236                        // movaps        %xmm4,%xmm13
   .byte  69,15,89,232                        // mulps         %xmm8,%xmm13
   .byte  68,15,40,220                        // movaps        %xmm4,%xmm11
   .byte  69,15,89,219                        // mulps         %xmm11,%xmm11
-  .byte  68,15,40,13,181,84,1,0              // movaps        0x154b5(%rip),%xmm9        # 3b5f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  .byte  68,15,40,13,87,83,1,0               // movaps        0x15357(%rip),%xmm9        # 3ae30 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
   .byte  68,15,40,244                        // movaps        %xmm4,%xmm14
   .byte  69,15,89,241                        // mulps         %xmm9,%xmm14
-  .byte  68,15,40,21,53,85,1,0               // movaps        0x15535(%rip),%xmm10        # 3b680 <_sk_srcover_bgra_8888_sse2_lowp+0xdb4>
+  .byte  68,15,40,21,215,83,1,0              // movaps        0x153d7(%rip),%xmm10        # 3aec0 <_sk_srcover_bgra_8888_sse2_lowp+0xdc4>
   .byte  69,15,88,242                        // addps         %xmm10,%xmm14
   .byte  69,15,89,243                        // mulps         %xmm11,%xmm14
-  .byte  68,15,40,29,53,85,1,0               // movaps        0x15535(%rip),%xmm11        # 3b690 <_sk_srcover_bgra_8888_sse2_lowp+0xdc4>
+  .byte  68,15,40,29,215,83,1,0              // movaps        0x153d7(%rip),%xmm11        # 3aed0 <_sk_srcover_bgra_8888_sse2_lowp+0xdd4>
   .byte  69,15,88,243                        // addps         %xmm11,%xmm14
-  .byte  68,15,40,37,57,85,1,0               // movaps        0x15539(%rip),%xmm12        # 3b6a0 <_sk_srcover_bgra_8888_sse2_lowp+0xdd4>
+  .byte  68,15,40,37,219,83,1,0              // movaps        0x153db(%rip),%xmm12        # 3aee0 <_sk_srcover_bgra_8888_sse2_lowp+0xde4>
   .byte  65,15,194,228,1                     // cmpltps       %xmm12,%xmm4
   .byte  68,15,84,236                        // andps         %xmm4,%xmm13
   .byte  65,15,85,230                        // andnps        %xmm14,%xmm4
@@ -37202,22 +36898,22 @@
 FUNCTION(_sk_to_srgb_sse2)
 _sk_to_srgb_sse2:
   .byte  68,15,82,232                        // rsqrtps       %xmm0,%xmm13
-  .byte  68,15,40,5,198,84,1,0               // movaps        0x154c6(%rip),%xmm8        # 3b6b0 <_sk_srcover_bgra_8888_sse2_lowp+0xde4>
+  .byte  68,15,40,5,104,83,1,0               // movaps        0x15368(%rip),%xmm8        # 3aef0 <_sk_srcover_bgra_8888_sse2_lowp+0xdf4>
   .byte  68,15,40,240                        // movaps        %xmm0,%xmm14
   .byte  69,15,89,240                        // mulps         %xmm8,%xmm14
-  .byte  68,15,40,13,198,84,1,0              // movaps        0x154c6(%rip),%xmm9        # 3b6c0 <_sk_srcover_bgra_8888_sse2_lowp+0xdf4>
+  .byte  68,15,40,13,104,83,1,0              // movaps        0x15368(%rip),%xmm9        # 3af00 <_sk_srcover_bgra_8888_sse2_lowp+0xe04>
   .byte  69,15,40,253                        // movaps        %xmm13,%xmm15
   .byte  69,15,89,249                        // mulps         %xmm9,%xmm15
-  .byte  68,15,40,21,198,84,1,0              // movaps        0x154c6(%rip),%xmm10        # 3b6d0 <_sk_srcover_bgra_8888_sse2_lowp+0xe04>
+  .byte  68,15,40,21,104,83,1,0              // movaps        0x15368(%rip),%xmm10        # 3af10 <_sk_srcover_bgra_8888_sse2_lowp+0xe14>
   .byte  69,15,88,250                        // addps         %xmm10,%xmm15
   .byte  69,15,89,253                        // mulps         %xmm13,%xmm15
-  .byte  68,15,40,29,198,84,1,0              // movaps        0x154c6(%rip),%xmm11        # 3b6e0 <_sk_srcover_bgra_8888_sse2_lowp+0xe14>
+  .byte  68,15,40,29,104,83,1,0              // movaps        0x15368(%rip),%xmm11        # 3af20 <_sk_srcover_bgra_8888_sse2_lowp+0xe24>
   .byte  69,15,88,251                        // addps         %xmm11,%xmm15
-  .byte  68,15,40,37,202,84,1,0              // movaps        0x154ca(%rip),%xmm12        # 3b6f0 <_sk_srcover_bgra_8888_sse2_lowp+0xe24>
+  .byte  68,15,40,37,108,83,1,0              // movaps        0x1536c(%rip),%xmm12        # 3af30 <_sk_srcover_bgra_8888_sse2_lowp+0xe34>
   .byte  69,15,88,236                        // addps         %xmm12,%xmm13
   .byte  69,15,83,237                        // rcpps         %xmm13,%xmm13
   .byte  69,15,89,239                        // mulps         %xmm15,%xmm13
-  .byte  68,15,40,61,198,84,1,0              // movaps        0x154c6(%rip),%xmm15        # 3b700 <_sk_srcover_bgra_8888_sse2_lowp+0xe34>
+  .byte  68,15,40,61,104,83,1,0              // movaps        0x15368(%rip),%xmm15        # 3af40 <_sk_srcover_bgra_8888_sse2_lowp+0xe44>
   .byte  65,15,194,199,1                     // cmpltps       %xmm15,%xmm0
   .byte  68,15,84,240                        // andps         %xmm0,%xmm14
   .byte  65,15,85,197                        // andnps        %xmm13,%xmm0
@@ -37269,7 +36965,7 @@
   .byte  68,15,93,216                        // minps         %xmm0,%xmm11
   .byte  65,15,40,202                        // movaps        %xmm10,%xmm1
   .byte  65,15,92,203                        // subps         %xmm11,%xmm1
-  .byte  68,15,40,45,121,82,1,0              // movaps        0x15279(%rip),%xmm13        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,45,27,81,1,0               // movaps        0x1511b(%rip),%xmm13        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,94,233                        // divps         %xmm1,%xmm13
   .byte  65,15,40,194                        // movaps        %xmm10,%xmm0
   .byte  65,15,194,192,0                     // cmpeqps       %xmm8,%xmm0
@@ -37278,30 +36974,30 @@
   .byte  69,15,89,229                        // mulps         %xmm13,%xmm12
   .byte  69,15,40,241                        // movaps        %xmm9,%xmm14
   .byte  68,15,194,242,1                     // cmpltps       %xmm2,%xmm14
-  .byte  68,15,84,53,239,83,1,0              // andps         0x153ef(%rip),%xmm14        # 3b710 <_sk_srcover_bgra_8888_sse2_lowp+0xe44>
+  .byte  68,15,84,53,145,82,1,0              // andps         0x15291(%rip),%xmm14        # 3af50 <_sk_srcover_bgra_8888_sse2_lowp+0xe54>
   .byte  69,15,88,244                        // addps         %xmm12,%xmm14
   .byte  69,15,40,250                        // movaps        %xmm10,%xmm15
   .byte  69,15,194,249,0                     // cmpeqps       %xmm9,%xmm15
   .byte  65,15,92,208                        // subps         %xmm8,%xmm2
   .byte  65,15,89,213                        // mulps         %xmm13,%xmm2
-  .byte  68,15,40,37,226,83,1,0              // movaps        0x153e2(%rip),%xmm12        # 3b720 <_sk_srcover_bgra_8888_sse2_lowp+0xe54>
+  .byte  68,15,40,37,132,82,1,0              // movaps        0x15284(%rip),%xmm12        # 3af60 <_sk_srcover_bgra_8888_sse2_lowp+0xe64>
   .byte  65,15,88,212                        // addps         %xmm12,%xmm2
   .byte  69,15,92,193                        // subps         %xmm9,%xmm8
   .byte  69,15,89,197                        // mulps         %xmm13,%xmm8
-  .byte  68,15,88,5,222,83,1,0               // addps         0x153de(%rip),%xmm8        # 3b730 <_sk_srcover_bgra_8888_sse2_lowp+0xe64>
+  .byte  68,15,88,5,128,82,1,0               // addps         0x15280(%rip),%xmm8        # 3af70 <_sk_srcover_bgra_8888_sse2_lowp+0xe74>
   .byte  65,15,84,215                        // andps         %xmm15,%xmm2
   .byte  69,15,85,248                        // andnps        %xmm8,%xmm15
   .byte  68,15,86,250                        // orps          %xmm2,%xmm15
   .byte  68,15,84,240                        // andps         %xmm0,%xmm14
   .byte  65,15,85,199                        // andnps        %xmm15,%xmm0
   .byte  65,15,86,198                        // orps          %xmm14,%xmm0
-  .byte  15,89,5,207,83,1,0                  // mulps         0x153cf(%rip),%xmm0        # 3b740 <_sk_srcover_bgra_8888_sse2_lowp+0xe74>
+  .byte  15,89,5,113,82,1,0                  // mulps         0x15271(%rip),%xmm0        # 3af80 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
   .byte  69,15,40,194                        // movaps        %xmm10,%xmm8
   .byte  69,15,194,195,4                     // cmpneqps      %xmm11,%xmm8
   .byte  65,15,84,192                        // andps         %xmm8,%xmm0
   .byte  69,15,92,226                        // subps         %xmm10,%xmm12
   .byte  69,15,88,211                        // addps         %xmm11,%xmm10
-  .byte  68,15,40,13,210,81,1,0              // movaps        0x151d2(%rip),%xmm9        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  68,15,40,13,116,80,1,0              // movaps        0x15074(%rip),%xmm9        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  65,15,40,210                        // movaps        %xmm10,%xmm2
   .byte  65,15,89,209                        // mulps         %xmm9,%xmm2
   .byte  68,15,194,202,1                     // cmpltps       %xmm2,%xmm9
@@ -37325,7 +37021,7 @@
   .byte  15,41,92,36,168                     // movaps        %xmm3,-0x58(%rsp)
   .byte  68,15,40,218                        // movaps        %xmm2,%xmm11
   .byte  15,40,240                           // movaps        %xmm0,%xmm6
-  .byte  68,15,40,13,129,81,1,0              // movaps        0x15181(%rip),%xmm9        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  68,15,40,13,35,80,1,0               // movaps        0x15023(%rip),%xmm9        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  69,15,40,209                        // movaps        %xmm9,%xmm10
   .byte  69,15,194,211,2                     // cmpleps       %xmm11,%xmm10
   .byte  15,40,193                           // movaps        %xmm1,%xmm0
@@ -37342,28 +37038,28 @@
   .byte  69,15,88,211                        // addps         %xmm11,%xmm10
   .byte  69,15,88,219                        // addps         %xmm11,%xmm11
   .byte  69,15,92,218                        // subps         %xmm10,%xmm11
-  .byte  15,40,5,42,83,1,0                   // movaps        0x1532a(%rip),%xmm0        # 3b750 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  .byte  15,40,5,204,81,1,0                  // movaps        0x151cc(%rip),%xmm0        # 3af90 <_sk_srcover_bgra_8888_sse2_lowp+0xe94>
   .byte  15,88,198                           // addps         %xmm6,%xmm0
   .byte  243,15,91,200                       // cvttps2dq     %xmm0,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
   .byte  15,40,216                           // movaps        %xmm0,%xmm3
   .byte  15,194,217,1                        // cmpltps       %xmm1,%xmm3
-  .byte  15,84,29,50,81,1,0                  // andps         0x15132(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,84,29,212,79,1,0                 // andps         0x14fd4(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,92,203                           // subps         %xmm3,%xmm1
   .byte  15,92,193                           // subps         %xmm1,%xmm0
-  .byte  68,15,40,45,20,83,1,0               // movaps        0x15314(%rip),%xmm13        # 3b760 <_sk_srcover_bgra_8888_sse2_lowp+0xe94>
+  .byte  68,15,40,45,182,81,1,0              // movaps        0x151b6(%rip),%xmm13        # 3afa0 <_sk_srcover_bgra_8888_sse2_lowp+0xea4>
   .byte  69,15,40,197                        // movaps        %xmm13,%xmm8
   .byte  68,15,194,192,2                     // cmpleps       %xmm0,%xmm8
   .byte  69,15,40,242                        // movaps        %xmm10,%xmm14
   .byte  69,15,92,243                        // subps         %xmm11,%xmm14
   .byte  65,15,40,217                        // movaps        %xmm9,%xmm3
   .byte  15,194,216,2                        // cmpleps       %xmm0,%xmm3
-  .byte  15,40,21,212,82,1,0                 // movaps        0x152d4(%rip),%xmm2        # 3b740 <_sk_srcover_bgra_8888_sse2_lowp+0xe74>
+  .byte  15,40,21,118,81,1,0                 // movaps        0x15176(%rip),%xmm2        # 3af80 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
   .byte  68,15,40,250                        // movaps        %xmm2,%xmm15
   .byte  68,15,194,248,2                     // cmpleps       %xmm0,%xmm15
-  .byte  15,40,13,148,82,1,0                 // movaps        0x15294(%rip),%xmm1        # 3b710 <_sk_srcover_bgra_8888_sse2_lowp+0xe44>
+  .byte  15,40,13,54,81,1,0                  // movaps        0x15136(%rip),%xmm1        # 3af50 <_sk_srcover_bgra_8888_sse2_lowp+0xe54>
   .byte  15,89,193                           // mulps         %xmm1,%xmm0
-  .byte  15,40,45,170,82,1,0                 // movaps        0x152aa(%rip),%xmm5        # 3b730 <_sk_srcover_bgra_8888_sse2_lowp+0xe64>
+  .byte  15,40,45,76,81,1,0                  // movaps        0x1514c(%rip),%xmm5        # 3af70 <_sk_srcover_bgra_8888_sse2_lowp+0xe74>
   .byte  15,40,229                           // movaps        %xmm5,%xmm4
   .byte  15,92,224                           // subps         %xmm0,%xmm4
   .byte  65,15,89,230                        // mulps         %xmm14,%xmm4
@@ -37386,7 +37082,7 @@
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
   .byte  15,40,222                           // movaps        %xmm6,%xmm3
   .byte  15,194,216,1                        // cmpltps       %xmm0,%xmm3
-  .byte  15,84,29,143,80,1,0                 // andps         0x1508f(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,84,29,49,79,1,0                  // andps         0x14f31(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,92,195                           // subps         %xmm3,%xmm0
   .byte  68,15,40,230                        // movaps        %xmm6,%xmm12
   .byte  68,15,92,224                        // subps         %xmm0,%xmm12
@@ -37416,12 +37112,12 @@
   .byte  15,40,124,36,136                    // movaps        -0x78(%rsp),%xmm7
   .byte  15,40,231                           // movaps        %xmm7,%xmm4
   .byte  15,85,227                           // andnps        %xmm3,%xmm4
-  .byte  15,88,53,23,82,1,0                  // addps         0x15217(%rip),%xmm6        # 3b770 <_sk_srcover_bgra_8888_sse2_lowp+0xea4>
+  .byte  15,88,53,185,80,1,0                 // addps         0x150b9(%rip),%xmm6        # 3afb0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
   .byte  243,15,91,198                       // cvttps2dq     %xmm6,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
   .byte  15,40,222                           // movaps        %xmm6,%xmm3
   .byte  15,194,216,1                        // cmpltps       %xmm0,%xmm3
-  .byte  15,84,29,2,80,1,0                   // andps         0x15002(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,84,29,164,78,1,0                 // andps         0x14ea4(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,92,195                           // subps         %xmm3,%xmm0
   .byte  15,92,240                           // subps         %xmm0,%xmm6
   .byte  15,89,206                           // mulps         %xmm6,%xmm1
@@ -37479,19 +37175,17 @@
 FUNCTION(_sk_scale_u8_sse2)
 _sk_scale_u8_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,61                              // jne           2666f <_sk_scale_u8_sse2+0x55>
-  .byte  102,71,15,110,4,16                  // movd          (%r8,%r10,1),%xmm8
+  .byte  117,61                              // jne           26007 <_sk_scale_u8_sse2+0x4f>
+  .byte  102,69,15,110,4,16                  // movd          (%r8,%rdx,1),%xmm8
   .byte  102,68,15,96,192                    // punpcklbw     %xmm0,%xmm8
   .byte  102,68,15,97,192                    // punpcklwd     %xmm0,%xmm8
-  .byte  102,68,15,219,5,213,79,1,0          // pand          0x14fd5(%rip),%xmm8        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  102,68,15,219,5,125,78,1,0          // pand          0x14e7d(%rip),%xmm8        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
-  .byte  68,15,89,5,41,81,1,0                // mulps         0x15129(%rip),%xmm8        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  68,15,89,5,209,79,1,0               // mulps         0x14fd1(%rip),%xmm8        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  65,15,89,200                        // mulps         %xmm8,%xmm1
   .byte  65,15,89,208                        // mulps         %xmm8,%xmm2
@@ -37499,54 +37193,52 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,216                        // movaps        %xmm8,%xmm3
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,61                              // je            266b9 <_sk_scale_u8_sse2+0x9f>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,57                              // je            26048 <_sk_scale_u8_sse2+0x90>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,23                              // je            2669e <_sk_scale_u8_sse2+0x84>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,181                             // jne           26642 <_sk_scale_u8_sse2+0x28>
-  .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,21                              // je            2602d <_sk_scale_u8_sse2+0x75>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,190                             // jne           25fda <_sk_scale_u8_sse2+0x22>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  102,69,15,112,192,69                // pshufd        $0x45,%xmm8,%xmm8
-  .byte  67,15,183,4,16                      // movzwl        (%r8,%r10,1),%eax
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  102,68,15,110,200                   // movd          %eax,%xmm9
   .byte  102,68,15,96,200                    // punpcklbw     %xmm0,%xmm9
   .byte  102,68,15,97,200                    // punpcklwd     %xmm0,%xmm9
   .byte  242,69,15,16,193                    // movsd         %xmm9,%xmm8
-  .byte  235,137                             // jmp           26642 <_sk_scale_u8_sse2+0x28>
-  .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
+  .byte  235,146                             // jmp           25fda <_sk_scale_u8_sse2+0x22>
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
-  .byte  233,122,255,255,255                 // jmpq          26642 <_sk_scale_u8_sse2+0x28>
+  .byte  235,134                             // jmp           25fda <_sk_scale_u8_sse2+0x22>
 
 HIDDEN _sk_scale_565_sse2
 .globl _sk_scale_565_sse2
 FUNCTION(_sk_scale_565_sse2)
 _sk_scale_565_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,173,0,0,0                    // jne           26794 <_sk_scale_565_sse2+0xcc>
-  .byte  243,71,15,126,20,80                 // movq          (%r8,%r10,2),%xmm10
+  .byte  15,133,173,0,0,0                    // jne           2611a <_sk_scale_565_sse2+0xc6>
+  .byte  243,69,15,126,20,80                 // movq          (%r8,%rdx,2),%xmm10
   .byte  102,68,15,97,208                    // punpcklwd     %xmm0,%xmm10
-  .byte  102,68,15,111,5,149,80,1,0          // movdqa        0x15095(%rip),%xmm8        # 3b790 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
+  .byte  102,68,15,111,5,79,79,1,0           // movdqa        0x14f4f(%rip),%xmm8        # 3afd0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
   .byte  102,69,15,219,194                   // pand          %xmm10,%xmm8
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
-  .byte  68,15,89,5,148,80,1,0               // mulps         0x15094(%rip),%xmm8        # 3b7a0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
-  .byte  102,68,15,111,13,155,80,1,0         // movdqa        0x1509b(%rip),%xmm9        # 3b7b0 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  .byte  68,15,89,5,78,79,1,0                // mulps         0x14f4e(%rip),%xmm8        # 3afe0 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  .byte  102,68,15,111,13,85,79,1,0          // movdqa        0x14f55(%rip),%xmm9        # 3aff0 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
   .byte  102,69,15,219,202                   // pand          %xmm10,%xmm9
   .byte  69,15,91,201                        // cvtdq2ps      %xmm9,%xmm9
-  .byte  68,15,89,13,154,80,1,0              // mulps         0x1509a(%rip),%xmm9        # 3b7c0 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
-  .byte  102,68,15,219,21,161,80,1,0         // pand          0x150a1(%rip),%xmm10        # 3b7d0 <_sk_srcover_bgra_8888_sse2_lowp+0xf04>
+  .byte  68,15,89,13,84,79,1,0               // mulps         0x14f54(%rip),%xmm9        # 3b000 <_sk_srcover_bgra_8888_sse2_lowp+0xf04>
+  .byte  102,68,15,219,21,91,79,1,0          // pand          0x14f5b(%rip),%xmm10        # 3b010 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
   .byte  69,15,91,210                        // cvtdq2ps      %xmm10,%xmm10
-  .byte  68,15,89,21,165,80,1,0              // mulps         0x150a5(%rip),%xmm10        # 3b7e0 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
+  .byte  68,15,89,21,95,79,1,0               // mulps         0x14f5f(%rip),%xmm10        # 3b020 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
   .byte  68,15,40,219                        // movaps        %xmm3,%xmm11
   .byte  68,15,194,223,1                     // cmpltps       %xmm7,%xmm11
   .byte  69,15,40,225                        // movaps        %xmm9,%xmm12
@@ -37570,25 +37262,25 @@
   .byte  65,15,40,210                        // movaps        %xmm10,%xmm2
   .byte  65,15,40,219                        // movaps        %xmm11,%xmm3
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,60                              // je            267dd <_sk_scale_565_sse2+0x115>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,56                              // je            2615a <_sk_scale_565_sse2+0x106>
   .byte  102,69,15,239,210                   // pxor          %xmm10,%xmm10
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,27                              // je            267c7 <_sk_scale_565_sse2+0xff>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  15,133,60,255,255,255               // jne           266f2 <_sk_scale_565_sse2+0x2a>
-  .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,25                              // je            26144 <_sk_scale_565_sse2+0xf0>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  15,133,69,255,255,255               // jne           26078 <_sk_scale_565_sse2+0x24>
+  .byte  65,15,183,68,80,4                   // movzwl        0x4(%r8,%rdx,2),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  102,69,15,112,208,69                // pshufd        $0x45,%xmm8,%xmm10
-  .byte  102,71,15,110,4,80                  // movd          (%r8,%r10,2),%xmm8
+  .byte  102,69,15,110,4,80                  // movd          (%r8,%rdx,2),%xmm8
   .byte  242,69,15,112,192,212               // pshuflw       $0xd4,%xmm8,%xmm8
   .byte  242,69,15,16,208                    // movsd         %xmm8,%xmm10
-  .byte  233,21,255,255,255                  // jmpq          266f2 <_sk_scale_565_sse2+0x2a>
-  .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
+  .byte  233,30,255,255,255                  // jmpq          26078 <_sk_scale_565_sse2+0x24>
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,68,15,110,208                   // movd          %eax,%xmm10
-  .byte  233,6,255,255,255                   // jmpq          266f2 <_sk_scale_565_sse2+0x2a>
+  .byte  233,15,255,255,255                  // jmpq          26078 <_sk_scale_565_sse2+0x24>
 
 HIDDEN _sk_lerp_1_float_sse2
 .globl _sk_lerp_1_float_sse2
@@ -37617,19 +37309,17 @@
 FUNCTION(_sk_lerp_u8_sse2)
 _sk_lerp_u8_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,81                              // jne           2688d <_sk_lerp_u8_sse2+0x69>
-  .byte  102,71,15,110,4,16                  // movd          (%r8,%r10,1),%xmm8
+  .byte  117,81                              // jne           26204 <_sk_lerp_u8_sse2+0x63>
+  .byte  102,69,15,110,4,16                  // movd          (%r8,%rdx,1),%xmm8
   .byte  102,68,15,96,192                    // punpcklbw     %xmm0,%xmm8
   .byte  102,68,15,97,192                    // punpcklwd     %xmm0,%xmm8
-  .byte  102,68,15,219,5,203,77,1,0          // pand          0x14dcb(%rip),%xmm8        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  102,68,15,219,5,148,76,1,0          // pand          0x14c94(%rip),%xmm8        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
-  .byte  68,15,89,5,31,79,1,0                // mulps         0x14f1f(%rip),%xmm8        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  68,15,89,5,232,77,1,0               // mulps         0x14de8(%rip),%xmm8        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  15,92,196                           // subps         %xmm4,%xmm0
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  15,88,196                           // addps         %xmm4,%xmm0
@@ -37644,54 +37334,52 @@
   .byte  15,88,223                           // addps         %xmm7,%xmm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,64                              // je            268da <_sk_lerp_u8_sse2+0xb6>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,60                              // je            26248 <_sk_lerp_u8_sse2+0xa7>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,23                              // je            268bc <_sk_lerp_u8_sse2+0x98>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,161                             // jne           2684c <_sk_lerp_u8_sse2+0x28>
-  .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,21                              // je            2622a <_sk_lerp_u8_sse2+0x89>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,170                             // jne           261c3 <_sk_lerp_u8_sse2+0x22>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  102,69,15,112,192,69                // pshufd        $0x45,%xmm8,%xmm8
-  .byte  67,15,183,4,16                      // movzwl        (%r8,%r10,1),%eax
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  102,68,15,110,200                   // movd          %eax,%xmm9
   .byte  102,68,15,96,200                    // punpcklbw     %xmm0,%xmm9
   .byte  102,68,15,97,200                    // punpcklwd     %xmm0,%xmm9
   .byte  242,69,15,16,193                    // movsd         %xmm9,%xmm8
-  .byte  233,114,255,255,255                 // jmpq          2684c <_sk_lerp_u8_sse2+0x28>
-  .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
+  .byte  233,123,255,255,255                 // jmpq          261c3 <_sk_lerp_u8_sse2+0x22>
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
-  .byte  233,99,255,255,255                  // jmpq          2684c <_sk_lerp_u8_sse2+0x28>
+  .byte  233,108,255,255,255                 // jmpq          261c3 <_sk_lerp_u8_sse2+0x22>
 
 HIDDEN _sk_lerp_565_sse2
 .globl _sk_lerp_565_sse2
 FUNCTION(_sk_lerp_565_sse2)
 _sk_lerp_565_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,173,0,0,0                    // jne           269b5 <_sk_lerp_565_sse2+0xcc>
-  .byte  243,71,15,126,4,80                  // movq          (%r8,%r10,2),%xmm8
+  .byte  15,133,173,0,0,0                    // jne           2631d <_sk_lerp_565_sse2+0xc6>
+  .byte  243,69,15,126,4,80                  // movq          (%r8,%rdx,2),%xmm8
   .byte  102,68,15,97,192                    // punpcklwd     %xmm0,%xmm8
-  .byte  102,68,15,111,13,116,78,1,0         // movdqa        0x14e74(%rip),%xmm9        # 3b790 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
+  .byte  102,68,15,111,13,76,77,1,0          // movdqa        0x14d4c(%rip),%xmm9        # 3afd0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
   .byte  102,69,15,219,200                   // pand          %xmm8,%xmm9
   .byte  69,15,91,201                        // cvtdq2ps      %xmm9,%xmm9
-  .byte  68,15,89,13,115,78,1,0              // mulps         0x14e73(%rip),%xmm9        # 3b7a0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
-  .byte  102,68,15,111,21,122,78,1,0         // movdqa        0x14e7a(%rip),%xmm10        # 3b7b0 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  .byte  68,15,89,13,75,77,1,0               // mulps         0x14d4b(%rip),%xmm9        # 3afe0 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  .byte  102,68,15,111,21,82,77,1,0          // movdqa        0x14d52(%rip),%xmm10        # 3aff0 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
   .byte  102,69,15,219,208                   // pand          %xmm8,%xmm10
   .byte  69,15,91,218                        // cvtdq2ps      %xmm10,%xmm11
-  .byte  68,15,89,29,121,78,1,0              // mulps         0x14e79(%rip),%xmm11        # 3b7c0 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
-  .byte  102,68,15,219,5,128,78,1,0          // pand          0x14e80(%rip),%xmm8        # 3b7d0 <_sk_srcover_bgra_8888_sse2_lowp+0xf04>
+  .byte  68,15,89,29,81,77,1,0               // mulps         0x14d51(%rip),%xmm11        # 3b000 <_sk_srcover_bgra_8888_sse2_lowp+0xf04>
+  .byte  102,68,15,219,5,88,77,1,0           // pand          0x14d58(%rip),%xmm8        # 3b010 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
-  .byte  68,15,89,5,132,78,1,0               // mulps         0x14e84(%rip),%xmm8        # 3b7e0 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
+  .byte  68,15,89,5,92,77,1,0                // mulps         0x14d5c(%rip),%xmm8        # 3b020 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
   .byte  68,15,40,211                        // movaps        %xmm3,%xmm10
   .byte  68,15,194,215,1                     // cmpltps       %xmm7,%xmm10
   .byte  69,15,40,227                        // movaps        %xmm11,%xmm12
@@ -37717,25 +37405,25 @@
   .byte  15,88,223                           // addps         %xmm7,%xmm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,60                              // je            269fe <_sk_lerp_565_sse2+0x115>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,56                              // je            2635d <_sk_lerp_565_sse2+0x106>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,27                              // je            269e8 <_sk_lerp_565_sse2+0xff>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  15,133,60,255,255,255               // jne           26913 <_sk_lerp_565_sse2+0x2a>
-  .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,25                              // je            26347 <_sk_lerp_565_sse2+0xf0>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  15,133,69,255,255,255               // jne           2627b <_sk_lerp_565_sse2+0x24>
+  .byte  65,15,183,68,80,4                   // movzwl        0x4(%r8,%rdx,2),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  102,69,15,112,192,69                // pshufd        $0x45,%xmm8,%xmm8
-  .byte  102,71,15,110,12,80                 // movd          (%r8,%r10,2),%xmm9
+  .byte  102,69,15,110,12,80                 // movd          (%r8,%rdx,2),%xmm9
   .byte  242,69,15,112,201,212               // pshuflw       $0xd4,%xmm9,%xmm9
   .byte  242,69,15,16,193                    // movsd         %xmm9,%xmm8
-  .byte  233,21,255,255,255                  // jmpq          26913 <_sk_lerp_565_sse2+0x2a>
-  .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
+  .byte  233,30,255,255,255                  // jmpq          2627b <_sk_lerp_565_sse2+0x24>
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
-  .byte  233,6,255,255,255                   // jmpq          26913 <_sk_lerp_565_sse2+0x2a>
+  .byte  233,15,255,255,255                  // jmpq          2627b <_sk_lerp_565_sse2+0x24>
 
 HIDDEN _sk_load_tables_sse2
 .globl _sk_load_tables_sse2
@@ -37744,11 +37432,11 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,34,1,0,0                     // jne           26b3d <_sk_load_tables_sse2+0x130>
+  .byte  15,133,34,1,0,0                     // jne           2649c <_sk_load_tables_sse2+0x130>
   .byte  243,69,15,111,12,144                // movdqu        (%r8,%rdx,4),%xmm9
   .byte  65,86                               // push          %r14
   .byte  83                                  // push          %rbx
-  .byte  102,68,15,111,5,243,75,1,0          // movdqa        0x14bf3(%rip),%xmm8        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  102,68,15,111,5,212,74,1,0          // movdqa        0x14ad4(%rip),%xmm8        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  102,65,15,111,193                   // movdqa        %xmm9,%xmm0
   .byte  102,65,15,219,192                   // pand          %xmm8,%xmm0
   .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
@@ -37804,7 +37492,7 @@
   .byte  102,15,20,211                       // unpcklpd      %xmm3,%xmm2
   .byte  102,65,15,114,209,24                // psrld         $0x18,%xmm9
   .byte  65,15,91,217                        // cvtdq2ps      %xmm9,%xmm3
-  .byte  15,89,29,74,76,1,0                  // mulps         0x14c4a(%rip),%xmm3        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  15,89,29,43,75,1,0                  // mulps         0x14b2b(%rip),%xmm3        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  91                                  // pop           %rbx
   .byte  65,94                               // pop           %r14
@@ -37812,18 +37500,18 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,45                              // je            26b77 <_sk_load_tables_sse2+0x16a>
+  .byte  116,45                              // je            264d6 <_sk_load_tables_sse2+0x16a>
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,23                              // je            26b6c <_sk_load_tables_sse2+0x15f>
+  .byte  116,23                              // je            264cb <_sk_load_tables_sse2+0x15f>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  15,133,194,254,255,255              // jne           26a21 <_sk_load_tables_sse2+0x14>
+  .byte  15,133,194,254,255,255              // jne           26380 <_sk_load_tables_sse2+0x14>
   .byte  102,65,15,110,68,144,8              // movd          0x8(%r8,%rdx,4),%xmm0
   .byte  102,68,15,112,200,69                // pshufd        $0x45,%xmm0,%xmm9
   .byte  102,69,15,18,12,144                 // movlpd        (%r8,%rdx,4),%xmm9
-  .byte  233,170,254,255,255                 // jmpq          26a21 <_sk_load_tables_sse2+0x14>
+  .byte  233,170,254,255,255                 // jmpq          26380 <_sk_load_tables_sse2+0x14>
   .byte  102,69,15,110,12,144                // movd          (%r8,%rdx,4),%xmm9
-  .byte  233,159,254,255,255                 // jmpq          26a21 <_sk_load_tables_sse2+0x14>
+  .byte  233,159,254,255,255                 // jmpq          26380 <_sk_load_tables_sse2+0x14>
 
 HIDDEN _sk_load_tables_u16_be_sse2
 .globl _sk_load_tables_u16_be_sse2
@@ -37833,7 +37521,7 @@
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  76,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,93,1,0,0                     // jne           26cf5 <_sk_load_tables_u16_be_sse2+0x173>
+  .byte  15,133,93,1,0,0                     // jne           26654 <_sk_load_tables_u16_be_sse2+0x173>
   .byte  102,67,15,16,4,72                   // movupd        (%r8,%r9,2),%xmm0
   .byte  243,67,15,111,76,72,16              // movdqu        0x10(%r8,%r9,2),%xmm1
   .byte  65,86                               // push          %r14
@@ -37844,7 +37532,7 @@
   .byte  102,65,15,111,201                   // movdqa        %xmm9,%xmm1
   .byte  102,15,97,200                       // punpcklwd     %xmm0,%xmm1
   .byte  102,68,15,105,200                   // punpckhwd     %xmm0,%xmm9
-  .byte  102,15,111,21,36,76,1,0             // movdqa        0x14c24(%rip),%xmm2        # 3b7f0 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
+  .byte  102,15,111,21,5,75,1,0              // movdqa        0x14b05(%rip),%xmm2        # 3b030 <_sk_srcover_bgra_8888_sse2_lowp+0xf34>
   .byte  102,15,112,217,238                  // pshufd        $0xee,%xmm1,%xmm3
   .byte  102,15,219,202                      // pand          %xmm2,%xmm1
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
@@ -37905,23 +37593,23 @@
   .byte  102,65,15,235,217                   // por           %xmm9,%xmm3
   .byte  102,65,15,97,216                    // punpcklwd     %xmm8,%xmm3
   .byte  15,91,219                           // cvtdq2ps      %xmm3,%xmm3
-  .byte  15,89,29,34,75,1,0                  // mulps         0x14b22(%rip),%xmm3        # 3b810 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
+  .byte  15,89,29,3,74,1,0                   // mulps         0x14a03(%rip),%xmm3        # 3b050 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  91                                  // pop           %rbx
   .byte  65,94                               // pop           %r14
   .byte  255,224                             // jmpq          *%rax
   .byte  242,67,15,16,4,72                   // movsd         (%r8,%r9,2),%xmm0
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,13                              // jne           26d0e <_sk_load_tables_u16_be_sse2+0x18c>
+  .byte  117,13                              // jne           2666d <_sk_load_tables_u16_be_sse2+0x18c>
   .byte  243,15,126,192                      // movq          %xmm0,%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  233,151,254,255,255                 // jmpq          26ba5 <_sk_load_tables_u16_be_sse2+0x23>
+  .byte  233,151,254,255,255                 // jmpq          26504 <_sk_load_tables_u16_be_sse2+0x23>
   .byte  102,67,15,22,68,72,8                // movhpd        0x8(%r8,%r9,2),%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  15,130,130,254,255,255              // jb            26ba5 <_sk_load_tables_u16_be_sse2+0x23>
+  .byte  15,130,130,254,255,255              // jb            26504 <_sk_load_tables_u16_be_sse2+0x23>
   .byte  243,67,15,126,76,72,16              // movq          0x10(%r8,%r9,2),%xmm1
-  .byte  233,118,254,255,255                 // jmpq          26ba5 <_sk_load_tables_u16_be_sse2+0x23>
+  .byte  233,118,254,255,255                 // jmpq          26504 <_sk_load_tables_u16_be_sse2+0x23>
 
 HIDDEN _sk_load_tables_rgb_u16_be_sse2
 .globl _sk_load_tables_rgb_u16_be_sse2
@@ -37931,7 +37619,7 @@
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  76,141,12,82                        // lea           (%rdx,%rdx,2),%r9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,81,1,0,0                     // jne           26e92 <_sk_load_tables_rgb_u16_be_sse2+0x163>
+  .byte  15,133,81,1,0,0                     // jne           267f1 <_sk_load_tables_rgb_u16_be_sse2+0x163>
   .byte  243,67,15,111,20,72                 // movdqu        (%r8,%r9,2),%xmm2
   .byte  243,67,15,111,76,72,8               // movdqu        0x8(%r8,%r9,2),%xmm1
   .byte  102,15,115,217,4                    // psrldq        $0x4,%xmm1
@@ -37946,7 +37634,7 @@
   .byte  102,15,111,194                      // movdqa        %xmm2,%xmm0
   .byte  102,65,15,97,194                    // punpcklwd     %xmm10,%xmm0
   .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
-  .byte  102,68,15,111,5,102,74,1,0          // movdqa        0x14a66(%rip),%xmm8        # 3b7f0 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
+  .byte  102,68,15,111,5,71,73,1,0           // movdqa        0x14947(%rip),%xmm8        # 3b030 <_sk_srcover_bgra_8888_sse2_lowp+0xf34>
   .byte  102,65,15,219,192                   // pand          %xmm8,%xmm0
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
   .byte  102,65,15,97,193                    // punpcklwd     %xmm9,%xmm0
@@ -38001,7 +37689,7 @@
   .byte  65,15,20,216                        // unpcklps      %xmm8,%xmm3
   .byte  102,15,20,211                       // unpcklpd      %xmm3,%xmm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,227,70,1,0                 // movaps        0x146e3(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,29,196,69,1,0                 // movaps        0x145c4(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  91                                  // pop           %rbx
   .byte  65,94                               // pop           %r14
   .byte  255,224                             // jmpq          *%rax
@@ -38009,21 +37697,21 @@
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,67,15,196,84,72,4,2             // pinsrw        $0x2,0x4(%r8,%r9,2),%xmm2
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,14                              // jne           26eb8 <_sk_load_tables_rgb_u16_be_sse2+0x189>
+  .byte  117,14                              // jne           26817 <_sk_load_tables_rgb_u16_be_sse2+0x189>
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  102,69,15,239,210                   // pxor          %xmm10,%xmm10
-  .byte  233,175,254,255,255                 // jmpq          26d67 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+  .byte  233,175,254,255,255                 // jmpq          266c6 <_sk_load_tables_rgb_u16_be_sse2+0x38>
   .byte  102,71,15,110,84,72,6               // movd          0x6(%r8,%r9,2),%xmm10
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,71,15,196,84,72,10,2            // pinsrw        $0x2,0xa(%r8,%r9,2),%xmm10
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,24                              // jb            26ee9 <_sk_load_tables_rgb_u16_be_sse2+0x1ba>
+  .byte  114,24                              // jb            26848 <_sk_load_tables_rgb_u16_be_sse2+0x1ba>
   .byte  102,67,15,110,76,72,12              // movd          0xc(%r8,%r9,2),%xmm1
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,67,15,196,76,72,16,2            // pinsrw        $0x2,0x10(%r8,%r9,2),%xmm1
-  .byte  233,126,254,255,255                 // jmpq          26d67 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+  .byte  233,126,254,255,255                 // jmpq          266c6 <_sk_load_tables_rgb_u16_be_sse2+0x38>
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  233,117,254,255,255                 // jmpq          26d67 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+  .byte  233,117,254,255,255                 // jmpq          266c6 <_sk_load_tables_rgb_u16_be_sse2+0x38>
 
 HIDDEN _sk_byte_tables_sse2
 .globl _sk_byte_tables_sse2
@@ -38036,9 +37724,9 @@
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  69,15,87,219                        // xorps         %xmm11,%xmm11
   .byte  68,15,95,216                        // maxps         %xmm0,%xmm11
-  .byte  68,15,40,13,99,70,1,0               // movaps        0x14663(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,13,68,69,1,0               // movaps        0x14544(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,93,217                        // minps         %xmm9,%xmm11
-  .byte  68,15,40,21,55,71,1,0               // movaps        0x14737(%rip),%xmm10        # 3b650 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  .byte  68,15,40,21,24,70,1,0               // movaps        0x14618(%rip),%xmm10        # 3ae90 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
   .byte  69,15,89,218                        // mulps         %xmm10,%xmm11
   .byte  102,65,15,91,195                    // cvtps2dq      %xmm11,%xmm0
   .byte  102,73,15,126,192                   // movq          %xmm0,%r8
@@ -38065,7 +37753,7 @@
   .byte  102,65,15,96,192                    // punpcklbw     %xmm8,%xmm0
   .byte  102,65,15,97,192                    // punpcklwd     %xmm8,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  68,15,40,29,246,71,1,0              // movaps        0x147f6(%rip),%xmm11        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  68,15,40,29,215,70,1,0              // movaps        0x146d7(%rip),%xmm11        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  65,15,89,195                        // mulps         %xmm11,%xmm0
   .byte  69,15,87,228                        // xorps         %xmm12,%xmm12
   .byte  68,15,95,225                        // maxps         %xmm1,%xmm12
@@ -38169,7 +37857,7 @@
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  69,15,87,219                        // xorps         %xmm11,%xmm11
   .byte  68,15,95,216                        // maxps         %xmm0,%xmm11
-  .byte  68,15,40,21,95,68,1,0               // movaps        0x1445f(%rip),%xmm10        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,21,64,67,1,0               // movaps        0x14340(%rip),%xmm10        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,93,218                        // minps         %xmm10,%xmm11
   .byte  69,15,89,217                        // mulps         %xmm9,%xmm11
   .byte  102,65,15,91,195                    // cvtps2dq      %xmm11,%xmm0
@@ -38197,7 +37885,7 @@
   .byte  102,65,15,96,192                    // punpcklbw     %xmm8,%xmm0
   .byte  102,65,15,97,192                    // punpcklwd     %xmm8,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  68,15,40,29,250,69,1,0              // movaps        0x145fa(%rip),%xmm11        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  68,15,40,29,219,68,1,0              // movaps        0x144db(%rip),%xmm11        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  65,15,89,195                        // mulps         %xmm11,%xmm0
   .byte  69,15,87,228                        // xorps         %xmm12,%xmm12
   .byte  68,15,95,225                        // maxps         %xmm1,%xmm12
@@ -38271,7 +37959,7 @@
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  68,15,95,200                        // maxps         %xmm0,%xmm9
-  .byte  68,15,93,13,219,66,1,0              // minps         0x142db(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,93,13,188,65,1,0              // minps         0x141bc(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  102,69,15,91,193                    // cvtps2dq      %xmm9,%xmm8
   .byte  102,65,15,112,192,78                // pshufd        $0x4e,%xmm8,%xmm0
@@ -38304,7 +37992,7 @@
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  68,15,95,201                        // maxps         %xmm1,%xmm9
-  .byte  68,15,93,13,98,66,1,0               // minps         0x14262(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,93,13,67,65,1,0               // minps         0x14143(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  102,69,15,91,193                    // cvtps2dq      %xmm9,%xmm8
   .byte  102,65,15,112,200,78                // pshufd        $0x4e,%xmm8,%xmm1
@@ -38337,7 +38025,7 @@
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  68,15,95,202                        // maxps         %xmm2,%xmm9
-  .byte  68,15,93,13,233,65,1,0              // minps         0x141e9(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,93,13,202,64,1,0              // minps         0x140ca(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  102,69,15,91,193                    // cvtps2dq      %xmm9,%xmm8
   .byte  102,65,15,112,208,78                // pshufd        $0x4e,%xmm8,%xmm2
@@ -38370,7 +38058,7 @@
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  68,15,95,203                        // maxps         %xmm3,%xmm9
-  .byte  68,15,93,13,112,65,1,0              // minps         0x14170(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,93,13,81,64,1,0               // minps         0x14051(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  102,69,15,91,193                    // cvtps2dq      %xmm9,%xmm8
   .byte  102,65,15,112,216,78                // pshufd        $0x4e,%xmm8,%xmm3
@@ -38414,16 +38102,16 @@
   .byte  69,15,198,228,0                     // shufps        $0x0,%xmm12,%xmm12
   .byte  69,15,87,210                        // xorps         %xmm10,%xmm10
   .byte  69,15,91,217                        // cvtdq2ps      %xmm9,%xmm11
-  .byte  68,15,89,29,104,67,1,0              // mulps         0x14368(%rip),%xmm11        # 3b820 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
-  .byte  68,15,40,45,112,67,1,0              // movaps        0x14370(%rip),%xmm13        # 3b830 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  .byte  68,15,89,29,73,66,1,0               // mulps         0x14249(%rip),%xmm11        # 3b060 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  .byte  68,15,40,45,81,66,1,0               // movaps        0x14251(%rip),%xmm13        # 3b070 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
   .byte  69,15,84,233                        // andps         %xmm9,%xmm13
-  .byte  68,15,86,45,148,64,1,0              // orps          0x14094(%rip),%xmm13        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
-  .byte  68,15,88,29,108,67,1,0              // addps         0x1436c(%rip),%xmm11        # 3b840 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
-  .byte  68,15,40,53,116,67,1,0              // movaps        0x14374(%rip),%xmm14        # 3b850 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  68,15,86,45,117,63,1,0              // orps          0x13f75(%rip),%xmm13        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,88,29,77,66,1,0               // addps         0x1424d(%rip),%xmm11        # 3b080 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  68,15,40,53,85,66,1,0               // movaps        0x14255(%rip),%xmm14        # 3b090 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
   .byte  69,15,89,245                        // mulps         %xmm13,%xmm14
   .byte  69,15,92,222                        // subps         %xmm14,%xmm11
-  .byte  68,15,88,45,116,67,1,0              // addps         0x14374(%rip),%xmm13        # 3b860 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
-  .byte  68,15,40,53,124,67,1,0              // movaps        0x1437c(%rip),%xmm14        # 3b870 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  .byte  68,15,88,45,85,66,1,0               // addps         0x14255(%rip),%xmm13        # 3b0a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  .byte  68,15,40,53,93,66,1,0               // movaps        0x1425d(%rip),%xmm14        # 3b0b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
   .byte  69,15,94,245                        // divps         %xmm13,%xmm14
   .byte  69,15,92,222                        // subps         %xmm14,%xmm11
   .byte  69,15,89,220                        // mulps         %xmm12,%xmm11
@@ -38431,21 +38119,21 @@
   .byte  69,15,91,236                        // cvtdq2ps      %xmm12,%xmm13
   .byte  69,15,40,243                        // movaps        %xmm11,%xmm14
   .byte  69,15,194,245,1                     // cmpltps       %xmm13,%xmm14
-  .byte  68,15,40,37,86,64,1,0               // movaps        0x14056(%rip),%xmm12        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,37,55,63,1,0               // movaps        0x13f37(%rip),%xmm12        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,84,244                        // andps         %xmm12,%xmm14
   .byte  69,15,92,238                        // subps         %xmm14,%xmm13
   .byte  69,15,40,243                        // movaps        %xmm11,%xmm14
   .byte  69,15,92,245                        // subps         %xmm13,%xmm14
-  .byte  68,15,88,29,78,67,1,0               // addps         0x1434e(%rip),%xmm11        # 3b880 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
-  .byte  68,15,40,45,86,67,1,0               // movaps        0x14356(%rip),%xmm13        # 3b890 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  68,15,88,29,47,66,1,0               // addps         0x1422f(%rip),%xmm11        # 3b0c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  68,15,40,45,55,66,1,0               // movaps        0x14237(%rip),%xmm13        # 3b0d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
   .byte  69,15,89,238                        // mulps         %xmm14,%xmm13
   .byte  69,15,92,221                        // subps         %xmm13,%xmm11
-  .byte  68,15,40,45,86,67,1,0               // movaps        0x14356(%rip),%xmm13        # 3b8a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
+  .byte  68,15,40,45,55,66,1,0               // movaps        0x14237(%rip),%xmm13        # 3b0e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
   .byte  69,15,92,238                        // subps         %xmm14,%xmm13
-  .byte  68,15,40,53,90,67,1,0               // movaps        0x1435a(%rip),%xmm14        # 3b8b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
+  .byte  68,15,40,53,59,66,1,0               // movaps        0x1423b(%rip),%xmm14        # 3b0f0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
   .byte  69,15,94,245                        // divps         %xmm13,%xmm14
   .byte  69,15,88,243                        // addps         %xmm11,%xmm14
-  .byte  68,15,89,53,90,67,1,0               // mulps         0x1435a(%rip),%xmm14        # 3b8c0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
+  .byte  68,15,89,53,59,66,1,0               // mulps         0x1423b(%rip),%xmm14        # 3b100 <_sk_srcover_bgra_8888_sse2_lowp+0x1004>
   .byte  102,69,15,91,222                    // cvtps2dq      %xmm14,%xmm11
   .byte  69,15,194,202,4                     // cmpneqps      %xmm10,%xmm9
   .byte  69,15,84,203                        // andps         %xmm11,%xmm9
@@ -38484,16 +38172,16 @@
   .byte  69,15,198,228,0                     // shufps        $0x0,%xmm12,%xmm12
   .byte  69,15,87,210                        // xorps         %xmm10,%xmm10
   .byte  69,15,91,217                        // cvtdq2ps      %xmm9,%xmm11
-  .byte  68,15,89,29,29,66,1,0               // mulps         0x1421d(%rip),%xmm11        # 3b820 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
-  .byte  68,15,40,45,37,66,1,0               // movaps        0x14225(%rip),%xmm13        # 3b830 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  .byte  68,15,89,29,254,64,1,0              // mulps         0x140fe(%rip),%xmm11        # 3b060 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  .byte  68,15,40,45,6,65,1,0                // movaps        0x14106(%rip),%xmm13        # 3b070 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
   .byte  69,15,84,233                        // andps         %xmm9,%xmm13
-  .byte  68,15,86,45,73,63,1,0               // orps          0x13f49(%rip),%xmm13        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
-  .byte  68,15,88,29,33,66,1,0               // addps         0x14221(%rip),%xmm11        # 3b840 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
-  .byte  68,15,40,53,41,66,1,0               // movaps        0x14229(%rip),%xmm14        # 3b850 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  68,15,86,45,42,62,1,0               // orps          0x13e2a(%rip),%xmm13        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,88,29,2,65,1,0                // addps         0x14102(%rip),%xmm11        # 3b080 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  68,15,40,53,10,65,1,0               // movaps        0x1410a(%rip),%xmm14        # 3b090 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
   .byte  69,15,89,245                        // mulps         %xmm13,%xmm14
   .byte  69,15,92,222                        // subps         %xmm14,%xmm11
-  .byte  68,15,88,45,41,66,1,0               // addps         0x14229(%rip),%xmm13        # 3b860 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
-  .byte  68,15,40,53,49,66,1,0               // movaps        0x14231(%rip),%xmm14        # 3b870 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  .byte  68,15,88,45,10,65,1,0               // addps         0x1410a(%rip),%xmm13        # 3b0a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  .byte  68,15,40,53,18,65,1,0               // movaps        0x14112(%rip),%xmm14        # 3b0b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
   .byte  69,15,94,245                        // divps         %xmm13,%xmm14
   .byte  69,15,92,222                        // subps         %xmm14,%xmm11
   .byte  69,15,89,220                        // mulps         %xmm12,%xmm11
@@ -38501,21 +38189,21 @@
   .byte  69,15,91,236                        // cvtdq2ps      %xmm12,%xmm13
   .byte  69,15,40,243                        // movaps        %xmm11,%xmm14
   .byte  69,15,194,245,1                     // cmpltps       %xmm13,%xmm14
-  .byte  68,15,40,37,11,63,1,0               // movaps        0x13f0b(%rip),%xmm12        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,37,236,61,1,0              // movaps        0x13dec(%rip),%xmm12        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,84,244                        // andps         %xmm12,%xmm14
   .byte  69,15,92,238                        // subps         %xmm14,%xmm13
   .byte  69,15,40,243                        // movaps        %xmm11,%xmm14
   .byte  69,15,92,245                        // subps         %xmm13,%xmm14
-  .byte  68,15,88,29,3,66,1,0                // addps         0x14203(%rip),%xmm11        # 3b880 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
-  .byte  68,15,40,45,11,66,1,0               // movaps        0x1420b(%rip),%xmm13        # 3b890 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  68,15,88,29,228,64,1,0              // addps         0x140e4(%rip),%xmm11        # 3b0c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  68,15,40,45,236,64,1,0              // movaps        0x140ec(%rip),%xmm13        # 3b0d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
   .byte  69,15,89,238                        // mulps         %xmm14,%xmm13
   .byte  69,15,92,221                        // subps         %xmm13,%xmm11
-  .byte  68,15,40,45,11,66,1,0               // movaps        0x1420b(%rip),%xmm13        # 3b8a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
+  .byte  68,15,40,45,236,64,1,0              // movaps        0x140ec(%rip),%xmm13        # 3b0e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
   .byte  69,15,92,238                        // subps         %xmm14,%xmm13
-  .byte  68,15,40,53,15,66,1,0               // movaps        0x1420f(%rip),%xmm14        # 3b8b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
+  .byte  68,15,40,53,240,64,1,0              // movaps        0x140f0(%rip),%xmm14        # 3b0f0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
   .byte  69,15,94,245                        // divps         %xmm13,%xmm14
   .byte  69,15,88,243                        // addps         %xmm11,%xmm14
-  .byte  68,15,89,53,15,66,1,0               // mulps         0x1420f(%rip),%xmm14        # 3b8c0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
+  .byte  68,15,89,53,240,64,1,0              // mulps         0x140f0(%rip),%xmm14        # 3b100 <_sk_srcover_bgra_8888_sse2_lowp+0x1004>
   .byte  102,69,15,91,222                    // cvtps2dq      %xmm14,%xmm11
   .byte  69,15,194,202,4                     // cmpneqps      %xmm10,%xmm9
   .byte  69,15,84,203                        // andps         %xmm11,%xmm9
@@ -38554,16 +38242,16 @@
   .byte  69,15,198,228,0                     // shufps        $0x0,%xmm12,%xmm12
   .byte  69,15,87,210                        // xorps         %xmm10,%xmm10
   .byte  69,15,91,217                        // cvtdq2ps      %xmm9,%xmm11
-  .byte  68,15,89,29,210,64,1,0              // mulps         0x140d2(%rip),%xmm11        # 3b820 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
-  .byte  68,15,40,45,218,64,1,0              // movaps        0x140da(%rip),%xmm13        # 3b830 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  .byte  68,15,89,29,179,63,1,0              // mulps         0x13fb3(%rip),%xmm11        # 3b060 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  .byte  68,15,40,45,187,63,1,0              // movaps        0x13fbb(%rip),%xmm13        # 3b070 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
   .byte  69,15,84,233                        // andps         %xmm9,%xmm13
-  .byte  68,15,86,45,254,61,1,0              // orps          0x13dfe(%rip),%xmm13        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
-  .byte  68,15,88,29,214,64,1,0              // addps         0x140d6(%rip),%xmm11        # 3b840 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
-  .byte  68,15,40,53,222,64,1,0              // movaps        0x140de(%rip),%xmm14        # 3b850 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  68,15,86,45,223,60,1,0              // orps          0x13cdf(%rip),%xmm13        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,88,29,183,63,1,0              // addps         0x13fb7(%rip),%xmm11        # 3b080 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  68,15,40,53,191,63,1,0              // movaps        0x13fbf(%rip),%xmm14        # 3b090 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
   .byte  69,15,89,245                        // mulps         %xmm13,%xmm14
   .byte  69,15,92,222                        // subps         %xmm14,%xmm11
-  .byte  68,15,88,45,222,64,1,0              // addps         0x140de(%rip),%xmm13        # 3b860 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
-  .byte  68,15,40,53,230,64,1,0              // movaps        0x140e6(%rip),%xmm14        # 3b870 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  .byte  68,15,88,45,191,63,1,0              // addps         0x13fbf(%rip),%xmm13        # 3b0a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  .byte  68,15,40,53,199,63,1,0              // movaps        0x13fc7(%rip),%xmm14        # 3b0b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
   .byte  69,15,94,245                        // divps         %xmm13,%xmm14
   .byte  69,15,92,222                        // subps         %xmm14,%xmm11
   .byte  69,15,89,220                        // mulps         %xmm12,%xmm11
@@ -38571,21 +38259,21 @@
   .byte  69,15,91,236                        // cvtdq2ps      %xmm12,%xmm13
   .byte  69,15,40,243                        // movaps        %xmm11,%xmm14
   .byte  69,15,194,245,1                     // cmpltps       %xmm13,%xmm14
-  .byte  68,15,40,37,192,61,1,0              // movaps        0x13dc0(%rip),%xmm12        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,37,161,60,1,0              // movaps        0x13ca1(%rip),%xmm12        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,84,244                        // andps         %xmm12,%xmm14
   .byte  69,15,92,238                        // subps         %xmm14,%xmm13
   .byte  69,15,40,243                        // movaps        %xmm11,%xmm14
   .byte  69,15,92,245                        // subps         %xmm13,%xmm14
-  .byte  68,15,88,29,184,64,1,0              // addps         0x140b8(%rip),%xmm11        # 3b880 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
-  .byte  68,15,40,45,192,64,1,0              // movaps        0x140c0(%rip),%xmm13        # 3b890 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  68,15,88,29,153,63,1,0              // addps         0x13f99(%rip),%xmm11        # 3b0c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  68,15,40,45,161,63,1,0              // movaps        0x13fa1(%rip),%xmm13        # 3b0d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
   .byte  69,15,89,238                        // mulps         %xmm14,%xmm13
   .byte  69,15,92,221                        // subps         %xmm13,%xmm11
-  .byte  68,15,40,45,192,64,1,0              // movaps        0x140c0(%rip),%xmm13        # 3b8a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
+  .byte  68,15,40,45,161,63,1,0              // movaps        0x13fa1(%rip),%xmm13        # 3b0e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
   .byte  69,15,92,238                        // subps         %xmm14,%xmm13
-  .byte  68,15,40,53,196,64,1,0              // movaps        0x140c4(%rip),%xmm14        # 3b8b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
+  .byte  68,15,40,53,165,63,1,0              // movaps        0x13fa5(%rip),%xmm14        # 3b0f0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
   .byte  69,15,94,245                        // divps         %xmm13,%xmm14
   .byte  69,15,88,243                        // addps         %xmm11,%xmm14
-  .byte  68,15,89,53,196,64,1,0              // mulps         0x140c4(%rip),%xmm14        # 3b8c0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
+  .byte  68,15,89,53,165,63,1,0              // mulps         0x13fa5(%rip),%xmm14        # 3b100 <_sk_srcover_bgra_8888_sse2_lowp+0x1004>
   .byte  102,69,15,91,222                    // cvtps2dq      %xmm14,%xmm11
   .byte  69,15,194,202,4                     // cmpneqps      %xmm10,%xmm9
   .byte  69,15,84,203                        // andps         %xmm11,%xmm9
@@ -38624,16 +38312,16 @@
   .byte  69,15,198,228,0                     // shufps        $0x0,%xmm12,%xmm12
   .byte  69,15,87,210                        // xorps         %xmm10,%xmm10
   .byte  69,15,91,217                        // cvtdq2ps      %xmm9,%xmm11
-  .byte  68,15,89,29,135,63,1,0              // mulps         0x13f87(%rip),%xmm11        # 3b820 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
-  .byte  68,15,40,45,143,63,1,0              // movaps        0x13f8f(%rip),%xmm13        # 3b830 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  .byte  68,15,89,29,104,62,1,0              // mulps         0x13e68(%rip),%xmm11        # 3b060 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  .byte  68,15,40,45,112,62,1,0              // movaps        0x13e70(%rip),%xmm13        # 3b070 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
   .byte  69,15,84,233                        // andps         %xmm9,%xmm13
-  .byte  68,15,86,45,179,60,1,0              // orps          0x13cb3(%rip),%xmm13        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
-  .byte  68,15,88,29,139,63,1,0              // addps         0x13f8b(%rip),%xmm11        # 3b840 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
-  .byte  68,15,40,53,147,63,1,0              // movaps        0x13f93(%rip),%xmm14        # 3b850 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  68,15,86,45,148,59,1,0              // orps          0x13b94(%rip),%xmm13        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,88,29,108,62,1,0              // addps         0x13e6c(%rip),%xmm11        # 3b080 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  68,15,40,53,116,62,1,0              // movaps        0x13e74(%rip),%xmm14        # 3b090 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
   .byte  69,15,89,245                        // mulps         %xmm13,%xmm14
   .byte  69,15,92,222                        // subps         %xmm14,%xmm11
-  .byte  68,15,88,45,147,63,1,0              // addps         0x13f93(%rip),%xmm13        # 3b860 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
-  .byte  68,15,40,53,155,63,1,0              // movaps        0x13f9b(%rip),%xmm14        # 3b870 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  .byte  68,15,88,45,116,62,1,0              // addps         0x13e74(%rip),%xmm13        # 3b0a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  .byte  68,15,40,53,124,62,1,0              // movaps        0x13e7c(%rip),%xmm14        # 3b0b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
   .byte  69,15,94,245                        // divps         %xmm13,%xmm14
   .byte  69,15,92,222                        // subps         %xmm14,%xmm11
   .byte  69,15,89,220                        // mulps         %xmm12,%xmm11
@@ -38641,21 +38329,21 @@
   .byte  69,15,91,236                        // cvtdq2ps      %xmm12,%xmm13
   .byte  69,15,40,243                        // movaps        %xmm11,%xmm14
   .byte  69,15,194,245,1                     // cmpltps       %xmm13,%xmm14
-  .byte  68,15,40,37,117,60,1,0              // movaps        0x13c75(%rip),%xmm12        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,37,86,59,1,0               // movaps        0x13b56(%rip),%xmm12        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,84,244                        // andps         %xmm12,%xmm14
   .byte  69,15,92,238                        // subps         %xmm14,%xmm13
   .byte  69,15,40,243                        // movaps        %xmm11,%xmm14
   .byte  69,15,92,245                        // subps         %xmm13,%xmm14
-  .byte  68,15,88,29,109,63,1,0              // addps         0x13f6d(%rip),%xmm11        # 3b880 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
-  .byte  68,15,40,45,117,63,1,0              // movaps        0x13f75(%rip),%xmm13        # 3b890 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  68,15,88,29,78,62,1,0               // addps         0x13e4e(%rip),%xmm11        # 3b0c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  68,15,40,45,86,62,1,0               // movaps        0x13e56(%rip),%xmm13        # 3b0d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
   .byte  69,15,89,238                        // mulps         %xmm14,%xmm13
   .byte  69,15,92,221                        // subps         %xmm13,%xmm11
-  .byte  68,15,40,45,117,63,1,0              // movaps        0x13f75(%rip),%xmm13        # 3b8a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
+  .byte  68,15,40,45,86,62,1,0               // movaps        0x13e56(%rip),%xmm13        # 3b0e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
   .byte  69,15,92,238                        // subps         %xmm14,%xmm13
-  .byte  68,15,40,53,121,63,1,0              // movaps        0x13f79(%rip),%xmm14        # 3b8b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
+  .byte  68,15,40,53,90,62,1,0               // movaps        0x13e5a(%rip),%xmm14        # 3b0f0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
   .byte  69,15,94,245                        // divps         %xmm13,%xmm14
   .byte  69,15,88,243                        // addps         %xmm11,%xmm14
-  .byte  68,15,89,53,121,63,1,0              // mulps         0x13f79(%rip),%xmm14        # 3b8c0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
+  .byte  68,15,89,53,90,62,1,0               // mulps         0x13e5a(%rip),%xmm14        # 3b100 <_sk_srcover_bgra_8888_sse2_lowp+0x1004>
   .byte  102,69,15,91,222                    // cvtps2dq      %xmm14,%xmm11
   .byte  69,15,194,202,4                     // cmpneqps      %xmm10,%xmm9
   .byte  69,15,84,203                        // andps         %xmm11,%xmm9
@@ -38683,21 +38371,21 @@
   .byte  68,15,40,209                        // movaps        %xmm1,%xmm10
   .byte  15,40,224                           // movaps        %xmm0,%xmm4
   .byte  15,91,244                           // cvtdq2ps      %xmm4,%xmm6
-  .byte  15,40,5,118,62,1,0                  // movaps        0x13e76(%rip),%xmm0        # 3b820 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
+  .byte  15,40,5,87,61,1,0                   // movaps        0x13d57(%rip),%xmm0        # 3b060 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
   .byte  15,89,240                           // mulps         %xmm0,%xmm6
   .byte  15,40,232                           // movaps        %xmm0,%xmm5
-  .byte  68,15,40,5,120,62,1,0               // movaps        0x13e78(%rip),%xmm8        # 3b830 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  .byte  68,15,40,5,89,61,1,0                // movaps        0x13d59(%rip),%xmm8        # 3b070 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
   .byte  15,40,196                           // movaps        %xmm4,%xmm0
   .byte  65,15,84,192                        // andps         %xmm8,%xmm0
-  .byte  15,86,5,154,59,1,0                  // orps          0x13b9a(%rip),%xmm0        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
-  .byte  15,88,53,115,62,1,0                 // addps         0x13e73(%rip),%xmm6        # 3b840 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
-  .byte  68,15,40,29,123,62,1,0              // movaps        0x13e7b(%rip),%xmm11        # 3b850 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  15,86,5,123,58,1,0                  // orps          0x13a7b(%rip),%xmm0        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,88,53,84,61,1,0                  // addps         0x13d54(%rip),%xmm6        # 3b080 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  68,15,40,29,92,61,1,0               // movaps        0x13d5c(%rip),%xmm11        # 3b090 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  65,15,89,203                        // mulps         %xmm11,%xmm1
   .byte  15,92,241                           // subps         %xmm1,%xmm6
-  .byte  68,15,40,61,121,62,1,0              // movaps        0x13e79(%rip),%xmm15        # 3b860 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
+  .byte  68,15,40,61,90,61,1,0               // movaps        0x13d5a(%rip),%xmm15        # 3b0a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
   .byte  65,15,88,199                        // addps         %xmm15,%xmm0
-  .byte  68,15,40,45,125,62,1,0              // movaps        0x13e7d(%rip),%xmm13        # 3b870 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  .byte  68,15,40,45,94,61,1,0               // movaps        0x13d5e(%rip),%xmm13        # 3b0b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
   .byte  65,15,40,205                        // movaps        %xmm13,%xmm1
   .byte  15,94,200                           // divps         %xmm0,%xmm1
   .byte  15,92,241                           // subps         %xmm1,%xmm6
@@ -38709,23 +38397,23 @@
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
   .byte  15,40,206                           // movaps        %xmm6,%xmm1
   .byte  15,194,200,1                        // cmpltps       %xmm0,%xmm1
-  .byte  15,84,13,81,59,1,0                  // andps         0x13b51(%rip),%xmm1        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,84,13,50,58,1,0                  // andps         0x13a32(%rip),%xmm1        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,92,193                           // subps         %xmm1,%xmm0
   .byte  15,40,206                           // movaps        %xmm6,%xmm1
   .byte  15,92,200                           // subps         %xmm0,%xmm1
-  .byte  15,88,53,81,62,1,0                  // addps         0x13e51(%rip),%xmm6        # 3b880 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
-  .byte  15,40,21,106,62,1,0                 // movaps        0x13e6a(%rip),%xmm2        # 3b8a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
+  .byte  15,88,53,50,61,1,0                  // addps         0x13d32(%rip),%xmm6        # 3b0c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  15,40,21,75,61,1,0                  // movaps        0x13d4b(%rip),%xmm2        # 3b0e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
   .byte  68,15,40,202                        // movaps        %xmm2,%xmm9
   .byte  68,15,92,201                        // subps         %xmm1,%xmm9
   .byte  15,40,193                           // movaps        %xmm1,%xmm0
-  .byte  15,40,13,72,62,1,0                  // movaps        0x13e48(%rip),%xmm1        # 3b890 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  15,40,13,41,61,1,0                  // movaps        0x13d29(%rip),%xmm1        # 3b0d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
   .byte  15,89,193                           // mulps         %xmm1,%xmm0
   .byte  15,92,240                           // subps         %xmm0,%xmm6
-  .byte  68,15,40,53,90,62,1,0               // movaps        0x13e5a(%rip),%xmm14        # 3b8b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
+  .byte  68,15,40,53,59,61,1,0               // movaps        0x13d3b(%rip),%xmm14        # 3b0f0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
   .byte  65,15,40,198                        // movaps        %xmm14,%xmm0
   .byte  65,15,94,193                        // divps         %xmm9,%xmm0
   .byte  15,88,198                           // addps         %xmm6,%xmm0
-  .byte  68,15,40,13,87,62,1,0               // movaps        0x13e57(%rip),%xmm9        # 3b8c0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
+  .byte  68,15,40,13,56,61,1,0               // movaps        0x13d38(%rip),%xmm9        # 3b100 <_sk_srcover_bgra_8888_sse2_lowp+0x1004>
   .byte  65,15,89,193                        // mulps         %xmm9,%xmm0
   .byte  102,15,91,192                       // cvtps2dq      %xmm0,%xmm0
   .byte  15,87,246                           // xorps         %xmm6,%xmm6
@@ -38735,9 +38423,9 @@
   .byte  15,89,197                           // mulps         %xmm5,%xmm0
   .byte  65,15,40,250                        // movaps        %xmm10,%xmm7
   .byte  65,15,84,248                        // andps         %xmm8,%xmm7
-  .byte  15,40,53,207,58,1,0                 // movaps        0x13acf(%rip),%xmm6        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  15,40,53,176,57,1,0                 // movaps        0x139b0(%rip),%xmm6        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  15,86,254                           // orps          %xmm6,%xmm7
-  .byte  15,88,5,165,61,1,0                  // addps         0x13da5(%rip),%xmm0        # 3b840 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
+  .byte  15,88,5,134,60,1,0                  // addps         0x13c86(%rip),%xmm0        # 3b080 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
   .byte  15,40,239                           // movaps        %xmm7,%xmm5
   .byte  65,15,89,235                        // mulps         %xmm11,%xmm5
   .byte  15,92,197                           // subps         %xmm5,%xmm0
@@ -38750,12 +38438,12 @@
   .byte  15,91,237                           // cvtdq2ps      %xmm5,%xmm5
   .byte  15,40,248                           // movaps        %xmm0,%xmm7
   .byte  15,194,253,1                        // cmpltps       %xmm5,%xmm7
-  .byte  68,15,40,61,164,58,1,0              // movaps        0x13aa4(%rip),%xmm15        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,61,133,57,1,0              // movaps        0x13985(%rip),%xmm15        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  65,15,84,255                        // andps         %xmm15,%xmm7
   .byte  15,92,239                           // subps         %xmm7,%xmm5
   .byte  15,40,248                           // movaps        %xmm0,%xmm7
   .byte  15,92,253                           // subps         %xmm5,%xmm7
-  .byte  15,88,5,160,61,1,0                  // addps         0x13da0(%rip),%xmm0        # 3b880 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
+  .byte  15,88,5,129,60,1,0                  // addps         0x13c81(%rip),%xmm0        # 3b0c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
   .byte  15,40,234                           // movaps        %xmm2,%xmm5
   .byte  15,92,239                           // subps         %xmm7,%xmm5
   .byte  15,89,249                           // mulps         %xmm1,%xmm7
@@ -38769,13 +38457,13 @@
   .byte  68,15,194,215,4                     // cmpneqps      %xmm7,%xmm10
   .byte  68,15,84,208                        // andps         %xmm0,%xmm10
   .byte  65,15,91,196                        // cvtdq2ps      %xmm12,%xmm0
-  .byte  15,89,5,11,61,1,0                   // mulps         0x13d0b(%rip),%xmm0        # 3b820 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
+  .byte  15,89,5,236,59,1,0                  // mulps         0x13bec(%rip),%xmm0        # 3b060 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
   .byte  69,15,84,196                        // andps         %xmm12,%xmm8
   .byte  68,15,86,198                        // orps          %xmm6,%xmm8
-  .byte  15,88,5,28,61,1,0                   // addps         0x13d1c(%rip),%xmm0        # 3b840 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
+  .byte  15,88,5,253,59,1,0                  // addps         0x13bfd(%rip),%xmm0        # 3b080 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
   .byte  69,15,89,216                        // mulps         %xmm8,%xmm11
   .byte  65,15,92,195                        // subps         %xmm11,%xmm0
-  .byte  68,15,88,5,44,61,1,0                // addps         0x13d2c(%rip),%xmm8        # 3b860 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
+  .byte  68,15,88,5,13,60,1,0                // addps         0x13c0d(%rip),%xmm8        # 3b0a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
   .byte  69,15,94,232                        // divps         %xmm8,%xmm13
   .byte  65,15,92,197                        // subps         %xmm13,%xmm0
   .byte  15,89,195                           // mulps         %xmm3,%xmm0
@@ -38787,7 +38475,7 @@
   .byte  15,92,221                           // subps         %xmm5,%xmm3
   .byte  15,40,232                           // movaps        %xmm0,%xmm5
   .byte  15,92,235                           // subps         %xmm3,%xmm5
-  .byte  15,88,5,31,61,1,0                   // addps         0x13d1f(%rip),%xmm0        # 3b880 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
+  .byte  15,88,5,0,60,1,0                    // addps         0x13c00(%rip),%xmm0        # 3b0c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
   .byte  15,89,205                           // mulps         %xmm5,%xmm1
   .byte  15,92,193                           // subps         %xmm1,%xmm0
   .byte  15,92,213                           // subps         %xmm5,%xmm2
@@ -38821,21 +38509,21 @@
   .byte  15,41,76,36,184                     // movaps        %xmm1,-0x48(%rsp)
   .byte  15,41,68,36,168                     // movaps        %xmm0,-0x58(%rsp)
   .byte  15,91,221                           // cvtdq2ps      %xmm5,%xmm3
-  .byte  15,40,5,70,60,1,0                   // movaps        0x13c46(%rip),%xmm0        # 3b820 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
+  .byte  15,40,5,39,59,1,0                   // movaps        0x13b27(%rip),%xmm0        # 3b060 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
   .byte  15,89,216                           // mulps         %xmm0,%xmm3
   .byte  15,40,240                           // movaps        %xmm0,%xmm6
-  .byte  68,15,40,5,72,60,1,0                // movaps        0x13c48(%rip),%xmm8        # 3b830 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  .byte  68,15,40,5,41,59,1,0                // movaps        0x13b29(%rip),%xmm8        # 3b070 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
   .byte  15,40,197                           // movaps        %xmm5,%xmm0
   .byte  65,15,84,192                        // andps         %xmm8,%xmm0
-  .byte  15,86,5,106,57,1,0                  // orps          0x1396a(%rip),%xmm0        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
-  .byte  15,88,29,67,60,1,0                  // addps         0x13c43(%rip),%xmm3        # 3b840 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
-  .byte  68,15,40,29,75,60,1,0               // movaps        0x13c4b(%rip),%xmm11        # 3b850 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  15,86,5,75,56,1,0                   // orps          0x1384b(%rip),%xmm0        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,88,29,36,59,1,0                  // addps         0x13b24(%rip),%xmm3        # 3b080 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  .byte  68,15,40,29,44,59,1,0               // movaps        0x13b2c(%rip),%xmm11        # 3b090 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  65,15,89,203                        // mulps         %xmm11,%xmm1
   .byte  15,92,217                           // subps         %xmm1,%xmm3
-  .byte  68,15,40,61,73,60,1,0               // movaps        0x13c49(%rip),%xmm15        # 3b860 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
+  .byte  68,15,40,61,42,59,1,0               // movaps        0x13b2a(%rip),%xmm15        # 3b0a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
   .byte  65,15,88,199                        // addps         %xmm15,%xmm0
-  .byte  68,15,40,45,77,60,1,0               // movaps        0x13c4d(%rip),%xmm13        # 3b870 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  .byte  68,15,40,45,46,59,1,0               // movaps        0x13b2e(%rip),%xmm13        # 3b0b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
   .byte  65,15,40,205                        // movaps        %xmm13,%xmm1
   .byte  15,94,200                           // divps         %xmm0,%xmm1
   .byte  15,92,217                           // subps         %xmm1,%xmm3
@@ -38847,23 +38535,23 @@
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
   .byte  15,40,203                           // movaps        %xmm3,%xmm1
   .byte  15,194,200,1                        // cmpltps       %xmm0,%xmm1
-  .byte  15,84,13,33,57,1,0                  // andps         0x13921(%rip),%xmm1        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,84,13,2,56,1,0                   // andps         0x13802(%rip),%xmm1        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,92,193                           // subps         %xmm1,%xmm0
   .byte  15,40,203                           // movaps        %xmm3,%xmm1
   .byte  15,92,200                           // subps         %xmm0,%xmm1
-  .byte  15,88,29,33,60,1,0                  // addps         0x13c21(%rip),%xmm3        # 3b880 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
-  .byte  15,40,21,58,60,1,0                  // movaps        0x13c3a(%rip),%xmm2        # 3b8a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
+  .byte  15,88,29,2,59,1,0                   // addps         0x13b02(%rip),%xmm3        # 3b0c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  15,40,21,27,59,1,0                  // movaps        0x13b1b(%rip),%xmm2        # 3b0e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
   .byte  68,15,40,202                        // movaps        %xmm2,%xmm9
   .byte  68,15,92,201                        // subps         %xmm1,%xmm9
   .byte  15,40,193                           // movaps        %xmm1,%xmm0
-  .byte  15,40,13,24,60,1,0                  // movaps        0x13c18(%rip),%xmm1        # 3b890 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  .byte  15,40,13,249,58,1,0                 // movaps        0x13af9(%rip),%xmm1        # 3b0d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
   .byte  15,89,193                           // mulps         %xmm1,%xmm0
   .byte  15,92,216                           // subps         %xmm0,%xmm3
-  .byte  68,15,40,53,42,60,1,0               // movaps        0x13c2a(%rip),%xmm14        # 3b8b0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
+  .byte  68,15,40,53,11,59,1,0               // movaps        0x13b0b(%rip),%xmm14        # 3b0f0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
   .byte  65,15,40,198                        // movaps        %xmm14,%xmm0
   .byte  65,15,94,193                        // divps         %xmm9,%xmm0
   .byte  15,88,195                           // addps         %xmm3,%xmm0
-  .byte  68,15,40,13,39,60,1,0               // movaps        0x13c27(%rip),%xmm9        # 3b8c0 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
+  .byte  68,15,40,13,8,59,1,0                // movaps        0x13b08(%rip),%xmm9        # 3b100 <_sk_srcover_bgra_8888_sse2_lowp+0x1004>
   .byte  65,15,89,193                        // mulps         %xmm9,%xmm0
   .byte  102,15,91,192                       // cvtps2dq      %xmm0,%xmm0
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
@@ -38873,9 +38561,9 @@
   .byte  15,89,198                           // mulps         %xmm6,%xmm0
   .byte  65,15,40,250                        // movaps        %xmm10,%xmm7
   .byte  65,15,84,248                        // andps         %xmm8,%xmm7
-  .byte  15,40,29,159,56,1,0                 // movaps        0x1389f(%rip),%xmm3        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  15,40,29,128,55,1,0                 // movaps        0x13780(%rip),%xmm3        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  15,86,251                           // orps          %xmm3,%xmm7
-  .byte  15,88,5,117,59,1,0                  // addps         0x13b75(%rip),%xmm0        # 3b840 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
+  .byte  15,88,5,86,58,1,0                   // addps         0x13a56(%rip),%xmm0        # 3b080 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
   .byte  15,40,247                           // movaps        %xmm7,%xmm6
   .byte  65,15,89,243                        // mulps         %xmm11,%xmm6
   .byte  15,92,198                           // subps         %xmm6,%xmm0
@@ -38888,12 +38576,12 @@
   .byte  15,91,246                           // cvtdq2ps      %xmm6,%xmm6
   .byte  15,40,248                           // movaps        %xmm0,%xmm7
   .byte  15,194,254,1                        // cmpltps       %xmm6,%xmm7
-  .byte  68,15,40,61,116,56,1,0              // movaps        0x13874(%rip),%xmm15        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,61,85,55,1,0               // movaps        0x13755(%rip),%xmm15        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  65,15,84,255                        // andps         %xmm15,%xmm7
   .byte  15,92,247                           // subps         %xmm7,%xmm6
   .byte  15,40,248                           // movaps        %xmm0,%xmm7
   .byte  15,92,254                           // subps         %xmm6,%xmm7
-  .byte  15,88,5,112,59,1,0                  // addps         0x13b70(%rip),%xmm0        # 3b880 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
+  .byte  15,88,5,81,58,1,0                   // addps         0x13a51(%rip),%xmm0        # 3b0c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
   .byte  15,40,242                           // movaps        %xmm2,%xmm6
   .byte  15,92,247                           // subps         %xmm7,%xmm6
   .byte  15,89,249                           // mulps         %xmm1,%xmm7
@@ -38907,13 +38595,13 @@
   .byte  68,15,194,215,4                     // cmpneqps      %xmm7,%xmm10
   .byte  68,15,84,208                        // andps         %xmm0,%xmm10
   .byte  65,15,91,196                        // cvtdq2ps      %xmm12,%xmm0
-  .byte  15,89,5,219,58,1,0                  // mulps         0x13adb(%rip),%xmm0        # 3b820 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
+  .byte  15,89,5,188,57,1,0                  // mulps         0x139bc(%rip),%xmm0        # 3b060 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
   .byte  69,15,84,196                        // andps         %xmm12,%xmm8
   .byte  68,15,86,195                        // orps          %xmm3,%xmm8
-  .byte  15,88,5,236,58,1,0                  // addps         0x13aec(%rip),%xmm0        # 3b840 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
+  .byte  15,88,5,205,57,1,0                  // addps         0x139cd(%rip),%xmm0        # 3b080 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
   .byte  69,15,89,216                        // mulps         %xmm8,%xmm11
   .byte  65,15,92,195                        // subps         %xmm11,%xmm0
-  .byte  68,15,88,5,252,58,1,0               // addps         0x13afc(%rip),%xmm8        # 3b860 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
+  .byte  68,15,88,5,221,57,1,0               // addps         0x139dd(%rip),%xmm8        # 3b0a0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
   .byte  69,15,94,232                        // divps         %xmm8,%xmm13
   .byte  65,15,92,197                        // subps         %xmm13,%xmm0
   .byte  15,89,196                           // mulps         %xmm4,%xmm0
@@ -38925,7 +38613,7 @@
   .byte  15,92,230                           // subps         %xmm6,%xmm4
   .byte  15,40,240                           // movaps        %xmm0,%xmm6
   .byte  15,92,244                           // subps         %xmm4,%xmm6
-  .byte  15,88,5,239,58,1,0                  // addps         0x13aef(%rip),%xmm0        # 3b880 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
+  .byte  15,88,5,208,57,1,0                  // addps         0x139d0(%rip),%xmm0        # 3b0c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
   .byte  15,89,206                           // mulps         %xmm6,%xmm1
   .byte  15,92,193                           // subps         %xmm1,%xmm0
   .byte  15,92,214                           // subps         %xmm6,%xmm2
@@ -38950,29 +38638,29 @@
 .globl _sk_lab_to_xyz_sse2
 FUNCTION(_sk_lab_to_xyz_sse2)
 _sk_lab_to_xyz_sse2:
-  .byte  15,89,5,237,58,1,0                  // mulps         0x13aed(%rip),%xmm0        # 3b8d0 <_sk_srcover_bgra_8888_sse2_lowp+0x1004>
-  .byte  68,15,40,5,101,56,1,0               // movaps        0x13865(%rip),%xmm8        # 3b650 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  .byte  15,89,5,206,57,1,0                  // mulps         0x139ce(%rip),%xmm0        # 3b110 <_sk_srcover_bgra_8888_sse2_lowp+0x1014>
+  .byte  68,15,40,5,70,55,1,0                // movaps        0x13746(%rip),%xmm8        # 3ae90 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
   .byte  65,15,89,200                        // mulps         %xmm8,%xmm1
-  .byte  68,15,40,13,233,58,1,0              // movaps        0x13ae9(%rip),%xmm9        # 3b8e0 <_sk_srcover_bgra_8888_sse2_lowp+0x1014>
+  .byte  68,15,40,13,202,57,1,0              // movaps        0x139ca(%rip),%xmm9        # 3b120 <_sk_srcover_bgra_8888_sse2_lowp+0x1024>
   .byte  65,15,88,201                        // addps         %xmm9,%xmm1
   .byte  65,15,89,208                        // mulps         %xmm8,%xmm2
   .byte  65,15,88,209                        // addps         %xmm9,%xmm2
-  .byte  15,88,5,230,58,1,0                  // addps         0x13ae6(%rip),%xmm0        # 3b8f0 <_sk_srcover_bgra_8888_sse2_lowp+0x1024>
-  .byte  15,89,5,239,58,1,0                  // mulps         0x13aef(%rip),%xmm0        # 3b900 <_sk_srcover_bgra_8888_sse2_lowp+0x1034>
-  .byte  15,89,13,248,58,1,0                 // mulps         0x13af8(%rip),%xmm1        # 3b910 <_sk_srcover_bgra_8888_sse2_lowp+0x1044>
+  .byte  15,88,5,199,57,1,0                  // addps         0x139c7(%rip),%xmm0        # 3b130 <_sk_srcover_bgra_8888_sse2_lowp+0x1034>
+  .byte  15,89,5,208,57,1,0                  // mulps         0x139d0(%rip),%xmm0        # 3b140 <_sk_srcover_bgra_8888_sse2_lowp+0x1044>
+  .byte  15,89,13,217,57,1,0                 // mulps         0x139d9(%rip),%xmm1        # 3b150 <_sk_srcover_bgra_8888_sse2_lowp+0x1054>
   .byte  15,88,200                           // addps         %xmm0,%xmm1
-  .byte  15,89,21,254,58,1,0                 // mulps         0x13afe(%rip),%xmm2        # 3b920 <_sk_srcover_bgra_8888_sse2_lowp+0x1054>
+  .byte  15,89,21,223,57,1,0                 // mulps         0x139df(%rip),%xmm2        # 3b160 <_sk_srcover_bgra_8888_sse2_lowp+0x1064>
   .byte  68,15,40,200                        // movaps        %xmm0,%xmm9
   .byte  68,15,92,202                        // subps         %xmm2,%xmm9
   .byte  68,15,40,225                        // movaps        %xmm1,%xmm12
   .byte  69,15,89,228                        // mulps         %xmm12,%xmm12
   .byte  68,15,89,225                        // mulps         %xmm1,%xmm12
-  .byte  15,40,21,243,58,1,0                 // movaps        0x13af3(%rip),%xmm2        # 3b930 <_sk_srcover_bgra_8888_sse2_lowp+0x1064>
+  .byte  15,40,21,212,57,1,0                 // movaps        0x139d4(%rip),%xmm2        # 3b170 <_sk_srcover_bgra_8888_sse2_lowp+0x1074>
   .byte  68,15,40,194                        // movaps        %xmm2,%xmm8
   .byte  69,15,194,196,1                     // cmpltps       %xmm12,%xmm8
-  .byte  68,15,40,21,242,58,1,0              // movaps        0x13af2(%rip),%xmm10        # 3b940 <_sk_srcover_bgra_8888_sse2_lowp+0x1074>
+  .byte  68,15,40,21,211,57,1,0              // movaps        0x139d3(%rip),%xmm10        # 3b180 <_sk_srcover_bgra_8888_sse2_lowp+0x1084>
   .byte  65,15,88,202                        // addps         %xmm10,%xmm1
-  .byte  68,15,40,29,246,58,1,0              // movaps        0x13af6(%rip),%xmm11        # 3b950 <_sk_srcover_bgra_8888_sse2_lowp+0x1084>
+  .byte  68,15,40,29,215,57,1,0              // movaps        0x139d7(%rip),%xmm11        # 3b190 <_sk_srcover_bgra_8888_sse2_lowp+0x1094>
   .byte  65,15,89,203                        // mulps         %xmm11,%xmm1
   .byte  69,15,84,224                        // andps         %xmm8,%xmm12
   .byte  68,15,85,193                        // andnps        %xmm1,%xmm8
@@ -38996,8 +38684,8 @@
   .byte  15,84,194                           // andps         %xmm2,%xmm0
   .byte  65,15,85,209                        // andnps        %xmm9,%xmm2
   .byte  15,86,208                           // orps          %xmm0,%xmm2
-  .byte  68,15,89,5,166,58,1,0               // mulps         0x13aa6(%rip),%xmm8        # 3b960 <_sk_srcover_bgra_8888_sse2_lowp+0x1094>
-  .byte  15,89,21,175,58,1,0                 // mulps         0x13aaf(%rip),%xmm2        # 3b970 <_sk_srcover_bgra_8888_sse2_lowp+0x10a4>
+  .byte  68,15,89,5,135,57,1,0               // mulps         0x13987(%rip),%xmm8        # 3b1a0 <_sk_srcover_bgra_8888_sse2_lowp+0x10a4>
+  .byte  15,89,21,144,57,1,0                 // mulps         0x13990(%rip),%xmm2        # 3b1b0 <_sk_srcover_bgra_8888_sse2_lowp+0x10b4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  255,224                             // jmpq          *%rax
@@ -39007,90 +38695,86 @@
 FUNCTION(_sk_load_a8_sse2)
 _sk_load_a8_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,46                              // jne           27f0f <_sk_load_a8_sse2+0x46>
-  .byte  102,67,15,110,4,16                  // movd          (%r8,%r10,1),%xmm0
+  .byte  117,46                              // jne           27868 <_sk_load_a8_sse2+0x40>
+  .byte  102,65,15,110,4,16                  // movd          (%r8,%rdx,1),%xmm0
   .byte  102,15,96,192                       // punpcklbw     %xmm0,%xmm0
   .byte  102,15,97,192                       // punpcklwd     %xmm0,%xmm0
-  .byte  102,15,219,5,41,55,1,0              // pand          0x13729(%rip),%xmm0        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  102,15,219,5,16,54,1,0              // pand          0x13610(%rip),%xmm0        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  15,91,216                           // cvtdq2ps      %xmm0,%xmm3
-  .byte  15,89,29,127,56,1,0                 // mulps         0x1387f(%rip),%xmm3        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  15,89,29,102,55,1,0                 // mulps         0x13766(%rip),%xmm3        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  102,15,87,201                       // xorpd         %xmm1,%xmm1
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,54                              // je            27f52 <_sk_load_a8_sse2+0x89>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,50                              // je            278a2 <_sk_load_a8_sse2+0x7a>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            27f3b <_sk_load_a8_sse2+0x72>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,195                             // jne           27eef <_sk_load_a8_sse2+0x26>
-  .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,19                              // je            2788b <_sk_load_a8_sse2+0x63>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,204                             // jne           27848 <_sk_load_a8_sse2+0x20>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,15,112,192,69                   // pshufd        $0x45,%xmm0,%xmm0
-  .byte  67,15,183,4,16                      // movzwl        (%r8,%r10,1),%eax
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  102,15,110,200                      // movd          %eax,%xmm1
   .byte  102,15,96,200                       // punpcklbw     %xmm0,%xmm1
   .byte  102,15,97,200                       // punpcklwd     %xmm0,%xmm1
   .byte  242,15,16,193                       // movsd         %xmm1,%xmm0
-  .byte  235,157                             // jmp           27eef <_sk_load_a8_sse2+0x26>
-  .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
+  .byte  235,166                             // jmp           27848 <_sk_load_a8_sse2+0x20>
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
-  .byte  235,146                             // jmp           27eef <_sk_load_a8_sse2+0x26>
+  .byte  235,155                             // jmp           27848 <_sk_load_a8_sse2+0x20>
 
 HIDDEN _sk_load_a8_dst_sse2
 .globl _sk_load_a8_dst_sse2
 FUNCTION(_sk_load_a8_dst_sse2)
 _sk_load_a8_dst_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,46                              // jne           27fa3 <_sk_load_a8_dst_sse2+0x46>
-  .byte  102,67,15,110,36,16                 // movd          (%r8,%r10,1),%xmm4
+  .byte  117,46                              // jne           278ed <_sk_load_a8_dst_sse2+0x40>
+  .byte  102,65,15,110,36,16                 // movd          (%r8,%rdx,1),%xmm4
   .byte  102,15,96,224                       // punpcklbw     %xmm0,%xmm4
   .byte  102,15,97,224                       // punpcklwd     %xmm0,%xmm4
-  .byte  102,15,219,37,149,54,1,0            // pand          0x13695(%rip),%xmm4        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  102,15,219,37,139,53,1,0            // pand          0x1358b(%rip),%xmm4        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  15,91,252                           // cvtdq2ps      %xmm4,%xmm7
-  .byte  15,89,61,235,55,1,0                 // mulps         0x137eb(%rip),%xmm7        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  15,89,61,225,54,1,0                 // mulps         0x136e1(%rip),%xmm7        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,87,228                           // xorps         %xmm4,%xmm4
   .byte  102,15,87,237                       // xorpd         %xmm5,%xmm5
   .byte  15,87,246                           // xorps         %xmm6,%xmm6
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,54                              // je            27fe6 <_sk_load_a8_dst_sse2+0x89>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,50                              // je            27927 <_sk_load_a8_dst_sse2+0x7a>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            27fcf <_sk_load_a8_dst_sse2+0x72>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,195                             // jne           27f83 <_sk_load_a8_dst_sse2+0x26>
-  .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,19                              // je            27910 <_sk_load_a8_dst_sse2+0x63>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,204                             // jne           278cd <_sk_load_a8_dst_sse2+0x20>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
   .byte  102,15,112,228,69                   // pshufd        $0x45,%xmm4,%xmm4
-  .byte  67,15,183,4,16                      // movzwl        (%r8,%r10,1),%eax
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  102,15,110,232                      // movd          %eax,%xmm5
   .byte  102,15,96,232                       // punpcklbw     %xmm0,%xmm5
   .byte  102,15,97,232                       // punpcklwd     %xmm0,%xmm5
   .byte  242,15,16,229                       // movsd         %xmm5,%xmm4
-  .byte  235,157                             // jmp           27f83 <_sk_load_a8_dst_sse2+0x26>
-  .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
+  .byte  235,166                             // jmp           278cd <_sk_load_a8_dst_sse2+0x20>
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
-  .byte  235,146                             // jmp           27f83 <_sk_load_a8_dst_sse2+0x26>
+  .byte  235,155                             // jmp           278cd <_sk_load_a8_dst_sse2+0x20>
 
 HIDDEN _sk_gather_a8_sse2
 .globl _sk_gather_a8_sse2
@@ -39143,7 +38827,7 @@
   .byte  102,65,15,96,192                    // punpcklbw     %xmm8,%xmm0
   .byte  102,65,15,97,192                    // punpcklwd     %xmm8,%xmm0
   .byte  15,91,216                           // cvtdq2ps      %xmm0,%xmm3
-  .byte  15,89,29,197,54,1,0                 // mulps         0x136c5(%rip),%xmm3        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  15,89,29,196,53,1,0                 // mulps         0x135c4(%rip),%xmm3        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
@@ -39155,137 +38839,131 @@
 FUNCTION(_sk_store_a8_sse2)
 _sk_store_a8_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  68,15,95,195                        // maxps         %xmm3,%xmm8
-  .byte  68,15,93,5,132,52,1,0               // minps         0x13484(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
-  .byte  68,15,89,5,92,53,1,0                // mulps         0x1355c(%rip),%xmm8        # 3b650 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  .byte  68,15,93,5,137,51,1,0               // minps         0x13389(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
+  .byte  68,15,89,5,97,52,1,0                // mulps         0x13461(%rip),%xmm8        # 3ae90 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
   .byte  102,69,15,91,192                    // cvtps2dq      %xmm8,%xmm8
   .byte  102,65,15,114,240,16                // pslld         $0x10,%xmm8
   .byte  102,65,15,114,224,16                // psrad         $0x10,%xmm8
   .byte  102,68,15,107,192                   // packssdw      %xmm0,%xmm8
   .byte  102,68,15,103,192                   // packuswb      %xmm0,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,13                              // jne           28121 <_sk_store_a8_sse2+0x58>
+  .byte  117,13                              // jne           27a5c <_sk_store_a8_sse2+0x52>
   .byte  102,68,15,126,192                   // movd          %xmm8,%eax
-  .byte  67,137,4,16                         // mov           %eax,(%r8,%r10,1)
+  .byte  65,137,4,16                         // mov           %eax,(%r8,%rdx,1)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,68,15,96,192                    // punpcklbw     %xmm0,%xmm8
   .byte  102,68,15,97,192                    // punpcklwd     %xmm0,%xmm8
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,54                              // je            2816e <_sk_store_a8_sse2+0xa5>
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,17                              // je            2814f <_sk_store_a8_sse2+0x86>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,217                             // jne           2811d <_sk_store_a8_sse2+0x54>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,50                              // je            27aa0 <_sk_store_a8_sse2+0x96>
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,15                              // je            27a81 <_sk_store_a8_sse2+0x77>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,226                             // jne           27a58 <_sk_store_a8_sse2+0x4e>
   .byte  102,65,15,197,192,4                 // pextrw        $0x4,%xmm8,%eax
-  .byte  67,136,68,16,2                      // mov           %al,0x2(%r8,%r10,1)
-  .byte  102,68,15,219,5,200,52,1,0          // pand          0x134c8(%rip),%xmm8        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  65,136,68,16,2                      // mov           %al,0x2(%r8,%rdx,1)
+  .byte  102,68,15,219,5,214,51,1,0          // pand          0x133d6(%rip),%xmm8        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  102,69,15,103,192                   // packuswb      %xmm8,%xmm8
   .byte  102,69,15,103,192                   // packuswb      %xmm8,%xmm8
   .byte  102,68,15,126,192                   // movd          %xmm8,%eax
-  .byte  102,67,137,4,16                     // mov           %ax,(%r8,%r10,1)
-  .byte  235,175                             // jmp           2811d <_sk_store_a8_sse2+0x54>
+  .byte  102,65,137,4,16                     // mov           %ax,(%r8,%rdx,1)
+  .byte  235,184                             // jmp           27a58 <_sk_store_a8_sse2+0x4e>
   .byte  102,68,15,126,192                   // movd          %xmm8,%eax
-  .byte  67,136,4,16                         // mov           %al,(%r8,%r10,1)
-  .byte  235,164                             // jmp           2811d <_sk_store_a8_sse2+0x54>
+  .byte  65,136,4,16                         // mov           %al,(%r8,%rdx,1)
+  .byte  235,173                             // jmp           27a58 <_sk_store_a8_sse2+0x4e>
 
 HIDDEN _sk_load_g8_sse2
 .globl _sk_load_g8_sse2
 FUNCTION(_sk_load_g8_sse2)
 _sk_load_g8_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,49                              // jne           281c2 <_sk_load_g8_sse2+0x49>
-  .byte  102,67,15,110,4,16                  // movd          (%r8,%r10,1),%xmm0
+  .byte  117,49                              // jne           27aee <_sk_load_g8_sse2+0x43>
+  .byte  102,65,15,110,4,16                  // movd          (%r8,%rdx,1),%xmm0
   .byte  102,15,96,192                       // punpcklbw     %xmm0,%xmm0
   .byte  102,15,97,192                       // punpcklwd     %xmm0,%xmm0
-  .byte  102,15,219,5,121,52,1,0             // pand          0x13479(%rip),%xmm0        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  102,15,219,5,141,51,1,0             // pand          0x1338d(%rip),%xmm0        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,207,53,1,0                  // mulps         0x135cf(%rip),%xmm0        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  15,89,5,227,52,1,0                  // mulps         0x134e3(%rip),%xmm0        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,182,51,1,0                 // movaps        0x133b6(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,29,202,50,1,0                 // movaps        0x132ca(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,54                              // je            28205 <_sk_load_g8_sse2+0x8c>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,50                              // je            27b28 <_sk_load_g8_sse2+0x7d>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            281ee <_sk_load_g8_sse2+0x75>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,192                             // jne           2819f <_sk_load_g8_sse2+0x26>
-  .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,19                              // je            27b11 <_sk_load_g8_sse2+0x66>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,201                             // jne           27acb <_sk_load_g8_sse2+0x20>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,15,112,192,69                   // pshufd        $0x45,%xmm0,%xmm0
-  .byte  67,15,183,4,16                      // movzwl        (%r8,%r10,1),%eax
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  102,15,110,200                      // movd          %eax,%xmm1
   .byte  102,15,96,200                       // punpcklbw     %xmm0,%xmm1
   .byte  102,15,97,200                       // punpcklwd     %xmm0,%xmm1
   .byte  242,15,16,193                       // movsd         %xmm1,%xmm0
-  .byte  235,154                             // jmp           2819f <_sk_load_g8_sse2+0x26>
-  .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
+  .byte  235,163                             // jmp           27acb <_sk_load_g8_sse2+0x20>
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
-  .byte  235,143                             // jmp           2819f <_sk_load_g8_sse2+0x26>
+  .byte  235,152                             // jmp           27acb <_sk_load_g8_sse2+0x20>
 
 HIDDEN _sk_load_g8_dst_sse2
 .globl _sk_load_g8_dst_sse2
 FUNCTION(_sk_load_g8_dst_sse2)
 _sk_load_g8_dst_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,49                              // jne           28259 <_sk_load_g8_dst_sse2+0x49>
-  .byte  102,67,15,110,36,16                 // movd          (%r8,%r10,1),%xmm4
+  .byte  117,49                              // jne           27b76 <_sk_load_g8_dst_sse2+0x43>
+  .byte  102,65,15,110,36,16                 // movd          (%r8,%rdx,1),%xmm4
   .byte  102,15,96,224                       // punpcklbw     %xmm0,%xmm4
   .byte  102,15,97,224                       // punpcklwd     %xmm0,%xmm4
-  .byte  102,15,219,37,226,51,1,0            // pand          0x133e2(%rip),%xmm4        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  102,15,219,37,5,51,1,0              // pand          0x13305(%rip),%xmm4        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
-  .byte  15,89,37,56,53,1,0                  // mulps         0x13538(%rip),%xmm4        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  15,89,37,91,52,1,0                  // mulps         0x1345b(%rip),%xmm4        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,61,31,51,1,0                  // movaps        0x1331f(%rip),%xmm7        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,61,66,50,1,0                  // movaps        0x13242(%rip),%xmm7        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,40,236                           // movaps        %xmm4,%xmm5
   .byte  15,40,244                           // movaps        %xmm4,%xmm6
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,54                              // je            2829c <_sk_load_g8_dst_sse2+0x8c>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,50                              // je            27bb0 <_sk_load_g8_dst_sse2+0x7d>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            28285 <_sk_load_g8_dst_sse2+0x75>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,192                             // jne           28236 <_sk_load_g8_dst_sse2+0x26>
-  .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,19                              // je            27b99 <_sk_load_g8_dst_sse2+0x66>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,201                             // jne           27b53 <_sk_load_g8_dst_sse2+0x20>
+  .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
   .byte  102,15,112,228,69                   // pshufd        $0x45,%xmm4,%xmm4
-  .byte  67,15,183,4,16                      // movzwl        (%r8,%r10,1),%eax
+  .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  102,15,110,232                      // movd          %eax,%xmm5
   .byte  102,15,96,232                       // punpcklbw     %xmm0,%xmm5
   .byte  102,15,97,232                       // punpcklwd     %xmm0,%xmm5
   .byte  242,15,16,229                       // movsd         %xmm5,%xmm4
-  .byte  235,154                             // jmp           28236 <_sk_load_g8_dst_sse2+0x26>
-  .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
+  .byte  235,163                             // jmp           27b53 <_sk_load_g8_dst_sse2+0x20>
+  .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
-  .byte  235,143                             // jmp           28236 <_sk_load_g8_dst_sse2+0x26>
+  .byte  235,152                             // jmp           27b53 <_sk_load_g8_dst_sse2+0x20>
 
 HIDDEN _sk_gather_g8_sse2
 .globl _sk_gather_g8_sse2
@@ -39338,9 +39016,9 @@
   .byte  102,65,15,96,192                    // punpcklbw     %xmm8,%xmm0
   .byte  102,65,15,97,192                    // punpcklwd     %xmm8,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,15,52,1,0                   // mulps         0x1340f(%rip),%xmm0        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  15,89,5,59,51,1,0                   // mulps         0x1333b(%rip),%xmm0        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,246,49,1,0                 // movaps        0x131f6(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,29,34,49,1,0                  // movaps        0x13122(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  255,224                             // jmpq          *%rax
@@ -39350,98 +39028,94 @@
 FUNCTION(_sk_load_565_sse2)
 _sk_load_565_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,83                              // jne           283f0 <_sk_load_565_sse2+0x6e>
-  .byte  243,67,15,126,20,80                 // movq          (%r8,%r10,2),%xmm2
+  .byte  117,83                              // jne           27cfe <_sk_load_565_sse2+0x68>
+  .byte  243,65,15,126,20,80                 // movq          (%r8,%rdx,2),%xmm2
   .byte  102,15,97,208                       // punpcklwd     %xmm0,%xmm2
-  .byte  102,15,111,5,225,51,1,0             // movdqa        0x133e1(%rip),%xmm0        # 3b790 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
+  .byte  102,15,111,5,19,51,1,0              // movdqa        0x13313(%rip),%xmm0        # 3afd0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
   .byte  102,15,219,194                      // pand          %xmm2,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,227,51,1,0                  // mulps         0x133e3(%rip),%xmm0        # 3b7a0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
-  .byte  102,15,111,13,235,51,1,0            // movdqa        0x133eb(%rip),%xmm1        # 3b7b0 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  .byte  15,89,5,21,51,1,0                   // mulps         0x13315(%rip),%xmm0        # 3afe0 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  .byte  102,15,111,13,29,51,1,0             // movdqa        0x1331d(%rip),%xmm1        # 3aff0 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
   .byte  102,15,219,202                      // pand          %xmm2,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
-  .byte  15,89,13,237,51,1,0                 // mulps         0x133ed(%rip),%xmm1        # 3b7c0 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
-  .byte  102,15,219,21,245,51,1,0            // pand          0x133f5(%rip),%xmm2        # 3b7d0 <_sk_srcover_bgra_8888_sse2_lowp+0xf04>
+  .byte  15,89,13,31,51,1,0                  // mulps         0x1331f(%rip),%xmm1        # 3b000 <_sk_srcover_bgra_8888_sse2_lowp+0xf04>
+  .byte  102,15,219,21,39,51,1,0             // pand          0x13327(%rip),%xmm2        # 3b010 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
-  .byte  15,89,21,251,51,1,0                 // mulps         0x133fb(%rip),%xmm2        # 3b7e0 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
+  .byte  15,89,21,45,51,1,0                  // mulps         0x1332d(%rip),%xmm2        # 3b020 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,130,49,1,0                 // movaps        0x13182(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,29,180,48,1,0                 // movaps        0x130b4(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,51                              // je            28430 <_sk_load_565_sse2+0xae>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,44                              // je            27d32 <_sk_load_565_sse2+0x9c>
   .byte  102,15,239,210                      // pxor          %xmm2,%xmm2
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            2841c <_sk_load_565_sse2+0x9a>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,154                             // jne           283a7 <_sk_load_565_sse2+0x25>
-  .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,19                              // je            27d21 <_sk_load_565_sse2+0x8b>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,163                             // jne           27cb5 <_sk_load_565_sse2+0x1f>
+  .byte  65,15,183,68,80,4                   // movzwl        0x4(%r8,%rdx,2),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,15,112,208,69                   // pshufd        $0x45,%xmm0,%xmm2
-  .byte  102,67,15,110,4,80                  // movd          (%r8,%r10,2),%xmm0
+  .byte  102,65,15,110,4,80                  // movd          (%r8,%rdx,2),%xmm0
   .byte  242,15,112,192,212                  // pshuflw       $0xd4,%xmm0,%xmm0
   .byte  242,15,16,208                       // movsd         %xmm0,%xmm2
-  .byte  233,119,255,255,255                 // jmpq          283a7 <_sk_load_565_sse2+0x25>
-  .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
+  .byte  235,131                             // jmp           27cb5 <_sk_load_565_sse2+0x1f>
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,15,110,208                      // movd          %eax,%xmm2
-  .byte  233,105,255,255,255                 // jmpq          283a7 <_sk_load_565_sse2+0x25>
+  .byte  233,117,255,255,255                 // jmpq          27cb5 <_sk_load_565_sse2+0x1f>
 
 HIDDEN _sk_load_565_dst_sse2
 .globl _sk_load_565_dst_sse2
 FUNCTION(_sk_load_565_dst_sse2)
 _sk_load_565_dst_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,83                              // jne           284ac <_sk_load_565_dst_sse2+0x6e>
-  .byte  243,67,15,126,52,80                 // movq          (%r8,%r10,2),%xmm6
+  .byte  117,83                              // jne           27da8 <_sk_load_565_dst_sse2+0x68>
+  .byte  243,65,15,126,52,80                 // movq          (%r8,%rdx,2),%xmm6
   .byte  102,15,97,240                       // punpcklwd     %xmm0,%xmm6
-  .byte  102,15,111,37,37,51,1,0             // movdqa        0x13325(%rip),%xmm4        # 3b790 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
+  .byte  102,15,111,37,105,50,1,0            // movdqa        0x13269(%rip),%xmm4        # 3afd0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
   .byte  102,15,219,230                      // pand          %xmm6,%xmm4
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
-  .byte  15,89,37,39,51,1,0                  // mulps         0x13327(%rip),%xmm4        # 3b7a0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
-  .byte  102,15,111,45,47,51,1,0             // movdqa        0x1332f(%rip),%xmm5        # 3b7b0 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  .byte  15,89,37,107,50,1,0                 // mulps         0x1326b(%rip),%xmm4        # 3afe0 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  .byte  102,15,111,45,115,50,1,0            // movdqa        0x13273(%rip),%xmm5        # 3aff0 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
   .byte  102,15,219,238                      // pand          %xmm6,%xmm5
   .byte  15,91,237                           // cvtdq2ps      %xmm5,%xmm5
-  .byte  15,89,45,49,51,1,0                  // mulps         0x13331(%rip),%xmm5        # 3b7c0 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
-  .byte  102,15,219,53,57,51,1,0             // pand          0x13339(%rip),%xmm6        # 3b7d0 <_sk_srcover_bgra_8888_sse2_lowp+0xf04>
+  .byte  15,89,45,117,50,1,0                 // mulps         0x13275(%rip),%xmm5        # 3b000 <_sk_srcover_bgra_8888_sse2_lowp+0xf04>
+  .byte  102,15,219,53,125,50,1,0            // pand          0x1327d(%rip),%xmm6        # 3b010 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
   .byte  15,91,246                           // cvtdq2ps      %xmm6,%xmm6
-  .byte  15,89,53,63,51,1,0                  // mulps         0x1333f(%rip),%xmm6        # 3b7e0 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
+  .byte  15,89,53,131,50,1,0                 // mulps         0x13283(%rip),%xmm6        # 3b020 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,61,198,48,1,0                 // movaps        0x130c6(%rip),%xmm7        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,61,10,48,1,0                  // movaps        0x1300a(%rip),%xmm7        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,51                              // je            284ec <_sk_load_565_dst_sse2+0xae>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,44                              // je            27ddc <_sk_load_565_dst_sse2+0x9c>
   .byte  102,15,239,246                      // pxor          %xmm6,%xmm6
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            284d8 <_sk_load_565_dst_sse2+0x9a>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,154                             // jne           28463 <_sk_load_565_dst_sse2+0x25>
-  .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,19                              // je            27dcb <_sk_load_565_dst_sse2+0x8b>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,163                             // jne           27d5f <_sk_load_565_dst_sse2+0x1f>
+  .byte  65,15,183,68,80,4                   // movzwl        0x4(%r8,%rdx,2),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
   .byte  102,15,112,244,69                   // pshufd        $0x45,%xmm4,%xmm6
-  .byte  102,67,15,110,36,80                 // movd          (%r8,%r10,2),%xmm4
+  .byte  102,65,15,110,36,80                 // movd          (%r8,%rdx,2),%xmm4
   .byte  242,15,112,228,212                  // pshuflw       $0xd4,%xmm4,%xmm4
   .byte  242,15,16,244                       // movsd         %xmm4,%xmm6
-  .byte  233,119,255,255,255                 // jmpq          28463 <_sk_load_565_dst_sse2+0x25>
-  .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
+  .byte  235,131                             // jmp           27d5f <_sk_load_565_dst_sse2+0x1f>
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,15,110,240                      // movd          %eax,%xmm6
-  .byte  233,105,255,255,255                 // jmpq          28463 <_sk_load_565_dst_sse2+0x25>
+  .byte  233,117,255,255,255                 // jmpq          27d5f <_sk_load_565_dst_sse2+0x1f>
 
 HIDDEN _sk_gather_565_sse2
 .globl _sk_gather_565_sse2
@@ -39490,19 +39164,19 @@
   .byte  65,15,183,4,64                      // movzwl        (%r8,%rax,2),%eax
   .byte  102,15,196,208,3                    // pinsrw        $0x3,%eax,%xmm2
   .byte  102,65,15,97,208                    // punpcklwd     %xmm8,%xmm2
-  .byte  102,15,111,5,212,49,1,0             // movdqa        0x131d4(%rip),%xmm0        # 3b790 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
+  .byte  102,15,111,5,36,49,1,0              // movdqa        0x13124(%rip),%xmm0        # 3afd0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
   .byte  102,15,219,194                      // pand          %xmm2,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,214,49,1,0                  // mulps         0x131d6(%rip),%xmm0        # 3b7a0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
-  .byte  102,15,111,13,222,49,1,0            // movdqa        0x131de(%rip),%xmm1        # 3b7b0 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  .byte  15,89,5,38,49,1,0                   // mulps         0x13126(%rip),%xmm0        # 3afe0 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  .byte  102,15,111,13,46,49,1,0             // movdqa        0x1312e(%rip),%xmm1        # 3aff0 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
   .byte  102,15,219,202                      // pand          %xmm2,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
-  .byte  15,89,13,224,49,1,0                 // mulps         0x131e0(%rip),%xmm1        # 3b7c0 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
-  .byte  102,15,219,21,232,49,1,0            // pand          0x131e8(%rip),%xmm2        # 3b7d0 <_sk_srcover_bgra_8888_sse2_lowp+0xf04>
+  .byte  15,89,13,48,49,1,0                  // mulps         0x13130(%rip),%xmm1        # 3b000 <_sk_srcover_bgra_8888_sse2_lowp+0xf04>
+  .byte  102,15,219,21,56,49,1,0             // pand          0x13138(%rip),%xmm2        # 3b010 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
-  .byte  15,89,21,238,49,1,0                 // mulps         0x131ee(%rip),%xmm2        # 3b7e0 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
+  .byte  15,89,21,62,49,1,0                  // mulps         0x1313e(%rip),%xmm2        # 3b020 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,117,47,1,0                 // movaps        0x12f75(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,29,197,46,1,0                 // movaps        0x12ec5(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  255,224                             // jmpq          *%rax
 
 HIDDEN _sk_store_565_sse2
@@ -39510,25 +39184,23 @@
 FUNCTION(_sk_store_565_sse2)
 _sk_store_565_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  68,15,95,200                        // maxps         %xmm0,%xmm9
-  .byte  68,15,40,21,73,47,1,0               // movaps        0x12f49(%rip),%xmm10        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,21,159,46,1,0              // movaps        0x12e9f(%rip),%xmm10        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,93,202                        // minps         %xmm10,%xmm9
-  .byte  68,15,40,29,93,51,1,0               // movaps        0x1335d(%rip),%xmm11        # 3b990 <_sk_srcover_bgra_8888_sse2_lowp+0x10c4>
+  .byte  68,15,40,29,179,50,1,0              // movaps        0x132b3(%rip),%xmm11        # 3b1d0 <_sk_srcover_bgra_8888_sse2_lowp+0x10d4>
   .byte  69,15,89,203                        // mulps         %xmm11,%xmm9
   .byte  102,69,15,91,201                    // cvtps2dq      %xmm9,%xmm9
   .byte  102,65,15,114,241,11                // pslld         $0xb,%xmm9
   .byte  69,15,87,228                        // xorps         %xmm12,%xmm12
   .byte  68,15,95,225                        // maxps         %xmm1,%xmm12
   .byte  69,15,93,226                        // minps         %xmm10,%xmm12
-  .byte  68,15,89,37,74,51,1,0               // mulps         0x1334a(%rip),%xmm12        # 3b9a0 <_sk_srcover_bgra_8888_sse2_lowp+0x10d4>
+  .byte  68,15,89,37,160,50,1,0              // mulps         0x132a0(%rip),%xmm12        # 3b1e0 <_sk_srcover_bgra_8888_sse2_lowp+0x10e4>
   .byte  102,69,15,91,228                    // cvtps2dq      %xmm12,%xmm12
   .byte  102,65,15,114,244,5                 // pslld         $0x5,%xmm12
   .byte  68,15,95,194                        // maxps         %xmm2,%xmm8
@@ -39541,131 +39213,127 @@
   .byte  102,65,15,114,224,16                // psrad         $0x10,%xmm8
   .byte  102,68,15,107,192                   // packssdw      %xmm0,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           2869c <_sk_store_565_sse2+0x9f>
-  .byte  102,71,15,214,4,80                  // movq          %xmm8,(%r8,%r10,2)
+  .byte  117,10                              // jne           27f86 <_sk_store_565_sse2+0x99>
+  .byte  102,69,15,214,4,80                  // movq          %xmm8,(%r8,%rdx,2)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,68,15,97,192                    // punpcklwd     %xmm0,%xmm8
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,38                              // je            286d4 <_sk_store_565_sse2+0xd7>
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,18                              // je            286c6 <_sk_store_565_sse2+0xc9>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,222                             // jne           28698 <_sk_store_565_sse2+0x9b>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,34                              // je            27fb5 <_sk_store_565_sse2+0xc8>
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,16                              // je            27fa7 <_sk_store_565_sse2+0xba>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,231                             // jne           27f82 <_sk_store_565_sse2+0x95>
   .byte  102,65,15,197,192,4                 // pextrw        $0x4,%xmm8,%eax
-  .byte  102,67,137,68,80,4                  // mov           %ax,0x4(%r8,%r10,2)
+  .byte  102,65,137,68,80,4                  // mov           %ax,0x4(%r8,%rdx,2)
   .byte  242,69,15,112,192,232               // pshuflw       $0xe8,%xmm8,%xmm8
-  .byte  102,71,15,126,4,80                  // movd          %xmm8,(%r8,%r10,2)
-  .byte  235,196                             // jmp           28698 <_sk_store_565_sse2+0x9b>
+  .byte  102,69,15,126,4,80                  // movd          %xmm8,(%r8,%rdx,2)
+  .byte  235,205                             // jmp           27f82 <_sk_store_565_sse2+0x95>
   .byte  102,68,15,126,192                   // movd          %xmm8,%eax
-  .byte  102,67,137,4,80                     // mov           %ax,(%r8,%r10,2)
-  .byte  235,184                             // jmp           28698 <_sk_store_565_sse2+0x9b>
+  .byte  102,65,137,4,80                     // mov           %ax,(%r8,%rdx,2)
+  .byte  235,193                             // jmp           27f82 <_sk_store_565_sse2+0x95>
 
 HIDDEN _sk_load_4444_sse2
 .globl _sk_load_4444_sse2
 FUNCTION(_sk_load_4444_sse2)
 _sk_load_4444_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,98                              // jne           2875d <_sk_load_4444_sse2+0x7d>
-  .byte  243,67,15,126,28,80                 // movq          (%r8,%r10,2),%xmm3
+  .byte  117,98                              // jne           28038 <_sk_load_4444_sse2+0x77>
+  .byte  243,65,15,126,28,80                 // movq          (%r8,%rdx,2),%xmm3
   .byte  102,15,97,216                       // punpcklwd     %xmm0,%xmm3
-  .byte  102,15,111,5,163,50,1,0             // movdqa        0x132a3(%rip),%xmm0        # 3b9b0 <_sk_srcover_bgra_8888_sse2_lowp+0x10e4>
+  .byte  102,15,111,5,8,50,1,0               // movdqa        0x13208(%rip),%xmm0        # 3b1f0 <_sk_srcover_bgra_8888_sse2_lowp+0x10f4>
   .byte  102,15,219,195                      // pand          %xmm3,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,165,50,1,0                  // mulps         0x132a5(%rip),%xmm0        # 3b9c0 <_sk_srcover_bgra_8888_sse2_lowp+0x10f4>
-  .byte  102,15,111,13,173,50,1,0            // movdqa        0x132ad(%rip),%xmm1        # 3b9d0 <_sk_srcover_bgra_8888_sse2_lowp+0x1104>
+  .byte  15,89,5,10,50,1,0                   // mulps         0x1320a(%rip),%xmm0        # 3b200 <_sk_srcover_bgra_8888_sse2_lowp+0x1104>
+  .byte  102,15,111,13,18,50,1,0             // movdqa        0x13212(%rip),%xmm1        # 3b210 <_sk_srcover_bgra_8888_sse2_lowp+0x1114>
   .byte  102,15,219,203                      // pand          %xmm3,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
-  .byte  15,89,13,175,50,1,0                 // mulps         0x132af(%rip),%xmm1        # 3b9e0 <_sk_srcover_bgra_8888_sse2_lowp+0x1114>
-  .byte  102,15,111,21,183,50,1,0            // movdqa        0x132b7(%rip),%xmm2        # 3b9f0 <_sk_srcover_bgra_8888_sse2_lowp+0x1124>
+  .byte  15,89,13,20,50,1,0                  // mulps         0x13214(%rip),%xmm1        # 3b220 <_sk_srcover_bgra_8888_sse2_lowp+0x1124>
+  .byte  102,15,111,21,28,50,1,0             // movdqa        0x1321c(%rip),%xmm2        # 3b230 <_sk_srcover_bgra_8888_sse2_lowp+0x1134>
   .byte  102,15,219,211                      // pand          %xmm3,%xmm2
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
-  .byte  15,89,21,185,50,1,0                 // mulps         0x132b9(%rip),%xmm2        # 3ba00 <_sk_srcover_bgra_8888_sse2_lowp+0x1134>
-  .byte  102,15,219,29,193,50,1,0            // pand          0x132c1(%rip),%xmm3        # 3ba10 <_sk_srcover_bgra_8888_sse2_lowp+0x1144>
+  .byte  15,89,21,30,50,1,0                  // mulps         0x1321e(%rip),%xmm2        # 3b240 <_sk_srcover_bgra_8888_sse2_lowp+0x1144>
+  .byte  102,15,219,29,38,50,1,0             // pand          0x13226(%rip),%xmm3        # 3b250 <_sk_srcover_bgra_8888_sse2_lowp+0x1154>
   .byte  15,91,219                           // cvtdq2ps      %xmm3,%xmm3
-  .byte  15,89,29,199,50,1,0                 // mulps         0x132c7(%rip),%xmm3        # 3ba20 <_sk_srcover_bgra_8888_sse2_lowp+0x1154>
+  .byte  15,89,29,44,50,1,0                  // mulps         0x1322c(%rip),%xmm3        # 3b260 <_sk_srcover_bgra_8888_sse2_lowp+0x1164>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,51                              // je            2879d <_sk_load_4444_sse2+0xbd>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,47                              // je            2806f <_sk_load_4444_sse2+0xae>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            28789 <_sk_load_4444_sse2+0xa9>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,139                             // jne           28705 <_sk_load_4444_sse2+0x25>
-  .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,19                              // je            2805b <_sk_load_4444_sse2+0x9a>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,148                             // jne           27fe0 <_sk_load_4444_sse2+0x1f>
+  .byte  65,15,183,68,80,4                   // movzwl        0x4(%r8,%rdx,2),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,15,112,216,69                   // pshufd        $0x45,%xmm0,%xmm3
-  .byte  102,67,15,110,4,80                  // movd          (%r8,%r10,2),%xmm0
+  .byte  102,65,15,110,4,80                  // movd          (%r8,%rdx,2),%xmm0
   .byte  242,15,112,192,212                  // pshuflw       $0xd4,%xmm0,%xmm0
   .byte  242,15,16,216                       // movsd         %xmm0,%xmm3
-  .byte  233,104,255,255,255                 // jmpq          28705 <_sk_load_4444_sse2+0x25>
-  .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
+  .byte  233,113,255,255,255                 // jmpq          27fe0 <_sk_load_4444_sse2+0x1f>
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,15,110,216                      // movd          %eax,%xmm3
-  .byte  233,90,255,255,255                  // jmpq          28705 <_sk_load_4444_sse2+0x25>
+  .byte  233,99,255,255,255                  // jmpq          27fe0 <_sk_load_4444_sse2+0x1f>
 
 HIDDEN _sk_load_4444_dst_sse2
 .globl _sk_load_4444_dst_sse2
 FUNCTION(_sk_load_4444_dst_sse2)
 _sk_load_4444_dst_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,98                              // jne           28828 <_sk_load_4444_dst_sse2+0x7d>
-  .byte  243,67,15,126,60,80                 // movq          (%r8,%r10,2),%xmm7
+  .byte  117,98                              // jne           280f4 <_sk_load_4444_dst_sse2+0x77>
+  .byte  243,65,15,126,60,80                 // movq          (%r8,%rdx,2),%xmm7
   .byte  102,15,97,248                       // punpcklwd     %xmm0,%xmm7
-  .byte  102,15,111,37,216,49,1,0            // movdqa        0x131d8(%rip),%xmm4        # 3b9b0 <_sk_srcover_bgra_8888_sse2_lowp+0x10e4>
+  .byte  102,15,111,37,76,49,1,0             // movdqa        0x1314c(%rip),%xmm4        # 3b1f0 <_sk_srcover_bgra_8888_sse2_lowp+0x10f4>
   .byte  102,15,219,231                      // pand          %xmm7,%xmm4
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
-  .byte  15,89,37,218,49,1,0                 // mulps         0x131da(%rip),%xmm4        # 3b9c0 <_sk_srcover_bgra_8888_sse2_lowp+0x10f4>
-  .byte  102,15,111,45,226,49,1,0            // movdqa        0x131e2(%rip),%xmm5        # 3b9d0 <_sk_srcover_bgra_8888_sse2_lowp+0x1104>
+  .byte  15,89,37,78,49,1,0                  // mulps         0x1314e(%rip),%xmm4        # 3b200 <_sk_srcover_bgra_8888_sse2_lowp+0x1104>
+  .byte  102,15,111,45,86,49,1,0             // movdqa        0x13156(%rip),%xmm5        # 3b210 <_sk_srcover_bgra_8888_sse2_lowp+0x1114>
   .byte  102,15,219,239                      // pand          %xmm7,%xmm5
   .byte  15,91,237                           // cvtdq2ps      %xmm5,%xmm5
-  .byte  15,89,45,228,49,1,0                 // mulps         0x131e4(%rip),%xmm5        # 3b9e0 <_sk_srcover_bgra_8888_sse2_lowp+0x1114>
-  .byte  102,15,111,53,236,49,1,0            // movdqa        0x131ec(%rip),%xmm6        # 3b9f0 <_sk_srcover_bgra_8888_sse2_lowp+0x1124>
+  .byte  15,89,45,88,49,1,0                  // mulps         0x13158(%rip),%xmm5        # 3b220 <_sk_srcover_bgra_8888_sse2_lowp+0x1124>
+  .byte  102,15,111,53,96,49,1,0             // movdqa        0x13160(%rip),%xmm6        # 3b230 <_sk_srcover_bgra_8888_sse2_lowp+0x1134>
   .byte  102,15,219,247                      // pand          %xmm7,%xmm6
   .byte  15,91,246                           // cvtdq2ps      %xmm6,%xmm6
-  .byte  15,89,53,238,49,1,0                 // mulps         0x131ee(%rip),%xmm6        # 3ba00 <_sk_srcover_bgra_8888_sse2_lowp+0x1134>
-  .byte  102,15,219,61,246,49,1,0            // pand          0x131f6(%rip),%xmm7        # 3ba10 <_sk_srcover_bgra_8888_sse2_lowp+0x1144>
+  .byte  15,89,53,98,49,1,0                  // mulps         0x13162(%rip),%xmm6        # 3b240 <_sk_srcover_bgra_8888_sse2_lowp+0x1144>
+  .byte  102,15,219,61,106,49,1,0            // pand          0x1316a(%rip),%xmm7        # 3b250 <_sk_srcover_bgra_8888_sse2_lowp+0x1154>
   .byte  15,91,255                           // cvtdq2ps      %xmm7,%xmm7
-  .byte  15,89,61,252,49,1,0                 // mulps         0x131fc(%rip),%xmm7        # 3ba20 <_sk_srcover_bgra_8888_sse2_lowp+0x1154>
+  .byte  15,89,61,112,49,1,0                 // mulps         0x13170(%rip),%xmm7        # 3b260 <_sk_srcover_bgra_8888_sse2_lowp+0x1164>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,51                              // je            28868 <_sk_load_4444_dst_sse2+0xbd>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,47                              // je            2812b <_sk_load_4444_dst_sse2+0xae>
   .byte  102,15,239,255                      // pxor          %xmm7,%xmm7
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            28854 <_sk_load_4444_dst_sse2+0xa9>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,139                             // jne           287d0 <_sk_load_4444_dst_sse2+0x25>
-  .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,19                              // je            28117 <_sk_load_4444_dst_sse2+0x9a>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,148                             // jne           2809c <_sk_load_4444_dst_sse2+0x1f>
+  .byte  65,15,183,68,80,4                   // movzwl        0x4(%r8,%rdx,2),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
   .byte  102,15,112,252,69                   // pshufd        $0x45,%xmm4,%xmm7
-  .byte  102,67,15,110,36,80                 // movd          (%r8,%r10,2),%xmm4
+  .byte  102,65,15,110,36,80                 // movd          (%r8,%rdx,2),%xmm4
   .byte  242,15,112,228,212                  // pshuflw       $0xd4,%xmm4,%xmm4
   .byte  242,15,16,252                       // movsd         %xmm4,%xmm7
-  .byte  233,104,255,255,255                 // jmpq          287d0 <_sk_load_4444_dst_sse2+0x25>
-  .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
+  .byte  233,113,255,255,255                 // jmpq          2809c <_sk_load_4444_dst_sse2+0x1f>
+  .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,15,110,248                      // movd          %eax,%xmm7
-  .byte  233,90,255,255,255                  // jmpq          287d0 <_sk_load_4444_dst_sse2+0x25>
+  .byte  233,99,255,255,255                  // jmpq          2809c <_sk_load_4444_dst_sse2+0x1f>
 
 HIDDEN _sk_gather_4444_sse2
 .globl _sk_gather_4444_sse2
@@ -39714,21 +39382,21 @@
   .byte  65,15,183,4,64                      // movzwl        (%r8,%rax,2),%eax
   .byte  102,15,196,216,3                    // pinsrw        $0x3,%eax,%xmm3
   .byte  102,65,15,97,216                    // punpcklwd     %xmm8,%xmm3
-  .byte  102,15,111,5,120,48,1,0             // movdqa        0x13078(%rip),%xmm0        # 3b9b0 <_sk_srcover_bgra_8888_sse2_lowp+0x10e4>
+  .byte  102,15,111,5,245,47,1,0             // movdqa        0x12ff5(%rip),%xmm0        # 3b1f0 <_sk_srcover_bgra_8888_sse2_lowp+0x10f4>
   .byte  102,15,219,195                      // pand          %xmm3,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,122,48,1,0                  // mulps         0x1307a(%rip),%xmm0        # 3b9c0 <_sk_srcover_bgra_8888_sse2_lowp+0x10f4>
-  .byte  102,15,111,13,130,48,1,0            // movdqa        0x13082(%rip),%xmm1        # 3b9d0 <_sk_srcover_bgra_8888_sse2_lowp+0x1104>
+  .byte  15,89,5,247,47,1,0                  // mulps         0x12ff7(%rip),%xmm0        # 3b200 <_sk_srcover_bgra_8888_sse2_lowp+0x1104>
+  .byte  102,15,111,13,255,47,1,0            // movdqa        0x12fff(%rip),%xmm1        # 3b210 <_sk_srcover_bgra_8888_sse2_lowp+0x1114>
   .byte  102,15,219,203                      // pand          %xmm3,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
-  .byte  15,89,13,132,48,1,0                 // mulps         0x13084(%rip),%xmm1        # 3b9e0 <_sk_srcover_bgra_8888_sse2_lowp+0x1114>
-  .byte  102,15,111,21,140,48,1,0            // movdqa        0x1308c(%rip),%xmm2        # 3b9f0 <_sk_srcover_bgra_8888_sse2_lowp+0x1124>
+  .byte  15,89,13,1,48,1,0                   // mulps         0x13001(%rip),%xmm1        # 3b220 <_sk_srcover_bgra_8888_sse2_lowp+0x1124>
+  .byte  102,15,111,21,9,48,1,0              // movdqa        0x13009(%rip),%xmm2        # 3b230 <_sk_srcover_bgra_8888_sse2_lowp+0x1134>
   .byte  102,15,219,211                      // pand          %xmm3,%xmm2
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
-  .byte  15,89,21,142,48,1,0                 // mulps         0x1308e(%rip),%xmm2        # 3ba00 <_sk_srcover_bgra_8888_sse2_lowp+0x1134>
-  .byte  102,15,219,29,150,48,1,0            // pand          0x13096(%rip),%xmm3        # 3ba10 <_sk_srcover_bgra_8888_sse2_lowp+0x1144>
+  .byte  15,89,21,11,48,1,0                  // mulps         0x1300b(%rip),%xmm2        # 3b240 <_sk_srcover_bgra_8888_sse2_lowp+0x1144>
+  .byte  102,15,219,29,19,48,1,0             // pand          0x13013(%rip),%xmm3        # 3b250 <_sk_srcover_bgra_8888_sse2_lowp+0x1154>
   .byte  15,91,219                           // cvtdq2ps      %xmm3,%xmm3
-  .byte  15,89,29,156,48,1,0                 // mulps         0x1309c(%rip),%xmm3        # 3ba20 <_sk_srcover_bgra_8888_sse2_lowp+0x1154>
+  .byte  15,89,29,25,48,1,0                  // mulps         0x13019(%rip),%xmm3        # 3b260 <_sk_srcover_bgra_8888_sse2_lowp+0x1164>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -39737,18 +39405,16 @@
 FUNCTION(_sk_store_4444_sse2)
 _sk_store_4444_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  76,99,210                           // movslq        %edx,%r10
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  68,15,95,200                        // maxps         %xmm0,%xmm9
-  .byte  68,15,40,21,190,43,1,0              // movaps        0x12bbe(%rip),%xmm10        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,21,65,43,1,0               // movaps        0x12b41(%rip),%xmm10        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,93,202                        // minps         %xmm10,%xmm9
-  .byte  68,15,40,29,114,48,1,0              // movaps        0x13072(%rip),%xmm11        # 3ba30 <_sk_srcover_bgra_8888_sse2_lowp+0x1164>
+  .byte  68,15,40,29,245,47,1,0              // movaps        0x12ff5(%rip),%xmm11        # 3b270 <_sk_srcover_bgra_8888_sse2_lowp+0x1174>
   .byte  69,15,89,203                        // mulps         %xmm11,%xmm9
   .byte  102,69,15,91,201                    // cvtps2dq      %xmm9,%xmm9
   .byte  102,65,15,114,241,12                // pslld         $0xc,%xmm9
@@ -39775,47 +39441,45 @@
   .byte  102,65,15,114,224,16                // psrad         $0x10,%xmm8
   .byte  102,68,15,107,192                   // packssdw      %xmm0,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           28a44 <_sk_store_4444_sse2+0xbc>
-  .byte  102,71,15,214,4,80                  // movq          %xmm8,(%r8,%r10,2)
+  .byte  117,10                              // jne           28301 <_sk_store_4444_sse2+0xb6>
+  .byte  102,69,15,214,4,80                  // movq          %xmm8,(%r8,%rdx,2)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,68,15,97,192                    // punpcklwd     %xmm0,%xmm8
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,38                              // je            28a7c <_sk_store_4444_sse2+0xf4>
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,18                              // je            28a6e <_sk_store_4444_sse2+0xe6>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,222                             // jne           28a40 <_sk_store_4444_sse2+0xb8>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,34                              // je            28330 <_sk_store_4444_sse2+0xe5>
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,16                              // je            28322 <_sk_store_4444_sse2+0xd7>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,231                             // jne           282fd <_sk_store_4444_sse2+0xb2>
   .byte  102,65,15,197,192,4                 // pextrw        $0x4,%xmm8,%eax
-  .byte  102,67,137,68,80,4                  // mov           %ax,0x4(%r8,%r10,2)
+  .byte  102,65,137,68,80,4                  // mov           %ax,0x4(%r8,%rdx,2)
   .byte  242,69,15,112,192,232               // pshuflw       $0xe8,%xmm8,%xmm8
-  .byte  102,71,15,126,4,80                  // movd          %xmm8,(%r8,%r10,2)
-  .byte  235,196                             // jmp           28a40 <_sk_store_4444_sse2+0xb8>
+  .byte  102,69,15,126,4,80                  // movd          %xmm8,(%r8,%rdx,2)
+  .byte  235,205                             // jmp           282fd <_sk_store_4444_sse2+0xb2>
   .byte  102,68,15,126,192                   // movd          %xmm8,%eax
-  .byte  102,67,137,4,80                     // mov           %ax,(%r8,%r10,2)
-  .byte  235,184                             // jmp           28a40 <_sk_store_4444_sse2+0xb8>
+  .byte  102,65,137,4,80                     // mov           %ax,(%r8,%rdx,2)
+  .byte  235,193                             // jmp           282fd <_sk_store_4444_sse2+0xb2>
 
 HIDDEN _sk_load_8888_sse2
 .globl _sk_load_8888_sse2
 FUNCTION(_sk_load_8888_sse2)
 _sk_load_8888_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,98                              // jne           28b06 <_sk_load_8888_sse2+0x7e>
-  .byte  243,69,15,111,12,128                // movdqu        (%r8,%rax,4),%xmm9
-  .byte  102,15,111,21,110,43,1,0            // movdqa        0x12b6e(%rip),%xmm2        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  117,98                              // jne           283b4 <_sk_load_8888_sse2+0x78>
+  .byte  243,69,15,111,12,144                // movdqu        (%r8,%rdx,4),%xmm9
+  .byte  102,15,111,21,0,43,1,0              // movdqa        0x12b00(%rip),%xmm2        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  102,65,15,111,193                   // movdqa        %xmm9,%xmm0
   .byte  102,15,219,194                      // pand          %xmm2,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  68,15,40,5,186,44,1,0               // movaps        0x12cba(%rip),%xmm8        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  68,15,40,5,76,44,1,0                // movaps        0x12c4c(%rip),%xmm8        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  102,65,15,111,201                   // movdqa        %xmm9,%xmm1
   .byte  102,15,114,209,8                    // psrld         $0x8,%xmm1
@@ -39832,41 +39496,39 @@
   .byte  65,15,89,216                        // mulps         %xmm8,%xmm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,41                              // je            28b3c <_sk_load_8888_sse2+0xb4>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,37                              // je            283e1 <_sk_load_8888_sse2+0xa5>
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,19                              // je            28b31 <_sk_load_8888_sse2+0xa9>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,134                             // jne           28aaa <_sk_load_8888_sse2+0x22>
-  .byte  102,65,15,110,68,128,8              // movd          0x8(%r8,%rax,4),%xmm0
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,17                              // je            283d6 <_sk_load_8888_sse2+0x9a>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,143                             // jne           28358 <_sk_load_8888_sse2+0x1c>
+  .byte  102,65,15,110,68,144,8              // movd          0x8(%r8,%rdx,4),%xmm0
   .byte  102,68,15,112,200,69                // pshufd        $0x45,%xmm0,%xmm9
-  .byte  102,69,15,18,12,128                 // movlpd        (%r8,%rax,4),%xmm9
-  .byte  233,110,255,255,255                 // jmpq          28aaa <_sk_load_8888_sse2+0x22>
-  .byte  102,69,15,110,12,128                // movd          (%r8,%rax,4),%xmm9
-  .byte  233,99,255,255,255                  // jmpq          28aaa <_sk_load_8888_sse2+0x22>
+  .byte  102,69,15,18,12,144                 // movlpd        (%r8,%rdx,4),%xmm9
+  .byte  233,119,255,255,255                 // jmpq          28358 <_sk_load_8888_sse2+0x1c>
+  .byte  102,69,15,110,12,144                // movd          (%r8,%rdx,4),%xmm9
+  .byte  233,108,255,255,255                 // jmpq          28358 <_sk_load_8888_sse2+0x1c>
 
 HIDDEN _sk_load_8888_dst_sse2
 .globl _sk_load_8888_dst_sse2
 FUNCTION(_sk_load_8888_dst_sse2)
 _sk_load_8888_dst_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,98                              // jne           28bc5 <_sk_load_8888_dst_sse2+0x7e>
-  .byte  243,69,15,111,12,128                // movdqu        (%r8,%rax,4),%xmm9
-  .byte  102,15,111,53,175,42,1,0            // movdqa        0x12aaf(%rip),%xmm6        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  117,98                              // jne           28464 <_sk_load_8888_dst_sse2+0x78>
+  .byte  243,69,15,111,12,144                // movdqu        (%r8,%rdx,4),%xmm9
+  .byte  102,15,111,53,80,42,1,0             // movdqa        0x12a50(%rip),%xmm6        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  102,65,15,111,225                   // movdqa        %xmm9,%xmm4
   .byte  102,15,219,230                      // pand          %xmm6,%xmm4
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
-  .byte  68,15,40,5,251,43,1,0               // movaps        0x12bfb(%rip),%xmm8        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  68,15,40,5,156,43,1,0               // movaps        0x12b9c(%rip),%xmm8        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  65,15,89,224                        // mulps         %xmm8,%xmm4
   .byte  102,65,15,111,233                   // movdqa        %xmm9,%xmm5
   .byte  102,15,114,213,8                    // psrld         $0x8,%xmm5
@@ -39883,21 +39545,21 @@
   .byte  65,15,89,248                        // mulps         %xmm8,%xmm7
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,41                              // je            28bfb <_sk_load_8888_dst_sse2+0xb4>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,37                              // je            28491 <_sk_load_8888_dst_sse2+0xa5>
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,19                              // je            28bf0 <_sk_load_8888_dst_sse2+0xa9>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,134                             // jne           28b69 <_sk_load_8888_dst_sse2+0x22>
-  .byte  102,65,15,110,100,128,8             // movd          0x8(%r8,%rax,4),%xmm4
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,17                              // je            28486 <_sk_load_8888_dst_sse2+0x9a>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,143                             // jne           28408 <_sk_load_8888_dst_sse2+0x1c>
+  .byte  102,65,15,110,100,144,8             // movd          0x8(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,204,69                // pshufd        $0x45,%xmm4,%xmm9
-  .byte  102,69,15,18,12,128                 // movlpd        (%r8,%rax,4),%xmm9
-  .byte  233,110,255,255,255                 // jmpq          28b69 <_sk_load_8888_dst_sse2+0x22>
-  .byte  102,69,15,110,12,128                // movd          (%r8,%rax,4),%xmm9
-  .byte  233,99,255,255,255                  // jmpq          28b69 <_sk_load_8888_dst_sse2+0x22>
+  .byte  102,69,15,18,12,144                 // movlpd        (%r8,%rdx,4),%xmm9
+  .byte  233,119,255,255,255                 // jmpq          28408 <_sk_load_8888_dst_sse2+0x1c>
+  .byte  102,69,15,110,12,144                // movd          (%r8,%rdx,4),%xmm9
+  .byte  233,108,255,255,255                 // jmpq          28408 <_sk_load_8888_dst_sse2+0x1c>
 
 HIDDEN _sk_gather_8888_sse2
 .globl _sk_gather_8888_sse2
@@ -39943,11 +39605,11 @@
   .byte  102,67,15,110,12,136                // movd          (%r8,%r9,4),%xmm1
   .byte  102,15,98,200                       // punpckldq     %xmm0,%xmm1
   .byte  102,68,15,108,201                   // punpcklqdq    %xmm1,%xmm9
-  .byte  102,15,111,21,98,41,1,0             // movdqa        0x12962(%rip),%xmm2        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  102,15,111,21,12,41,1,0             // movdqa        0x1290c(%rip),%xmm2        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  102,65,15,111,193                   // movdqa        %xmm9,%xmm0
   .byte  102,15,219,194                      // pand          %xmm2,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  68,15,40,5,174,42,1,0               // movaps        0x12aae(%rip),%xmm8        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  68,15,40,5,88,42,1,0                // movaps        0x12a58(%rip),%xmm8        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  102,65,15,111,201                   // movdqa        %xmm9,%xmm1
   .byte  102,15,114,209,8                    // psrld         $0x8,%xmm1
@@ -39970,18 +39632,16 @@
 FUNCTION(_sk_store_8888_sse2)
 _sk_store_8888_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  68,15,95,200                        // maxps         %xmm0,%xmm9
-  .byte  68,15,40,21,51,40,1,0               // movaps        0x12833(%rip),%xmm10        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,21,227,39,1,0              // movaps        0x127e3(%rip),%xmm10        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,93,202                        // minps         %xmm10,%xmm9
-  .byte  68,15,40,29,7,41,1,0                // movaps        0x12907(%rip),%xmm11        # 3b650 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  .byte  68,15,40,29,183,40,1,0              // movaps        0x128b7(%rip),%xmm11        # 3ae90 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
   .byte  69,15,89,203                        // mulps         %xmm11,%xmm9
   .byte  102,69,15,91,201                    // cvtps2dq      %xmm9,%xmm9
   .byte  69,15,87,228                        // xorps         %xmm12,%xmm12
@@ -40005,44 +39665,42 @@
   .byte  102,69,15,235,193                   // por           %xmm9,%xmm8
   .byte  102,69,15,235,196                   // por           %xmm12,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           28dbe <_sk_store_8888_sse2+0xac>
-  .byte  243,69,15,127,4,128                 // movdqu        %xmm8,(%r8,%rax,4)
+  .byte  117,10                              // jne           2864e <_sk_store_8888_sse2+0xa6>
+  .byte  243,69,15,127,4,144                 // movdqu        %xmm8,(%r8,%rdx,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,33                              // je            28dec <_sk_store_8888_sse2+0xda>
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,19                              // je            28de4 <_sk_store_8888_sse2+0xd2>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,227                             // jne           28dba <_sk_store_8888_sse2+0xa8>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,29                              // je            28673 <_sk_store_8888_sse2+0xcb>
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,17                              // je            2866b <_sk_store_8888_sse2+0xc3>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,236                             // jne           2864a <_sk_store_8888_sse2+0xa2>
   .byte  102,69,15,112,200,78                // pshufd        $0x4e,%xmm8,%xmm9
-  .byte  102,69,15,126,76,128,8              // movd          %xmm9,0x8(%r8,%rax,4)
-  .byte  102,69,15,214,4,128                 // movq          %xmm8,(%r8,%rax,4)
-  .byte  235,206                             // jmp           28dba <_sk_store_8888_sse2+0xa8>
-  .byte  102,69,15,126,4,128                 // movd          %xmm8,(%r8,%rax,4)
-  .byte  235,198                             // jmp           28dba <_sk_store_8888_sse2+0xa8>
+  .byte  102,69,15,126,76,144,8              // movd          %xmm9,0x8(%r8,%rdx,4)
+  .byte  102,69,15,214,4,144                 // movq          %xmm8,(%r8,%rdx,4)
+  .byte  235,215                             // jmp           2864a <_sk_store_8888_sse2+0xa2>
+  .byte  102,69,15,126,4,144                 // movd          %xmm8,(%r8,%rdx,4)
+  .byte  235,207                             // jmp           2864a <_sk_store_8888_sse2+0xa2>
 
 HIDDEN _sk_load_bgra_sse2
 .globl _sk_load_bgra_sse2
 FUNCTION(_sk_load_bgra_sse2)
 _sk_load_bgra_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,98                              // jne           28e72 <_sk_load_bgra_sse2+0x7e>
-  .byte  243,69,15,111,12,128                // movdqu        (%r8,%rax,4),%xmm9
-  .byte  102,15,111,5,2,40,1,0               // movdqa        0x12802(%rip),%xmm0        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  117,98                              // jne           286f3 <_sk_load_bgra_sse2+0x78>
+  .byte  243,69,15,111,12,144                // movdqu        (%r8,%rdx,4),%xmm9
+  .byte  102,15,111,5,193,39,1,0             // movdqa        0x127c1(%rip),%xmm0        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  102,65,15,111,201                   // movdqa        %xmm9,%xmm1
   .byte  102,15,219,200                      // pand          %xmm0,%xmm1
   .byte  15,91,209                           // cvtdq2ps      %xmm1,%xmm2
-  .byte  68,15,40,5,78,41,1,0                // movaps        0x1294e(%rip),%xmm8        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  68,15,40,5,13,41,1,0                // movaps        0x1290d(%rip),%xmm8        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  65,15,89,208                        // mulps         %xmm8,%xmm2
   .byte  102,65,15,111,201                   // movdqa        %xmm9,%xmm1
   .byte  102,15,114,209,8                    // psrld         $0x8,%xmm1
@@ -40059,41 +39717,39 @@
   .byte  65,15,89,216                        // mulps         %xmm8,%xmm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,41                              // je            28ea8 <_sk_load_bgra_sse2+0xb4>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,37                              // je            28720 <_sk_load_bgra_sse2+0xa5>
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,19                              // je            28e9d <_sk_load_bgra_sse2+0xa9>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,134                             // jne           28e16 <_sk_load_bgra_sse2+0x22>
-  .byte  102,65,15,110,68,128,8              // movd          0x8(%r8,%rax,4),%xmm0
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,17                              // je            28715 <_sk_load_bgra_sse2+0x9a>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,143                             // jne           28697 <_sk_load_bgra_sse2+0x1c>
+  .byte  102,65,15,110,68,144,8              // movd          0x8(%r8,%rdx,4),%xmm0
   .byte  102,68,15,112,200,69                // pshufd        $0x45,%xmm0,%xmm9
-  .byte  102,69,15,18,12,128                 // movlpd        (%r8,%rax,4),%xmm9
-  .byte  233,110,255,255,255                 // jmpq          28e16 <_sk_load_bgra_sse2+0x22>
-  .byte  102,69,15,110,12,128                // movd          (%r8,%rax,4),%xmm9
-  .byte  233,99,255,255,255                  // jmpq          28e16 <_sk_load_bgra_sse2+0x22>
+  .byte  102,69,15,18,12,144                 // movlpd        (%r8,%rdx,4),%xmm9
+  .byte  233,119,255,255,255                 // jmpq          28697 <_sk_load_bgra_sse2+0x1c>
+  .byte  102,69,15,110,12,144                // movd          (%r8,%rdx,4),%xmm9
+  .byte  233,108,255,255,255                 // jmpq          28697 <_sk_load_bgra_sse2+0x1c>
 
 HIDDEN _sk_load_bgra_dst_sse2
 .globl _sk_load_bgra_dst_sse2
 FUNCTION(_sk_load_bgra_dst_sse2)
 _sk_load_bgra_dst_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,98                              // jne           28f31 <_sk_load_bgra_dst_sse2+0x7e>
-  .byte  243,69,15,111,12,128                // movdqu        (%r8,%rax,4),%xmm9
-  .byte  102,15,111,37,67,39,1,0             // movdqa        0x12743(%rip),%xmm4        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  117,98                              // jne           287a3 <_sk_load_bgra_dst_sse2+0x78>
+  .byte  243,69,15,111,12,144                // movdqu        (%r8,%rdx,4),%xmm9
+  .byte  102,15,111,37,17,39,1,0             // movdqa        0x12711(%rip),%xmm4        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  102,65,15,111,233                   // movdqa        %xmm9,%xmm5
   .byte  102,15,219,236                      // pand          %xmm4,%xmm5
   .byte  15,91,245                           // cvtdq2ps      %xmm5,%xmm6
-  .byte  68,15,40,5,143,40,1,0               // movaps        0x1288f(%rip),%xmm8        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  68,15,40,5,93,40,1,0                // movaps        0x1285d(%rip),%xmm8        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  65,15,89,240                        // mulps         %xmm8,%xmm6
   .byte  102,65,15,111,233                   // movdqa        %xmm9,%xmm5
   .byte  102,15,114,213,8                    // psrld         $0x8,%xmm5
@@ -40110,21 +39766,21 @@
   .byte  65,15,89,248                        // mulps         %xmm8,%xmm7
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,41                              // je            28f67 <_sk_load_bgra_dst_sse2+0xb4>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,37                              // je            287d0 <_sk_load_bgra_dst_sse2+0xa5>
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,19                              // je            28f5c <_sk_load_bgra_dst_sse2+0xa9>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,134                             // jne           28ed5 <_sk_load_bgra_dst_sse2+0x22>
-  .byte  102,65,15,110,100,128,8             // movd          0x8(%r8,%rax,4),%xmm4
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,17                              // je            287c5 <_sk_load_bgra_dst_sse2+0x9a>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,143                             // jne           28747 <_sk_load_bgra_dst_sse2+0x1c>
+  .byte  102,65,15,110,100,144,8             // movd          0x8(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,204,69                // pshufd        $0x45,%xmm4,%xmm9
-  .byte  102,69,15,18,12,128                 // movlpd        (%r8,%rax,4),%xmm9
-  .byte  233,110,255,255,255                 // jmpq          28ed5 <_sk_load_bgra_dst_sse2+0x22>
-  .byte  102,69,15,110,12,128                // movd          (%r8,%rax,4),%xmm9
-  .byte  233,99,255,255,255                  // jmpq          28ed5 <_sk_load_bgra_dst_sse2+0x22>
+  .byte  102,69,15,18,12,144                 // movlpd        (%r8,%rdx,4),%xmm9
+  .byte  233,119,255,255,255                 // jmpq          28747 <_sk_load_bgra_dst_sse2+0x1c>
+  .byte  102,69,15,110,12,144                // movd          (%r8,%rdx,4),%xmm9
+  .byte  233,108,255,255,255                 // jmpq          28747 <_sk_load_bgra_dst_sse2+0x1c>
 
 HIDDEN _sk_gather_bgra_sse2
 .globl _sk_gather_bgra_sse2
@@ -40170,11 +39826,11 @@
   .byte  102,67,15,110,12,136                // movd          (%r8,%r9,4),%xmm1
   .byte  102,15,98,200                       // punpckldq     %xmm0,%xmm1
   .byte  102,68,15,108,201                   // punpcklqdq    %xmm1,%xmm9
-  .byte  102,15,111,5,246,37,1,0             // movdqa        0x125f6(%rip),%xmm0        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  .byte  102,15,111,5,205,37,1,0             // movdqa        0x125cd(%rip),%xmm0        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
   .byte  102,65,15,111,201                   // movdqa        %xmm9,%xmm1
   .byte  102,15,219,200                      // pand          %xmm0,%xmm1
   .byte  15,91,209                           // cvtdq2ps      %xmm1,%xmm2
-  .byte  68,15,40,5,66,39,1,0                // movaps        0x12742(%rip),%xmm8        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  68,15,40,5,25,39,1,0                // movaps        0x12719(%rip),%xmm8        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  65,15,89,208                        // mulps         %xmm8,%xmm2
   .byte  102,65,15,111,201                   // movdqa        %xmm9,%xmm1
   .byte  102,15,114,209,8                    // psrld         $0x8,%xmm1
@@ -40197,18 +39853,16 @@
 FUNCTION(_sk_store_bgra_sse2)
 _sk_store_bgra_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  68,15,95,202                        // maxps         %xmm2,%xmm9
-  .byte  68,15,40,21,199,36,1,0              // movaps        0x124c7(%rip),%xmm10        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,21,164,36,1,0              // movaps        0x124a4(%rip),%xmm10        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,93,202                        // minps         %xmm10,%xmm9
-  .byte  68,15,40,29,155,37,1,0              // movaps        0x1259b(%rip),%xmm11        # 3b650 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  .byte  68,15,40,29,120,37,1,0              // movaps        0x12578(%rip),%xmm11        # 3ae90 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
   .byte  69,15,89,203                        // mulps         %xmm11,%xmm9
   .byte  102,69,15,91,201                    // cvtps2dq      %xmm9,%xmm9
   .byte  69,15,87,228                        // xorps         %xmm12,%xmm12
@@ -40232,40 +39886,38 @@
   .byte  102,69,15,235,193                   // por           %xmm9,%xmm8
   .byte  102,69,15,235,196                   // por           %xmm12,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           2912a <_sk_store_bgra_sse2+0xac>
-  .byte  243,69,15,127,4,128                 // movdqu        %xmm8,(%r8,%rax,4)
+  .byte  117,10                              // jne           2898d <_sk_store_bgra_sse2+0xa6>
+  .byte  243,69,15,127,4,144                 // movdqu        %xmm8,(%r8,%rdx,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  65,137,249                          // mov           %edi,%r9d
-  .byte  65,128,225,3                        // and           $0x3,%r9b
-  .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,33                              // je            29158 <_sk_store_bgra_sse2+0xda>
-  .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,19                              // je            29150 <_sk_store_bgra_sse2+0xd2>
-  .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,227                             // jne           29126 <_sk_store_bgra_sse2+0xa8>
+  .byte  137,248                             // mov           %edi,%eax
+  .byte  36,3                                // and           $0x3,%al
+  .byte  60,1                                // cmp           $0x1,%al
+  .byte  116,29                              // je            289b2 <_sk_store_bgra_sse2+0xcb>
+  .byte  60,2                                // cmp           $0x2,%al
+  .byte  116,17                              // je            289aa <_sk_store_bgra_sse2+0xc3>
+  .byte  60,3                                // cmp           $0x3,%al
+  .byte  117,236                             // jne           28989 <_sk_store_bgra_sse2+0xa2>
   .byte  102,69,15,112,200,78                // pshufd        $0x4e,%xmm8,%xmm9
-  .byte  102,69,15,126,76,128,8              // movd          %xmm9,0x8(%r8,%rax,4)
-  .byte  102,69,15,214,4,128                 // movq          %xmm8,(%r8,%rax,4)
-  .byte  235,206                             // jmp           29126 <_sk_store_bgra_sse2+0xa8>
-  .byte  102,69,15,126,4,128                 // movd          %xmm8,(%r8,%rax,4)
-  .byte  235,198                             // jmp           29126 <_sk_store_bgra_sse2+0xa8>
+  .byte  102,69,15,126,76,144,8              // movd          %xmm9,0x8(%r8,%rdx,4)
+  .byte  102,69,15,214,4,144                 // movq          %xmm8,(%r8,%rdx,4)
+  .byte  235,215                             // jmp           28989 <_sk_store_bgra_sse2+0xa2>
+  .byte  102,69,15,126,4,144                 // movd          %xmm8,(%r8,%rdx,4)
+  .byte  235,207                             // jmp           28989 <_sk_store_bgra_sse2+0xa2>
 
 HIDDEN _sk_load_f16_sse2
 .globl _sk_load_f16_sse2
 FUNCTION(_sk_load_f16_sse2)
 _sk_load_f16_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,3                        // shl           $0x3,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,47,1,0,0                     // jne           292af <_sk_load_f16_sse2+0x14f>
-  .byte  102,65,15,16,4,192                  // movupd        (%r8,%rax,8),%xmm0
-  .byte  243,65,15,111,76,192,16             // movdqu        0x10(%r8,%rax,8),%xmm1
+  .byte  15,133,47,1,0,0                     // jne           28b03 <_sk_load_f16_sse2+0x149>
+  .byte  102,65,15,16,4,208                  // movupd        (%r8,%rdx,8),%xmm0
+  .byte  243,65,15,111,76,208,16             // movdqu        0x10(%r8,%rdx,8),%xmm1
   .byte  102,68,15,40,192                    // movapd        %xmm0,%xmm8
   .byte  102,68,15,97,193                    // punpcklwd     %xmm1,%xmm8
   .byte  102,15,105,193                      // punpckhwd     %xmm1,%xmm0
@@ -40275,18 +39927,18 @@
   .byte  102,69,15,239,210                   // pxor          %xmm10,%xmm10
   .byte  102,15,111,202                      // movdqa        %xmm2,%xmm1
   .byte  102,65,15,97,202                    // punpcklwd     %xmm10,%xmm1
-  .byte  102,68,15,111,13,128,40,1,0         // movdqa        0x12880(%rip),%xmm9        # 3ba40 <_sk_srcover_bgra_8888_sse2_lowp+0x1174>
+  .byte  102,68,15,111,13,108,40,1,0         // movdqa        0x1286c(%rip),%xmm9        # 3b280 <_sk_srcover_bgra_8888_sse2_lowp+0x1184>
   .byte  102,68,15,111,225                   // movdqa        %xmm1,%xmm12
   .byte  102,69,15,219,225                   // pand          %xmm9,%xmm12
-  .byte  102,68,15,111,29,125,40,1,0         // movdqa        0x1287d(%rip),%xmm11        # 3ba50 <_sk_srcover_bgra_8888_sse2_lowp+0x1184>
+  .byte  102,68,15,111,29,105,40,1,0         // movdqa        0x12869(%rip),%xmm11        # 3b290 <_sk_srcover_bgra_8888_sse2_lowp+0x1194>
   .byte  102,65,15,219,203                   // pand          %xmm11,%xmm1
-  .byte  102,15,111,29,128,40,1,0            // movdqa        0x12880(%rip),%xmm3        # 3ba60 <_sk_srcover_bgra_8888_sse2_lowp+0x1194>
+  .byte  102,15,111,29,108,40,1,0            // movdqa        0x1286c(%rip),%xmm3        # 3b2a0 <_sk_srcover_bgra_8888_sse2_lowp+0x11a4>
   .byte  102,65,15,114,244,16                // pslld         $0x10,%xmm12
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
   .byte  102,15,102,193                      // pcmpgtd       %xmm1,%xmm0
   .byte  102,15,114,241,13                   // pslld         $0xd,%xmm1
   .byte  102,65,15,235,204                   // por           %xmm12,%xmm1
-  .byte  102,68,15,111,37,111,40,1,0         // movdqa        0x1286f(%rip),%xmm12        # 3ba70 <_sk_srcover_bgra_8888_sse2_lowp+0x11a4>
+  .byte  102,68,15,111,37,91,40,1,0          // movdqa        0x1285b(%rip),%xmm12        # 3b2b0 <_sk_srcover_bgra_8888_sse2_lowp+0x11b4>
   .byte  102,65,15,254,204                   // paddd         %xmm12,%xmm1
   .byte  102,15,223,193                      // pandn         %xmm1,%xmm0
   .byte  102,65,15,105,210                   // punpckhwd     %xmm10,%xmm2
@@ -40323,34 +39975,32 @@
   .byte  102,65,15,223,216                   // pandn         %xmm8,%xmm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  242,65,15,16,4,192                  // movsd         (%r8,%rax,8),%xmm0
+  .byte  242,65,15,16,4,208                  // movsd         (%r8,%rdx,8),%xmm0
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,13                              // jne           292c8 <_sk_load_f16_sse2+0x168>
+  .byte  117,13                              // jne           28b1c <_sk_load_f16_sse2+0x162>
   .byte  243,15,126,192                      // movq          %xmm0,%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  233,197,254,255,255                 // jmpq          2918d <_sk_load_f16_sse2+0x2d>
-  .byte  102,65,15,22,68,192,8               // movhpd        0x8(%r8,%rax,8),%xmm0
+  .byte  233,197,254,255,255                 // jmpq          289e1 <_sk_load_f16_sse2+0x27>
+  .byte  102,65,15,22,68,208,8               // movhpd        0x8(%r8,%rdx,8),%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  15,130,176,254,255,255              // jb            2918d <_sk_load_f16_sse2+0x2d>
-  .byte  243,65,15,126,76,192,16             // movq          0x10(%r8,%rax,8),%xmm1
-  .byte  233,164,254,255,255                 // jmpq          2918d <_sk_load_f16_sse2+0x2d>
+  .byte  15,130,176,254,255,255              // jb            289e1 <_sk_load_f16_sse2+0x27>
+  .byte  243,65,15,126,76,208,16             // movq          0x10(%r8,%rdx,8),%xmm1
+  .byte  233,164,254,255,255                 // jmpq          289e1 <_sk_load_f16_sse2+0x27>
 
 HIDDEN _sk_load_f16_dst_sse2
 .globl _sk_load_f16_dst_sse2
 FUNCTION(_sk_load_f16_dst_sse2)
 _sk_load_f16_dst_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,3                        // shl           $0x3,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,47,1,0,0                     // jne           29438 <_sk_load_f16_dst_sse2+0x14f>
-  .byte  102,65,15,16,36,192                 // movupd        (%r8,%rax,8),%xmm4
-  .byte  243,65,15,111,108,192,16            // movdqu        0x10(%r8,%rax,8),%xmm5
+  .byte  15,133,47,1,0,0                     // jne           28c86 <_sk_load_f16_dst_sse2+0x149>
+  .byte  102,65,15,16,36,208                 // movupd        (%r8,%rdx,8),%xmm4
+  .byte  243,65,15,111,108,208,16            // movdqu        0x10(%r8,%rdx,8),%xmm5
   .byte  102,68,15,40,196                    // movapd        %xmm4,%xmm8
   .byte  102,68,15,97,197                    // punpcklwd     %xmm5,%xmm8
   .byte  102,15,105,229                      // punpckhwd     %xmm5,%xmm4
@@ -40360,18 +40010,18 @@
   .byte  102,69,15,239,210                   // pxor          %xmm10,%xmm10
   .byte  102,15,111,238                      // movdqa        %xmm6,%xmm5
   .byte  102,65,15,97,234                    // punpcklwd     %xmm10,%xmm5
-  .byte  102,68,15,111,13,247,38,1,0         // movdqa        0x126f7(%rip),%xmm9        # 3ba40 <_sk_srcover_bgra_8888_sse2_lowp+0x1174>
+  .byte  102,68,15,111,13,233,38,1,0         // movdqa        0x126e9(%rip),%xmm9        # 3b280 <_sk_srcover_bgra_8888_sse2_lowp+0x1184>
   .byte  102,68,15,111,229                   // movdqa        %xmm5,%xmm12
   .byte  102,69,15,219,225                   // pand          %xmm9,%xmm12
-  .byte  102,68,15,111,29,244,38,1,0         // movdqa        0x126f4(%rip),%xmm11        # 3ba50 <_sk_srcover_bgra_8888_sse2_lowp+0x1184>
+  .byte  102,68,15,111,29,230,38,1,0         // movdqa        0x126e6(%rip),%xmm11        # 3b290 <_sk_srcover_bgra_8888_sse2_lowp+0x1194>
   .byte  102,65,15,219,235                   // pand          %xmm11,%xmm5
-  .byte  102,15,111,61,247,38,1,0            // movdqa        0x126f7(%rip),%xmm7        # 3ba60 <_sk_srcover_bgra_8888_sse2_lowp+0x1194>
+  .byte  102,15,111,61,233,38,1,0            // movdqa        0x126e9(%rip),%xmm7        # 3b2a0 <_sk_srcover_bgra_8888_sse2_lowp+0x11a4>
   .byte  102,65,15,114,244,16                // pslld         $0x10,%xmm12
   .byte  102,15,111,231                      // movdqa        %xmm7,%xmm4
   .byte  102,15,102,229                      // pcmpgtd       %xmm5,%xmm4
   .byte  102,15,114,245,13                   // pslld         $0xd,%xmm5
   .byte  102,65,15,235,236                   // por           %xmm12,%xmm5
-  .byte  102,68,15,111,37,230,38,1,0         // movdqa        0x126e6(%rip),%xmm12        # 3ba70 <_sk_srcover_bgra_8888_sse2_lowp+0x11a4>
+  .byte  102,68,15,111,37,216,38,1,0         // movdqa        0x126d8(%rip),%xmm12        # 3b2b0 <_sk_srcover_bgra_8888_sse2_lowp+0x11b4>
   .byte  102,65,15,254,236                   // paddd         %xmm12,%xmm5
   .byte  102,15,223,229                      // pandn         %xmm5,%xmm4
   .byte  102,65,15,105,242                   // punpckhwd     %xmm10,%xmm6
@@ -40408,18 +40058,18 @@
   .byte  102,65,15,223,248                   // pandn         %xmm8,%xmm7
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  242,65,15,16,36,192                 // movsd         (%r8,%rax,8),%xmm4
+  .byte  242,65,15,16,36,208                 // movsd         (%r8,%rdx,8),%xmm4
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,13                              // jne           29451 <_sk_load_f16_dst_sse2+0x168>
+  .byte  117,13                              // jne           28c9f <_sk_load_f16_dst_sse2+0x162>
   .byte  243,15,126,228                      // movq          %xmm4,%xmm4
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
-  .byte  233,197,254,255,255                 // jmpq          29316 <_sk_load_f16_dst_sse2+0x2d>
-  .byte  102,65,15,22,100,192,8              // movhpd        0x8(%r8,%rax,8),%xmm4
+  .byte  233,197,254,255,255                 // jmpq          28b64 <_sk_load_f16_dst_sse2+0x27>
+  .byte  102,65,15,22,100,208,8              // movhpd        0x8(%r8,%rdx,8),%xmm4
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  15,130,176,254,255,255              // jb            29316 <_sk_load_f16_dst_sse2+0x2d>
-  .byte  243,65,15,126,108,192,16            // movq          0x10(%r8,%rax,8),%xmm5
-  .byte  233,164,254,255,255                 // jmpq          29316 <_sk_load_f16_dst_sse2+0x2d>
+  .byte  15,130,176,254,255,255              // jb            28b64 <_sk_load_f16_dst_sse2+0x27>
+  .byte  243,65,15,126,108,208,16            // movq          0x10(%r8,%rdx,8),%xmm5
+  .byte  233,164,254,255,255                 // jmpq          28b64 <_sk_load_f16_dst_sse2+0x27>
 
 HIDDEN _sk_gather_f16_sse2
 .globl _sk_gather_f16_sse2
@@ -40473,18 +40123,18 @@
   .byte  102,68,15,105,201                   // punpckhwd     %xmm1,%xmm9
   .byte  102,15,111,202                      // movdqa        %xmm2,%xmm1
   .byte  102,65,15,97,200                    // punpcklwd     %xmm8,%xmm1
-  .byte  102,68,15,111,21,245,36,1,0         // movdqa        0x124f5(%rip),%xmm10        # 3ba40 <_sk_srcover_bgra_8888_sse2_lowp+0x1174>
+  .byte  102,68,15,111,21,231,36,1,0         // movdqa        0x124e7(%rip),%xmm10        # 3b280 <_sk_srcover_bgra_8888_sse2_lowp+0x1184>
   .byte  102,68,15,111,225                   // movdqa        %xmm1,%xmm12
   .byte  102,69,15,219,226                   // pand          %xmm10,%xmm12
-  .byte  102,68,15,111,29,242,36,1,0         // movdqa        0x124f2(%rip),%xmm11        # 3ba50 <_sk_srcover_bgra_8888_sse2_lowp+0x1184>
+  .byte  102,68,15,111,29,228,36,1,0         // movdqa        0x124e4(%rip),%xmm11        # 3b290 <_sk_srcover_bgra_8888_sse2_lowp+0x1194>
   .byte  102,65,15,219,203                   // pand          %xmm11,%xmm1
-  .byte  102,15,111,29,245,36,1,0            // movdqa        0x124f5(%rip),%xmm3        # 3ba60 <_sk_srcover_bgra_8888_sse2_lowp+0x1194>
+  .byte  102,15,111,29,231,36,1,0            // movdqa        0x124e7(%rip),%xmm3        # 3b2a0 <_sk_srcover_bgra_8888_sse2_lowp+0x11a4>
   .byte  102,65,15,114,244,16                // pslld         $0x10,%xmm12
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
   .byte  102,15,102,193                      // pcmpgtd       %xmm1,%xmm0
   .byte  102,15,114,241,13                   // pslld         $0xd,%xmm1
   .byte  102,65,15,235,204                   // por           %xmm12,%xmm1
-  .byte  102,68,15,111,37,228,36,1,0         // movdqa        0x124e4(%rip),%xmm12        # 3ba70 <_sk_srcover_bgra_8888_sse2_lowp+0x11a4>
+  .byte  102,68,15,111,37,214,36,1,0         // movdqa        0x124d6(%rip),%xmm12        # 3b2b0 <_sk_srcover_bgra_8888_sse2_lowp+0x11b4>
   .byte  102,65,15,254,204                   // paddd         %xmm12,%xmm1
   .byte  102,15,223,193                      // pandn         %xmm1,%xmm0
   .byte  102,65,15,105,208                   // punpckhwd     %xmm8,%xmm2
@@ -40527,19 +40177,19 @@
 FUNCTION(_sk_store_f16_sse2)
 _sk_store_f16_sse2:
   .byte  15,41,124,36,232                    // movaps        %xmm7,-0x18(%rsp)
-  .byte  102,68,15,111,29,56,36,1,0          // movdqa        0x12438(%rip),%xmm11        # 3ba80 <_sk_srcover_bgra_8888_sse2_lowp+0x11b4>
+  .byte  102,68,15,111,29,42,36,1,0          // movdqa        0x1242a(%rip),%xmm11        # 3b2c0 <_sk_srcover_bgra_8888_sse2_lowp+0x11c4>
   .byte  102,68,15,111,192                   // movdqa        %xmm0,%xmm8
   .byte  102,69,15,219,195                   // pand          %xmm11,%xmm8
-  .byte  102,68,15,111,21,53,36,1,0          // movdqa        0x12435(%rip),%xmm10        # 3ba90 <_sk_srcover_bgra_8888_sse2_lowp+0x11c4>
+  .byte  102,68,15,111,21,39,36,1,0          // movdqa        0x12427(%rip),%xmm10        # 3b2d0 <_sk_srcover_bgra_8888_sse2_lowp+0x11d4>
   .byte  102,68,15,111,240                   // movdqa        %xmm0,%xmm14
   .byte  102,69,15,219,242                   // pand          %xmm10,%xmm14
-  .byte  102,15,111,61,51,36,1,0             // movdqa        0x12433(%rip),%xmm7        # 3baa0 <_sk_srcover_bgra_8888_sse2_lowp+0x11d4>
-  .byte  102,68,15,111,37,186,37,1,0         // movdqa        0x125ba(%rip),%xmm12        # 3bc30 <_sk_srcover_bgra_8888_sse2_lowp+0x1364>
+  .byte  102,15,111,61,37,36,1,0             // movdqa        0x12425(%rip),%xmm7        # 3b2e0 <_sk_srcover_bgra_8888_sse2_lowp+0x11e4>
+  .byte  102,68,15,111,37,172,37,1,0         // movdqa        0x125ac(%rip),%xmm12        # 3b470 <_sk_srcover_bgra_8888_sse2_lowp+0x1374>
   .byte  102,68,15,111,248                   // movdqa        %xmm0,%xmm15
   .byte  102,65,15,114,247,3                 // pslld         $0x3,%xmm15
   .byte  102,69,15,219,252                   // pand          %xmm12,%xmm15
   .byte  102,69,15,254,248                   // paddd         %xmm8,%xmm15
-  .byte  102,68,15,111,45,140,32,1,0         // movdqa        0x1208c(%rip),%xmm13        # 3b720 <_sk_srcover_bgra_8888_sse2_lowp+0xe54>
+  .byte  102,68,15,111,45,126,32,1,0         // movdqa        0x1207e(%rip),%xmm13        # 3af60 <_sk_srcover_bgra_8888_sse2_lowp+0xe64>
   .byte  102,69,15,254,253                   // paddd         %xmm13,%xmm15
   .byte  102,65,15,114,231,16                // psrad         $0x10,%xmm15
   .byte  102,68,15,111,199                   // movdqa        %xmm7,%xmm8
@@ -40588,50 +40238,46 @@
   .byte  102,15,107,248                      // packssdw      %xmm0,%xmm7
   .byte  102,68,15,97,247                    // punpcklwd     %xmm7,%xmm14
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
+  .byte  76,99,64,8                          // movslq        0x8(%rax),%r8
+  .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  73,193,224,3                        // shl           $0x3,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,37                              // jne           297c6 <_sk_store_f16_sse2+0x18c>
+  .byte  117,37                              // jne           2900e <_sk_store_f16_sse2+0x186>
   .byte  102,65,15,111,248                   // movdqa        %xmm8,%xmm7
   .byte  102,65,15,98,254                    // punpckldq     %xmm14,%xmm7
-  .byte  243,65,15,127,60,192                // movdqu        %xmm7,(%r8,%rax,8)
+  .byte  243,65,15,127,60,208                // movdqu        %xmm7,(%r8,%rdx,8)
   .byte  102,69,15,106,198                   // punpckhdq     %xmm14,%xmm8
-  .byte  243,69,15,127,68,192,16             // movdqu        %xmm8,0x10(%r8,%rax,8)
+  .byte  243,69,15,127,68,208,16             // movdqu        %xmm8,0x10(%r8,%rdx,8)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,40,124,36,232                    // movaps        -0x18(%rsp),%xmm7
   .byte  255,224                             // jmpq          *%rax
   .byte  102,69,15,111,200                   // movdqa        %xmm8,%xmm9
   .byte  102,69,15,98,206                    // punpckldq     %xmm14,%xmm9
-  .byte  102,69,15,214,12,192                // movq          %xmm9,(%r8,%rax,8)
+  .byte  102,69,15,214,12,208                // movq          %xmm9,(%r8,%rdx,8)
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,225                             // je            297bd <_sk_store_f16_sse2+0x183>
-  .byte  102,69,15,23,76,192,8               // movhpd        %xmm9,0x8(%r8,%rax,8)
+  .byte  116,225                             // je            29005 <_sk_store_f16_sse2+0x17d>
+  .byte  102,69,15,23,76,208,8               // movhpd        %xmm9,0x8(%r8,%rdx,8)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,212                             // jb            297bd <_sk_store_f16_sse2+0x183>
+  .byte  114,212                             // jb            29005 <_sk_store_f16_sse2+0x17d>
   .byte  102,69,15,106,198                   // punpckhdq     %xmm14,%xmm8
-  .byte  102,69,15,214,68,192,16             // movq          %xmm8,0x10(%r8,%rax,8)
-  .byte  235,198                             // jmp           297bd <_sk_store_f16_sse2+0x183>
+  .byte  102,69,15,214,68,208,16             // movq          %xmm8,0x10(%r8,%rdx,8)
+  .byte  235,198                             // jmp           29005 <_sk_store_f16_sse2+0x17d>
 
 HIDDEN _sk_load_u16_be_sse2
 .globl _sk_load_u16_be_sse2
 FUNCTION(_sk_load_u16_be_sse2)
 _sk_load_u16_be_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
-  .byte  77,1,192                            // add           %r8,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  73,99,193                           // movslq        %r9d,%rax
+  .byte  76,141,4,149,0,0,0,0                // lea           0x0(,%rdx,4),%r8
+  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  77,1,201                            // add           %r9,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,190,0,0,0                    // jne           298dc <_sk_load_u16_be_sse2+0xe5>
-  .byte  102,65,15,16,4,64                   // movupd        (%r8,%rax,2),%xmm0
-  .byte  243,65,15,111,76,64,16              // movdqu        0x10(%r8,%rax,2),%xmm1
+  .byte  15,133,190,0,0,0                    // jne           2911e <_sk_load_u16_be_sse2+0xdf>
+  .byte  102,67,15,16,4,65                   // movupd        (%r9,%r8,2),%xmm0
+  .byte  243,67,15,111,76,65,16              // movdqu        0x10(%r9,%r8,2),%xmm1
   .byte  102,15,40,208                       // movapd        %xmm0,%xmm2
   .byte  102,15,97,209                       // punpcklwd     %xmm1,%xmm2
   .byte  102,15,105,193                      // punpckhwd     %xmm1,%xmm0
@@ -40646,7 +40292,7 @@
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
   .byte  102,65,15,97,201                    // punpcklwd     %xmm9,%xmm1
   .byte  15,91,193                           // cvtdq2ps      %xmm1,%xmm0
-  .byte  68,15,40,5,161,31,1,0               // movaps        0x11fa1(%rip),%xmm8        # 3b810 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
+  .byte  68,15,40,5,159,31,1,0               // movaps        0x11f9f(%rip),%xmm8        # 3b050 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  102,15,111,203                      // movdqa        %xmm3,%xmm1
   .byte  102,15,113,241,8                    // psllw         $0x8,%xmm1
@@ -40672,37 +40318,33 @@
   .byte  65,15,89,216                        // mulps         %xmm8,%xmm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  242,65,15,16,4,64                   // movsd         (%r8,%rax,2),%xmm0
+  .byte  242,67,15,16,4,65                   // movsd         (%r9,%r8,2),%xmm0
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,13                              // jne           298f5 <_sk_load_u16_be_sse2+0xfe>
+  .byte  117,13                              // jne           29137 <_sk_load_u16_be_sse2+0xf8>
   .byte  243,15,126,192                      // movq          %xmm0,%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  233,54,255,255,255                  // jmpq          2982b <_sk_load_u16_be_sse2+0x34>
-  .byte  102,65,15,22,68,64,8                // movhpd        0x8(%r8,%rax,2),%xmm0
+  .byte  233,54,255,255,255                  // jmpq          2906d <_sk_load_u16_be_sse2+0x2e>
+  .byte  102,67,15,22,68,65,8                // movhpd        0x8(%r9,%r8,2),%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  15,130,33,255,255,255               // jb            2982b <_sk_load_u16_be_sse2+0x34>
-  .byte  243,65,15,126,76,64,16              // movq          0x10(%r8,%rax,2),%xmm1
-  .byte  233,21,255,255,255                  // jmpq          2982b <_sk_load_u16_be_sse2+0x34>
+  .byte  15,130,33,255,255,255               // jb            2906d <_sk_load_u16_be_sse2+0x2e>
+  .byte  243,67,15,126,76,65,16              // movq          0x10(%r9,%r8,2),%xmm1
+  .byte  233,21,255,255,255                  // jmpq          2906d <_sk_load_u16_be_sse2+0x2e>
 
 HIDDEN _sk_load_rgb_u16_be_sse2
 .globl _sk_load_rgb_u16_be_sse2
 FUNCTION(_sk_load_rgb_u16_be_sse2)
 _sk_load_rgb_u16_be_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  76,141,4,82                         // lea           (%rdx,%rdx,2),%r8
   .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,193                       // imul          %r9,%r8
-  .byte  77,1,192                            // add           %r8,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  72,137,208                          // mov           %rdx,%rax
-  .byte  72,193,224,32                       // shl           $0x20,%rax
-  .byte  72,141,4,64                         // lea           (%rax,%rax,2),%rax
-  .byte  72,193,248,32                       // sar           $0x20,%rax
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  77,1,201                            // add           %r9,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,175,0,0,0                    // jne           299f0 <_sk_load_rgb_u16_be_sse2+0xda>
-  .byte  243,65,15,111,20,64                 // movdqu        (%r8,%rax,2),%xmm2
-  .byte  243,65,15,111,92,64,8               // movdqu        0x8(%r8,%rax,2),%xmm3
+  .byte  15,133,175,0,0,0                    // jne           29224 <_sk_load_rgb_u16_be_sse2+0xcc>
+  .byte  243,67,15,111,20,65                 // movdqu        (%r9,%r8,2),%xmm2
+  .byte  243,67,15,111,92,65,8               // movdqu        0x8(%r9,%r8,2),%xmm3
   .byte  102,15,115,219,4                    // psrldq        $0x4,%xmm3
   .byte  102,15,111,194                      // movdqa        %xmm2,%xmm0
   .byte  102,15,115,216,6                    // psrldq        $0x6,%xmm0
@@ -40721,7 +40363,7 @@
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  102,65,15,97,200                    // punpcklwd     %xmm8,%xmm1
   .byte  15,91,193                           // cvtdq2ps      %xmm1,%xmm0
-  .byte  68,15,40,13,107,30,1,0              // movaps        0x11e6b(%rip),%xmm9        # 3b810 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
+  .byte  68,15,40,13,119,30,1,0              // movaps        0x11e77(%rip),%xmm9        # 3b050 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
   .byte  65,15,89,193                        // mulps         %xmm9,%xmm0
   .byte  102,15,111,203                      // movdqa        %xmm3,%xmm1
   .byte  102,15,113,241,8                    // psllw         $0x8,%xmm1
@@ -40738,46 +40380,44 @@
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
   .byte  65,15,89,209                        // mulps         %xmm9,%xmm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,130,27,1,0                 // movaps        0x11b82(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,29,142,27,1,0                 // movaps        0x11b8e(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  255,224                             // jmpq          *%rax
-  .byte  102,65,15,110,20,64                 // movd          (%r8,%rax,2),%xmm2
+  .byte  102,67,15,110,20,65                 // movd          (%r9,%r8,2),%xmm2
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  102,65,15,196,84,64,4,2             // pinsrw        $0x2,0x4(%r8,%rax,2),%xmm2
+  .byte  102,67,15,196,84,65,4,2             // pinsrw        $0x2,0x4(%r9,%r8,2),%xmm2
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,13                              // jne           29a15 <_sk_load_rgb_u16_be_sse2+0xff>
+  .byte  117,13                              // jne           29249 <_sk_load_rgb_u16_be_sse2+0xf1>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
-  .byte  233,80,255,255,255                  // jmpq          29965 <_sk_load_rgb_u16_be_sse2+0x4f>
-  .byte  102,65,15,110,68,64,6               // movd          0x6(%r8,%rax,2),%xmm0
+  .byte  233,80,255,255,255                  // jmpq          29199 <_sk_load_rgb_u16_be_sse2+0x41>
+  .byte  102,67,15,110,68,65,6               // movd          0x6(%r9,%r8,2),%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  102,65,15,196,68,64,10,2            // pinsrw        $0x2,0xa(%r8,%rax,2),%xmm0
+  .byte  102,67,15,196,68,65,10,2            // pinsrw        $0x2,0xa(%r9,%r8,2),%xmm0
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,24                              // jb            29a46 <_sk_load_rgb_u16_be_sse2+0x130>
-  .byte  102,65,15,110,92,64,12              // movd          0xc(%r8,%rax,2),%xmm3
+  .byte  114,24                              // jb            2927a <_sk_load_rgb_u16_be_sse2+0x122>
+  .byte  102,67,15,110,92,65,12              // movd          0xc(%r9,%r8,2),%xmm3
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  102,65,15,196,92,64,16,2            // pinsrw        $0x2,0x10(%r8,%rax,2),%xmm3
-  .byte  233,31,255,255,255                  // jmpq          29965 <_sk_load_rgb_u16_be_sse2+0x4f>
+  .byte  102,67,15,196,92,65,16,2            // pinsrw        $0x2,0x10(%r9,%r8,2),%xmm3
+  .byte  233,31,255,255,255                  // jmpq          29199 <_sk_load_rgb_u16_be_sse2+0x41>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
-  .byte  233,22,255,255,255                  // jmpq          29965 <_sk_load_rgb_u16_be_sse2+0x4f>
+  .byte  233,22,255,255,255                  // jmpq          29199 <_sk_load_rgb_u16_be_sse2+0x41>
 
 HIDDEN _sk_store_u16_be_sse2
 .globl _sk_store_u16_be_sse2
 FUNCTION(_sk_store_u16_be_sse2)
 _sk_store_u16_be_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
-  .byte  77,1,192                            // add           %r8,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  73,99,193                           // movslq        %r9d,%rax
+  .byte  76,141,4,149,0,0,0,0                // lea           0x0(,%rdx,4),%r8
+  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  77,1,201                            // add           %r9,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  68,15,95,192                        // maxps         %xmm0,%xmm8
-  .byte  68,15,40,21,239,26,1,0              // movaps        0x11aef(%rip),%xmm10        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,21,1,27,1,0                // movaps        0x11b01(%rip),%xmm10        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,93,194                        // minps         %xmm10,%xmm8
-  .byte  68,15,40,29,51,32,1,0               // movaps        0x12033(%rip),%xmm11        # 3bac0 <_sk_srcover_bgra_8888_sse2_lowp+0x11f4>
+  .byte  68,15,40,29,69,32,1,0               // movaps        0x12045(%rip),%xmm11        # 3b300 <_sk_srcover_bgra_8888_sse2_lowp+0x1204>
   .byte  69,15,89,195                        // mulps         %xmm11,%xmm8
   .byte  102,69,15,91,192                    // cvtps2dq      %xmm8,%xmm8
   .byte  102,65,15,114,240,16                // pslld         $0x10,%xmm8
@@ -40827,40 +40467,40 @@
   .byte  102,69,15,111,200                   // movdqa        %xmm8,%xmm9
   .byte  102,69,15,98,204                    // punpckldq     %xmm12,%xmm9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,21                              // jne           29b9d <_sk_store_u16_be_sse2+0x14e>
-  .byte  69,15,17,12,64                      // movups        %xmm9,(%r8,%rax,2)
+  .byte  117,21                              // jne           293cb <_sk_store_u16_be_sse2+0x148>
+  .byte  71,15,17,12,65                      // movups        %xmm9,(%r9,%r8,2)
   .byte  102,69,15,106,196                   // punpckhdq     %xmm12,%xmm8
-  .byte  243,69,15,127,68,64,16              // movdqu        %xmm8,0x10(%r8,%rax,2)
+  .byte  243,71,15,127,68,65,16              // movdqu        %xmm8,0x10(%r9,%r8,2)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
-  .byte  102,69,15,214,12,64                 // movq          %xmm9,(%r8,%rax,2)
+  .byte  102,71,15,214,12,65                 // movq          %xmm9,(%r9,%r8,2)
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,240                             // je            29b99 <_sk_store_u16_be_sse2+0x14a>
-  .byte  102,69,15,23,76,64,8                // movhpd        %xmm9,0x8(%r8,%rax,2)
+  .byte  116,240                             // je            293c7 <_sk_store_u16_be_sse2+0x144>
+  .byte  102,71,15,23,76,65,8                // movhpd        %xmm9,0x8(%r9,%r8,2)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,227                             // jb            29b99 <_sk_store_u16_be_sse2+0x14a>
+  .byte  114,227                             // jb            293c7 <_sk_store_u16_be_sse2+0x144>
   .byte  102,69,15,106,196                   // punpckhdq     %xmm12,%xmm8
-  .byte  102,69,15,214,68,64,16              // movq          %xmm8,0x10(%r8,%rax,2)
-  .byte  235,213                             // jmp           29b99 <_sk_store_u16_be_sse2+0x14a>
+  .byte  102,71,15,214,68,65,16              // movq          %xmm8,0x10(%r9,%r8,2)
+  .byte  235,213                             // jmp           293c7 <_sk_store_u16_be_sse2+0x144>
 
 HIDDEN _sk_load_f32_sse2
 .globl _sk_load_f32_sse2
 FUNCTION(_sk_load_f32_sse2)
 _sk_load_f32_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
-  .byte  73,193,224,2                        // shl           $0x2,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  73,99,193                           // movslq        %r9d,%rax
-  .byte  69,15,16,4,128                      // movups        (%r8,%rax,4),%xmm8
+  .byte  76,141,4,149,0,0,0,0                // lea           0x0(,%rdx,4),%r8
+  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  73,193,225,2                        // shl           $0x2,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
+  .byte  72,137,208                          // mov           %rdx,%rax
+  .byte  72,193,224,4                        // shl           $0x4,%rax
+  .byte  70,15,16,4,8                        // movups        (%rax,%r9,1),%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,66                              // jne           29c2f <_sk_load_f32_sse2+0x6b>
-  .byte  65,15,16,68,128,16                  // movups        0x10(%r8,%rax,4),%xmm0
-  .byte  65,15,16,92,128,32                  // movups        0x20(%r8,%rax,4),%xmm3
-  .byte  69,15,16,76,128,48                  // movups        0x30(%r8,%rax,4),%xmm9
+  .byte  117,66                              // jne           2945e <_sk_load_f32_sse2+0x6c>
+  .byte  67,15,16,68,129,16                  // movups        0x10(%r9,%r8,4),%xmm0
+  .byte  67,15,16,92,129,32                  // movups        0x20(%r9,%r8,4),%xmm3
+  .byte  71,15,16,76,129,48                  // movups        0x30(%r9,%r8,4),%xmm9
   .byte  65,15,40,208                        // movaps        %xmm8,%xmm2
   .byte  15,20,208                           // unpcklps      %xmm0,%xmm2
   .byte  15,40,203                           // movaps        %xmm3,%xmm1
@@ -40877,36 +40517,36 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,8                               // jne           29c41 <_sk_load_f32_sse2+0x7d>
+  .byte  117,8                               // jne           29470 <_sk_load_f32_sse2+0x7e>
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
-  .byte  235,190                             // jmp           29bff <_sk_load_f32_sse2+0x3b>
-  .byte  65,15,16,68,128,16                  // movups        0x10(%r8,%rax,4),%xmm0
+  .byte  235,190                             // jmp           2942e <_sk_load_f32_sse2+0x3c>
+  .byte  67,15,16,68,129,16                  // movups        0x10(%r9,%r8,4),%xmm0
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,8                               // jb            29c55 <_sk_load_f32_sse2+0x91>
-  .byte  65,15,16,92,128,32                  // movups        0x20(%r8,%rax,4),%xmm3
-  .byte  235,170                             // jmp           29bff <_sk_load_f32_sse2+0x3b>
+  .byte  114,8                               // jb            29484 <_sk_load_f32_sse2+0x92>
+  .byte  67,15,16,92,129,32                  // movups        0x20(%r9,%r8,4),%xmm3
+  .byte  235,170                             // jmp           2942e <_sk_load_f32_sse2+0x3c>
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
-  .byte  235,165                             // jmp           29bff <_sk_load_f32_sse2+0x3b>
+  .byte  235,165                             // jmp           2942e <_sk_load_f32_sse2+0x3c>
 
 HIDDEN _sk_load_f32_dst_sse2
 .globl _sk_load_f32_dst_sse2
 FUNCTION(_sk_load_f32_dst_sse2)
 _sk_load_f32_dst_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
-  .byte  73,193,224,2                        // shl           $0x2,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  73,99,193                           // movslq        %r9d,%rax
-  .byte  69,15,16,4,128                      // movups        (%r8,%rax,4),%xmm8
+  .byte  76,141,4,149,0,0,0,0                // lea           0x0(,%rdx,4),%r8
+  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  73,193,225,2                        // shl           $0x2,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
+  .byte  72,137,208                          // mov           %rdx,%rax
+  .byte  72,193,224,4                        // shl           $0x4,%rax
+  .byte  70,15,16,4,8                        // movups        (%rax,%r9,1),%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,66                              // jne           29cc5 <_sk_load_f32_dst_sse2+0x6b>
-  .byte  65,15,16,100,128,16                 // movups        0x10(%r8,%rax,4),%xmm4
-  .byte  65,15,16,124,128,32                 // movups        0x20(%r8,%rax,4),%xmm7
-  .byte  69,15,16,76,128,48                  // movups        0x30(%r8,%rax,4),%xmm9
+  .byte  117,66                              // jne           294f5 <_sk_load_f32_dst_sse2+0x6c>
+  .byte  67,15,16,100,129,16                 // movups        0x10(%r9,%r8,4),%xmm4
+  .byte  67,15,16,124,129,32                 // movups        0x20(%r9,%r8,4),%xmm7
+  .byte  71,15,16,76,129,48                  // movups        0x30(%r9,%r8,4),%xmm9
   .byte  65,15,40,240                        // movaps        %xmm8,%xmm6
   .byte  15,20,244                           // unpcklps      %xmm4,%xmm6
   .byte  15,40,239                           // movaps        %xmm7,%xmm5
@@ -40923,30 +40563,30 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,8                               // jne           29cd7 <_sk_load_f32_dst_sse2+0x7d>
+  .byte  117,8                               // jne           29507 <_sk_load_f32_dst_sse2+0x7e>
   .byte  15,87,255                           // xorps         %xmm7,%xmm7
   .byte  15,87,228                           // xorps         %xmm4,%xmm4
-  .byte  235,190                             // jmp           29c95 <_sk_load_f32_dst_sse2+0x3b>
-  .byte  65,15,16,100,128,16                 // movups        0x10(%r8,%rax,4),%xmm4
+  .byte  235,190                             // jmp           294c5 <_sk_load_f32_dst_sse2+0x3c>
+  .byte  67,15,16,100,129,16                 // movups        0x10(%r9,%r8,4),%xmm4
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,8                               // jb            29ceb <_sk_load_f32_dst_sse2+0x91>
-  .byte  65,15,16,124,128,32                 // movups        0x20(%r8,%rax,4),%xmm7
-  .byte  235,170                             // jmp           29c95 <_sk_load_f32_dst_sse2+0x3b>
+  .byte  114,8                               // jb            2951b <_sk_load_f32_dst_sse2+0x92>
+  .byte  67,15,16,124,129,32                 // movups        0x20(%r9,%r8,4),%xmm7
+  .byte  235,170                             // jmp           294c5 <_sk_load_f32_dst_sse2+0x3c>
   .byte  15,87,255                           // xorps         %xmm7,%xmm7
-  .byte  235,165                             // jmp           29c95 <_sk_load_f32_dst_sse2+0x3b>
+  .byte  235,165                             // jmp           294c5 <_sk_load_f32_dst_sse2+0x3c>
 
 HIDDEN _sk_store_f32_sse2
 .globl _sk_store_f32_sse2
 FUNCTION(_sk_store_f32_sse2)
 _sk_store_f32_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9d
-  .byte  76,99,80,8                          // movslq        0x8(%rax),%r10
-  .byte  76,99,193                           // movslq        %ecx,%r8
-  .byte  77,15,175,194                       // imul          %r10,%r8
-  .byte  73,193,224,2                        // shl           $0x2,%r8
-  .byte  76,3,0                              // add           (%rax),%r8
-  .byte  73,99,193                           // movslq        %r9d,%rax
+  .byte  76,141,4,149,0,0,0,0                // lea           0x0(,%rdx,4),%r8
+  .byte  76,99,72,8                          // movslq        0x8(%rax),%r9
+  .byte  76,15,175,201                       // imul          %rcx,%r9
+  .byte  73,193,225,2                        // shl           $0x2,%r9
+  .byte  76,3,8                              // add           (%rax),%r9
+  .byte  72,137,208                          // mov           %rdx,%rax
+  .byte  72,193,224,4                        // shl           $0x4,%rax
   .byte  68,15,40,200                        // movaps        %xmm0,%xmm9
   .byte  68,15,20,201                        // unpcklps      %xmm1,%xmm9
   .byte  68,15,40,194                        // movaps        %xmm2,%xmm8
@@ -40960,22 +40600,22 @@
   .byte  69,15,18,193                        // movhlps       %xmm9,%xmm8
   .byte  69,15,40,202                        // movaps        %xmm10,%xmm9
   .byte  102,69,15,20,203                    // unpcklpd      %xmm11,%xmm9
-  .byte  102,69,15,17,36,128                 // movupd        %xmm12,(%r8,%rax,4)
+  .byte  102,70,15,17,36,8                   // movupd        %xmm12,(%rax,%r9,1)
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,29                              // jne           29d6d <_sk_store_f32_sse2+0x7d>
+  .byte  117,29                              // jne           2959e <_sk_store_f32_sse2+0x7e>
   .byte  102,69,15,21,211                    // unpckhpd      %xmm11,%xmm10
-  .byte  69,15,17,68,128,16                  // movups        %xmm8,0x10(%r8,%rax,4)
-  .byte  102,69,15,17,76,128,32              // movupd        %xmm9,0x20(%r8,%rax,4)
-  .byte  102,69,15,17,84,128,48              // movupd        %xmm10,0x30(%r8,%rax,4)
+  .byte  71,15,17,68,129,16                  // movups        %xmm8,0x10(%r9,%r8,4)
+  .byte  102,71,15,17,76,129,32              // movupd        %xmm9,0x20(%r9,%r8,4)
+  .byte  102,71,15,17,84,129,48              // movupd        %xmm10,0x30(%r9,%r8,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,246                             // je            29d69 <_sk_store_f32_sse2+0x79>
-  .byte  69,15,17,68,128,16                  // movups        %xmm8,0x10(%r8,%rax,4)
+  .byte  116,246                             // je            2959a <_sk_store_f32_sse2+0x7a>
+  .byte  71,15,17,68,129,16                  // movups        %xmm8,0x10(%r9,%r8,4)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,234                             // jb            29d69 <_sk_store_f32_sse2+0x79>
-  .byte  102,69,15,17,76,128,32              // movupd        %xmm9,0x20(%r8,%rax,4)
-  .byte  235,225                             // jmp           29d69 <_sk_store_f32_sse2+0x79>
+  .byte  114,234                             // jb            2959a <_sk_store_f32_sse2+0x7a>
+  .byte  102,71,15,17,76,129,32              // movupd        %xmm9,0x20(%r9,%r8,4)
+  .byte  235,225                             // jmp           2959a <_sk_store_f32_sse2+0x7a>
 
 HIDDEN _sk_repeat_x_sse2
 .globl _sk_repeat_x_sse2
@@ -40989,7 +40629,7 @@
   .byte  243,69,15,91,209                    // cvttps2dq     %xmm9,%xmm10
   .byte  69,15,91,210                        // cvtdq2ps      %xmm10,%xmm10
   .byte  69,15,194,202,1                     // cmpltps       %xmm10,%xmm9
-  .byte  68,15,84,13,188,23,1,0              // andps         0x117bc(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,84,13,203,23,1,0              // andps         0x117cb(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,92,209                        // subps         %xmm9,%xmm10
   .byte  69,15,198,192,0                     // shufps        $0x0,%xmm8,%xmm8
   .byte  69,15,89,194                        // mulps         %xmm10,%xmm8
@@ -41009,7 +40649,7 @@
   .byte  243,69,15,91,209                    // cvttps2dq     %xmm9,%xmm10
   .byte  69,15,91,210                        // cvtdq2ps      %xmm10,%xmm10
   .byte  69,15,194,202,1                     // cmpltps       %xmm10,%xmm9
-  .byte  68,15,84,13,123,23,1,0              // andps         0x1177b(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,84,13,138,23,1,0              // andps         0x1178a(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,92,209                        // subps         %xmm9,%xmm10
   .byte  69,15,198,192,0                     // shufps        $0x0,%xmm8,%xmm8
   .byte  69,15,89,194                        // mulps         %xmm10,%xmm8
@@ -41029,13 +40669,13 @@
   .byte  65,15,92,194                        // subps         %xmm10,%xmm0
   .byte  243,69,15,88,192                    // addss         %xmm8,%xmm8
   .byte  69,15,198,192,0                     // shufps        $0x0,%xmm8,%xmm8
-  .byte  243,68,15,89,13,65,13,1,0           // mulss         0x10d41(%rip),%xmm9        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  243,68,15,89,13,64,13,1,0           // mulss         0x10d40(%rip),%xmm9        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
   .byte  68,15,89,200                        // mulps         %xmm0,%xmm9
   .byte  243,69,15,91,217                    // cvttps2dq     %xmm9,%xmm11
   .byte  69,15,91,219                        // cvtdq2ps      %xmm11,%xmm11
   .byte  69,15,194,203,1                     // cmpltps       %xmm11,%xmm9
-  .byte  68,15,84,13,26,23,1,0               // andps         0x1171a(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,84,13,41,23,1,0               // andps         0x11729(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,87,228                        // xorps         %xmm12,%xmm12
   .byte  69,15,92,217                        // subps         %xmm9,%xmm11
   .byte  69,15,89,216                        // mulps         %xmm8,%xmm11
@@ -41058,13 +40698,13 @@
   .byte  65,15,92,202                        // subps         %xmm10,%xmm1
   .byte  243,69,15,88,192                    // addss         %xmm8,%xmm8
   .byte  69,15,198,192,0                     // shufps        $0x0,%xmm8,%xmm8
-  .byte  243,68,15,89,13,213,12,1,0          // mulss         0x10cd5(%rip),%xmm9        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  243,68,15,89,13,212,12,1,0          // mulss         0x10cd4(%rip),%xmm9        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
   .byte  68,15,89,201                        // mulps         %xmm1,%xmm9
   .byte  243,69,15,91,217                    // cvttps2dq     %xmm9,%xmm11
   .byte  69,15,91,219                        // cvtdq2ps      %xmm11,%xmm11
   .byte  69,15,194,203,1                     // cmpltps       %xmm11,%xmm9
-  .byte  68,15,84,13,174,22,1,0              // andps         0x116ae(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,84,13,189,22,1,0              // andps         0x116bd(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,87,228                        // xorps         %xmm12,%xmm12
   .byte  69,15,92,217                        // subps         %xmm9,%xmm11
   .byte  69,15,89,216                        // mulps         %xmm8,%xmm11
@@ -41081,7 +40721,7 @@
 _sk_clamp_x_1_sse2:
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  68,15,95,192                        // maxps         %xmm0,%xmm8
-  .byte  68,15,93,5,126,22,1,0               // minps         0x1167e(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,93,5,141,22,1,0               // minps         0x1168d(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  255,224                             // jmpq          *%rax
@@ -41094,7 +40734,7 @@
   .byte  69,15,91,200                        // cvtdq2ps      %xmm8,%xmm9
   .byte  68,15,40,208                        // movaps        %xmm0,%xmm10
   .byte  69,15,194,209,1                     // cmpltps       %xmm9,%xmm10
-  .byte  68,15,40,29,92,22,1,0               // movaps        0x1165c(%rip),%xmm11        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,29,107,22,1,0              // movaps        0x1166b(%rip),%xmm11        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,84,211                        // andps         %xmm11,%xmm10
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  69,15,92,202                        // subps         %xmm10,%xmm9
@@ -41109,14 +40749,14 @@
 .globl _sk_mirror_x_1_sse2
 FUNCTION(_sk_mirror_x_1_sse2)
 _sk_mirror_x_1_sse2:
-  .byte  68,15,40,13,148,22,1,0              // movaps        0x11694(%rip),%xmm9        # 3b5d0 <_sk_srcover_bgra_8888_sse2_lowp+0xd04>
+  .byte  68,15,40,13,163,22,1,0              // movaps        0x116a3(%rip),%xmm9        # 3ae10 <_sk_srcover_bgra_8888_sse2_lowp+0xd14>
   .byte  65,15,88,193                        // addps         %xmm9,%xmm0
-  .byte  68,15,40,21,24,22,1,0               // movaps        0x11618(%rip),%xmm10        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  68,15,40,21,39,22,1,0               // movaps        0x11627(%rip),%xmm10        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  68,15,89,208                        // mulps         %xmm0,%xmm10
   .byte  243,69,15,91,194                    // cvttps2dq     %xmm10,%xmm8
   .byte  69,15,91,216                        // cvtdq2ps      %xmm8,%xmm11
   .byte  69,15,194,211,1                     // cmpltps       %xmm11,%xmm10
-  .byte  68,15,40,37,14,22,1,0               // movaps        0x1160e(%rip),%xmm12        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,37,29,22,1,0               // movaps        0x1161d(%rip),%xmm12        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,84,212                        // andps         %xmm12,%xmm10
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  69,15,92,218                        // subps         %xmm10,%xmm11
@@ -41137,10 +40777,10 @@
 FUNCTION(_sk_luminance_to_alpha_sse2)
 _sk_luminance_to_alpha_sse2:
   .byte  15,40,218                           // movaps        %xmm2,%xmm3
-  .byte  15,89,5,48,27,1,0                   // mulps         0x11b30(%rip),%xmm0        # 3bad0 <_sk_srcover_bgra_8888_sse2_lowp+0x1204>
-  .byte  15,89,13,57,27,1,0                  // mulps         0x11b39(%rip),%xmm1        # 3bae0 <_sk_srcover_bgra_8888_sse2_lowp+0x1214>
+  .byte  15,89,5,63,27,1,0                   // mulps         0x11b3f(%rip),%xmm0        # 3b310 <_sk_srcover_bgra_8888_sse2_lowp+0x1214>
+  .byte  15,89,13,72,27,1,0                  // mulps         0x11b48(%rip),%xmm1        # 3b320 <_sk_srcover_bgra_8888_sse2_lowp+0x1224>
   .byte  15,88,200                           // addps         %xmm0,%xmm1
-  .byte  15,89,29,63,27,1,0                  // mulps         0x11b3f(%rip),%xmm3        # 3baf0 <_sk_srcover_bgra_8888_sse2_lowp+0x1224>
+  .byte  15,89,29,78,27,1,0                  // mulps         0x11b4e(%rip),%xmm3        # 3b330 <_sk_srcover_bgra_8888_sse2_lowp+0x1234>
   .byte  15,88,217                           // addps         %xmm1,%xmm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
@@ -41452,9 +41092,9 @@
   .byte  72,139,24                           // mov           (%rax),%rbx
   .byte  76,139,112,8                        // mov           0x8(%rax),%r14
   .byte  72,255,203                          // dec           %rbx
-  .byte  120,7                               // js            2a451 <_sk_evenly_spaced_gradient_sse2+0x18>
+  .byte  120,7                               // js            29c82 <_sk_evenly_spaced_gradient_sse2+0x18>
   .byte  243,72,15,42,203                    // cvtsi2ss      %rbx,%xmm1
-  .byte  235,21                              // jmp           2a466 <_sk_evenly_spaced_gradient_sse2+0x2d>
+  .byte  235,21                              // jmp           29c97 <_sk_evenly_spaced_gradient_sse2+0x2d>
   .byte  73,137,216                          // mov           %rbx,%r8
   .byte  73,209,232                          // shr           %r8
   .byte  131,227,1                           // and           $0x1,%ebx
@@ -41556,7 +41196,7 @@
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  73,131,248,2                        // cmp           $0x2,%r8
-  .byte  114,41                              // jb            2a62a <_sk_gradient_sse2+0x38>
+  .byte  114,41                              // jb            29e5b <_sk_gradient_sse2+0x38>
   .byte  76,139,72,72                        // mov           0x48(%rax),%r9
   .byte  73,255,200                          // dec           %r8
   .byte  73,131,193,4                        // add           $0x4,%r9
@@ -41567,7 +41207,7 @@
   .byte  102,15,250,202                      // psubd         %xmm2,%xmm1
   .byte  73,131,193,4                        // add           $0x4,%r9
   .byte  73,255,200                          // dec           %r8
-  .byte  117,230                             // jne           2a610 <_sk_gradient_sse2+0x1e>
+  .byte  117,230                             // jne           29e41 <_sk_gradient_sse2+0x1e>
   .byte  65,86                               // push          %r14
   .byte  83                                  // push          %rbx
   .byte  102,15,112,209,78                   // pshufd        $0x4e,%xmm1,%xmm2
@@ -41707,29 +41347,29 @@
   .byte  69,15,94,220                        // divps         %xmm12,%xmm11
   .byte  69,15,40,227                        // movaps        %xmm11,%xmm12
   .byte  69,15,89,228                        // mulps         %xmm12,%xmm12
-  .byte  68,15,40,45,155,18,1,0              // movaps        0x1129b(%rip),%xmm13        # 3bb00 <_sk_srcover_bgra_8888_sse2_lowp+0x1234>
+  .byte  68,15,40,45,170,18,1,0              // movaps        0x112aa(%rip),%xmm13        # 3b340 <_sk_srcover_bgra_8888_sse2_lowp+0x1244>
   .byte  69,15,89,236                        // mulps         %xmm12,%xmm13
-  .byte  68,15,88,45,159,18,1,0              // addps         0x1129f(%rip),%xmm13        # 3bb10 <_sk_srcover_bgra_8888_sse2_lowp+0x1244>
+  .byte  68,15,88,45,174,18,1,0              // addps         0x112ae(%rip),%xmm13        # 3b350 <_sk_srcover_bgra_8888_sse2_lowp+0x1254>
   .byte  69,15,89,236                        // mulps         %xmm12,%xmm13
-  .byte  68,15,88,45,163,18,1,0              // addps         0x112a3(%rip),%xmm13        # 3bb20 <_sk_srcover_bgra_8888_sse2_lowp+0x1254>
+  .byte  68,15,88,45,178,18,1,0              // addps         0x112b2(%rip),%xmm13        # 3b360 <_sk_srcover_bgra_8888_sse2_lowp+0x1264>
   .byte  69,15,89,236                        // mulps         %xmm12,%xmm13
-  .byte  68,15,88,45,167,18,1,0              // addps         0x112a7(%rip),%xmm13        # 3bb30 <_sk_srcover_bgra_8888_sse2_lowp+0x1264>
+  .byte  68,15,88,45,182,18,1,0              // addps         0x112b6(%rip),%xmm13        # 3b370 <_sk_srcover_bgra_8888_sse2_lowp+0x1274>
   .byte  69,15,89,235                        // mulps         %xmm11,%xmm13
   .byte  69,15,194,202,1                     // cmpltps       %xmm10,%xmm9
-  .byte  68,15,40,21,166,18,1,0              // movaps        0x112a6(%rip),%xmm10        # 3bb40 <_sk_srcover_bgra_8888_sse2_lowp+0x1274>
+  .byte  68,15,40,21,181,18,1,0              // movaps        0x112b5(%rip),%xmm10        # 3b380 <_sk_srcover_bgra_8888_sse2_lowp+0x1284>
   .byte  69,15,92,213                        // subps         %xmm13,%xmm10
   .byte  69,15,84,209                        // andps         %xmm9,%xmm10
   .byte  69,15,85,205                        // andnps        %xmm13,%xmm9
   .byte  69,15,86,202                        // orps          %xmm10,%xmm9
   .byte  68,15,194,192,1                     // cmpltps       %xmm0,%xmm8
-  .byte  68,15,40,21,169,12,1,0              // movaps        0x10ca9(%rip),%xmm10        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  68,15,40,21,184,12,1,0              // movaps        0x10cb8(%rip),%xmm10        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  69,15,92,209                        // subps         %xmm9,%xmm10
   .byte  69,15,84,208                        // andps         %xmm8,%xmm10
   .byte  69,15,85,193                        // andnps        %xmm9,%xmm8
   .byte  69,15,86,194                        // orps          %xmm10,%xmm8
   .byte  68,15,40,201                        // movaps        %xmm1,%xmm9
   .byte  68,15,194,200,1                     // cmpltps       %xmm0,%xmm9
-  .byte  68,15,40,21,152,12,1,0              // movaps        0x10c98(%rip),%xmm10        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,21,167,12,1,0              // movaps        0x10ca7(%rip),%xmm10        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,92,208                        // subps         %xmm8,%xmm10
   .byte  69,15,84,209                        // andps         %xmm9,%xmm10
   .byte  69,15,85,200                        // andnps        %xmm8,%xmm9
@@ -41755,7 +41395,7 @@
 .globl _sk_negate_x_sse2
 FUNCTION(_sk_negate_x_sse2)
 _sk_negate_x_sse2:
-  .byte  15,87,5,109,17,1,0                  // xorps         0x1116d(%rip),%xmm0        # 3ba80 <_sk_srcover_bgra_8888_sse2_lowp+0x11b4>
+  .byte  15,87,5,124,17,1,0                  // xorps         0x1117c(%rip),%xmm0        # 3b2c0 <_sk_srcover_bgra_8888_sse2_lowp+0x11c4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -41832,7 +41472,7 @@
   .byte  69,15,89,201                        // mulps         %xmm9,%xmm9
   .byte  65,15,92,193                        // subps         %xmm9,%xmm0
   .byte  15,81,192                           // sqrtps        %xmm0,%xmm0
-  .byte  15,87,5,175,16,1,0                  // xorps         0x110af(%rip),%xmm0        # 3ba80 <_sk_srcover_bgra_8888_sse2_lowp+0x11b4>
+  .byte  15,87,5,190,16,1,0                  // xorps         0x110be(%rip),%xmm0        # 3b2c0 <_sk_srcover_bgra_8888_sse2_lowp+0x11c4>
   .byte  65,15,92,192                        // subps         %xmm8,%xmm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -41852,7 +41492,7 @@
 .globl _sk_alter_2pt_conical_unswap_sse2
 FUNCTION(_sk_alter_2pt_conical_unswap_sse2)
 _sk_alter_2pt_conical_unswap_sse2:
-  .byte  68,15,40,5,122,11,1,0               // movaps        0x10b7a(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,137,11,1,0               // movaps        0x10b89(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  68,15,92,192                        // subps         %xmm0,%xmm8
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
@@ -41901,7 +41541,7 @@
 FUNCTION(_sk_save_xy_sse2)
 _sk_save_xy_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,15,40,5,8,11,1,0                 // movaps        0x10b08(%rip),%xmm8        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  68,15,40,5,23,11,1,0                // movaps        0x10b17(%rip),%xmm8        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  15,17,0                             // movups        %xmm0,(%rax)
   .byte  68,15,40,200                        // movaps        %xmm0,%xmm9
   .byte  69,15,88,200                        // addps         %xmm8,%xmm9
@@ -41909,7 +41549,7 @@
   .byte  69,15,91,210                        // cvtdq2ps      %xmm10,%xmm10
   .byte  69,15,40,217                        // movaps        %xmm9,%xmm11
   .byte  69,15,194,218,1                     // cmpltps       %xmm10,%xmm11
-  .byte  68,15,40,37,243,10,1,0              // movaps        0x10af3(%rip),%xmm12        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,37,2,11,1,0                // movaps        0x10b02(%rip),%xmm12        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,84,220                        // andps         %xmm12,%xmm11
   .byte  69,15,92,211                        // subps         %xmm11,%xmm10
   .byte  69,15,92,202                        // subps         %xmm10,%xmm9
@@ -41956,8 +41596,8 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,128,128,0,0,0              // movups        0x80(%rax),%xmm8
-  .byte  15,88,5,51,16,1,0                   // addps         0x11033(%rip),%xmm0        # 3bb50 <_sk_srcover_bgra_8888_sse2_lowp+0x1284>
-  .byte  68,15,40,13,75,10,1,0               // movaps        0x10a4b(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,88,5,66,16,1,0                   // addps         0x11042(%rip),%xmm0        # 3b390 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
+  .byte  68,15,40,13,90,10,1,0               // movaps        0x10a5a(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
   .byte  68,15,17,136,0,1,0,0                // movups        %xmm9,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -41970,7 +41610,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,128,128,0,0,0              // movups        0x80(%rax),%xmm8
-  .byte  15,88,5,23,10,1,0                   // addps         0x10a17(%rip),%xmm0        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  15,88,5,38,10,1,0                   // addps         0x10a26(%rip),%xmm0        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  68,15,17,128,0,1,0,0                // movups        %xmm8,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -41982,8 +41622,8 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,72,64                         // movups        0x40(%rax),%xmm1
   .byte  68,15,16,128,192,0,0,0              // movups        0xc0(%rax),%xmm8
-  .byte  15,88,13,230,15,1,0                 // addps         0x10fe6(%rip),%xmm1        # 3bb50 <_sk_srcover_bgra_8888_sse2_lowp+0x1284>
-  .byte  68,15,40,13,254,9,1,0               // movaps        0x109fe(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,88,13,245,15,1,0                 // addps         0x10ff5(%rip),%xmm1        # 3b390 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
+  .byte  68,15,40,13,13,10,1,0               // movaps        0x10a0d(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
   .byte  68,15,17,136,64,1,0,0               // movups        %xmm9,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -41996,7 +41636,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,72,64                         // movups        0x40(%rax),%xmm1
   .byte  68,15,16,128,192,0,0,0              // movups        0xc0(%rax),%xmm8
-  .byte  15,88,13,201,9,1,0                  // addps         0x109c9(%rip),%xmm1        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  15,88,13,216,9,1,0                  // addps         0x109d8(%rip),%xmm1        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  68,15,17,128,64,1,0,0               // movups        %xmm8,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -42008,13 +41648,13 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,128,128,0,0,0              // movups        0x80(%rax),%xmm8
-  .byte  15,88,5,169,15,1,0                  // addps         0x10fa9(%rip),%xmm0        # 3bb60 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
-  .byte  68,15,40,13,177,9,1,0               // movaps        0x109b1(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,88,5,184,15,1,0                  // addps         0x10fb8(%rip),%xmm0        # 3b3a0 <_sk_srcover_bgra_8888_sse2_lowp+0x12a4>
+  .byte  68,15,40,13,192,9,1,0               // movaps        0x109c0(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
   .byte  69,15,40,193                        // movaps        %xmm9,%xmm8
   .byte  69,15,89,192                        // mulps         %xmm8,%xmm8
-  .byte  68,15,89,13,157,15,1,0              // mulps         0x10f9d(%rip),%xmm9        # 3bb70 <_sk_srcover_bgra_8888_sse2_lowp+0x12a4>
-  .byte  68,15,88,13,149,11,1,0              // addps         0x10b95(%rip),%xmm9        # 3b770 <_sk_srcover_bgra_8888_sse2_lowp+0xea4>
+  .byte  68,15,89,13,172,15,1,0              // mulps         0x10fac(%rip),%xmm9        # 3b3b0 <_sk_srcover_bgra_8888_sse2_lowp+0x12b4>
+  .byte  68,15,88,13,164,11,1,0              // addps         0x10ba4(%rip),%xmm9        # 3afb0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  68,15,17,136,0,1,0,0                // movups        %xmm9,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -42027,16 +41667,16 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,128,128,0,0,0              // movups        0x80(%rax),%xmm8
-  .byte  15,88,5,81,15,1,0                   // addps         0x10f51(%rip),%xmm0        # 3bb50 <_sk_srcover_bgra_8888_sse2_lowp+0x1284>
-  .byte  68,15,40,13,105,9,1,0               // movaps        0x10969(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,88,5,96,15,1,0                   // addps         0x10f60(%rip),%xmm0        # 3b390 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
+  .byte  68,15,40,13,120,9,1,0               // movaps        0x10978(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
-  .byte  68,15,40,5,109,15,1,0               // movaps        0x10f6d(%rip),%xmm8        # 3bb80 <_sk_srcover_bgra_8888_sse2_lowp+0x12b4>
+  .byte  68,15,40,5,124,15,1,0               // movaps        0x10f7c(%rip),%xmm8        # 3b3c0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,113,15,1,0               // addps         0x10f71(%rip),%xmm8        # 3bb90 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  .byte  68,15,88,5,128,15,1,0               // addps         0x10f80(%rip),%xmm8        # 3b3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,53,9,1,0                 // addps         0x10935(%rip),%xmm8        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  68,15,88,5,68,9,1,0                 // addps         0x10944(%rip),%xmm8        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,105,15,1,0               // addps         0x10f69(%rip),%xmm8        # 3bba0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
+  .byte  68,15,88,5,120,15,1,0               // addps         0x10f78(%rip),%xmm8        # 3b3e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e4>
   .byte  68,15,17,128,0,1,0,0                // movups        %xmm8,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -42046,17 +41686,17 @@
 FUNCTION(_sk_bicubic_p1x_sse2)
 _sk_bicubic_p1x_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,15,40,5,19,9,1,0                 // movaps        0x10913(%rip),%xmm8        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  68,15,40,5,34,9,1,0                 // movaps        0x10922(%rip),%xmm8        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,136,128,0,0,0              // movups        0x80(%rax),%xmm9
   .byte  65,15,88,192                        // addps         %xmm8,%xmm0
-  .byte  68,15,40,21,28,15,1,0               // movaps        0x10f1c(%rip),%xmm10        # 3bb80 <_sk_srcover_bgra_8888_sse2_lowp+0x12b4>
+  .byte  68,15,40,21,43,15,1,0               // movaps        0x10f2b(%rip),%xmm10        # 3b3c0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
-  .byte  68,15,88,21,32,15,1,0               // addps         0x10f20(%rip),%xmm10        # 3bb90 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  .byte  68,15,88,21,47,15,1,0               // addps         0x10f2f(%rip),%xmm10        # 3b3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
   .byte  69,15,88,208                        // addps         %xmm8,%xmm10
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
-  .byte  68,15,88,21,28,15,1,0               // addps         0x10f1c(%rip),%xmm10        # 3bba0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
+  .byte  68,15,88,21,43,15,1,0               // addps         0x10f2b(%rip),%xmm10        # 3b3e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e4>
   .byte  68,15,17,144,0,1,0,0                // movups        %xmm10,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -42068,11 +41708,11 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,128,128,0,0,0              // movups        0x80(%rax),%xmm8
-  .byte  15,88,5,236,14,1,0                  // addps         0x10eec(%rip),%xmm0        # 3bb90 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  .byte  15,88,5,251,14,1,0                  // addps         0x10efb(%rip),%xmm0        # 3b3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  69,15,89,201                        // mulps         %xmm9,%xmm9
-  .byte  68,15,89,5,188,14,1,0               // mulps         0x10ebc(%rip),%xmm8        # 3bb70 <_sk_srcover_bgra_8888_sse2_lowp+0x12a4>
-  .byte  68,15,88,5,180,10,1,0               // addps         0x10ab4(%rip),%xmm8        # 3b770 <_sk_srcover_bgra_8888_sse2_lowp+0xea4>
+  .byte  68,15,89,5,203,14,1,0               // mulps         0x10ecb(%rip),%xmm8        # 3b3b0 <_sk_srcover_bgra_8888_sse2_lowp+0x12b4>
+  .byte  68,15,88,5,195,10,1,0               // addps         0x10ac3(%rip),%xmm8        # 3afb0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
   .byte  68,15,17,128,0,1,0,0                // movups        %xmm8,0x100(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -42085,13 +41725,13 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,72,64                         // movups        0x40(%rax),%xmm1
   .byte  68,15,16,128,192,0,0,0              // movups        0xc0(%rax),%xmm8
-  .byte  15,88,13,127,14,1,0                 // addps         0x10e7f(%rip),%xmm1        # 3bb60 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
-  .byte  68,15,40,13,135,8,1,0               // movaps        0x10887(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,88,13,142,14,1,0                 // addps         0x10e8e(%rip),%xmm1        # 3b3a0 <_sk_srcover_bgra_8888_sse2_lowp+0x12a4>
+  .byte  68,15,40,13,150,8,1,0               // movaps        0x10896(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
   .byte  69,15,40,193                        // movaps        %xmm9,%xmm8
   .byte  69,15,89,192                        // mulps         %xmm8,%xmm8
-  .byte  68,15,89,13,115,14,1,0              // mulps         0x10e73(%rip),%xmm9        # 3bb70 <_sk_srcover_bgra_8888_sse2_lowp+0x12a4>
-  .byte  68,15,88,13,107,10,1,0              // addps         0x10a6b(%rip),%xmm9        # 3b770 <_sk_srcover_bgra_8888_sse2_lowp+0xea4>
+  .byte  68,15,89,13,130,14,1,0              // mulps         0x10e82(%rip),%xmm9        # 3b3b0 <_sk_srcover_bgra_8888_sse2_lowp+0x12b4>
+  .byte  68,15,88,13,122,10,1,0              // addps         0x10a7a(%rip),%xmm9        # 3afb0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  68,15,17,136,64,1,0,0               // movups        %xmm9,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -42104,16 +41744,16 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,72,64                         // movups        0x40(%rax),%xmm1
   .byte  68,15,16,128,192,0,0,0              // movups        0xc0(%rax),%xmm8
-  .byte  15,88,13,38,14,1,0                  // addps         0x10e26(%rip),%xmm1        # 3bb50 <_sk_srcover_bgra_8888_sse2_lowp+0x1284>
-  .byte  68,15,40,13,62,8,1,0                // movaps        0x1083e(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,88,13,53,14,1,0                  // addps         0x10e35(%rip),%xmm1        # 3b390 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
+  .byte  68,15,40,13,77,8,1,0                // movaps        0x1084d(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
-  .byte  68,15,40,5,66,14,1,0                // movaps        0x10e42(%rip),%xmm8        # 3bb80 <_sk_srcover_bgra_8888_sse2_lowp+0x12b4>
+  .byte  68,15,40,5,81,14,1,0                // movaps        0x10e51(%rip),%xmm8        # 3b3c0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,70,14,1,0                // addps         0x10e46(%rip),%xmm8        # 3bb90 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  .byte  68,15,88,5,85,14,1,0                // addps         0x10e55(%rip),%xmm8        # 3b3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,10,8,1,0                 // addps         0x1080a(%rip),%xmm8        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  68,15,88,5,25,8,1,0                 // addps         0x10819(%rip),%xmm8        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,62,14,1,0                // addps         0x10e3e(%rip),%xmm8        # 3bba0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
+  .byte  68,15,88,5,77,14,1,0                // addps         0x10e4d(%rip),%xmm8        # 3b3e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e4>
   .byte  68,15,17,128,64,1,0,0               // movups        %xmm8,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -42123,17 +41763,17 @@
 FUNCTION(_sk_bicubic_p1y_sse2)
 _sk_bicubic_p1y_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,15,40,5,232,7,1,0                // movaps        0x107e8(%rip),%xmm8        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  68,15,40,5,247,7,1,0                // movaps        0x107f7(%rip),%xmm8        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  15,16,72,64                         // movups        0x40(%rax),%xmm1
   .byte  68,15,16,136,192,0,0,0              // movups        0xc0(%rax),%xmm9
   .byte  65,15,88,200                        // addps         %xmm8,%xmm1
-  .byte  68,15,40,21,240,13,1,0              // movaps        0x10df0(%rip),%xmm10        # 3bb80 <_sk_srcover_bgra_8888_sse2_lowp+0x12b4>
+  .byte  68,15,40,21,255,13,1,0              // movaps        0x10dff(%rip),%xmm10        # 3b3c0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
-  .byte  68,15,88,21,244,13,1,0              // addps         0x10df4(%rip),%xmm10        # 3bb90 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  .byte  68,15,88,21,3,14,1,0                // addps         0x10e03(%rip),%xmm10        # 3b3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
   .byte  69,15,88,208                        // addps         %xmm8,%xmm10
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
-  .byte  68,15,88,21,240,13,1,0              // addps         0x10df0(%rip),%xmm10        # 3bba0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
+  .byte  68,15,88,21,255,13,1,0              // addps         0x10dff(%rip),%xmm10        # 3b3e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e4>
   .byte  68,15,17,144,64,1,0,0               // movups        %xmm10,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -42145,11 +41785,11 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,72,64                         // movups        0x40(%rax),%xmm1
   .byte  68,15,16,128,192,0,0,0              // movups        0xc0(%rax),%xmm8
-  .byte  15,88,13,191,13,1,0                 // addps         0x10dbf(%rip),%xmm1        # 3bb90 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  .byte  15,88,13,206,13,1,0                 // addps         0x10dce(%rip),%xmm1        # 3b3d0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  69,15,89,201                        // mulps         %xmm9,%xmm9
-  .byte  68,15,89,5,143,13,1,0               // mulps         0x10d8f(%rip),%xmm8        # 3bb70 <_sk_srcover_bgra_8888_sse2_lowp+0x12a4>
-  .byte  68,15,88,5,135,9,1,0                // addps         0x10987(%rip),%xmm8        # 3b770 <_sk_srcover_bgra_8888_sse2_lowp+0xea4>
+  .byte  68,15,89,5,158,13,1,0               // mulps         0x10d9e(%rip),%xmm8        # 3b3b0 <_sk_srcover_bgra_8888_sse2_lowp+0x12b4>
+  .byte  68,15,88,5,150,9,1,0                // addps         0x10996(%rip),%xmm8        # 3afb0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
   .byte  68,15,17,128,64,1,0,0               // movups        %xmm8,0x140(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -42294,7 +41934,7 @@
   .byte  102,65,15,254,205                   // paddd         %xmm13,%xmm1
   .byte  102,68,15,127,108,36,208            // movdqa        %xmm13,-0x30(%rsp)
   .byte  102,15,254,217                      // paddd         %xmm1,%xmm3
-  .byte  102,68,15,111,5,214,11,1,0          // movdqa        0x10bd6(%rip),%xmm8        # 3bbc0 <_sk_srcover_bgra_8888_sse2_lowp+0x12f4>
+  .byte  102,68,15,111,5,229,11,1,0          // movdqa        0x10be5(%rip),%xmm8        # 3b400 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
   .byte  102,15,112,195,245                  // pshufd        $0xf5,%xmm3,%xmm0
   .byte  102,65,15,244,216                   // pmuludq       %xmm8,%xmm3
   .byte  102,65,15,244,192                   // pmuludq       %xmm8,%xmm0
@@ -42333,7 +41973,7 @@
   .byte  243,66,15,16,44,139                 // movss         (%rbx,%r9,4),%xmm5
   .byte  15,20,236                           // unpcklps      %xmm4,%xmm5
   .byte  102,15,20,221                       // unpcklpd      %xmm5,%xmm3
-  .byte  102,68,15,111,37,253,4,1,0          // movdqa        0x104fd(%rip),%xmm12        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,68,15,111,37,12,5,1,0           // movdqa        0x1050c(%rip),%xmm12        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,65,15,254,196                   // paddd         %xmm12,%xmm0
   .byte  102,15,112,224,78                   // pshufd        $0x4e,%xmm0,%xmm4
   .byte  102,73,15,126,224                   // movq          %xmm4,%r8
@@ -42349,7 +41989,7 @@
   .byte  243,66,15,16,36,139                 // movss         (%rbx,%r9,4),%xmm4
   .byte  15,20,224                           // unpcklps      %xmm0,%xmm4
   .byte  102,15,20,236                       // unpcklpd      %xmm4,%xmm5
-  .byte  15,40,37,194,10,1,0                 // movaps        0x10ac2(%rip),%xmm4        # 3bbb0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e4>
+  .byte  15,40,37,209,10,1,0                 // movaps        0x10ad1(%rip),%xmm4        # 3b3f0 <_sk_srcover_bgra_8888_sse2_lowp+0x12f4>
   .byte  68,15,88,220                        // addps         %xmm4,%xmm11
   .byte  68,15,41,92,36,192                  // movaps        %xmm11,-0x40(%rsp)
   .byte  68,15,40,223                        // movaps        %xmm7,%xmm11
@@ -42385,7 +42025,7 @@
   .byte  15,20,249                           // unpcklps      %xmm1,%xmm7
   .byte  102,15,20,252                       // unpcklpd      %xmm4,%xmm7
   .byte  102,15,111,202                      // movdqa        %xmm2,%xmm1
-  .byte  102,15,250,13,55,10,1,0             // psubd         0x10a37(%rip),%xmm1        # 3bbd0 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
+  .byte  102,15,250,13,70,10,1,0             // psubd         0x10a46(%rip),%xmm1        # 3b410 <_sk_srcover_bgra_8888_sse2_lowp+0x1314>
   .byte  102,15,112,225,78                   // pshufd        $0x4e,%xmm1,%xmm4
   .byte  102,73,15,126,224                   // movq          %xmm4,%r8
   .byte  102,72,15,126,200                   // movq          %xmm1,%rax
@@ -42475,7 +42115,7 @@
   .byte  243,15,16,44,131                    // movss         (%rbx,%rax,4),%xmm5
   .byte  15,20,233                           // unpcklps      %xmm1,%xmm5
   .byte  102,15,20,221                       // unpcklpd      %xmm5,%xmm3
-  .byte  102,68,15,111,45,111,2,1,0          // movdqa        0x1026f(%rip),%xmm13        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,68,15,111,45,126,2,1,0          // movdqa        0x1027e(%rip),%xmm13        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,65,15,254,197                   // paddd         %xmm13,%xmm0
   .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
   .byte  102,73,15,126,200                   // movq          %xmm1,%r8
@@ -42572,7 +42212,7 @@
   .byte  102,15,111,206                      // movdqa        %xmm6,%xmm1
   .byte  102,65,15,254,202                   // paddd         %xmm10,%xmm1
   .byte  102,15,112,209,245                  // pshufd        $0xf5,%xmm1,%xmm2
-  .byte  102,15,111,29,210,6,1,0             // movdqa        0x106d2(%rip),%xmm3        # 3bbc0 <_sk_srcover_bgra_8888_sse2_lowp+0x12f4>
+  .byte  102,15,111,29,225,6,1,0             // movdqa        0x106e1(%rip),%xmm3        # 3b400 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
   .byte  102,15,244,203                      // pmuludq       %xmm3,%xmm1
   .byte  102,15,244,211                      // pmuludq       %xmm3,%xmm2
   .byte  102,15,111,251                      // movdqa        %xmm3,%xmm7
@@ -42610,7 +42250,7 @@
   .byte  243,15,16,44,131                    // movss         (%rbx,%rax,4),%xmm5
   .byte  15,20,236                           // unpcklps      %xmm4,%xmm5
   .byte  102,15,20,213                       // unpcklpd      %xmm5,%xmm2
-  .byte  102,15,111,5,2,0,1,0                // movdqa        0x10002(%rip),%xmm0        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,15,111,5,17,0,1,0               // movdqa        0x10011(%rip),%xmm0        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,15,254,216                      // paddd         %xmm0,%xmm3
   .byte  102,15,112,227,78                   // pshufd        $0x4e,%xmm3,%xmm4
   .byte  102,73,15,126,224                   // movq          %xmm4,%r8
@@ -42691,7 +42331,7 @@
   .byte  102,15,111,214                      // movdqa        %xmm6,%xmm2
   .byte  102,65,15,254,212                   // paddd         %xmm12,%xmm2
   .byte  102,15,112,194,245                  // pshufd        $0xf5,%xmm2,%xmm0
-  .byte  102,15,111,13,175,4,1,0             // movdqa        0x104af(%rip),%xmm1        # 3bbc0 <_sk_srcover_bgra_8888_sse2_lowp+0x12f4>
+  .byte  102,15,111,13,190,4,1,0             // movdqa        0x104be(%rip),%xmm1        # 3b400 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
   .byte  102,15,244,209                      // pmuludq       %xmm1,%xmm2
   .byte  102,15,244,193                      // pmuludq       %xmm1,%xmm0
   .byte  102,15,111,241                      // movdqa        %xmm1,%xmm6
@@ -42713,7 +42353,7 @@
   .byte  68,15,20,209                        // unpcklps      %xmm1,%xmm10
   .byte  102,68,15,20,210                    // unpcklpd      %xmm2,%xmm10
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
-  .byte  102,15,250,13,84,4,1,0              // psubd         0x10454(%rip),%xmm1        # 3bbd0 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
+  .byte  102,15,250,13,99,4,1,0              // psubd         0x10463(%rip),%xmm1        # 3b410 <_sk_srcover_bgra_8888_sse2_lowp+0x1314>
   .byte  102,15,112,209,78                   // pshufd        $0x4e,%xmm1,%xmm2
   .byte  102,73,15,126,208                   // movq          %xmm2,%r8
   .byte  102,72,15,126,200                   // movq          %xmm1,%rax
@@ -42728,7 +42368,7 @@
   .byte  243,15,16,20,131                    // movss         (%rbx,%rax,4),%xmm2
   .byte  15,20,209                           // unpcklps      %xmm1,%xmm2
   .byte  102,15,20,226                       // unpcklpd      %xmm2,%xmm4
-  .byte  102,15,254,5,223,253,0,0            // paddd         0xfddf(%rip),%xmm0        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,15,254,5,238,253,0,0            // paddd         0xfdee(%rip),%xmm0        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
   .byte  102,73,15,126,200                   // movq          %xmm1,%r8
   .byte  102,72,15,126,192                   // movq          %xmm0,%rax
@@ -42765,7 +42405,7 @@
   .byte  15,20,199                           // unpcklps      %xmm7,%xmm0
   .byte  102,15,20,193                       // unpcklpd      %xmm1,%xmm0
   .byte  102,15,111,202                      // movdqa        %xmm2,%xmm1
-  .byte  102,15,250,13,94,3,1,0              // psubd         0x1035e(%rip),%xmm1        # 3bbd0 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
+  .byte  102,15,250,13,109,3,1,0             // psubd         0x1036d(%rip),%xmm1        # 3b410 <_sk_srcover_bgra_8888_sse2_lowp+0x1314>
   .byte  102,15,112,249,78                   // pshufd        $0x4e,%xmm1,%xmm7
   .byte  102,73,15,126,248                   // movq          %xmm7,%r8
   .byte  102,72,15,126,200                   // movq          %xmm1,%rax
@@ -42780,7 +42420,7 @@
   .byte  243,15,16,52,131                    // movss         (%rbx,%rax,4),%xmm6
   .byte  15,20,247                           // unpcklps      %xmm7,%xmm6
   .byte  102,15,20,206                       // unpcklpd      %xmm6,%xmm1
-  .byte  102,15,254,21,233,252,0,0           // paddd         0xfce9(%rip),%xmm2        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,15,254,21,248,252,0,0           // paddd         0xfcf8(%rip),%xmm2        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,15,112,242,78                   // pshufd        $0x4e,%xmm2,%xmm6
   .byte  102,73,15,126,240                   // movq          %xmm6,%r8
   .byte  102,72,15,126,208                   // movq          %xmm2,%rax
@@ -42926,7 +42566,7 @@
   .byte  102,65,15,254,210                   // paddd         %xmm10,%xmm2
   .byte  102,15,111,220                      // movdqa        %xmm4,%xmm3
   .byte  102,15,254,218                      // paddd         %xmm2,%xmm3
-  .byte  102,15,111,37,161,0,1,0             // movdqa        0x100a1(%rip),%xmm4        # 3bbc0 <_sk_srcover_bgra_8888_sse2_lowp+0x12f4>
+  .byte  102,15,111,37,176,0,1,0             // movdqa        0x100b0(%rip),%xmm4        # 3b400 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
   .byte  102,15,112,195,245                  // pshufd        $0xf5,%xmm3,%xmm0
   .byte  102,15,244,220                      // pmuludq       %xmm4,%xmm3
   .byte  102,15,244,196                      // pmuludq       %xmm4,%xmm0
@@ -42965,7 +42605,7 @@
   .byte  243,66,15,16,52,139                 // movss         (%rbx,%r9,4),%xmm6
   .byte  15,20,244                           // unpcklps      %xmm4,%xmm6
   .byte  102,15,20,238                       // unpcklpd      %xmm6,%xmm5
-  .byte  102,15,254,5,203,249,0,0            // paddd         0xf9cb(%rip),%xmm0        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,15,254,5,218,249,0,0            // paddd         0xf9da(%rip),%xmm0        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,15,112,224,78                   // pshufd        $0x4e,%xmm0,%xmm4
   .byte  102,73,15,126,224                   // movq          %xmm4,%r8
   .byte  102,73,15,126,193                   // movq          %xmm0,%r9
@@ -42980,7 +42620,7 @@
   .byte  243,66,15,16,52,139                 // movss         (%rbx,%r9,4),%xmm6
   .byte  15,20,244                           // unpcklps      %xmm4,%xmm6
   .byte  102,15,20,222                       // unpcklpd      %xmm6,%xmm3
-  .byte  15,40,53,149,255,0,0                // movaps        0xff95(%rip),%xmm6        # 3bbb0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e4>
+  .byte  15,40,53,164,255,0,0                // movaps        0xffa4(%rip),%xmm6        # 3b3f0 <_sk_srcover_bgra_8888_sse2_lowp+0x12f4>
   .byte  68,15,88,198                        // addps         %xmm6,%xmm8
   .byte  68,15,41,68,36,176                  // movaps        %xmm8,-0x50(%rsp)
   .byte  68,15,88,254                        // addps         %xmm6,%xmm15
@@ -42998,7 +42638,7 @@
   .byte  102,65,15,254,215                   // paddd         %xmm15,%xmm2
   .byte  102,68,15,127,124,36,224            // movdqa        %xmm15,-0x20(%rsp)
   .byte  102,15,112,194,245                  // pshufd        $0xf5,%xmm2,%xmm0
-  .byte  102,15,111,13,75,255,0,0            // movdqa        0xff4b(%rip),%xmm1        # 3bbc0 <_sk_srcover_bgra_8888_sse2_lowp+0x12f4>
+  .byte  102,15,111,13,90,255,0,0            // movdqa        0xff5a(%rip),%xmm1        # 3b400 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
   .byte  102,15,244,209                      // pmuludq       %xmm1,%xmm2
   .byte  102,15,244,193                      // pmuludq       %xmm1,%xmm0
   .byte  102,15,112,192,232                  // pshufd        $0xe8,%xmm0,%xmm0
@@ -43019,7 +42659,7 @@
   .byte  15,20,240                           // unpcklps      %xmm0,%xmm6
   .byte  102,15,20,242                       // unpcklpd      %xmm2,%xmm6
   .byte  102,15,111,193                      // movdqa        %xmm1,%xmm0
-  .byte  102,15,250,5,246,254,0,0            // psubd         0xfef6(%rip),%xmm0        # 3bbd0 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
+  .byte  102,15,250,5,5,255,0,0              // psubd         0xff05(%rip),%xmm0        # 3b410 <_sk_srcover_bgra_8888_sse2_lowp+0x1314>
   .byte  102,15,112,208,78                   // pshufd        $0x4e,%xmm0,%xmm2
   .byte  102,73,15,126,208                   // movq          %xmm2,%r8
   .byte  102,72,15,126,192                   // movq          %xmm0,%rax
@@ -43034,7 +42674,7 @@
   .byte  243,68,15,16,28,131                 // movss         (%rbx,%rax,4),%xmm11
   .byte  68,15,20,216                        // unpcklps      %xmm0,%xmm11
   .byte  102,65,15,20,211                    // unpcklpd      %xmm11,%xmm2
-  .byte  102,15,254,13,126,248,0,0           // paddd         0xf87e(%rip),%xmm1        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,15,254,13,141,248,0,0           // paddd         0xf88d(%rip),%xmm1        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,15,112,193,78                   // pshufd        $0x4e,%xmm1,%xmm0
   .byte  102,73,15,126,192                   // movq          %xmm0,%r8
   .byte  102,72,15,126,200                   // movq          %xmm1,%rax
@@ -43072,7 +42712,7 @@
   .byte  102,65,15,111,194                   // movdqa        %xmm10,%xmm0
   .byte  102,15,254,68,36,160                // paddd         -0x60(%rsp),%xmm0
   .byte  102,15,112,216,245                  // pshufd        $0xf5,%xmm0,%xmm3
-  .byte  102,15,111,37,245,253,0,0           // movdqa        0xfdf5(%rip),%xmm4        # 3bbc0 <_sk_srcover_bgra_8888_sse2_lowp+0x12f4>
+  .byte  102,15,111,37,4,254,0,0             // movdqa        0xfe04(%rip),%xmm4        # 3b400 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
   .byte  102,15,244,196                      // pmuludq       %xmm4,%xmm0
   .byte  102,15,244,220                      // pmuludq       %xmm4,%xmm3
   .byte  102,68,15,111,220                   // movdqa        %xmm4,%xmm11
@@ -43110,7 +42750,7 @@
   .byte  243,15,16,60,131                    // movss         (%rbx,%rax,4),%xmm7
   .byte  15,20,253                           // unpcklps      %xmm5,%xmm7
   .byte  102,15,20,199                       // unpcklpd      %xmm7,%xmm0
-  .byte  102,68,15,111,5,33,247,0,0          // movdqa        0xf721(%rip),%xmm8        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,68,15,111,5,48,247,0,0          // movdqa        0xf730(%rip),%xmm8        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,65,15,254,224                   // paddd         %xmm8,%xmm4
   .byte  102,15,112,236,78                   // pshufd        $0x4e,%xmm4,%xmm5
   .byte  102,73,15,126,232                   // movq          %xmm5,%r8
@@ -43256,7 +42896,7 @@
   .byte  243,15,16,36,131                    // movss         (%rbx,%rax,4),%xmm4
   .byte  15,20,226                           // unpcklps      %xmm2,%xmm4
   .byte  102,15,20,252                       // unpcklpd      %xmm4,%xmm7
-  .byte  102,68,15,111,61,123,244,0,0        // movdqa        0xf47b(%rip),%xmm15        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,68,15,111,61,138,244,0,0        // movdqa        0xf48a(%rip),%xmm15        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,65,15,254,207                   // paddd         %xmm15,%xmm1
   .byte  102,15,112,209,78                   // pshufd        $0x4e,%xmm1,%xmm2
   .byte  102,73,15,126,208                   // movq          %xmm2,%r8
@@ -43339,7 +42979,7 @@
   .byte  102,65,15,111,217                   // movdqa        %xmm9,%xmm3
   .byte  102,65,15,254,216                   // paddd         %xmm8,%xmm3
   .byte  102,15,112,211,245                  // pshufd        $0xf5,%xmm3,%xmm2
-  .byte  102,15,111,45,42,249,0,0            // movdqa        0xf92a(%rip),%xmm5        # 3bbc0 <_sk_srcover_bgra_8888_sse2_lowp+0x12f4>
+  .byte  102,15,111,45,57,249,0,0            // movdqa        0xf939(%rip),%xmm5        # 3b400 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
   .byte  102,15,244,221                      // pmuludq       %xmm5,%xmm3
   .byte  102,15,244,213                      // pmuludq       %xmm5,%xmm2
   .byte  102,15,112,234,232                  // pshufd        $0xe8,%xmm2,%xmm5
@@ -43360,7 +43000,7 @@
   .byte  68,15,20,198                        // unpcklps      %xmm6,%xmm8
   .byte  102,68,15,20,197                    // unpcklpd      %xmm5,%xmm8
   .byte  102,15,111,234                      // movdqa        %xmm2,%xmm5
-  .byte  102,15,250,45,211,248,0,0           // psubd         0xf8d3(%rip),%xmm5        # 3bbd0 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
+  .byte  102,15,250,45,226,248,0,0           // psubd         0xf8e2(%rip),%xmm5        # 3b410 <_sk_srcover_bgra_8888_sse2_lowp+0x1314>
   .byte  102,15,112,245,78                   // pshufd        $0x4e,%xmm5,%xmm6
   .byte  102,73,15,126,240                   // movq          %xmm6,%r8
   .byte  102,72,15,126,232                   // movq          %xmm5,%rax
@@ -43392,7 +43032,7 @@
   .byte  102,15,20,214                       // unpcklpd      %xmm6,%xmm2
   .byte  102,69,15,254,205                   // paddd         %xmm13,%xmm9
   .byte  102,65,15,112,233,245               // pshufd        $0xf5,%xmm9,%xmm5
-  .byte  102,15,111,29,49,248,0,0            // movdqa        0xf831(%rip),%xmm3        # 3bbc0 <_sk_srcover_bgra_8888_sse2_lowp+0x12f4>
+  .byte  102,15,111,29,64,248,0,0            // movdqa        0xf840(%rip),%xmm3        # 3b400 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
   .byte  102,68,15,244,203                   // pmuludq       %xmm3,%xmm9
   .byte  102,15,244,235                      // pmuludq       %xmm3,%xmm5
   .byte  102,15,112,237,232                  // pshufd        $0xe8,%xmm5,%xmm5
@@ -43413,7 +43053,7 @@
   .byte  69,15,20,233                        // unpcklps      %xmm9,%xmm13
   .byte  102,68,15,20,237                    // unpcklpd      %xmm5,%xmm13
   .byte  102,65,15,111,239                   // movdqa        %xmm15,%xmm5
-  .byte  102,15,250,45,209,247,0,0           // psubd         0xf7d1(%rip),%xmm5        # 3bbd0 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
+  .byte  102,15,250,45,224,247,0,0           // psubd         0xf7e0(%rip),%xmm5        # 3b410 <_sk_srcover_bgra_8888_sse2_lowp+0x1314>
   .byte  102,15,112,221,78                   // pshufd        $0x4e,%xmm5,%xmm3
   .byte  102,73,15,126,216                   // movq          %xmm3,%r8
   .byte  102,72,15,126,232                   // movq          %xmm5,%rax
@@ -43428,7 +43068,7 @@
   .byte  243,15,16,44,131                    // movss         (%rbx,%rax,4),%xmm5
   .byte  15,20,235                           // unpcklps      %xmm3,%xmm5
   .byte  102,15,20,245                       // unpcklpd      %xmm5,%xmm6
-  .byte  102,68,15,111,13,91,241,0,0         // movdqa        0xf15b(%rip),%xmm9        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,68,15,111,13,106,241,0,0        // movdqa        0xf16a(%rip),%xmm9        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,69,15,254,249                   // paddd         %xmm9,%xmm15
   .byte  102,65,15,112,223,78                // pshufd        $0x4e,%xmm15,%xmm3
   .byte  102,73,15,126,216                   // movq          %xmm3,%r8
@@ -43490,7 +43130,7 @@
   .byte  102,65,15,111,195                   // movdqa        %xmm11,%xmm0
   .byte  102,15,254,195                      // paddd         %xmm3,%xmm0
   .byte  102,15,112,200,245                  // pshufd        $0xf5,%xmm0,%xmm1
-  .byte  102,15,111,21,108,246,0,0           // movdqa        0xf66c(%rip),%xmm2        # 3bbc0 <_sk_srcover_bgra_8888_sse2_lowp+0x12f4>
+  .byte  102,15,111,21,123,246,0,0           // movdqa        0xf67b(%rip),%xmm2        # 3b400 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
   .byte  102,15,244,194                      // pmuludq       %xmm2,%xmm0
   .byte  102,15,244,202                      // pmuludq       %xmm2,%xmm1
   .byte  102,68,15,111,234                   // movdqa        %xmm2,%xmm13
@@ -43683,7 +43323,7 @@
   .byte  68,15,20,238                        // unpcklps      %xmm6,%xmm13
   .byte  102,68,15,20,234                    // unpcklpd      %xmm2,%xmm13
   .byte  102,15,111,212                      // movdqa        %xmm4,%xmm2
-  .byte  102,15,250,21,8,243,0,0             // psubd         0xf308(%rip),%xmm2        # 3bbd0 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
+  .byte  102,15,250,21,23,243,0,0            // psubd         0xf317(%rip),%xmm2        # 3b410 <_sk_srcover_bgra_8888_sse2_lowp+0x1314>
   .byte  102,15,112,242,78                   // pshufd        $0x4e,%xmm2,%xmm6
   .byte  102,73,15,126,240                   // movq          %xmm6,%r8
   .byte  102,72,15,126,208                   // movq          %xmm2,%rax
@@ -43743,7 +43383,7 @@
   .byte  102,68,15,111,116,36,160            // movdqa        -0x60(%rsp),%xmm14
   .byte  102,65,15,254,198                   // paddd         %xmm14,%xmm0
   .byte  102,15,112,200,245                  // pshufd        $0xf5,%xmm0,%xmm1
-  .byte  102,68,15,111,5,231,241,0,0         // movdqa        0xf1e7(%rip),%xmm8        # 3bbc0 <_sk_srcover_bgra_8888_sse2_lowp+0x12f4>
+  .byte  102,68,15,111,5,246,241,0,0         // movdqa        0xf1f6(%rip),%xmm8        # 3b400 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
   .byte  102,65,15,244,192                   // pmuludq       %xmm8,%xmm0
   .byte  102,65,15,244,200                   // pmuludq       %xmm8,%xmm1
   .byte  102,65,15,111,240                   // movdqa        %xmm8,%xmm6
@@ -43781,7 +43421,7 @@
   .byte  243,15,16,44,131                    // movss         (%rbx,%rax,4),%xmm5
   .byte  15,20,235                           // unpcklps      %xmm3,%xmm5
   .byte  102,15,20,205                       // unpcklpd      %xmm5,%xmm1
-  .byte  102,68,15,111,5,21,235,0,0          // movdqa        0xeb15(%rip),%xmm8        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,68,15,111,5,36,235,0,0          // movdqa        0xeb24(%rip),%xmm8        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,65,15,254,208                   // paddd         %xmm8,%xmm2
   .byte  102,15,112,218,78                   // pshufd        $0x4e,%xmm2,%xmm3
   .byte  102,73,15,126,216                   // movq          %xmm3,%r8
@@ -43864,7 +43504,7 @@
   .byte  102,15,254,208                      // paddd         %xmm0,%xmm2
   .byte  102,15,111,240                      // movdqa        %xmm0,%xmm6
   .byte  102,15,112,194,245                  // pshufd        $0xf5,%xmm2,%xmm0
-  .byte  102,15,111,37,193,239,0,0           // movdqa        0xefc1(%rip),%xmm4        # 3bbc0 <_sk_srcover_bgra_8888_sse2_lowp+0x12f4>
+  .byte  102,15,111,37,208,239,0,0           // movdqa        0xefd0(%rip),%xmm4        # 3b400 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
   .byte  102,15,244,212                      // pmuludq       %xmm4,%xmm2
   .byte  102,15,244,196                      // pmuludq       %xmm4,%xmm0
   .byte  102,15,112,200,232                  // pshufd        $0xe8,%xmm0,%xmm1
@@ -43885,7 +43525,7 @@
   .byte  68,15,20,193                        // unpcklps      %xmm1,%xmm8
   .byte  102,68,15,20,194                    // unpcklpd      %xmm2,%xmm8
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
-  .byte  102,15,250,13,106,239,0,0           // psubd         0xef6a(%rip),%xmm1        # 3bbd0 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
+  .byte  102,15,250,13,121,239,0,0           // psubd         0xef79(%rip),%xmm1        # 3b410 <_sk_srcover_bgra_8888_sse2_lowp+0x1314>
   .byte  102,15,112,209,78                   // pshufd        $0x4e,%xmm1,%xmm2
   .byte  102,73,15,126,208                   // movq          %xmm2,%r8
   .byte  102,72,15,126,200                   // movq          %xmm1,%rax
@@ -43900,7 +43540,7 @@
   .byte  243,15,16,20,131                    // movss         (%rbx,%rax,4),%xmm2
   .byte  15,20,209                           // unpcklps      %xmm1,%xmm2
   .byte  102,68,15,20,242                    // unpcklpd      %xmm2,%xmm14
-  .byte  102,15,254,5,243,232,0,0            // paddd         0xe8f3(%rip),%xmm0        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,15,254,5,2,233,0,0              // paddd         0xe902(%rip),%xmm0        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
   .byte  102,73,15,126,200                   // movq          %xmm1,%r8
   .byte  102,72,15,126,192                   // movq          %xmm0,%rax
@@ -43938,7 +43578,7 @@
   .byte  15,20,198                           // unpcklps      %xmm6,%xmm0
   .byte  102,15,20,193                       // unpcklpd      %xmm1,%xmm0
   .byte  102,15,111,202                      // movdqa        %xmm2,%xmm1
-  .byte  102,15,250,13,114,238,0,0           // psubd         0xee72(%rip),%xmm1        # 3bbd0 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
+  .byte  102,15,250,13,129,238,0,0           // psubd         0xee81(%rip),%xmm1        # 3b410 <_sk_srcover_bgra_8888_sse2_lowp+0x1314>
   .byte  102,15,112,241,78                   // pshufd        $0x4e,%xmm1,%xmm6
   .byte  102,73,15,126,240                   // movq          %xmm6,%r8
   .byte  102,72,15,126,200                   // movq          %xmm1,%rax
@@ -43953,7 +43593,7 @@
   .byte  243,15,16,36,131                    // movss         (%rbx,%rax,4),%xmm4
   .byte  15,20,230                           // unpcklps      %xmm6,%xmm4
   .byte  102,15,20,204                       // unpcklpd      %xmm4,%xmm1
-  .byte  102,15,254,21,253,231,0,0           // paddd         0xe7fd(%rip),%xmm2        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  .byte  102,15,254,21,12,232,0,0            // paddd         0xe80c(%rip),%xmm2        # 3ade0 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
   .byte  102,15,112,226,78                   // pshufd        $0x4e,%xmm2,%xmm4
   .byte  102,73,15,126,224                   // movq          %xmm4,%r8
   .byte  102,72,15,126,208                   // movq          %xmm2,%rax
@@ -44012,7 +43652,7 @@
   .byte  15,89,212                           // mulps         %xmm4,%xmm2
   .byte  65,15,88,215                        // addps         %xmm15,%xmm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,233,230,0,0                // movaps        0xe6e9(%rip),%xmm3        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,29,248,230,0,0                // movaps        0xe6f8(%rip),%xmm3        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,40,100,36,96                     // movaps        0x60(%rsp),%xmm4
   .byte  15,40,108,36,112                    // movaps        0x70(%rsp),%xmm5
   .byte  15,40,180,36,128,0,0,0              // movaps        0x80(%rsp),%xmm6
@@ -44025,15 +43665,15 @@
 .globl _sk_gauss_a_to_rgba_sse2
 FUNCTION(_sk_gauss_a_to_rgba_sse2)
 _sk_gauss_a_to_rgba_sse2:
-  .byte  15,40,5,46,237,0,0                  // movaps        0xed2e(%rip),%xmm0        # 3bbe0 <_sk_srcover_bgra_8888_sse2_lowp+0x1314>
+  .byte  15,40,5,61,237,0,0                  // movaps        0xed3d(%rip),%xmm0        # 3b420 <_sk_srcover_bgra_8888_sse2_lowp+0x1324>
   .byte  15,89,195                           // mulps         %xmm3,%xmm0
-  .byte  15,88,5,52,237,0,0                  // addps         0xed34(%rip),%xmm0        # 3bbf0 <_sk_srcover_bgra_8888_sse2_lowp+0x1324>
+  .byte  15,88,5,67,237,0,0                  // addps         0xed43(%rip),%xmm0        # 3b430 <_sk_srcover_bgra_8888_sse2_lowp+0x1334>
   .byte  15,89,195                           // mulps         %xmm3,%xmm0
-  .byte  15,88,5,58,237,0,0                  // addps         0xed3a(%rip),%xmm0        # 3bc00 <_sk_srcover_bgra_8888_sse2_lowp+0x1334>
+  .byte  15,88,5,73,237,0,0                  // addps         0xed49(%rip),%xmm0        # 3b440 <_sk_srcover_bgra_8888_sse2_lowp+0x1344>
   .byte  15,89,195                           // mulps         %xmm3,%xmm0
-  .byte  15,88,5,64,237,0,0                  // addps         0xed40(%rip),%xmm0        # 3bc10 <_sk_srcover_bgra_8888_sse2_lowp+0x1344>
+  .byte  15,88,5,79,237,0,0                  // addps         0xed4f(%rip),%xmm0        # 3b450 <_sk_srcover_bgra_8888_sse2_lowp+0x1354>
   .byte  15,89,195                           // mulps         %xmm3,%xmm0
-  .byte  15,88,5,70,237,0,0                  // addps         0xed46(%rip),%xmm0        # 3bc20 <_sk_srcover_bgra_8888_sse2_lowp+0x1354>
+  .byte  15,88,5,85,237,0,0                  // addps         0xed55(%rip),%xmm0        # 3b460 <_sk_srcover_bgra_8888_sse2_lowp+0x1364>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
@@ -44050,7 +43690,7 @@
   .byte  15,41,108,36,144                    // movaps        %xmm5,-0x70(%rsp)
   .byte  15,41,100,36,128                    // movaps        %xmm4,-0x80(%rsp)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,37,88,230,0,0                 // movaps        0xe658(%rip),%xmm4        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  15,40,37,103,230,0,0                // movaps        0xe667(%rip),%xmm4        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  15,41,68,36,64                      // movaps        %xmm0,0x40(%rsp)
   .byte  15,40,232                           // movaps        %xmm0,%xmm5
   .byte  15,88,236                           // addps         %xmm4,%xmm5
@@ -44058,7 +43698,7 @@
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
   .byte  15,40,213                           // movaps        %xmm5,%xmm2
   .byte  15,194,208,1                        // cmpltps       %xmm0,%xmm2
-  .byte  15,40,53,72,230,0,0                 // movaps        0xe648(%rip),%xmm6        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,53,87,230,0,0                 // movaps        0xe657(%rip),%xmm6        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,84,214                           // andps         %xmm6,%xmm2
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
   .byte  15,92,194                           // subps         %xmm2,%xmm0
@@ -44091,9 +43731,9 @@
   .byte  102,15,110,72,8                     // movd          0x8(%rax),%xmm1
   .byte  102,15,112,193,0                    // pshufd        $0x0,%xmm1,%xmm0
   .byte  102,15,127,68,36,208                // movdqa        %xmm0,-0x30(%rsp)
-  .byte  243,15,16,5,15,221,0,0              // movss         0xdd0f(%rip),%xmm0        # 3acc0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
-  .byte  102,15,111,45,103,230,0,0           // movdqa        0xe667(%rip),%xmm5        # 3b620 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
-  .byte  15,40,37,192,231,0,0                // movaps        0xe7c0(%rip),%xmm4        # 3b780 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  .byte  243,15,16,5,14,221,0,0              // movss         0xdd0e(%rip),%xmm0        # 3a4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  .byte  102,15,111,45,118,230,0,0           // movdqa        0xe676(%rip),%xmm5        # 3ae60 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
+  .byte  15,40,37,207,231,0,0                // movaps        0xe7cf(%rip),%xmm4        # 3afc0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
@@ -44104,9 +43744,9 @@
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  15,95,206                           // maxps         %xmm6,%xmm1
   .byte  15,41,124,36,16                     // movaps        %xmm7,0x10(%rsp)
-  .byte  15,46,61,16,221,0,0                 // ucomiss       0xdd10(%rip),%xmm7        # 3acfc <_sk_srcover_bgra_8888_sse2_lowp+0x430>
+  .byte  15,46,61,15,221,0,0                 // ucomiss       0xdd0f(%rip),%xmm7        # 3a52c <_sk_srcover_bgra_8888_sse2_lowp+0x430>
   .byte  68,15,40,124,36,240                 // movaps        -0x10(%rsp),%xmm15
-  .byte  119,6                               // ja            2cffa <_sk_bilerp_clamp_8888_sse2+0x113>
+  .byte  119,6                               // ja            2c82b <_sk_bilerp_clamp_8888_sse2+0x113>
   .byte  68,15,40,124,36,192                 // movaps        -0x40(%rsp),%xmm15
   .byte  15,93,76,36,224                     // minps         -0x20(%rsp),%xmm1
   .byte  243,15,91,201                       // cvttps2dq     %xmm1,%xmm1
@@ -44119,7 +43759,7 @@
   .byte  102,15,244,241                      // pmuludq       %xmm1,%xmm6
   .byte  102,15,112,206,232                  // pshufd        $0xe8,%xmm6,%xmm1
   .byte  102,68,15,98,225                    // punpckldq     %xmm1,%xmm12
-  .byte  243,15,16,13,137,220,0,0            // movss         0xdc89(%rip),%xmm1        # 3acc0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  .byte  243,15,16,13,136,220,0,0            // movss         0xdc88(%rip),%xmm1        # 3a4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   .byte  15,40,241                           // movaps        %xmm1,%xmm6
   .byte  15,198,246,0                        // shufps        $0x0,%xmm6,%xmm6
   .byte  15,88,116,36,64                     // addps         0x40(%rsp),%xmm6
@@ -44159,9 +43799,9 @@
   .byte  102,15,114,208,24                   // psrld         $0x18,%xmm0
   .byte  68,15,91,208                        // cvtdq2ps      %xmm0,%xmm10
   .byte  68,15,89,212                        // mulps         %xmm4,%xmm10
-  .byte  15,46,13,27,220,0,0                 // ucomiss       0xdc1b(%rip),%xmm1        # 3acfc <_sk_srcover_bgra_8888_sse2_lowp+0x430>
+  .byte  15,46,13,26,220,0,0                 // ucomiss       0xdc1a(%rip),%xmm1        # 3a52c <_sk_srcover_bgra_8888_sse2_lowp+0x430>
   .byte  68,15,40,92,36,48                   // movaps        0x30(%rsp),%xmm11
-  .byte  119,6                               // ja            2d0ef <_sk_bilerp_clamp_8888_sse2+0x208>
+  .byte  119,6                               // ja            2c920 <_sk_bilerp_clamp_8888_sse2+0x208>
   .byte  68,15,40,92,36,32                   // movaps        0x20(%rsp),%xmm11
   .byte  69,15,89,223                        // mulps         %xmm15,%xmm11
   .byte  69,15,89,235                        // mulps         %xmm11,%xmm13
@@ -44172,15 +43812,15 @@
   .byte  15,88,215                           // addps         %xmm7,%xmm2
   .byte  69,15,89,218                        // mulps         %xmm10,%xmm11
   .byte  65,15,88,219                        // addps         %xmm11,%xmm3
-  .byte  243,15,88,13,98,218,0,0             // addss         0xda62(%rip),%xmm1        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
-  .byte  243,15,16,5,86,218,0,0              // movss         0xda56(%rip),%xmm0        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  243,15,88,13,97,218,0,0             // addss         0xda61(%rip),%xmm1        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  243,15,16,5,85,218,0,0              // movss         0xda55(%rip),%xmm0        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  15,46,193                           // ucomiss       %xmm1,%xmm0
-  .byte  15,131,12,255,255,255               // jae           2d037 <_sk_bilerp_clamp_8888_sse2+0x150>
+  .byte  15,131,12,255,255,255               // jae           2c868 <_sk_bilerp_clamp_8888_sse2+0x150>
   .byte  15,40,124,36,16                     // movaps        0x10(%rsp),%xmm7
-  .byte  243,15,88,61,68,218,0,0             // addss         0xda44(%rip),%xmm7        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
-  .byte  243,15,16,5,56,218,0,0              // movss         0xda38(%rip),%xmm0        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  243,15,88,61,67,218,0,0             // addss         0xda43(%rip),%xmm7        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  243,15,16,5,55,218,0,0              // movss         0xda37(%rip),%xmm0        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  15,46,199                           // ucomiss       %xmm7,%xmm0
-  .byte  15,131,133,254,255,255              // jae           2cfce <_sk_bilerp_clamp_8888_sse2+0xe7>
+  .byte  15,131,133,254,255,255              // jae           2c7ff <_sk_bilerp_clamp_8888_sse2+0xe7>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
   .byte  65,15,40,200                        // movaps        %xmm8,%xmm1
@@ -44192,7 +43832,6 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  144                                 // nop
   .byte  144                                 // nop
-  .byte  144                                 // nop
 
 HIDDEN _sk_start_pipeline_hsw_lowp
 .globl _sk_start_pipeline_hsw_lowp
@@ -44215,13 +43854,13 @@
   .byte  73,137,246                          // mov           %rsi,%r14
   .byte  72,137,77,192                       // mov           %rcx,-0x40(%rbp)
   .byte  72,57,203                           // cmp           %rcx,%rbx
-  .byte  15,131,151,0,0,0                    // jae           2d23a <_sk_start_pipeline_hsw_lowp+0xca>
+  .byte  15,131,151,0,0,0                    // jae           2ca6a <_sk_start_pipeline_hsw_lowp+0xca>
   .byte  72,139,69,208                       // mov           -0x30(%rbp),%rax
   .byte  72,141,64,16                        // lea           0x10(%rax),%rax
   .byte  72,137,69,200                       // mov           %rax,-0x38(%rbp)
   .byte  72,139,85,208                       // mov           -0x30(%rbp),%rdx
   .byte  76,57,125,200                       // cmp           %r15,-0x38(%rbp)
-  .byte  119,67                              // ja            2d1fc <_sk_start_pipeline_hsw_lowp+0x8c>
+  .byte  119,67                              // ja            2ca2c <_sk_start_pipeline_hsw_lowp+0x8c>
   .byte  76,139,101,208                      // mov           -0x30(%rbp),%r12
   .byte  49,255                              // xor           %edi,%edi
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
@@ -44240,10 +43879,10 @@
   .byte  73,131,196,32                       // add           $0x20,%r12
   .byte  77,57,252                           // cmp           %r15,%r12
   .byte  73,137,212                          // mov           %rdx,%r12
-  .byte  118,193                             // jbe           2d1bd <_sk_start_pipeline_hsw_lowp+0x4d>
+  .byte  118,193                             // jbe           2c9ed <_sk_start_pipeline_hsw_lowp+0x4d>
   .byte  76,137,255                          // mov           %r15,%rdi
   .byte  72,41,215                           // sub           %rdx,%rdi
-  .byte  116,41                              // je            2d22d <_sk_start_pipeline_hsw_lowp+0xbd>
+  .byte  116,41                              // je            2ca5d <_sk_start_pipeline_hsw_lowp+0xbd>
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  197,236,87,210                      // vxorps        %ymm2,%ymm2,%ymm2
@@ -44257,7 +43896,7 @@
   .byte  65,255,213                          // callq         *%r13
   .byte  72,255,195                          // inc           %rbx
   .byte  72,59,93,192                        // cmp           -0x40(%rbp),%rbx
-  .byte  15,133,117,255,255,255              // jne           2d1af <_sk_start_pipeline_hsw_lowp+0x3f>
+  .byte  15,133,117,255,255,255              // jne           2c9df <_sk_start_pipeline_hsw_lowp+0x3f>
   .byte  72,131,196,24                       // add           $0x18,%rsp
   .byte  91                                  // pop           %rbx
   .byte  65,92                               // pop           %r12
@@ -44287,7 +43926,7 @@
   .byte  197,249,110,209                     // vmovd         %ecx,%xmm2
   .byte  196,226,125,88,210                  // vpbroadcastd  %xmm2,%ymm2
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
-  .byte  196,226,125,24,29,253,216,0,0       // vbroadcastss  0xd8fd(%rip),%ymm3        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,226,125,24,29,253,216,0,0       // vbroadcastss  0xd8fd(%rip),%ymm3        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,236,88,211                      // vaddps        %ymm3,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,40,218                      // vmovaps       %ymm2,%ymm3
@@ -44403,7 +44042,7 @@
 FUNCTION(_sk_black_color_hsw_lowp)
 _sk_black_color_hsw_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,121,29,160,222,0,0      // vpbroadcastw  0xdea0(%rip),%ymm3        # 3b2a0 <_sk_srcover_bgra_8888_sse2_lowp+0x9d4>
+  .byte  196,226,125,121,29,176,222,0,0      // vpbroadcastw  0xdeb0(%rip),%ymm3        # 3aae0 <_sk_srcover_bgra_8888_sse2_lowp+0x9e4>
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  197,236,87,210                      // vxorps        %ymm2,%ymm2,%ymm2
@@ -44414,7 +44053,7 @@
 FUNCTION(_sk_white_color_hsw_lowp)
 _sk_white_color_hsw_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,121,5,137,222,0,0       // vpbroadcastw  0xde89(%rip),%ymm0        # 3b2a2 <_sk_srcover_bgra_8888_sse2_lowp+0x9d6>
+  .byte  196,226,125,121,5,153,222,0,0       // vpbroadcastw  0xde99(%rip),%ymm0        # 3aae2 <_sk_srcover_bgra_8888_sse2_lowp+0x9e6>
   .byte  197,253,111,200                     // vmovdqa       %ymm0,%ymm1
   .byte  197,253,111,208                     // vmovdqa       %ymm0,%ymm2
   .byte  197,253,111,216                     // vmovdqa       %ymm0,%ymm3
@@ -44425,8 +44064,8 @@
 FUNCTION(_sk_set_rgb_hsw_lowp)
 _sk_set_rgb_hsw_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  197,122,16,5,71,215,0,0             // vmovss        0xd747(%rip),%xmm8        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
-  .byte  197,250,16,21,111,215,0,0           // vmovss        0xd76f(%rip),%xmm2        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  197,122,16,5,71,215,0,0             // vmovss        0xd747(%rip),%xmm8        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  197,250,16,21,111,215,0,0           // vmovss        0xd76f(%rip),%xmm2        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   .byte  197,250,16,0                        // vmovss        (%rax),%xmm0
   .byte  196,226,57,153,194                  // vfmadd132ss   %xmm2,%xmm8,%xmm0
   .byte  197,122,44,192                      // vcvttss2si    %xmm0,%r8d
@@ -44469,7 +44108,7 @@
 FUNCTION(_sk_premul_hsw_lowp)
 _sk_premul_hsw_lowp:
   .byte  197,229,213,192                     // vpmullw       %ymm0,%ymm3,%ymm0
-  .byte  196,98,125,121,5,242,221,0,0        // vpbroadcastw  0xddf2(%rip),%ymm8        # 3b2a4 <_sk_srcover_bgra_8888_sse2_lowp+0x9d8>
+  .byte  196,98,125,121,5,2,222,0,0          // vpbroadcastw  0xde02(%rip),%ymm8        # 3aae4 <_sk_srcover_bgra_8888_sse2_lowp+0x9e8>
   .byte  196,193,125,253,192                 // vpaddw        %ymm8,%ymm0,%ymm0
   .byte  197,253,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm0
   .byte  197,229,213,201                     // vpmullw       %ymm1,%ymm3,%ymm1
@@ -44486,7 +44125,7 @@
 FUNCTION(_sk_premul_dst_hsw_lowp)
 _sk_premul_dst_hsw_lowp:
   .byte  197,197,213,228                     // vpmullw       %ymm4,%ymm7,%ymm4
-  .byte  196,98,125,121,5,189,221,0,0        // vpbroadcastw  0xddbd(%rip),%ymm8        # 3b2a6 <_sk_srcover_bgra_8888_sse2_lowp+0x9da>
+  .byte  196,98,125,121,5,205,221,0,0        // vpbroadcastw  0xddcd(%rip),%ymm8        # 3aae6 <_sk_srcover_bgra_8888_sse2_lowp+0x9ea>
   .byte  196,193,93,253,224                  // vpaddw        %ymm8,%ymm4,%ymm4
   .byte  197,221,113,212,8                   // vpsrlw        $0x8,%ymm4,%ymm4
   .byte  197,197,213,237                     // vpmullw       %ymm5,%ymm7,%ymm5
@@ -44534,7 +44173,7 @@
 .globl _sk_invert_hsw_lowp
 FUNCTION(_sk_invert_hsw_lowp)
 _sk_invert_hsw_lowp:
-  .byte  196,98,125,121,5,84,221,0,0         // vpbroadcastw  0xdd54(%rip),%ymm8        # 3b2a8 <_sk_srcover_bgra_8888_sse2_lowp+0x9dc>
+  .byte  196,98,125,121,5,100,221,0,0        // vpbroadcastw  0xdd64(%rip),%ymm8        # 3aae8 <_sk_srcover_bgra_8888_sse2_lowp+0x9ec>
   .byte  197,189,249,192                     // vpsubw        %ymm0,%ymm8,%ymm0
   .byte  197,189,249,201                     // vpsubw        %ymm1,%ymm8,%ymm1
   .byte  197,189,249,210                     // vpsubw        %ymm2,%ymm8,%ymm2
@@ -44558,7 +44197,7 @@
 FUNCTION(_sk_srcatop_hsw_lowp)
 _sk_srcatop_hsw_lowp:
   .byte  197,197,213,192                     // vpmullw       %ymm0,%ymm7,%ymm0
-  .byte  196,98,125,121,5,33,221,0,0         // vpbroadcastw  0xdd21(%rip),%ymm8        # 3b2aa <_sk_srcover_bgra_8888_sse2_lowp+0x9de>
+  .byte  196,98,125,121,5,49,221,0,0         // vpbroadcastw  0xdd31(%rip),%ymm8        # 3aaea <_sk_srcover_bgra_8888_sse2_lowp+0x9ee>
   .byte  197,189,249,219                     // vpsubw        %ymm3,%ymm8,%ymm3
   .byte  197,101,213,204                     // vpmullw       %ymm4,%ymm3,%ymm9
   .byte  196,193,125,253,192                 // vpaddw        %ymm8,%ymm0,%ymm0
@@ -44585,7 +44224,7 @@
 FUNCTION(_sk_dstatop_hsw_lowp)
 _sk_dstatop_hsw_lowp:
   .byte  197,93,213,195                      // vpmullw       %ymm3,%ymm4,%ymm8
-  .byte  196,98,125,121,13,193,220,0,0       // vpbroadcastw  0xdcc1(%rip),%ymm9        # 3b2ac <_sk_srcover_bgra_8888_sse2_lowp+0x9e0>
+  .byte  196,98,125,121,13,209,220,0,0       // vpbroadcastw  0xdcd1(%rip),%ymm9        # 3aaec <_sk_srcover_bgra_8888_sse2_lowp+0x9f0>
   .byte  197,53,249,215                      // vpsubw        %ymm7,%ymm9,%ymm10
   .byte  197,173,213,192                     // vpmullw       %ymm0,%ymm10,%ymm0
   .byte  196,65,61,253,193                   // vpaddw        %ymm9,%ymm8,%ymm8
@@ -44612,7 +44251,7 @@
 FUNCTION(_sk_srcin_hsw_lowp)
 _sk_srcin_hsw_lowp:
   .byte  197,197,213,192                     // vpmullw       %ymm0,%ymm7,%ymm0
-  .byte  196,98,125,121,5,94,220,0,0         // vpbroadcastw  0xdc5e(%rip),%ymm8        # 3b2ae <_sk_srcover_bgra_8888_sse2_lowp+0x9e2>
+  .byte  196,98,125,121,5,110,220,0,0        // vpbroadcastw  0xdc6e(%rip),%ymm8        # 3aaee <_sk_srcover_bgra_8888_sse2_lowp+0x9f2>
   .byte  196,193,125,253,192                 // vpaddw        %ymm8,%ymm0,%ymm0
   .byte  197,253,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm0
   .byte  197,197,213,201                     // vpmullw       %ymm1,%ymm7,%ymm1
@@ -44632,7 +44271,7 @@
 FUNCTION(_sk_dstin_hsw_lowp)
 _sk_dstin_hsw_lowp:
   .byte  197,221,213,195                     // vpmullw       %ymm3,%ymm4,%ymm0
-  .byte  196,98,125,121,5,27,220,0,0         // vpbroadcastw  0xdc1b(%rip),%ymm8        # 3b2b0 <_sk_srcover_bgra_8888_sse2_lowp+0x9e4>
+  .byte  196,98,125,121,5,43,220,0,0         // vpbroadcastw  0xdc2b(%rip),%ymm8        # 3aaf0 <_sk_srcover_bgra_8888_sse2_lowp+0x9f4>
   .byte  196,193,125,253,192                 // vpaddw        %ymm8,%ymm0,%ymm0
   .byte  197,253,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm0
   .byte  197,213,213,203                     // vpmullw       %ymm3,%ymm5,%ymm1
@@ -44651,7 +44290,7 @@
 .globl _sk_srcout_hsw_lowp
 FUNCTION(_sk_srcout_hsw_lowp)
 _sk_srcout_hsw_lowp:
-  .byte  196,98,125,121,5,220,219,0,0        // vpbroadcastw  0xdbdc(%rip),%ymm8        # 3b2b2 <_sk_srcover_bgra_8888_sse2_lowp+0x9e6>
+  .byte  196,98,125,121,5,236,219,0,0        // vpbroadcastw  0xdbec(%rip),%ymm8        # 3aaf2 <_sk_srcover_bgra_8888_sse2_lowp+0x9f6>
   .byte  197,61,249,207                      // vpsubw        %ymm7,%ymm8,%ymm9
   .byte  197,181,213,192                     // vpmullw       %ymm0,%ymm9,%ymm0
   .byte  196,193,125,253,192                 // vpaddw        %ymm8,%ymm0,%ymm0
@@ -44672,7 +44311,7 @@
 .globl _sk_dstout_hsw_lowp
 FUNCTION(_sk_dstout_hsw_lowp)
 _sk_dstout_hsw_lowp:
-  .byte  196,98,125,121,5,149,219,0,0        // vpbroadcastw  0xdb95(%rip),%ymm8        # 3b2b4 <_sk_srcover_bgra_8888_sse2_lowp+0x9e8>
+  .byte  196,98,125,121,5,165,219,0,0        // vpbroadcastw  0xdba5(%rip),%ymm8        # 3aaf4 <_sk_srcover_bgra_8888_sse2_lowp+0x9f8>
   .byte  197,189,249,219                     // vpsubw        %ymm3,%ymm8,%ymm3
   .byte  197,229,213,196                     // vpmullw       %ymm4,%ymm3,%ymm0
   .byte  196,193,125,253,192                 // vpaddw        %ymm8,%ymm0,%ymm0
@@ -44693,7 +44332,7 @@
 .globl _sk_srcover_hsw_lowp
 FUNCTION(_sk_srcover_hsw_lowp)
 _sk_srcover_hsw_lowp:
-  .byte  196,98,125,121,5,78,219,0,0         // vpbroadcastw  0xdb4e(%rip),%ymm8        # 3b2b6 <_sk_srcover_bgra_8888_sse2_lowp+0x9ea>
+  .byte  196,98,125,121,5,94,219,0,0         // vpbroadcastw  0xdb5e(%rip),%ymm8        # 3aaf6 <_sk_srcover_bgra_8888_sse2_lowp+0x9fa>
   .byte  197,61,249,203                      // vpsubw        %ymm3,%ymm8,%ymm9
   .byte  197,53,213,212                      // vpmullw       %ymm4,%ymm9,%ymm10
   .byte  196,65,45,253,208                   // vpaddw        %ymm8,%ymm10,%ymm10
@@ -44718,7 +44357,7 @@
 .globl _sk_dstover_hsw_lowp
 FUNCTION(_sk_dstover_hsw_lowp)
 _sk_dstover_hsw_lowp:
-  .byte  196,98,125,121,5,243,218,0,0        // vpbroadcastw  0xdaf3(%rip),%ymm8        # 3b2b8 <_sk_srcover_bgra_8888_sse2_lowp+0x9ec>
+  .byte  196,98,125,121,5,3,219,0,0          // vpbroadcastw  0xdb03(%rip),%ymm8        # 3aaf8 <_sk_srcover_bgra_8888_sse2_lowp+0x9fc>
   .byte  197,61,249,207                      // vpsubw        %ymm7,%ymm8,%ymm9
   .byte  197,181,213,192                     // vpmullw       %ymm0,%ymm9,%ymm0
   .byte  196,193,125,253,192                 // vpaddw        %ymm8,%ymm0,%ymm0
@@ -44744,7 +44383,7 @@
 FUNCTION(_sk_modulate_hsw_lowp)
 _sk_modulate_hsw_lowp:
   .byte  197,221,213,192                     // vpmullw       %ymm0,%ymm4,%ymm0
-  .byte  196,98,125,121,5,152,218,0,0        // vpbroadcastw  0xda98(%rip),%ymm8        # 3b2ba <_sk_srcover_bgra_8888_sse2_lowp+0x9ee>
+  .byte  196,98,125,121,5,168,218,0,0        // vpbroadcastw  0xdaa8(%rip),%ymm8        # 3aafa <_sk_srcover_bgra_8888_sse2_lowp+0x9fe>
   .byte  196,193,125,253,192                 // vpaddw        %ymm8,%ymm0,%ymm0
   .byte  197,253,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm0
   .byte  197,213,213,201                     // vpmullw       %ymm1,%ymm5,%ymm1
@@ -44763,7 +44402,7 @@
 .globl _sk_multiply_hsw_lowp
 FUNCTION(_sk_multiply_hsw_lowp)
 _sk_multiply_hsw_lowp:
-  .byte  196,98,125,121,5,89,218,0,0         // vpbroadcastw  0xda59(%rip),%ymm8        # 3b2bc <_sk_srcover_bgra_8888_sse2_lowp+0x9f0>
+  .byte  196,98,125,121,5,105,218,0,0        // vpbroadcastw  0xda69(%rip),%ymm8        # 3aafc <_sk_srcover_bgra_8888_sse2_lowp+0xa00>
   .byte  197,61,249,203                      // vpsubw        %ymm3,%ymm8,%ymm9
   .byte  197,53,213,212                      // vpmullw       %ymm4,%ymm9,%ymm10
   .byte  196,65,93,253,216                   // vpaddw        %ymm8,%ymm4,%ymm11
@@ -44799,7 +44438,7 @@
 FUNCTION(_sk_plus__hsw_lowp)
 _sk_plus__hsw_lowp:
   .byte  197,221,253,192                     // vpaddw        %ymm0,%ymm4,%ymm0
-  .byte  196,98,125,121,5,207,217,0,0        // vpbroadcastw  0xd9cf(%rip),%ymm8        # 3b2be <_sk_srcover_bgra_8888_sse2_lowp+0x9f2>
+  .byte  196,98,125,121,5,223,217,0,0        // vpbroadcastw  0xd9df(%rip),%ymm8        # 3aafe <_sk_srcover_bgra_8888_sse2_lowp+0xa02>
   .byte  196,194,125,58,192                  // vpminuw       %ymm8,%ymm0,%ymm0
   .byte  197,213,253,201                     // vpaddw        %ymm1,%ymm5,%ymm1
   .byte  196,194,117,58,200                  // vpminuw       %ymm8,%ymm1,%ymm1
@@ -44816,7 +44455,7 @@
 _sk_screen_hsw_lowp:
   .byte  197,93,253,192                      // vpaddw        %ymm0,%ymm4,%ymm8
   .byte  197,221,213,192                     // vpmullw       %ymm0,%ymm4,%ymm0
-  .byte  196,98,125,121,13,156,217,0,0       // vpbroadcastw  0xd99c(%rip),%ymm9        # 3b2c0 <_sk_srcover_bgra_8888_sse2_lowp+0x9f4>
+  .byte  196,98,125,121,13,172,217,0,0       // vpbroadcastw  0xd9ac(%rip),%ymm9        # 3ab00 <_sk_srcover_bgra_8888_sse2_lowp+0xa04>
   .byte  196,193,125,253,193                 // vpaddw        %ymm9,%ymm0,%ymm0
   .byte  197,253,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm0
   .byte  197,189,249,192                     // vpsubw        %ymm0,%ymm8,%ymm0
@@ -44842,7 +44481,7 @@
 .globl _sk_xor__hsw_lowp
 FUNCTION(_sk_xor__hsw_lowp)
 _sk_xor__hsw_lowp:
-  .byte  196,98,125,121,5,65,217,0,0         // vpbroadcastw  0xd941(%rip),%ymm8        # 3b2c2 <_sk_srcover_bgra_8888_sse2_lowp+0x9f6>
+  .byte  196,98,125,121,5,81,217,0,0         // vpbroadcastw  0xd951(%rip),%ymm8        # 3ab02 <_sk_srcover_bgra_8888_sse2_lowp+0xa06>
   .byte  197,61,249,207                      // vpsubw        %ymm7,%ymm8,%ymm9
   .byte  197,181,213,192                     // vpmullw       %ymm0,%ymm9,%ymm0
   .byte  197,61,249,211                      // vpsubw        %ymm3,%ymm8,%ymm10
@@ -44876,7 +44515,7 @@
   .byte  197,197,213,192                     // vpmullw       %ymm0,%ymm7,%ymm0
   .byte  197,93,213,203                      // vpmullw       %ymm3,%ymm4,%ymm9
   .byte  196,194,125,62,193                  // vpmaxuw       %ymm9,%ymm0,%ymm0
-  .byte  196,98,125,121,13,197,216,0,0       // vpbroadcastw  0xd8c5(%rip),%ymm9        # 3b2c4 <_sk_srcover_bgra_8888_sse2_lowp+0x9f8>
+  .byte  196,98,125,121,13,213,216,0,0       // vpbroadcastw  0xd8d5(%rip),%ymm9        # 3ab04 <_sk_srcover_bgra_8888_sse2_lowp+0xa08>
   .byte  196,193,125,253,193                 // vpaddw        %ymm9,%ymm0,%ymm0
   .byte  197,253,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm0
   .byte  197,189,249,192                     // vpsubw        %ymm0,%ymm8,%ymm0
@@ -44910,7 +44549,7 @@
   .byte  197,197,213,192                     // vpmullw       %ymm0,%ymm7,%ymm0
   .byte  197,93,213,203                      // vpmullw       %ymm3,%ymm4,%ymm9
   .byte  196,194,125,58,193                  // vpminuw       %ymm9,%ymm0,%ymm0
-  .byte  196,98,125,121,13,70,216,0,0        // vpbroadcastw  0xd846(%rip),%ymm9        # 3b2c6 <_sk_srcover_bgra_8888_sse2_lowp+0x9fa>
+  .byte  196,98,125,121,13,86,216,0,0        // vpbroadcastw  0xd856(%rip),%ymm9        # 3ab06 <_sk_srcover_bgra_8888_sse2_lowp+0xa0a>
   .byte  196,193,125,253,193                 // vpaddw        %ymm9,%ymm0,%ymm0
   .byte  197,253,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm0
   .byte  197,189,249,192                     // vpsubw        %ymm0,%ymm8,%ymm0
@@ -44944,10 +44583,10 @@
   .byte  197,197,213,192                     // vpmullw       %ymm0,%ymm7,%ymm0
   .byte  197,93,213,203                      // vpmullw       %ymm3,%ymm4,%ymm9
   .byte  196,194,125,58,193                  // vpminuw       %ymm9,%ymm0,%ymm0
-  .byte  196,98,125,121,13,199,215,0,0       // vpbroadcastw  0xd7c7(%rip),%ymm9        # 3b2c8 <_sk_srcover_bgra_8888_sse2_lowp+0x9fc>
+  .byte  196,98,125,121,13,215,215,0,0       // vpbroadcastw  0xd7d7(%rip),%ymm9        # 3ab08 <_sk_srcover_bgra_8888_sse2_lowp+0xa0c>
   .byte  196,193,125,253,193                 // vpaddw        %ymm9,%ymm0,%ymm0
   .byte  197,253,113,208,7                   // vpsrlw        $0x7,%ymm0,%ymm0
-  .byte  196,98,125,121,21,182,215,0,0       // vpbroadcastw  0xd7b6(%rip),%ymm10        # 3b2ca <_sk_srcover_bgra_8888_sse2_lowp+0x9fe>
+  .byte  196,98,125,121,21,198,215,0,0       // vpbroadcastw  0xd7c6(%rip),%ymm10        # 3ab0a <_sk_srcover_bgra_8888_sse2_lowp+0xa0e>
   .byte  196,193,125,219,194                 // vpand         %ymm10,%ymm0,%ymm0
   .byte  197,189,249,192                     // vpsubw        %ymm0,%ymm8,%ymm0
   .byte  197,85,253,193                      // vpaddw        %ymm1,%ymm5,%ymm8
@@ -44980,10 +44619,10 @@
 _sk_exclusion_hsw_lowp:
   .byte  197,93,253,192                      // vpaddw        %ymm0,%ymm4,%ymm8
   .byte  197,221,213,192                     // vpmullw       %ymm0,%ymm4,%ymm0
-  .byte  196,98,125,121,13,59,215,0,0        // vpbroadcastw  0xd73b(%rip),%ymm9        # 3b2cc <_sk_srcover_bgra_8888_sse2_lowp+0xa00>
+  .byte  196,98,125,121,13,75,215,0,0        // vpbroadcastw  0xd74b(%rip),%ymm9        # 3ab0c <_sk_srcover_bgra_8888_sse2_lowp+0xa10>
   .byte  196,193,125,253,193                 // vpaddw        %ymm9,%ymm0,%ymm0
   .byte  197,253,113,208,7                   // vpsrlw        $0x7,%ymm0,%ymm0
-  .byte  196,98,125,121,21,42,215,0,0        // vpbroadcastw  0xd72a(%rip),%ymm10        # 3b2ce <_sk_srcover_bgra_8888_sse2_lowp+0xa02>
+  .byte  196,98,125,121,21,58,215,0,0        // vpbroadcastw  0xd73a(%rip),%ymm10        # 3ab0e <_sk_srcover_bgra_8888_sse2_lowp+0xa12>
   .byte  196,193,125,219,194                 // vpand         %ymm10,%ymm0,%ymm0
   .byte  197,189,249,192                     // vpsubw        %ymm0,%ymm8,%ymm0
   .byte  197,85,253,193                      // vpaddw        %ymm1,%ymm5,%ymm8
@@ -45011,7 +44650,7 @@
 FUNCTION(_sk_hardlight_hsw_lowp)
 _sk_hardlight_hsw_lowp:
   .byte  197,125,253,192                     // vpaddw        %ymm0,%ymm0,%ymm8
-  .byte  196,98,125,121,13,199,214,0,0       // vpbroadcastw  0xd6c7(%rip),%ymm9        # 3b2d2 <_sk_srcover_bgra_8888_sse2_lowp+0xa06>
+  .byte  196,98,125,121,13,215,214,0,0       // vpbroadcastw  0xd6d7(%rip),%ymm9        # 3ab12 <_sk_srcover_bgra_8888_sse2_lowp+0xa16>
   .byte  196,65,101,239,209                  // vpxor         %ymm9,%ymm3,%ymm10
   .byte  196,65,61,239,217                   // vpxor         %ymm9,%ymm8,%ymm11
   .byte  196,65,37,101,218                   // vpcmpgtw      %ymm10,%ymm11,%ymm11
@@ -45039,7 +44678,7 @@
   .byte  197,101,249,210                     // vpsubw        %ymm2,%ymm3,%ymm10
   .byte  197,69,249,246                      // vpsubw        %ymm6,%ymm7,%ymm14
   .byte  196,65,45,213,214                   // vpmullw       %ymm14,%ymm10,%ymm10
-  .byte  196,98,125,121,53,62,214,0,0        // vpbroadcastw  0xd63e(%rip),%ymm14        # 3b2d0 <_sk_srcover_bgra_8888_sse2_lowp+0xa04>
+  .byte  196,98,125,121,53,78,214,0,0        // vpbroadcastw  0xd64e(%rip),%ymm14        # 3ab10 <_sk_srcover_bgra_8888_sse2_lowp+0xa14>
   .byte  196,65,45,253,210                   // vpaddw        %ymm10,%ymm10,%ymm10
   .byte  196,65,61,249,194                   // vpsubw        %ymm10,%ymm8,%ymm8
   .byte  197,13,249,215                      // vpsubw        %ymm7,%ymm14,%ymm10
@@ -45076,7 +44715,7 @@
 FUNCTION(_sk_overlay_hsw_lowp)
 _sk_overlay_hsw_lowp:
   .byte  197,93,253,196                      // vpaddw        %ymm4,%ymm4,%ymm8
-  .byte  196,98,125,121,13,179,213,0,0       // vpbroadcastw  0xd5b3(%rip),%ymm9        # 3b2d6 <_sk_srcover_bgra_8888_sse2_lowp+0xa0a>
+  .byte  196,98,125,121,13,195,213,0,0       // vpbroadcastw  0xd5c3(%rip),%ymm9        # 3ab16 <_sk_srcover_bgra_8888_sse2_lowp+0xa1a>
   .byte  196,65,69,239,209                   // vpxor         %ymm9,%ymm7,%ymm10
   .byte  196,65,61,239,193                   // vpxor         %ymm9,%ymm8,%ymm8
   .byte  196,65,61,101,218                   // vpcmpgtw      %ymm10,%ymm8,%ymm11
@@ -45100,7 +44739,7 @@
   .byte  196,65,21,253,237                   // vpaddw        %ymm13,%ymm13,%ymm13
   .byte  196,65,61,249,237                   // vpsubw        %ymm13,%ymm8,%ymm13
   .byte  196,67,13,76,229,192                // vpblendvb     %ymm12,%ymm13,%ymm14,%ymm12
-  .byte  196,98,125,121,45,59,213,0,0        // vpbroadcastw  0xd53b(%rip),%ymm13        # 3b2d4 <_sk_srcover_bgra_8888_sse2_lowp+0xa08>
+  .byte  196,98,125,121,45,75,213,0,0        // vpbroadcastw  0xd54b(%rip),%ymm13        # 3ab14 <_sk_srcover_bgra_8888_sse2_lowp+0xa18>
   .byte  197,77,253,246                      // vpaddw        %ymm6,%ymm6,%ymm14
   .byte  196,65,13,239,201                   // vpxor         %ymm9,%ymm14,%ymm9
   .byte  196,65,53,101,202                   // vpcmpgtw      %ymm10,%ymm9,%ymm9
@@ -45152,10 +44791,10 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,55                              // ja            2de8f <_sk_load_8888_hsw_lowp+0x52>
+  .byte  119,55                              // ja            2d6bf <_sk_load_8888_hsw_lowp+0x52>
   .byte  197,253,239,192                     // vpxor         %ymm0,%ymm0,%ymm0
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,162,1,0,0                 // lea           0x1a2(%rip),%r9        # 2e008 <_sk_load_8888_hsw_lowp+0x1cb>
+  .byte  76,141,13,162,1,0,0                 // lea           0x1a2(%rip),%r9        # 2d838 <_sk_load_8888_hsw_lowp+0x1cb>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
@@ -45165,10 +44804,10 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  196,193,121,110,12,144              // vmovd         (%r8,%rdx,4),%xmm1
   .byte  197,253,239,192                     // vpxor         %ymm0,%ymm0,%ymm0
-  .byte  233,39,1,0,0                        // jmpq          2dfb6 <_sk_load_8888_hsw_lowp+0x179>
+  .byte  233,39,1,0,0                        // jmpq          2d7e6 <_sk_load_8888_hsw_lowp+0x179>
   .byte  196,193,126,111,12,144              // vmovdqu       (%r8,%rdx,4),%ymm1
   .byte  196,193,126,111,68,144,32           // vmovdqu       0x20(%r8,%rdx,4),%ymm0
-  .byte  233,21,1,0,0                        // jmpq          2dfb6 <_sk_load_8888_hsw_lowp+0x179>
+  .byte  233,21,1,0,0                        // jmpq          2d7e6 <_sk_load_8888_hsw_lowp+0x179>
   .byte  196,193,121,110,68,144,8            // vmovd         0x8(%r8,%rdx,4),%xmm0
   .byte  196,226,121,89,192                  // vpbroadcastq  %xmm0,%xmm0
   .byte  197,229,239,219                     // vpxor         %ymm3,%ymm3,%ymm3
@@ -45177,7 +44816,7 @@
   .byte  197,249,112,201,232                 // vpshufd       $0xe8,%xmm1,%xmm1
   .byte  196,227,125,2,201,3                 // vpblendd      $0x3,%ymm1,%ymm0,%ymm1
   .byte  197,253,111,195                     // vmovdqa       %ymm3,%ymm0
-  .byte  233,229,0,0,0                       // jmpq          2dfb6 <_sk_load_8888_hsw_lowp+0x179>
+  .byte  233,229,0,0,0                       // jmpq          2d7e6 <_sk_load_8888_hsw_lowp+0x179>
   .byte  196,193,121,110,68,144,24           // vmovd         0x18(%r8,%rdx,4),%xmm0
   .byte  196,226,125,89,192                  // vpbroadcastq  %xmm0,%ymm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
@@ -45193,7 +44832,7 @@
   .byte  196,193,122,111,12,144              // vmovdqu       (%r8,%rdx,4),%xmm1
   .byte  196,227,117,2,200,240               // vpblendd      $0xf0,%ymm0,%ymm1,%ymm1
   .byte  197,125,127,192                     // vmovdqa       %ymm8,%ymm0
-  .byte  233,138,0,0,0                       // jmpq          2dfb6 <_sk_load_8888_hsw_lowp+0x179>
+  .byte  233,138,0,0,0                       // jmpq          2d7e6 <_sk_load_8888_hsw_lowp+0x179>
   .byte  196,193,121,110,68,144,40           // vmovd         0x28(%r8,%rdx,4),%xmm0
   .byte  196,226,121,89,192                  // vpbroadcastq  %xmm0,%xmm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
@@ -45203,7 +44842,7 @@
   .byte  196,193,121,110,76,144,32           // vmovd         0x20(%r8,%rdx,4),%xmm1
   .byte  196,227,125,2,193,1                 // vpblendd      $0x1,%ymm1,%ymm0,%ymm0
   .byte  196,193,126,111,12,144              // vmovdqu       (%r8,%rdx,4),%ymm1
-  .byte  235,81                              // jmp           2dfb6 <_sk_load_8888_hsw_lowp+0x179>
+  .byte  235,81                              // jmp           2d7e6 <_sk_load_8888_hsw_lowp+0x179>
   .byte  196,193,121,110,68,144,56           // vmovd         0x38(%r8,%rdx,4),%xmm0
   .byte  196,226,125,89,192                  // vpbroadcastq  %xmm0,%ymm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
@@ -45223,7 +44862,7 @@
   .byte  196,227,101,14,200,170              // vpblendw      $0xaa,%ymm0,%ymm3,%ymm1
   .byte  196,227,109,14,192,170              // vpblendw      $0xaa,%ymm0,%ymm2,%ymm0
   .byte  196,226,125,43,201                  // vpackusdw     %ymm1,%ymm0,%ymm1
-  .byte  197,125,111,5,1,211,0,0             // vmovdqa       0xd301(%rip),%ymm8        # 3b2e0 <_sk_srcover_bgra_8888_sse2_lowp+0xa14>
+  .byte  197,125,111,5,17,211,0,0            // vmovdqa       0xd311(%rip),%ymm8        # 3ab20 <_sk_srcover_bgra_8888_sse2_lowp+0xa24>
   .byte  196,193,117,219,192                 // vpand         %ymm8,%ymm1,%ymm0
   .byte  197,245,113,209,8                   // vpsrlw        $0x8,%ymm1,%ymm1
   .byte  197,229,114,211,16                  // vpsrld        $0x10,%ymm3,%ymm3
@@ -45234,7 +44873,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,144                             // xchg          %ax,%ax
-  .byte  120,254                             // js            2e008 <_sk_load_8888_hsw_lowp+0x1cb>
+  .byte  120,254                             // js            2d838 <_sk_load_8888_hsw_lowp+0x1cb>
   .byte  255                                 // (bad)
   .byte  255,175,254,255,255,153             // ljmp          *-0x66000002(%rdi)
   .byte  254                                 // (bad)
@@ -45282,10 +44921,10 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,55                              // ja            2e096 <_sk_load_8888_dst_hsw_lowp+0x52>
+  .byte  119,55                              // ja            2d8c6 <_sk_load_8888_dst_hsw_lowp+0x52>
   .byte  197,221,239,228                     // vpxor         %ymm4,%ymm4,%ymm4
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,163,1,0,0                 // lea           0x1a3(%rip),%r9        # 2e210 <_sk_load_8888_dst_hsw_lowp+0x1cc>
+  .byte  76,141,13,163,1,0,0                 // lea           0x1a3(%rip),%r9        # 2da40 <_sk_load_8888_dst_hsw_lowp+0x1cc>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -45295,10 +44934,10 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  196,193,121,110,44,144              // vmovd         (%r8,%rdx,4),%xmm5
   .byte  197,221,239,228                     // vpxor         %ymm4,%ymm4,%ymm4
-  .byte  233,39,1,0,0                        // jmpq          2e1bd <_sk_load_8888_dst_hsw_lowp+0x179>
+  .byte  233,39,1,0,0                        // jmpq          2d9ed <_sk_load_8888_dst_hsw_lowp+0x179>
   .byte  196,193,126,111,44,144              // vmovdqu       (%r8,%rdx,4),%ymm5
   .byte  196,193,126,111,100,144,32          // vmovdqu       0x20(%r8,%rdx,4),%ymm4
-  .byte  233,21,1,0,0                        // jmpq          2e1bd <_sk_load_8888_dst_hsw_lowp+0x179>
+  .byte  233,21,1,0,0                        // jmpq          2d9ed <_sk_load_8888_dst_hsw_lowp+0x179>
   .byte  196,193,121,110,100,144,8           // vmovd         0x8(%r8,%rdx,4),%xmm4
   .byte  196,226,121,89,228                  // vpbroadcastq  %xmm4,%xmm4
   .byte  197,197,239,255                     // vpxor         %ymm7,%ymm7,%ymm7
@@ -45307,7 +44946,7 @@
   .byte  197,249,112,237,232                 // vpshufd       $0xe8,%xmm5,%xmm5
   .byte  196,227,93,2,237,3                  // vpblendd      $0x3,%ymm5,%ymm4,%ymm5
   .byte  197,253,111,231                     // vmovdqa       %ymm7,%ymm4
-  .byte  233,229,0,0,0                       // jmpq          2e1bd <_sk_load_8888_dst_hsw_lowp+0x179>
+  .byte  233,229,0,0,0                       // jmpq          2d9ed <_sk_load_8888_dst_hsw_lowp+0x179>
   .byte  196,193,121,110,100,144,24          // vmovd         0x18(%r8,%rdx,4),%xmm4
   .byte  196,226,125,89,228                  // vpbroadcastq  %xmm4,%ymm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -45323,7 +44962,7 @@
   .byte  196,193,122,111,44,144              // vmovdqu       (%r8,%rdx,4),%xmm5
   .byte  196,227,85,2,236,240                // vpblendd      $0xf0,%ymm4,%ymm5,%ymm5
   .byte  197,125,127,196                     // vmovdqa       %ymm8,%ymm4
-  .byte  233,138,0,0,0                       // jmpq          2e1bd <_sk_load_8888_dst_hsw_lowp+0x179>
+  .byte  233,138,0,0,0                       // jmpq          2d9ed <_sk_load_8888_dst_hsw_lowp+0x179>
   .byte  196,193,121,110,100,144,40          // vmovd         0x28(%r8,%rdx,4),%xmm4
   .byte  196,226,121,89,228                  // vpbroadcastq  %xmm4,%xmm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -45333,7 +44972,7 @@
   .byte  196,193,121,110,108,144,32          // vmovd         0x20(%r8,%rdx,4),%xmm5
   .byte  196,227,93,2,229,1                  // vpblendd      $0x1,%ymm5,%ymm4,%ymm4
   .byte  196,193,126,111,44,144              // vmovdqu       (%r8,%rdx,4),%ymm5
-  .byte  235,81                              // jmp           2e1bd <_sk_load_8888_dst_hsw_lowp+0x179>
+  .byte  235,81                              // jmp           2d9ed <_sk_load_8888_dst_hsw_lowp+0x179>
   .byte  196,193,121,110,100,144,56          // vmovd         0x38(%r8,%rdx,4),%xmm4
   .byte  196,226,125,89,228                  // vpbroadcastq  %xmm4,%ymm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -45353,7 +44992,7 @@
   .byte  196,227,69,14,236,170               // vpblendw      $0xaa,%ymm4,%ymm7,%ymm5
   .byte  196,227,77,14,228,170               // vpblendw      $0xaa,%ymm4,%ymm6,%ymm4
   .byte  196,226,93,43,237                   // vpackusdw     %ymm5,%ymm4,%ymm5
-  .byte  197,125,111,5,26,209,0,0            // vmovdqa       0xd11a(%rip),%ymm8        # 3b300 <_sk_srcover_bgra_8888_sse2_lowp+0xa34>
+  .byte  197,125,111,5,42,209,0,0            // vmovdqa       0xd12a(%rip),%ymm8        # 3ab40 <_sk_srcover_bgra_8888_sse2_lowp+0xa44>
   .byte  196,193,85,219,224                  // vpand         %ymm8,%ymm5,%ymm4
   .byte  197,213,113,213,8                   // vpsrlw        $0x8,%ymm5,%ymm5
   .byte  197,197,114,215,16                  // vpsrld        $0x10,%ymm7,%ymm7
@@ -45364,7 +45003,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  15,31,0                             // nopl          (%rax)
-  .byte  119,254                             // ja            2e210 <_sk_load_8888_dst_hsw_lowp+0x1cc>
+  .byte  119,254                             // ja            2da40 <_sk_load_8888_dst_hsw_lowp+0x1cc>
   .byte  255                                 // (bad)
   .byte  255,174,254,255,255,152             // ljmp          *-0x67000002(%rsi)
   .byte  254                                 // (bad)
@@ -45425,20 +45064,20 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,30                              // ja            2e2cd <_sk_store_8888_hsw_lowp+0x81>
+  .byte  119,30                              // ja            2dafd <_sk_store_8888_hsw_lowp+0x81>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,195,0,0,0                 // lea           0xc3(%rip),%r9        # 2e37c <_sk_store_8888_hsw_lowp+0x130>
+  .byte  76,141,13,195,0,0,0                 // lea           0xc3(%rip),%r9        # 2dbac <_sk_store_8888_hsw_lowp+0x130>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,65,121,126,4,144                // vmovd         %xmm8,(%r8,%rdx,4)
-  .byte  233,171,0,0,0                       // jmpq          2e378 <_sk_store_8888_hsw_lowp+0x12c>
+  .byte  233,171,0,0,0                       // jmpq          2dba8 <_sk_store_8888_hsw_lowp+0x12c>
   .byte  196,65,126,127,4,144                // vmovdqu       %ymm8,(%r8,%rdx,4)
   .byte  196,65,126,127,76,144,32            // vmovdqu       %ymm9,0x20(%r8,%rdx,4)
-  .byte  233,153,0,0,0                       // jmpq          2e378 <_sk_store_8888_hsw_lowp+0x12c>
+  .byte  233,153,0,0,0                       // jmpq          2dba8 <_sk_store_8888_hsw_lowp+0x12c>
   .byte  196,67,121,22,68,144,8,2            // vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
   .byte  196,65,121,214,4,144                // vmovq         %xmm8,(%r8,%rdx,4)
-  .byte  233,134,0,0,0                       // jmpq          2e378 <_sk_store_8888_hsw_lowp+0x12c>
+  .byte  233,134,0,0,0                       // jmpq          2dba8 <_sk_store_8888_hsw_lowp+0x12c>
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,67,121,22,76,144,24,2           // vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
@@ -45446,12 +45085,12 @@
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,65,121,126,76,144,16            // vmovd         %xmm9,0x10(%r8,%rdx,4)
   .byte  196,65,122,127,4,144                // vmovdqu       %xmm8,(%r8,%rdx,4)
-  .byte  235,85                              // jmp           2e378 <_sk_store_8888_hsw_lowp+0x12c>
+  .byte  235,85                              // jmp           2dba8 <_sk_store_8888_hsw_lowp+0x12c>
   .byte  196,67,121,22,76,144,40,2           // vpextrd       $0x2,%xmm9,0x28(%r8,%rdx,4)
   .byte  196,67,121,22,76,144,36,1           // vpextrd       $0x1,%xmm9,0x24(%r8,%rdx,4)
   .byte  196,65,121,126,76,144,32            // vmovd         %xmm9,0x20(%r8,%rdx,4)
   .byte  196,65,126,127,4,144                // vmovdqu       %ymm8,(%r8,%rdx,4)
-  .byte  235,54                              // jmp           2e378 <_sk_store_8888_hsw_lowp+0x12c>
+  .byte  235,54                              // jmp           2dba8 <_sk_store_8888_hsw_lowp+0x12c>
   .byte  196,67,125,57,202,1                 // vextracti128  $0x1,%ymm9,%xmm10
   .byte  196,67,121,22,84,144,56,2           // vpextrd       $0x2,%xmm10,0x38(%r8,%rdx,4)
   .byte  196,67,125,57,202,1                 // vextracti128  $0x1,%ymm9,%xmm10
@@ -45508,10 +45147,10 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,55                              // ja            2e40a <_sk_load_bgra_hsw_lowp+0x52>
+  .byte  119,55                              // ja            2dc3a <_sk_load_bgra_hsw_lowp+0x52>
   .byte  197,253,239,192                     // vpxor         %ymm0,%ymm0,%ymm0
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,163,1,0,0                 // lea           0x1a3(%rip),%r9        # 2e584 <_sk_load_bgra_hsw_lowp+0x1cc>
+  .byte  76,141,13,163,1,0,0                 // lea           0x1a3(%rip),%r9        # 2ddb4 <_sk_load_bgra_hsw_lowp+0x1cc>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
@@ -45521,10 +45160,10 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  196,193,121,110,12,144              // vmovd         (%r8,%rdx,4),%xmm1
   .byte  197,253,239,192                     // vpxor         %ymm0,%ymm0,%ymm0
-  .byte  233,39,1,0,0                        // jmpq          2e531 <_sk_load_bgra_hsw_lowp+0x179>
+  .byte  233,39,1,0,0                        // jmpq          2dd61 <_sk_load_bgra_hsw_lowp+0x179>
   .byte  196,193,126,111,12,144              // vmovdqu       (%r8,%rdx,4),%ymm1
   .byte  196,193,126,111,68,144,32           // vmovdqu       0x20(%r8,%rdx,4),%ymm0
-  .byte  233,21,1,0,0                        // jmpq          2e531 <_sk_load_bgra_hsw_lowp+0x179>
+  .byte  233,21,1,0,0                        // jmpq          2dd61 <_sk_load_bgra_hsw_lowp+0x179>
   .byte  196,193,121,110,68,144,8            // vmovd         0x8(%r8,%rdx,4),%xmm0
   .byte  196,226,121,89,192                  // vpbroadcastq  %xmm0,%xmm0
   .byte  197,229,239,219                     // vpxor         %ymm3,%ymm3,%ymm3
@@ -45533,7 +45172,7 @@
   .byte  197,249,112,201,232                 // vpshufd       $0xe8,%xmm1,%xmm1
   .byte  196,227,125,2,201,3                 // vpblendd      $0x3,%ymm1,%ymm0,%ymm1
   .byte  197,253,111,195                     // vmovdqa       %ymm3,%ymm0
-  .byte  233,229,0,0,0                       // jmpq          2e531 <_sk_load_bgra_hsw_lowp+0x179>
+  .byte  233,229,0,0,0                       // jmpq          2dd61 <_sk_load_bgra_hsw_lowp+0x179>
   .byte  196,193,121,110,68,144,24           // vmovd         0x18(%r8,%rdx,4),%xmm0
   .byte  196,226,125,89,192                  // vpbroadcastq  %xmm0,%ymm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
@@ -45549,7 +45188,7 @@
   .byte  196,193,122,111,12,144              // vmovdqu       (%r8,%rdx,4),%xmm1
   .byte  196,227,117,2,200,240               // vpblendd      $0xf0,%ymm0,%ymm1,%ymm1
   .byte  197,125,127,192                     // vmovdqa       %ymm8,%ymm0
-  .byte  233,138,0,0,0                       // jmpq          2e531 <_sk_load_bgra_hsw_lowp+0x179>
+  .byte  233,138,0,0,0                       // jmpq          2dd61 <_sk_load_bgra_hsw_lowp+0x179>
   .byte  196,193,121,110,68,144,40           // vmovd         0x28(%r8,%rdx,4),%xmm0
   .byte  196,226,121,89,192                  // vpbroadcastq  %xmm0,%xmm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
@@ -45559,7 +45198,7 @@
   .byte  196,193,121,110,76,144,32           // vmovd         0x20(%r8,%rdx,4),%xmm1
   .byte  196,227,125,2,193,1                 // vpblendd      $0x1,%ymm1,%ymm0,%ymm0
   .byte  196,193,126,111,12,144              // vmovdqu       (%r8,%rdx,4),%ymm1
-  .byte  235,81                              // jmp           2e531 <_sk_load_bgra_hsw_lowp+0x179>
+  .byte  235,81                              // jmp           2dd61 <_sk_load_bgra_hsw_lowp+0x179>
   .byte  196,193,121,110,68,144,56           // vmovd         0x38(%r8,%rdx,4),%xmm0
   .byte  196,226,125,89,192                  // vpbroadcastq  %xmm0,%ymm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
@@ -45579,7 +45218,7 @@
   .byte  196,227,125,14,209,170              // vpblendw      $0xaa,%ymm1,%ymm0,%ymm2
   .byte  196,227,101,14,201,170              // vpblendw      $0xaa,%ymm1,%ymm3,%ymm1
   .byte  196,226,117,43,202                  // vpackusdw     %ymm2,%ymm1,%ymm1
-  .byte  197,125,111,5,198,205,0,0           // vmovdqa       0xcdc6(%rip),%ymm8        # 3b320 <_sk_srcover_bgra_8888_sse2_lowp+0xa54>
+  .byte  197,125,111,5,214,205,0,0           // vmovdqa       0xcdd6(%rip),%ymm8        # 3ab60 <_sk_srcover_bgra_8888_sse2_lowp+0xa64>
   .byte  196,193,117,219,208                 // vpand         %ymm8,%ymm1,%ymm2
   .byte  197,245,113,209,8                   // vpsrlw        $0x8,%ymm1,%ymm1
   .byte  197,253,114,208,16                  // vpsrld        $0x10,%ymm0,%ymm0
@@ -45590,7 +45229,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  15,31,0                             // nopl          (%rax)
-  .byte  119,254                             // ja            2e584 <_sk_load_bgra_hsw_lowp+0x1cc>
+  .byte  119,254                             // ja            2ddb4 <_sk_load_bgra_hsw_lowp+0x1cc>
   .byte  255                                 // (bad)
   .byte  255,174,254,255,255,152             // ljmp          *-0x67000002(%rsi)
   .byte  254                                 // (bad)
@@ -45637,10 +45276,10 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,55                              // ja            2e612 <_sk_load_bgra_dst_hsw_lowp+0x52>
+  .byte  119,55                              // ja            2de42 <_sk_load_bgra_dst_hsw_lowp+0x52>
   .byte  197,221,239,228                     // vpxor         %ymm4,%ymm4,%ymm4
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,163,1,0,0                 // lea           0x1a3(%rip),%r9        # 2e78c <_sk_load_bgra_dst_hsw_lowp+0x1cc>
+  .byte  76,141,13,163,1,0,0                 // lea           0x1a3(%rip),%r9        # 2dfbc <_sk_load_bgra_dst_hsw_lowp+0x1cc>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -45650,10 +45289,10 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  196,193,121,110,44,144              // vmovd         (%r8,%rdx,4),%xmm5
   .byte  197,221,239,228                     // vpxor         %ymm4,%ymm4,%ymm4
-  .byte  233,39,1,0,0                        // jmpq          2e739 <_sk_load_bgra_dst_hsw_lowp+0x179>
+  .byte  233,39,1,0,0                        // jmpq          2df69 <_sk_load_bgra_dst_hsw_lowp+0x179>
   .byte  196,193,126,111,44,144              // vmovdqu       (%r8,%rdx,4),%ymm5
   .byte  196,193,126,111,100,144,32          // vmovdqu       0x20(%r8,%rdx,4),%ymm4
-  .byte  233,21,1,0,0                        // jmpq          2e739 <_sk_load_bgra_dst_hsw_lowp+0x179>
+  .byte  233,21,1,0,0                        // jmpq          2df69 <_sk_load_bgra_dst_hsw_lowp+0x179>
   .byte  196,193,121,110,100,144,8           // vmovd         0x8(%r8,%rdx,4),%xmm4
   .byte  196,226,121,89,228                  // vpbroadcastq  %xmm4,%xmm4
   .byte  197,197,239,255                     // vpxor         %ymm7,%ymm7,%ymm7
@@ -45662,7 +45301,7 @@
   .byte  197,249,112,237,232                 // vpshufd       $0xe8,%xmm5,%xmm5
   .byte  196,227,93,2,237,3                  // vpblendd      $0x3,%ymm5,%ymm4,%ymm5
   .byte  197,253,111,231                     // vmovdqa       %ymm7,%ymm4
-  .byte  233,229,0,0,0                       // jmpq          2e739 <_sk_load_bgra_dst_hsw_lowp+0x179>
+  .byte  233,229,0,0,0                       // jmpq          2df69 <_sk_load_bgra_dst_hsw_lowp+0x179>
   .byte  196,193,121,110,100,144,24          // vmovd         0x18(%r8,%rdx,4),%xmm4
   .byte  196,226,125,89,228                  // vpbroadcastq  %xmm4,%ymm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -45678,7 +45317,7 @@
   .byte  196,193,122,111,44,144              // vmovdqu       (%r8,%rdx,4),%xmm5
   .byte  196,227,85,2,236,240                // vpblendd      $0xf0,%ymm4,%ymm5,%ymm5
   .byte  197,125,127,196                     // vmovdqa       %ymm8,%ymm4
-  .byte  233,138,0,0,0                       // jmpq          2e739 <_sk_load_bgra_dst_hsw_lowp+0x179>
+  .byte  233,138,0,0,0                       // jmpq          2df69 <_sk_load_bgra_dst_hsw_lowp+0x179>
   .byte  196,193,121,110,100,144,40          // vmovd         0x28(%r8,%rdx,4),%xmm4
   .byte  196,226,121,89,228                  // vpbroadcastq  %xmm4,%xmm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -45688,7 +45327,7 @@
   .byte  196,193,121,110,108,144,32          // vmovd         0x20(%r8,%rdx,4),%xmm5
   .byte  196,227,93,2,229,1                  // vpblendd      $0x1,%ymm5,%ymm4,%ymm4
   .byte  196,193,126,111,44,144              // vmovdqu       (%r8,%rdx,4),%ymm5
-  .byte  235,81                              // jmp           2e739 <_sk_load_bgra_dst_hsw_lowp+0x179>
+  .byte  235,81                              // jmp           2df69 <_sk_load_bgra_dst_hsw_lowp+0x179>
   .byte  196,193,121,110,100,144,56          // vmovd         0x38(%r8,%rdx,4),%xmm4
   .byte  196,226,125,89,228                  // vpbroadcastq  %xmm4,%ymm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -45708,7 +45347,7 @@
   .byte  196,227,93,14,245,170               // vpblendw      $0xaa,%ymm5,%ymm4,%ymm6
   .byte  196,227,69,14,237,170               // vpblendw      $0xaa,%ymm5,%ymm7,%ymm5
   .byte  196,226,85,43,238                   // vpackusdw     %ymm6,%ymm5,%ymm5
-  .byte  197,125,111,5,222,203,0,0           // vmovdqa       0xcbde(%rip),%ymm8        # 3b340 <_sk_srcover_bgra_8888_sse2_lowp+0xa74>
+  .byte  197,125,111,5,238,203,0,0           // vmovdqa       0xcbee(%rip),%ymm8        # 3ab80 <_sk_srcover_bgra_8888_sse2_lowp+0xa84>
   .byte  196,193,85,219,240                  // vpand         %ymm8,%ymm5,%ymm6
   .byte  197,213,113,213,8                   // vpsrlw        $0x8,%ymm5,%ymm5
   .byte  197,221,114,212,16                  // vpsrld        $0x10,%ymm4,%ymm4
@@ -45719,7 +45358,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  15,31,0                             // nopl          (%rax)
-  .byte  119,254                             // ja            2e78c <_sk_load_bgra_dst_hsw_lowp+0x1cc>
+  .byte  119,254                             // ja            2dfbc <_sk_load_bgra_dst_hsw_lowp+0x1cc>
   .byte  255                                 // (bad)
   .byte  255,174,254,255,255,152             // ljmp          *-0x67000002(%rsi)
   .byte  254                                 // (bad)
@@ -45780,20 +45419,20 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,30                              // ja            2e849 <_sk_store_bgra_hsw_lowp+0x81>
+  .byte  119,30                              // ja            2e079 <_sk_store_bgra_hsw_lowp+0x81>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,195,0,0,0                 // lea           0xc3(%rip),%r9        # 2e8f8 <_sk_store_bgra_hsw_lowp+0x130>
+  .byte  76,141,13,195,0,0,0                 // lea           0xc3(%rip),%r9        # 2e128 <_sk_store_bgra_hsw_lowp+0x130>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,65,121,126,4,144                // vmovd         %xmm8,(%r8,%rdx,4)
-  .byte  233,171,0,0,0                       // jmpq          2e8f4 <_sk_store_bgra_hsw_lowp+0x12c>
+  .byte  233,171,0,0,0                       // jmpq          2e124 <_sk_store_bgra_hsw_lowp+0x12c>
   .byte  196,65,126,127,4,144                // vmovdqu       %ymm8,(%r8,%rdx,4)
   .byte  196,65,126,127,76,144,32            // vmovdqu       %ymm9,0x20(%r8,%rdx,4)
-  .byte  233,153,0,0,0                       // jmpq          2e8f4 <_sk_store_bgra_hsw_lowp+0x12c>
+  .byte  233,153,0,0,0                       // jmpq          2e124 <_sk_store_bgra_hsw_lowp+0x12c>
   .byte  196,67,121,22,68,144,8,2            // vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
   .byte  196,65,121,214,4,144                // vmovq         %xmm8,(%r8,%rdx,4)
-  .byte  233,134,0,0,0                       // jmpq          2e8f4 <_sk_store_bgra_hsw_lowp+0x12c>
+  .byte  233,134,0,0,0                       // jmpq          2e124 <_sk_store_bgra_hsw_lowp+0x12c>
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,67,121,22,76,144,24,2           // vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
@@ -45801,12 +45440,12 @@
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,65,121,126,76,144,16            // vmovd         %xmm9,0x10(%r8,%rdx,4)
   .byte  196,65,122,127,4,144                // vmovdqu       %xmm8,(%r8,%rdx,4)
-  .byte  235,85                              // jmp           2e8f4 <_sk_store_bgra_hsw_lowp+0x12c>
+  .byte  235,85                              // jmp           2e124 <_sk_store_bgra_hsw_lowp+0x12c>
   .byte  196,67,121,22,76,144,40,2           // vpextrd       $0x2,%xmm9,0x28(%r8,%rdx,4)
   .byte  196,67,121,22,76,144,36,1           // vpextrd       $0x1,%xmm9,0x24(%r8,%rdx,4)
   .byte  196,65,121,126,76,144,32            // vmovd         %xmm9,0x20(%r8,%rdx,4)
   .byte  196,65,126,127,4,144                // vmovdqu       %ymm8,(%r8,%rdx,4)
-  .byte  235,54                              // jmp           2e8f4 <_sk_store_bgra_hsw_lowp+0x12c>
+  .byte  235,54                              // jmp           2e124 <_sk_store_bgra_hsw_lowp+0x12c>
   .byte  196,67,125,57,202,1                 // vextracti128  $0x1,%ymm9,%xmm10
   .byte  196,67,121,22,84,144,56,2           // vpextrd       $0x2,%xmm10,0x38(%r8,%rdx,4)
   .byte  196,67,125,57,202,1                 // vextracti128  $0x1,%ymm9,%xmm10
@@ -45889,7 +45528,7 @@
   .byte  196,195,101,14,194,170              // vpblendw      $0xaa,%ymm10,%ymm3,%ymm0
   .byte  196,195,109,14,202,170              // vpblendw      $0xaa,%ymm10,%ymm2,%ymm1
   .byte  196,226,117,43,200                  // vpackusdw     %ymm0,%ymm1,%ymm1
-  .byte  197,125,111,5,122,201,0,0           // vmovdqa       0xc97a(%rip),%ymm8        # 3b360 <_sk_srcover_bgra_8888_sse2_lowp+0xa94>
+  .byte  197,125,111,5,138,201,0,0           // vmovdqa       0xc98a(%rip),%ymm8        # 3aba0 <_sk_srcover_bgra_8888_sse2_lowp+0xaa4>
   .byte  196,193,117,219,192                 // vpand         %ymm8,%ymm1,%ymm0
   .byte  197,245,113,209,8                   // vpsrlw        $0x8,%ymm1,%ymm1
   .byte  197,229,114,211,16                  // vpsrld        $0x10,%ymm3,%ymm3
@@ -45939,7 +45578,7 @@
   .byte  196,195,125,14,202,170              // vpblendw      $0xaa,%ymm10,%ymm0,%ymm1
   .byte  196,195,61,14,210,170               // vpblendw      $0xaa,%ymm10,%ymm8,%ymm2
   .byte  196,226,109,43,201                  // vpackusdw     %ymm1,%ymm2,%ymm1
-  .byte  197,253,111,29,193,200,0,0          // vmovdqa       0xc8c1(%rip),%ymm3        # 3b380 <_sk_srcover_bgra_8888_sse2_lowp+0xab4>
+  .byte  197,253,111,29,209,200,0,0          // vmovdqa       0xc8d1(%rip),%ymm3        # 3abc0 <_sk_srcover_bgra_8888_sse2_lowp+0xac4>
   .byte  197,245,219,211                     // vpand         %ymm3,%ymm1,%ymm2
   .byte  197,245,113,209,8                   // vpsrlw        $0x8,%ymm1,%ymm1
   .byte  197,253,114,208,16                  // vpsrld        $0x10,%ymm0,%ymm0
@@ -45963,24 +45602,24 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,37                              // ja            2eb25 <_sk_load_565_hsw_lowp+0x3f>
+  .byte  119,37                              // ja            2e355 <_sk_load_565_hsw_lowp+0x3f>
   .byte  197,253,239,192                     // vpxor         %ymm0,%ymm0,%ymm0
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,130,1,0,0                 // lea           0x182(%rip),%r9        # 2ec90 <_sk_load_565_hsw_lowp+0x1aa>
+  .byte  76,141,13,130,1,0,0                 // lea           0x182(%rip),%r9        # 2e4c0 <_sk_load_565_hsw_lowp+0x1aa>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  233,8,1,0,0                         // jmpq          2ec2d <_sk_load_565_hsw_lowp+0x147>
+  .byte  233,8,1,0,0                         // jmpq          2e45d <_sk_load_565_hsw_lowp+0x147>
   .byte  196,193,126,111,4,80                // vmovdqu       (%r8,%rdx,2),%ymm0
-  .byte  233,253,0,0,0                       // jmpq          2ec2d <_sk_load_565_hsw_lowp+0x147>
+  .byte  233,253,0,0,0                       // jmpq          2e45d <_sk_load_565_hsw_lowp+0x147>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,193,121,196,76,80,4,2           // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm0,%xmm1
   .byte  196,227,117,56,192,1                // vinserti128   $0x1,%xmm0,%ymm1,%ymm0
   .byte  196,193,121,110,12,80               // vmovd         (%r8,%rdx,2),%xmm1
   .byte  196,227,125,2,193,1                 // vpblendd      $0x1,%ymm1,%ymm0,%ymm0
-  .byte  233,218,0,0,0                       // jmpq          2ec2d <_sk_load_565_hsw_lowp+0x147>
+  .byte  233,218,0,0,0                       // jmpq          2e45d <_sk_load_565_hsw_lowp+0x147>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,193,121,196,76,80,12,6          // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm0,%xmm1
   .byte  196,227,117,56,192,1                // vinserti128   $0x1,%xmm0,%ymm1,%ymm0
@@ -45990,7 +45629,7 @@
   .byte  196,227,125,2,193,15                // vpblendd      $0xf,%ymm1,%ymm0,%ymm0
   .byte  196,193,122,126,12,80               // vmovq         (%r8,%rdx,2),%xmm1
   .byte  196,227,125,2,193,3                 // vpblendd      $0x3,%ymm1,%ymm0,%ymm0
-  .byte  233,155,0,0,0                       // jmpq          2ec2d <_sk_load_565_hsw_lowp+0x147>
+  .byte  233,155,0,0,0                       // jmpq          2e45d <_sk_load_565_hsw_lowp+0x147>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,193,121,196,76,80,20,2          // vpinsrw       $0x2,0x14(%r8,%rdx,2),%xmm0,%xmm1
   .byte  196,227,125,56,193,1                // vinserti128   $0x1,%xmm1,%ymm0,%ymm0
@@ -46002,7 +45641,7 @@
   .byte  196,227,125,56,193,1                // vinserti128   $0x1,%xmm1,%ymm0,%ymm0
   .byte  196,193,122,111,12,80               // vmovdqu       (%r8,%rdx,2),%xmm1
   .byte  196,227,117,2,192,240               // vpblendd      $0xf0,%ymm0,%ymm1,%ymm0
-  .byte  235,83                              // jmp           2ec2d <_sk_load_565_hsw_lowp+0x147>
+  .byte  235,83                              // jmp           2e45d <_sk_load_565_hsw_lowp+0x147>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,193,121,196,76,80,28,6          // vpinsrw       $0x6,0x1c(%r8,%rdx,2),%xmm0,%xmm1
   .byte  196,227,125,56,193,1                // vinserti128   $0x1,%xmm1,%ymm0,%ymm0
@@ -46016,13 +45655,13 @@
   .byte  196,193,122,111,20,80               // vmovdqu       (%r8,%rdx,2),%xmm2
   .byte  196,227,109,56,201,1                // vinserti128   $0x1,%xmm1,%ymm2,%ymm1
   .byte  196,227,117,2,192,192               // vpblendd      $0xc0,%ymm0,%ymm1,%ymm0
-  .byte  196,226,125,121,13,106,199,0,0      // vpbroadcastw  0xc76a(%rip),%ymm1        # 3b3a0 <_sk_srcover_bgra_8888_sse2_lowp+0xad4>
+  .byte  196,226,125,121,13,122,199,0,0      // vpbroadcastw  0xc77a(%rip),%ymm1        # 3abe0 <_sk_srcover_bgra_8888_sse2_lowp+0xae4>
   .byte  197,237,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm2
   .byte  197,237,219,201                     // vpand         %ymm1,%ymm2,%ymm1
   .byte  197,237,113,208,5                   // vpsrlw        $0x5,%ymm0,%ymm2
-  .byte  196,226,125,121,29,85,199,0,0       // vpbroadcastw  0xc755(%rip),%ymm3        # 3b3a2 <_sk_srcover_bgra_8888_sse2_lowp+0xad6>
+  .byte  196,226,125,121,29,101,199,0,0      // vpbroadcastw  0xc765(%rip),%ymm3        # 3abe2 <_sk_srcover_bgra_8888_sse2_lowp+0xae6>
   .byte  197,237,219,211                     // vpand         %ymm3,%ymm2,%ymm2
-  .byte  196,226,125,121,29,74,199,0,0       // vpbroadcastw  0xc74a(%rip),%ymm3        # 3b3a4 <_sk_srcover_bgra_8888_sse2_lowp+0xad8>
+  .byte  196,226,125,121,29,90,199,0,0       // vpbroadcastw  0xc75a(%rip),%ymm3        # 3abe4 <_sk_srcover_bgra_8888_sse2_lowp+0xae8>
   .byte  197,253,219,219                     // vpand         %ymm3,%ymm0,%ymm3
   .byte  197,253,113,208,13                  // vpsrlw        $0xd,%ymm0,%ymm0
   .byte  197,245,235,192                     // vpor          %ymm0,%ymm1,%ymm0
@@ -46033,7 +45672,7 @@
   .byte  197,229,113,211,2                   // vpsrlw        $0x2,%ymm3,%ymm3
   .byte  197,237,235,211                     // vpor          %ymm3,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,121,29,24,199,0,0       // vpbroadcastw  0xc718(%rip),%ymm3        # 3b3a6 <_sk_srcover_bgra_8888_sse2_lowp+0xada>
+  .byte  196,226,125,121,29,40,199,0,0       // vpbroadcastw  0xc728(%rip),%ymm3        # 3abe6 <_sk_srcover_bgra_8888_sse2_lowp+0xaea>
   .byte  255,224                             // jmpq          *%rax
   .byte  135,254                             // xchg          %edi,%esi
   .byte  255                                 // (bad)
@@ -46083,24 +45722,24 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,37                              // ja            2ed0b <_sk_load_565_dst_hsw_lowp+0x3f>
+  .byte  119,37                              // ja            2e53b <_sk_load_565_dst_hsw_lowp+0x3f>
   .byte  197,221,239,228                     // vpxor         %ymm4,%ymm4,%ymm4
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,132,1,0,0                 // lea           0x184(%rip),%r9        # 2ee78 <_sk_load_565_dst_hsw_lowp+0x1ac>
+  .byte  76,141,13,132,1,0,0                 // lea           0x184(%rip),%r9        # 2e6a8 <_sk_load_565_dst_hsw_lowp+0x1ac>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  233,8,1,0,0                         // jmpq          2ee13 <_sk_load_565_dst_hsw_lowp+0x147>
+  .byte  233,8,1,0,0                         // jmpq          2e643 <_sk_load_565_dst_hsw_lowp+0x147>
   .byte  196,193,126,111,36,80               // vmovdqu       (%r8,%rdx,2),%ymm4
-  .byte  233,253,0,0,0                       // jmpq          2ee13 <_sk_load_565_dst_hsw_lowp+0x147>
+  .byte  233,253,0,0,0                       // jmpq          2e643 <_sk_load_565_dst_hsw_lowp+0x147>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,193,89,196,108,80,4,2           // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm4,%xmm5
   .byte  196,227,85,56,228,1                 // vinserti128   $0x1,%xmm4,%ymm5,%ymm4
   .byte  196,193,121,110,44,80               // vmovd         (%r8,%rdx,2),%xmm5
   .byte  196,227,93,2,229,1                  // vpblendd      $0x1,%ymm5,%ymm4,%ymm4
-  .byte  233,218,0,0,0                       // jmpq          2ee13 <_sk_load_565_dst_hsw_lowp+0x147>
+  .byte  233,218,0,0,0                       // jmpq          2e643 <_sk_load_565_dst_hsw_lowp+0x147>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,193,89,196,108,80,12,6          // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm4,%xmm5
   .byte  196,227,85,56,228,1                 // vinserti128   $0x1,%xmm4,%ymm5,%ymm4
@@ -46110,7 +45749,7 @@
   .byte  196,227,93,2,229,15                 // vpblendd      $0xf,%ymm5,%ymm4,%ymm4
   .byte  196,193,122,126,44,80               // vmovq         (%r8,%rdx,2),%xmm5
   .byte  196,227,93,2,229,3                  // vpblendd      $0x3,%ymm5,%ymm4,%ymm4
-  .byte  233,155,0,0,0                       // jmpq          2ee13 <_sk_load_565_dst_hsw_lowp+0x147>
+  .byte  233,155,0,0,0                       // jmpq          2e643 <_sk_load_565_dst_hsw_lowp+0x147>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,193,89,196,108,80,20,2          // vpinsrw       $0x2,0x14(%r8,%rdx,2),%xmm4,%xmm5
   .byte  196,227,93,56,229,1                 // vinserti128   $0x1,%xmm5,%ymm4,%ymm4
@@ -46122,7 +45761,7 @@
   .byte  196,227,93,56,229,1                 // vinserti128   $0x1,%xmm5,%ymm4,%ymm4
   .byte  196,193,122,111,44,80               // vmovdqu       (%r8,%rdx,2),%xmm5
   .byte  196,227,85,2,228,240                // vpblendd      $0xf0,%ymm4,%ymm5,%ymm4
-  .byte  235,83                              // jmp           2ee13 <_sk_load_565_dst_hsw_lowp+0x147>
+  .byte  235,83                              // jmp           2e643 <_sk_load_565_dst_hsw_lowp+0x147>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,193,89,196,108,80,28,6          // vpinsrw       $0x6,0x1c(%r8,%rdx,2),%xmm4,%xmm5
   .byte  196,227,93,56,229,1                 // vinserti128   $0x1,%xmm5,%ymm4,%ymm4
@@ -46136,13 +45775,13 @@
   .byte  196,193,122,111,52,80               // vmovdqu       (%r8,%rdx,2),%xmm6
   .byte  196,227,77,56,237,1                 // vinserti128   $0x1,%xmm5,%ymm6,%ymm5
   .byte  196,227,85,2,228,192                // vpblendd      $0xc0,%ymm4,%ymm5,%ymm4
-  .byte  196,226,125,121,45,140,197,0,0      // vpbroadcastw  0xc58c(%rip),%ymm5        # 3b3a8 <_sk_srcover_bgra_8888_sse2_lowp+0xadc>
+  .byte  196,226,125,121,45,156,197,0,0      // vpbroadcastw  0xc59c(%rip),%ymm5        # 3abe8 <_sk_srcover_bgra_8888_sse2_lowp+0xaec>
   .byte  197,205,113,212,8                   // vpsrlw        $0x8,%ymm4,%ymm6
   .byte  197,205,219,237                     // vpand         %ymm5,%ymm6,%ymm5
   .byte  197,205,113,212,5                   // vpsrlw        $0x5,%ymm4,%ymm6
-  .byte  196,226,125,121,61,119,197,0,0      // vpbroadcastw  0xc577(%rip),%ymm7        # 3b3aa <_sk_srcover_bgra_8888_sse2_lowp+0xade>
+  .byte  196,226,125,121,61,135,197,0,0      // vpbroadcastw  0xc587(%rip),%ymm7        # 3abea <_sk_srcover_bgra_8888_sse2_lowp+0xaee>
   .byte  197,205,219,247                     // vpand         %ymm7,%ymm6,%ymm6
-  .byte  196,226,125,121,61,108,197,0,0      // vpbroadcastw  0xc56c(%rip),%ymm7        # 3b3ac <_sk_srcover_bgra_8888_sse2_lowp+0xae0>
+  .byte  196,226,125,121,61,124,197,0,0      // vpbroadcastw  0xc57c(%rip),%ymm7        # 3abec <_sk_srcover_bgra_8888_sse2_lowp+0xaf0>
   .byte  197,221,219,255                     // vpand         %ymm7,%ymm4,%ymm7
   .byte  197,221,113,212,13                  // vpsrlw        $0xd,%ymm4,%ymm4
   .byte  197,213,235,228                     // vpor          %ymm4,%ymm5,%ymm4
@@ -46153,7 +45792,7 @@
   .byte  197,197,113,215,2                   // vpsrlw        $0x2,%ymm7,%ymm7
   .byte  197,205,235,247                     // vpor          %ymm7,%ymm6,%ymm6
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,121,61,58,197,0,0       // vpbroadcastw  0xc53a(%rip),%ymm7        # 3b3ae <_sk_srcover_bgra_8888_sse2_lowp+0xae2>
+  .byte  196,226,125,121,61,74,197,0,0       // vpbroadcastw  0xc54a(%rip),%ymm7        # 3abee <_sk_srcover_bgra_8888_sse2_lowp+0xaf2>
   .byte  255,224                             // jmpq          *%rax
   .byte  102,144                             // xchg          %ax,%ax
   .byte  133,254                             // test          %edi,%esi
@@ -46204,10 +45843,10 @@
   .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  196,98,125,121,5,227,196,0,0        // vpbroadcastw  0xc4e3(%rip),%ymm8        # 3b3b0 <_sk_srcover_bgra_8888_sse2_lowp+0xae4>
+  .byte  196,98,125,121,5,243,196,0,0        // vpbroadcastw  0xc4f3(%rip),%ymm8        # 3abf0 <_sk_srcover_bgra_8888_sse2_lowp+0xaf4>
   .byte  197,181,113,240,8                   // vpsllw        $0x8,%ymm0,%ymm9
   .byte  196,65,53,219,192                   // vpand         %ymm8,%ymm9,%ymm8
-  .byte  196,98,125,121,13,210,196,0,0       // vpbroadcastw  0xc4d2(%rip),%ymm9        # 3b3b2 <_sk_srcover_bgra_8888_sse2_lowp+0xae6>
+  .byte  196,98,125,121,13,226,196,0,0       // vpbroadcastw  0xc4e2(%rip),%ymm9        # 3abf2 <_sk_srcover_bgra_8888_sse2_lowp+0xaf6>
   .byte  197,173,113,241,3                   // vpsllw        $0x3,%ymm1,%ymm10
   .byte  196,65,45,219,201                   // vpand         %ymm9,%ymm10,%ymm9
   .byte  196,65,53,235,192                   // vpor          %ymm8,%ymm9,%ymm8
@@ -46217,31 +45856,31 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,31                              // ja            2ef22 <_sk_store_565_hsw_lowp+0x6e>
+  .byte  119,31                              // ja            2e752 <_sk_store_565_hsw_lowp+0x6e>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,195,0,0,0                 // lea           0xc3(%rip),%r9        # 2efd0 <_sk_store_565_hsw_lowp+0x11c>
+  .byte  76,141,13,195,0,0,0                 // lea           0xc3(%rip),%r9        # 2e800 <_sk_store_565_hsw_lowp+0x11c>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,67,121,21,4,80,0                // vpextrw       $0x0,%xmm8,(%r8,%rdx,2)
-  .byte  233,167,0,0,0                       // jmpq          2efc9 <_sk_store_565_hsw_lowp+0x115>
+  .byte  233,167,0,0,0                       // jmpq          2e7f9 <_sk_store_565_hsw_lowp+0x115>
   .byte  196,65,126,127,4,80                 // vmovdqu       %ymm8,(%r8,%rdx,2)
-  .byte  233,156,0,0,0                       // jmpq          2efc9 <_sk_store_565_hsw_lowp+0x115>
+  .byte  233,156,0,0,0                       // jmpq          2e7f9 <_sk_store_565_hsw_lowp+0x115>
   .byte  196,67,121,21,68,80,4,2             // vpextrw       $0x2,%xmm8,0x4(%r8,%rdx,2)
   .byte  196,65,121,126,4,80                 // vmovd         %xmm8,(%r8,%rdx,2)
-  .byte  233,137,0,0,0                       // jmpq          2efc9 <_sk_store_565_hsw_lowp+0x115>
+  .byte  233,137,0,0,0                       // jmpq          2e7f9 <_sk_store_565_hsw_lowp+0x115>
   .byte  196,67,121,21,68,80,12,6            // vpextrw       $0x6,%xmm8,0xc(%r8,%rdx,2)
   .byte  196,67,121,21,68,80,10,5            // vpextrw       $0x5,%xmm8,0xa(%r8,%rdx,2)
   .byte  196,67,121,21,68,80,8,4             // vpextrw       $0x4,%xmm8,0x8(%r8,%rdx,2)
   .byte  196,65,121,214,4,80                 // vmovq         %xmm8,(%r8,%rdx,2)
-  .byte  235,105                             // jmp           2efc9 <_sk_store_565_hsw_lowp+0x115>
+  .byte  235,105                             // jmp           2e7f9 <_sk_store_565_hsw_lowp+0x115>
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,67,121,21,76,80,20,2            // vpextrw       $0x2,%xmm9,0x14(%r8,%rdx,2)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,67,121,21,76,80,18,1            // vpextrw       $0x1,%xmm9,0x12(%r8,%rdx,2)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,67,121,21,76,80,16,0            // vpextrw       $0x0,%xmm9,0x10(%r8,%rdx,2)
-  .byte  235,55                              // jmp           2efc3 <_sk_store_565_hsw_lowp+0x10f>
+  .byte  235,55                              // jmp           2e7f3 <_sk_store_565_hsw_lowp+0x10f>
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,67,121,21,76,80,28,6            // vpextrw       $0x6,%xmm9,0x1c(%r8,%rdx,2)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
@@ -46264,7 +45903,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  120,255                             // js            2efe5 <_sk_store_565_hsw_lowp+0x131>
+  .byte  120,255                             // js            2e815 <_sk_store_565_hsw_lowp+0x131>
   .byte  255                                 // (bad)
   .byte  255,112,255                         // pushq         -0x1(%rax)
   .byte  255                                 // (bad)
@@ -46376,13 +46015,13 @@
   .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
   .byte  197,249,196,192,7                   // vpinsrw       $0x7,%eax,%xmm0,%xmm0
   .byte  196,227,125,56,193,1                // vinserti128   $0x1,%xmm1,%ymm0,%ymm0
-  .byte  196,226,125,121,13,22,194,0,0       // vpbroadcastw  0xc216(%rip),%ymm1        # 3b3b4 <_sk_srcover_bgra_8888_sse2_lowp+0xae8>
+  .byte  196,226,125,121,13,38,194,0,0       // vpbroadcastw  0xc226(%rip),%ymm1        # 3abf4 <_sk_srcover_bgra_8888_sse2_lowp+0xaf8>
   .byte  197,237,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm2
   .byte  197,237,219,201                     // vpand         %ymm1,%ymm2,%ymm1
   .byte  197,237,113,208,5                   // vpsrlw        $0x5,%ymm0,%ymm2
-  .byte  196,226,125,121,29,1,194,0,0        // vpbroadcastw  0xc201(%rip),%ymm3        # 3b3b6 <_sk_srcover_bgra_8888_sse2_lowp+0xaea>
+  .byte  196,226,125,121,29,17,194,0,0       // vpbroadcastw  0xc211(%rip),%ymm3        # 3abf6 <_sk_srcover_bgra_8888_sse2_lowp+0xafa>
   .byte  197,237,219,211                     // vpand         %ymm3,%ymm2,%ymm2
-  .byte  196,226,125,121,29,246,193,0,0      // vpbroadcastw  0xc1f6(%rip),%ymm3        # 3b3b8 <_sk_srcover_bgra_8888_sse2_lowp+0xaec>
+  .byte  196,226,125,121,29,6,194,0,0        // vpbroadcastw  0xc206(%rip),%ymm3        # 3abf8 <_sk_srcover_bgra_8888_sse2_lowp+0xafc>
   .byte  197,253,219,219                     // vpand         %ymm3,%ymm0,%ymm3
   .byte  197,253,113,208,13                  // vpsrlw        $0xd,%ymm0,%ymm0
   .byte  197,245,235,192                     // vpor          %ymm0,%ymm1,%ymm0
@@ -46393,7 +46032,7 @@
   .byte  197,229,113,211,2                   // vpsrlw        $0x2,%ymm3,%ymm3
   .byte  197,237,235,211                     // vpor          %ymm3,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,121,29,196,193,0,0      // vpbroadcastw  0xc1c4(%rip),%ymm3        # 3b3ba <_sk_srcover_bgra_8888_sse2_lowp+0xaee>
+  .byte  196,226,125,121,29,212,193,0,0      // vpbroadcastw  0xc1d4(%rip),%ymm3        # 3abfa <_sk_srcover_bgra_8888_sse2_lowp+0xafe>
   .byte  255,224                             // jmpq          *%rax
 
 HIDDEN _sk_load_4444_hsw_lowp
@@ -46409,24 +46048,24 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,37                              // ja            2f237 <_sk_load_4444_hsw_lowp+0x3f>
+  .byte  119,37                              // ja            2ea67 <_sk_load_4444_hsw_lowp+0x3f>
   .byte  197,253,239,192                     // vpxor         %ymm0,%ymm0,%ymm0
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,112,1,0,0                 // lea           0x170(%rip),%r9        # 2f390 <_sk_load_4444_hsw_lowp+0x198>
+  .byte  76,141,13,112,1,0,0                 // lea           0x170(%rip),%r9        # 2ebc0 <_sk_load_4444_hsw_lowp+0x198>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  233,8,1,0,0                         // jmpq          2f33f <_sk_load_4444_hsw_lowp+0x147>
+  .byte  233,8,1,0,0                         // jmpq          2eb6f <_sk_load_4444_hsw_lowp+0x147>
   .byte  196,193,126,111,4,80                // vmovdqu       (%r8,%rdx,2),%ymm0
-  .byte  233,253,0,0,0                       // jmpq          2f33f <_sk_load_4444_hsw_lowp+0x147>
+  .byte  233,253,0,0,0                       // jmpq          2eb6f <_sk_load_4444_hsw_lowp+0x147>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,193,121,196,76,80,4,2           // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm0,%xmm1
   .byte  196,227,117,56,192,1                // vinserti128   $0x1,%xmm0,%ymm1,%ymm0
   .byte  196,193,121,110,12,80               // vmovd         (%r8,%rdx,2),%xmm1
   .byte  196,227,125,2,193,1                 // vpblendd      $0x1,%ymm1,%ymm0,%ymm0
-  .byte  233,218,0,0,0                       // jmpq          2f33f <_sk_load_4444_hsw_lowp+0x147>
+  .byte  233,218,0,0,0                       // jmpq          2eb6f <_sk_load_4444_hsw_lowp+0x147>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,193,121,196,76,80,12,6          // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm0,%xmm1
   .byte  196,227,117,56,192,1                // vinserti128   $0x1,%xmm0,%ymm1,%ymm0
@@ -46436,7 +46075,7 @@
   .byte  196,227,125,2,193,15                // vpblendd      $0xf,%ymm1,%ymm0,%ymm0
   .byte  196,193,122,126,12,80               // vmovq         (%r8,%rdx,2),%xmm1
   .byte  196,227,125,2,193,3                 // vpblendd      $0x3,%ymm1,%ymm0,%ymm0
-  .byte  233,155,0,0,0                       // jmpq          2f33f <_sk_load_4444_hsw_lowp+0x147>
+  .byte  233,155,0,0,0                       // jmpq          2eb6f <_sk_load_4444_hsw_lowp+0x147>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,193,121,196,76,80,20,2          // vpinsrw       $0x2,0x14(%r8,%rdx,2),%xmm0,%xmm1
   .byte  196,227,125,56,193,1                // vinserti128   $0x1,%xmm1,%ymm0,%ymm0
@@ -46448,7 +46087,7 @@
   .byte  196,227,125,56,193,1                // vinserti128   $0x1,%xmm1,%ymm0,%ymm0
   .byte  196,193,122,111,12,80               // vmovdqu       (%r8,%rdx,2),%xmm1
   .byte  196,227,117,2,192,240               // vpblendd      $0xf0,%ymm0,%ymm1,%ymm0
-  .byte  235,83                              // jmp           2f33f <_sk_load_4444_hsw_lowp+0x147>
+  .byte  235,83                              // jmp           2eb6f <_sk_load_4444_hsw_lowp+0x147>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,193,121,196,76,80,28,6          // vpinsrw       $0x6,0x1c(%r8,%rdx,2),%xmm0,%xmm1
   .byte  196,227,125,56,193,1                // vinserti128   $0x1,%xmm1,%ymm0,%ymm0
@@ -46464,7 +46103,7 @@
   .byte  196,227,117,2,192,192               // vpblendd      $0xc0,%ymm0,%ymm1,%ymm0
   .byte  197,245,113,208,12                  // vpsrlw        $0xc,%ymm0,%ymm1
   .byte  197,237,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm2
-  .byte  196,226,125,121,29,106,192,0,0      // vpbroadcastw  0xc06a(%rip),%ymm3        # 3b3bc <_sk_srcover_bgra_8888_sse2_lowp+0xaf0>
+  .byte  196,226,125,121,29,122,192,0,0      // vpbroadcastw  0xc07a(%rip),%ymm3        # 3abfc <_sk_srcover_bgra_8888_sse2_lowp+0xb00>
   .byte  197,237,219,211                     // vpand         %ymm3,%ymm2,%ymm2
   .byte  197,189,113,208,4                   // vpsrlw        $0x4,%ymm0,%ymm8
   .byte  197,61,219,195                      // vpand         %ymm3,%ymm8,%ymm8
@@ -46529,24 +46168,24 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,37                              // ja            2f40b <_sk_load_4444_dst_hsw_lowp+0x3f>
+  .byte  119,37                              // ja            2ec3b <_sk_load_4444_dst_hsw_lowp+0x3f>
   .byte  197,221,239,228                     // vpxor         %ymm4,%ymm4,%ymm4
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,112,1,0,0                 // lea           0x170(%rip),%r9        # 2f564 <_sk_load_4444_dst_hsw_lowp+0x198>
+  .byte  76,141,13,112,1,0,0                 // lea           0x170(%rip),%r9        # 2ed94 <_sk_load_4444_dst_hsw_lowp+0x198>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  233,8,1,0,0                         // jmpq          2f513 <_sk_load_4444_dst_hsw_lowp+0x147>
+  .byte  233,8,1,0,0                         // jmpq          2ed43 <_sk_load_4444_dst_hsw_lowp+0x147>
   .byte  196,193,126,111,36,80               // vmovdqu       (%r8,%rdx,2),%ymm4
-  .byte  233,253,0,0,0                       // jmpq          2f513 <_sk_load_4444_dst_hsw_lowp+0x147>
+  .byte  233,253,0,0,0                       // jmpq          2ed43 <_sk_load_4444_dst_hsw_lowp+0x147>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,193,89,196,108,80,4,2           // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm4,%xmm5
   .byte  196,227,85,56,228,1                 // vinserti128   $0x1,%xmm4,%ymm5,%ymm4
   .byte  196,193,121,110,44,80               // vmovd         (%r8,%rdx,2),%xmm5
   .byte  196,227,93,2,229,1                  // vpblendd      $0x1,%ymm5,%ymm4,%ymm4
-  .byte  233,218,0,0,0                       // jmpq          2f513 <_sk_load_4444_dst_hsw_lowp+0x147>
+  .byte  233,218,0,0,0                       // jmpq          2ed43 <_sk_load_4444_dst_hsw_lowp+0x147>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,193,89,196,108,80,12,6          // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm4,%xmm5
   .byte  196,227,85,56,228,1                 // vinserti128   $0x1,%xmm4,%ymm5,%ymm4
@@ -46556,7 +46195,7 @@
   .byte  196,227,93,2,229,15                 // vpblendd      $0xf,%ymm5,%ymm4,%ymm4
   .byte  196,193,122,126,44,80               // vmovq         (%r8,%rdx,2),%xmm5
   .byte  196,227,93,2,229,3                  // vpblendd      $0x3,%ymm5,%ymm4,%ymm4
-  .byte  233,155,0,0,0                       // jmpq          2f513 <_sk_load_4444_dst_hsw_lowp+0x147>
+  .byte  233,155,0,0,0                       // jmpq          2ed43 <_sk_load_4444_dst_hsw_lowp+0x147>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,193,89,196,108,80,20,2          // vpinsrw       $0x2,0x14(%r8,%rdx,2),%xmm4,%xmm5
   .byte  196,227,93,56,229,1                 // vinserti128   $0x1,%xmm5,%ymm4,%ymm4
@@ -46568,7 +46207,7 @@
   .byte  196,227,93,56,229,1                 // vinserti128   $0x1,%xmm5,%ymm4,%ymm4
   .byte  196,193,122,111,44,80               // vmovdqu       (%r8,%rdx,2),%xmm5
   .byte  196,227,85,2,228,240                // vpblendd      $0xf0,%ymm4,%ymm5,%ymm4
-  .byte  235,83                              // jmp           2f513 <_sk_load_4444_dst_hsw_lowp+0x147>
+  .byte  235,83                              // jmp           2ed43 <_sk_load_4444_dst_hsw_lowp+0x147>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,193,89,196,108,80,28,6          // vpinsrw       $0x6,0x1c(%r8,%rdx,2),%xmm4,%xmm5
   .byte  196,227,93,56,229,1                 // vinserti128   $0x1,%xmm5,%ymm4,%ymm4
@@ -46584,7 +46223,7 @@
   .byte  196,227,85,2,228,192                // vpblendd      $0xc0,%ymm4,%ymm5,%ymm4
   .byte  197,213,113,212,12                  // vpsrlw        $0xc,%ymm4,%ymm5
   .byte  197,205,113,212,8                   // vpsrlw        $0x8,%ymm4,%ymm6
-  .byte  196,226,125,121,61,152,190,0,0      // vpbroadcastw  0xbe98(%rip),%ymm7        # 3b3be <_sk_srcover_bgra_8888_sse2_lowp+0xaf2>
+  .byte  196,226,125,121,61,168,190,0,0      // vpbroadcastw  0xbea8(%rip),%ymm7        # 3abfe <_sk_srcover_bgra_8888_sse2_lowp+0xb02>
   .byte  197,205,219,247                     // vpand         %ymm7,%ymm6,%ymm6
   .byte  197,189,113,212,4                   // vpsrlw        $0x4,%ymm4,%ymm8
   .byte  197,61,219,199                      // vpand         %ymm7,%ymm8,%ymm8
@@ -46645,13 +46284,13 @@
   .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  196,98,125,121,5,7,190,0,0          // vpbroadcastw  0xbe07(%rip),%ymm8        # 3b3c0 <_sk_srcover_bgra_8888_sse2_lowp+0xaf4>
+  .byte  196,98,125,121,5,23,190,0,0         // vpbroadcastw  0xbe17(%rip),%ymm8        # 3ac00 <_sk_srcover_bgra_8888_sse2_lowp+0xb04>
   .byte  197,181,113,240,8                   // vpsllw        $0x8,%ymm0,%ymm9
   .byte  196,65,53,219,192                   // vpand         %ymm8,%ymm9,%ymm8
   .byte  197,181,113,241,4                   // vpsllw        $0x4,%ymm1,%ymm9
-  .byte  197,53,219,13,16,190,0,0            // vpand         0xbe10(%rip),%ymm9,%ymm9        # 3b3e0 <_sk_srcover_bgra_8888_sse2_lowp+0xb14>
+  .byte  197,53,219,13,32,190,0,0            // vpand         0xbe20(%rip),%ymm9,%ymm9        # 3ac20 <_sk_srcover_bgra_8888_sse2_lowp+0xb24>
   .byte  196,65,53,235,192                   // vpor          %ymm8,%ymm9,%ymm8
-  .byte  196,98,125,121,13,34,190,0,0        // vpbroadcastw  0xbe22(%rip),%ymm9        # 3b400 <_sk_srcover_bgra_8888_sse2_lowp+0xb34>
+  .byte  196,98,125,121,13,50,190,0,0        // vpbroadcastw  0xbe32(%rip),%ymm9        # 3ac40 <_sk_srcover_bgra_8888_sse2_lowp+0xb44>
   .byte  196,65,109,219,201                  // vpand         %ymm9,%ymm2,%ymm9
   .byte  197,173,113,211,4                   // vpsrlw        $0x4,%ymm3,%ymm10
   .byte  196,65,53,235,202                   // vpor          %ymm10,%ymm9,%ymm9
@@ -46660,31 +46299,31 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,31                              // ja            2f61b <_sk_store_4444_hsw_lowp+0x7b>
+  .byte  119,31                              // ja            2ee4b <_sk_store_4444_hsw_lowp+0x7b>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,194,0,0,0                 // lea           0xc2(%rip),%r9        # 2f6c8 <_sk_store_4444_hsw_lowp+0x128>
+  .byte  76,141,13,194,0,0,0                 // lea           0xc2(%rip),%r9        # 2eef8 <_sk_store_4444_hsw_lowp+0x128>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,67,121,21,4,80,0                // vpextrw       $0x0,%xmm8,(%r8,%rdx,2)
-  .byte  233,167,0,0,0                       // jmpq          2f6c2 <_sk_store_4444_hsw_lowp+0x122>
+  .byte  233,167,0,0,0                       // jmpq          2eef2 <_sk_store_4444_hsw_lowp+0x122>
   .byte  196,65,126,127,4,80                 // vmovdqu       %ymm8,(%r8,%rdx,2)
-  .byte  233,156,0,0,0                       // jmpq          2f6c2 <_sk_store_4444_hsw_lowp+0x122>
+  .byte  233,156,0,0,0                       // jmpq          2eef2 <_sk_store_4444_hsw_lowp+0x122>
   .byte  196,67,121,21,68,80,4,2             // vpextrw       $0x2,%xmm8,0x4(%r8,%rdx,2)
   .byte  196,65,121,126,4,80                 // vmovd         %xmm8,(%r8,%rdx,2)
-  .byte  233,137,0,0,0                       // jmpq          2f6c2 <_sk_store_4444_hsw_lowp+0x122>
+  .byte  233,137,0,0,0                       // jmpq          2eef2 <_sk_store_4444_hsw_lowp+0x122>
   .byte  196,67,121,21,68,80,12,6            // vpextrw       $0x6,%xmm8,0xc(%r8,%rdx,2)
   .byte  196,67,121,21,68,80,10,5            // vpextrw       $0x5,%xmm8,0xa(%r8,%rdx,2)
   .byte  196,67,121,21,68,80,8,4             // vpextrw       $0x4,%xmm8,0x8(%r8,%rdx,2)
   .byte  196,65,121,214,4,80                 // vmovq         %xmm8,(%r8,%rdx,2)
-  .byte  235,105                             // jmp           2f6c2 <_sk_store_4444_hsw_lowp+0x122>
+  .byte  235,105                             // jmp           2eef2 <_sk_store_4444_hsw_lowp+0x122>
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,67,121,21,76,80,20,2            // vpextrw       $0x2,%xmm9,0x14(%r8,%rdx,2)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,67,121,21,76,80,18,1            // vpextrw       $0x1,%xmm9,0x12(%r8,%rdx,2)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,67,121,21,76,80,16,0            // vpextrw       $0x0,%xmm9,0x10(%r8,%rdx,2)
-  .byte  235,55                              // jmp           2f6bc <_sk_store_4444_hsw_lowp+0x11c>
+  .byte  235,55                              // jmp           2eeec <_sk_store_4444_hsw_lowp+0x11c>
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,67,121,21,76,80,28,6            // vpextrw       $0x6,%xmm9,0x1c(%r8,%rdx,2)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
@@ -46707,7 +46346,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  121,255                             // jns           2f6dd <_sk_store_4444_hsw_lowp+0x13d>
+  .byte  121,255                             // jns           2ef0d <_sk_store_4444_hsw_lowp+0x13d>
   .byte  255                                 // (bad)
   .byte  255,113,255                         // pushq         -0x1(%rcx)
   .byte  255                                 // (bad)
@@ -46822,7 +46461,7 @@
   .byte  196,227,125,56,193,1                // vinserti128   $0x1,%xmm1,%ymm0,%ymm0
   .byte  197,245,113,208,12                  // vpsrlw        $0xc,%ymm0,%ymm1
   .byte  197,237,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm2
-  .byte  196,226,125,121,29,98,187,0,0       // vpbroadcastw  0xbb62(%rip),%ymm3        # 3b402 <_sk_srcover_bgra_8888_sse2_lowp+0xb36>
+  .byte  196,226,125,121,29,114,187,0,0      // vpbroadcastw  0xbb72(%rip),%ymm3        # 3ac42 <_sk_srcover_bgra_8888_sse2_lowp+0xb46>
   .byte  197,237,219,211                     // vpand         %ymm3,%ymm2,%ymm2
   .byte  197,189,113,208,4                   // vpsrlw        $0x4,%ymm0,%ymm8
   .byte  197,61,219,195                      // vpand         %ymm3,%ymm8,%ymm8
@@ -46850,38 +46489,38 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,37                              // ja            2f917 <_sk_load_a8_hsw_lowp+0x3c>
+  .byte  119,37                              // ja            2f147 <_sk_load_a8_hsw_lowp+0x3c>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,220,0,0,0                 // lea           0xdc(%rip),%r9        # 2f9dc <_sk_load_a8_hsw_lowp+0x101>
+  .byte  76,141,13,220,0,0,0                 // lea           0xdc(%rip),%r9        # 2f20c <_sk_load_a8_hsw_lowp+0x101>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  233,175,0,0,0                       // jmpq          2f9c6 <_sk_load_a8_hsw_lowp+0xeb>
+  .byte  233,175,0,0,0                       // jmpq          2f1f6 <_sk_load_a8_hsw_lowp+0xeb>
   .byte  196,193,122,111,4,16                // vmovdqu       (%r8,%rdx,1),%xmm0
-  .byte  233,164,0,0,0                       // jmpq          2f9c6 <_sk_load_a8_hsw_lowp+0xeb>
+  .byte  233,164,0,0,0                       // jmpq          2f1f6 <_sk_load_a8_hsw_lowp+0xeb>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,195,121,32,68,16,2,2            // vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm0,%xmm0
   .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  197,249,110,200                     // vmovd         %eax,%xmm1
   .byte  196,227,121,14,193,1                // vpblendw      $0x1,%xmm1,%xmm0,%xmm0
-  .byte  233,132,0,0,0                       // jmpq          2f9c6 <_sk_load_a8_hsw_lowp+0xeb>
+  .byte  233,132,0,0,0                       // jmpq          2f1f6 <_sk_load_a8_hsw_lowp+0xeb>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,195,121,32,68,16,6,6            // vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,195,121,32,68,16,5,5            // vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,195,121,32,68,16,4,4            // vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,193,121,110,12,16               // vmovd         (%r8,%rdx,1),%xmm1
   .byte  196,227,121,2,193,1                 // vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  .byte  235,90                              // jmp           2f9c6 <_sk_load_a8_hsw_lowp+0xeb>
+  .byte  235,90                              // jmp           2f1f6 <_sk_load_a8_hsw_lowp+0xeb>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,195,121,32,68,16,10,10          // vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,195,121,32,68,16,9,9            // vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,195,121,32,68,16,8,8            // vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,193,122,126,12,16               // vmovq         (%r8,%rdx,1),%xmm1
   .byte  196,227,113,2,192,12                // vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  .byte  235,48                              // jmp           2f9c6 <_sk_load_a8_hsw_lowp+0xeb>
+  .byte  235,48                              // jmp           2f1f6 <_sk_load_a8_hsw_lowp+0xeb>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,195,121,32,68,16,14,14          // vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,195,121,32,68,16,13,13          // vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm0,%xmm0
@@ -46939,38 +46578,38 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,37                              // ja            2fa54 <_sk_load_a8_dst_hsw_lowp+0x3c>
+  .byte  119,37                              // ja            2f284 <_sk_load_a8_dst_hsw_lowp+0x3c>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,219,0,0,0                 // lea           0xdb(%rip),%r9        # 2fb18 <_sk_load_a8_dst_hsw_lowp+0x100>
+  .byte  76,141,13,219,0,0,0                 // lea           0xdb(%rip),%r9        # 2f348 <_sk_load_a8_dst_hsw_lowp+0x100>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  233,175,0,0,0                       // jmpq          2fb03 <_sk_load_a8_dst_hsw_lowp+0xeb>
+  .byte  233,175,0,0,0                       // jmpq          2f333 <_sk_load_a8_dst_hsw_lowp+0xeb>
   .byte  196,193,122,111,36,16               // vmovdqu       (%r8,%rdx,1),%xmm4
-  .byte  233,164,0,0,0                       // jmpq          2fb03 <_sk_load_a8_dst_hsw_lowp+0xeb>
+  .byte  233,164,0,0,0                       // jmpq          2f333 <_sk_load_a8_dst_hsw_lowp+0xeb>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,195,89,32,100,16,2,2            // vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm4,%xmm4
   .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  197,249,110,232                     // vmovd         %eax,%xmm5
   .byte  196,227,89,14,229,1                 // vpblendw      $0x1,%xmm5,%xmm4,%xmm4
-  .byte  233,132,0,0,0                       // jmpq          2fb03 <_sk_load_a8_dst_hsw_lowp+0xeb>
+  .byte  233,132,0,0,0                       // jmpq          2f333 <_sk_load_a8_dst_hsw_lowp+0xeb>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,195,89,32,100,16,6,6            // vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,195,89,32,100,16,5,5            // vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,195,89,32,100,16,4,4            // vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,193,121,110,44,16               // vmovd         (%r8,%rdx,1),%xmm5
   .byte  196,227,89,2,229,1                  // vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  .byte  235,90                              // jmp           2fb03 <_sk_load_a8_dst_hsw_lowp+0xeb>
+  .byte  235,90                              // jmp           2f333 <_sk_load_a8_dst_hsw_lowp+0xeb>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,195,89,32,100,16,10,10          // vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,195,89,32,100,16,9,9            // vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,195,89,32,100,16,8,8            // vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,193,122,126,44,16               // vmovq         (%r8,%rdx,1),%xmm5
   .byte  196,227,81,2,228,12                 // vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  .byte  235,48                              // jmp           2fb03 <_sk_load_a8_dst_hsw_lowp+0xeb>
+  .byte  235,48                              // jmp           2f333 <_sk_load_a8_dst_hsw_lowp+0xeb>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,195,89,32,100,16,14,14          // vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,195,89,32,100,16,13,13          // vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm4,%xmm4
@@ -47027,7 +46666,7 @@
   .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  196,195,125,57,216,1                // vextracti128  $0x1,%ymm3,%xmm8
-  .byte  197,121,111,13,209,192,0,0          // vmovdqa       0xc0d1(%rip),%xmm9        # 3bc40 <_sk_srcover_bgra_8888_sse2_lowp+0x1374>
+  .byte  197,121,111,13,225,192,0,0          // vmovdqa       0xc0e1(%rip),%xmm9        # 3b480 <_sk_srcover_bgra_8888_sse2_lowp+0x1384>
   .byte  196,66,57,0,193                     // vpshufb       %xmm9,%xmm8,%xmm8
   .byte  196,66,97,0,201                     // vpshufb       %xmm9,%xmm3,%xmm9
   .byte  196,65,49,108,192                   // vpunpcklqdq   %xmm8,%xmm9,%xmm8
@@ -47035,28 +46674,28 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,28                              // ja            2fba4 <_sk_store_a8_hsw_lowp+0x50>
+  .byte  119,28                              // ja            2f3d4 <_sk_store_a8_hsw_lowp+0x50>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,146,0,0,0                 // lea           0x92(%rip),%r9        # 2fc24 <_sk_store_a8_hsw_lowp+0xd0>
+  .byte  76,141,13,146,0,0,0                 // lea           0x92(%rip),%r9        # 2f454 <_sk_store_a8_hsw_lowp+0xd0>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,67,121,20,4,16,0                // vpextrb       $0x0,%xmm8,(%r8,%rdx,1)
-  .byte  235,121                             // jmp           2fc1d <_sk_store_a8_hsw_lowp+0xc9>
+  .byte  235,121                             // jmp           2f44d <_sk_store_a8_hsw_lowp+0xc9>
   .byte  196,65,122,127,4,16                 // vmovdqu       %xmm8,(%r8,%rdx,1)
-  .byte  235,113                             // jmp           2fc1d <_sk_store_a8_hsw_lowp+0xc9>
+  .byte  235,113                             // jmp           2f44d <_sk_store_a8_hsw_lowp+0xc9>
   .byte  196,67,121,20,68,16,2,2             // vpextrb       $0x2,%xmm8,0x2(%r8,%rdx,1)
   .byte  196,67,121,21,4,16,0                // vpextrw       $0x0,%xmm8,(%r8,%rdx,1)
-  .byte  235,96                              // jmp           2fc1d <_sk_store_a8_hsw_lowp+0xc9>
+  .byte  235,96                              // jmp           2f44d <_sk_store_a8_hsw_lowp+0xc9>
   .byte  196,67,121,20,68,16,6,6             // vpextrb       $0x6,%xmm8,0x6(%r8,%rdx,1)
   .byte  196,67,121,20,68,16,5,5             // vpextrb       $0x5,%xmm8,0x5(%r8,%rdx,1)
   .byte  196,67,121,20,68,16,4,4             // vpextrb       $0x4,%xmm8,0x4(%r8,%rdx,1)
   .byte  196,65,121,126,4,16                 // vmovd         %xmm8,(%r8,%rdx,1)
-  .byte  235,64                              // jmp           2fc1d <_sk_store_a8_hsw_lowp+0xc9>
+  .byte  235,64                              // jmp           2f44d <_sk_store_a8_hsw_lowp+0xc9>
   .byte  196,67,121,20,68,16,10,10           // vpextrb       $0xa,%xmm8,0xa(%r8,%rdx,1)
   .byte  196,67,121,20,68,16,9,9             // vpextrb       $0x9,%xmm8,0x9(%r8,%rdx,1)
   .byte  196,67,121,20,68,16,8,8             // vpextrb       $0x8,%xmm8,0x8(%r8,%rdx,1)
-  .byte  235,32                              // jmp           2fc17 <_sk_store_a8_hsw_lowp+0xc3>
+  .byte  235,32                              // jmp           2f447 <_sk_store_a8_hsw_lowp+0xc3>
   .byte  196,67,121,20,68,16,14,14           // vpextrb       $0xe,%xmm8,0xe(%r8,%rdx,1)
   .byte  196,67,121,20,68,16,13,13           // vpextrb       $0xd,%xmm8,0xd(%r8,%rdx,1)
   .byte  196,67,121,20,68,16,12,12           // vpextrb       $0xc,%xmm8,0xc(%r8,%rdx,1)
@@ -47065,7 +46704,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  15,31,0                             // nopl          (%rax)
-  .byte  119,255                             // ja            2fc25 <_sk_store_a8_hsw_lowp+0xd1>
+  .byte  119,255                             // ja            2f455 <_sk_store_a8_hsw_lowp+0xd1>
   .byte  255                                 // (bad)
   .byte  255,144,255,255,255,136             // callq         *-0x77000001(%rax)
   .byte  255                                 // (bad)
@@ -47206,38 +46845,38 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,37                              // ja            2fe43 <_sk_load_g8_hsw_lowp+0x3c>
+  .byte  119,37                              // ja            2f673 <_sk_load_g8_hsw_lowp+0x3c>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,224,0,0,0                 // lea           0xe0(%rip),%r9        # 2ff0c <_sk_load_g8_hsw_lowp+0x105>
+  .byte  76,141,13,224,0,0,0                 // lea           0xe0(%rip),%r9        # 2f73c <_sk_load_g8_hsw_lowp+0x105>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  233,175,0,0,0                       // jmpq          2fef2 <_sk_load_g8_hsw_lowp+0xeb>
+  .byte  233,175,0,0,0                       // jmpq          2f722 <_sk_load_g8_hsw_lowp+0xeb>
   .byte  196,193,122,111,4,16                // vmovdqu       (%r8,%rdx,1),%xmm0
-  .byte  233,164,0,0,0                       // jmpq          2fef2 <_sk_load_g8_hsw_lowp+0xeb>
+  .byte  233,164,0,0,0                       // jmpq          2f722 <_sk_load_g8_hsw_lowp+0xeb>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,195,121,32,68,16,2,2            // vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm0,%xmm0
   .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  197,249,110,200                     // vmovd         %eax,%xmm1
   .byte  196,227,121,14,193,1                // vpblendw      $0x1,%xmm1,%xmm0,%xmm0
-  .byte  233,132,0,0,0                       // jmpq          2fef2 <_sk_load_g8_hsw_lowp+0xeb>
+  .byte  233,132,0,0,0                       // jmpq          2f722 <_sk_load_g8_hsw_lowp+0xeb>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,195,121,32,68,16,6,6            // vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,195,121,32,68,16,5,5            // vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,195,121,32,68,16,4,4            // vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,193,121,110,12,16               // vmovd         (%r8,%rdx,1),%xmm1
   .byte  196,227,121,2,193,1                 // vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  .byte  235,90                              // jmp           2fef2 <_sk_load_g8_hsw_lowp+0xeb>
+  .byte  235,90                              // jmp           2f722 <_sk_load_g8_hsw_lowp+0xeb>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,195,121,32,68,16,10,10          // vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,195,121,32,68,16,9,9            // vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,195,121,32,68,16,8,8            // vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,193,122,126,12,16               // vmovq         (%r8,%rdx,1),%xmm1
   .byte  196,227,113,2,192,12                // vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  .byte  235,48                              // jmp           2fef2 <_sk_load_g8_hsw_lowp+0xeb>
+  .byte  235,48                              // jmp           2f722 <_sk_load_g8_hsw_lowp+0xeb>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,195,121,32,68,16,14,14          // vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,195,121,32,68,16,13,13          // vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm0,%xmm0
@@ -47247,7 +46886,7 @@
   .byte  196,227,113,2,192,8                 // vpblendd      $0x8,%xmm0,%xmm1,%xmm0
   .byte  196,226,125,48,192                  // vpmovzxbw     %xmm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,121,29,2,181,0,0        // vpbroadcastw  0xb502(%rip),%ymm3        # 3b404 <_sk_srcover_bgra_8888_sse2_lowp+0xb38>
+  .byte  196,226,125,121,29,18,181,0,0       // vpbroadcastw  0xb512(%rip),%ymm3        # 3ac44 <_sk_srcover_bgra_8888_sse2_lowp+0xb48>
   .byte  197,253,111,200                     // vmovdqa       %ymm0,%ymm1
   .byte  197,253,111,208                     // vmovdqa       %ymm0,%ymm2
   .byte  255,224                             // jmpq          *%rax
@@ -47258,7 +46897,7 @@
   .byte  255,66,255                          // incl          -0x1(%rdx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  126,255                             // jle           2ff19 <_sk_load_g8_hsw_lowp+0x112>
+  .byte  126,255                             // jle           2f749 <_sk_load_g8_hsw_lowp+0x112>
   .byte  255                                 // (bad)
   .byte  255,118,255                         // pushq         -0x1(%rsi)
   .byte  255                                 // (bad)
@@ -47298,38 +46937,38 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,37                              // ja            2ff84 <_sk_load_g8_dst_hsw_lowp+0x3c>
+  .byte  119,37                              // ja            2f7b4 <_sk_load_g8_dst_hsw_lowp+0x3c>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,227,0,0,0                 // lea           0xe3(%rip),%r9        # 30050 <_sk_load_g8_dst_hsw_lowp+0x108>
+  .byte  76,141,13,227,0,0,0                 // lea           0xe3(%rip),%r9        # 2f880 <_sk_load_g8_dst_hsw_lowp+0x108>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  233,175,0,0,0                       // jmpq          30033 <_sk_load_g8_dst_hsw_lowp+0xeb>
+  .byte  233,175,0,0,0                       // jmpq          2f863 <_sk_load_g8_dst_hsw_lowp+0xeb>
   .byte  196,193,122,111,36,16               // vmovdqu       (%r8,%rdx,1),%xmm4
-  .byte  233,164,0,0,0                       // jmpq          30033 <_sk_load_g8_dst_hsw_lowp+0xeb>
+  .byte  233,164,0,0,0                       // jmpq          2f863 <_sk_load_g8_dst_hsw_lowp+0xeb>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,195,89,32,100,16,2,2            // vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm4,%xmm4
   .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  197,249,110,232                     // vmovd         %eax,%xmm5
   .byte  196,227,89,14,229,1                 // vpblendw      $0x1,%xmm5,%xmm4,%xmm4
-  .byte  233,132,0,0,0                       // jmpq          30033 <_sk_load_g8_dst_hsw_lowp+0xeb>
+  .byte  233,132,0,0,0                       // jmpq          2f863 <_sk_load_g8_dst_hsw_lowp+0xeb>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,195,89,32,100,16,6,6            // vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,195,89,32,100,16,5,5            // vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,195,89,32,100,16,4,4            // vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,193,121,110,44,16               // vmovd         (%r8,%rdx,1),%xmm5
   .byte  196,227,89,2,229,1                  // vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  .byte  235,90                              // jmp           30033 <_sk_load_g8_dst_hsw_lowp+0xeb>
+  .byte  235,90                              // jmp           2f863 <_sk_load_g8_dst_hsw_lowp+0xeb>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,195,89,32,100,16,10,10          // vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,195,89,32,100,16,9,9            // vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,195,89,32,100,16,8,8            // vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,193,122,126,44,16               // vmovq         (%r8,%rdx,1),%xmm5
   .byte  196,227,81,2,228,12                 // vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  .byte  235,48                              // jmp           30033 <_sk_load_g8_dst_hsw_lowp+0xeb>
+  .byte  235,48                              // jmp           2f863 <_sk_load_g8_dst_hsw_lowp+0xeb>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,195,89,32,100,16,14,14          // vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,195,89,32,100,16,13,13          // vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm4,%xmm4
@@ -47339,7 +46978,7 @@
   .byte  196,227,81,2,228,8                  // vpblendd      $0x8,%xmm4,%xmm5,%xmm4
   .byte  196,226,125,48,228                  // vpmovzxbw     %xmm4,%ymm4
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,121,61,195,179,0,0      // vpbroadcastw  0xb3c3(%rip),%ymm7        # 3b406 <_sk_srcover_bgra_8888_sse2_lowp+0xb3a>
+  .byte  196,226,125,121,61,211,179,0,0      // vpbroadcastw  0xb3d3(%rip),%ymm7        # 3ac46 <_sk_srcover_bgra_8888_sse2_lowp+0xb4a>
   .byte  197,253,111,236                     // vmovdqa       %ymm4,%ymm5
   .byte  197,253,111,244                     // vmovdqa       %ymm4,%ymm6
   .byte  255,224                             // jmpq          *%rax
@@ -47353,7 +46992,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  123,255                             // jnp           3005d <_sk_load_g8_dst_hsw_lowp+0x115>
+  .byte  123,255                             // jnp           2f88d <_sk_load_g8_dst_hsw_lowp+0x115>
   .byte  255                                 // (bad)
   .byte  255,115,255                         // pushq         -0x1(%rbx)
   .byte  255                                 // (bad)
@@ -47383,12 +47022,12 @@
 .globl _sk_luminance_to_alpha_hsw_lowp
 FUNCTION(_sk_luminance_to_alpha_hsw_lowp)
 _sk_luminance_to_alpha_hsw_lowp:
-  .byte  196,226,125,121,29,115,179,0,0      // vpbroadcastw  0xb373(%rip),%ymm3        # 3b408 <_sk_srcover_bgra_8888_sse2_lowp+0xb3c>
+  .byte  196,226,125,121,29,131,179,0,0      // vpbroadcastw  0xb383(%rip),%ymm3        # 3ac48 <_sk_srcover_bgra_8888_sse2_lowp+0xb4c>
   .byte  197,253,213,195                     // vpmullw       %ymm3,%ymm0,%ymm0
-  .byte  196,226,125,121,29,104,179,0,0      // vpbroadcastw  0xb368(%rip),%ymm3        # 3b40a <_sk_srcover_bgra_8888_sse2_lowp+0xb3e>
+  .byte  196,226,125,121,29,120,179,0,0      // vpbroadcastw  0xb378(%rip),%ymm3        # 3ac4a <_sk_srcover_bgra_8888_sse2_lowp+0xb4e>
   .byte  197,245,213,203                     // vpmullw       %ymm3,%ymm1,%ymm1
   .byte  197,245,253,192                     // vpaddw        %ymm0,%ymm1,%ymm0
-  .byte  196,226,125,121,13,89,179,0,0       // vpbroadcastw  0xb359(%rip),%ymm1        # 3b40c <_sk_srcover_bgra_8888_sse2_lowp+0xb40>
+  .byte  196,226,125,121,13,105,179,0,0      // vpbroadcastw  0xb369(%rip),%ymm1        # 3ac4c <_sk_srcover_bgra_8888_sse2_lowp+0xb50>
   .byte  197,237,213,201                     // vpmullw       %ymm1,%ymm2,%ymm1
   .byte  197,253,253,193                     // vpaddw        %ymm1,%ymm0,%ymm0
   .byte  197,229,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm3
@@ -47487,7 +47126,7 @@
   .byte  196,227,121,32,192,15               // vpinsrb       $0xf,%eax,%xmm0,%xmm0
   .byte  196,226,125,48,192                  // vpmovzxbw     %xmm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,121,29,156,177,0,0      // vpbroadcastw  0xb19c(%rip),%ymm3        # 3b40e <_sk_srcover_bgra_8888_sse2_lowp+0xb42>
+  .byte  196,226,125,121,29,172,177,0,0      // vpbroadcastw  0xb1ac(%rip),%ymm3        # 3ac4e <_sk_srcover_bgra_8888_sse2_lowp+0xb52>
   .byte  197,253,111,200                     // vmovdqa       %ymm0,%ymm1
   .byte  197,253,111,208                     // vmovdqa       %ymm0,%ymm2
   .byte  255,224                             // jmpq          *%rax
@@ -47498,13 +47137,13 @@
 _sk_scale_1_float_hsw_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,122,16,0                        // vmovss        (%rax),%xmm8
-  .byte  197,122,16,13,30,169,0,0            // vmovss        0xa91e(%rip),%xmm9        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
-  .byte  196,98,57,169,13,229,168,0,0        // vfmadd213ss   0xa8e5(%rip),%xmm8,%xmm9        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  197,122,16,13,30,169,0,0            // vmovss        0xa91e(%rip),%xmm9        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,98,57,169,13,229,168,0,0        // vfmadd213ss   0xa8e5(%rip),%xmm8,%xmm9        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,193,122,44,193                  // vcvttss2si    %xmm9,%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
   .byte  196,66,125,121,192                  // vpbroadcastw  %xmm8,%ymm8
   .byte  197,189,213,192                     // vpmullw       %ymm0,%ymm8,%ymm0
-  .byte  196,98,125,121,13,98,177,0,0        // vpbroadcastw  0xb162(%rip),%ymm9        # 3b410 <_sk_srcover_bgra_8888_sse2_lowp+0xb44>
+  .byte  196,98,125,121,13,114,177,0,0       // vpbroadcastw  0xb172(%rip),%ymm9        # 3ac50 <_sk_srcover_bgra_8888_sse2_lowp+0xb54>
   .byte  196,193,125,253,193                 // vpaddw        %ymm9,%ymm0,%ymm0
   .byte  197,253,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm0
   .byte  197,189,213,201                     // vpmullw       %ymm1,%ymm8,%ymm1
@@ -47525,12 +47164,12 @@
 _sk_lerp_1_float_hsw_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,122,16,0                        // vmovss        (%rax),%xmm8
-  .byte  197,122,16,13,180,168,0,0           // vmovss        0xa8b4(%rip),%xmm9        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
-  .byte  196,98,57,169,13,123,168,0,0        // vfmadd213ss   0xa87b(%rip),%xmm8,%xmm9        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  197,122,16,13,180,168,0,0           // vmovss        0xa8b4(%rip),%xmm9        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,98,57,169,13,123,168,0,0        // vfmadd213ss   0xa87b(%rip),%xmm8,%xmm9        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,193,122,44,193                  // vcvttss2si    %xmm9,%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
   .byte  196,66,125,121,192                  // vpbroadcastw  %xmm8,%ymm8
-  .byte  196,98,125,121,13,254,176,0,0       // vpbroadcastw  0xb0fe(%rip),%ymm9        # 3b412 <_sk_srcover_bgra_8888_sse2_lowp+0xb46>
+  .byte  196,98,125,121,13,14,177,0,0        // vpbroadcastw  0xb10e(%rip),%ymm9        # 3ac52 <_sk_srcover_bgra_8888_sse2_lowp+0xb56>
   .byte  196,65,53,249,208                   // vpsubw        %ymm8,%ymm9,%ymm10
   .byte  197,45,213,220                      // vpmullw       %ymm4,%ymm10,%ymm11
   .byte  197,189,213,192                     // vpmullw       %ymm0,%ymm8,%ymm0
@@ -47567,38 +47206,38 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,38                              // ja            303b2 <_sk_scale_u8_hsw_lowp+0x3d>
+  .byte  119,38                              // ja            2fbe2 <_sk_scale_u8_hsw_lowp+0x3d>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,21,1,0,0                  // lea           0x115(%rip),%r9        # 304b0 <_sk_scale_u8_hsw_lowp+0x13b>
+  .byte  76,141,13,21,1,0,0                  // lea           0x115(%rip),%r9        # 2fce0 <_sk_scale_u8_hsw_lowp+0x13b>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  233,179,0,0,0                       // jmpq          30465 <_sk_scale_u8_hsw_lowp+0xf0>
+  .byte  233,179,0,0,0                       // jmpq          2fc95 <_sk_scale_u8_hsw_lowp+0xf0>
   .byte  196,65,122,111,4,16                 // vmovdqu       (%r8,%rdx,1),%xmm8
-  .byte  233,168,0,0,0                       // jmpq          30465 <_sk_scale_u8_hsw_lowp+0xf0>
+  .byte  233,168,0,0,0                       // jmpq          2fc95 <_sk_scale_u8_hsw_lowp+0xf0>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,67,57,32,68,16,2,2              // vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm8,%xmm8
   .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  197,121,110,200                     // vmovd         %eax,%xmm9
   .byte  196,67,57,14,193,1                  // vpblendw      $0x1,%xmm9,%xmm8,%xmm8
-  .byte  233,135,0,0,0                       // jmpq          30465 <_sk_scale_u8_hsw_lowp+0xf0>
+  .byte  233,135,0,0,0                       // jmpq          2fc95 <_sk_scale_u8_hsw_lowp+0xf0>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,67,57,32,68,16,6,6              // vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,67,57,32,68,16,5,5              // vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,67,57,32,68,16,4,4              // vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,65,121,110,12,16                // vmovd         (%r8,%rdx,1),%xmm9
   .byte  196,67,57,2,193,1                   // vpblendd      $0x1,%xmm9,%xmm8,%xmm8
-  .byte  235,92                              // jmp           30465 <_sk_scale_u8_hsw_lowp+0xf0>
+  .byte  235,92                              // jmp           2fc95 <_sk_scale_u8_hsw_lowp+0xf0>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,67,57,32,68,16,10,10            // vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,67,57,32,68,16,9,9              // vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,67,57,32,68,16,8,8              // vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,65,122,126,12,16                // vmovq         (%r8,%rdx,1),%xmm9
   .byte  196,67,49,2,192,12                  // vpblendd      $0xc,%xmm8,%xmm9,%xmm8
-  .byte  235,49                              // jmp           30465 <_sk_scale_u8_hsw_lowp+0xf0>
+  .byte  235,49                              // jmp           2fc95 <_sk_scale_u8_hsw_lowp+0xf0>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,67,57,32,68,16,14,14            // vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,67,57,32,68,16,13,13            // vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm8,%xmm8
@@ -47608,7 +47247,7 @@
   .byte  196,67,49,2,192,8                   // vpblendd      $0x8,%xmm8,%xmm9,%xmm8
   .byte  196,66,125,48,192                   // vpmovzxbw     %xmm8,%ymm8
   .byte  197,189,213,192                     // vpmullw       %ymm0,%ymm8,%ymm0
-  .byte  196,98,125,121,13,157,175,0,0       // vpbroadcastw  0xaf9d(%rip),%ymm9        # 3b414 <_sk_srcover_bgra_8888_sse2_lowp+0xb48>
+  .byte  196,98,125,121,13,173,175,0,0       // vpbroadcastw  0xafad(%rip),%ymm9        # 3ac54 <_sk_srcover_bgra_8888_sse2_lowp+0xb58>
   .byte  196,193,125,253,193                 // vpaddw        %ymm9,%ymm0,%ymm0
   .byte  197,253,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm0
   .byte  197,189,213,201                     // vpmullw       %ymm1,%ymm8,%ymm1
@@ -47629,7 +47268,7 @@
   .byte  255,26                              // lcall         *(%rdx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,13,255,255,255,75               // decl          0x4bffffff(%rip)        # 4c0304bc <_sk_srcover_bgra_8888_sse2_lowp+0x4bff5bf0>
+  .byte  255,13,255,255,255,75               // decl          0x4bffffff(%rip)        # 4c02fcec <_sk_srcover_bgra_8888_sse2_lowp+0x4bff5bf0>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,67,255                          // incl          -0x1(%rbx)
@@ -47668,38 +47307,38 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,38                              // ja            30529 <_sk_lerp_u8_hsw_lowp+0x3d>
+  .byte  119,38                              // ja            2fd59 <_sk_lerp_u8_hsw_lowp+0x3d>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,58,1,0,0                  // lea           0x13a(%rip),%r9        # 3064c <_sk_lerp_u8_hsw_lowp+0x160>
+  .byte  76,141,13,58,1,0,0                  // lea           0x13a(%rip),%r9        # 2fe7c <_sk_lerp_u8_hsw_lowp+0x160>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  233,179,0,0,0                       // jmpq          305dc <_sk_lerp_u8_hsw_lowp+0xf0>
+  .byte  233,179,0,0,0                       // jmpq          2fe0c <_sk_lerp_u8_hsw_lowp+0xf0>
   .byte  196,65,122,111,4,16                 // vmovdqu       (%r8,%rdx,1),%xmm8
-  .byte  233,168,0,0,0                       // jmpq          305dc <_sk_lerp_u8_hsw_lowp+0xf0>
+  .byte  233,168,0,0,0                       // jmpq          2fe0c <_sk_lerp_u8_hsw_lowp+0xf0>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,67,57,32,68,16,2,2              // vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm8,%xmm8
   .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  197,121,110,200                     // vmovd         %eax,%xmm9
   .byte  196,67,57,14,193,1                  // vpblendw      $0x1,%xmm9,%xmm8,%xmm8
-  .byte  233,135,0,0,0                       // jmpq          305dc <_sk_lerp_u8_hsw_lowp+0xf0>
+  .byte  233,135,0,0,0                       // jmpq          2fe0c <_sk_lerp_u8_hsw_lowp+0xf0>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,67,57,32,68,16,6,6              // vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,67,57,32,68,16,5,5              // vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,67,57,32,68,16,4,4              // vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,65,121,110,12,16                // vmovd         (%r8,%rdx,1),%xmm9
   .byte  196,67,57,2,193,1                   // vpblendd      $0x1,%xmm9,%xmm8,%xmm8
-  .byte  235,92                              // jmp           305dc <_sk_lerp_u8_hsw_lowp+0xf0>
+  .byte  235,92                              // jmp           2fe0c <_sk_lerp_u8_hsw_lowp+0xf0>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,67,57,32,68,16,10,10            // vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,67,57,32,68,16,9,9              // vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,67,57,32,68,16,8,8              // vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,65,122,126,12,16                // vmovq         (%r8,%rdx,1),%xmm9
   .byte  196,67,49,2,192,12                  // vpblendd      $0xc,%xmm8,%xmm9,%xmm8
-  .byte  235,49                              // jmp           305dc <_sk_lerp_u8_hsw_lowp+0xf0>
+  .byte  235,49                              // jmp           2fe0c <_sk_lerp_u8_hsw_lowp+0xf0>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,67,57,32,68,16,14,14            // vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,67,57,32,68,16,13,13            // vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm8,%xmm8
@@ -47708,7 +47347,7 @@
   .byte  196,67,49,34,76,16,8,2              // vpinsrd       $0x2,0x8(%r8,%rdx,1),%xmm9,%xmm9
   .byte  196,67,49,2,192,8                   // vpblendd      $0x8,%xmm8,%xmm9,%xmm8
   .byte  196,66,125,48,192                   // vpmovzxbw     %xmm8,%ymm8
-  .byte  196,98,125,121,13,44,174,0,0        // vpbroadcastw  0xae2c(%rip),%ymm9        # 3b416 <_sk_srcover_bgra_8888_sse2_lowp+0xb4a>
+  .byte  196,98,125,121,13,60,174,0,0        // vpbroadcastw  0xae3c(%rip),%ymm9        # 3ac56 <_sk_srcover_bgra_8888_sse2_lowp+0xb5a>
   .byte  196,65,61,239,209                   // vpxor         %ymm9,%ymm8,%ymm10
   .byte  197,45,213,220                      // vpmullw       %ymm4,%ymm10,%ymm11
   .byte  197,189,213,192                     // vpmullw       %ymm0,%ymm8,%ymm0
@@ -47740,7 +47379,7 @@
   .byte  254                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  232,254,255,255,38                  // callq         27030657 <_sk_srcover_bgra_8888_sse2_lowp+0x26ff5d8b>
+  .byte  232,254,255,255,38                  // callq         2702fe87 <_sk_srcover_bgra_8888_sse2_lowp+0x26ff5d8b>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,30                              // lcall         *(%rsi)
@@ -47761,7 +47400,7 @@
   .byte  255,52,255                          // pushq         (%rdi,%rdi,8)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  124,255                             // jl            30679 <_sk_lerp_u8_hsw_lowp+0x18d>
+  .byte  124,255                             // jl            2fea9 <_sk_lerp_u8_hsw_lowp+0x18d>
   .byte  255                                 // (bad)
   .byte  255,116,255,255                     // pushq         -0x1(%rdi,%rdi,8)
   .byte  255,108,255,255                     // ljmp          *-0x1(%rdi,%rdi,8)
@@ -47782,24 +47421,24 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,38                              // ja            306c8 <_sk_scale_565_hsw_lowp+0x40>
+  .byte  119,38                              // ja            2fef8 <_sk_scale_565_hsw_lowp+0x40>
   .byte  196,65,61,239,192                   // vpxor         %ymm8,%ymm8,%ymm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,255,1,0,0                 // lea           0x1ff(%rip),%r9        # 308b0 <_sk_scale_565_hsw_lowp+0x228>
+  .byte  76,141,13,255,1,0,0                 // lea           0x1ff(%rip),%r9        # 300e0 <_sk_scale_565_hsw_lowp+0x228>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  233,12,1,0,0                        // jmpq          307d4 <_sk_scale_565_hsw_lowp+0x14c>
+  .byte  233,12,1,0,0                        // jmpq          30004 <_sk_scale_565_hsw_lowp+0x14c>
   .byte  196,65,126,111,4,80                 // vmovdqu       (%r8,%rdx,2),%ymm8
-  .byte  233,1,1,0,0                         // jmpq          307d4 <_sk_scale_565_hsw_lowp+0x14c>
+  .byte  233,1,1,0,0                         // jmpq          30004 <_sk_scale_565_hsw_lowp+0x14c>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,65,57,196,76,80,4,2             // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm8,%xmm9
   .byte  196,67,53,56,192,1                  // vinserti128   $0x1,%xmm8,%ymm9,%ymm8
   .byte  196,65,121,110,12,80                // vmovd         (%r8,%rdx,2),%xmm9
   .byte  196,67,61,2,193,1                   // vpblendd      $0x1,%ymm9,%ymm8,%ymm8
-  .byte  233,221,0,0,0                       // jmpq          307d4 <_sk_scale_565_hsw_lowp+0x14c>
+  .byte  233,221,0,0,0                       // jmpq          30004 <_sk_scale_565_hsw_lowp+0x14c>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,65,57,196,76,80,12,6            // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm8,%xmm9
   .byte  196,67,53,56,192,1                  // vinserti128   $0x1,%xmm8,%ymm9,%ymm8
@@ -47809,7 +47448,7 @@
   .byte  196,67,61,2,193,15                  // vpblendd      $0xf,%ymm9,%ymm8,%ymm8
   .byte  196,65,122,126,12,80                // vmovq         (%r8,%rdx,2),%xmm9
   .byte  196,67,61,2,193,3                   // vpblendd      $0x3,%ymm9,%ymm8,%ymm8
-  .byte  233,157,0,0,0                       // jmpq          307d4 <_sk_scale_565_hsw_lowp+0x14c>
+  .byte  233,157,0,0,0                       // jmpq          30004 <_sk_scale_565_hsw_lowp+0x14c>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,65,57,196,76,80,20,2            // vpinsrw       $0x2,0x14(%r8,%rdx,2),%xmm8,%xmm9
   .byte  196,67,61,56,193,1                  // vinserti128   $0x1,%xmm9,%ymm8,%ymm8
@@ -47821,7 +47460,7 @@
   .byte  196,67,61,56,193,1                  // vinserti128   $0x1,%xmm9,%ymm8,%ymm8
   .byte  196,65,122,111,12,80                // vmovdqu       (%r8,%rdx,2),%xmm9
   .byte  196,67,53,2,192,240                 // vpblendd      $0xf0,%ymm8,%ymm9,%ymm8
-  .byte  235,84                              // jmp           307d4 <_sk_scale_565_hsw_lowp+0x14c>
+  .byte  235,84                              // jmp           30004 <_sk_scale_565_hsw_lowp+0x14c>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,65,57,196,76,80,28,6            // vpinsrw       $0x6,0x1c(%r8,%rdx,2),%xmm8,%xmm9
   .byte  196,67,61,56,193,1                  // vinserti128   $0x1,%xmm9,%ymm8,%ymm8
@@ -47835,13 +47474,13 @@
   .byte  196,65,122,111,20,80                // vmovdqu       (%r8,%rdx,2),%xmm10
   .byte  196,67,45,56,201,1                  // vinserti128   $0x1,%xmm9,%ymm10,%ymm9
   .byte  196,67,53,2,192,192                 // vpblendd      $0xc0,%ymm8,%ymm9,%ymm8
-  .byte  196,98,125,121,13,59,172,0,0        // vpbroadcastw  0xac3b(%rip),%ymm9        # 3b418 <_sk_srcover_bgra_8888_sse2_lowp+0xb4c>
+  .byte  196,98,125,121,13,75,172,0,0        // vpbroadcastw  0xac4b(%rip),%ymm9        # 3ac58 <_sk_srcover_bgra_8888_sse2_lowp+0xb5c>
   .byte  196,193,45,113,208,8                // vpsrlw        $0x8,%ymm8,%ymm10
   .byte  196,65,45,219,201                   // vpand         %ymm9,%ymm10,%ymm9
   .byte  196,193,45,113,208,5                // vpsrlw        $0x5,%ymm8,%ymm10
-  .byte  196,98,125,121,29,35,172,0,0        // vpbroadcastw  0xac23(%rip),%ymm11        # 3b41a <_sk_srcover_bgra_8888_sse2_lowp+0xb4e>
+  .byte  196,98,125,121,29,51,172,0,0        // vpbroadcastw  0xac33(%rip),%ymm11        # 3ac5a <_sk_srcover_bgra_8888_sse2_lowp+0xb5e>
   .byte  196,65,45,219,211                   // vpand         %ymm11,%ymm10,%ymm10
-  .byte  196,98,125,121,29,23,172,0,0        // vpbroadcastw  0xac17(%rip),%ymm11        # 3b41c <_sk_srcover_bgra_8888_sse2_lowp+0xb50>
+  .byte  196,98,125,121,29,39,172,0,0        // vpbroadcastw  0xac27(%rip),%ymm11        # 3ac5c <_sk_srcover_bgra_8888_sse2_lowp+0xb60>
   .byte  196,65,61,219,219                   // vpand         %ymm11,%ymm8,%ymm11
   .byte  196,193,61,113,208,13               // vpsrlw        $0xd,%ymm8,%ymm8
   .byte  196,65,53,235,192                   // vpor          %ymm8,%ymm9,%ymm8
@@ -47851,7 +47490,7 @@
   .byte  196,193,45,113,243,3                // vpsllw        $0x3,%ymm11,%ymm10
   .byte  196,193,37,113,211,2                // vpsrlw        $0x2,%ymm11,%ymm11
   .byte  196,65,45,235,211                   // vpor          %ymm11,%ymm10,%ymm10
-  .byte  196,98,125,121,29,222,171,0,0       // vpbroadcastw  0xabde(%rip),%ymm11        # 3b41e <_sk_srcover_bgra_8888_sse2_lowp+0xb52>
+  .byte  196,98,125,121,29,238,171,0,0       // vpbroadcastw  0xabee(%rip),%ymm11        # 3ac5e <_sk_srcover_bgra_8888_sse2_lowp+0xb62>
   .byte  196,65,101,239,227                  // vpxor         %ymm11,%ymm3,%ymm12
   .byte  196,65,69,239,219                   // vpxor         %ymm11,%ymm7,%ymm11
   .byte  196,65,37,101,220                   // vpcmpgtw      %ymm12,%ymm11,%ymm11
@@ -47861,7 +47500,7 @@
   .byte  196,66,21,62,232                    // vpmaxuw       %ymm8,%ymm13,%ymm13
   .byte  196,67,21,76,220,176                // vpblendvb     %ymm11,%ymm12,%ymm13,%ymm11
   .byte  197,189,213,192                     // vpmullw       %ymm0,%ymm8,%ymm0
-  .byte  196,98,125,121,5,170,171,0,0        // vpbroadcastw  0xabaa(%rip),%ymm8        # 3b420 <_sk_srcover_bgra_8888_sse2_lowp+0xb54>
+  .byte  196,98,125,121,5,186,171,0,0        // vpbroadcastw  0xabba(%rip),%ymm8        # 3ac60 <_sk_srcover_bgra_8888_sse2_lowp+0xb64>
   .byte  196,193,125,253,192                 // vpaddw        %ymm8,%ymm0,%ymm0
   .byte  197,253,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm0
   .byte  197,181,213,201                     // vpmullw       %ymm1,%ymm9,%ymm1
@@ -47925,24 +47564,24 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,38                              // ja            3092c <_sk_lerp_565_hsw_lowp+0x40>
+  .byte  119,38                              // ja            3015c <_sk_lerp_565_hsw_lowp+0x40>
   .byte  196,65,61,239,192                   // vpxor         %ymm8,%ymm8,%ymm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,51,2,0,0                  // lea           0x233(%rip),%r9        # 30b48 <_sk_lerp_565_hsw_lowp+0x25c>
+  .byte  76,141,13,51,2,0,0                  // lea           0x233(%rip),%r9        # 30378 <_sk_lerp_565_hsw_lowp+0x25c>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  233,12,1,0,0                        // jmpq          30a38 <_sk_lerp_565_hsw_lowp+0x14c>
+  .byte  233,12,1,0,0                        // jmpq          30268 <_sk_lerp_565_hsw_lowp+0x14c>
   .byte  196,65,126,111,4,80                 // vmovdqu       (%r8,%rdx,2),%ymm8
-  .byte  233,1,1,0,0                         // jmpq          30a38 <_sk_lerp_565_hsw_lowp+0x14c>
+  .byte  233,1,1,0,0                         // jmpq          30268 <_sk_lerp_565_hsw_lowp+0x14c>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,65,57,196,76,80,4,2             // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm8,%xmm9
   .byte  196,67,53,56,192,1                  // vinserti128   $0x1,%xmm8,%ymm9,%ymm8
   .byte  196,65,121,110,12,80                // vmovd         (%r8,%rdx,2),%xmm9
   .byte  196,67,61,2,193,1                   // vpblendd      $0x1,%ymm9,%ymm8,%ymm8
-  .byte  233,221,0,0,0                       // jmpq          30a38 <_sk_lerp_565_hsw_lowp+0x14c>
+  .byte  233,221,0,0,0                       // jmpq          30268 <_sk_lerp_565_hsw_lowp+0x14c>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,65,57,196,76,80,12,6            // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm8,%xmm9
   .byte  196,67,53,56,192,1                  // vinserti128   $0x1,%xmm8,%ymm9,%ymm8
@@ -47952,7 +47591,7 @@
   .byte  196,67,61,2,193,15                  // vpblendd      $0xf,%ymm9,%ymm8,%ymm8
   .byte  196,65,122,126,12,80                // vmovq         (%r8,%rdx,2),%xmm9
   .byte  196,67,61,2,193,3                   // vpblendd      $0x3,%ymm9,%ymm8,%ymm8
-  .byte  233,157,0,0,0                       // jmpq          30a38 <_sk_lerp_565_hsw_lowp+0x14c>
+  .byte  233,157,0,0,0                       // jmpq          30268 <_sk_lerp_565_hsw_lowp+0x14c>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,65,57,196,76,80,20,2            // vpinsrw       $0x2,0x14(%r8,%rdx,2),%xmm8,%xmm9
   .byte  196,67,61,56,193,1                  // vinserti128   $0x1,%xmm9,%ymm8,%ymm8
@@ -47964,7 +47603,7 @@
   .byte  196,67,61,56,193,1                  // vinserti128   $0x1,%xmm9,%ymm8,%ymm8
   .byte  196,65,122,111,12,80                // vmovdqu       (%r8,%rdx,2),%xmm9
   .byte  196,67,53,2,192,240                 // vpblendd      $0xf0,%ymm8,%ymm9,%ymm8
-  .byte  235,84                              // jmp           30a38 <_sk_lerp_565_hsw_lowp+0x14c>
+  .byte  235,84                              // jmp           30268 <_sk_lerp_565_hsw_lowp+0x14c>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,65,57,196,76,80,28,6            // vpinsrw       $0x6,0x1c(%r8,%rdx,2),%xmm8,%xmm9
   .byte  196,67,61,56,193,1                  // vinserti128   $0x1,%xmm9,%ymm8,%ymm8
@@ -47978,13 +47617,13 @@
   .byte  196,65,122,111,20,80                // vmovdqu       (%r8,%rdx,2),%xmm10
   .byte  196,67,45,56,201,1                  // vinserti128   $0x1,%xmm9,%ymm10,%ymm9
   .byte  196,67,53,2,192,192                 // vpblendd      $0xc0,%ymm8,%ymm9,%ymm8
-  .byte  196,98,125,121,13,225,169,0,0       // vpbroadcastw  0xa9e1(%rip),%ymm9        # 3b422 <_sk_srcover_bgra_8888_sse2_lowp+0xb56>
+  .byte  196,98,125,121,13,241,169,0,0       // vpbroadcastw  0xa9f1(%rip),%ymm9        # 3ac62 <_sk_srcover_bgra_8888_sse2_lowp+0xb66>
   .byte  196,193,45,113,208,8                // vpsrlw        $0x8,%ymm8,%ymm10
   .byte  196,65,45,219,201                   // vpand         %ymm9,%ymm10,%ymm9
   .byte  196,193,45,113,208,5                // vpsrlw        $0x5,%ymm8,%ymm10
-  .byte  196,98,125,121,29,201,169,0,0       // vpbroadcastw  0xa9c9(%rip),%ymm11        # 3b424 <_sk_srcover_bgra_8888_sse2_lowp+0xb58>
+  .byte  196,98,125,121,29,217,169,0,0       // vpbroadcastw  0xa9d9(%rip),%ymm11        # 3ac64 <_sk_srcover_bgra_8888_sse2_lowp+0xb68>
   .byte  196,65,45,219,211                   // vpand         %ymm11,%ymm10,%ymm10
-  .byte  196,98,125,121,29,189,169,0,0       // vpbroadcastw  0xa9bd(%rip),%ymm11        # 3b426 <_sk_srcover_bgra_8888_sse2_lowp+0xb5a>
+  .byte  196,98,125,121,29,205,169,0,0       // vpbroadcastw  0xa9cd(%rip),%ymm11        # 3ac66 <_sk_srcover_bgra_8888_sse2_lowp+0xb6a>
   .byte  196,65,61,219,219                   // vpand         %ymm11,%ymm8,%ymm11
   .byte  196,193,61,113,208,13               // vpsrlw        $0xd,%ymm8,%ymm8
   .byte  196,65,53,235,192                   // vpor          %ymm8,%ymm9,%ymm8
@@ -47994,7 +47633,7 @@
   .byte  196,193,45,113,243,3                // vpsllw        $0x3,%ymm11,%ymm10
   .byte  196,193,37,113,211,2                // vpsrlw        $0x2,%ymm11,%ymm11
   .byte  196,65,45,235,211                   // vpor          %ymm11,%ymm10,%ymm10
-  .byte  196,98,125,121,29,132,169,0,0       // vpbroadcastw  0xa984(%rip),%ymm11        # 3b428 <_sk_srcover_bgra_8888_sse2_lowp+0xb5c>
+  .byte  196,98,125,121,29,148,169,0,0       // vpbroadcastw  0xa994(%rip),%ymm11        # 3ac68 <_sk_srcover_bgra_8888_sse2_lowp+0xb6c>
   .byte  196,65,101,239,227                  // vpxor         %ymm11,%ymm3,%ymm12
   .byte  196,65,69,239,219                   // vpxor         %ymm11,%ymm7,%ymm11
   .byte  196,65,37,101,220                   // vpcmpgtw      %ymm12,%ymm11,%ymm11
@@ -48003,7 +47642,7 @@
   .byte  196,66,53,62,234                    // vpmaxuw       %ymm10,%ymm9,%ymm13
   .byte  196,66,21,62,232                    // vpmaxuw       %ymm8,%ymm13,%ymm13
   .byte  196,67,21,76,220,176                // vpblendvb     %ymm11,%ymm12,%ymm13,%ymm11
-  .byte  196,98,125,121,37,84,169,0,0        // vpbroadcastw  0xa954(%rip),%ymm12        # 3b42a <_sk_srcover_bgra_8888_sse2_lowp+0xb5e>
+  .byte  196,98,125,121,37,100,169,0,0       // vpbroadcastw  0xa964(%rip),%ymm12        # 3ac6a <_sk_srcover_bgra_8888_sse2_lowp+0xb6e>
   .byte  196,65,61,239,236                   // vpxor         %ymm12,%ymm8,%ymm13
   .byte  197,21,213,236                      // vpmullw       %ymm4,%ymm13,%ymm13
   .byte  197,189,213,192                     // vpmullw       %ymm0,%ymm8,%ymm0
@@ -48076,7 +47715,7 @@
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  196,193,116,95,200                  // vmaxps        %ymm8,%ymm1,%ymm1
   .byte  196,193,124,95,192                  // vmaxps        %ymm8,%ymm0,%ymm0
-  .byte  196,98,125,24,5,224,159,0,0         // vbroadcastss  0x9fe0(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,224,159,0,0         // vbroadcastss  0x9fe0(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  196,193,116,93,200                  // vminps        %ymm8,%ymm1,%ymm1
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -48093,7 +47732,7 @@
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  196,193,116,95,200                  // vmaxps        %ymm8,%ymm1,%ymm1
   .byte  196,193,124,95,192                  // vmaxps        %ymm8,%ymm0,%ymm0
-  .byte  196,98,125,24,5,164,159,0,0         // vbroadcastss  0x9fa4(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,164,159,0,0         // vbroadcastss  0x9fa4(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  196,193,116,93,200                  // vminps        %ymm8,%ymm1,%ymm1
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -48103,10 +47742,10 @@
 .globl _sk_mirror_x_1_hsw_lowp
 FUNCTION(_sk_mirror_x_1_hsw_lowp)
 _sk_mirror_x_1_hsw_lowp:
-  .byte  196,98,125,24,5,165,159,0,0         // vbroadcastss  0x9fa5(%rip),%ymm8        # 3ab94 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
+  .byte  196,98,125,24,5,165,159,0,0         // vbroadcastss  0x9fa5(%rip),%ymm8        # 3a3c4 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
   .byte  196,193,124,88,192                  // vaddps        %ymm8,%ymm0,%ymm0
   .byte  196,193,116,88,200                  // vaddps        %ymm8,%ymm1,%ymm1
-  .byte  196,98,125,24,13,118,159,0,0        // vbroadcastss  0x9f76(%rip),%ymm9        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,13,118,159,0,0        // vbroadcastss  0x9f76(%rip),%ymm9        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,65,116,89,209                   // vmulps        %ymm9,%ymm1,%ymm10
   .byte  196,65,124,89,201                   // vmulps        %ymm9,%ymm0,%ymm9
   .byte  196,67,125,8,201,1                  // vroundps      $0x1,%ymm9,%ymm9
@@ -48117,13 +47756,13 @@
   .byte  196,193,116,92,202                  // vsubps        %ymm10,%ymm1,%ymm1
   .byte  196,193,116,88,200                  // vaddps        %ymm8,%ymm1,%ymm1
   .byte  196,193,124,88,192                  // vaddps        %ymm8,%ymm0,%ymm0
-  .byte  196,98,125,24,5,201,160,0,0         // vbroadcastss  0xa0c9(%rip),%ymm8        # 3ad08 <_sk_srcover_bgra_8888_sse2_lowp+0x43c>
+  .byte  196,98,125,24,5,201,160,0,0         // vbroadcastss  0xa0c9(%rip),%ymm8        # 3a538 <_sk_srcover_bgra_8888_sse2_lowp+0x43c>
   .byte  196,193,124,84,192                  // vandps        %ymm8,%ymm0,%ymm0
   .byte  196,193,116,84,200                  // vandps        %ymm8,%ymm1,%ymm1
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  196,193,116,95,200                  // vmaxps        %ymm8,%ymm1,%ymm1
   .byte  196,193,124,95,192                  // vmaxps        %ymm8,%ymm0,%ymm0
-  .byte  196,98,125,24,5,27,159,0,0          // vbroadcastss  0x9f1b(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,27,159,0,0          // vbroadcastss  0x9f1b(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  196,193,116,93,200                  // vminps        %ymm8,%ymm1,%ymm1
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -48143,7 +47782,7 @@
   .byte  197,197,239,255                     // vpxor         %ymm7,%ymm7,%ymm7
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
   .byte  73,131,248,2                        // cmp           $0x2,%r8
-  .byte  114,60                              // jb            30cdc <_sk_gradient_hsw_lowp+0x6d>
+  .byte  114,60                              // jb            3050c <_sk_gradient_hsw_lowp+0x6d>
   .byte  76,139,72,72                        // mov           0x48(%rax),%r9
   .byte  197,197,239,255                     // vpxor         %ymm7,%ymm7,%ymm7
   .byte  65,186,1,0,0,0                      // mov           $0x1,%r10d
@@ -48155,9 +47794,9 @@
   .byte  197,213,250,234                     // vpsubd        %ymm2,%ymm5,%ymm5
   .byte  73,255,194                          // inc           %r10
   .byte  77,57,208                           // cmp           %r10,%r8
-  .byte  117,224                             // jne           30cb2 <_sk_gradient_hsw_lowp+0x43>
+  .byte  117,224                             // jne           304e2 <_sk_gradient_hsw_lowp+0x43>
   .byte  73,131,248,8                        // cmp           $0x8,%r8
-  .byte  15,135,180,0,0,0                    // ja            30d90 <_sk_gradient_hsw_lowp+0x121>
+  .byte  15,135,180,0,0,0                    // ja            305c0 <_sk_gradient_hsw_lowp+0x121>
   .byte  76,139,64,8                         // mov           0x8(%rax),%r8
   .byte  76,139,72,16                        // mov           0x10(%rax),%r9
   .byte  196,193,124,16,24                   // vmovups       (%r8),%ymm3
@@ -48194,7 +47833,7 @@
   .byte  197,124,16,56                       // vmovups       (%rax),%ymm15
   .byte  196,66,69,22,231                    // vpermps       %ymm15,%ymm7,%ymm12
   .byte  196,194,85,22,255                   // vpermps       %ymm15,%ymm5,%ymm7
-  .byte  233,34,1,0,0                        // jmpq          30eb2 <_sk_gradient_hsw_lowp+0x243>
+  .byte  233,34,1,0,0                        // jmpq          306e2 <_sk_gradient_hsw_lowp+0x243>
   .byte  76,139,64,8                         // mov           0x8(%rax),%r8
   .byte  76,139,72,16                        // mov           0x10(%rax),%r9
   .byte  197,229,118,219                     // vpcmpeqd      %ymm3,%ymm3,%ymm3
@@ -48263,8 +47902,8 @@
   .byte  196,98,117,168,76,36,128            // vfmadd213ps   -0x80(%rsp),%ymm1,%ymm9
   .byte  196,98,117,168,222                  // vfmadd213ps   %ymm6,%ymm1,%ymm11
   .byte  196,226,117,184,124,36,160          // vfmadd231ps   -0x60(%rsp),%ymm1,%ymm7
-  .byte  196,226,125,24,5,189,156,0,0        // vbroadcastss  0x9cbd(%rip),%ymm0        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
-  .byte  196,226,125,24,13,132,156,0,0       // vbroadcastss  0x9c84(%rip),%ymm1        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,226,125,24,5,189,156,0,0        // vbroadcastss  0x9cbd(%rip),%ymm0        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,226,125,24,13,132,156,0,0       // vbroadcastss  0x9c84(%rip),%ymm1        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,226,125,168,217                 // vfmadd213ps   %ymm1,%ymm0,%ymm3
   .byte  196,226,125,168,209                 // vfmadd213ps   %ymm1,%ymm0,%ymm2
   .byte  196,98,125,168,201                  // vfmadd213ps   %ymm1,%ymm0,%ymm9
@@ -48274,7 +47913,7 @@
   .byte  196,226,125,168,249                 // vfmadd213ps   %ymm1,%ymm0,%ymm7
   .byte  196,98,125,168,225                  // vfmadd213ps   %ymm1,%ymm0,%ymm12
   .byte  197,254,91,194                      // vcvttps2dq    %ymm2,%ymm0
-  .byte  197,253,111,37,24,165,0,0           // vmovdqa       0xa518(%rip),%ymm4        # 3b440 <_sk_srcover_bgra_8888_sse2_lowp+0xb74>
+  .byte  197,253,111,37,40,165,0,0           // vmovdqa       0xa528(%rip),%ymm4        # 3ac80 <_sk_srcover_bgra_8888_sse2_lowp+0xb84>
   .byte  196,226,125,0,196                   // vpshufb       %ymm4,%ymm0,%ymm0
   .byte  196,227,253,0,192,232               // vpermq        $0xe8,%ymm0,%ymm0
   .byte  197,254,91,203                      // vcvttps2dq    %ymm3,%ymm1
@@ -48323,9 +47962,9 @@
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  77,137,193                          // mov           %r8,%r9
   .byte  73,255,201                          // dec           %r9
-  .byte  120,7                               // js            3100d <_sk_evenly_spaced_gradient_hsw_lowp+0x32>
+  .byte  120,7                               // js            3083d <_sk_evenly_spaced_gradient_hsw_lowp+0x32>
   .byte  196,193,234,42,209                  // vcvtsi2ss     %r9,%xmm2,%xmm2
-  .byte  235,22                              // jmp           31023 <_sk_evenly_spaced_gradient_hsw_lowp+0x48>
+  .byte  235,22                              // jmp           30853 <_sk_evenly_spaced_gradient_hsw_lowp+0x48>
   .byte  77,137,202                          // mov           %r9,%r10
   .byte  73,209,234                          // shr           %r10
   .byte  65,131,225,1                        // and           $0x1,%r9d
@@ -48338,7 +47977,7 @@
   .byte  197,126,91,242                      // vcvttps2dq    %ymm2,%ymm14
   .byte  197,254,91,251                      // vcvttps2dq    %ymm3,%ymm7
   .byte  73,131,248,8                        // cmp           $0x8,%r8
-  .byte  15,135,180,0,0,0                    // ja            310f6 <_sk_evenly_spaced_gradient_hsw_lowp+0x11b>
+  .byte  15,135,180,0,0,0                    // ja            30926 <_sk_evenly_spaced_gradient_hsw_lowp+0x11b>
   .byte  76,139,64,8                         // mov           0x8(%rax),%r8
   .byte  76,139,72,16                        // mov           0x10(%rax),%r9
   .byte  196,193,124,16,24                   // vmovups       (%r8),%ymm3
@@ -48375,7 +48014,7 @@
   .byte  197,124,16,56                       // vmovups       (%rax),%ymm15
   .byte  196,66,69,22,231                    // vpermps       %ymm15,%ymm7,%ymm12
   .byte  196,194,13,22,255                   // vpermps       %ymm15,%ymm14,%ymm7
-  .byte  233,33,1,0,0                        // jmpq          31217 <_sk_evenly_spaced_gradient_hsw_lowp+0x23c>
+  .byte  233,33,1,0,0                        // jmpq          30a47 <_sk_evenly_spaced_gradient_hsw_lowp+0x23c>
   .byte  76,139,64,8                         // mov           0x8(%rax),%r8
   .byte  76,139,72,16                        // mov           0x10(%rax),%r9
   .byte  197,236,87,210                      // vxorps        %ymm2,%ymm2,%ymm2
@@ -48444,8 +48083,8 @@
   .byte  196,98,117,168,76,36,128            // vfmadd213ps   -0x80(%rsp),%ymm1,%ymm9
   .byte  196,98,117,168,222                  // vfmadd213ps   %ymm6,%ymm1,%ymm11
   .byte  196,226,117,184,124,36,160          // vfmadd231ps   -0x60(%rsp),%ymm1,%ymm7
-  .byte  196,226,125,24,5,88,153,0,0         // vbroadcastss  0x9958(%rip),%ymm0        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
-  .byte  196,226,125,24,13,31,153,0,0        // vbroadcastss  0x991f(%rip),%ymm1        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,226,125,24,5,88,153,0,0         // vbroadcastss  0x9958(%rip),%ymm0        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,226,125,24,13,31,153,0,0        // vbroadcastss  0x991f(%rip),%ymm1        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,226,125,168,217                 // vfmadd213ps   %ymm1,%ymm0,%ymm3
   .byte  196,226,125,168,209                 // vfmadd213ps   %ymm1,%ymm0,%ymm2
   .byte  196,98,125,168,201                  // vfmadd213ps   %ymm1,%ymm0,%ymm9
@@ -48455,7 +48094,7 @@
   .byte  196,226,125,168,249                 // vfmadd213ps   %ymm1,%ymm0,%ymm7
   .byte  196,98,125,168,225                  // vfmadd213ps   %ymm1,%ymm0,%ymm12
   .byte  197,254,91,194                      // vcvttps2dq    %ymm2,%ymm0
-  .byte  197,253,111,37,211,161,0,0          // vmovdqa       0xa1d3(%rip),%ymm4        # 3b460 <_sk_srcover_bgra_8888_sse2_lowp+0xb94>
+  .byte  197,253,111,37,227,161,0,0          // vmovdqa       0xa1e3(%rip),%ymm4        # 3aca0 <_sk_srcover_bgra_8888_sse2_lowp+0xba4>
   .byte  196,226,125,0,196                   // vpshufb       %ymm4,%ymm0,%ymm0
   .byte  196,227,253,0,192,232               // vpermq        $0xe8,%ymm0,%ymm0
   .byte  197,254,91,203                      // vcvttps2dq    %ymm3,%ymm1
@@ -48501,12 +48140,12 @@
   .byte  197,124,40,194                      // vmovaps       %ymm2,%ymm8
   .byte  196,98,125,168,195                  // vfmadd213ps   %ymm3,%ymm0,%ymm8
   .byte  196,226,117,168,211                 // vfmadd213ps   %ymm3,%ymm1,%ymm2
-  .byte  196,226,125,24,29,68,152,0,0        // vbroadcastss  0x9844(%rip),%ymm3        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
-  .byte  196,98,125,24,29,11,152,0,0         // vbroadcastss  0x980b(%rip),%ymm11        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,226,125,24,29,68,152,0,0        // vbroadcastss  0x9844(%rip),%ymm3        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  196,98,125,24,29,11,152,0,0         // vbroadcastss  0x980b(%rip),%ymm11        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  196,194,101,168,211                 // vfmadd213ps   %ymm11,%ymm3,%ymm2
   .byte  196,66,101,168,195                  // vfmadd213ps   %ymm11,%ymm3,%ymm8
   .byte  196,65,126,91,192                   // vcvttps2dq    %ymm8,%ymm8
-  .byte  197,125,111,21,252,160,0,0          // vmovdqa       0xa0fc(%rip),%ymm10        # 3b480 <_sk_srcover_bgra_8888_sse2_lowp+0xbb4>
+  .byte  197,125,111,21,12,161,0,0           // vmovdqa       0xa10c(%rip),%ymm10        # 3acc0 <_sk_srcover_bgra_8888_sse2_lowp+0xbc4>
   .byte  196,66,61,0,194                     // vpshufb       %ymm10,%ymm8,%ymm8
   .byte  196,67,253,0,192,232                // vpermq        $0xe8,%ymm8,%ymm8
   .byte  197,254,91,210                      // vcvttps2dq    %ymm2,%ymm2
@@ -48570,7 +48209,7 @@
   .byte  197,252,40,227                      // vmovaps       %ymm3,%ymm4
   .byte  197,252,40,217                      // vmovaps       %ymm1,%ymm3
   .byte  197,252,40,200                      // vmovaps       %ymm0,%ymm1
-  .byte  196,98,125,24,5,90,152,0,0          // vbroadcastss  0x985a(%rip),%ymm8        # 3ad08 <_sk_srcover_bgra_8888_sse2_lowp+0x43c>
+  .byte  196,98,125,24,5,90,152,0,0          // vbroadcastss  0x985a(%rip),%ymm8        # 3a538 <_sk_srcover_bgra_8888_sse2_lowp+0x43c>
   .byte  196,65,116,84,200                   // vandps        %ymm8,%ymm1,%ymm9
   .byte  196,65,100,84,208                   // vandps        %ymm8,%ymm3,%ymm10
   .byte  196,65,108,84,216                   // vandps        %ymm8,%ymm2,%ymm11
@@ -48584,20 +48223,20 @@
   .byte  196,67,45,74,192,192                // vblendvps     %ymm12,%ymm8,%ymm10,%ymm8
   .byte  196,65,4,94,192                     // vdivps        %ymm8,%ymm15,%ymm8
   .byte  196,65,60,89,208                    // vmulps        %ymm8,%ymm8,%ymm10
-  .byte  196,98,125,24,29,170,151,0,0        // vbroadcastss  0x97aa(%rip),%ymm11        # 3aca8 <_sk_srcover_bgra_8888_sse2_lowp+0x3dc>
-  .byte  196,98,125,24,53,165,151,0,0        // vbroadcastss  0x97a5(%rip),%ymm14        # 3acac <_sk_srcover_bgra_8888_sse2_lowp+0x3e0>
+  .byte  196,98,125,24,29,170,151,0,0        // vbroadcastss  0x97aa(%rip),%ymm11        # 3a4d8 <_sk_srcover_bgra_8888_sse2_lowp+0x3dc>
+  .byte  196,98,125,24,53,165,151,0,0        // vbroadcastss  0x97a5(%rip),%ymm14        # 3a4dc <_sk_srcover_bgra_8888_sse2_lowp+0x3e0>
   .byte  196,65,124,40,251                   // vmovaps       %ymm11,%ymm15
   .byte  196,66,45,168,254                   // vfmadd213ps   %ymm14,%ymm10,%ymm15
   .byte  196,193,52,89,193                   // vmulps        %ymm9,%ymm9,%ymm0
   .byte  196,66,125,168,222                  // vfmadd213ps   %ymm14,%ymm0,%ymm11
-  .byte  196,98,125,24,53,140,151,0,0        // vbroadcastss  0x978c(%rip),%ymm14        # 3acb0 <_sk_srcover_bgra_8888_sse2_lowp+0x3e4>
+  .byte  196,98,125,24,53,140,151,0,0        // vbroadcastss  0x978c(%rip),%ymm14        # 3a4e0 <_sk_srcover_bgra_8888_sse2_lowp+0x3e4>
   .byte  196,66,125,168,222                  // vfmadd213ps   %ymm14,%ymm0,%ymm11
   .byte  196,66,45,168,254                   // vfmadd213ps   %ymm14,%ymm10,%ymm15
-  .byte  196,98,125,24,53,125,151,0,0        // vbroadcastss  0x977d(%rip),%ymm14        # 3acb4 <_sk_srcover_bgra_8888_sse2_lowp+0x3e8>
+  .byte  196,98,125,24,53,125,151,0,0        // vbroadcastss  0x977d(%rip),%ymm14        # 3a4e4 <_sk_srcover_bgra_8888_sse2_lowp+0x3e8>
   .byte  196,66,45,168,254                   // vfmadd213ps   %ymm14,%ymm10,%ymm15
   .byte  196,66,125,168,222                  // vfmadd213ps   %ymm14,%ymm0,%ymm11
   .byte  196,193,52,89,195                   // vmulps        %ymm11,%ymm9,%ymm0
-  .byte  196,98,125,24,13,105,151,0,0        // vbroadcastss  0x9769(%rip),%ymm9        # 3acb8 <_sk_srcover_bgra_8888_sse2_lowp+0x3ec>
+  .byte  196,98,125,24,13,105,151,0,0        // vbroadcastss  0x9769(%rip),%ymm9        # 3a4e8 <_sk_srcover_bgra_8888_sse2_lowp+0x3ec>
   .byte  197,52,92,208                       // vsubps        %ymm0,%ymm9,%ymm10
   .byte  196,195,125,74,194,208              // vblendvps     %ymm13,%ymm10,%ymm0,%ymm0
   .byte  196,65,60,89,199                    // vmulps        %ymm15,%ymm8,%ymm8
@@ -48605,14 +48244,14 @@
   .byte  196,67,61,74,193,192                // vblendvps     %ymm12,%ymm9,%ymm8,%ymm8
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
   .byte  196,193,116,194,201,1               // vcmpltps      %ymm9,%ymm1,%ymm1
-  .byte  196,98,125,24,21,251,149,0,0        // vbroadcastss  0x95fb(%rip),%ymm10        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  196,98,125,24,21,251,149,0,0        // vbroadcastss  0x95fb(%rip),%ymm10        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  197,44,92,216                       // vsubps        %ymm0,%ymm10,%ymm11
   .byte  196,195,125,74,195,16               // vblendvps     %ymm1,%ymm11,%ymm0,%ymm0
   .byte  196,193,100,194,201,1               // vcmpltps      %ymm9,%ymm3,%ymm1
   .byte  196,193,44,92,216                   // vsubps        %ymm8,%ymm10,%ymm3
   .byte  196,227,61,74,203,16                // vblendvps     %ymm1,%ymm3,%ymm8,%ymm1
   .byte  196,193,108,194,217,1               // vcmpltps      %ymm9,%ymm2,%ymm3
-  .byte  196,98,125,24,5,213,149,0,0         // vbroadcastss  0x95d5(%rip),%ymm8        # 3ab7c <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  .byte  196,98,125,24,5,213,149,0,0         // vbroadcastss  0x95d5(%rip),%ymm8        # 3a3ac <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   .byte  197,60,92,208                       // vsubps        %ymm0,%ymm8,%ymm10
   .byte  196,195,125,74,194,48               // vblendvps     %ymm3,%ymm10,%ymm0,%ymm0
   .byte  196,193,92,194,217,1                // vcmpltps      %ymm9,%ymm4,%ymm3
@@ -48658,9 +48297,9 @@
   .byte  65,254,202                          // dec           %r10b
   .byte  69,15,182,194                       // movzbl        %r10b,%r8d
   .byte  65,128,248,14                       // cmp           $0xe,%r8b
-  .byte  119,51                              // ja            3166b <_sk_srcover_rgba_8888_hsw_lowp+0x5c>
+  .byte  119,51                              // ja            30e9b <_sk_srcover_rgba_8888_hsw_lowp+0x5c>
   .byte  197,221,239,228                     // vpxor         %ymm4,%ymm4,%ymm4
-  .byte  76,141,29,237,2,0,0                 // lea           0x2ed(%rip),%r11        # 31930 <_sk_srcover_rgba_8888_hsw_lowp+0x321>
+  .byte  76,141,29,237,2,0,0                 // lea           0x2ed(%rip),%r11        # 31160 <_sk_srcover_rgba_8888_hsw_lowp+0x321>
   .byte  75,99,4,131                         // movslq        (%r11,%r8,4),%rax
   .byte  76,1,216                            // add           %r11,%rax
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -48670,10 +48309,10 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  196,193,121,110,41                  // vmovd         (%r9),%xmm5
   .byte  197,221,239,228                     // vpxor         %ymm4,%ymm4,%ymm4
-  .byte  233,22,1,0,0                        // jmpq          31781 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
+  .byte  233,22,1,0,0                        // jmpq          30fb1 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
   .byte  196,193,126,111,41                  // vmovdqu       (%r9),%ymm5
   .byte  196,193,126,111,97,32               // vmovdqu       0x20(%r9),%ymm4
-  .byte  233,6,1,0,0                         // jmpq          31781 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
+  .byte  233,6,1,0,0                         // jmpq          30fb1 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
   .byte  196,193,121,110,97,8                // vmovd         0x8(%r9),%xmm4
   .byte  196,226,121,89,228                  // vpbroadcastq  %xmm4,%xmm4
   .byte  197,197,239,255                     // vpxor         %ymm7,%ymm7,%ymm7
@@ -48682,7 +48321,7 @@
   .byte  197,249,112,237,232                 // vpshufd       $0xe8,%xmm5,%xmm5
   .byte  196,227,93,2,237,3                  // vpblendd      $0x3,%ymm5,%ymm4,%ymm5
   .byte  197,253,111,231                     // vmovdqa       %ymm7,%ymm4
-  .byte  233,216,0,0,0                       // jmpq          31781 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
+  .byte  233,216,0,0,0                       // jmpq          30fb1 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
   .byte  196,193,121,110,97,24               // vmovd         0x18(%r9),%xmm4
   .byte  196,226,125,89,228                  // vpbroadcastq  %xmm4,%ymm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -48698,7 +48337,7 @@
   .byte  196,193,122,111,41                  // vmovdqu       (%r9),%xmm5
   .byte  196,227,85,2,236,240                // vpblendd      $0xf0,%ymm4,%ymm5,%ymm5
   .byte  197,125,127,196                     // vmovdqa       %ymm8,%ymm4
-  .byte  233,129,0,0,0                       // jmpq          31781 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
+  .byte  233,129,0,0,0                       // jmpq          30fb1 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
   .byte  196,193,121,110,97,40               // vmovd         0x28(%r9),%xmm4
   .byte  196,226,121,89,228                  // vpbroadcastq  %xmm4,%xmm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -48708,7 +48347,7 @@
   .byte  196,193,121,110,105,32              // vmovd         0x20(%r9),%xmm5
   .byte  196,227,93,2,229,1                  // vpblendd      $0x1,%ymm5,%ymm4,%ymm4
   .byte  196,193,126,111,41                  // vmovdqu       (%r9),%ymm5
-  .byte  235,76                              // jmp           31781 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
+  .byte  235,76                              // jmp           30fb1 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
   .byte  196,193,121,110,97,56               // vmovd         0x38(%r9),%xmm4
   .byte  196,226,125,89,228                  // vpbroadcastq  %xmm4,%ymm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -48728,9 +48367,9 @@
   .byte  196,227,69,14,236,170               // vpblendw      $0xaa,%ymm4,%ymm7,%ymm5
   .byte  196,227,77,14,228,170               // vpblendw      $0xaa,%ymm4,%ymm6,%ymm4
   .byte  196,226,93,43,237                   // vpackusdw     %ymm5,%ymm4,%ymm5
-  .byte  197,125,111,5,246,156,0,0           // vmovdqa       0x9cf6(%rip),%ymm8        # 3b4a0 <_sk_srcover_bgra_8888_sse2_lowp+0xbd4>
+  .byte  197,125,111,5,6,157,0,0             // vmovdqa       0x9d06(%rip),%ymm8        # 3ace0 <_sk_srcover_bgra_8888_sse2_lowp+0xbe4>
   .byte  196,193,85,219,224                  // vpand         %ymm8,%ymm5,%ymm4
-  .byte  196,98,125,121,13,8,157,0,0         // vpbroadcastw  0x9d08(%rip),%ymm9        # 3b4c0 <_sk_srcover_bgra_8888_sse2_lowp+0xbf4>
+  .byte  196,98,125,121,13,24,157,0,0        // vpbroadcastw  0x9d18(%rip),%ymm9        # 3ad00 <_sk_srcover_bgra_8888_sse2_lowp+0xc04>
   .byte  197,213,113,213,8                   // vpsrlw        $0x8,%ymm5,%ymm5
   .byte  197,197,114,215,16                  // vpsrld        $0x10,%ymm7,%ymm7
   .byte  197,205,114,214,16                  // vpsrld        $0x10,%ymm6,%ymm6
@@ -48769,19 +48408,19 @@
   .byte  196,193,53,114,243,16               // vpslld        $0x10,%ymm11,%ymm9
   .byte  196,65,53,235,202                   // vpor          %ymm10,%ymm9,%ymm9
   .byte  65,128,250,14                       // cmp           $0xe,%r10b
-  .byte  119,26                              // ja            31892 <_sk_srcover_rgba_8888_hsw_lowp+0x283>
-  .byte  76,141,21,237,0,0,0                 // lea           0xed(%rip),%r10        # 3196c <_sk_srcover_rgba_8888_hsw_lowp+0x35d>
+  .byte  119,26                              // ja            310c2 <_sk_srcover_rgba_8888_hsw_lowp+0x283>
+  .byte  76,141,21,237,0,0,0                 // lea           0xed(%rip),%r10        # 3119c <_sk_srcover_rgba_8888_hsw_lowp+0x35d>
   .byte  75,99,4,130                         // movslq        (%r10,%r8,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,65,121,126,1                    // vmovd         %xmm8,(%r9)
-  .byte  233,151,0,0,0                       // jmpq          31929 <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
+  .byte  233,151,0,0,0                       // jmpq          31159 <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
   .byte  196,65,126,127,1                    // vmovdqu       %ymm8,(%r9)
   .byte  196,65,126,127,73,32                // vmovdqu       %ymm9,0x20(%r9)
-  .byte  233,135,0,0,0                       // jmpq          31929 <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
+  .byte  233,135,0,0,0                       // jmpq          31159 <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
   .byte  196,67,121,22,65,8,2                // vpextrd       $0x2,%xmm8,0x8(%r9)
   .byte  196,65,121,214,1                    // vmovq         %xmm8,(%r9)
-  .byte  235,121                             // jmp           31929 <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
+  .byte  235,121                             // jmp           31159 <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,67,121,22,73,24,2               // vpextrd       $0x2,%xmm9,0x18(%r9)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
@@ -48789,12 +48428,12 @@
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,65,121,126,73,16                // vmovd         %xmm9,0x10(%r9)
   .byte  196,65,122,127,1                    // vmovdqu       %xmm8,(%r9)
-  .byte  235,76                              // jmp           31929 <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
+  .byte  235,76                              // jmp           31159 <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
   .byte  196,67,121,22,73,40,2               // vpextrd       $0x2,%xmm9,0x28(%r9)
   .byte  196,67,121,22,73,36,1               // vpextrd       $0x1,%xmm9,0x24(%r9)
   .byte  196,65,121,126,73,32                // vmovd         %xmm9,0x20(%r9)
   .byte  196,65,126,127,1                    // vmovdqu       %ymm8,(%r9)
-  .byte  235,49                              // jmp           31929 <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
+  .byte  235,49                              // jmp           31159 <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
   .byte  196,67,125,57,202,1                 // vextracti128  $0x1,%ymm9,%xmm10
   .byte  196,67,121,22,81,56,2               // vpextrd       $0x2,%xmm10,0x38(%r9)
   .byte  196,67,125,57,202,1                 // vextracti128  $0x1,%ymm9,%xmm10
@@ -48833,10 +48472,10 @@
   .byte  255                                 // (bad)
   .byte  255,64,254                          // incl          -0x2(%rax)
   .byte  255                                 // (bad)
-  .byte  255,45,254,255,255,26               // ljmp          *0x1afffffe(%rip)        # 1b031963 <_sk_srcover_bgra_8888_sse2_lowp+0x1aff7097>
+  .byte  255,45,254,255,255,26               // ljmp          *0x1afffffe(%rip)        # 1b031193 <_sk_srcover_bgra_8888_sse2_lowp+0x1aff7097>
   .byte  254                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,5,254,255,255,28                // incl          0x1cfffffe(%rip)        # 1d03196b <_sk_srcover_bgra_8888_sse2_lowp+0x1cff709f>
+  .byte  255,5,254,255,255,28                // incl          0x1cfffffe(%rip)        # 1d03119b <_sk_srcover_bgra_8888_sse2_lowp+0x1cff709f>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
@@ -48854,7 +48493,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  120,255                             // js            31991 <_sk_srcover_rgba_8888_hsw_lowp+0x382>
+  .byte  120,255                             // js            311c1 <_sk_srcover_rgba_8888_hsw_lowp+0x382>
   .byte  255                                 // (bad)
   .byte  255,113,255                         // pushq         -0x1(%rcx)
   .byte  255                                 // (bad)
@@ -48881,9 +48520,9 @@
   .byte  65,254,202                          // dec           %r10b
   .byte  69,15,182,194                       // movzbl        %r10b,%r8d
   .byte  65,128,248,14                       // cmp           $0xe,%r8b
-  .byte  119,51                              // ja            31a04 <_sk_srcover_bgra_8888_hsw_lowp+0x5c>
+  .byte  119,51                              // ja            31234 <_sk_srcover_bgra_8888_hsw_lowp+0x5c>
   .byte  197,221,239,228                     // vpxor         %ymm4,%ymm4,%ymm4
-  .byte  76,141,29,236,2,0,0                 // lea           0x2ec(%rip),%r11        # 31cc8 <_sk_srcover_bgra_8888_hsw_lowp+0x320>
+  .byte  76,141,29,236,2,0,0                 // lea           0x2ec(%rip),%r11        # 314f8 <_sk_srcover_bgra_8888_hsw_lowp+0x320>
   .byte  75,99,4,131                         // movslq        (%r11,%r8,4),%rax
   .byte  76,1,216                            // add           %r11,%rax
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -48893,10 +48532,10 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  196,193,121,110,41                  // vmovd         (%r9),%xmm5
   .byte  197,221,239,228                     // vpxor         %ymm4,%ymm4,%ymm4
-  .byte  233,22,1,0,0                        // jmpq          31b1a <_sk_srcover_bgra_8888_hsw_lowp+0x172>
+  .byte  233,22,1,0,0                        // jmpq          3134a <_sk_srcover_bgra_8888_hsw_lowp+0x172>
   .byte  196,193,126,111,41                  // vmovdqu       (%r9),%ymm5
   .byte  196,193,126,111,97,32               // vmovdqu       0x20(%r9),%ymm4
-  .byte  233,6,1,0,0                         // jmpq          31b1a <_sk_srcover_bgra_8888_hsw_lowp+0x172>
+  .byte  233,6,1,0,0                         // jmpq          3134a <_sk_srcover_bgra_8888_hsw_lowp+0x172>
   .byte  196,193,121,110,97,8                // vmovd         0x8(%r9),%xmm4
   .byte  196,226,121,89,228                  // vpbroadcastq  %xmm4,%xmm4
   .byte  197,197,239,255                     // vpxor         %ymm7,%ymm7,%ymm7
@@ -48905,7 +48544,7 @@
   .byte  197,249,112,237,232                 // vpshufd       $0xe8,%xmm5,%xmm5
   .byte  196,227,93,2,237,3                  // vpblendd      $0x3,%ymm5,%ymm4,%ymm5
   .byte  197,253,111,231                     // vmovdqa       %ymm7,%ymm4
-  .byte  233,216,0,0,0                       // jmpq          31b1a <_sk_srcover_bgra_8888_hsw_lowp+0x172>
+  .byte  233,216,0,0,0                       // jmpq          3134a <_sk_srcover_bgra_8888_hsw_lowp+0x172>
   .byte  196,193,121,110,97,24               // vmovd         0x18(%r9),%xmm4
   .byte  196,226,125,89,228                  // vpbroadcastq  %xmm4,%ymm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -48921,7 +48560,7 @@
   .byte  196,193,122,111,41                  // vmovdqu       (%r9),%xmm5
   .byte  196,227,85,2,236,240                // vpblendd      $0xf0,%ymm4,%ymm5,%ymm5
   .byte  197,125,127,196                     // vmovdqa       %ymm8,%ymm4
-  .byte  233,129,0,0,0                       // jmpq          31b1a <_sk_srcover_bgra_8888_hsw_lowp+0x172>
+  .byte  233,129,0,0,0                       // jmpq          3134a <_sk_srcover_bgra_8888_hsw_lowp+0x172>
   .byte  196,193,121,110,97,40               // vmovd         0x28(%r9),%xmm4
   .byte  196,226,121,89,228                  // vpbroadcastq  %xmm4,%xmm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -48931,7 +48570,7 @@
   .byte  196,193,121,110,105,32              // vmovd         0x20(%r9),%xmm5
   .byte  196,227,93,2,229,1                  // vpblendd      $0x1,%ymm5,%ymm4,%ymm4
   .byte  196,193,126,111,41                  // vmovdqu       (%r9),%ymm5
-  .byte  235,76                              // jmp           31b1a <_sk_srcover_bgra_8888_hsw_lowp+0x172>
+  .byte  235,76                              // jmp           3134a <_sk_srcover_bgra_8888_hsw_lowp+0x172>
   .byte  196,193,121,110,97,56               // vmovd         0x38(%r9),%xmm4
   .byte  196,226,125,89,228                  // vpbroadcastq  %xmm4,%ymm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -48951,9 +48590,9 @@
   .byte  196,227,93,14,245,170               // vpblendw      $0xaa,%ymm5,%ymm4,%ymm6
   .byte  196,227,69,14,237,170               // vpblendw      $0xaa,%ymm5,%ymm7,%ymm5
   .byte  196,226,85,43,238                   // vpackusdw     %ymm6,%ymm5,%ymm5
-  .byte  197,125,111,5,157,153,0,0           // vmovdqa       0x999d(%rip),%ymm8        # 3b4e0 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  .byte  197,125,111,5,173,153,0,0           // vmovdqa       0x99ad(%rip),%ymm8        # 3ad20 <_sk_srcover_bgra_8888_sse2_lowp+0xc24>
   .byte  196,193,85,219,240                  // vpand         %ymm8,%ymm5,%ymm6
-  .byte  196,98,125,121,13,175,153,0,0       // vpbroadcastw  0x99af(%rip),%ymm9        # 3b500 <_sk_srcover_bgra_8888_sse2_lowp+0xc34>
+  .byte  196,98,125,121,13,191,153,0,0       // vpbroadcastw  0x99bf(%rip),%ymm9        # 3ad40 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
   .byte  197,213,113,213,8                   // vpsrlw        $0x8,%ymm5,%ymm5
   .byte  197,221,114,212,16                  // vpsrld        $0x10,%ymm4,%ymm4
   .byte  197,197,114,215,16                  // vpsrld        $0x10,%ymm7,%ymm7
@@ -48992,19 +48631,19 @@
   .byte  196,193,53,114,243,16               // vpslld        $0x10,%ymm11,%ymm9
   .byte  196,65,53,235,202                   // vpor          %ymm10,%ymm9,%ymm9
   .byte  65,128,250,14                       // cmp           $0xe,%r10b
-  .byte  119,26                              // ja            31c2b <_sk_srcover_bgra_8888_hsw_lowp+0x283>
-  .byte  76,141,21,236,0,0,0                 // lea           0xec(%rip),%r10        # 31d04 <_sk_srcover_bgra_8888_hsw_lowp+0x35c>
+  .byte  119,26                              // ja            3145b <_sk_srcover_bgra_8888_hsw_lowp+0x283>
+  .byte  76,141,21,236,0,0,0                 // lea           0xec(%rip),%r10        # 31534 <_sk_srcover_bgra_8888_hsw_lowp+0x35c>
   .byte  75,99,4,130                         // movslq        (%r10,%r8,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,65,121,126,1                    // vmovd         %xmm8,(%r9)
-  .byte  233,151,0,0,0                       // jmpq          31cc2 <_sk_srcover_bgra_8888_hsw_lowp+0x31a>
+  .byte  233,151,0,0,0                       // jmpq          314f2 <_sk_srcover_bgra_8888_hsw_lowp+0x31a>
   .byte  196,65,126,127,1                    // vmovdqu       %ymm8,(%r9)
   .byte  196,65,126,127,73,32                // vmovdqu       %ymm9,0x20(%r9)
-  .byte  233,135,0,0,0                       // jmpq          31cc2 <_sk_srcover_bgra_8888_hsw_lowp+0x31a>
+  .byte  233,135,0,0,0                       // jmpq          314f2 <_sk_srcover_bgra_8888_hsw_lowp+0x31a>
   .byte  196,67,121,22,65,8,2                // vpextrd       $0x2,%xmm8,0x8(%r9)
   .byte  196,65,121,214,1                    // vmovq         %xmm8,(%r9)
-  .byte  235,121                             // jmp           31cc2 <_sk_srcover_bgra_8888_hsw_lowp+0x31a>
+  .byte  235,121                             // jmp           314f2 <_sk_srcover_bgra_8888_hsw_lowp+0x31a>
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,67,121,22,73,24,2               // vpextrd       $0x2,%xmm9,0x18(%r9)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
@@ -49012,12 +48651,12 @@
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,65,121,126,73,16                // vmovd         %xmm9,0x10(%r9)
   .byte  196,65,122,127,1                    // vmovdqu       %xmm8,(%r9)
-  .byte  235,76                              // jmp           31cc2 <_sk_srcover_bgra_8888_hsw_lowp+0x31a>
+  .byte  235,76                              // jmp           314f2 <_sk_srcover_bgra_8888_hsw_lowp+0x31a>
   .byte  196,67,121,22,73,40,2               // vpextrd       $0x2,%xmm9,0x28(%r9)
   .byte  196,67,121,22,73,36,1               // vpextrd       $0x1,%xmm9,0x24(%r9)
   .byte  196,65,121,126,73,32                // vmovd         %xmm9,0x20(%r9)
   .byte  196,65,126,127,1                    // vmovdqu       %ymm8,(%r9)
-  .byte  235,49                              // jmp           31cc2 <_sk_srcover_bgra_8888_hsw_lowp+0x31a>
+  .byte  235,49                              // jmp           314f2 <_sk_srcover_bgra_8888_hsw_lowp+0x31a>
   .byte  196,67,125,57,202,1                 // vextracti128  $0x1,%ymm9,%xmm10
   .byte  196,67,121,22,81,56,2               // vpextrd       $0x2,%xmm10,0x38(%r9)
   .byte  196,67,125,57,202,1                 // vextracti128  $0x1,%ymm9,%xmm10
@@ -49065,7 +48704,7 @@
   .byte  255,6                               // incl          (%rsi)
   .byte  254                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,29,255,255,255,62               // lcall         *0x3effffff(%rip)        # 3f031d08 <_sk_srcover_bgra_8888_sse2_lowp+0x3eff743c>
+  .byte  255,29,255,255,255,62               // lcall         *0x3effffff(%rip)        # 3f031538 <_sk_srcover_bgra_8888_sse2_lowp+0x3eff743c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,55                              // pushq         (%rdi)
@@ -49083,7 +48722,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  121,255                             // jns           31d29 <_sk_srcover_bgra_8888_hsw_lowp+0x381>
+  .byte  121,255                             // jns           31559 <_sk_srcover_bgra_8888_hsw_lowp+0x381>
   .byte  255                                 // (bad)
   .byte  255,114,255                         // pushq         -0x1(%rdx)
   .byte  255                                 // (bad)
@@ -49116,13 +48755,13 @@
   .byte  73,137,246                          // mov           %rsi,%r14
   .byte  72,137,77,192                       // mov           %rcx,-0x40(%rbp)
   .byte  72,57,203                           // cmp           %rcx,%rbx
-  .byte  15,131,131,0,0,0                    // jae           31df6 <_sk_start_pipeline_sse41_lowp+0xb6>
+  .byte  15,131,131,0,0,0                    // jae           31626 <_sk_start_pipeline_sse41_lowp+0xb6>
   .byte  72,139,69,208                       // mov           -0x30(%rbp),%rax
   .byte  72,141,64,8                         // lea           0x8(%rax),%rax
   .byte  72,137,69,200                       // mov           %rax,-0x38(%rbp)
   .byte  76,57,125,200                       // cmp           %r15,-0x38(%rbp)
   .byte  72,139,85,208                       // mov           -0x30(%rbp),%rdx
-  .byte  119,59                              // ja            31dc4 <_sk_start_pipeline_sse41_lowp+0x84>
+  .byte  119,59                              // ja            315f4 <_sk_start_pipeline_sse41_lowp+0x84>
   .byte  76,139,101,208                      // mov           -0x30(%rbp),%r12
   .byte  49,255                              // xor           %edi,%edi
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
@@ -49141,10 +48780,10 @@
   .byte  73,131,196,16                       // add           $0x10,%r12
   .byte  77,57,252                           // cmp           %r15,%r12
   .byte  73,137,212                          // mov           %rdx,%r12
-  .byte  118,201                             // jbe           31d8d <_sk_start_pipeline_sse41_lowp+0x4d>
+  .byte  118,201                             // jbe           315bd <_sk_start_pipeline_sse41_lowp+0x4d>
   .byte  76,137,255                          // mov           %r15,%rdi
   .byte  72,41,215                           // sub           %rdx,%rdi
-  .byte  116,33                              // je            31ded <_sk_start_pipeline_sse41_lowp+0xad>
+  .byte  116,33                              // je            3161d <_sk_start_pipeline_sse41_lowp+0xad>
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  15,87,201                           // xorps         %xmm1,%xmm1
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
@@ -49158,7 +48797,7 @@
   .byte  65,255,213                          // callq         *%r13
   .byte  72,255,195                          // inc           %rbx
   .byte  72,59,93,192                        // cmp           -0x40(%rbp),%rbx
-  .byte  117,137                             // jne           31d7f <_sk_start_pipeline_sse41_lowp+0x3f>
+  .byte  117,137                             // jne           315af <_sk_start_pipeline_sse41_lowp+0x3f>
   .byte  72,131,196,24                       // add           $0x18,%rsp
   .byte  91                                  // pop           %rbx
   .byte  65,92                               // pop           %r12
@@ -49189,7 +48828,7 @@
   .byte  102,15,110,209                      // movd          %ecx,%xmm2
   .byte  102,15,112,210,0                    // pshufd        $0x0,%xmm2,%xmm2
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
-  .byte  15,88,21,44,151,0,0                 // addps         0x972c(%rip),%xmm2        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  15,88,21,60,151,0,0                 // addps         0x973c(%rip),%xmm2        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,40,218                           // movaps        %xmm2,%xmm3
   .byte  255,224                             // jmpq          *%rax
@@ -49366,7 +49005,7 @@
 FUNCTION(_sk_black_color_sse41_lowp)
 _sk_black_color_sse41_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,113,148,0,0                // movaps        0x9471(%rip),%xmm3        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  15,40,29,129,148,0,0                // movaps        0x9481(%rip),%xmm3        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  15,87,201                           // xorps         %xmm1,%xmm1
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
@@ -49377,7 +49016,7 @@
 FUNCTION(_sk_white_color_sse41_lowp)
 _sk_white_color_sse41_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,5,93,148,0,0                  // movaps        0x945d(%rip),%xmm0        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  15,40,5,109,148,0,0                 // movaps        0x946d(%rip),%xmm0        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  15,40,216                           // movaps        %xmm0,%xmm3
@@ -49388,10 +49027,10 @@
 FUNCTION(_sk_set_rgb_sse41_lowp)
 _sk_set_rgb_sse41_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  243,15,16,21,224,138,0,0            // movss         0x8ae0(%rip),%xmm2        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  243,15,16,21,224,138,0,0            // movss         0x8ae0(%rip),%xmm2        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   .byte  243,15,16,0                         // movss         (%rax),%xmm0
   .byte  243,15,89,194                       // mulss         %xmm2,%xmm0
-  .byte  243,68,15,16,5,159,138,0,0          // movss         0x8a9f(%rip),%xmm8        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  243,68,15,16,5,159,138,0,0          // movss         0x8a9f(%rip),%xmm8        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  243,65,15,88,192                    // addss         %xmm8,%xmm0
   .byte  243,68,15,44,192                    // cvttss2si     %xmm0,%r8d
   .byte  102,65,15,110,192                   // movd          %r8d,%xmm0
@@ -49438,7 +49077,7 @@
 FUNCTION(_sk_premul_sse41_lowp)
 _sk_premul_sse41_lowp:
   .byte  102,15,213,195                      // pmullw        %xmm3,%xmm0
-  .byte  102,68,15,111,5,169,147,0,0         // movdqa        0x93a9(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,5,185,147,0,0         // movdqa        0x93b9(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,192                   // paddw         %xmm8,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,15,213,203                      // pmullw        %xmm3,%xmm1
@@ -49455,7 +49094,7 @@
 FUNCTION(_sk_premul_dst_sse41_lowp)
 _sk_premul_dst_sse41_lowp:
   .byte  102,15,213,231                      // pmullw        %xmm7,%xmm4
-  .byte  102,68,15,111,5,114,147,0,0         // movdqa        0x9372(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,5,130,147,0,0         // movdqa        0x9382(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,224                   // paddw         %xmm8,%xmm4
   .byte  102,15,113,212,8                    // psrlw         $0x8,%xmm4
   .byte  102,15,213,239                      // pmullw        %xmm7,%xmm5
@@ -49503,7 +49142,7 @@
 .globl _sk_invert_sse41_lowp
 FUNCTION(_sk_invert_sse41_lowp)
 _sk_invert_sse41_lowp:
-  .byte  102,68,15,111,5,16,147,0,0          // movdqa        0x9310(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,5,32,147,0,0          // movdqa        0x9320(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,69,15,111,200                   // movdqa        %xmm8,%xmm9
   .byte  102,68,15,249,200                   // psubw         %xmm0,%xmm9
   .byte  102,69,15,111,208                   // movdqa        %xmm8,%xmm10
@@ -49535,7 +49174,7 @@
 _sk_srcatop_sse41_lowp:
   .byte  102,68,15,111,195                   // movdqa        %xmm3,%xmm8
   .byte  102,15,213,199                      // pmullw        %xmm7,%xmm0
-  .byte  102,15,111,29,180,146,0,0           // movdqa        0x92b4(%rip),%xmm3        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,15,111,29,196,146,0,0           // movdqa        0x92c4(%rip),%xmm3        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,68,15,111,203                   // movdqa        %xmm3,%xmm9
   .byte  102,69,15,249,200                   // psubw         %xmm8,%xmm9
   .byte  102,69,15,111,193                   // movdqa        %xmm9,%xmm8
@@ -49567,7 +49206,7 @@
 _sk_dstatop_sse41_lowp:
   .byte  102,68,15,111,196                   // movdqa        %xmm4,%xmm8
   .byte  102,68,15,213,195                   // pmullw        %xmm3,%xmm8
-  .byte  102,68,15,111,13,52,146,0,0         // movdqa        0x9234(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,68,146,0,0         // movdqa        0x9244(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,69,15,253,193                   // paddw         %xmm9,%xmm8
   .byte  102,68,15,111,213                   // movdqa        %xmm5,%xmm10
   .byte  102,68,15,213,211                   // pmullw        %xmm3,%xmm10
@@ -49596,7 +49235,7 @@
 FUNCTION(_sk_srcin_sse41_lowp)
 _sk_srcin_sse41_lowp:
   .byte  102,15,213,199                      // pmullw        %xmm7,%xmm0
-  .byte  102,68,15,111,5,191,145,0,0         // movdqa        0x91bf(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,5,207,145,0,0         // movdqa        0x91cf(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,192                   // paddw         %xmm8,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,15,213,207                      // pmullw        %xmm7,%xmm1
@@ -49617,7 +49256,7 @@
 _sk_dstin_sse41_lowp:
   .byte  102,15,111,196                      // movdqa        %xmm4,%xmm0
   .byte  102,15,213,195                      // pmullw        %xmm3,%xmm0
-  .byte  102,68,15,111,5,118,145,0,0         // movdqa        0x9176(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,5,134,145,0,0         // movdqa        0x9186(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,192                   // paddw         %xmm8,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,15,111,205                      // movdqa        %xmm5,%xmm1
@@ -49638,7 +49277,7 @@
 .globl _sk_srcout_sse41_lowp
 FUNCTION(_sk_srcout_sse41_lowp)
 _sk_srcout_sse41_lowp:
-  .byte  102,68,15,111,5,45,145,0,0          // movdqa        0x912d(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,5,61,145,0,0          // movdqa        0x913d(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,69,15,111,200                   // movdqa        %xmm8,%xmm9
   .byte  102,68,15,249,207                   // psubw         %xmm7,%xmm9
   .byte  102,65,15,213,193                   // pmullw        %xmm9,%xmm0
@@ -49661,7 +49300,7 @@
 FUNCTION(_sk_dstout_sse41_lowp)
 _sk_dstout_sse41_lowp:
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
-  .byte  102,68,15,111,5,214,144,0,0         // movdqa        0x90d6(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,5,230,144,0,0         // movdqa        0x90e6(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,111,216                   // movdqa        %xmm8,%xmm3
   .byte  102,15,249,216                      // psubw         %xmm0,%xmm3
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
@@ -49686,7 +49325,7 @@
 .globl _sk_srcover_sse41_lowp
 FUNCTION(_sk_srcover_sse41_lowp)
 _sk_srcover_sse41_lowp:
-  .byte  102,68,15,111,13,124,144,0,0        // movdqa        0x907c(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,140,144,0,0        // movdqa        0x908c(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,69,15,111,193                   // movdqa        %xmm9,%xmm8
   .byte  102,68,15,249,195                   // psubw         %xmm3,%xmm8
   .byte  102,69,15,111,208                   // movdqa        %xmm8,%xmm10
@@ -49715,7 +49354,7 @@
 .globl _sk_dstover_sse41_lowp
 FUNCTION(_sk_dstover_sse41_lowp)
 _sk_dstover_sse41_lowp:
-  .byte  102,68,15,111,5,2,144,0,0           // movdqa        0x9002(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,5,18,144,0,0          // movdqa        0x9012(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,69,15,111,200                   // movdqa        %xmm8,%xmm9
   .byte  102,68,15,249,207                   // psubw         %xmm7,%xmm9
   .byte  102,65,15,213,193                   // pmullw        %xmm9,%xmm0
@@ -49742,7 +49381,7 @@
 FUNCTION(_sk_modulate_sse41_lowp)
 _sk_modulate_sse41_lowp:
   .byte  102,15,213,196                      // pmullw        %xmm4,%xmm0
-  .byte  102,68,15,111,5,155,143,0,0         // movdqa        0x8f9b(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,5,171,143,0,0         // movdqa        0x8fab(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,192                   // paddw         %xmm8,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,15,213,205                      // pmullw        %xmm5,%xmm1
@@ -49761,7 +49400,7 @@
 .globl _sk_multiply_sse41_lowp
 FUNCTION(_sk_multiply_sse41_lowp)
 _sk_multiply_sse41_lowp:
-  .byte  102,68,15,111,13,90,143,0,0         // movdqa        0x8f5a(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,106,143,0,0        // movdqa        0x8f6a(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,69,15,111,193                   // movdqa        %xmm9,%xmm8
   .byte  102,68,15,249,195                   // psubw         %xmm3,%xmm8
   .byte  102,69,15,111,208                   // movdqa        %xmm8,%xmm10
@@ -49804,7 +49443,7 @@
 FUNCTION(_sk_plus__sse41_lowp)
 _sk_plus__sse41_lowp:
   .byte  102,15,253,196                      // paddw         %xmm4,%xmm0
-  .byte  102,68,15,111,5,159,142,0,0         // movdqa        0x8e9f(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,5,175,142,0,0         // movdqa        0x8eaf(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,56,58,192                 // pminuw        %xmm8,%xmm0
   .byte  102,15,253,205                      // paddw         %xmm5,%xmm1
   .byte  102,65,15,56,58,200                 // pminuw        %xmm8,%xmm1
@@ -49824,7 +49463,7 @@
   .byte  102,15,111,196                      // movdqa        %xmm4,%xmm0
   .byte  102,15,253,193                      // paddw         %xmm1,%xmm0
   .byte  102,15,213,204                      // pmullw        %xmm4,%xmm1
-  .byte  102,68,15,111,21,89,142,0,0         // movdqa        0x8e59(%rip),%xmm10        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,21,105,142,0,0        // movdqa        0x8e69(%rip),%xmm10        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,202                   // paddw         %xmm10,%xmm1
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
   .byte  102,15,249,193                      // psubw         %xmm1,%xmm0
@@ -49856,7 +49495,7 @@
 FUNCTION(_sk_xor__sse41_lowp)
 _sk_xor__sse41_lowp:
   .byte  102,68,15,111,195                   // movdqa        %xmm3,%xmm8
-  .byte  102,68,15,111,13,215,141,0,0        // movdqa        0x8dd7(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,231,141,0,0        // movdqa        0x8de7(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,69,15,111,209                   // movdqa        %xmm9,%xmm10
   .byte  102,68,15,249,215                   // psubw         %xmm7,%xmm10
   .byte  102,65,15,213,194                   // pmullw        %xmm10,%xmm0
@@ -49899,7 +49538,7 @@
   .byte  102,68,15,213,207                   // pmullw        %xmm7,%xmm9
   .byte  102,15,213,203                      // pmullw        %xmm3,%xmm1
   .byte  102,65,15,56,62,201                 // pmaxuw        %xmm9,%xmm1
-  .byte  102,68,15,111,13,30,141,0,0         // movdqa        0x8d1e(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,46,141,0,0         // movdqa        0x8d2e(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,201                   // paddw         %xmm9,%xmm1
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
   .byte  102,15,249,193                      // psubw         %xmm1,%xmm0
@@ -49943,7 +49582,7 @@
   .byte  102,68,15,213,207                   // pmullw        %xmm7,%xmm9
   .byte  102,15,213,203                      // pmullw        %xmm3,%xmm1
   .byte  102,65,15,56,58,201                 // pminuw        %xmm9,%xmm1
-  .byte  102,68,15,111,13,97,140,0,0         // movdqa        0x8c61(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,113,140,0,0        // movdqa        0x8c71(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,201                   // paddw         %xmm9,%xmm1
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
   .byte  102,15,249,193                      // psubw         %xmm1,%xmm0
@@ -49987,10 +49626,10 @@
   .byte  102,68,15,213,207                   // pmullw        %xmm7,%xmm9
   .byte  102,15,213,203                      // pmullw        %xmm3,%xmm1
   .byte  102,65,15,56,58,201                 // pminuw        %xmm9,%xmm1
-  .byte  102,68,15,111,13,164,139,0,0        // movdqa        0x8ba4(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,180,139,0,0        // movdqa        0x8bb4(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,201                   // paddw         %xmm9,%xmm1
   .byte  102,15,113,209,7                    // psrlw         $0x7,%xmm1
-  .byte  102,68,15,111,21,209,146,0,0        // movdqa        0x92d1(%rip),%xmm10        # 3bc50 <_sk_srcover_bgra_8888_sse2_lowp+0x1384>
+  .byte  102,68,15,111,21,225,146,0,0        // movdqa        0x92e1(%rip),%xmm10        # 3b490 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
   .byte  102,65,15,219,202                   // pand          %xmm10,%xmm1
   .byte  102,15,249,193                      // psubw         %xmm1,%xmm0
   .byte  102,68,15,111,221                   // movdqa        %xmm5,%xmm11
@@ -50032,10 +49671,10 @@
   .byte  102,15,111,196                      // movdqa        %xmm4,%xmm0
   .byte  102,15,253,193                      // paddw         %xmm1,%xmm0
   .byte  102,15,213,204                      // pmullw        %xmm4,%xmm1
-  .byte  102,68,15,111,13,224,138,0,0        // movdqa        0x8ae0(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,240,138,0,0        // movdqa        0x8af0(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,201                   // paddw         %xmm9,%xmm1
   .byte  102,15,113,209,7                    // psrlw         $0x7,%xmm1
-  .byte  102,68,15,111,21,13,146,0,0         // movdqa        0x920d(%rip),%xmm10        # 3bc50 <_sk_srcover_bgra_8888_sse2_lowp+0x1384>
+  .byte  102,68,15,111,21,29,146,0,0         // movdqa        0x921d(%rip),%xmm10        # 3b490 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
   .byte  102,65,15,219,202                   // pand          %xmm10,%xmm1
   .byte  102,15,249,193                      // psubw         %xmm1,%xmm0
   .byte  102,15,111,205                      // movdqa        %xmm5,%xmm1
@@ -50071,14 +49710,14 @@
   .byte  102,15,111,245                      // movdqa        %xmm5,%xmm6
   .byte  102,15,111,236                      // movdqa        %xmm4,%xmm5
   .byte  102,68,15,111,192                   // movdqa        %xmm0,%xmm8
-  .byte  102,68,15,111,29,59,138,0,0         // movdqa        0x8a3b(%rip),%xmm11        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,29,75,138,0,0         // movdqa        0x8a4b(%rip),%xmm11        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,69,15,249,220                   // psubw         %xmm12,%xmm11
   .byte  102,65,15,111,227                   // movdqa        %xmm11,%xmm4
   .byte  102,65,15,213,224                   // pmullw        %xmm8,%xmm4
   .byte  102,68,15,111,251                   // movdqa        %xmm3,%xmm15
   .byte  102,69,15,249,248                   // psubw         %xmm8,%xmm15
   .byte  102,69,15,253,192                   // paddw         %xmm8,%xmm8
-  .byte  102,68,15,111,13,100,145,0,0        // movdqa        0x9164(%rip),%xmm9        # 3bc60 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
+  .byte  102,68,15,111,13,116,145,0,0        // movdqa        0x9174(%rip),%xmm9        # 3b4a0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
   .byte  102,68,15,111,243                   // movdqa        %xmm3,%xmm14
   .byte  102,69,15,239,241                   // pxor          %xmm9,%xmm14
   .byte  102,65,15,111,196                   // movdqa        %xmm12,%xmm0
@@ -50125,7 +49764,7 @@
   .byte  102,68,15,111,232                   // movdqa        %xmm0,%xmm13
   .byte  102,65,15,111,193                   // movdqa        %xmm9,%xmm0
   .byte  102,65,15,56,16,210                 // pblendvb      %xmm0,%xmm10,%xmm2
-  .byte  102,68,15,111,13,44,137,0,0         // movdqa        0x892c(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,60,137,0,0         // movdqa        0x893c(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,111,193                   // movdqa        %xmm9,%xmm0
   .byte  102,15,249,195                      // psubw         %xmm3,%xmm0
   .byte  102,15,111,248                      // movdqa        %xmm0,%xmm7
@@ -50164,7 +49803,7 @@
 _sk_overlay_sse41_lowp:
   .byte  102,68,15,111,231                   // movdqa        %xmm7,%xmm12
   .byte  102,68,15,111,192                   // movdqa        %xmm0,%xmm8
-  .byte  102,68,15,111,29,143,136,0,0        // movdqa        0x888f(%rip),%xmm11        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,29,159,136,0,0        // movdqa        0x889f(%rip),%xmm11        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,69,15,249,220                   // psubw         %xmm12,%xmm11
   .byte  102,65,15,111,195                   // movdqa        %xmm11,%xmm0
   .byte  102,65,15,213,192                   // pmullw        %xmm8,%xmm0
@@ -50176,7 +49815,7 @@
   .byte  102,68,15,249,252                   // psubw         %xmm4,%xmm15
   .byte  102,15,111,196                      // movdqa        %xmm4,%xmm0
   .byte  102,15,253,192                      // paddw         %xmm0,%xmm0
-  .byte  102,68,15,111,13,160,143,0,0        // movdqa        0x8fa0(%rip),%xmm9        # 3bc60 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
+  .byte  102,68,15,111,13,176,143,0,0        // movdqa        0x8fb0(%rip),%xmm9        # 3b4a0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
   .byte  102,69,15,111,212                   // movdqa        %xmm12,%xmm10
   .byte  102,68,15,213,211                   // pmullw        %xmm3,%xmm10
   .byte  102,69,15,213,254                   // pmullw        %xmm14,%xmm15
@@ -50222,7 +49861,7 @@
   .byte  102,15,253,210                      // paddw         %xmm2,%xmm2
   .byte  102,65,15,111,193                   // movdqa        %xmm9,%xmm0
   .byte  102,65,15,56,16,210                 // pblendvb      %xmm0,%xmm10,%xmm2
-  .byte  102,68,15,111,13,114,135,0,0        // movdqa        0x8772(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,130,135,0,0        // movdqa        0x8782(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,111,193                   // movdqa        %xmm9,%xmm0
   .byte  102,15,249,195                      // psubw         %xmm3,%xmm0
   .byte  102,15,111,248                      // movdqa        %xmm0,%xmm7
@@ -50265,49 +49904,49 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,41                              // ja            32e60 <_sk_load_8888_sse41_lowp+0x44>
+  .byte  119,41                              // ja            32690 <_sk_load_8888_sse41_lowp+0x44>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,242,0,0,0                 // lea           0xf2(%rip),%r9        # 32f38 <_sk_load_8888_sse41_lowp+0x11c>
+  .byte  76,141,13,242,0,0,0                 // lea           0xf2(%rip),%r9        # 32768 <_sk_load_8888_sse41_lowp+0x11c>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  255,224                             // jmpq          *%rax
   .byte  102,65,15,110,20,144                // movd          (%r8,%rdx,4),%xmm2
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  235,89                              // jmp           32eb9 <_sk_load_8888_sse41_lowp+0x9d>
+  .byte  235,89                              // jmp           326e9 <_sk_load_8888_sse41_lowp+0x9d>
   .byte  243,65,15,111,20,144                // movdqu        (%r8,%rdx,4),%xmm2
   .byte  243,69,15,111,68,144,16             // movdqu        0x10(%r8,%rdx,4),%xmm8
-  .byte  235,74                              // jmp           32eb9 <_sk_load_8888_sse41_lowp+0x9d>
+  .byte  235,74                              // jmp           326e9 <_sk_load_8888_sse41_lowp+0x9d>
   .byte  102,65,15,110,68,144,8              // movd          0x8(%r8,%rdx,4),%xmm0
   .byte  102,68,15,112,192,69                // pshufd        $0x45,%xmm0,%xmm8
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  243,65,15,126,20,144                // movq          (%r8,%rdx,4),%xmm2
   .byte  102,65,15,58,14,208,240             // pblendw       $0xf0,%xmm8,%xmm2
   .byte  102,68,15,111,192                   // movdqa        %xmm0,%xmm8
-  .byte  235,37                              // jmp           32eb9 <_sk_load_8888_sse41_lowp+0x9d>
+  .byte  235,37                              // jmp           326e9 <_sk_load_8888_sse41_lowp+0x9d>
   .byte  102,65,15,110,68,144,24             // movd          0x18(%r8,%rdx,4),%xmm0
   .byte  102,68,15,112,192,69                // pshufd        $0x45,%xmm0,%xmm8
   .byte  102,69,15,58,34,68,144,20,1         // pinsrd        $0x1,0x14(%r8,%rdx,4),%xmm8
   .byte  102,69,15,58,34,68,144,16,0         // pinsrd        $0x0,0x10(%r8,%rdx,4),%xmm8
   .byte  243,65,15,111,20,144                // movdqu        (%r8,%rdx,4),%xmm2
-  .byte  102,15,111,5,175,141,0,0            // movdqa        0x8daf(%rip),%xmm0        # 3bc70 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
+  .byte  102,15,111,5,191,141,0,0            // movdqa        0x8dbf(%rip),%xmm0        # 3b4b0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
   .byte  102,15,111,202                      // movdqa        %xmm2,%xmm1
   .byte  102,15,56,0,200                     // pshufb        %xmm0,%xmm1
   .byte  102,65,15,111,216                   // movdqa        %xmm8,%xmm3
   .byte  102,15,56,0,216                     // pshufb        %xmm0,%xmm3
   .byte  102,15,108,203                      // punpcklqdq    %xmm3,%xmm1
-  .byte  102,68,15,111,13,47,134,0,0         // movdqa        0x862f(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,63,134,0,0         // movdqa        0x863f(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,111,193                      // movdqa        %xmm1,%xmm0
   .byte  102,65,15,219,193                   // pand          %xmm9,%xmm0
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
-  .byte  102,68,15,111,21,136,141,0,0        // movdqa        0x8d88(%rip),%xmm10        # 3bc80 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
+  .byte  102,68,15,111,21,152,141,0,0        // movdqa        0x8d98(%rip),%xmm10        # 3b4c0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
   .byte  102,15,111,218                      // movdqa        %xmm2,%xmm3
   .byte  102,65,15,56,0,218                  // pshufb        %xmm10,%xmm3
   .byte  102,69,15,111,216                   // movdqa        %xmm8,%xmm11
   .byte  102,69,15,56,0,218                  // pshufb        %xmm10,%xmm11
   .byte  102,65,15,108,219                   // punpcklqdq    %xmm11,%xmm3
-  .byte  102,68,15,111,21,117,141,0,0        // movdqa        0x8d75(%rip),%xmm10        # 3bc90 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
+  .byte  102,68,15,111,21,133,141,0,0        // movdqa        0x8d85(%rip),%xmm10        # 3b4d0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d4>
   .byte  102,65,15,56,0,210                  // pshufb        %xmm10,%xmm2
   .byte  102,69,15,56,0,194                  // pshufb        %xmm10,%xmm8
   .byte  102,65,15,108,208                   // punpcklqdq    %xmm8,%xmm2
@@ -50323,7 +49962,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  123,255                             // jnp           32f45 <_sk_load_8888_sse41_lowp+0x129>
+  .byte  123,255                             // jnp           32775 <_sk_load_8888_sse41_lowp+0x129>
   .byte  255                                 // (bad)
   .byte  255,114,255                         // pushq         -0x1(%rdx)
   .byte  255                                 // (bad)
@@ -50345,49 +49984,49 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,41                              // ja            32f98 <_sk_load_8888_dst_sse41_lowp+0x44>
+  .byte  119,41                              // ja            327c8 <_sk_load_8888_dst_sse41_lowp+0x44>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,242,0,0,0                 // lea           0xf2(%rip),%r9        # 33070 <_sk_load_8888_dst_sse41_lowp+0x11c>
+  .byte  76,141,13,242,0,0,0                 // lea           0xf2(%rip),%r9        # 328a0 <_sk_load_8888_dst_sse41_lowp+0x11c>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  255,224                             // jmpq          *%rax
   .byte  102,65,15,110,52,144                // movd          (%r8,%rdx,4),%xmm6
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  235,89                              // jmp           32ff1 <_sk_load_8888_dst_sse41_lowp+0x9d>
+  .byte  235,89                              // jmp           32821 <_sk_load_8888_dst_sse41_lowp+0x9d>
   .byte  243,65,15,111,52,144                // movdqu        (%r8,%rdx,4),%xmm6
   .byte  243,69,15,111,68,144,16             // movdqu        0x10(%r8,%rdx,4),%xmm8
-  .byte  235,74                              // jmp           32ff1 <_sk_load_8888_dst_sse41_lowp+0x9d>
+  .byte  235,74                              // jmp           32821 <_sk_load_8888_dst_sse41_lowp+0x9d>
   .byte  102,65,15,110,100,144,8             // movd          0x8(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  243,65,15,126,52,144                // movq          (%r8,%rdx,4),%xmm6
   .byte  102,65,15,58,14,240,240             // pblendw       $0xf0,%xmm8,%xmm6
   .byte  102,68,15,111,196                   // movdqa        %xmm4,%xmm8
-  .byte  235,37                              // jmp           32ff1 <_sk_load_8888_dst_sse41_lowp+0x9d>
+  .byte  235,37                              // jmp           32821 <_sk_load_8888_dst_sse41_lowp+0x9d>
   .byte  102,65,15,110,100,144,24            // movd          0x18(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  102,69,15,58,34,68,144,20,1         // pinsrd        $0x1,0x14(%r8,%rdx,4),%xmm8
   .byte  102,69,15,58,34,68,144,16,0         // pinsrd        $0x0,0x10(%r8,%rdx,4),%xmm8
   .byte  243,65,15,111,52,144                // movdqu        (%r8,%rdx,4),%xmm6
-  .byte  102,15,111,37,119,140,0,0           // movdqa        0x8c77(%rip),%xmm4        # 3bc70 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
+  .byte  102,15,111,37,135,140,0,0           // movdqa        0x8c87(%rip),%xmm4        # 3b4b0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
   .byte  102,15,111,238                      // movdqa        %xmm6,%xmm5
   .byte  102,15,56,0,236                     // pshufb        %xmm4,%xmm5
   .byte  102,65,15,111,248                   // movdqa        %xmm8,%xmm7
   .byte  102,15,56,0,252                     // pshufb        %xmm4,%xmm7
   .byte  102,15,108,239                      // punpcklqdq    %xmm7,%xmm5
-  .byte  102,68,15,111,13,247,132,0,0        // movdqa        0x84f7(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,7,133,0,0          // movdqa        0x8507(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,111,229                      // movdqa        %xmm5,%xmm4
   .byte  102,65,15,219,225                   // pand          %xmm9,%xmm4
   .byte  102,15,113,213,8                    // psrlw         $0x8,%xmm5
-  .byte  102,68,15,111,21,80,140,0,0         // movdqa        0x8c50(%rip),%xmm10        # 3bc80 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
+  .byte  102,68,15,111,21,96,140,0,0         // movdqa        0x8c60(%rip),%xmm10        # 3b4c0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
   .byte  102,15,111,254                      // movdqa        %xmm6,%xmm7
   .byte  102,65,15,56,0,250                  // pshufb        %xmm10,%xmm7
   .byte  102,69,15,111,216                   // movdqa        %xmm8,%xmm11
   .byte  102,69,15,56,0,218                  // pshufb        %xmm10,%xmm11
   .byte  102,65,15,108,251                   // punpcklqdq    %xmm11,%xmm7
-  .byte  102,68,15,111,21,61,140,0,0         // movdqa        0x8c3d(%rip),%xmm10        # 3bc90 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
+  .byte  102,68,15,111,21,77,140,0,0         // movdqa        0x8c4d(%rip),%xmm10        # 3b4d0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d4>
   .byte  102,65,15,56,0,242                  // pshufb        %xmm10,%xmm6
   .byte  102,69,15,56,0,194                  // pshufb        %xmm10,%xmm8
   .byte  102,65,15,108,240                   // punpcklqdq    %xmm8,%xmm6
@@ -50403,7 +50042,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  123,255                             // jnp           3307d <_sk_load_8888_dst_sse41_lowp+0x129>
+  .byte  123,255                             // jnp           328ad <_sk_load_8888_dst_sse41_lowp+0x129>
   .byte  255                                 // (bad)
   .byte  255,114,255                         // pushq         -0x1(%rdx)
   .byte  255                                 // (bad)
@@ -50440,20 +50079,20 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,27                              // ja            33112 <_sk_store_8888_sse41_lowp+0x86>
+  .byte  119,27                              // ja            32942 <_sk_store_8888_sse41_lowp+0x86>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,87,0,0,0                  // lea           0x57(%rip),%r9        # 33158 <_sk_store_8888_sse41_lowp+0xcc>
+  .byte  76,141,13,87,0,0,0                  // lea           0x57(%rip),%r9        # 32988 <_sk_store_8888_sse41_lowp+0xcc>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,69,15,126,4,144                 // movd          %xmm8,(%r8,%rdx,4)
-  .byte  235,63                              // jmp           33151 <_sk_store_8888_sse41_lowp+0xc5>
+  .byte  235,63                              // jmp           32981 <_sk_store_8888_sse41_lowp+0xc5>
   .byte  243,69,15,127,4,144                 // movdqu        %xmm8,(%r8,%rdx,4)
   .byte  243,69,15,127,76,144,16             // movdqu        %xmm9,0x10(%r8,%rdx,4)
-  .byte  235,48                              // jmp           33151 <_sk_store_8888_sse41_lowp+0xc5>
+  .byte  235,48                              // jmp           32981 <_sk_store_8888_sse41_lowp+0xc5>
   .byte  102,69,15,58,22,68,144,8,2          // pextrd        $0x2,%xmm8,0x8(%r8,%rdx,4)
   .byte  102,69,15,214,4,144                 // movq          %xmm8,(%r8,%rdx,4)
-  .byte  235,31                              // jmp           33151 <_sk_store_8888_sse41_lowp+0xc5>
+  .byte  235,31                              // jmp           32981 <_sk_store_8888_sse41_lowp+0xc5>
   .byte  102,69,15,58,22,76,144,24,2         // pextrd        $0x2,%xmm9,0x18(%r8,%rdx,4)
   .byte  102,69,15,58,22,76,144,20,1         // pextrd        $0x1,%xmm9,0x14(%r8,%rdx,4)
   .byte  102,69,15,126,76,144,16             // movd          %xmm9,0x10(%r8,%rdx,4)
@@ -50497,49 +50136,49 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,41                              // ja            331b8 <_sk_load_bgra_sse41_lowp+0x44>
+  .byte  119,41                              // ja            329e8 <_sk_load_bgra_sse41_lowp+0x44>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,242,0,0,0                 // lea           0xf2(%rip),%r9        # 33290 <_sk_load_bgra_sse41_lowp+0x11c>
+  .byte  76,141,13,242,0,0,0                 // lea           0xf2(%rip),%r9        # 32ac0 <_sk_load_bgra_sse41_lowp+0x11c>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  255,224                             // jmpq          *%rax
   .byte  102,65,15,110,4,144                 // movd          (%r8,%rdx,4),%xmm0
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  235,89                              // jmp           33211 <_sk_load_bgra_sse41_lowp+0x9d>
+  .byte  235,89                              // jmp           32a41 <_sk_load_bgra_sse41_lowp+0x9d>
   .byte  243,65,15,111,4,144                 // movdqu        (%r8,%rdx,4),%xmm0
   .byte  243,69,15,111,68,144,16             // movdqu        0x10(%r8,%rdx,4),%xmm8
-  .byte  235,74                              // jmp           33211 <_sk_load_bgra_sse41_lowp+0x9d>
+  .byte  235,74                              // jmp           32a41 <_sk_load_bgra_sse41_lowp+0x9d>
   .byte  102,65,15,110,68,144,8              // movd          0x8(%r8,%rdx,4),%xmm0
   .byte  102,68,15,112,192,69                // pshufd        $0x45,%xmm0,%xmm8
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  243,65,15,126,4,144                 // movq          (%r8,%rdx,4),%xmm0
   .byte  102,65,15,58,14,192,240             // pblendw       $0xf0,%xmm8,%xmm0
   .byte  102,68,15,111,193                   // movdqa        %xmm1,%xmm8
-  .byte  235,37                              // jmp           33211 <_sk_load_bgra_sse41_lowp+0x9d>
+  .byte  235,37                              // jmp           32a41 <_sk_load_bgra_sse41_lowp+0x9d>
   .byte  102,65,15,110,68,144,24             // movd          0x18(%r8,%rdx,4),%xmm0
   .byte  102,68,15,112,192,69                // pshufd        $0x45,%xmm0,%xmm8
   .byte  102,69,15,58,34,68,144,20,1         // pinsrd        $0x1,0x14(%r8,%rdx,4),%xmm8
   .byte  102,69,15,58,34,68,144,16,0         // pinsrd        $0x0,0x10(%r8,%rdx,4),%xmm8
   .byte  243,65,15,111,4,144                 // movdqu        (%r8,%rdx,4),%xmm0
-  .byte  102,15,111,21,87,138,0,0            // movdqa        0x8a57(%rip),%xmm2        # 3bc70 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
+  .byte  102,15,111,21,103,138,0,0           // movdqa        0x8a67(%rip),%xmm2        # 3b4b0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
   .byte  102,15,56,0,202                     // pshufb        %xmm2,%xmm1
   .byte  102,65,15,111,216                   // movdqa        %xmm8,%xmm3
   .byte  102,15,56,0,218                     // pshufb        %xmm2,%xmm3
   .byte  102,15,108,203                      // punpcklqdq    %xmm3,%xmm1
-  .byte  102,68,15,111,13,215,130,0,0        // movdqa        0x82d7(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,231,130,0,0        // movdqa        0x82e7(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,111,209                      // movdqa        %xmm1,%xmm2
   .byte  102,65,15,219,209                   // pand          %xmm9,%xmm2
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
-  .byte  102,68,15,111,21,48,138,0,0         // movdqa        0x8a30(%rip),%xmm10        # 3bc80 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
+  .byte  102,68,15,111,21,64,138,0,0         // movdqa        0x8a40(%rip),%xmm10        # 3b4c0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
   .byte  102,15,111,216                      // movdqa        %xmm0,%xmm3
   .byte  102,65,15,56,0,218                  // pshufb        %xmm10,%xmm3
   .byte  102,69,15,111,216                   // movdqa        %xmm8,%xmm11
   .byte  102,69,15,56,0,218                  // pshufb        %xmm10,%xmm11
   .byte  102,65,15,108,219                   // punpcklqdq    %xmm11,%xmm3
-  .byte  102,68,15,111,21,29,138,0,0         // movdqa        0x8a1d(%rip),%xmm10        # 3bc90 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
+  .byte  102,68,15,111,21,45,138,0,0         // movdqa        0x8a2d(%rip),%xmm10        # 3b4d0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d4>
   .byte  102,65,15,56,0,194                  // pshufb        %xmm10,%xmm0
   .byte  102,69,15,56,0,194                  // pshufb        %xmm10,%xmm8
   .byte  102,65,15,108,192                   // punpcklqdq    %xmm8,%xmm0
@@ -50555,7 +50194,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  123,255                             // jnp           3329d <_sk_load_bgra_sse41_lowp+0x129>
+  .byte  123,255                             // jnp           32acd <_sk_load_bgra_sse41_lowp+0x129>
   .byte  255                                 // (bad)
   .byte  255,114,255                         // pushq         -0x1(%rdx)
   .byte  255                                 // (bad)
@@ -50577,49 +50216,49 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,41                              // ja            332f0 <_sk_load_bgra_dst_sse41_lowp+0x44>
+  .byte  119,41                              // ja            32b20 <_sk_load_bgra_dst_sse41_lowp+0x44>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,242,0,0,0                 // lea           0xf2(%rip),%r9        # 333c8 <_sk_load_bgra_dst_sse41_lowp+0x11c>
+  .byte  76,141,13,242,0,0,0                 // lea           0xf2(%rip),%r9        # 32bf8 <_sk_load_bgra_dst_sse41_lowp+0x11c>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  255,224                             // jmpq          *%rax
   .byte  102,65,15,110,36,144                // movd          (%r8,%rdx,4),%xmm4
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  235,89                              // jmp           33349 <_sk_load_bgra_dst_sse41_lowp+0x9d>
+  .byte  235,89                              // jmp           32b79 <_sk_load_bgra_dst_sse41_lowp+0x9d>
   .byte  243,65,15,111,36,144                // movdqu        (%r8,%rdx,4),%xmm4
   .byte  243,69,15,111,68,144,16             // movdqu        0x10(%r8,%rdx,4),%xmm8
-  .byte  235,74                              // jmp           33349 <_sk_load_bgra_dst_sse41_lowp+0x9d>
+  .byte  235,74                              // jmp           32b79 <_sk_load_bgra_dst_sse41_lowp+0x9d>
   .byte  102,65,15,110,100,144,8             // movd          0x8(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  243,65,15,126,36,144                // movq          (%r8,%rdx,4),%xmm4
   .byte  102,65,15,58,14,224,240             // pblendw       $0xf0,%xmm8,%xmm4
   .byte  102,68,15,111,197                   // movdqa        %xmm5,%xmm8
-  .byte  235,37                              // jmp           33349 <_sk_load_bgra_dst_sse41_lowp+0x9d>
+  .byte  235,37                              // jmp           32b79 <_sk_load_bgra_dst_sse41_lowp+0x9d>
   .byte  102,65,15,110,100,144,24            // movd          0x18(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  102,69,15,58,34,68,144,20,1         // pinsrd        $0x1,0x14(%r8,%rdx,4),%xmm8
   .byte  102,69,15,58,34,68,144,16,0         // pinsrd        $0x0,0x10(%r8,%rdx,4),%xmm8
   .byte  243,65,15,111,36,144                // movdqu        (%r8,%rdx,4),%xmm4
-  .byte  102,15,111,53,31,137,0,0            // movdqa        0x891f(%rip),%xmm6        # 3bc70 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
+  .byte  102,15,111,53,47,137,0,0            // movdqa        0x892f(%rip),%xmm6        # 3b4b0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
   .byte  102,15,111,236                      // movdqa        %xmm4,%xmm5
   .byte  102,15,56,0,238                     // pshufb        %xmm6,%xmm5
   .byte  102,65,15,111,248                   // movdqa        %xmm8,%xmm7
   .byte  102,15,56,0,254                     // pshufb        %xmm6,%xmm7
   .byte  102,15,108,239                      // punpcklqdq    %xmm7,%xmm5
-  .byte  102,68,15,111,13,159,129,0,0        // movdqa        0x819f(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,175,129,0,0        // movdqa        0x81af(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,111,245                      // movdqa        %xmm5,%xmm6
   .byte  102,65,15,219,241                   // pand          %xmm9,%xmm6
   .byte  102,15,113,213,8                    // psrlw         $0x8,%xmm5
-  .byte  102,68,15,111,21,248,136,0,0        // movdqa        0x88f8(%rip),%xmm10        # 3bc80 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
+  .byte  102,68,15,111,21,8,137,0,0          // movdqa        0x8908(%rip),%xmm10        # 3b4c0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
   .byte  102,15,111,252                      // movdqa        %xmm4,%xmm7
   .byte  102,65,15,56,0,250                  // pshufb        %xmm10,%xmm7
   .byte  102,69,15,111,216                   // movdqa        %xmm8,%xmm11
   .byte  102,69,15,56,0,218                  // pshufb        %xmm10,%xmm11
   .byte  102,65,15,108,251                   // punpcklqdq    %xmm11,%xmm7
-  .byte  102,68,15,111,21,229,136,0,0        // movdqa        0x88e5(%rip),%xmm10        # 3bc90 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
+  .byte  102,68,15,111,21,245,136,0,0        // movdqa        0x88f5(%rip),%xmm10        # 3b4d0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d4>
   .byte  102,65,15,56,0,226                  // pshufb        %xmm10,%xmm4
   .byte  102,69,15,56,0,194                  // pshufb        %xmm10,%xmm8
   .byte  102,65,15,108,224                   // punpcklqdq    %xmm8,%xmm4
@@ -50635,7 +50274,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  123,255                             // jnp           333d5 <_sk_load_bgra_dst_sse41_lowp+0x129>
+  .byte  123,255                             // jnp           32c05 <_sk_load_bgra_dst_sse41_lowp+0x129>
   .byte  255                                 // (bad)
   .byte  255,114,255                         // pushq         -0x1(%rdx)
   .byte  255                                 // (bad)
@@ -50672,20 +50311,20 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,27                              // ja            3346a <_sk_store_bgra_sse41_lowp+0x86>
+  .byte  119,27                              // ja            32c9a <_sk_store_bgra_sse41_lowp+0x86>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,87,0,0,0                  // lea           0x57(%rip),%r9        # 334b0 <_sk_store_bgra_sse41_lowp+0xcc>
+  .byte  76,141,13,87,0,0,0                  // lea           0x57(%rip),%r9        # 32ce0 <_sk_store_bgra_sse41_lowp+0xcc>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,69,15,126,4,144                 // movd          %xmm8,(%r8,%rdx,4)
-  .byte  235,63                              // jmp           334a9 <_sk_store_bgra_sse41_lowp+0xc5>
+  .byte  235,63                              // jmp           32cd9 <_sk_store_bgra_sse41_lowp+0xc5>
   .byte  243,69,15,127,4,144                 // movdqu        %xmm8,(%r8,%rdx,4)
   .byte  243,69,15,127,76,144,16             // movdqu        %xmm9,0x10(%r8,%rdx,4)
-  .byte  235,48                              // jmp           334a9 <_sk_store_bgra_sse41_lowp+0xc5>
+  .byte  235,48                              // jmp           32cd9 <_sk_store_bgra_sse41_lowp+0xc5>
   .byte  102,69,15,58,22,68,144,8,2          // pextrd        $0x2,%xmm8,0x8(%r8,%rdx,4)
   .byte  102,69,15,214,4,144                 // movq          %xmm8,(%r8,%rdx,4)
-  .byte  235,31                              // jmp           334a9 <_sk_store_bgra_sse41_lowp+0xc5>
+  .byte  235,31                              // jmp           32cd9 <_sk_store_bgra_sse41_lowp+0xc5>
   .byte  102,69,15,58,22,76,144,24,2         // pextrd        $0x2,%xmm9,0x18(%r8,%rdx,4)
   .byte  102,69,15,58,22,76,144,20,1         // pextrd        $0x1,%xmm9,0x14(%r8,%rdx,4)
   .byte  102,69,15,126,76,144,16             // movd          %xmm9,0x10(%r8,%rdx,4)
@@ -50788,17 +50427,17 @@
   .byte  102,65,15,196,202,5                 // pinsrw        $0x5,%r10d,%xmm1
   .byte  102,65,15,196,201,6                 // pinsrw        $0x6,%r9d,%xmm1
   .byte  102,15,196,200,7                    // pinsrw        $0x7,%eax,%xmm1
-  .byte  102,68,15,111,13,8,127,0,0          // movdqa        0x7f08(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,24,127,0,0         // movdqa        0x7f18(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,111,193                      // movdqa        %xmm1,%xmm0
   .byte  102,65,15,219,193                   // pand          %xmm9,%xmm0
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
-  .byte  102,68,15,111,21,97,134,0,0         // movdqa        0x8661(%rip),%xmm10        # 3bc80 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
+  .byte  102,68,15,111,21,113,134,0,0        // movdqa        0x8671(%rip),%xmm10        # 3b4c0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
   .byte  102,15,111,218                      // movdqa        %xmm2,%xmm3
   .byte  102,65,15,56,0,218                  // pshufb        %xmm10,%xmm3
   .byte  102,69,15,111,216                   // movdqa        %xmm8,%xmm11
   .byte  102,69,15,56,0,218                  // pshufb        %xmm10,%xmm11
   .byte  102,65,15,108,219                   // punpcklqdq    %xmm11,%xmm3
-  .byte  102,68,15,111,21,78,134,0,0         // movdqa        0x864e(%rip),%xmm10        # 3bc90 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
+  .byte  102,68,15,111,21,94,134,0,0         // movdqa        0x865e(%rip),%xmm10        # 3b4d0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d4>
   .byte  102,65,15,56,0,210                  // pshufb        %xmm10,%xmm2
   .byte  102,69,15,56,0,194                  // pshufb        %xmm10,%xmm8
   .byte  102,65,15,108,208                   // punpcklqdq    %xmm8,%xmm2
@@ -50883,17 +50522,17 @@
   .byte  102,65,15,196,202,5                 // pinsrw        $0x5,%r10d,%xmm1
   .byte  102,65,15,196,201,6                 // pinsrw        $0x6,%r9d,%xmm1
   .byte  102,15,196,200,7                    // pinsrw        $0x7,%eax,%xmm1
-  .byte  102,68,15,111,13,112,125,0,0        // movdqa        0x7d70(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,128,125,0,0        // movdqa        0x7d80(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,111,209                      // movdqa        %xmm1,%xmm2
   .byte  102,65,15,219,209                   // pand          %xmm9,%xmm2
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
-  .byte  102,68,15,111,21,201,132,0,0        // movdqa        0x84c9(%rip),%xmm10        # 3bc80 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
+  .byte  102,68,15,111,21,217,132,0,0        // movdqa        0x84d9(%rip),%xmm10        # 3b4c0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
   .byte  102,15,111,216                      // movdqa        %xmm0,%xmm3
   .byte  102,65,15,56,0,218                  // pshufb        %xmm10,%xmm3
   .byte  102,69,15,111,216                   // movdqa        %xmm8,%xmm11
   .byte  102,69,15,56,0,218                  // pshufb        %xmm10,%xmm11
   .byte  102,65,15,108,219                   // punpcklqdq    %xmm11,%xmm3
-  .byte  102,68,15,111,21,182,132,0,0        // movdqa        0x84b6(%rip),%xmm10        # 3bc90 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
+  .byte  102,68,15,111,21,198,132,0,0        // movdqa        0x84c6(%rip),%xmm10        # 3b4d0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d4>
   .byte  102,65,15,56,0,194                  // pshufb        %xmm10,%xmm0
   .byte  102,69,15,56,0,194                  // pshufb        %xmm10,%xmm8
   .byte  102,65,15,108,192                   // punpcklqdq    %xmm8,%xmm0
@@ -50919,23 +50558,23 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            33838 <_sk_load_565_sse41_lowp+0x3c>
+  .byte  119,34                              // ja            33068 <_sk_load_565_sse41_lowp+0x3c>
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,196,0,0,0                 // lea           0xc4(%rip),%r9        # 338e8 <_sk_load_565_sse41_lowp+0xec>
+  .byte  76,141,13,196,0,0,0                 // lea           0xc4(%rip),%r9        # 33118 <_sk_load_565_sse41_lowp+0xec>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
-  .byte  235,74                              // jmp           33882 <_sk_load_565_sse41_lowp+0x86>
+  .byte  235,74                              // jmp           330b2 <_sk_load_565_sse41_lowp+0x86>
   .byte  243,65,15,111,4,80                  // movdqu        (%r8,%rdx,2),%xmm0
-  .byte  235,66                              // jmp           33882 <_sk_load_565_sse41_lowp+0x86>
+  .byte  235,66                              // jmp           330b2 <_sk_load_565_sse41_lowp+0x86>
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  102,65,15,196,76,80,4,2             // pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm1
   .byte  102,65,15,110,4,80                  // movd          (%r8,%rdx,2),%xmm0
   .byte  102,15,58,14,193,252                // pblendw       $0xfc,%xmm1,%xmm0
-  .byte  235,40                              // jmp           33882 <_sk_load_565_sse41_lowp+0x86>
+  .byte  235,40                              // jmp           330b2 <_sk_load_565_sse41_lowp+0x86>
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  102,65,15,196,76,80,12,6            // pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm1
   .byte  102,65,15,196,76,80,10,5            // pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm1
@@ -50944,11 +50583,11 @@
   .byte  102,15,58,14,193,240                // pblendw       $0xf0,%xmm1,%xmm0
   .byte  102,15,111,216                      // movdqa        %xmm0,%xmm3
   .byte  102,15,113,211,8                    // psrlw         $0x8,%xmm3
-  .byte  102,15,219,29,13,132,0,0            // pand          0x840d(%rip),%xmm3        # 3bca0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d4>
+  .byte  102,15,219,29,29,132,0,0            // pand          0x841d(%rip),%xmm3        # 3b4e0 <_sk_srcover_bgra_8888_sse2_lowp+0x13e4>
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
   .byte  102,15,113,209,5                    // psrlw         $0x5,%xmm1
-  .byte  102,15,219,13,12,132,0,0            // pand          0x840c(%rip),%xmm1        # 3bcb0 <_sk_srcover_bgra_8888_sse2_lowp+0x13e4>
-  .byte  102,15,111,21,20,132,0,0            // movdqa        0x8414(%rip),%xmm2        # 3bcc0 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  .byte  102,15,219,13,28,132,0,0            // pand          0x841c(%rip),%xmm1        # 3b4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  .byte  102,15,111,21,36,132,0,0            // movdqa        0x8424(%rip),%xmm2        # 3b500 <_sk_srcover_bgra_8888_sse2_lowp+0x1404>
   .byte  102,15,219,208                      // pand          %xmm0,%xmm2
   .byte  102,15,113,208,13                   // psrlw         $0xd,%xmm0
   .byte  102,15,235,195                      // por           %xmm3,%xmm0
@@ -50961,7 +50600,7 @@
   .byte  102,15,113,210,2                    // psrlw         $0x2,%xmm2
   .byte  102,15,235,211                      // por           %xmm3,%xmm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,42,124,0,0                 // movaps        0x7c2a(%rip),%xmm3        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  15,40,29,58,124,0,0                 // movaps        0x7c3a(%rip),%xmm3        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  255,224                             // jmpq          *%rax
   .byte  69,255                              // rex.RB        (bad)
   .byte  255                                 // (bad)
@@ -50972,7 +50611,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  126,255                             // jle           338fd <_sk_load_565_sse41_lowp+0x101>
+  .byte  126,255                             // jle           3312d <_sk_load_565_sse41_lowp+0x101>
   .byte  255                                 // (bad)
   .byte  255,114,255                         // pushq         -0x1(%rdx)
   .byte  255                                 // (bad)
@@ -50991,23 +50630,23 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            33940 <_sk_load_565_dst_sse41_lowp+0x3c>
+  .byte  119,34                              // ja            33170 <_sk_load_565_dst_sse41_lowp+0x3c>
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,196,0,0,0                 // lea           0xc4(%rip),%r9        # 339f0 <_sk_load_565_dst_sse41_lowp+0xec>
+  .byte  76,141,13,196,0,0,0                 // lea           0xc4(%rip),%r9        # 33220 <_sk_load_565_dst_sse41_lowp+0xec>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
-  .byte  235,74                              // jmp           3398a <_sk_load_565_dst_sse41_lowp+0x86>
+  .byte  235,74                              // jmp           331ba <_sk_load_565_dst_sse41_lowp+0x86>
   .byte  243,65,15,111,36,80                 // movdqu        (%r8,%rdx,2),%xmm4
-  .byte  235,66                              // jmp           3398a <_sk_load_565_dst_sse41_lowp+0x86>
+  .byte  235,66                              // jmp           331ba <_sk_load_565_dst_sse41_lowp+0x86>
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  102,65,15,196,108,80,4,2            // pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm5
   .byte  102,65,15,110,36,80                 // movd          (%r8,%rdx,2),%xmm4
   .byte  102,15,58,14,229,252                // pblendw       $0xfc,%xmm5,%xmm4
-  .byte  235,40                              // jmp           3398a <_sk_load_565_dst_sse41_lowp+0x86>
+  .byte  235,40                              // jmp           331ba <_sk_load_565_dst_sse41_lowp+0x86>
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  102,65,15,196,108,80,12,6           // pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm5
   .byte  102,65,15,196,108,80,10,5           // pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm5
@@ -51016,11 +50655,11 @@
   .byte  102,15,58,14,229,240                // pblendw       $0xf0,%xmm5,%xmm4
   .byte  102,15,111,252                      // movdqa        %xmm4,%xmm7
   .byte  102,15,113,215,8                    // psrlw         $0x8,%xmm7
-  .byte  102,15,219,61,5,131,0,0             // pand          0x8305(%rip),%xmm7        # 3bca0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d4>
+  .byte  102,15,219,61,21,131,0,0            // pand          0x8315(%rip),%xmm7        # 3b4e0 <_sk_srcover_bgra_8888_sse2_lowp+0x13e4>
   .byte  102,15,111,236                      // movdqa        %xmm4,%xmm5
   .byte  102,15,113,213,5                    // psrlw         $0x5,%xmm5
-  .byte  102,15,219,45,4,131,0,0             // pand          0x8304(%rip),%xmm5        # 3bcb0 <_sk_srcover_bgra_8888_sse2_lowp+0x13e4>
-  .byte  102,15,111,53,12,131,0,0            // movdqa        0x830c(%rip),%xmm6        # 3bcc0 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  .byte  102,15,219,45,20,131,0,0            // pand          0x8314(%rip),%xmm5        # 3b4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  .byte  102,15,111,53,28,131,0,0            // movdqa        0x831c(%rip),%xmm6        # 3b500 <_sk_srcover_bgra_8888_sse2_lowp+0x1404>
   .byte  102,15,219,244                      // pand          %xmm4,%xmm6
   .byte  102,15,113,212,13                   // psrlw         $0xd,%xmm4
   .byte  102,15,235,231                      // por           %xmm7,%xmm4
@@ -51033,7 +50672,7 @@
   .byte  102,15,113,214,2                    // psrlw         $0x2,%xmm6
   .byte  102,15,235,247                      // por           %xmm7,%xmm6
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,61,34,123,0,0                 // movaps        0x7b22(%rip),%xmm7        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  15,40,61,50,123,0,0                 // movaps        0x7b32(%rip),%xmm7        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  255,224                             // jmpq          *%rax
   .byte  69,255                              // rex.RB        (bad)
   .byte  255                                 // (bad)
@@ -51044,7 +50683,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  126,255                             // jle           33a05 <_sk_load_565_dst_sse41_lowp+0x101>
+  .byte  126,255                             // jle           33235 <_sk_load_565_dst_sse41_lowp+0x101>
   .byte  255                                 // (bad)
   .byte  255,114,255                         // pushq         -0x1(%rdx)
   .byte  255                                 // (bad)
@@ -51061,10 +50700,10 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  102,68,15,111,192                   // movdqa        %xmm0,%xmm8
   .byte  102,65,15,113,240,8                 // psllw         $0x8,%xmm8
-  .byte  102,68,15,219,5,160,130,0,0         // pand          0x82a0(%rip),%xmm8        # 3bcd0 <_sk_srcover_bgra_8888_sse2_lowp+0x1404>
+  .byte  102,68,15,219,5,176,130,0,0         // pand          0x82b0(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0x1414>
   .byte  102,68,15,111,201                   // movdqa        %xmm1,%xmm9
   .byte  102,65,15,113,241,3                 // psllw         $0x3,%xmm9
-  .byte  102,68,15,219,13,156,130,0,0        // pand          0x829c(%rip),%xmm9        # 3bce0 <_sk_srcover_bgra_8888_sse2_lowp+0x1414>
+  .byte  102,68,15,219,13,172,130,0,0        // pand          0x82ac(%rip),%xmm9        # 3b520 <_sk_srcover_bgra_8888_sse2_lowp+0x1424>
   .byte  102,69,15,235,200                   // por           %xmm8,%xmm9
   .byte  102,68,15,111,194                   // movdqa        %xmm2,%xmm8
   .byte  102,65,15,113,208,3                 // psrlw         $0x3,%xmm8
@@ -51073,19 +50712,19 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,29                              // ja            33a80 <_sk_store_565_sse41_lowp+0x74>
+  .byte  119,29                              // ja            332b0 <_sk_store_565_sse41_lowp+0x74>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,83,0,0,0                  // lea           0x53(%rip),%r9        # 33ac0 <_sk_store_565_sse41_lowp+0xb4>
+  .byte  76,141,13,83,0,0,0                  // lea           0x53(%rip),%r9        # 332f0 <_sk_store_565_sse41_lowp+0xb4>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,69,15,58,21,4,80,0              // pextrw        $0x0,%xmm8,(%r8,%rdx,2)
-  .byte  235,58                              // jmp           33aba <_sk_store_565_sse41_lowp+0xae>
+  .byte  235,58                              // jmp           332ea <_sk_store_565_sse41_lowp+0xae>
   .byte  243,69,15,127,4,80                  // movdqu        %xmm8,(%r8,%rdx,2)
-  .byte  235,50                              // jmp           33aba <_sk_store_565_sse41_lowp+0xae>
+  .byte  235,50                              // jmp           332ea <_sk_store_565_sse41_lowp+0xae>
   .byte  102,69,15,58,21,68,80,4,2           // pextrw        $0x2,%xmm8,0x4(%r8,%rdx,2)
   .byte  102,69,15,126,4,80                  // movd          %xmm8,(%r8,%rdx,2)
-  .byte  235,33                              // jmp           33aba <_sk_store_565_sse41_lowp+0xae>
+  .byte  235,33                              // jmp           332ea <_sk_store_565_sse41_lowp+0xae>
   .byte  102,69,15,58,21,68,80,12,6          // pextrw        $0x6,%xmm8,0xc(%r8,%rdx,2)
   .byte  102,69,15,58,21,68,80,10,5          // pextrw        $0x5,%xmm8,0xa(%r8,%rdx,2)
   .byte  102,69,15,58,21,68,80,8,4           // pextrw        $0x4,%xmm8,0x8(%r8,%rdx,2)
@@ -51105,7 +50744,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  235,255                             // jmp           33ad1 <_sk_store_565_sse41_lowp+0xc5>
+  .byte  235,255                             // jmp           33301 <_sk_store_565_sse41_lowp+0xc5>
   .byte  255                                 // (bad)
   .byte  255,226                             // jmpq          *%rdx
   .byte  255                                 // (bad)
@@ -51182,11 +50821,11 @@
   .byte  102,15,196,192,7                    // pinsrw        $0x7,%eax,%xmm0
   .byte  102,15,111,216                      // movdqa        %xmm0,%xmm3
   .byte  102,15,113,211,8                    // psrlw         $0x8,%xmm3
-  .byte  102,15,219,29,170,128,0,0           // pand          0x80aa(%rip),%xmm3        # 3bca0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d4>
+  .byte  102,15,219,29,186,128,0,0           // pand          0x80ba(%rip),%xmm3        # 3b4e0 <_sk_srcover_bgra_8888_sse2_lowp+0x13e4>
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
   .byte  102,15,113,209,5                    // psrlw         $0x5,%xmm1
-  .byte  102,15,219,13,169,128,0,0           // pand          0x80a9(%rip),%xmm1        # 3bcb0 <_sk_srcover_bgra_8888_sse2_lowp+0x13e4>
-  .byte  102,15,111,21,177,128,0,0           // movdqa        0x80b1(%rip),%xmm2        # 3bcc0 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  .byte  102,15,219,13,185,128,0,0           // pand          0x80b9(%rip),%xmm1        # 3b4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  .byte  102,15,111,21,193,128,0,0           // movdqa        0x80c1(%rip),%xmm2        # 3b500 <_sk_srcover_bgra_8888_sse2_lowp+0x1404>
   .byte  102,15,219,208                      // pand          %xmm0,%xmm2
   .byte  102,15,113,208,13                   // psrlw         $0xd,%xmm0
   .byte  102,15,235,195                      // por           %xmm3,%xmm0
@@ -51199,7 +50838,7 @@
   .byte  102,15,113,210,2                    // psrlw         $0x2,%xmm2
   .byte  102,15,235,211                      // por           %xmm3,%xmm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,199,120,0,0                // movaps        0x78c7(%rip),%xmm3        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  15,40,29,215,120,0,0                // movaps        0x78d7(%rip),%xmm3        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  91                                  // pop           %rbx
   .byte  65,92                               // pop           %r12
   .byte  65,94                               // pop           %r14
@@ -51220,23 +50859,23 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,35                              // ja            33c90 <_sk_load_4444_sse41_lowp+0x3d>
+  .byte  119,35                              // ja            334c0 <_sk_load_4444_sse41_lowp+0x3d>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,209,0,0,0                 // lea           0xd1(%rip),%r9        # 33d4c <_sk_load_4444_sse41_lowp+0xf9>
+  .byte  76,141,13,209,0,0,0                 // lea           0xd1(%rip),%r9        # 3357c <_sk_load_4444_sse41_lowp+0xf9>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
-  .byte  235,76                              // jmp           33cdc <_sk_load_4444_sse41_lowp+0x89>
+  .byte  235,76                              // jmp           3350c <_sk_load_4444_sse41_lowp+0x89>
   .byte  243,69,15,111,4,80                  // movdqu        (%r8,%rdx,2),%xmm8
-  .byte  235,68                              // jmp           33cdc <_sk_load_4444_sse41_lowp+0x89>
+  .byte  235,68                              // jmp           3350c <_sk_load_4444_sse41_lowp+0x89>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,65,15,196,68,80,4,2             // pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm0
   .byte  102,69,15,110,4,80                  // movd          (%r8,%rdx,2),%xmm8
   .byte  102,68,15,58,14,192,252             // pblendw       $0xfc,%xmm0,%xmm8
-  .byte  235,41                              // jmp           33cdc <_sk_load_4444_sse41_lowp+0x89>
+  .byte  235,41                              // jmp           3350c <_sk_load_4444_sse41_lowp+0x89>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,65,15,196,68,80,12,6            // pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm0
   .byte  102,65,15,196,68,80,10,5            // pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm0
@@ -51247,7 +50886,7 @@
   .byte  102,15,113,209,12                   // psrlw         $0xc,%xmm1
   .byte  102,65,15,111,208                   // movdqa        %xmm8,%xmm2
   .byte  102,15,113,210,8                    // psrlw         $0x8,%xmm2
-  .byte  102,15,111,5,248,127,0,0            // movdqa        0x7ff8(%rip),%xmm0        # 3bcf0 <_sk_srcover_bgra_8888_sse2_lowp+0x1424>
+  .byte  102,15,111,5,8,128,0,0              // movdqa        0x8008(%rip),%xmm0        # 3b530 <_sk_srcover_bgra_8888_sse2_lowp+0x1434>
   .byte  102,15,219,208                      // pand          %xmm0,%xmm2
   .byte  102,65,15,111,216                   // movdqa        %xmm8,%xmm3
   .byte  102,15,113,211,4                    // psrlw         $0x4,%xmm3
@@ -51295,23 +50934,23 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,35                              // ja            33da5 <_sk_load_4444_dst_sse41_lowp+0x3d>
+  .byte  119,35                              // ja            335d5 <_sk_load_4444_dst_sse41_lowp+0x3d>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,208,0,0,0                 // lea           0xd0(%rip),%r9        # 33e60 <_sk_load_4444_dst_sse41_lowp+0xf8>
+  .byte  76,141,13,208,0,0,0                 // lea           0xd0(%rip),%r9        # 33690 <_sk_load_4444_dst_sse41_lowp+0xf8>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
-  .byte  235,76                              // jmp           33df1 <_sk_load_4444_dst_sse41_lowp+0x89>
+  .byte  235,76                              // jmp           33621 <_sk_load_4444_dst_sse41_lowp+0x89>
   .byte  243,69,15,111,4,80                  // movdqu        (%r8,%rdx,2),%xmm8
-  .byte  235,68                              // jmp           33df1 <_sk_load_4444_dst_sse41_lowp+0x89>
+  .byte  235,68                              // jmp           33621 <_sk_load_4444_dst_sse41_lowp+0x89>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,65,15,196,100,80,4,2            // pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm4
   .byte  102,69,15,110,4,80                  // movd          (%r8,%rdx,2),%xmm8
   .byte  102,68,15,58,14,196,252             // pblendw       $0xfc,%xmm4,%xmm8
-  .byte  235,41                              // jmp           33df1 <_sk_load_4444_dst_sse41_lowp+0x89>
+  .byte  235,41                              // jmp           33621 <_sk_load_4444_dst_sse41_lowp+0x89>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,65,15,196,100,80,12,6           // pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm4
   .byte  102,65,15,196,100,80,10,5           // pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm4
@@ -51322,7 +50961,7 @@
   .byte  102,15,113,213,12                   // psrlw         $0xc,%xmm5
   .byte  102,65,15,111,240                   // movdqa        %xmm8,%xmm6
   .byte  102,15,113,214,8                    // psrlw         $0x8,%xmm6
-  .byte  102,15,111,37,227,126,0,0           // movdqa        0x7ee3(%rip),%xmm4        # 3bcf0 <_sk_srcover_bgra_8888_sse2_lowp+0x1424>
+  .byte  102,15,111,37,243,126,0,0           // movdqa        0x7ef3(%rip),%xmm4        # 3b530 <_sk_srcover_bgra_8888_sse2_lowp+0x1434>
   .byte  102,15,219,244                      // pand          %xmm4,%xmm6
   .byte  102,65,15,111,248                   // movdqa        %xmm8,%xmm7
   .byte  102,15,113,215,4                    // psrlw         $0x4,%xmm7
@@ -51367,12 +51006,12 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  102,68,15,111,192                   // movdqa        %xmm0,%xmm8
   .byte  102,65,15,113,240,8                 // psllw         $0x8,%xmm8
-  .byte  102,68,15,219,5,96,126,0,0          // pand          0x7e60(%rip),%xmm8        # 3bd00 <_sk_srcover_bgra_8888_sse2_lowp+0x1434>
+  .byte  102,68,15,219,5,112,126,0,0         // pand          0x7e70(%rip),%xmm8        # 3b540 <_sk_srcover_bgra_8888_sse2_lowp+0x1444>
   .byte  102,68,15,111,201                   // movdqa        %xmm1,%xmm9
   .byte  102,65,15,113,241,4                 // psllw         $0x4,%xmm9
-  .byte  102,68,15,219,13,92,126,0,0         // pand          0x7e5c(%rip),%xmm9        # 3bd10 <_sk_srcover_bgra_8888_sse2_lowp+0x1444>
+  .byte  102,68,15,219,13,108,126,0,0        // pand          0x7e6c(%rip),%xmm9        # 3b550 <_sk_srcover_bgra_8888_sse2_lowp+0x1454>
   .byte  102,69,15,235,200                   // por           %xmm8,%xmm9
-  .byte  102,68,15,111,21,94,126,0,0         // movdqa        0x7e5e(%rip),%xmm10        # 3bd20 <_sk_srcover_bgra_8888_sse2_lowp+0x1454>
+  .byte  102,68,15,111,21,110,126,0,0        // movdqa        0x7e6e(%rip),%xmm10        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0x1464>
   .byte  102,68,15,219,210                   // pand          %xmm2,%xmm10
   .byte  102,68,15,111,195                   // movdqa        %xmm3,%xmm8
   .byte  102,65,15,113,208,4                 // psrlw         $0x4,%xmm8
@@ -51382,19 +51021,19 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,29                              // ja            33f03 <_sk_store_4444_sse41_lowp+0x87>
+  .byte  119,29                              // ja            33733 <_sk_store_4444_sse41_lowp+0x87>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,84,0,0,0                  // lea           0x54(%rip),%r9        # 33f44 <_sk_store_4444_sse41_lowp+0xc8>
+  .byte  76,141,13,84,0,0,0                  // lea           0x54(%rip),%r9        # 33774 <_sk_store_4444_sse41_lowp+0xc8>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,69,15,58,21,4,80,0              // pextrw        $0x0,%xmm8,(%r8,%rdx,2)
-  .byte  235,58                              // jmp           33f3d <_sk_store_4444_sse41_lowp+0xc1>
+  .byte  235,58                              // jmp           3376d <_sk_store_4444_sse41_lowp+0xc1>
   .byte  243,69,15,127,4,80                  // movdqu        %xmm8,(%r8,%rdx,2)
-  .byte  235,50                              // jmp           33f3d <_sk_store_4444_sse41_lowp+0xc1>
+  .byte  235,50                              // jmp           3376d <_sk_store_4444_sse41_lowp+0xc1>
   .byte  102,69,15,58,21,68,80,4,2           // pextrw        $0x2,%xmm8,0x4(%r8,%rdx,2)
   .byte  102,69,15,126,4,80                  // movd          %xmm8,(%r8,%rdx,2)
-  .byte  235,33                              // jmp           33f3d <_sk_store_4444_sse41_lowp+0xc1>
+  .byte  235,33                              // jmp           3376d <_sk_store_4444_sse41_lowp+0xc1>
   .byte  102,69,15,58,21,68,80,12,6          // pextrw        $0x6,%xmm8,0xc(%r8,%rdx,2)
   .byte  102,69,15,58,21,68,80,10,5          // pextrw        $0x5,%xmm8,0xa(%r8,%rdx,2)
   .byte  102,69,15,58,21,68,80,8,4           // pextrw        $0x4,%xmm8,0x8(%r8,%rdx,2)
@@ -51494,7 +51133,7 @@
   .byte  102,15,113,209,12                   // psrlw         $0xc,%xmm1
   .byte  102,65,15,111,208                   // movdqa        %xmm8,%xmm2
   .byte  102,15,113,210,8                    // psrlw         $0x8,%xmm2
-  .byte  102,15,111,5,100,124,0,0            // movdqa        0x7c64(%rip),%xmm0        # 3bcf0 <_sk_srcover_bgra_8888_sse2_lowp+0x1424>
+  .byte  102,15,111,5,116,124,0,0            // movdqa        0x7c74(%rip),%xmm0        # 3b530 <_sk_srcover_bgra_8888_sse2_lowp+0x1434>
   .byte  102,15,219,208                      // pand          %xmm0,%xmm2
   .byte  102,65,15,111,216                   // movdqa        %xmm8,%xmm3
   .byte  102,15,113,211,4                    // psrlw         $0x4,%xmm3
@@ -51532,18 +51171,18 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            3411e <_sk_load_a8_sse41_lowp+0x39>
+  .byte  119,34                              // ja            3394e <_sk_load_a8_sse41_lowp+0x39>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,146,0,0,0                 // lea           0x92(%rip),%r9        # 3419c <_sk_load_a8_sse41_lowp+0xb7>
+  .byte  76,141,13,146,0,0,0                 // lea           0x92(%rip),%r9        # 339cc <_sk_load_a8_sse41_lowp+0xb7>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,216                      // movd          %eax,%xmm3
-  .byte  235,100                             // jmp           34182 <_sk_load_a8_sse41_lowp+0x9d>
+  .byte  235,100                             // jmp           339b2 <_sk_load_a8_sse41_lowp+0x9d>
   .byte  102,65,15,56,48,28,16               // pmovzxbw      (%r8,%rdx,1),%xmm3
-  .byte  235,91                              // jmp           34182 <_sk_load_a8_sse41_lowp+0x9d>
+  .byte  235,91                              // jmp           339b2 <_sk_load_a8_sse41_lowp+0x9d>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,15,196,192,2                    // pinsrw        $0x2,%eax,%xmm0
@@ -51551,7 +51190,7 @@
   .byte  102,15,110,200                      // movd          %eax,%xmm1
   .byte  102,15,56,48,217                    // pmovzxbw      %xmm1,%xmm3
   .byte  102,15,58,14,216,252                // pblendw       $0xfc,%xmm0,%xmm3
-  .byte  235,54                              // jmp           34182 <_sk_load_a8_sse41_lowp+0x9d>
+  .byte  235,54                              // jmp           339b2 <_sk_load_a8_sse41_lowp+0x9d>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,15,196,192,6                    // pinsrw        $0x6,%eax,%xmm0
@@ -51562,14 +51201,14 @@
   .byte  102,65,15,110,12,16                 // movd          (%r8,%rdx,1),%xmm1
   .byte  102,15,56,48,217                    // pmovzxbw      %xmm1,%xmm3
   .byte  102,15,58,14,216,240                // pblendw       $0xf0,%xmm0,%xmm3
-  .byte  102,15,219,29,134,115,0,0           // pand          0x7386(%rip),%xmm3        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,15,219,29,150,115,0,0           // pand          0x7396(%rip),%xmm3        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
   .byte  255,224                             // jmpq          *%rax
   .byte  15,31,0                             // nopl          (%rax)
-  .byte  119,255                             // ja            3419d <_sk_load_a8_sse41_lowp+0xb8>
+  .byte  119,255                             // ja            339cd <_sk_load_a8_sse41_lowp+0xb8>
   .byte  255                                 // (bad)
   .byte  255,154,255,255,255,139             // lcall         *-0x74000001(%rdx)
   .byte  255                                 // (bad)
@@ -51598,18 +51237,18 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            341f1 <_sk_load_a8_dst_sse41_lowp+0x39>
+  .byte  119,34                              // ja            33a21 <_sk_load_a8_dst_sse41_lowp+0x39>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,143,0,0,0                 // lea           0x8f(%rip),%r9        # 3426c <_sk_load_a8_dst_sse41_lowp+0xb4>
+  .byte  76,141,13,143,0,0,0                 // lea           0x8f(%rip),%r9        # 33a9c <_sk_load_a8_dst_sse41_lowp+0xb4>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,248                      // movd          %eax,%xmm7
-  .byte  235,100                             // jmp           34255 <_sk_load_a8_dst_sse41_lowp+0x9d>
+  .byte  235,100                             // jmp           33a85 <_sk_load_a8_dst_sse41_lowp+0x9d>
   .byte  102,65,15,56,48,60,16               // pmovzxbw      (%r8,%rdx,1),%xmm7
-  .byte  235,91                              // jmp           34255 <_sk_load_a8_dst_sse41_lowp+0x9d>
+  .byte  235,91                              // jmp           33a85 <_sk_load_a8_dst_sse41_lowp+0x9d>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,15,196,224,2                    // pinsrw        $0x2,%eax,%xmm4
@@ -51617,7 +51256,7 @@
   .byte  102,15,110,232                      // movd          %eax,%xmm5
   .byte  102,15,56,48,253                    // pmovzxbw      %xmm5,%xmm7
   .byte  102,15,58,14,252,252                // pblendw       $0xfc,%xmm4,%xmm7
-  .byte  235,54                              // jmp           34255 <_sk_load_a8_dst_sse41_lowp+0x9d>
+  .byte  235,54                              // jmp           33a85 <_sk_load_a8_dst_sse41_lowp+0x9d>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,15,196,224,6                    // pinsrw        $0x6,%eax,%xmm4
@@ -51628,13 +51267,13 @@
   .byte  102,65,15,110,44,16                 // movd          (%r8,%rdx,1),%xmm5
   .byte  102,15,56,48,253                    // pmovzxbw      %xmm5,%xmm7
   .byte  102,15,58,14,252,240                // pblendw       $0xf0,%xmm4,%xmm7
-  .byte  102,15,219,61,179,114,0,0           // pand          0x72b3(%rip),%xmm7        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,15,219,61,195,114,0,0           // pand          0x72c3(%rip),%xmm7        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  15,87,246                           // xorps         %xmm6,%xmm6
   .byte  255,224                             // jmpq          *%rax
-  .byte  122,255                             // jp            3426d <_sk_load_a8_dst_sse41_lowp+0xb5>
+  .byte  122,255                             // jp            33a9d <_sk_load_a8_dst_sse41_lowp+0xb5>
   .byte  255                                 // (bad)
   .byte  255,157,255,255,255,142             // lcall         *-0x71000001(%rbp)
   .byte  255                                 // (bad)
@@ -51665,28 +51304,28 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,29                              // ja            342bc <_sk_store_a8_sse41_lowp+0x34>
+  .byte  119,29                              // ja            33aec <_sk_store_a8_sse41_lowp+0x34>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,131,0,0,0                 // lea           0x83(%rip),%r9        # 3432c <_sk_store_a8_sse41_lowp+0xa4>
+  .byte  76,141,13,131,0,0,0                 // lea           0x83(%rip),%r9        # 33b5c <_sk_store_a8_sse41_lowp+0xa4>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,65,15,58,20,28,16,0             // pextrb        $0x0,%xmm3,(%r8,%rdx,1)
-  .byte  235,105                             // jmp           34325 <_sk_store_a8_sse41_lowp+0x9d>
+  .byte  235,105                             // jmp           33b55 <_sk_store_a8_sse41_lowp+0x9d>
   .byte  102,68,15,111,195                   // movdqa        %xmm3,%xmm8
-  .byte  102,68,15,56,0,5,117,121,0,0        // pshufb        0x7975(%rip),%xmm8        # 3bc40 <_sk_srcover_bgra_8888_sse2_lowp+0x1374>
+  .byte  102,68,15,56,0,5,133,121,0,0        // pshufb        0x7985(%rip),%xmm8        # 3b480 <_sk_srcover_bgra_8888_sse2_lowp+0x1384>
   .byte  102,69,15,214,4,16                  // movq          %xmm8,(%r8,%rdx,1)
-  .byte  235,82                              // jmp           34325 <_sk_store_a8_sse41_lowp+0x9d>
+  .byte  235,82                              // jmp           33b55 <_sk_store_a8_sse41_lowp+0x9d>
   .byte  102,65,15,58,20,92,16,2,4           // pextrb        $0x4,%xmm3,0x2(%r8,%rdx,1)
   .byte  102,68,15,111,195                   // movdqa        %xmm3,%xmm8
-  .byte  102,68,15,56,0,5,53,114,0,0         // pshufb        0x7235(%rip),%xmm8        # 3b520 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
+  .byte  102,68,15,56,0,5,69,114,0,0         // pshufb        0x7245(%rip),%xmm8        # 3ad60 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
   .byte  102,69,15,58,21,4,16,0              // pextrw        $0x0,%xmm8,(%r8,%rdx,1)
-  .byte  235,48                              // jmp           34325 <_sk_store_a8_sse41_lowp+0x9d>
+  .byte  235,48                              // jmp           33b55 <_sk_store_a8_sse41_lowp+0x9d>
   .byte  102,65,15,58,20,92,16,6,12          // pextrb        $0xc,%xmm3,0x6(%r8,%rdx,1)
   .byte  102,65,15,58,20,92,16,5,10          // pextrb        $0xa,%xmm3,0x5(%r8,%rdx,1)
   .byte  102,65,15,58,20,92,16,4,8           // pextrb        $0x8,%xmm3,0x4(%r8,%rdx,1)
   .byte  102,68,15,111,195                   // movdqa        %xmm3,%xmm8
-  .byte  102,68,15,56,0,5,17,114,0,0         // pshufb        0x7211(%rip),%xmm8        # 3b530 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  .byte  102,68,15,56,0,5,33,114,0,0         // pshufb        0x7221(%rip),%xmm8        # 3ad70 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
   .byte  102,69,15,126,4,16                  // movd          %xmm8,(%r8,%rdx,1)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -51799,18 +51438,18 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            344ae <_sk_load_g8_sse41_lowp+0x39>
+  .byte  119,34                              // ja            33cde <_sk_load_g8_sse41_lowp+0x39>
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,150,0,0,0                 // lea           0x96(%rip),%r9        # 34530 <_sk_load_g8_sse41_lowp+0xbb>
+  .byte  76,141,13,150,0,0,0                 // lea           0x96(%rip),%r9        # 33d60 <_sk_load_g8_sse41_lowp+0xbb>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
-  .byte  235,100                             // jmp           34512 <_sk_load_g8_sse41_lowp+0x9d>
+  .byte  235,100                             // jmp           33d42 <_sk_load_g8_sse41_lowp+0x9d>
   .byte  102,65,15,56,48,4,16                // pmovzxbw      (%r8,%rdx,1),%xmm0
-  .byte  235,91                              // jmp           34512 <_sk_load_g8_sse41_lowp+0x9d>
+  .byte  235,91                              // jmp           33d42 <_sk_load_g8_sse41_lowp+0x9d>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  102,15,196,200,2                    // pinsrw        $0x2,%eax,%xmm1
@@ -51818,7 +51457,7 @@
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,15,56,48,192                    // pmovzxbw      %xmm0,%xmm0
   .byte  102,15,58,14,193,252                // pblendw       $0xfc,%xmm1,%xmm0
-  .byte  235,54                              // jmp           34512 <_sk_load_g8_sse41_lowp+0x9d>
+  .byte  235,54                              // jmp           33d42 <_sk_load_g8_sse41_lowp+0x9d>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  102,15,196,200,6                    // pinsrw        $0x6,%eax,%xmm1
@@ -51829,14 +51468,14 @@
   .byte  102,65,15,110,4,16                  // movd          (%r8,%rdx,1),%xmm0
   .byte  102,15,56,48,192                    // pmovzxbw      %xmm0,%xmm0
   .byte  102,15,58,14,193,240                // pblendw       $0xf0,%xmm1,%xmm0
-  .byte  102,15,219,5,246,111,0,0            // pand          0x6ff6(%rip),%xmm0        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,15,219,5,6,112,0,0              // pand          0x7006(%rip),%xmm0        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,237,111,0,0                // movaps        0x6fed(%rip),%xmm3        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  15,40,29,253,111,0,0                // movaps        0x6ffd(%rip),%xmm3        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
   .byte  102,15,111,208                      // movdqa        %xmm0,%xmm2
   .byte  255,224                             // jmpq          *%rax
   .byte  15,31,0                             // nopl          (%rax)
-  .byte  115,255                             // jae           34531 <_sk_load_g8_sse41_lowp+0xbc>
+  .byte  115,255                             // jae           33d61 <_sk_load_g8_sse41_lowp+0xbc>
   .byte  255                                 // (bad)
   .byte  255,150,255,255,255,135             // callq         *-0x78000001(%rsi)
   .byte  255                                 // (bad)
@@ -51865,18 +51504,18 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            34585 <_sk_load_g8_dst_sse41_lowp+0x39>
+  .byte  119,34                              // ja            33db5 <_sk_load_g8_dst_sse41_lowp+0x39>
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,147,0,0,0                 // lea           0x93(%rip),%r9        # 34604 <_sk_load_g8_dst_sse41_lowp+0xb8>
+  .byte  76,141,13,147,0,0,0                 // lea           0x93(%rip),%r9        # 33e34 <_sk_load_g8_dst_sse41_lowp+0xb8>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
-  .byte  235,100                             // jmp           345e9 <_sk_load_g8_dst_sse41_lowp+0x9d>
+  .byte  235,100                             // jmp           33e19 <_sk_load_g8_dst_sse41_lowp+0x9d>
   .byte  102,65,15,56,48,36,16               // pmovzxbw      (%r8,%rdx,1),%xmm4
-  .byte  235,91                              // jmp           345e9 <_sk_load_g8_dst_sse41_lowp+0x9d>
+  .byte  235,91                              // jmp           33e19 <_sk_load_g8_dst_sse41_lowp+0x9d>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  102,15,196,232,2                    // pinsrw        $0x2,%eax,%xmm5
@@ -51884,7 +51523,7 @@
   .byte  102,15,110,224                      // movd          %eax,%xmm4
   .byte  102,15,56,48,228                    // pmovzxbw      %xmm4,%xmm4
   .byte  102,15,58,14,229,252                // pblendw       $0xfc,%xmm5,%xmm4
-  .byte  235,54                              // jmp           345e9 <_sk_load_g8_dst_sse41_lowp+0x9d>
+  .byte  235,54                              // jmp           33e19 <_sk_load_g8_dst_sse41_lowp+0x9d>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  102,15,196,232,6                    // pinsrw        $0x6,%eax,%xmm5
@@ -51895,13 +51534,13 @@
   .byte  102,65,15,110,36,16                 // movd          (%r8,%rdx,1),%xmm4
   .byte  102,15,56,48,228                    // pmovzxbw      %xmm4,%xmm4
   .byte  102,15,58,14,229,240                // pblendw       $0xf0,%xmm5,%xmm4
-  .byte  102,15,219,37,31,111,0,0            // pand          0x6f1f(%rip),%xmm4        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,15,219,37,47,111,0,0            // pand          0x6f2f(%rip),%xmm4        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,61,22,111,0,0                 // movaps        0x6f16(%rip),%xmm7        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  15,40,61,38,111,0,0                 // movaps        0x6f26(%rip),%xmm7        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,111,236                      // movdqa        %xmm4,%xmm5
   .byte  102,15,111,244                      // movdqa        %xmm4,%xmm6
   .byte  255,224                             // jmpq          *%rax
-  .byte  118,255                             // jbe           34605 <_sk_load_g8_dst_sse41_lowp+0xb9>
+  .byte  118,255                             // jbe           33e35 <_sk_load_g8_dst_sse41_lowp+0xb9>
   .byte  255                                 // (bad)
   .byte  255,153,255,255,255,138             // lcall         *-0x75000001(%rcx)
   .byte  255                                 // (bad)
@@ -51923,10 +51562,10 @@
 FUNCTION(_sk_luminance_to_alpha_sse41_lowp)
 _sk_luminance_to_alpha_sse41_lowp:
   .byte  102,15,111,218                      // movdqa        %xmm2,%xmm3
-  .byte  102,15,213,5,4,119,0,0              // pmullw        0x7704(%rip),%xmm0        # 3bd30 <_sk_srcover_bgra_8888_sse2_lowp+0x1464>
-  .byte  102,15,213,13,12,119,0,0            // pmullw        0x770c(%rip),%xmm1        # 3bd40 <_sk_srcover_bgra_8888_sse2_lowp+0x1474>
+  .byte  102,15,213,5,20,119,0,0             // pmullw        0x7714(%rip),%xmm0        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0x1474>
+  .byte  102,15,213,13,28,119,0,0            // pmullw        0x771c(%rip),%xmm1        # 3b580 <_sk_srcover_bgra_8888_sse2_lowp+0x1484>
   .byte  102,15,253,200                      // paddw         %xmm0,%xmm1
-  .byte  102,15,213,29,16,119,0,0            // pmullw        0x7710(%rip),%xmm3        # 3bd50 <_sk_srcover_bgra_8888_sse2_lowp+0x1484>
+  .byte  102,15,213,29,32,119,0,0            // pmullw        0x7720(%rip),%xmm3        # 3b590 <_sk_srcover_bgra_8888_sse2_lowp+0x1494>
   .byte  102,15,253,217                      // paddw         %xmm1,%xmm3
   .byte  102,15,113,211,8                    // psrlw         $0x8,%xmm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -52002,7 +51641,7 @@
   .byte  102,15,58,32,192,7                  // pinsrb        $0x7,%eax,%xmm0
   .byte  102,15,56,48,192                    // pmovzxbw      %xmm0,%xmm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,153,109,0,0                // movaps        0x6d99(%rip),%xmm3        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  15,40,29,169,109,0,0                // movaps        0x6da9(%rip),%xmm3        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
   .byte  102,15,111,208                      // movdqa        %xmm0,%xmm2
   .byte  91                                  // pop           %rbx
@@ -52018,14 +51657,14 @@
 _sk_scale_1_float_sse41_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  243,68,15,16,0                      // movss         (%rax),%xmm8
-  .byte  243,68,15,89,5,15,100,0,0           // mulss         0x640f(%rip),%xmm8        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
-  .byte  243,68,15,88,5,214,99,0,0           // addss         0x63d6(%rip),%xmm8        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  243,68,15,89,5,15,100,0,0           // mulss         0x640f(%rip),%xmm8        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  243,68,15,88,5,214,99,0,0           // addss         0x63d6(%rip),%xmm8        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  243,65,15,44,192                    // cvttss2si     %xmm8,%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  242,69,15,112,192,0                 // pshuflw       $0x0,%xmm8,%xmm8
   .byte  102,69,15,112,192,80                // pshufd        $0x50,%xmm8,%xmm8
   .byte  102,65,15,213,192                   // pmullw        %xmm8,%xmm0
-  .byte  102,68,15,111,13,74,109,0,0         // movdqa        0x6d4a(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,90,109,0,0         // movdqa        0x6d5a(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,193                   // paddw         %xmm9,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,65,15,213,200                   // pmullw        %xmm8,%xmm1
@@ -52046,13 +51685,13 @@
 _sk_lerp_1_float_sse41_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  243,68,15,16,0                      // movss         (%rax),%xmm8
-  .byte  243,68,15,89,5,151,99,0,0           // mulss         0x6397(%rip),%xmm8        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
-  .byte  243,68,15,88,5,94,99,0,0            // addss         0x635e(%rip),%xmm8        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  243,68,15,89,5,151,99,0,0           // mulss         0x6397(%rip),%xmm8        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  243,68,15,88,5,94,99,0,0            // addss         0x635e(%rip),%xmm8        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  243,65,15,44,192                    // cvttss2si     %xmm8,%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  242,69,15,112,192,0                 // pshuflw       $0x0,%xmm8,%xmm8
   .byte  102,69,15,112,192,80                // pshufd        $0x50,%xmm8,%xmm8
-  .byte  102,68,15,111,13,215,108,0,0        // movdqa        0x6cd7(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,231,108,0,0        // movdqa        0x6ce7(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,213,192                   // pmullw        %xmm8,%xmm0
   .byte  102,65,15,253,193                   // paddw         %xmm9,%xmm0
   .byte  102,65,15,213,200                   // pmullw        %xmm8,%xmm1
@@ -52092,18 +51731,18 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,36                              // ja            348f0 <_sk_scale_u8_sse41_lowp+0x3b>
+  .byte  119,36                              // ja            34120 <_sk_scale_u8_sse41_lowp+0x3b>
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,221,0,0,0                 // lea           0xdd(%rip),%r9        # 349b8 <_sk_scale_u8_sse41_lowp+0x103>
+  .byte  76,141,13,221,0,0,0                 // lea           0xdd(%rip),%r9        # 341e8 <_sk_scale_u8_sse41_lowp+0x103>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
-  .byte  235,111                             // jmp           3495f <_sk_scale_u8_sse41_lowp+0xaa>
+  .byte  235,111                             // jmp           3418f <_sk_scale_u8_sse41_lowp+0xaa>
   .byte  102,69,15,56,48,4,16                // pmovzxbw      (%r8,%rdx,1),%xmm8
-  .byte  235,102                             // jmp           3495f <_sk_scale_u8_sse41_lowp+0xaa>
+  .byte  235,102                             // jmp           3418f <_sk_scale_u8_sse41_lowp+0xaa>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
   .byte  102,68,15,196,200,2                 // pinsrw        $0x2,%eax,%xmm9
@@ -52111,7 +51750,7 @@
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  102,69,15,56,48,192                 // pmovzxbw      %xmm8,%xmm8
   .byte  102,69,15,58,14,193,252             // pblendw       $0xfc,%xmm9,%xmm8
-  .byte  235,60                              // jmp           3495f <_sk_scale_u8_sse41_lowp+0xaa>
+  .byte  235,60                              // jmp           3418f <_sk_scale_u8_sse41_lowp+0xaa>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
   .byte  102,68,15,196,200,6                 // pinsrw        $0x6,%eax,%xmm9
@@ -52122,9 +51761,9 @@
   .byte  102,69,15,110,4,16                  // movd          (%r8,%rdx,1),%xmm8
   .byte  102,69,15,56,48,192                 // pmovzxbw      %xmm8,%xmm8
   .byte  102,69,15,58,14,193,240             // pblendw       $0xf0,%xmm9,%xmm8
-  .byte  102,68,15,219,5,168,107,0,0         // pand          0x6ba8(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,219,5,184,107,0,0         // pand          0x6bb8(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,213,192                   // pmullw        %xmm8,%xmm0
-  .byte  102,68,15,111,13,154,107,0,0        // movdqa        0x6b9a(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,170,107,0,0        // movdqa        0x6baa(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,193                   // paddw         %xmm9,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,65,15,213,200                   // pmullw        %xmm8,%xmm1
@@ -52149,7 +51788,7 @@
   .byte  255,148,255,255,255,136,255         // callq         *-0x770001(%rdi,%rdi,8)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  124,255                             // jl            349cd <_sk_scale_u8_sse41_lowp+0x118>
+  .byte  124,255                             // jl            341fd <_sk_scale_u8_sse41_lowp+0x118>
   .byte  255                                 // (bad)
   .byte  255,107,255                         // ljmp          *-0x1(%rbx)
   .byte  255                                 // (bad)
@@ -52167,18 +51806,18 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,36                              // ja            34a0f <_sk_lerp_u8_sse41_lowp+0x3b>
+  .byte  119,36                              // ja            3423f <_sk_lerp_u8_sse41_lowp+0x3b>
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,30,1,0,0                  // lea           0x11e(%rip),%r9        # 34b18 <_sk_lerp_u8_sse41_lowp+0x144>
+  .byte  76,141,13,30,1,0,0                  // lea           0x11e(%rip),%r9        # 34348 <_sk_lerp_u8_sse41_lowp+0x144>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
-  .byte  235,111                             // jmp           34a7e <_sk_lerp_u8_sse41_lowp+0xaa>
+  .byte  235,111                             // jmp           342ae <_sk_lerp_u8_sse41_lowp+0xaa>
   .byte  102,69,15,56,48,4,16                // pmovzxbw      (%r8,%rdx,1),%xmm8
-  .byte  235,102                             // jmp           34a7e <_sk_lerp_u8_sse41_lowp+0xaa>
+  .byte  235,102                             // jmp           342ae <_sk_lerp_u8_sse41_lowp+0xaa>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
   .byte  102,68,15,196,200,2                 // pinsrw        $0x2,%eax,%xmm9
@@ -52186,7 +51825,7 @@
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  102,69,15,56,48,192                 // pmovzxbw      %xmm8,%xmm8
   .byte  102,69,15,58,14,193,252             // pblendw       $0xfc,%xmm9,%xmm8
-  .byte  235,60                              // jmp           34a7e <_sk_lerp_u8_sse41_lowp+0xaa>
+  .byte  235,60                              // jmp           342ae <_sk_lerp_u8_sse41_lowp+0xaa>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
   .byte  102,68,15,196,200,6                 // pinsrw        $0x6,%eax,%xmm9
@@ -52197,8 +51836,8 @@
   .byte  102,69,15,110,4,16                  // movd          (%r8,%rdx,1),%xmm8
   .byte  102,69,15,56,48,192                 // pmovzxbw      %xmm8,%xmm8
   .byte  102,69,15,58,14,193,240             // pblendw       $0xf0,%xmm9,%xmm8
-  .byte  102,68,15,219,5,137,106,0,0         // pand          0x6a89(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
-  .byte  102,68,15,111,21,128,106,0,0        // movdqa        0x6a80(%rip),%xmm10        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,219,5,153,106,0,0         // pand          0x6a99(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
+  .byte  102,68,15,111,21,144,106,0,0        // movdqa        0x6a90(%rip),%xmm10        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,69,15,111,200                   // movdqa        %xmm8,%xmm9
   .byte  102,69,15,239,202                   // pxor          %xmm10,%xmm9
   .byte  102,69,15,111,217                   // movdqa        %xmm9,%xmm11
@@ -52228,7 +51867,7 @@
   .byte  102,65,15,111,216                   // movdqa        %xmm8,%xmm3
   .byte  255,224                             // jmpq          *%rax
   .byte  144                                 // nop
-  .byte  235,254                             // jmp           34b18 <_sk_lerp_u8_sse41_lowp+0x144>
+  .byte  235,254                             // jmp           34348 <_sk_lerp_u8_sse41_lowp+0x144>
   .byte  255                                 // (bad)
   .byte  255,17                              // callq         *(%rcx)
   .byte  255                                 // (bad)
@@ -52262,23 +51901,23 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,35                              // ja            34b76 <_sk_scale_565_sse41_lowp+0x42>
+  .byte  119,35                              // ja            343a6 <_sk_scale_565_sse41_lowp+0x42>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,111,1,0,0                 // lea           0x16f(%rip),%r9        # 34cd0 <_sk_scale_565_sse41_lowp+0x19c>
+  .byte  76,141,13,111,1,0,0                 // lea           0x16f(%rip),%r9        # 34500 <_sk_scale_565_sse41_lowp+0x19c>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,68,15,110,200                   // movd          %eax,%xmm9
-  .byte  235,76                              // jmp           34bc2 <_sk_scale_565_sse41_lowp+0x8e>
+  .byte  235,76                              // jmp           343f2 <_sk_scale_565_sse41_lowp+0x8e>
   .byte  243,69,15,111,12,80                 // movdqu        (%r8,%rdx,2),%xmm9
-  .byte  235,68                              // jmp           34bc2 <_sk_scale_565_sse41_lowp+0x8e>
+  .byte  235,68                              // jmp           343f2 <_sk_scale_565_sse41_lowp+0x8e>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,65,15,196,68,80,4,2             // pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm0
   .byte  102,69,15,110,12,80                 // movd          (%r8,%rdx,2),%xmm9
   .byte  102,68,15,58,14,200,252             // pblendw       $0xfc,%xmm0,%xmm9
-  .byte  235,41                              // jmp           34bc2 <_sk_scale_565_sse41_lowp+0x8e>
+  .byte  235,41                              // jmp           343f2 <_sk_scale_565_sse41_lowp+0x8e>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,65,15,196,68,80,12,6            // pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm0
   .byte  102,65,15,196,68,80,10,5            // pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm0
@@ -52287,11 +51926,11 @@
   .byte  102,68,15,58,14,200,240             // pblendw       $0xf0,%xmm0,%xmm9
   .byte  102,65,15,111,193                   // movdqa        %xmm9,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
-  .byte  102,15,219,5,204,112,0,0            // pand          0x70cc(%rip),%xmm0        # 3bca0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d4>
+  .byte  102,15,219,5,220,112,0,0            // pand          0x70dc(%rip),%xmm0        # 3b4e0 <_sk_srcover_bgra_8888_sse2_lowp+0x13e4>
   .byte  102,69,15,111,209                   // movdqa        %xmm9,%xmm10
   .byte  102,65,15,113,210,5                 // psrlw         $0x5,%xmm10
-  .byte  102,68,15,219,21,200,112,0,0        // pand          0x70c8(%rip),%xmm10        # 3bcb0 <_sk_srcover_bgra_8888_sse2_lowp+0x13e4>
-  .byte  102,68,15,111,29,207,112,0,0        // movdqa        0x70cf(%rip),%xmm11        # 3bcc0 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  .byte  102,68,15,219,21,216,112,0,0        // pand          0x70d8(%rip),%xmm10        # 3b4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  .byte  102,68,15,111,29,223,112,0,0        // movdqa        0x70df(%rip),%xmm11        # 3b500 <_sk_srcover_bgra_8888_sse2_lowp+0x1404>
   .byte  102,69,15,219,217                   // pand          %xmm9,%xmm11
   .byte  102,65,15,113,209,13                // psrlw         $0xd,%xmm9
   .byte  102,68,15,235,200                   // por           %xmm0,%xmm9
@@ -52303,7 +51942,7 @@
   .byte  102,15,113,240,3                    // psllw         $0x3,%xmm0
   .byte  102,65,15,113,211,2                 // psrlw         $0x2,%xmm11
   .byte  102,68,15,235,216                   // por           %xmm0,%xmm11
-  .byte  102,15,111,5,45,112,0,0             // movdqa        0x702d(%rip),%xmm0        # 3bc60 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
+  .byte  102,15,111,5,61,112,0,0             // movdqa        0x703d(%rip),%xmm0        # 3b4a0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
   .byte  102,68,15,111,227                   // movdqa        %xmm3,%xmm12
   .byte  102,68,15,239,224                   // pxor          %xmm0,%xmm12
   .byte  102,15,239,199                      // pxor          %xmm7,%xmm0
@@ -52316,7 +51955,7 @@
   .byte  102,69,15,56,62,225                 // pmaxuw        %xmm9,%xmm12
   .byte  102,69,15,56,16,229                 // pblendvb      %xmm0,%xmm13,%xmm12
   .byte  102,69,15,213,200                   // pmullw        %xmm8,%xmm9
-  .byte  102,15,111,5,149,104,0,0            // movdqa        0x6895(%rip),%xmm0        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,15,111,5,165,104,0,0            // movdqa        0x68a5(%rip),%xmm0        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,68,15,253,200                   // paddw         %xmm0,%xmm9
   .byte  102,65,15,113,209,8                 // psrlw         $0x8,%xmm9
   .byte  102,68,15,213,209                   // pmullw        %xmm1,%xmm10
@@ -52370,23 +52009,23 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,35                              // ja            34d2e <_sk_lerp_565_sse41_lowp+0x42>
+  .byte  119,35                              // ja            3455e <_sk_lerp_565_sse41_lowp+0x42>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,187,1,0,0                 // lea           0x1bb(%rip),%r9        # 34ed4 <_sk_lerp_565_sse41_lowp+0x1e8>
+  .byte  76,141,13,187,1,0,0                 // lea           0x1bb(%rip),%r9        # 34704 <_sk_lerp_565_sse41_lowp+0x1e8>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,68,15,110,200                   // movd          %eax,%xmm9
-  .byte  235,76                              // jmp           34d7a <_sk_lerp_565_sse41_lowp+0x8e>
+  .byte  235,76                              // jmp           345aa <_sk_lerp_565_sse41_lowp+0x8e>
   .byte  243,69,15,111,12,80                 // movdqu        (%r8,%rdx,2),%xmm9
-  .byte  235,68                              // jmp           34d7a <_sk_lerp_565_sse41_lowp+0x8e>
+  .byte  235,68                              // jmp           345aa <_sk_lerp_565_sse41_lowp+0x8e>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,65,15,196,68,80,4,2             // pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm0
   .byte  102,69,15,110,12,80                 // movd          (%r8,%rdx,2),%xmm9
   .byte  102,68,15,58,14,200,252             // pblendw       $0xfc,%xmm0,%xmm9
-  .byte  235,41                              // jmp           34d7a <_sk_lerp_565_sse41_lowp+0x8e>
+  .byte  235,41                              // jmp           345aa <_sk_lerp_565_sse41_lowp+0x8e>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,65,15,196,68,80,12,6            // pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm0
   .byte  102,65,15,196,68,80,10,5            // pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm0
@@ -52395,11 +52034,11 @@
   .byte  102,68,15,58,14,200,240             // pblendw       $0xf0,%xmm0,%xmm9
   .byte  102,65,15,111,193                   // movdqa        %xmm9,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
-  .byte  102,15,219,5,20,111,0,0             // pand          0x6f14(%rip),%xmm0        # 3bca0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d4>
+  .byte  102,15,219,5,36,111,0,0             // pand          0x6f24(%rip),%xmm0        # 3b4e0 <_sk_srcover_bgra_8888_sse2_lowp+0x13e4>
   .byte  102,69,15,111,209                   // movdqa        %xmm9,%xmm10
   .byte  102,65,15,113,210,5                 // psrlw         $0x5,%xmm10
-  .byte  102,68,15,219,21,16,111,0,0         // pand          0x6f10(%rip),%xmm10        # 3bcb0 <_sk_srcover_bgra_8888_sse2_lowp+0x13e4>
-  .byte  102,68,15,111,29,23,111,0,0         // movdqa        0x6f17(%rip),%xmm11        # 3bcc0 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  .byte  102,68,15,219,21,32,111,0,0         // pand          0x6f20(%rip),%xmm10        # 3b4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  .byte  102,68,15,111,29,39,111,0,0         // movdqa        0x6f27(%rip),%xmm11        # 3b500 <_sk_srcover_bgra_8888_sse2_lowp+0x1404>
   .byte  102,69,15,219,217                   // pand          %xmm9,%xmm11
   .byte  102,65,15,113,209,13                // psrlw         $0xd,%xmm9
   .byte  102,68,15,235,200                   // por           %xmm0,%xmm9
@@ -52411,7 +52050,7 @@
   .byte  102,15,113,240,3                    // psllw         $0x3,%xmm0
   .byte  102,65,15,113,211,2                 // psrlw         $0x2,%xmm11
   .byte  102,68,15,235,216                   // por           %xmm0,%xmm11
-  .byte  102,15,111,5,117,110,0,0            // movdqa        0x6e75(%rip),%xmm0        # 3bc60 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
+  .byte  102,15,111,5,133,110,0,0            // movdqa        0x6e85(%rip),%xmm0        # 3b4a0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
   .byte  102,68,15,111,227                   // movdqa        %xmm3,%xmm12
   .byte  102,68,15,239,224                   // pxor          %xmm0,%xmm12
   .byte  102,15,239,199                      // pxor          %xmm7,%xmm0
@@ -52423,7 +52062,7 @@
   .byte  102,69,15,56,62,227                 // pmaxuw        %xmm11,%xmm12
   .byte  102,69,15,56,62,225                 // pmaxuw        %xmm9,%xmm12
   .byte  102,69,15,56,16,229                 // pblendvb      %xmm0,%xmm13,%xmm12
-  .byte  102,68,15,111,45,225,102,0,0        // movdqa        0x66e1(%rip),%xmm13        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,45,241,102,0,0        // movdqa        0x66f1(%rip),%xmm13        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,111,193                   // movdqa        %xmm9,%xmm0
   .byte  102,65,15,239,197                   // pxor          %xmm13,%xmm0
   .byte  102,15,213,196                      // pmullw        %xmm4,%xmm0
@@ -52480,7 +52119,7 @@
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  65,15,95,200                        // maxps         %xmm8,%xmm1
   .byte  65,15,95,192                        // maxps         %xmm8,%xmm0
-  .byte  68,15,40,5,108,102,0,0              // movaps        0x666c(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,124,102,0,0              // movaps        0x667c(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  65,15,93,192                        // minps         %xmm8,%xmm0
   .byte  65,15,93,200                        // minps         %xmm8,%xmm1
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -52497,7 +52136,7 @@
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  65,15,95,200                        // maxps         %xmm8,%xmm1
   .byte  65,15,95,192                        // maxps         %xmm8,%xmm0
-  .byte  68,15,40,5,54,102,0,0               // movaps        0x6636(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,70,102,0,0               // movaps        0x6646(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  65,15,93,192                        // minps         %xmm8,%xmm0
   .byte  65,15,93,200                        // minps         %xmm8,%xmm1
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -52507,10 +52146,10 @@
 .globl _sk_mirror_x_1_sse41_lowp
 FUNCTION(_sk_mirror_x_1_sse41_lowp)
 _sk_mirror_x_1_sse41_lowp:
-  .byte  68,15,40,5,130,102,0,0              // movaps        0x6682(%rip),%xmm8        # 3b5d0 <_sk_srcover_bgra_8888_sse2_lowp+0xd04>
+  .byte  68,15,40,5,146,102,0,0              // movaps        0x6692(%rip),%xmm8        # 3ae10 <_sk_srcover_bgra_8888_sse2_lowp+0xd14>
   .byte  65,15,88,192                        // addps         %xmm8,%xmm0
   .byte  65,15,88,200                        // addps         %xmm8,%xmm1
-  .byte  68,15,40,13,2,102,0,0               // movaps        0x6602(%rip),%xmm9        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  68,15,40,13,18,102,0,0              // movaps        0x6612(%rip),%xmm9        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  68,15,40,209                        // movaps        %xmm1,%xmm10
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
   .byte  68,15,89,200                        // mulps         %xmm0,%xmm9
@@ -52522,13 +52161,13 @@
   .byte  65,15,92,202                        // subps         %xmm10,%xmm1
   .byte  65,15,88,200                        // addps         %xmm8,%xmm1
   .byte  65,15,88,192                        // addps         %xmm8,%xmm0
-  .byte  68,15,40,5,248,106,0,0              // movaps        0x6af8(%rip),%xmm8        # 3ba90 <_sk_srcover_bgra_8888_sse2_lowp+0x11c4>
+  .byte  68,15,40,5,8,107,0,0                // movaps        0x6b08(%rip),%xmm8        # 3b2d0 <_sk_srcover_bgra_8888_sse2_lowp+0x11d4>
   .byte  65,15,84,192                        // andps         %xmm8,%xmm0
   .byte  65,15,84,200                        // andps         %xmm8,%xmm1
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  65,15,95,200                        // maxps         %xmm8,%xmm1
   .byte  65,15,95,192                        // maxps         %xmm8,%xmm0
-  .byte  68,15,40,5,188,101,0,0              // movaps        0x65bc(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,204,101,0,0              // movaps        0x65cc(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  65,15,93,192                        // minps         %xmm8,%xmm0
   .byte  65,15,93,200                        // minps         %xmm8,%xmm1
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -52555,7 +52194,7 @@
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
   .byte  72,131,249,2                        // cmp           $0x2,%rcx
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
-  .byte  114,57                              // jb            35035 <_sk_gradient_sse41_lowp+0x75>
+  .byte  114,57                              // jb            34865 <_sk_gradient_sse41_lowp+0x75>
   .byte  72,139,80,72                        // mov           0x48(%rax),%rdx
   .byte  72,255,201                          // dec           %rcx
   .byte  72,131,194,4                        // add           $0x4,%rdx
@@ -52570,7 +52209,7 @@
   .byte  102,15,250,218                      // psubd         %xmm2,%xmm3
   .byte  72,131,194,4                        // add           $0x4,%rdx
   .byte  72,255,201                          // dec           %rcx
-  .byte  117,219                             // jne           35010 <_sk_gradient_sse41_lowp+0x50>
+  .byte  117,219                             // jne           34840 <_sk_gradient_sse41_lowp+0x50>
   .byte  102,72,15,58,22,219,1               // pextrq        $0x1,%xmm3,%rbx
   .byte  65,137,221                          // mov           %ebx,%r13d
   .byte  72,193,235,32                       // shr           $0x20,%rbx
@@ -52649,14 +52288,14 @@
   .byte  69,15,88,239                        // addps         %xmm15,%xmm13
   .byte  15,89,216                           // mulps         %xmm0,%xmm3
   .byte  15,88,223                           // addps         %xmm7,%xmm3
-  .byte  15,40,61,63,100,0,0                 // movaps        0x643f(%rip),%xmm7        # 3b650 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  .byte  15,40,61,79,100,0,0                 // movaps        0x644f(%rip),%xmm7        # 3ae90 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
   .byte  68,15,89,239                        // mulps         %xmm7,%xmm13
   .byte  15,89,223                           // mulps         %xmm7,%xmm3
-  .byte  68,15,40,61,64,99,0,0               // movaps        0x6340(%rip),%xmm15        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  68,15,40,61,80,99,0,0               // movaps        0x6350(%rip),%xmm15        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  69,15,88,239                        // addps         %xmm15,%xmm13
   .byte  65,15,88,223                        // addps         %xmm15,%xmm3
   .byte  243,65,15,91,245                    // cvttps2dq     %xmm13,%xmm6
-  .byte  102,68,15,111,45,58,106,0,0         // movdqa        0x6a3a(%rip),%xmm13        # 3bc70 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
+  .byte  102,68,15,111,45,74,106,0,0         // movdqa        0x6a4a(%rip),%xmm13        # 3b4b0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
   .byte  102,65,15,56,0,245                  // pshufb        %xmm13,%xmm6
   .byte  243,68,15,91,195                    // cvttps2dq     %xmm3,%xmm8
   .byte  102,69,15,56,0,197                  // pshufb        %xmm13,%xmm8
@@ -52760,9 +52399,9 @@
   .byte  72,139,24                           // mov           (%rax),%rbx
   .byte  72,139,104,8                        // mov           0x8(%rax),%rbp
   .byte  72,255,203                          // dec           %rbx
-  .byte  120,7                               // js            3540e <_sk_evenly_spaced_gradient_sse41_lowp+0x34>
+  .byte  120,7                               // js            34c3e <_sk_evenly_spaced_gradient_sse41_lowp+0x34>
   .byte  243,72,15,42,211                    // cvtsi2ss      %rbx,%xmm2
-  .byte  235,21                              // jmp           35423 <_sk_evenly_spaced_gradient_sse41_lowp+0x49>
+  .byte  235,21                              // jmp           34c53 <_sk_evenly_spaced_gradient_sse41_lowp+0x49>
   .byte  73,137,216                          // mov           %rbx,%r8
   .byte  73,209,232                          // shr           %r8
   .byte  131,227,1                           // and           $0x1,%ebx
@@ -52900,14 +52539,14 @@
   .byte  15,40,100,36,176                    // movaps        -0x50(%rsp),%xmm4
   .byte  68,15,89,196                        // mulps         %xmm4,%xmm8
   .byte  68,15,88,192                        // addps         %xmm0,%xmm8
-  .byte  15,40,5,28,95,0,0                   // movaps        0x5f1c(%rip),%xmm0        # 3b650 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  .byte  15,40,5,44,95,0,0                   // movaps        0x5f2c(%rip),%xmm0        # 3ae90 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
   .byte  15,89,216                           // mulps         %xmm0,%xmm3
   .byte  68,15,89,192                        // mulps         %xmm0,%xmm8
-  .byte  68,15,40,53,29,94,0,0               // movaps        0x5e1d(%rip),%xmm14        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  68,15,40,53,45,94,0,0               // movaps        0x5e2d(%rip),%xmm14        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  69,15,88,198                        // addps         %xmm14,%xmm8
   .byte  65,15,88,222                        // addps         %xmm14,%xmm3
   .byte  243,15,91,219                       // cvttps2dq     %xmm3,%xmm3
-  .byte  102,15,111,5,25,101,0,0             // movdqa        0x6519(%rip),%xmm0        # 3bc70 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
+  .byte  102,15,111,5,41,101,0,0             // movdqa        0x6529(%rip),%xmm0        # 3b4b0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
   .byte  102,15,56,0,216                     // pshufb        %xmm0,%xmm3
   .byte  243,69,15,91,192                    // cvttps2dq     %xmm8,%xmm8
   .byte  102,68,15,56,0,192                  // pshufb        %xmm0,%xmm8
@@ -52917,7 +52556,7 @@
   .byte  15,40,220                           // movaps        %xmm4,%xmm3
   .byte  68,15,89,203                        // mulps         %xmm3,%xmm9
   .byte  68,15,88,201                        // addps         %xmm1,%xmm9
-  .byte  15,40,13,204,94,0,0                 // movaps        0x5ecc(%rip),%xmm1        # 3b650 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  .byte  15,40,13,220,94,0,0                 // movaps        0x5edc(%rip),%xmm1        # 3ae90 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
   .byte  15,89,209                           // mulps         %xmm1,%xmm2
   .byte  68,15,89,201                        // mulps         %xmm1,%xmm9
   .byte  15,40,225                           // movaps        %xmm1,%xmm4
@@ -52986,14 +52625,14 @@
   .byte  15,89,216                           // mulps         %xmm0,%xmm3
   .byte  65,15,88,216                        // addps         %xmm8,%xmm3
   .byte  65,15,88,208                        // addps         %xmm8,%xmm2
-  .byte  68,15,40,21,198,93,0,0              // movaps        0x5dc6(%rip),%xmm10        # 3b650 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  .byte  68,15,40,21,214,93,0,0              // movaps        0x5dd6(%rip),%xmm10        # 3ae90 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
   .byte  65,15,89,210                        // mulps         %xmm10,%xmm2
   .byte  65,15,89,218                        // mulps         %xmm10,%xmm3
-  .byte  68,15,40,37,198,92,0,0              // movaps        0x5cc6(%rip),%xmm12        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  68,15,40,37,214,92,0,0              // movaps        0x5cd6(%rip),%xmm12        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  65,15,88,220                        // addps         %xmm12,%xmm3
   .byte  65,15,88,212                        // addps         %xmm12,%xmm2
   .byte  243,15,91,210                       // cvttps2dq     %xmm2,%xmm2
-  .byte  102,68,15,111,29,193,99,0,0         // movdqa        0x63c1(%rip),%xmm11        # 3bc70 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
+  .byte  102,68,15,111,29,209,99,0,0         // movdqa        0x63d1(%rip),%xmm11        # 3b4b0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
   .byte  102,65,15,56,0,211                  // pshufb        %xmm11,%xmm2
   .byte  243,68,15,91,195                    // cvttps2dq     %xmm3,%xmm8
   .byte  102,69,15,56,0,195                  // pshufb        %xmm11,%xmm8
@@ -53066,7 +52705,7 @@
   .byte  15,40,251                           // movaps        %xmm3,%xmm7
   .byte  15,40,242                           // movaps        %xmm2,%xmm6
   .byte  68,15,40,192                        // movaps        %xmm0,%xmm8
-  .byte  15,40,37,183,96,0,0                 // movaps        0x60b7(%rip),%xmm4        # 3ba90 <_sk_srcover_bgra_8888_sse2_lowp+0x11c4>
+  .byte  15,40,37,199,96,0,0                 // movaps        0x60c7(%rip),%xmm4        # 3b2d0 <_sk_srcover_bgra_8888_sse2_lowp+0x11d4>
   .byte  68,15,40,233                        // movaps        %xmm1,%xmm13
   .byte  68,15,84,236                        // andps         %xmm4,%xmm13
   .byte  69,15,40,216                        // movaps        %xmm8,%xmm11
@@ -53091,18 +52730,18 @@
   .byte  69,15,94,251                        // divps         %xmm11,%xmm15
   .byte  65,15,40,199                        // movaps        %xmm15,%xmm0
   .byte  15,89,192                           // mulps         %xmm0,%xmm0
-  .byte  68,15,40,29,183,96,0,0              // movaps        0x60b7(%rip),%xmm11        # 3bb00 <_sk_srcover_bgra_8888_sse2_lowp+0x1234>
+  .byte  68,15,40,29,199,96,0,0              // movaps        0x60c7(%rip),%xmm11        # 3b340 <_sk_srcover_bgra_8888_sse2_lowp+0x1244>
   .byte  68,15,40,224                        // movaps        %xmm0,%xmm12
   .byte  69,15,89,227                        // mulps         %xmm11,%xmm12
-  .byte  68,15,88,37,183,96,0,0              // addps         0x60b7(%rip),%xmm12        # 3bb10 <_sk_srcover_bgra_8888_sse2_lowp+0x1244>
+  .byte  68,15,88,37,199,96,0,0              // addps         0x60c7(%rip),%xmm12        # 3b350 <_sk_srcover_bgra_8888_sse2_lowp+0x1254>
   .byte  68,15,89,224                        // mulps         %xmm0,%xmm12
-  .byte  15,40,45,188,96,0,0                 // movaps        0x60bc(%rip),%xmm5        # 3bb20 <_sk_srcover_bgra_8888_sse2_lowp+0x1254>
+  .byte  15,40,45,204,96,0,0                 // movaps        0x60cc(%rip),%xmm5        # 3b360 <_sk_srcover_bgra_8888_sse2_lowp+0x1264>
   .byte  68,15,88,229                        // addps         %xmm5,%xmm12
   .byte  68,15,89,224                        // mulps         %xmm0,%xmm12
-  .byte  15,40,37,189,96,0,0                 // movaps        0x60bd(%rip),%xmm4        # 3bb30 <_sk_srcover_bgra_8888_sse2_lowp+0x1264>
+  .byte  15,40,37,205,96,0,0                 // movaps        0x60cd(%rip),%xmm4        # 3b370 <_sk_srcover_bgra_8888_sse2_lowp+0x1274>
   .byte  68,15,88,228                        // addps         %xmm4,%xmm12
   .byte  69,15,89,231                        // mulps         %xmm15,%xmm12
-  .byte  15,40,21,190,96,0,0                 // movaps        0x60be(%rip),%xmm2        # 3bb40 <_sk_srcover_bgra_8888_sse2_lowp+0x1274>
+  .byte  15,40,21,206,96,0,0                 // movaps        0x60ce(%rip),%xmm2        # 3b380 <_sk_srcover_bgra_8888_sse2_lowp+0x1284>
   .byte  15,40,218                           // movaps        %xmm2,%xmm3
   .byte  65,15,92,212                        // subps         %xmm12,%xmm2
   .byte  65,15,40,194                        // movaps        %xmm10,%xmm0
@@ -53111,7 +52750,7 @@
   .byte  65,15,40,198                        // movaps        %xmm14,%xmm0
   .byte  15,89,192                           // mulps         %xmm0,%xmm0
   .byte  68,15,89,216                        // mulps         %xmm0,%xmm11
-  .byte  68,15,88,29,102,96,0,0              // addps         0x6066(%rip),%xmm11        # 3bb10 <_sk_srcover_bgra_8888_sse2_lowp+0x1244>
+  .byte  68,15,88,29,118,96,0,0              // addps         0x6076(%rip),%xmm11        # 3b350 <_sk_srcover_bgra_8888_sse2_lowp+0x1254>
   .byte  68,15,89,216                        // mulps         %xmm0,%xmm11
   .byte  68,15,88,221                        // addps         %xmm5,%xmm11
   .byte  68,15,89,216                        // mulps         %xmm0,%xmm11
@@ -53122,7 +52761,7 @@
   .byte  102,68,15,56,20,219                 // blendvps      %xmm0,%xmm3,%xmm11
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  69,15,194,193,1                     // cmpltps       %xmm9,%xmm8
-  .byte  15,40,21,132,90,0,0                 // movaps        0x5a84(%rip),%xmm2        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  15,40,21,148,90,0,0                 // movaps        0x5a94(%rip),%xmm2        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  15,40,218                           // movaps        %xmm2,%xmm3
   .byte  65,15,92,212                        // subps         %xmm12,%xmm2
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
@@ -53133,7 +52772,7 @@
   .byte  102,68,15,56,20,219                 // blendvps      %xmm0,%xmm3,%xmm11
   .byte  15,40,198                           // movaps        %xmm6,%xmm0
   .byte  65,15,194,193,1                     // cmpltps       %xmm9,%xmm0
-  .byte  15,40,13,98,90,0,0                  // movaps        0x5a62(%rip),%xmm1        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  15,40,13,114,90,0,0                 // movaps        0x5a72(%rip),%xmm1        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  15,40,209                           // movaps        %xmm1,%xmm2
   .byte  65,15,92,204                        // subps         %xmm12,%xmm1
   .byte  102,68,15,56,20,225                 // blendvps      %xmm0,%xmm1,%xmm12
@@ -53187,48 +52826,48 @@
   .byte  65,254,202                          // dec           %r10b
   .byte  69,15,182,202                       // movzbl        %r10b,%r9d
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,38                              // ja            35bda <_sk_srcover_rgba_8888_sse41_lowp+0x4b>
+  .byte  119,38                              // ja            3540a <_sk_srcover_rgba_8888_sse41_lowp+0x4b>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  76,141,29,20,2,0,0                  // lea           0x214(%rip),%r11        # 35dd4 <_sk_srcover_rgba_8888_sse41_lowp+0x245>
+  .byte  76,141,29,20,2,0,0                  // lea           0x214(%rip),%r11        # 35604 <_sk_srcover_rgba_8888_sse41_lowp+0x245>
   .byte  75,99,4,139                         // movslq        (%r11,%r9,4),%rax
   .byte  76,1,216                            // add           %r11,%rax
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  255,224                             // jmpq          *%rax
   .byte  102,65,15,110,52,144                // movd          (%r8,%rdx,4),%xmm6
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  235,89                              // jmp           35c33 <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
+  .byte  235,89                              // jmp           35463 <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
   .byte  243,65,15,111,52,144                // movdqu        (%r8,%rdx,4),%xmm6
   .byte  243,69,15,111,68,144,16             // movdqu        0x10(%r8,%rdx,4),%xmm8
-  .byte  235,74                              // jmp           35c33 <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
+  .byte  235,74                              // jmp           35463 <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
   .byte  102,65,15,110,100,144,8             // movd          0x8(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  243,65,15,126,52,144                // movq          (%r8,%rdx,4),%xmm6
   .byte  102,65,15,58,14,240,240             // pblendw       $0xf0,%xmm8,%xmm6
   .byte  102,68,15,111,196                   // movdqa        %xmm4,%xmm8
-  .byte  235,37                              // jmp           35c33 <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
+  .byte  235,37                              // jmp           35463 <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
   .byte  102,65,15,110,100,144,24            // movd          0x18(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  102,69,15,58,34,68,144,20,1         // pinsrd        $0x1,0x14(%r8,%rdx,4),%xmm8
   .byte  102,69,15,58,34,68,144,16,0         // pinsrd        $0x0,0x10(%r8,%rdx,4),%xmm8
   .byte  243,65,15,111,52,144                // movdqu        (%r8,%rdx,4),%xmm6
-  .byte  102,15,111,37,53,96,0,0             // movdqa        0x6035(%rip),%xmm4        # 3bc70 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
+  .byte  102,15,111,37,69,96,0,0             // movdqa        0x6045(%rip),%xmm4        # 3b4b0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
   .byte  102,15,111,238                      // movdqa        %xmm6,%xmm5
   .byte  102,15,56,0,236                     // pshufb        %xmm4,%xmm5
   .byte  102,65,15,111,248                   // movdqa        %xmm8,%xmm7
   .byte  102,15,56,0,252                     // pshufb        %xmm4,%xmm7
   .byte  102,15,108,239                      // punpcklqdq    %xmm7,%xmm5
-  .byte  102,68,15,111,37,181,88,0,0         // movdqa        0x58b5(%rip),%xmm12        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,37,197,88,0,0         // movdqa        0x58c5(%rip),%xmm12        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,111,229                      // movdqa        %xmm5,%xmm4
   .byte  102,65,15,219,228                   // pand          %xmm12,%xmm4
   .byte  102,15,113,213,8                    // psrlw         $0x8,%xmm5
-  .byte  102,68,15,111,13,14,96,0,0          // movdqa        0x600e(%rip),%xmm9        # 3bc80 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
+  .byte  102,68,15,111,13,30,96,0,0          // movdqa        0x601e(%rip),%xmm9        # 3b4c0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
   .byte  102,15,111,254                      // movdqa        %xmm6,%xmm7
   .byte  102,65,15,56,0,249                  // pshufb        %xmm9,%xmm7
   .byte  102,69,15,111,208                   // movdqa        %xmm8,%xmm10
   .byte  102,69,15,56,0,209                  // pshufb        %xmm9,%xmm10
   .byte  102,65,15,108,250                   // punpcklqdq    %xmm10,%xmm7
-  .byte  102,68,15,111,13,251,95,0,0         // movdqa        0x5ffb(%rip),%xmm9        # 3bc90 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
+  .byte  102,68,15,111,13,11,96,0,0          // movdqa        0x600b(%rip),%xmm9        # 3b4d0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d4>
   .byte  102,65,15,56,0,241                  // pshufb        %xmm9,%xmm6
   .byte  102,69,15,56,0,193                  // pshufb        %xmm9,%xmm8
   .byte  102,65,15,108,240                   // punpcklqdq    %xmm8,%xmm6
@@ -53270,19 +52909,19 @@
   .byte  102,15,97,195                       // punpcklwd     %xmm3,%xmm0
   .byte  102,65,15,235,196                   // por           %xmm12,%xmm0
   .byte  65,128,250,6                        // cmp           $0x6,%r10b
-  .byte  119,24                              // ja            35d7d <_sk_srcover_rgba_8888_sse41_lowp+0x1ee>
-  .byte  76,141,21,132,0,0,0                 // lea           0x84(%rip),%r10        # 35df0 <_sk_srcover_rgba_8888_sse41_lowp+0x261>
+  .byte  119,24                              // ja            355ad <_sk_srcover_rgba_8888_sse41_lowp+0x1ee>
+  .byte  76,141,21,132,0,0,0                 // lea           0x84(%rip),%r10        # 35620 <_sk_srcover_rgba_8888_sse41_lowp+0x261>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,65,15,126,4,144                 // movd          %xmm0,(%r8,%rdx,4)
-  .byte  235,63                              // jmp           35dbc <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
+  .byte  235,63                              // jmp           355ec <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
   .byte  243,65,15,127,4,144                 // movdqu        %xmm0,(%r8,%rdx,4)
   .byte  243,65,15,127,76,144,16             // movdqu        %xmm1,0x10(%r8,%rdx,4)
-  .byte  235,48                              // jmp           35dbc <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
+  .byte  235,48                              // jmp           355ec <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
   .byte  102,65,15,58,22,68,144,8,2          // pextrd        $0x2,%xmm0,0x8(%r8,%rdx,4)
   .byte  102,65,15,214,4,144                 // movq          %xmm0,(%r8,%rdx,4)
-  .byte  235,31                              // jmp           35dbc <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
+  .byte  235,31                              // jmp           355ec <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
   .byte  102,65,15,58,22,76,144,24,2         // pextrd        $0x2,%xmm1,0x18(%r8,%rdx,4)
   .byte  102,65,15,58,22,76,144,20,1         // pextrd        $0x1,%xmm1,0x14(%r8,%rdx,4)
   .byte  102,65,15,126,76,144,16             // movd          %xmm1,0x10(%r8,%rdx,4)
@@ -53299,7 +52938,7 @@
   .byte  255,38                              // jmpq          *(%rsi)
   .byte  254                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,21,254,255,255,89               // callq         *0x59fffffe(%rip)        # 5a035ddf <_sk_srcover_bgra_8888_sse2_lowp+0x59ffb513>
+  .byte  255,21,254,255,255,89               // callq         *0x59fffffe(%rip)        # 5a03560f <_sk_srcover_bgra_8888_sse2_lowp+0x59ffb513>
   .byte  254                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,80,254                          // callq         *-0x2(%rax)
@@ -53338,48 +52977,48 @@
   .byte  65,254,202                          // dec           %r10b
   .byte  69,15,182,202                       // movzbl        %r10b,%r9d
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,38                              // ja            35e57 <_sk_srcover_bgra_8888_sse41_lowp+0x4b>
+  .byte  119,38                              // ja            35687 <_sk_srcover_bgra_8888_sse41_lowp+0x4b>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  76,141,29,23,2,0,0                  // lea           0x217(%rip),%r11        # 36054 <_sk_srcover_bgra_8888_sse41_lowp+0x248>
+  .byte  76,141,29,23,2,0,0                  // lea           0x217(%rip),%r11        # 35884 <_sk_srcover_bgra_8888_sse41_lowp+0x248>
   .byte  75,99,4,139                         // movslq        (%r11,%r9,4),%rax
   .byte  76,1,216                            // add           %r11,%rax
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  255,224                             // jmpq          *%rax
   .byte  102,65,15,110,36,144                // movd          (%r8,%rdx,4),%xmm4
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  235,89                              // jmp           35eb0 <_sk_srcover_bgra_8888_sse41_lowp+0xa4>
+  .byte  235,89                              // jmp           356e0 <_sk_srcover_bgra_8888_sse41_lowp+0xa4>
   .byte  243,65,15,111,36,144                // movdqu        (%r8,%rdx,4),%xmm4
   .byte  243,69,15,111,68,144,16             // movdqu        0x10(%r8,%rdx,4),%xmm8
-  .byte  235,74                              // jmp           35eb0 <_sk_srcover_bgra_8888_sse41_lowp+0xa4>
+  .byte  235,74                              // jmp           356e0 <_sk_srcover_bgra_8888_sse41_lowp+0xa4>
   .byte  102,65,15,110,100,144,8             // movd          0x8(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  243,65,15,126,36,144                // movq          (%r8,%rdx,4),%xmm4
   .byte  102,65,15,58,14,224,240             // pblendw       $0xf0,%xmm8,%xmm4
   .byte  102,68,15,111,197                   // movdqa        %xmm5,%xmm8
-  .byte  235,37                              // jmp           35eb0 <_sk_srcover_bgra_8888_sse41_lowp+0xa4>
+  .byte  235,37                              // jmp           356e0 <_sk_srcover_bgra_8888_sse41_lowp+0xa4>
   .byte  102,65,15,110,100,144,24            // movd          0x18(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  102,69,15,58,34,68,144,20,1         // pinsrd        $0x1,0x14(%r8,%rdx,4),%xmm8
   .byte  102,69,15,58,34,68,144,16,0         // pinsrd        $0x0,0x10(%r8,%rdx,4),%xmm8
   .byte  243,65,15,111,36,144                // movdqu        (%r8,%rdx,4),%xmm4
-  .byte  102,15,111,53,184,93,0,0            // movdqa        0x5db8(%rip),%xmm6        # 3bc70 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
+  .byte  102,15,111,53,200,93,0,0            // movdqa        0x5dc8(%rip),%xmm6        # 3b4b0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
   .byte  102,15,111,236                      // movdqa        %xmm4,%xmm5
   .byte  102,15,56,0,238                     // pshufb        %xmm6,%xmm5
   .byte  102,65,15,111,248                   // movdqa        %xmm8,%xmm7
   .byte  102,15,56,0,254                     // pshufb        %xmm6,%xmm7
   .byte  102,15,108,239                      // punpcklqdq    %xmm7,%xmm5
-  .byte  102,68,15,111,37,56,86,0,0          // movdqa        0x5638(%rip),%xmm12        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,37,72,86,0,0          // movdqa        0x5648(%rip),%xmm12        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,111,245                      // movdqa        %xmm5,%xmm6
   .byte  102,65,15,219,244                   // pand          %xmm12,%xmm6
   .byte  102,15,113,213,8                    // psrlw         $0x8,%xmm5
-  .byte  102,68,15,111,13,145,93,0,0         // movdqa        0x5d91(%rip),%xmm9        # 3bc80 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
+  .byte  102,68,15,111,13,161,93,0,0         // movdqa        0x5da1(%rip),%xmm9        # 3b4c0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
   .byte  102,15,111,252                      // movdqa        %xmm4,%xmm7
   .byte  102,65,15,56,0,249                  // pshufb        %xmm9,%xmm7
   .byte  102,69,15,111,208                   // movdqa        %xmm8,%xmm10
   .byte  102,69,15,56,0,209                  // pshufb        %xmm9,%xmm10
   .byte  102,65,15,108,250                   // punpcklqdq    %xmm10,%xmm7
-  .byte  102,68,15,111,13,126,93,0,0         // movdqa        0x5d7e(%rip),%xmm9        # 3bc90 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
+  .byte  102,68,15,111,13,142,93,0,0         // movdqa        0x5d8e(%rip),%xmm9        # 3b4d0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d4>
   .byte  102,65,15,56,0,225                  // pshufb        %xmm9,%xmm4
   .byte  102,69,15,56,0,193                  // pshufb        %xmm9,%xmm8
   .byte  102,65,15,108,224                   // punpcklqdq    %xmm8,%xmm4
@@ -53421,19 +53060,19 @@
   .byte  102,15,97,195                       // punpcklwd     %xmm3,%xmm0
   .byte  102,65,15,235,196                   // por           %xmm12,%xmm0
   .byte  65,128,250,6                        // cmp           $0x6,%r10b
-  .byte  119,24                              // ja            35ffa <_sk_srcover_bgra_8888_sse41_lowp+0x1ee>
-  .byte  76,141,21,135,0,0,0                 // lea           0x87(%rip),%r10        # 36070 <_sk_srcover_bgra_8888_sse41_lowp+0x264>
+  .byte  119,24                              // ja            3582a <_sk_srcover_bgra_8888_sse41_lowp+0x1ee>
+  .byte  76,141,21,135,0,0,0                 // lea           0x87(%rip),%r10        # 358a0 <_sk_srcover_bgra_8888_sse41_lowp+0x264>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,65,15,126,4,144                 // movd          %xmm0,(%r8,%rdx,4)
-  .byte  235,63                              // jmp           36039 <_sk_srcover_bgra_8888_sse41_lowp+0x22d>
+  .byte  235,63                              // jmp           35869 <_sk_srcover_bgra_8888_sse41_lowp+0x22d>
   .byte  243,65,15,127,4,144                 // movdqu        %xmm0,(%r8,%rdx,4)
   .byte  243,65,15,127,76,144,16             // movdqu        %xmm1,0x10(%r8,%rdx,4)
-  .byte  235,48                              // jmp           36039 <_sk_srcover_bgra_8888_sse41_lowp+0x22d>
+  .byte  235,48                              // jmp           35869 <_sk_srcover_bgra_8888_sse41_lowp+0x22d>
   .byte  102,65,15,58,22,68,144,8,2          // pextrd        $0x2,%xmm0,0x8(%r8,%rdx,4)
   .byte  102,65,15,214,4,144                 // movq          %xmm0,(%r8,%rdx,4)
-  .byte  235,31                              // jmp           36039 <_sk_srcover_bgra_8888_sse41_lowp+0x22d>
+  .byte  235,31                              // jmp           35869 <_sk_srcover_bgra_8888_sse41_lowp+0x22d>
   .byte  102,65,15,58,22,76,144,24,2         // pextrd        $0x2,%xmm1,0x18(%r8,%rdx,4)
   .byte  102,65,15,58,22,76,144,20,1         // pextrd        $0x1,%xmm1,0x14(%r8,%rdx,4)
   .byte  102,65,15,126,76,144,16             // movd          %xmm1,0x10(%r8,%rdx,4)
@@ -53498,13 +53137,13 @@
   .byte  73,137,246                          // mov           %rsi,%r14
   .byte  72,137,77,192                       // mov           %rcx,-0x40(%rbp)
   .byte  72,57,203                           // cmp           %rcx,%rbx
-  .byte  15,131,131,0,0,0                    // jae           36142 <_sk_start_pipeline_sse2_lowp+0xb6>
+  .byte  15,131,131,0,0,0                    // jae           35972 <_sk_start_pipeline_sse2_lowp+0xb6>
   .byte  72,139,69,208                       // mov           -0x30(%rbp),%rax
   .byte  72,141,64,8                         // lea           0x8(%rax),%rax
   .byte  72,137,69,200                       // mov           %rax,-0x38(%rbp)
   .byte  76,57,125,200                       // cmp           %r15,-0x38(%rbp)
   .byte  72,139,85,208                       // mov           -0x30(%rbp),%rdx
-  .byte  119,59                              // ja            36110 <_sk_start_pipeline_sse2_lowp+0x84>
+  .byte  119,59                              // ja            35940 <_sk_start_pipeline_sse2_lowp+0x84>
   .byte  76,139,101,208                      // mov           -0x30(%rbp),%r12
   .byte  49,255                              // xor           %edi,%edi
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
@@ -53523,10 +53162,10 @@
   .byte  73,131,196,16                       // add           $0x10,%r12
   .byte  77,57,252                           // cmp           %r15,%r12
   .byte  73,137,212                          // mov           %rdx,%r12
-  .byte  118,201                             // jbe           360d9 <_sk_start_pipeline_sse2_lowp+0x4d>
+  .byte  118,201                             // jbe           35909 <_sk_start_pipeline_sse2_lowp+0x4d>
   .byte  76,137,255                          // mov           %r15,%rdi
   .byte  72,41,215                           // sub           %rdx,%rdi
-  .byte  116,33                              // je            36139 <_sk_start_pipeline_sse2_lowp+0xad>
+  .byte  116,33                              // je            35969 <_sk_start_pipeline_sse2_lowp+0xad>
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  15,87,201                           // xorps         %xmm1,%xmm1
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
@@ -53540,7 +53179,7 @@
   .byte  65,255,213                          // callq         *%r13
   .byte  72,255,195                          // inc           %rbx
   .byte  72,59,93,192                        // cmp           -0x40(%rbp),%rbx
-  .byte  117,137                             // jne           360cb <_sk_start_pipeline_sse2_lowp+0x3f>
+  .byte  117,137                             // jne           358fb <_sk_start_pipeline_sse2_lowp+0x3f>
   .byte  72,131,196,24                       // add           $0x18,%rsp
   .byte  91                                  // pop           %rbx
   .byte  65,92                               // pop           %r12
@@ -53571,7 +53210,7 @@
   .byte  102,15,110,209                      // movd          %ecx,%xmm2
   .byte  102,15,112,210,0                    // pshufd        $0x0,%xmm2,%xmm2
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
-  .byte  15,88,21,224,83,0,0                 // addps         0x53e0(%rip),%xmm2        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  15,88,21,240,83,0,0                 // addps         0x53f0(%rip),%xmm2        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,40,218                           // movaps        %xmm2,%xmm3
   .byte  255,224                             // jmpq          *%rax
@@ -53748,7 +53387,7 @@
 FUNCTION(_sk_black_color_sse2_lowp)
 _sk_black_color_sse2_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,37,81,0,0                  // movaps        0x5125(%rip),%xmm3        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  15,40,29,53,81,0,0                  // movaps        0x5135(%rip),%xmm3        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  15,87,201                           // xorps         %xmm1,%xmm1
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
@@ -53759,7 +53398,7 @@
 FUNCTION(_sk_white_color_sse2_lowp)
 _sk_white_color_sse2_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,5,17,81,0,0                   // movaps        0x5111(%rip),%xmm0        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  15,40,5,33,81,0,0                   // movaps        0x5121(%rip),%xmm0        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  15,40,216                           // movaps        %xmm0,%xmm3
@@ -53770,10 +53409,10 @@
 FUNCTION(_sk_set_rgb_sse2_lowp)
 _sk_set_rgb_sse2_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  243,15,16,21,148,71,0,0             // movss         0x4794(%rip),%xmm2        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  243,15,16,21,148,71,0,0             // movss         0x4794(%rip),%xmm2        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   .byte  243,15,16,0                         // movss         (%rax),%xmm0
   .byte  243,15,89,194                       // mulss         %xmm2,%xmm0
-  .byte  243,68,15,16,5,83,71,0,0            // movss         0x4753(%rip),%xmm8        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  243,68,15,16,5,83,71,0,0            // movss         0x4753(%rip),%xmm8        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  243,65,15,88,192                    // addss         %xmm8,%xmm0
   .byte  243,68,15,44,192                    // cvttss2si     %xmm0,%r8d
   .byte  102,65,15,110,192                   // movd          %r8d,%xmm0
@@ -53799,7 +53438,7 @@
 .globl _sk_clamp_a_sse2_lowp
 FUNCTION(_sk_clamp_a_sse2_lowp)
 _sk_clamp_a_sse2_lowp:
-  .byte  102,68,15,111,5,215,87,0,0          // movdqa        0x57d7(%rip),%xmm8        # 3bc60 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
+  .byte  102,68,15,111,5,231,87,0,0          // movdqa        0x57e7(%rip),%xmm8        # 3b4a0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
   .byte  102,68,15,111,200                   // movdqa        %xmm0,%xmm9
   .byte  102,69,15,239,200                   // pxor          %xmm8,%xmm9
   .byte  102,68,15,111,211                   // movdqa        %xmm3,%xmm10
@@ -53828,7 +53467,7 @@
 .globl _sk_clamp_a_dst_sse2_lowp
 FUNCTION(_sk_clamp_a_dst_sse2_lowp)
 _sk_clamp_a_dst_sse2_lowp:
-  .byte  102,68,15,111,5,97,87,0,0           // movdqa        0x5761(%rip),%xmm8        # 3bc60 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
+  .byte  102,68,15,111,5,113,87,0,0          // movdqa        0x5771(%rip),%xmm8        # 3b4a0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
   .byte  102,68,15,111,204                   // movdqa        %xmm4,%xmm9
   .byte  102,69,15,239,200                   // pxor          %xmm8,%xmm9
   .byte  102,68,15,111,215                   // movdqa        %xmm7,%xmm10
@@ -53858,7 +53497,7 @@
 FUNCTION(_sk_premul_sse2_lowp)
 _sk_premul_sse2_lowp:
   .byte  102,15,213,195                      // pmullw        %xmm3,%xmm0
-  .byte  102,68,15,111,5,151,79,0,0          // movdqa        0x4f97(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,5,167,79,0,0          // movdqa        0x4fa7(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,192                   // paddw         %xmm8,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,15,213,203                      // pmullw        %xmm3,%xmm1
@@ -53875,7 +53514,7 @@
 FUNCTION(_sk_premul_dst_sse2_lowp)
 _sk_premul_dst_sse2_lowp:
   .byte  102,15,213,231                      // pmullw        %xmm7,%xmm4
-  .byte  102,68,15,111,5,96,79,0,0           // movdqa        0x4f60(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,5,112,79,0,0          // movdqa        0x4f70(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,224                   // paddw         %xmm8,%xmm4
   .byte  102,15,113,212,8                    // psrlw         $0x8,%xmm4
   .byte  102,15,213,239                      // pmullw        %xmm7,%xmm5
@@ -53923,7 +53562,7 @@
 .globl _sk_invert_sse2_lowp
 FUNCTION(_sk_invert_sse2_lowp)
 _sk_invert_sse2_lowp:
-  .byte  102,68,15,111,5,254,78,0,0          // movdqa        0x4efe(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,5,14,79,0,0           // movdqa        0x4f0e(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,69,15,111,200                   // movdqa        %xmm8,%xmm9
   .byte  102,68,15,249,200                   // psubw         %xmm0,%xmm9
   .byte  102,69,15,111,208                   // movdqa        %xmm8,%xmm10
@@ -53955,7 +53594,7 @@
 _sk_srcatop_sse2_lowp:
   .byte  102,68,15,111,195                   // movdqa        %xmm3,%xmm8
   .byte  102,15,213,199                      // pmullw        %xmm7,%xmm0
-  .byte  102,15,111,29,162,78,0,0            // movdqa        0x4ea2(%rip),%xmm3        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,15,111,29,178,78,0,0            // movdqa        0x4eb2(%rip),%xmm3        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,68,15,111,203                   // movdqa        %xmm3,%xmm9
   .byte  102,69,15,249,200                   // psubw         %xmm8,%xmm9
   .byte  102,69,15,111,193                   // movdqa        %xmm9,%xmm8
@@ -53987,7 +53626,7 @@
 _sk_dstatop_sse2_lowp:
   .byte  102,68,15,111,196                   // movdqa        %xmm4,%xmm8
   .byte  102,68,15,213,195                   // pmullw        %xmm3,%xmm8
-  .byte  102,68,15,111,13,34,78,0,0          // movdqa        0x4e22(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,50,78,0,0          // movdqa        0x4e32(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,69,15,253,193                   // paddw         %xmm9,%xmm8
   .byte  102,68,15,111,213                   // movdqa        %xmm5,%xmm10
   .byte  102,68,15,213,211                   // pmullw        %xmm3,%xmm10
@@ -54016,7 +53655,7 @@
 FUNCTION(_sk_srcin_sse2_lowp)
 _sk_srcin_sse2_lowp:
   .byte  102,15,213,199                      // pmullw        %xmm7,%xmm0
-  .byte  102,68,15,111,5,173,77,0,0          // movdqa        0x4dad(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,5,189,77,0,0          // movdqa        0x4dbd(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,192                   // paddw         %xmm8,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,15,213,207                      // pmullw        %xmm7,%xmm1
@@ -54037,7 +53676,7 @@
 _sk_dstin_sse2_lowp:
   .byte  102,15,111,196                      // movdqa        %xmm4,%xmm0
   .byte  102,15,213,195                      // pmullw        %xmm3,%xmm0
-  .byte  102,68,15,111,5,100,77,0,0          // movdqa        0x4d64(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,5,116,77,0,0          // movdqa        0x4d74(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,192                   // paddw         %xmm8,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,15,111,205                      // movdqa        %xmm5,%xmm1
@@ -54058,7 +53697,7 @@
 .globl _sk_srcout_sse2_lowp
 FUNCTION(_sk_srcout_sse2_lowp)
 _sk_srcout_sse2_lowp:
-  .byte  102,68,15,111,5,27,77,0,0           // movdqa        0x4d1b(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,5,43,77,0,0           // movdqa        0x4d2b(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,69,15,111,200                   // movdqa        %xmm8,%xmm9
   .byte  102,68,15,249,207                   // psubw         %xmm7,%xmm9
   .byte  102,65,15,213,193                   // pmullw        %xmm9,%xmm0
@@ -54081,7 +53720,7 @@
 FUNCTION(_sk_dstout_sse2_lowp)
 _sk_dstout_sse2_lowp:
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
-  .byte  102,68,15,111,5,196,76,0,0          // movdqa        0x4cc4(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,5,212,76,0,0          // movdqa        0x4cd4(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,111,216                   // movdqa        %xmm8,%xmm3
   .byte  102,15,249,216                      // psubw         %xmm0,%xmm3
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
@@ -54106,7 +53745,7 @@
 .globl _sk_srcover_sse2_lowp
 FUNCTION(_sk_srcover_sse2_lowp)
 _sk_srcover_sse2_lowp:
-  .byte  102,68,15,111,13,106,76,0,0         // movdqa        0x4c6a(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,122,76,0,0         // movdqa        0x4c7a(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,69,15,111,193                   // movdqa        %xmm9,%xmm8
   .byte  102,68,15,249,195                   // psubw         %xmm3,%xmm8
   .byte  102,69,15,111,208                   // movdqa        %xmm8,%xmm10
@@ -54135,7 +53774,7 @@
 .globl _sk_dstover_sse2_lowp
 FUNCTION(_sk_dstover_sse2_lowp)
 _sk_dstover_sse2_lowp:
-  .byte  102,68,15,111,5,240,75,0,0          // movdqa        0x4bf0(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,5,0,76,0,0            // movdqa        0x4c00(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,69,15,111,200                   // movdqa        %xmm8,%xmm9
   .byte  102,68,15,249,207                   // psubw         %xmm7,%xmm9
   .byte  102,65,15,213,193                   // pmullw        %xmm9,%xmm0
@@ -54162,7 +53801,7 @@
 FUNCTION(_sk_modulate_sse2_lowp)
 _sk_modulate_sse2_lowp:
   .byte  102,15,213,196                      // pmullw        %xmm4,%xmm0
-  .byte  102,68,15,111,5,137,75,0,0          // movdqa        0x4b89(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,5,153,75,0,0          // movdqa        0x4b99(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,192                   // paddw         %xmm8,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,15,213,205                      // pmullw        %xmm5,%xmm1
@@ -54181,7 +53820,7 @@
 .globl _sk_multiply_sse2_lowp
 FUNCTION(_sk_multiply_sse2_lowp)
 _sk_multiply_sse2_lowp:
-  .byte  102,68,15,111,13,72,75,0,0          // movdqa        0x4b48(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,88,75,0,0          // movdqa        0x4b58(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,69,15,111,193                   // movdqa        %xmm9,%xmm8
   .byte  102,68,15,249,195                   // psubw         %xmm3,%xmm8
   .byte  102,69,15,111,208                   // movdqa        %xmm8,%xmm10
@@ -54226,12 +53865,12 @@
   .byte  102,68,15,111,193                   // movdqa        %xmm1,%xmm8
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
   .byte  102,15,253,204                      // paddw         %xmm4,%xmm1
-  .byte  102,68,15,111,21,212,82,0,0         // movdqa        0x52d4(%rip),%xmm10        # 3bd60 <_sk_srcover_bgra_8888_sse2_lowp+0x1494>
+  .byte  102,68,15,111,21,228,82,0,0         // movdqa        0x52e4(%rip),%xmm10        # 3b5a0 <_sk_srcover_bgra_8888_sse2_lowp+0x14a4>
   .byte  102,15,111,193                      // movdqa        %xmm1,%xmm0
   .byte  102,65,15,217,194                   // psubusw       %xmm10,%xmm0
   .byte  102,69,15,239,228                   // pxor          %xmm12,%xmm12
   .byte  102,65,15,117,196                   // pcmpeqw       %xmm12,%xmm0
-  .byte  102,68,15,111,29,104,74,0,0         // movdqa        0x4a68(%rip),%xmm11        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,29,120,74,0,0         // movdqa        0x4a78(%rip),%xmm11        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,219,200                      // pand          %xmm0,%xmm1
   .byte  102,65,15,223,195                   // pandn         %xmm11,%xmm0
   .byte  102,15,235,193                      // por           %xmm1,%xmm0
@@ -54270,7 +53909,7 @@
   .byte  102,15,111,196                      // movdqa        %xmm4,%xmm0
   .byte  102,15,253,193                      // paddw         %xmm1,%xmm0
   .byte  102,15,213,204                      // pmullw        %xmm4,%xmm1
-  .byte  102,68,15,111,21,200,73,0,0         // movdqa        0x49c8(%rip),%xmm10        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,21,216,73,0,0         // movdqa        0x49d8(%rip),%xmm10        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,202                   // paddw         %xmm10,%xmm1
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
   .byte  102,15,249,193                      // psubw         %xmm1,%xmm0
@@ -54302,7 +53941,7 @@
 FUNCTION(_sk_xor__sse2_lowp)
 _sk_xor__sse2_lowp:
   .byte  102,68,15,111,195                   // movdqa        %xmm3,%xmm8
-  .byte  102,68,15,111,13,70,73,0,0          // movdqa        0x4946(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,86,73,0,0          // movdqa        0x4956(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,69,15,111,209                   // movdqa        %xmm9,%xmm10
   .byte  102,68,15,249,215                   // psubw         %xmm7,%xmm10
   .byte  102,65,15,213,194                   // pmullw        %xmm10,%xmm0
@@ -54344,7 +53983,7 @@
   .byte  102,65,15,253,194                   // paddw         %xmm10,%xmm0
   .byte  102,68,15,213,215                   // pmullw        %xmm7,%xmm10
   .byte  102,68,15,213,227                   // pmullw        %xmm3,%xmm12
-  .byte  102,68,15,111,13,225,79,0,0         // movdqa        0x4fe1(%rip),%xmm9        # 3bc60 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
+  .byte  102,68,15,111,13,241,79,0,0         // movdqa        0x4ff1(%rip),%xmm9        # 3b4a0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
   .byte  102,69,15,111,218                   // movdqa        %xmm10,%xmm11
   .byte  102,69,15,239,217                   // pxor          %xmm9,%xmm11
   .byte  102,65,15,111,204                   // movdqa        %xmm12,%xmm1
@@ -54353,7 +53992,7 @@
   .byte  102,68,15,219,225                   // pand          %xmm1,%xmm12
   .byte  102,65,15,223,202                   // pandn         %xmm10,%xmm1
   .byte  102,65,15,235,204                   // por           %xmm12,%xmm1
-  .byte  102,68,15,111,21,96,72,0,0          // movdqa        0x4860(%rip),%xmm10        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,21,112,72,0,0         // movdqa        0x4870(%rip),%xmm10        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,202                   // paddw         %xmm10,%xmm1
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
   .byte  102,15,249,193                      // psubw         %xmm1,%xmm0
@@ -54409,7 +54048,7 @@
   .byte  102,65,15,253,196                   // paddw         %xmm12,%xmm0
   .byte  102,68,15,213,231                   // pmullw        %xmm7,%xmm12
   .byte  102,68,15,213,211                   // pmullw        %xmm3,%xmm10
-  .byte  102,68,15,111,13,184,78,0,0         // movdqa        0x4eb8(%rip),%xmm9        # 3bc60 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
+  .byte  102,68,15,111,13,200,78,0,0         // movdqa        0x4ec8(%rip),%xmm9        # 3b4a0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
   .byte  102,69,15,111,220                   // movdqa        %xmm12,%xmm11
   .byte  102,69,15,239,217                   // pxor          %xmm9,%xmm11
   .byte  102,65,15,111,202                   // movdqa        %xmm10,%xmm1
@@ -54418,7 +54057,7 @@
   .byte  102,68,15,219,225                   // pand          %xmm1,%xmm12
   .byte  102,65,15,223,202                   // pandn         %xmm10,%xmm1
   .byte  102,65,15,235,204                   // por           %xmm12,%xmm1
-  .byte  102,68,15,111,21,55,71,0,0          // movdqa        0x4737(%rip),%xmm10        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,21,71,71,0,0          // movdqa        0x4747(%rip),%xmm10        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,202                   // paddw         %xmm10,%xmm1
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
   .byte  102,15,249,193                      // psubw         %xmm1,%xmm0
@@ -54474,7 +54113,7 @@
   .byte  102,65,15,253,196                   // paddw         %xmm12,%xmm0
   .byte  102,68,15,213,231                   // pmullw        %xmm7,%xmm12
   .byte  102,68,15,213,211                   // pmullw        %xmm3,%xmm10
-  .byte  102,68,15,111,13,143,77,0,0         // movdqa        0x4d8f(%rip),%xmm9        # 3bc60 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
+  .byte  102,68,15,111,13,159,77,0,0         // movdqa        0x4d9f(%rip),%xmm9        # 3b4a0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
   .byte  102,69,15,111,220                   // movdqa        %xmm12,%xmm11
   .byte  102,69,15,239,217                   // pxor          %xmm9,%xmm11
   .byte  102,65,15,111,202                   // movdqa        %xmm10,%xmm1
@@ -54483,10 +54122,10 @@
   .byte  102,68,15,219,225                   // pand          %xmm1,%xmm12
   .byte  102,65,15,223,202                   // pandn         %xmm10,%xmm1
   .byte  102,65,15,235,204                   // por           %xmm12,%xmm1
-  .byte  102,68,15,111,21,14,70,0,0          // movdqa        0x460e(%rip),%xmm10        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,21,30,70,0,0          // movdqa        0x461e(%rip),%xmm10        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,202                   // paddw         %xmm10,%xmm1
   .byte  102,15,113,209,7                    // psrlw         $0x7,%xmm1
-  .byte  102,68,15,111,29,59,77,0,0          // movdqa        0x4d3b(%rip),%xmm11        # 3bc50 <_sk_srcover_bgra_8888_sse2_lowp+0x1384>
+  .byte  102,68,15,111,29,75,77,0,0          // movdqa        0x4d4b(%rip),%xmm11        # 3b490 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
   .byte  102,65,15,219,203                   // pand          %xmm11,%xmm1
   .byte  102,15,249,193                      // psubw         %xmm1,%xmm0
   .byte  102,68,15,111,229                   // movdqa        %xmm5,%xmm12
@@ -54541,10 +54180,10 @@
   .byte  102,15,111,196                      // movdqa        %xmm4,%xmm0
   .byte  102,15,253,193                      // paddw         %xmm1,%xmm0
   .byte  102,15,213,204                      // pmullw        %xmm4,%xmm1
-  .byte  102,68,15,111,13,11,69,0,0          // movdqa        0x450b(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,27,69,0,0          // movdqa        0x451b(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,201                   // paddw         %xmm9,%xmm1
   .byte  102,15,113,209,7                    // psrlw         $0x7,%xmm1
-  .byte  102,68,15,111,21,56,76,0,0          // movdqa        0x4c38(%rip),%xmm10        # 3bc50 <_sk_srcover_bgra_8888_sse2_lowp+0x1384>
+  .byte  102,68,15,111,21,72,76,0,0          // movdqa        0x4c48(%rip),%xmm10        # 3b490 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
   .byte  102,65,15,219,202                   // pand          %xmm10,%xmm1
   .byte  102,15,249,193                      // psubw         %xmm1,%xmm0
   .byte  102,15,111,205                      // movdqa        %xmm5,%xmm1
@@ -54580,7 +54219,7 @@
   .byte  102,15,111,236                      // movdqa        %xmm4,%xmm5
   .byte  102,68,15,111,194                   // movdqa        %xmm2,%xmm8
   .byte  102,68,15,111,200                   // movdqa        %xmm0,%xmm9
-  .byte  102,15,111,21,103,68,0,0            // movdqa        0x4467(%rip),%xmm2        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,15,111,21,119,68,0,0            // movdqa        0x4477(%rip),%xmm2        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,68,15,111,226                   // movdqa        %xmm2,%xmm12
   .byte  102,68,15,249,231                   // psubw         %xmm7,%xmm12
   .byte  102,65,15,111,196                   // movdqa        %xmm12,%xmm0
@@ -54593,7 +54232,7 @@
   .byte  102,68,15,111,243                   // movdqa        %xmm3,%xmm14
   .byte  102,69,15,249,241                   // psubw         %xmm9,%xmm14
   .byte  102,69,15,253,201                   // paddw         %xmm9,%xmm9
-  .byte  102,15,111,21,115,75,0,0            // movdqa        0x4b73(%rip),%xmm2        # 3bc60 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
+  .byte  102,15,111,21,131,75,0,0            // movdqa        0x4b83(%rip),%xmm2        # 3b4a0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
   .byte  102,15,111,199                      // movdqa        %xmm7,%xmm0
   .byte  102,68,15,111,215                   // movdqa        %xmm7,%xmm10
   .byte  102,15,111,231                      // movdqa        %xmm7,%xmm4
@@ -54612,7 +54251,7 @@
   .byte  102,68,15,219,232                   // pand          %xmm0,%xmm13
   .byte  102,65,15,223,193                   // pandn         %xmm9,%xmm0
   .byte  102,65,15,235,197                   // por           %xmm13,%xmm0
-  .byte  102,15,253,5,198,67,0,0             // paddw         0x43c6(%rip),%xmm0        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,15,253,5,214,67,0,0             // paddw         0x43d6(%rip),%xmm0        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,199                   // paddw         %xmm15,%xmm0
   .byte  102,69,15,111,204                   // movdqa        %xmm12,%xmm9
   .byte  102,68,15,213,201                   // pmullw        %xmm1,%xmm9
@@ -54635,7 +54274,7 @@
   .byte  102,65,15,219,249                   // pand          %xmm9,%xmm7
   .byte  102,68,15,223,201                   // pandn         %xmm1,%xmm9
   .byte  102,68,15,235,207                   // por           %xmm7,%xmm9
-  .byte  102,68,15,253,13,81,67,0,0          // paddw         0x4351(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,253,13,97,67,0,0          // paddw         0x4361(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,69,15,253,205                   // paddw         %xmm13,%xmm9
   .byte  102,69,15,213,224                   // pmullw        %xmm8,%xmm12
   .byte  102,69,15,111,251                   // movdqa        %xmm11,%xmm15
@@ -54657,7 +54296,7 @@
   .byte  102,68,15,219,210                   // pand          %xmm2,%xmm10
   .byte  102,65,15,223,208                   // pandn         %xmm8,%xmm2
   .byte  102,65,15,235,210                   // por           %xmm10,%xmm2
-  .byte  102,68,15,111,5,225,66,0,0          // movdqa        0x42e1(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,5,241,66,0,0          // movdqa        0x42f1(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,208                   // paddw         %xmm8,%xmm2
   .byte  102,65,15,253,215                   // paddw         %xmm15,%xmm2
   .byte  102,68,15,213,220                   // pmullw        %xmm4,%xmm11
@@ -54685,7 +54324,7 @@
   .byte  102,15,127,124,36,232               // movdqa        %xmm7,-0x18(%rsp)
   .byte  102,68,15,111,193                   // movdqa        %xmm1,%xmm8
   .byte  102,68,15,111,248                   // movdqa        %xmm0,%xmm15
-  .byte  102,15,111,53,114,66,0,0            // movdqa        0x4272(%rip),%xmm6        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,15,111,53,130,66,0,0            // movdqa        0x4282(%rip),%xmm6        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,68,15,111,222                   // movdqa        %xmm6,%xmm11
   .byte  102,69,15,249,222                   // psubw         %xmm14,%xmm11
   .byte  102,65,15,111,203                   // movdqa        %xmm11,%xmm1
@@ -54707,7 +54346,7 @@
   .byte  102,15,253,201                      // paddw         %xmm1,%xmm1
   .byte  102,69,15,111,225                   // movdqa        %xmm9,%xmm12
   .byte  102,68,15,249,225                   // psubw         %xmm1,%xmm12
-  .byte  102,15,111,13,86,73,0,0             // movdqa        0x4956(%rip),%xmm1        # 3bc60 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
+  .byte  102,15,111,13,102,73,0,0            // movdqa        0x4966(%rip),%xmm1        # 3b4a0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
   .byte  102,69,15,111,238                   // movdqa        %xmm14,%xmm13
   .byte  102,68,15,239,233                   // pxor          %xmm1,%xmm13
   .byte  102,15,239,249                      // pxor          %xmm1,%xmm7
@@ -54734,7 +54373,7 @@
   .byte  102,68,15,213,197                   // pmullw        %xmm5,%xmm8
   .byte  102,15,111,229                      // movdqa        %xmm5,%xmm4
   .byte  102,15,253,228                      // paddw         %xmm4,%xmm4
-  .byte  102,15,111,61,213,72,0,0            // movdqa        0x48d5(%rip),%xmm7        # 3bc60 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
+  .byte  102,15,111,61,229,72,0,0            // movdqa        0x48e5(%rip),%xmm7        # 3b4a0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
   .byte  102,15,239,231                      // pxor          %xmm7,%xmm4
   .byte  102,65,15,101,229                   // pcmpgtw       %xmm13,%xmm4
   .byte  102,69,15,253,192                   // paddw         %xmm8,%xmm8
@@ -54794,27 +54433,27 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,41                              // ja            374a1 <_sk_load_8888_sse2_lowp+0x44>
+  .byte  119,41                              // ja            36cd1 <_sk_load_8888_sse2_lowp+0x44>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,25,1,0,0                  // lea           0x119(%rip),%r9        # 375a0 <_sk_load_8888_sse2_lowp+0x143>
+  .byte  76,141,13,25,1,0,0                  // lea           0x119(%rip),%r9        # 36dd0 <_sk_load_8888_sse2_lowp+0x143>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  255,224                             // jmpq          *%rax
   .byte  243,65,15,16,28,144                 // movss         (%r8,%rdx,4),%xmm3
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  235,102                             // jmp           37507 <_sk_load_8888_sse2_lowp+0xaa>
+  .byte  235,102                             // jmp           36d37 <_sk_load_8888_sse2_lowp+0xaa>
   .byte  102,65,15,16,28,144                 // movupd        (%r8,%rdx,4),%xmm3
   .byte  243,69,15,111,68,144,16             // movdqu        0x10(%r8,%rdx,4),%xmm8
-  .byte  235,87                              // jmp           37507 <_sk_load_8888_sse2_lowp+0xaa>
+  .byte  235,87                              // jmp           36d37 <_sk_load_8888_sse2_lowp+0xaa>
   .byte  102,65,15,110,68,144,8              // movd          0x8(%r8,%rdx,4),%xmm0
   .byte  102,68,15,112,192,69                // pshufd        $0x45,%xmm0,%xmm8
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,69,15,18,4,144                  // movlpd        (%r8,%rdx,4),%xmm8
   .byte  102,65,15,40,216                    // movapd        %xmm8,%xmm3
   .byte  102,68,15,111,192                   // movdqa        %xmm0,%xmm8
-  .byte  235,52                              // jmp           37507 <_sk_load_8888_sse2_lowp+0xaa>
+  .byte  235,52                              // jmp           36d37 <_sk_load_8888_sse2_lowp+0xaa>
   .byte  102,65,15,110,68,144,24             // movd          0x18(%r8,%rdx,4),%xmm0
   .byte  102,68,15,112,192,69                // pshufd        $0x45,%xmm0,%xmm8
   .byte  243,65,15,16,68,144,20              // movss         0x14(%r8,%rdx,4),%xmm0
@@ -54831,7 +54470,7 @@
   .byte  102,15,114,240,16                   // pslld         $0x10,%xmm0
   .byte  102,15,114,224,16                   // psrad         $0x10,%xmm0
   .byte  102,15,107,200                      // packssdw      %xmm0,%xmm1
-  .byte  102,68,15,111,13,223,63,0,0         // movdqa        0x3fdf(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,239,63,0,0         // movdqa        0x3fef(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,111,193                      // movdqa        %xmm1,%xmm0
   .byte  102,65,15,219,193                   // pand          %xmm9,%xmm0
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
@@ -54888,27 +54527,27 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,41                              // ja            37600 <_sk_load_8888_dst_sse2_lowp+0x44>
+  .byte  119,41                              // ja            36e30 <_sk_load_8888_dst_sse2_lowp+0x44>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,22,1,0,0                  // lea           0x116(%rip),%r9        # 376fc <_sk_load_8888_dst_sse2_lowp+0x140>
+  .byte  76,141,13,22,1,0,0                  // lea           0x116(%rip),%r9        # 36f2c <_sk_load_8888_dst_sse2_lowp+0x140>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  255,224                             // jmpq          *%rax
   .byte  243,65,15,16,60,144                 // movss         (%r8,%rdx,4),%xmm7
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  235,102                             // jmp           37666 <_sk_load_8888_dst_sse2_lowp+0xaa>
+  .byte  235,102                             // jmp           36e96 <_sk_load_8888_dst_sse2_lowp+0xaa>
   .byte  102,65,15,16,60,144                 // movupd        (%r8,%rdx,4),%xmm7
   .byte  243,69,15,111,68,144,16             // movdqu        0x10(%r8,%rdx,4),%xmm8
-  .byte  235,87                              // jmp           37666 <_sk_load_8888_dst_sse2_lowp+0xaa>
+  .byte  235,87                              // jmp           36e96 <_sk_load_8888_dst_sse2_lowp+0xaa>
   .byte  102,65,15,110,100,144,8             // movd          0x8(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,69,15,18,4,144                  // movlpd        (%r8,%rdx,4),%xmm8
   .byte  102,65,15,40,248                    // movapd        %xmm8,%xmm7
   .byte  102,68,15,111,196                   // movdqa        %xmm4,%xmm8
-  .byte  235,52                              // jmp           37666 <_sk_load_8888_dst_sse2_lowp+0xaa>
+  .byte  235,52                              // jmp           36e96 <_sk_load_8888_dst_sse2_lowp+0xaa>
   .byte  102,65,15,110,100,144,24            // movd          0x18(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  243,65,15,16,100,144,20             // movss         0x14(%r8,%rdx,4),%xmm4
@@ -54925,7 +54564,7 @@
   .byte  102,15,114,244,16                   // pslld         $0x10,%xmm4
   .byte  102,15,114,228,16                   // psrad         $0x10,%xmm4
   .byte  102,15,107,236                      // packssdw      %xmm4,%xmm5
-  .byte  102,68,15,111,13,128,62,0,0         // movdqa        0x3e80(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,144,62,0,0         // movdqa        0x3e90(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,111,229                      // movdqa        %xmm5,%xmm4
   .byte  102,65,15,219,225                   // pand          %xmm9,%xmm4
   .byte  102,15,113,213,8                    // psrlw         $0x8,%xmm5
@@ -54993,21 +54632,21 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,27                              // ja            3779b <_sk_store_8888_sse2_lowp+0x83>
+  .byte  119,27                              // ja            36fcb <_sk_store_8888_sse2_lowp+0x83>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,98,0,0,0                  // lea           0x62(%rip),%r9        # 377ec <_sk_store_8888_sse2_lowp+0xd4>
+  .byte  76,141,13,98,0,0,0                  // lea           0x62(%rip),%r9        # 3701c <_sk_store_8888_sse2_lowp+0xd4>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,69,15,126,12,144                // movd          %xmm9,(%r8,%rdx,4)
-  .byte  235,75                              // jmp           377e6 <_sk_store_8888_sse2_lowp+0xce>
+  .byte  235,75                              // jmp           37016 <_sk_store_8888_sse2_lowp+0xce>
   .byte  243,69,15,127,12,144                // movdqu        %xmm9,(%r8,%rdx,4)
   .byte  243,69,15,127,68,144,16             // movdqu        %xmm8,0x10(%r8,%rdx,4)
-  .byte  235,60                              // jmp           377e6 <_sk_store_8888_sse2_lowp+0xce>
+  .byte  235,60                              // jmp           37016 <_sk_store_8888_sse2_lowp+0xce>
   .byte  102,69,15,112,193,78                // pshufd        $0x4e,%xmm9,%xmm8
   .byte  102,69,15,126,68,144,8              // movd          %xmm8,0x8(%r8,%rdx,4)
   .byte  102,69,15,214,12,144                // movq          %xmm9,(%r8,%rdx,4)
-  .byte  235,39                              // jmp           377e6 <_sk_store_8888_sse2_lowp+0xce>
+  .byte  235,39                              // jmp           37016 <_sk_store_8888_sse2_lowp+0xce>
   .byte  102,69,15,112,208,78                // pshufd        $0x4e,%xmm8,%xmm10
   .byte  102,69,15,126,84,144,24             // movd          %xmm10,0x18(%r8,%rdx,4)
   .byte  102,69,15,112,208,229               // pshufd        $0xe5,%xmm8,%xmm10
@@ -55052,27 +54691,27 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,41                              // ja            3784c <_sk_load_bgra_sse2_lowp+0x44>
+  .byte  119,41                              // ja            3707c <_sk_load_bgra_sse2_lowp+0x44>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,22,1,0,0                  // lea           0x116(%rip),%r9        # 37948 <_sk_load_bgra_sse2_lowp+0x140>
+  .byte  76,141,13,22,1,0,0                  // lea           0x116(%rip),%r9        # 37178 <_sk_load_bgra_sse2_lowp+0x140>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  255,224                             // jmpq          *%rax
   .byte  243,65,15,16,28,144                 // movss         (%r8,%rdx,4),%xmm3
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  235,102                             // jmp           378b2 <_sk_load_bgra_sse2_lowp+0xaa>
+  .byte  235,102                             // jmp           370e2 <_sk_load_bgra_sse2_lowp+0xaa>
   .byte  102,65,15,16,28,144                 // movupd        (%r8,%rdx,4),%xmm3
   .byte  243,69,15,111,68,144,16             // movdqu        0x10(%r8,%rdx,4),%xmm8
-  .byte  235,87                              // jmp           378b2 <_sk_load_bgra_sse2_lowp+0xaa>
+  .byte  235,87                              // jmp           370e2 <_sk_load_bgra_sse2_lowp+0xaa>
   .byte  102,65,15,110,68,144,8              // movd          0x8(%r8,%rdx,4),%xmm0
   .byte  102,68,15,112,192,69                // pshufd        $0x45,%xmm0,%xmm8
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,69,15,18,4,144                  // movlpd        (%r8,%rdx,4),%xmm8
   .byte  102,65,15,40,216                    // movapd        %xmm8,%xmm3
   .byte  102,68,15,111,192                   // movdqa        %xmm0,%xmm8
-  .byte  235,52                              // jmp           378b2 <_sk_load_bgra_sse2_lowp+0xaa>
+  .byte  235,52                              // jmp           370e2 <_sk_load_bgra_sse2_lowp+0xaa>
   .byte  102,65,15,110,68,144,24             // movd          0x18(%r8,%rdx,4),%xmm0
   .byte  102,68,15,112,192,69                // pshufd        $0x45,%xmm0,%xmm8
   .byte  243,65,15,16,68,144,20              // movss         0x14(%r8,%rdx,4),%xmm0
@@ -55089,7 +54728,7 @@
   .byte  102,15,114,240,16                   // pslld         $0x10,%xmm0
   .byte  102,15,114,224,16                   // psrad         $0x10,%xmm0
   .byte  102,15,107,200                      // packssdw      %xmm0,%xmm1
-  .byte  102,68,15,111,13,52,60,0,0          // movdqa        0x3c34(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,68,60,0,0          // movdqa        0x3c44(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,111,209                      // movdqa        %xmm1,%xmm2
   .byte  102,65,15,219,209                   // pand          %xmm9,%xmm2
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
@@ -55142,27 +54781,27 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,41                              // ja            379a8 <_sk_load_bgra_dst_sse2_lowp+0x44>
+  .byte  119,41                              // ja            371d8 <_sk_load_bgra_dst_sse2_lowp+0x44>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,22,1,0,0                  // lea           0x116(%rip),%r9        # 37aa4 <_sk_load_bgra_dst_sse2_lowp+0x140>
+  .byte  76,141,13,22,1,0,0                  // lea           0x116(%rip),%r9        # 372d4 <_sk_load_bgra_dst_sse2_lowp+0x140>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  255,224                             // jmpq          *%rax
   .byte  243,65,15,16,60,144                 // movss         (%r8,%rdx,4),%xmm7
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  235,102                             // jmp           37a0e <_sk_load_bgra_dst_sse2_lowp+0xaa>
+  .byte  235,102                             // jmp           3723e <_sk_load_bgra_dst_sse2_lowp+0xaa>
   .byte  102,65,15,16,60,144                 // movupd        (%r8,%rdx,4),%xmm7
   .byte  243,69,15,111,68,144,16             // movdqu        0x10(%r8,%rdx,4),%xmm8
-  .byte  235,87                              // jmp           37a0e <_sk_load_bgra_dst_sse2_lowp+0xaa>
+  .byte  235,87                              // jmp           3723e <_sk_load_bgra_dst_sse2_lowp+0xaa>
   .byte  102,65,15,110,100,144,8             // movd          0x8(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,69,15,18,4,144                  // movlpd        (%r8,%rdx,4),%xmm8
   .byte  102,65,15,40,248                    // movapd        %xmm8,%xmm7
   .byte  102,68,15,111,196                   // movdqa        %xmm4,%xmm8
-  .byte  235,52                              // jmp           37a0e <_sk_load_bgra_dst_sse2_lowp+0xaa>
+  .byte  235,52                              // jmp           3723e <_sk_load_bgra_dst_sse2_lowp+0xaa>
   .byte  102,65,15,110,100,144,24            // movd          0x18(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  243,65,15,16,100,144,20             // movss         0x14(%r8,%rdx,4),%xmm4
@@ -55179,7 +54818,7 @@
   .byte  102,15,114,244,16                   // pslld         $0x10,%xmm4
   .byte  102,15,114,228,16                   // psrad         $0x10,%xmm4
   .byte  102,15,107,236                      // packssdw      %xmm4,%xmm5
-  .byte  102,68,15,111,13,216,58,0,0         // movdqa        0x3ad8(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,232,58,0,0         // movdqa        0x3ae8(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,111,245                      // movdqa        %xmm5,%xmm6
   .byte  102,65,15,219,241                   // pand          %xmm9,%xmm6
   .byte  102,15,113,213,8                    // psrlw         $0x8,%xmm5
@@ -55247,21 +54886,21 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,27                              // ja            37b43 <_sk_store_bgra_sse2_lowp+0x83>
+  .byte  119,27                              // ja            37373 <_sk_store_bgra_sse2_lowp+0x83>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,98,0,0,0                  // lea           0x62(%rip),%r9        # 37b94 <_sk_store_bgra_sse2_lowp+0xd4>
+  .byte  76,141,13,98,0,0,0                  // lea           0x62(%rip),%r9        # 373c4 <_sk_store_bgra_sse2_lowp+0xd4>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,69,15,126,12,144                // movd          %xmm9,(%r8,%rdx,4)
-  .byte  235,75                              // jmp           37b8e <_sk_store_bgra_sse2_lowp+0xce>
+  .byte  235,75                              // jmp           373be <_sk_store_bgra_sse2_lowp+0xce>
   .byte  243,69,15,127,12,144                // movdqu        %xmm9,(%r8,%rdx,4)
   .byte  243,69,15,127,68,144,16             // movdqu        %xmm8,0x10(%r8,%rdx,4)
-  .byte  235,60                              // jmp           37b8e <_sk_store_bgra_sse2_lowp+0xce>
+  .byte  235,60                              // jmp           373be <_sk_store_bgra_sse2_lowp+0xce>
   .byte  102,69,15,112,193,78                // pshufd        $0x4e,%xmm9,%xmm8
   .byte  102,69,15,126,68,144,8              // movd          %xmm8,0x8(%r8,%rdx,4)
   .byte  102,69,15,214,12,144                // movq          %xmm9,(%r8,%rdx,4)
-  .byte  235,39                              // jmp           37b8e <_sk_store_bgra_sse2_lowp+0xce>
+  .byte  235,39                              // jmp           373be <_sk_store_bgra_sse2_lowp+0xce>
   .byte  102,69,15,112,208,78                // pshufd        $0x4e,%xmm8,%xmm10
   .byte  102,69,15,126,84,144,24             // movd          %xmm10,0x18(%r8,%rdx,4)
   .byte  102,69,15,112,208,229               // pshufd        $0xe5,%xmm8,%xmm10
@@ -55375,7 +55014,7 @@
   .byte  102,15,114,241,16                   // pslld         $0x10,%xmm1
   .byte  102,15,114,225,16                   // psrad         $0x10,%xmm1
   .byte  102,15,107,200                      // packssdw      %xmm0,%xmm1
-  .byte  102,68,15,111,13,244,55,0,0         // movdqa        0x37f4(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,4,56,0,0           // movdqa        0x3804(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,111,193                      // movdqa        %xmm1,%xmm0
   .byte  102,65,15,219,193                   // pand          %xmm9,%xmm0
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
@@ -55485,7 +55124,7 @@
   .byte  102,15,114,241,16                   // pslld         $0x10,%xmm1
   .byte  102,15,114,225,16                   // psrad         $0x10,%xmm1
   .byte  102,15,107,200                      // packssdw      %xmm0,%xmm1
-  .byte  102,68,15,111,13,21,54,0,0          // movdqa        0x3615(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,37,54,0,0          // movdqa        0x3625(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,111,209                      // movdqa        %xmm1,%xmm2
   .byte  102,65,15,219,209                   // pand          %xmm9,%xmm2
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
@@ -55526,23 +55165,23 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            37faa <_sk_load_565_sse2_lowp+0x3c>
+  .byte  119,34                              // ja            377da <_sk_load_565_sse2_lowp+0x3c>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,190,0,0,0                 // lea           0xbe(%rip),%r9        # 38054 <_sk_load_565_sse2_lowp+0xe6>
+  .byte  76,141,13,190,0,0,0                 // lea           0xbe(%rip),%r9        # 37884 <_sk_load_565_sse2_lowp+0xe6>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
-  .byte  235,66                              // jmp           37fec <_sk_load_565_sse2_lowp+0x7e>
+  .byte  235,66                              // jmp           3781c <_sk_load_565_sse2_lowp+0x7e>
   .byte  243,65,15,111,4,80                  // movdqu        (%r8,%rdx,2),%xmm0
-  .byte  235,58                              // jmp           37fec <_sk_load_565_sse2_lowp+0x7e>
+  .byte  235,58                              // jmp           3781c <_sk_load_565_sse2_lowp+0x7e>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,65,15,196,68,80,4,2             // pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm0
   .byte  243,65,15,16,12,80                  // movss         (%r8,%rdx,2),%xmm1
   .byte  243,15,16,193                       // movss         %xmm1,%xmm0
-  .byte  235,34                              // jmp           37fec <_sk_load_565_sse2_lowp+0x7e>
+  .byte  235,34                              // jmp           3781c <_sk_load_565_sse2_lowp+0x7e>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,65,15,196,68,80,12,6            // pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm0
   .byte  102,65,15,196,68,80,10,5            // pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm0
@@ -55550,11 +55189,11 @@
   .byte  102,65,15,18,4,80                   // movlpd        (%r8,%rdx,2),%xmm0
   .byte  102,15,111,216                      // movdqa        %xmm0,%xmm3
   .byte  102,15,113,211,8                    // psrlw         $0x8,%xmm3
-  .byte  102,15,219,29,163,60,0,0            // pand          0x3ca3(%rip),%xmm3        # 3bca0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d4>
+  .byte  102,15,219,29,179,60,0,0            // pand          0x3cb3(%rip),%xmm3        # 3b4e0 <_sk_srcover_bgra_8888_sse2_lowp+0x13e4>
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
   .byte  102,15,113,209,5                    // psrlw         $0x5,%xmm1
-  .byte  102,15,219,13,162,60,0,0            // pand          0x3ca2(%rip),%xmm1        # 3bcb0 <_sk_srcover_bgra_8888_sse2_lowp+0x13e4>
-  .byte  102,15,111,21,170,60,0,0            // movdqa        0x3caa(%rip),%xmm2        # 3bcc0 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  .byte  102,15,219,13,178,60,0,0            // pand          0x3cb2(%rip),%xmm1        # 3b4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  .byte  102,15,111,21,186,60,0,0            // movdqa        0x3cba(%rip),%xmm2        # 3b500 <_sk_srcover_bgra_8888_sse2_lowp+0x1404>
   .byte  102,15,219,208                      // pand          %xmm0,%xmm2
   .byte  102,15,113,208,13                   // psrlw         $0xd,%xmm0
   .byte  102,15,235,195                      // por           %xmm3,%xmm0
@@ -55567,7 +55206,7 @@
   .byte  102,15,113,210,2                    // psrlw         $0x2,%xmm2
   .byte  102,15,235,211                      // por           %xmm3,%xmm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,192,52,0,0                 // movaps        0x34c0(%rip),%xmm3        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  15,40,29,208,52,0,0                 // movaps        0x34d0(%rip),%xmm3        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  255,224                             // jmpq          *%rax
   .byte  102,144                             // xchg          %ax,%ax
   .byte  75,255                              // rex.WXB       (bad)
@@ -55597,23 +55236,23 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            380ac <_sk_load_565_dst_sse2_lowp+0x3c>
+  .byte  119,34                              // ja            378dc <_sk_load_565_dst_sse2_lowp+0x3c>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,188,0,0,0                 // lea           0xbc(%rip),%r9        # 38154 <_sk_load_565_dst_sse2_lowp+0xe4>
+  .byte  76,141,13,188,0,0,0                 // lea           0xbc(%rip),%r9        # 37984 <_sk_load_565_dst_sse2_lowp+0xe4>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
-  .byte  235,66                              // jmp           380ee <_sk_load_565_dst_sse2_lowp+0x7e>
+  .byte  235,66                              // jmp           3791e <_sk_load_565_dst_sse2_lowp+0x7e>
   .byte  243,65,15,111,36,80                 // movdqu        (%r8,%rdx,2),%xmm4
-  .byte  235,58                              // jmp           380ee <_sk_load_565_dst_sse2_lowp+0x7e>
+  .byte  235,58                              // jmp           3791e <_sk_load_565_dst_sse2_lowp+0x7e>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,65,15,196,100,80,4,2            // pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm4
   .byte  243,65,15,16,44,80                  // movss         (%r8,%rdx,2),%xmm5
   .byte  243,15,16,229                       // movss         %xmm5,%xmm4
-  .byte  235,34                              // jmp           380ee <_sk_load_565_dst_sse2_lowp+0x7e>
+  .byte  235,34                              // jmp           3791e <_sk_load_565_dst_sse2_lowp+0x7e>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,65,15,196,100,80,12,6           // pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm4
   .byte  102,65,15,196,100,80,10,5           // pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm4
@@ -55621,11 +55260,11 @@
   .byte  102,65,15,18,36,80                  // movlpd        (%r8,%rdx,2),%xmm4
   .byte  102,15,111,252                      // movdqa        %xmm4,%xmm7
   .byte  102,15,113,215,8                    // psrlw         $0x8,%xmm7
-  .byte  102,15,219,61,161,59,0,0            // pand          0x3ba1(%rip),%xmm7        # 3bca0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d4>
+  .byte  102,15,219,61,177,59,0,0            // pand          0x3bb1(%rip),%xmm7        # 3b4e0 <_sk_srcover_bgra_8888_sse2_lowp+0x13e4>
   .byte  102,15,111,236                      // movdqa        %xmm4,%xmm5
   .byte  102,15,113,213,5                    // psrlw         $0x5,%xmm5
-  .byte  102,15,219,45,160,59,0,0            // pand          0x3ba0(%rip),%xmm5        # 3bcb0 <_sk_srcover_bgra_8888_sse2_lowp+0x13e4>
-  .byte  102,15,111,53,168,59,0,0            // movdqa        0x3ba8(%rip),%xmm6        # 3bcc0 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  .byte  102,15,219,45,176,59,0,0            // pand          0x3bb0(%rip),%xmm5        # 3b4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  .byte  102,15,111,53,184,59,0,0            // movdqa        0x3bb8(%rip),%xmm6        # 3b500 <_sk_srcover_bgra_8888_sse2_lowp+0x1404>
   .byte  102,15,219,244                      // pand          %xmm4,%xmm6
   .byte  102,15,113,212,13                   // psrlw         $0xd,%xmm4
   .byte  102,15,235,231                      // por           %xmm7,%xmm4
@@ -55638,7 +55277,7 @@
   .byte  102,15,113,214,2                    // psrlw         $0x2,%xmm6
   .byte  102,15,235,247                      // por           %xmm7,%xmm6
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,61,190,51,0,0                 // movaps        0x33be(%rip),%xmm7        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  15,40,61,206,51,0,0                 // movaps        0x33ce(%rip),%xmm7        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  255,224                             // jmpq          *%rax
   .byte  77,255                              // rex.WRB       (bad)
   .byte  255                                 // (bad)
@@ -55662,10 +55301,10 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  102,68,15,111,192                   // movdqa        %xmm0,%xmm8
   .byte  102,65,15,113,240,8                 // psllw         $0x8,%xmm8
-  .byte  102,68,15,219,5,60,59,0,0           // pand          0x3b3c(%rip),%xmm8        # 3bcd0 <_sk_srcover_bgra_8888_sse2_lowp+0x1404>
+  .byte  102,68,15,219,5,76,59,0,0           // pand          0x3b4c(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0x1414>
   .byte  102,68,15,111,201                   // movdqa        %xmm1,%xmm9
   .byte  102,65,15,113,241,3                 // psllw         $0x3,%xmm9
-  .byte  102,68,15,219,13,56,59,0,0          // pand          0x3b38(%rip),%xmm9        # 3bce0 <_sk_srcover_bgra_8888_sse2_lowp+0x1414>
+  .byte  102,68,15,219,13,72,59,0,0          // pand          0x3b48(%rip),%xmm9        # 3b520 <_sk_srcover_bgra_8888_sse2_lowp+0x1424>
   .byte  102,69,15,235,200                   // por           %xmm8,%xmm9
   .byte  102,68,15,111,194                   // movdqa        %xmm2,%xmm8
   .byte  102,65,15,113,208,3                 // psrlw         $0x3,%xmm8
@@ -55674,21 +55313,21 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,31                              // ja            381e6 <_sk_store_565_sse2_lowp+0x76>
+  .byte  119,31                              // ja            37a16 <_sk_store_565_sse2_lowp+0x76>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,95,0,0,0                  // lea           0x5f(%rip),%r9        # 38230 <_sk_store_565_sse2_lowp+0xc0>
+  .byte  76,141,13,95,0,0,0                  // lea           0x5f(%rip),%r9        # 37a60 <_sk_store_565_sse2_lowp+0xc0>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,68,15,126,192                   // movd          %xmm8,%eax
   .byte  102,65,137,4,80                     // mov           %ax,(%r8,%rdx,2)
-  .byte  235,70                              // jmp           3822c <_sk_store_565_sse2_lowp+0xbc>
+  .byte  235,70                              // jmp           37a5c <_sk_store_565_sse2_lowp+0xbc>
   .byte  243,69,15,127,4,80                  // movdqu        %xmm8,(%r8,%rdx,2)
-  .byte  235,62                              // jmp           3822c <_sk_store_565_sse2_lowp+0xbc>
+  .byte  235,62                              // jmp           37a5c <_sk_store_565_sse2_lowp+0xbc>
   .byte  102,65,15,197,192,2                 // pextrw        $0x2,%xmm8,%eax
   .byte  102,65,137,68,80,4                  // mov           %ax,0x4(%r8,%rdx,2)
   .byte  102,69,15,126,4,80                  // movd          %xmm8,(%r8,%rdx,2)
-  .byte  235,42                              // jmp           3822c <_sk_store_565_sse2_lowp+0xbc>
+  .byte  235,42                              // jmp           37a5c <_sk_store_565_sse2_lowp+0xbc>
   .byte  102,65,15,197,192,6                 // pextrw        $0x6,%xmm8,%eax
   .byte  102,65,137,68,80,12                 // mov           %ax,0xc(%r8,%rdx,2)
   .byte  102,65,15,197,192,5                 // pextrw        $0x5,%xmm8,%eax
@@ -55807,11 +55446,11 @@
   .byte  102,15,108,193                      // punpcklqdq    %xmm1,%xmm0
   .byte  102,15,111,216                      // movdqa        %xmm0,%xmm3
   .byte  102,15,113,211,8                    // psrlw         $0x8,%xmm3
-  .byte  102,15,219,29,229,56,0,0            // pand          0x38e5(%rip),%xmm3        # 3bca0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d4>
+  .byte  102,15,219,29,245,56,0,0            // pand          0x38f5(%rip),%xmm3        # 3b4e0 <_sk_srcover_bgra_8888_sse2_lowp+0x13e4>
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
   .byte  102,15,113,209,5                    // psrlw         $0x5,%xmm1
-  .byte  102,15,219,13,228,56,0,0            // pand          0x38e4(%rip),%xmm1        # 3bcb0 <_sk_srcover_bgra_8888_sse2_lowp+0x13e4>
-  .byte  102,15,111,21,236,56,0,0            // movdqa        0x38ec(%rip),%xmm2        # 3bcc0 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  .byte  102,15,219,13,244,56,0,0            // pand          0x38f4(%rip),%xmm1        # 3b4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  .byte  102,15,111,21,252,56,0,0            // movdqa        0x38fc(%rip),%xmm2        # 3b500 <_sk_srcover_bgra_8888_sse2_lowp+0x1404>
   .byte  102,15,219,208                      // pand          %xmm0,%xmm2
   .byte  102,15,113,208,13                   // psrlw         $0xd,%xmm0
   .byte  102,15,235,195                      // por           %xmm3,%xmm0
@@ -55824,7 +55463,7 @@
   .byte  102,15,113,210,2                    // psrlw         $0x2,%xmm2
   .byte  102,15,235,211                      // por           %xmm3,%xmm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,2,49,0,0                   // movaps        0x3102(%rip),%xmm3        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  15,40,29,18,49,0,0                  // movaps        0x3112(%rip),%xmm3        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  91                                  // pop           %rbx
   .byte  65,92                               // pop           %r12
   .byte  65,94                               // pop           %r14
@@ -55845,23 +55484,23 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,36                              // ja            38456 <_sk_load_4444_sse2_lowp+0x3e>
+  .byte  119,36                              // ja            37c86 <_sk_load_4444_sse2_lowp+0x3e>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,199,0,0,0                 // lea           0xc7(%rip),%r9        # 38508 <_sk_load_4444_sse2_lowp+0xf0>
+  .byte  76,141,13,199,0,0,0                 // lea           0xc7(%rip),%r9        # 37d38 <_sk_load_4444_sse2_lowp+0xf0>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
-  .byte  235,69                              // jmp           3849b <_sk_load_4444_sse2_lowp+0x83>
+  .byte  235,69                              // jmp           37ccb <_sk_load_4444_sse2_lowp+0x83>
   .byte  243,69,15,111,4,80                  // movdqu        (%r8,%rdx,2),%xmm8
-  .byte  235,61                              // jmp           3849b <_sk_load_4444_sse2_lowp+0x83>
+  .byte  235,61                              // jmp           37ccb <_sk_load_4444_sse2_lowp+0x83>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  102,69,15,196,68,80,4,2             // pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm8
   .byte  243,65,15,16,4,80                   // movss         (%r8,%rdx,2),%xmm0
   .byte  243,68,15,16,192                    // movss         %xmm0,%xmm8
-  .byte  235,35                              // jmp           3849b <_sk_load_4444_sse2_lowp+0x83>
+  .byte  235,35                              // jmp           37ccb <_sk_load_4444_sse2_lowp+0x83>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  102,69,15,196,68,80,12,6            // pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm8
   .byte  102,69,15,196,68,80,10,5            // pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm8
@@ -55871,7 +55510,7 @@
   .byte  102,15,113,209,12                   // psrlw         $0xc,%xmm1
   .byte  102,65,15,111,208                   // movdqa        %xmm8,%xmm2
   .byte  102,15,113,210,8                    // psrlw         $0x8,%xmm2
-  .byte  102,15,111,5,57,56,0,0              // movdqa        0x3839(%rip),%xmm0        # 3bcf0 <_sk_srcover_bgra_8888_sse2_lowp+0x1424>
+  .byte  102,15,111,5,73,56,0,0              // movdqa        0x3849(%rip),%xmm0        # 3b530 <_sk_srcover_bgra_8888_sse2_lowp+0x1434>
   .byte  102,15,219,208                      // pand          %xmm0,%xmm2
   .byte  102,65,15,111,216                   // movdqa        %xmm8,%xmm3
   .byte  102,15,113,211,4                    // psrlw         $0x4,%xmm3
@@ -55901,7 +55540,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  125,255                             // jge           3851d <_sk_load_4444_sse2_lowp+0x105>
+  .byte  125,255                             // jge           37d4d <_sk_load_4444_sse2_lowp+0x105>
   .byte  255                                 // (bad)
   .byte  255,112,255                         // pushq         -0x1(%rax)
   .byte  255                                 // (bad)
@@ -55920,23 +55559,23 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,36                              // ja            38562 <_sk_load_4444_dst_sse2_lowp+0x3e>
+  .byte  119,36                              // ja            37d92 <_sk_load_4444_dst_sse2_lowp+0x3e>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,199,0,0,0                 // lea           0xc7(%rip),%r9        # 38614 <_sk_load_4444_dst_sse2_lowp+0xf0>
+  .byte  76,141,13,199,0,0,0                 // lea           0xc7(%rip),%r9        # 37e44 <_sk_load_4444_dst_sse2_lowp+0xf0>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
-  .byte  235,69                              // jmp           385a7 <_sk_load_4444_dst_sse2_lowp+0x83>
+  .byte  235,69                              // jmp           37dd7 <_sk_load_4444_dst_sse2_lowp+0x83>
   .byte  243,69,15,111,4,80                  // movdqu        (%r8,%rdx,2),%xmm8
-  .byte  235,61                              // jmp           385a7 <_sk_load_4444_dst_sse2_lowp+0x83>
+  .byte  235,61                              // jmp           37dd7 <_sk_load_4444_dst_sse2_lowp+0x83>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  102,69,15,196,68,80,4,2             // pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm8
   .byte  243,65,15,16,36,80                  // movss         (%r8,%rdx,2),%xmm4
   .byte  243,68,15,16,196                    // movss         %xmm4,%xmm8
-  .byte  235,35                              // jmp           385a7 <_sk_load_4444_dst_sse2_lowp+0x83>
+  .byte  235,35                              // jmp           37dd7 <_sk_load_4444_dst_sse2_lowp+0x83>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  102,69,15,196,68,80,12,6            // pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm8
   .byte  102,69,15,196,68,80,10,5            // pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm8
@@ -55946,7 +55585,7 @@
   .byte  102,15,113,213,12                   // psrlw         $0xc,%xmm5
   .byte  102,65,15,111,240                   // movdqa        %xmm8,%xmm6
   .byte  102,15,113,214,8                    // psrlw         $0x8,%xmm6
-  .byte  102,15,111,37,45,55,0,0             // movdqa        0x372d(%rip),%xmm4        # 3bcf0 <_sk_srcover_bgra_8888_sse2_lowp+0x1424>
+  .byte  102,15,111,37,61,55,0,0             // movdqa        0x373d(%rip),%xmm4        # 3b530 <_sk_srcover_bgra_8888_sse2_lowp+0x1434>
   .byte  102,15,219,244                      // pand          %xmm4,%xmm6
   .byte  102,65,15,111,248                   // movdqa        %xmm8,%xmm7
   .byte  102,15,113,215,4                    // psrlw         $0x4,%xmm7
@@ -55976,7 +55615,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  125,255                             // jge           38629 <_sk_load_4444_dst_sse2_lowp+0x105>
+  .byte  125,255                             // jge           37e59 <_sk_load_4444_dst_sse2_lowp+0x105>
   .byte  255                                 // (bad)
   .byte  255,112,255                         // pushq         -0x1(%rax)
   .byte  255                                 // (bad)
@@ -55993,12 +55632,12 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  102,68,15,111,192                   // movdqa        %xmm0,%xmm8
   .byte  102,65,15,113,240,8                 // psllw         $0x8,%xmm8
-  .byte  102,68,15,219,5,172,54,0,0          // pand          0x36ac(%rip),%xmm8        # 3bd00 <_sk_srcover_bgra_8888_sse2_lowp+0x1434>
+  .byte  102,68,15,219,5,188,54,0,0          // pand          0x36bc(%rip),%xmm8        # 3b540 <_sk_srcover_bgra_8888_sse2_lowp+0x1444>
   .byte  102,68,15,111,201                   // movdqa        %xmm1,%xmm9
   .byte  102,65,15,113,241,4                 // psllw         $0x4,%xmm9
-  .byte  102,68,15,219,13,168,54,0,0         // pand          0x36a8(%rip),%xmm9        # 3bd10 <_sk_srcover_bgra_8888_sse2_lowp+0x1444>
+  .byte  102,68,15,219,13,184,54,0,0         // pand          0x36b8(%rip),%xmm9        # 3b550 <_sk_srcover_bgra_8888_sse2_lowp+0x1454>
   .byte  102,69,15,235,200                   // por           %xmm8,%xmm9
-  .byte  102,68,15,111,21,170,54,0,0         // movdqa        0x36aa(%rip),%xmm10        # 3bd20 <_sk_srcover_bgra_8888_sse2_lowp+0x1454>
+  .byte  102,68,15,111,21,186,54,0,0         // movdqa        0x36ba(%rip),%xmm10        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0x1464>
   .byte  102,68,15,219,210                   // pand          %xmm2,%xmm10
   .byte  102,68,15,111,195                   // movdqa        %xmm3,%xmm8
   .byte  102,65,15,113,208,4                 // psrlw         $0x4,%xmm8
@@ -56008,21 +55647,21 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,31                              // ja            386b9 <_sk_store_4444_sse2_lowp+0x89>
+  .byte  119,31                              // ja            37ee9 <_sk_store_4444_sse2_lowp+0x89>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,96,0,0,0                  // lea           0x60(%rip),%r9        # 38704 <_sk_store_4444_sse2_lowp+0xd4>
+  .byte  76,141,13,96,0,0,0                  // lea           0x60(%rip),%r9        # 37f34 <_sk_store_4444_sse2_lowp+0xd4>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,68,15,126,192                   // movd          %xmm8,%eax
   .byte  102,65,137,4,80                     // mov           %ax,(%r8,%rdx,2)
-  .byte  235,70                              // jmp           386ff <_sk_store_4444_sse2_lowp+0xcf>
+  .byte  235,70                              // jmp           37f2f <_sk_store_4444_sse2_lowp+0xcf>
   .byte  243,69,15,127,4,80                  // movdqu        %xmm8,(%r8,%rdx,2)
-  .byte  235,62                              // jmp           386ff <_sk_store_4444_sse2_lowp+0xcf>
+  .byte  235,62                              // jmp           37f2f <_sk_store_4444_sse2_lowp+0xcf>
   .byte  102,65,15,197,192,2                 // pextrw        $0x2,%xmm8,%eax
   .byte  102,65,137,68,80,4                  // mov           %ax,0x4(%r8,%rdx,2)
   .byte  102,69,15,126,4,80                  // movd          %xmm8,(%r8,%rdx,2)
-  .byte  235,42                              // jmp           386ff <_sk_store_4444_sse2_lowp+0xcf>
+  .byte  235,42                              // jmp           37f2f <_sk_store_4444_sse2_lowp+0xcf>
   .byte  102,65,15,197,192,6                 // pextrw        $0x6,%xmm8,%eax
   .byte  102,65,137,68,80,12                 // mov           %ax,0xc(%r8,%rdx,2)
   .byte  102,65,15,197,192,5                 // pextrw        $0x5,%xmm8,%eax
@@ -56041,7 +55680,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  233,255,255,255,221                 // jmpq          ffffffffde038718 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddffde4c>
+  .byte  233,255,255,255,221                 // jmpq          ffffffffde037f48 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddffde4c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,209                             // callq         *%rcx
@@ -56138,7 +55777,7 @@
   .byte  102,15,113,209,12                   // psrlw         $0xc,%xmm1
   .byte  102,65,15,111,208                   // movdqa        %xmm8,%xmm2
   .byte  102,15,113,210,8                    // psrlw         $0x8,%xmm2
-  .byte  102,15,111,5,82,52,0,0              // movdqa        0x3452(%rip),%xmm0        # 3bcf0 <_sk_srcover_bgra_8888_sse2_lowp+0x1424>
+  .byte  102,15,111,5,98,52,0,0              // movdqa        0x3462(%rip),%xmm0        # 3b530 <_sk_srcover_bgra_8888_sse2_lowp+0x1434>
   .byte  102,15,219,208                      // pand          %xmm0,%xmm2
   .byte  102,65,15,111,216                   // movdqa        %xmm8,%xmm3
   .byte  102,15,113,211,4                    // psrlw         $0x4,%xmm3
@@ -56176,19 +55815,19 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            38930 <_sk_load_a8_sse2_lowp+0x39>
+  .byte  119,34                              // ja            38160 <_sk_load_a8_sse2_lowp+0x39>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,140,0,0,0                 // lea           0x8c(%rip),%r9        # 389a8 <_sk_load_a8_sse2_lowp+0xb1>
+  .byte  76,141,13,140,0,0,0                 // lea           0x8c(%rip),%r9        # 381d8 <_sk_load_a8_sse2_lowp+0xb1>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,216                      // movd          %eax,%xmm3
-  .byte  235,97                              // jmp           38991 <_sk_load_a8_sse2_lowp+0x9a>
+  .byte  235,97                              // jmp           381c1 <_sk_load_a8_sse2_lowp+0x9a>
   .byte  243,65,15,126,28,16                 // movq          (%r8,%rdx,1),%xmm3
   .byte  102,15,96,216                       // punpcklbw     %xmm0,%xmm3
-  .byte  235,85                              // jmp           38991 <_sk_load_a8_sse2_lowp+0x9a>
+  .byte  235,85                              // jmp           381c1 <_sk_load_a8_sse2_lowp+0x9a>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  102,15,196,216,2                    // pinsrw        $0x2,%eax,%xmm3
@@ -56196,7 +55835,7 @@
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,15,96,192                       // punpcklbw     %xmm0,%xmm0
   .byte  243,15,16,216                       // movss         %xmm0,%xmm3
-  .byte  235,51                              // jmp           38991 <_sk_load_a8_sse2_lowp+0x9a>
+  .byte  235,51                              // jmp           381c1 <_sk_load_a8_sse2_lowp+0x9a>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  102,15,196,216,6                    // pinsrw        $0x6,%eax,%xmm3
@@ -56207,14 +55846,14 @@
   .byte  102,65,15,110,4,16                  // movd          (%r8,%rdx,1),%xmm0
   .byte  102,15,96,192                       // punpcklbw     %xmm0,%xmm0
   .byte  242,15,16,216                       // movsd         %xmm0,%xmm3
-  .byte  102,15,219,29,119,43,0,0            // pand          0x2b77(%rip),%xmm3        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,15,219,29,135,43,0,0            // pand          0x2b87(%rip),%xmm3        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  15,87,201                           // xorps         %xmm1,%xmm1
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
   .byte  255,224                             // jmpq          *%rax
   .byte  102,144                             // xchg          %ax,%ax
-  .byte  125,255                             // jge           389a9 <_sk_load_a8_sse2_lowp+0xb2>
+  .byte  125,255                             // jge           381d9 <_sk_load_a8_sse2_lowp+0xb2>
   .byte  255                                 // (bad)
   .byte  255,163,255,255,255,148             // jmpq          *-0x6b000001(%rbx)
   .byte  255                                 // (bad)
@@ -56245,19 +55884,19 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            389fd <_sk_load_a8_dst_sse2_lowp+0x39>
+  .byte  119,34                              // ja            3822d <_sk_load_a8_dst_sse2_lowp+0x39>
   .byte  102,15,239,255                      // pxor          %xmm7,%xmm7
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,139,0,0,0                 // lea           0x8b(%rip),%r9        # 38a74 <_sk_load_a8_dst_sse2_lowp+0xb0>
+  .byte  76,141,13,139,0,0,0                 // lea           0x8b(%rip),%r9        # 382a4 <_sk_load_a8_dst_sse2_lowp+0xb0>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,248                      // movd          %eax,%xmm7
-  .byte  235,97                              // jmp           38a5e <_sk_load_a8_dst_sse2_lowp+0x9a>
+  .byte  235,97                              // jmp           3828e <_sk_load_a8_dst_sse2_lowp+0x9a>
   .byte  243,65,15,126,60,16                 // movq          (%r8,%rdx,1),%xmm7
   .byte  102,15,96,248                       // punpcklbw     %xmm0,%xmm7
-  .byte  235,85                              // jmp           38a5e <_sk_load_a8_dst_sse2_lowp+0x9a>
+  .byte  235,85                              // jmp           3828e <_sk_load_a8_dst_sse2_lowp+0x9a>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,239,255                      // pxor          %xmm7,%xmm7
   .byte  102,15,196,248,2                    // pinsrw        $0x2,%eax,%xmm7
@@ -56265,7 +55904,7 @@
   .byte  102,15,110,224                      // movd          %eax,%xmm4
   .byte  102,15,96,224                       // punpcklbw     %xmm0,%xmm4
   .byte  243,15,16,252                       // movss         %xmm4,%xmm7
-  .byte  235,51                              // jmp           38a5e <_sk_load_a8_dst_sse2_lowp+0x9a>
+  .byte  235,51                              // jmp           3828e <_sk_load_a8_dst_sse2_lowp+0x9a>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,15,239,255                      // pxor          %xmm7,%xmm7
   .byte  102,15,196,248,6                    // pinsrw        $0x6,%eax,%xmm7
@@ -56276,14 +55915,14 @@
   .byte  102,65,15,110,36,16                 // movd          (%r8,%rdx,1),%xmm4
   .byte  102,15,96,224                       // punpcklbw     %xmm0,%xmm4
   .byte  242,15,16,252                       // movsd         %xmm4,%xmm7
-  .byte  102,15,219,61,170,42,0,0            // pand          0x2aaa(%rip),%xmm7        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,15,219,61,186,42,0,0            // pand          0x2aba(%rip),%xmm7        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,87,228                           // xorps         %xmm4,%xmm4
   .byte  15,87,237                           // xorps         %xmm5,%xmm5
   .byte  15,87,246                           // xorps         %xmm6,%xmm6
   .byte  255,224                             // jmpq          *%rax
   .byte  144                                 // nop
-  .byte  126,255                             // jle           38a75 <_sk_load_a8_dst_sse2_lowp+0xb1>
+  .byte  126,255                             // jle           382a5 <_sk_load_a8_dst_sse2_lowp+0xb1>
   .byte  255                                 // (bad)
   .byte  255,164,255,255,255,149,255         // jmpq          *-0x6a0001(%rdi,%rdi,8)
   .byte  255                                 // (bad)
@@ -56313,42 +55952,42 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,29                              // ja            38ac4 <_sk_store_a8_sse2_lowp+0x34>
+  .byte  119,29                              // ja            382f4 <_sk_store_a8_sse2_lowp+0x34>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,147,0,0,0                 // lea           0x93(%rip),%r9        # 38b44 <_sk_store_a8_sse2_lowp+0xb4>
+  .byte  76,141,13,147,0,0,0                 // lea           0x93(%rip),%r9        # 38374 <_sk_store_a8_sse2_lowp+0xb4>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,15,126,216                      // movd          %xmm3,%eax
   .byte  65,136,4,16                         // mov           %al,(%r8,%rdx,1)
-  .byte  235,123                             // jmp           38b3f <_sk_store_a8_sse2_lowp+0xaf>
-  .byte  102,68,15,111,5,67,42,0,0           // movdqa        0x2a43(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  235,123                             // jmp           3836f <_sk_store_a8_sse2_lowp+0xaf>
+  .byte  102,68,15,111,5,83,42,0,0           // movdqa        0x2a53(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,68,15,219,195                   // pand          %xmm3,%xmm8
   .byte  102,69,15,103,192                   // packuswb      %xmm8,%xmm8
   .byte  102,69,15,214,4,16                  // movq          %xmm8,(%r8,%rdx,1)
-  .byte  235,96                              // jmp           38b3f <_sk_store_a8_sse2_lowp+0xaf>
+  .byte  235,96                              // jmp           3836f <_sk_store_a8_sse2_lowp+0xaf>
   .byte  102,15,197,195,2                    // pextrw        $0x2,%xmm3,%eax
   .byte  65,136,68,16,2                      // mov           %al,0x2(%r8,%rdx,1)
-  .byte  102,68,15,111,5,30,42,0,0           // movdqa        0x2a1e(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,5,46,42,0,0           // movdqa        0x2a2e(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,68,15,219,195                   // pand          %xmm3,%xmm8
   .byte  102,69,15,103,192                   // packuswb      %xmm8,%xmm8
   .byte  102,68,15,126,192                   // movd          %xmm8,%eax
   .byte  102,65,137,4,16                     // mov           %ax,(%r8,%rdx,1)
-  .byte  235,55                              // jmp           38b3f <_sk_store_a8_sse2_lowp+0xaf>
+  .byte  235,55                              // jmp           3836f <_sk_store_a8_sse2_lowp+0xaf>
   .byte  102,15,197,195,6                    // pextrw        $0x6,%xmm3,%eax
   .byte  65,136,68,16,6                      // mov           %al,0x6(%r8,%rdx,1)
   .byte  102,15,197,195,5                    // pextrw        $0x5,%xmm3,%eax
   .byte  65,136,68,16,5                      // mov           %al,0x5(%r8,%rdx,1)
   .byte  102,15,197,195,4                    // pextrw        $0x4,%xmm3,%eax
   .byte  65,136,68,16,4                      // mov           %al,0x4(%r8,%rdx,1)
-  .byte  102,68,15,111,5,225,41,0,0          // movdqa        0x29e1(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,5,241,41,0,0          // movdqa        0x29f1(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,68,15,219,195                   // pand          %xmm3,%xmm8
   .byte  102,69,15,103,192                   // packuswb      %xmm8,%xmm8
   .byte  102,69,15,126,4,16                  // movd          %xmm8,(%r8,%rdx,1)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  144                                 // nop
-  .byte  118,255                             // jbe           38b45 <_sk_store_a8_sse2_lowp+0xb5>
+  .byte  118,255                             // jbe           38375 <_sk_store_a8_sse2_lowp+0xb5>
   .byte  255                                 // (bad)
   .byte  255,165,255,255,255,155             // jmpq          *-0x64000001(%rbp)
   .byte  255                                 // (bad)
@@ -56473,19 +56112,19 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            38d01 <_sk_load_g8_sse2_lowp+0x39>
+  .byte  119,34                              // ja            38531 <_sk_load_g8_sse2_lowp+0x39>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,147,0,0,0                 // lea           0x93(%rip),%r9        # 38d80 <_sk_load_g8_sse2_lowp+0xb8>
+  .byte  76,141,13,147,0,0,0                 // lea           0x93(%rip),%r9        # 385b0 <_sk_load_g8_sse2_lowp+0xb8>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
-  .byte  235,97                              // jmp           38d62 <_sk_load_g8_sse2_lowp+0x9a>
+  .byte  235,97                              // jmp           38592 <_sk_load_g8_sse2_lowp+0x9a>
   .byte  243,65,15,126,4,16                  // movq          (%r8,%rdx,1),%xmm0
   .byte  102,15,96,192                       // punpcklbw     %xmm0,%xmm0
-  .byte  235,85                              // jmp           38d62 <_sk_load_g8_sse2_lowp+0x9a>
+  .byte  235,85                              // jmp           38592 <_sk_load_g8_sse2_lowp+0x9a>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,15,196,192,2                    // pinsrw        $0x2,%eax,%xmm0
@@ -56493,7 +56132,7 @@
   .byte  102,15,110,200                      // movd          %eax,%xmm1
   .byte  102,15,96,200                       // punpcklbw     %xmm0,%xmm1
   .byte  243,15,16,193                       // movss         %xmm1,%xmm0
-  .byte  235,51                              // jmp           38d62 <_sk_load_g8_sse2_lowp+0x9a>
+  .byte  235,51                              // jmp           38592 <_sk_load_g8_sse2_lowp+0x9a>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,15,196,192,6                    // pinsrw        $0x6,%eax,%xmm0
@@ -56504,14 +56143,14 @@
   .byte  102,65,15,110,12,16                 // movd          (%r8,%rdx,1),%xmm1
   .byte  102,15,96,200                       // punpcklbw     %xmm0,%xmm1
   .byte  242,15,16,193                       // movsd         %xmm1,%xmm0
-  .byte  102,15,219,5,166,39,0,0             // pand          0x27a6(%rip),%xmm0        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,15,219,5,182,39,0,0             // pand          0x27b6(%rip),%xmm0        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,157,39,0,0                 // movaps        0x279d(%rip),%xmm3        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  15,40,29,173,39,0,0                 // movaps        0x27ad(%rip),%xmm3        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
   .byte  102,15,111,208                      // movdqa        %xmm0,%xmm2
   .byte  255,224                             // jmpq          *%rax
   .byte  15,31,0                             // nopl          (%rax)
-  .byte  118,255                             // jbe           38d81 <_sk_load_g8_sse2_lowp+0xb9>
+  .byte  118,255                             // jbe           385b1 <_sk_load_g8_sse2_lowp+0xb9>
   .byte  255                                 // (bad)
   .byte  255,156,255,255,255,141,255         // lcall         *-0x720001(%rdi,%rdi,8)
   .byte  255                                 // (bad)
@@ -56539,19 +56178,19 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            38dd5 <_sk_load_g8_dst_sse2_lowp+0x39>
+  .byte  119,34                              // ja            38605 <_sk_load_g8_dst_sse2_lowp+0x39>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,147,0,0,0                 // lea           0x93(%rip),%r9        # 38e54 <_sk_load_g8_dst_sse2_lowp+0xb8>
+  .byte  76,141,13,147,0,0,0                 // lea           0x93(%rip),%r9        # 38684 <_sk_load_g8_dst_sse2_lowp+0xb8>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
-  .byte  235,97                              // jmp           38e36 <_sk_load_g8_dst_sse2_lowp+0x9a>
+  .byte  235,97                              // jmp           38666 <_sk_load_g8_dst_sse2_lowp+0x9a>
   .byte  243,65,15,126,36,16                 // movq          (%r8,%rdx,1),%xmm4
   .byte  102,15,96,224                       // punpcklbw     %xmm0,%xmm4
-  .byte  235,85                              // jmp           38e36 <_sk_load_g8_dst_sse2_lowp+0x9a>
+  .byte  235,85                              // jmp           38666 <_sk_load_g8_dst_sse2_lowp+0x9a>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,15,196,224,2                    // pinsrw        $0x2,%eax,%xmm4
@@ -56559,7 +56198,7 @@
   .byte  102,15,110,232                      // movd          %eax,%xmm5
   .byte  102,15,96,232                       // punpcklbw     %xmm0,%xmm5
   .byte  243,15,16,229                       // movss         %xmm5,%xmm4
-  .byte  235,51                              // jmp           38e36 <_sk_load_g8_dst_sse2_lowp+0x9a>
+  .byte  235,51                              // jmp           38666 <_sk_load_g8_dst_sse2_lowp+0x9a>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,15,196,224,6                    // pinsrw        $0x6,%eax,%xmm4
@@ -56570,14 +56209,14 @@
   .byte  102,65,15,110,44,16                 // movd          (%r8,%rdx,1),%xmm5
   .byte  102,15,96,232                       // punpcklbw     %xmm0,%xmm5
   .byte  242,15,16,229                       // movsd         %xmm5,%xmm4
-  .byte  102,15,219,37,210,38,0,0            // pand          0x26d2(%rip),%xmm4        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,15,219,37,226,38,0,0            // pand          0x26e2(%rip),%xmm4        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,61,201,38,0,0                 // movaps        0x26c9(%rip),%xmm7        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  15,40,61,217,38,0,0                 // movaps        0x26d9(%rip),%xmm7        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,111,236                      // movdqa        %xmm4,%xmm5
   .byte  102,15,111,244                      // movdqa        %xmm4,%xmm6
   .byte  255,224                             // jmpq          *%rax
   .byte  15,31,0                             // nopl          (%rax)
-  .byte  118,255                             // jbe           38e55 <_sk_load_g8_dst_sse2_lowp+0xb9>
+  .byte  118,255                             // jbe           38685 <_sk_load_g8_dst_sse2_lowp+0xb9>
   .byte  255                                 // (bad)
   .byte  255,156,255,255,255,141,255         // lcall         *-0x720001(%rdi,%rdi,8)
   .byte  255                                 // (bad)
@@ -56598,10 +56237,10 @@
 FUNCTION(_sk_luminance_to_alpha_sse2_lowp)
 _sk_luminance_to_alpha_sse2_lowp:
   .byte  102,15,111,218                      // movdqa        %xmm2,%xmm3
-  .byte  102,15,213,5,180,46,0,0             // pmullw        0x2eb4(%rip),%xmm0        # 3bd30 <_sk_srcover_bgra_8888_sse2_lowp+0x1464>
-  .byte  102,15,213,13,188,46,0,0            // pmullw        0x2ebc(%rip),%xmm1        # 3bd40 <_sk_srcover_bgra_8888_sse2_lowp+0x1474>
+  .byte  102,15,213,5,196,46,0,0             // pmullw        0x2ec4(%rip),%xmm0        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0x1474>
+  .byte  102,15,213,13,204,46,0,0            // pmullw        0x2ecc(%rip),%xmm1        # 3b580 <_sk_srcover_bgra_8888_sse2_lowp+0x1484>
   .byte  102,15,253,200                      // paddw         %xmm0,%xmm1
-  .byte  102,15,213,29,192,46,0,0            // pmullw        0x2ec0(%rip),%xmm3        # 3bd50 <_sk_srcover_bgra_8888_sse2_lowp+0x1484>
+  .byte  102,15,213,29,208,46,0,0            // pmullw        0x2ed0(%rip),%xmm3        # 3b590 <_sk_srcover_bgra_8888_sse2_lowp+0x1494>
   .byte  102,15,253,217                      // paddw         %xmm1,%xmm3
   .byte  102,15,113,211,8                    // psrlw         $0x8,%xmm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -56694,7 +56333,7 @@
   .byte  102,15,196,197,3                    // pinsrw        $0x3,%ebp,%xmm0
   .byte  102,65,15,96,192                    // punpcklbw     %xmm8,%xmm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,14,37,0,0                  // movaps        0x250e(%rip),%xmm3        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  15,40,29,30,37,0,0                  // movaps        0x251e(%rip),%xmm3        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
   .byte  102,15,111,208                      // movdqa        %xmm0,%xmm2
   .byte  91                                  // pop           %rbx
@@ -56710,14 +56349,14 @@
 _sk_scale_1_float_sse2_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  243,68,15,16,0                      // movss         (%rax),%xmm8
-  .byte  243,68,15,89,5,132,27,0,0           // mulss         0x1b84(%rip),%xmm8        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
-  .byte  243,68,15,88,5,75,27,0,0            // addss         0x1b4b(%rip),%xmm8        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  243,68,15,89,5,132,27,0,0           // mulss         0x1b84(%rip),%xmm8        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  243,68,15,88,5,75,27,0,0            // addss         0x1b4b(%rip),%xmm8        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  243,65,15,44,192                    // cvttss2si     %xmm8,%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  242,69,15,112,192,0                 // pshuflw       $0x0,%xmm8,%xmm8
   .byte  102,69,15,112,192,80                // pshufd        $0x50,%xmm8,%xmm8
   .byte  102,65,15,213,192                   // pmullw        %xmm8,%xmm0
-  .byte  102,68,15,111,13,191,36,0,0         // movdqa        0x24bf(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,207,36,0,0         // movdqa        0x24cf(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,193                   // paddw         %xmm9,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,65,15,213,200                   // pmullw        %xmm8,%xmm1
@@ -56738,13 +56377,13 @@
 _sk_lerp_1_float_sse2_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  243,68,15,16,0                      // movss         (%rax),%xmm8
-  .byte  243,68,15,89,5,12,27,0,0            // mulss         0x1b0c(%rip),%xmm8        # 3aba8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
-  .byte  243,68,15,88,5,211,26,0,0           // addss         0x1ad3(%rip),%xmm8        # 3ab78 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  .byte  243,68,15,89,5,12,27,0,0            // mulss         0x1b0c(%rip),%xmm8        # 3a3d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  .byte  243,68,15,88,5,211,26,0,0           // addss         0x1ad3(%rip),%xmm8        # 3a3a8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   .byte  243,65,15,44,192                    // cvttss2si     %xmm8,%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  242,69,15,112,192,0                 // pshuflw       $0x0,%xmm8,%xmm8
   .byte  102,69,15,112,192,80                // pshufd        $0x50,%xmm8,%xmm8
-  .byte  102,68,15,111,13,76,36,0,0          // movdqa        0x244c(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,92,36,0,0          // movdqa        0x245c(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,213,192                   // pmullw        %xmm8,%xmm0
   .byte  102,65,15,253,193                   // paddw         %xmm9,%xmm0
   .byte  102,65,15,213,200                   // pmullw        %xmm8,%xmm1
@@ -56784,19 +56423,19 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,36                              // ja            3917b <_sk_scale_u8_sse2_lowp+0x3b>
+  .byte  119,36                              // ja            389ab <_sk_scale_u8_sse2_lowp+0x3b>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,218,0,0,0                 // lea           0xda(%rip),%r9        # 39240 <_sk_scale_u8_sse2_lowp+0x100>
+  .byte  76,141,13,218,0,0,0                 // lea           0xda(%rip),%r9        # 38a70 <_sk_scale_u8_sse2_lowp+0x100>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
-  .byte  235,109                             // jmp           391e8 <_sk_scale_u8_sse2_lowp+0xa8>
+  .byte  235,109                             // jmp           38a18 <_sk_scale_u8_sse2_lowp+0xa8>
   .byte  243,69,15,126,4,16                  // movq          (%r8,%rdx,1),%xmm8
   .byte  102,68,15,96,192                    // punpcklbw     %xmm0,%xmm8
-  .byte  235,96                              // jmp           391e8 <_sk_scale_u8_sse2_lowp+0xa8>
+  .byte  235,96                              // jmp           38a18 <_sk_scale_u8_sse2_lowp+0xa8>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  102,68,15,196,192,2                 // pinsrw        $0x2,%eax,%xmm8
@@ -56804,7 +56443,7 @@
   .byte  102,68,15,110,200                   // movd          %eax,%xmm9
   .byte  102,68,15,96,200                    // punpcklbw     %xmm0,%xmm9
   .byte  243,69,15,16,193                    // movss         %xmm9,%xmm8
-  .byte  235,57                              // jmp           391e8 <_sk_scale_u8_sse2_lowp+0xa8>
+  .byte  235,57                              // jmp           38a18 <_sk_scale_u8_sse2_lowp+0xa8>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  102,68,15,196,192,6                 // pinsrw        $0x6,%eax,%xmm8
@@ -56815,9 +56454,9 @@
   .byte  102,69,15,110,12,16                 // movd          (%r8,%rdx,1),%xmm9
   .byte  102,68,15,96,200                    // punpcklbw     %xmm0,%xmm9
   .byte  242,69,15,16,193                    // movsd         %xmm9,%xmm8
-  .byte  102,68,15,219,5,31,35,0,0           // pand          0x231f(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,219,5,47,35,0,0           // pand          0x232f(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,213,192                   // pmullw        %xmm8,%xmm0
-  .byte  102,68,15,111,13,17,35,0,0          // movdqa        0x2311(%rip),%xmm9        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,13,33,35,0,0          // movdqa        0x2321(%rip),%xmm9        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,253,193                   // paddw         %xmm9,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,65,15,213,200                   // pmullw        %xmm8,%xmm1
@@ -56859,19 +56498,19 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,36                              // ja            39297 <_sk_lerp_u8_sse2_lowp+0x3b>
+  .byte  119,36                              // ja            38ac7 <_sk_lerp_u8_sse2_lowp+0x3b>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,30,1,0,0                  // lea           0x11e(%rip),%r9        # 393a0 <_sk_lerp_u8_sse2_lowp+0x144>
+  .byte  76,141,13,30,1,0,0                  // lea           0x11e(%rip),%r9        # 38bd0 <_sk_lerp_u8_sse2_lowp+0x144>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
-  .byte  235,109                             // jmp           39304 <_sk_lerp_u8_sse2_lowp+0xa8>
+  .byte  235,109                             // jmp           38b34 <_sk_lerp_u8_sse2_lowp+0xa8>
   .byte  243,69,15,126,4,16                  // movq          (%r8,%rdx,1),%xmm8
   .byte  102,68,15,96,192                    // punpcklbw     %xmm0,%xmm8
-  .byte  235,96                              // jmp           39304 <_sk_lerp_u8_sse2_lowp+0xa8>
+  .byte  235,96                              // jmp           38b34 <_sk_lerp_u8_sse2_lowp+0xa8>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  102,68,15,196,192,2                 // pinsrw        $0x2,%eax,%xmm8
@@ -56879,7 +56518,7 @@
   .byte  102,68,15,110,200                   // movd          %eax,%xmm9
   .byte  102,68,15,96,200                    // punpcklbw     %xmm0,%xmm9
   .byte  243,69,15,16,193                    // movss         %xmm9,%xmm8
-  .byte  235,57                              // jmp           39304 <_sk_lerp_u8_sse2_lowp+0xa8>
+  .byte  235,57                              // jmp           38b34 <_sk_lerp_u8_sse2_lowp+0xa8>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  102,68,15,196,192,6                 // pinsrw        $0x6,%eax,%xmm8
@@ -56890,8 +56529,8 @@
   .byte  102,69,15,110,12,16                 // movd          (%r8,%rdx,1),%xmm9
   .byte  102,68,15,96,200                    // punpcklbw     %xmm0,%xmm9
   .byte  242,69,15,16,193                    // movsd         %xmm9,%xmm8
-  .byte  102,68,15,219,5,3,34,0,0            // pand          0x2203(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
-  .byte  102,68,15,111,21,250,33,0,0         // movdqa        0x21fa(%rip),%xmm10        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,219,5,19,34,0,0           // pand          0x2213(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
+  .byte  102,68,15,111,21,10,34,0,0          // movdqa        0x220a(%rip),%xmm10        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,69,15,111,200                   // movdqa        %xmm8,%xmm9
   .byte  102,69,15,239,202                   // pxor          %xmm10,%xmm9
   .byte  102,69,15,111,217                   // movdqa        %xmm9,%xmm11
@@ -56921,9 +56560,9 @@
   .byte  102,65,15,111,216                   // movdqa        %xmm8,%xmm3
   .byte  255,224                             // jmpq          *%rax
   .byte  15,31,0                             // nopl          (%rax)
-  .byte  235,254                             // jmp           393a0 <_sk_lerp_u8_sse2_lowp+0x144>
+  .byte  235,254                             // jmp           38bd0 <_sk_lerp_u8_sse2_lowp+0x144>
   .byte  255                                 // (bad)
-  .byte  255,21,255,255,255,4                // callq         *0x4ffffff(%rip)        # 50393a8 <_sk_srcover_bgra_8888_sse2_lowp+0x4ffeadc>
+  .byte  255,21,255,255,255,4                // callq         *0x4ffffff(%rip)        # 5038bd8 <_sk_srcover_bgra_8888_sse2_lowp+0x4ffeadc>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,84,255,255                      // callq         *-0x1(%rdi,%rdi,8)
@@ -56953,23 +56592,23 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            39407 <_sk_scale_565_sse2_lowp+0x4b>
+  .byte  119,34                              // ja            38c37 <_sk_scale_565_sse2_lowp+0x4b>
   .byte  102,15,239,246                      // pxor          %xmm6,%xmm6
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,229,1,0,0                 // lea           0x1e5(%rip),%r9        # 395d8 <_sk_scale_565_sse2_lowp+0x21c>
+  .byte  76,141,13,229,1,0,0                 // lea           0x1e5(%rip),%r9        # 38e08 <_sk_scale_565_sse2_lowp+0x21c>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,15,110,240                      // movd          %eax,%xmm6
-  .byte  235,67                              // jmp           3944a <_sk_scale_565_sse2_lowp+0x8e>
+  .byte  235,67                              // jmp           38c7a <_sk_scale_565_sse2_lowp+0x8e>
   .byte  243,65,15,111,52,80                 // movdqu        (%r8,%rdx,2),%xmm6
-  .byte  235,59                              // jmp           3944a <_sk_scale_565_sse2_lowp+0x8e>
+  .byte  235,59                              // jmp           38c7a <_sk_scale_565_sse2_lowp+0x8e>
   .byte  102,15,239,246                      // pxor          %xmm6,%xmm6
   .byte  102,65,15,196,116,80,4,2            // pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm6
   .byte  243,69,15,16,12,80                  // movss         (%r8,%rdx,2),%xmm9
   .byte  243,65,15,16,241                    // movss         %xmm9,%xmm6
-  .byte  235,34                              // jmp           3944a <_sk_scale_565_sse2_lowp+0x8e>
+  .byte  235,34                              // jmp           38c7a <_sk_scale_565_sse2_lowp+0x8e>
   .byte  102,15,239,246                      // pxor          %xmm6,%xmm6
   .byte  102,65,15,196,116,80,12,6           // pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm6
   .byte  102,65,15,196,116,80,10,5           // pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm6
@@ -56977,11 +56616,11 @@
   .byte  102,65,15,18,52,80                  // movlpd        (%r8,%rdx,2),%xmm6
   .byte  102,68,15,111,222                   // movdqa        %xmm6,%xmm11
   .byte  102,65,15,113,211,8                 // psrlw         $0x8,%xmm11
-  .byte  102,68,15,219,29,66,40,0,0          // pand          0x2842(%rip),%xmm11        # 3bca0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d4>
+  .byte  102,68,15,219,29,82,40,0,0          // pand          0x2852(%rip),%xmm11        # 3b4e0 <_sk_srcover_bgra_8888_sse2_lowp+0x13e4>
   .byte  102,68,15,111,206                   // movdqa        %xmm6,%xmm9
   .byte  102,65,15,113,209,5                 // psrlw         $0x5,%xmm9
-  .byte  102,68,15,219,13,62,40,0,0          // pand          0x283e(%rip),%xmm9        # 3bcb0 <_sk_srcover_bgra_8888_sse2_lowp+0x13e4>
-  .byte  102,68,15,111,21,69,40,0,0          // movdqa        0x2845(%rip),%xmm10        # 3bcc0 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  .byte  102,68,15,219,13,78,40,0,0          // pand          0x284e(%rip),%xmm9        # 3b4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  .byte  102,68,15,111,21,85,40,0,0          // movdqa        0x2855(%rip),%xmm10        # 3b500 <_sk_srcover_bgra_8888_sse2_lowp+0x1404>
   .byte  102,68,15,219,214                   // pand          %xmm6,%xmm10
   .byte  102,15,113,214,13                   // psrlw         $0xd,%xmm6
   .byte  102,65,15,235,243                   // por           %xmm11,%xmm6
@@ -56993,7 +56632,7 @@
   .byte  102,65,15,113,243,3                 // psllw         $0x3,%xmm11
   .byte  102,65,15,113,210,2                 // psrlw         $0x2,%xmm10
   .byte  102,69,15,235,211                   // por           %xmm11,%xmm10
-  .byte  102,68,15,111,37,161,39,0,0         // movdqa        0x27a1(%rip),%xmm12        # 3bc60 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
+  .byte  102,68,15,111,37,177,39,0,0         // movdqa        0x27b1(%rip),%xmm12        # 3b4a0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
   .byte  102,68,15,111,235                   // movdqa        %xmm3,%xmm13
   .byte  102,69,15,239,236                   // pxor          %xmm12,%xmm13
   .byte  102,68,15,111,223                   // movdqa        %xmm7,%xmm11
@@ -57034,7 +56673,7 @@
   .byte  102,68,15,213,201                   // pmullw        %xmm1,%xmm9
   .byte  102,68,15,213,210                   // pmullw        %xmm2,%xmm10
   .byte  102,68,15,213,219                   // pmullw        %xmm3,%xmm11
-  .byte  102,15,111,5,131,31,0,0             // movdqa        0x1f83(%rip),%xmm0        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,15,111,5,147,31,0,0             // movdqa        0x1f93(%rip),%xmm0        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,253,240                      // paddw         %xmm0,%xmm6
   .byte  102,68,15,253,200                   // paddw         %xmm0,%xmm9
   .byte  102,68,15,253,208                   // paddw         %xmm0,%xmm10
@@ -57081,23 +56720,23 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            3963f <_sk_lerp_565_sse2_lowp+0x4b>
+  .byte  119,34                              // ja            38e6f <_sk_lerp_565_sse2_lowp+0x4b>
   .byte  102,15,239,210                      // pxor          %xmm2,%xmm2
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,45,2,0,0                  // lea           0x22d(%rip),%r9        # 39858 <_sk_lerp_565_sse2_lowp+0x264>
+  .byte  76,141,13,45,2,0,0                  // lea           0x22d(%rip),%r9        # 39088 <_sk_lerp_565_sse2_lowp+0x264>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,15,110,208                      // movd          %eax,%xmm2
-  .byte  235,67                              // jmp           39682 <_sk_lerp_565_sse2_lowp+0x8e>
+  .byte  235,67                              // jmp           38eb2 <_sk_lerp_565_sse2_lowp+0x8e>
   .byte  243,65,15,111,20,80                 // movdqu        (%r8,%rdx,2),%xmm2
-  .byte  235,59                              // jmp           39682 <_sk_lerp_565_sse2_lowp+0x8e>
+  .byte  235,59                              // jmp           38eb2 <_sk_lerp_565_sse2_lowp+0x8e>
   .byte  102,15,239,210                      // pxor          %xmm2,%xmm2
   .byte  102,65,15,196,84,80,4,2             // pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm2
   .byte  243,69,15,16,12,80                  // movss         (%r8,%rdx,2),%xmm9
   .byte  243,65,15,16,209                    // movss         %xmm9,%xmm2
-  .byte  235,34                              // jmp           39682 <_sk_lerp_565_sse2_lowp+0x8e>
+  .byte  235,34                              // jmp           38eb2 <_sk_lerp_565_sse2_lowp+0x8e>
   .byte  102,15,239,210                      // pxor          %xmm2,%xmm2
   .byte  102,65,15,196,84,80,12,6            // pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm2
   .byte  102,65,15,196,84,80,10,5            // pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm2
@@ -57105,11 +56744,11 @@
   .byte  102,65,15,18,20,80                  // movlpd        (%r8,%rdx,2),%xmm2
   .byte  102,68,15,111,218                   // movdqa        %xmm2,%xmm11
   .byte  102,65,15,113,211,8                 // psrlw         $0x8,%xmm11
-  .byte  102,68,15,219,29,10,38,0,0          // pand          0x260a(%rip),%xmm11        # 3bca0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d4>
+  .byte  102,68,15,219,29,26,38,0,0          // pand          0x261a(%rip),%xmm11        # 3b4e0 <_sk_srcover_bgra_8888_sse2_lowp+0x13e4>
   .byte  102,68,15,111,202                   // movdqa        %xmm2,%xmm9
   .byte  102,65,15,113,209,5                 // psrlw         $0x5,%xmm9
-  .byte  102,68,15,219,13,6,38,0,0           // pand          0x2606(%rip),%xmm9        # 3bcb0 <_sk_srcover_bgra_8888_sse2_lowp+0x13e4>
-  .byte  102,68,15,111,21,13,38,0,0          // movdqa        0x260d(%rip),%xmm10        # 3bcc0 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  .byte  102,68,15,219,13,22,38,0,0          // pand          0x2616(%rip),%xmm9        # 3b4f0 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  .byte  102,68,15,111,21,29,38,0,0          // movdqa        0x261d(%rip),%xmm10        # 3b500 <_sk_srcover_bgra_8888_sse2_lowp+0x1404>
   .byte  102,68,15,219,210                   // pand          %xmm2,%xmm10
   .byte  102,15,113,210,13                   // psrlw         $0xd,%xmm2
   .byte  102,65,15,235,211                   // por           %xmm11,%xmm2
@@ -57121,7 +56760,7 @@
   .byte  102,65,15,113,243,3                 // psllw         $0x3,%xmm11
   .byte  102,65,15,113,210,2                 // psrlw         $0x2,%xmm10
   .byte  102,69,15,235,211                   // por           %xmm11,%xmm10
-  .byte  102,68,15,111,37,105,37,0,0         // movdqa        0x2569(%rip),%xmm12        # 3bc60 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
+  .byte  102,68,15,111,37,121,37,0,0         // movdqa        0x2579(%rip),%xmm12        # 3b4a0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
   .byte  102,68,15,111,235                   // movdqa        %xmm3,%xmm13
   .byte  102,69,15,239,236                   // pxor          %xmm12,%xmm13
   .byte  102,68,15,111,223                   // movdqa        %xmm7,%xmm11
@@ -57160,7 +56799,7 @@
   .byte  102,69,15,235,222                   // por           %xmm14,%xmm11
   .byte  102,15,111,194                      // movdqa        %xmm2,%xmm0
   .byte  102,15,213,209                      // pmullw        %xmm1,%xmm2
-  .byte  102,68,15,111,5,85,29,0,0           // movdqa        0x1d55(%rip),%xmm8        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,5,101,29,0,0          // movdqa        0x1d65(%rip),%xmm8        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,65,15,239,192                   // pxor          %xmm8,%xmm0
   .byte  102,15,213,196                      // pmullw        %xmm4,%xmm0
   .byte  102,65,15,253,208                   // paddw         %xmm8,%xmm2
@@ -57222,7 +56861,7 @@
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  65,15,95,200                        // maxps         %xmm8,%xmm1
   .byte  65,15,95,192                        // maxps         %xmm8,%xmm0
-  .byte  68,15,40,5,232,28,0,0               // movaps        0x1ce8(%rip),%xmm8        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,5,248,28,0,0               // movaps        0x1cf8(%rip),%xmm8        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  65,15,93,192                        // minps         %xmm8,%xmm0
   .byte  65,15,93,200                        // minps         %xmm8,%xmm1
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -57240,7 +56879,7 @@
   .byte  69,15,194,208,1                     // cmpltps       %xmm8,%xmm10
   .byte  68,15,40,216                        // movaps        %xmm0,%xmm11
   .byte  69,15,194,217,1                     // cmpltps       %xmm9,%xmm11
-  .byte  68,15,40,37,176,28,0,0              // movaps        0x1cb0(%rip),%xmm12        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,37,192,28,0,0              // movaps        0x1cc0(%rip),%xmm12        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,84,220                        // andps         %xmm12,%xmm11
   .byte  69,15,84,212                        // andps         %xmm12,%xmm10
   .byte  69,15,87,237                        // xorps         %xmm13,%xmm13
@@ -57259,10 +56898,10 @@
 .globl _sk_mirror_x_1_sse2_lowp
 FUNCTION(_sk_mirror_x_1_sse2_lowp)
 _sk_mirror_x_1_sse2_lowp:
-  .byte  68,15,40,5,216,28,0,0               // movaps        0x1cd8(%rip),%xmm8        # 3b5d0 <_sk_srcover_bgra_8888_sse2_lowp+0xd04>
+  .byte  68,15,40,5,232,28,0,0               // movaps        0x1ce8(%rip),%xmm8        # 3ae10 <_sk_srcover_bgra_8888_sse2_lowp+0xd14>
   .byte  65,15,88,192                        // addps         %xmm8,%xmm0
   .byte  65,15,88,200                        // addps         %xmm8,%xmm1
-  .byte  68,15,40,21,88,28,0,0               // movaps        0x1c58(%rip),%xmm10        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  68,15,40,21,104,28,0,0              // movaps        0x1c68(%rip),%xmm10        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  68,15,40,217                        // movaps        %xmm1,%xmm11
   .byte  69,15,89,218                        // mulps         %xmm10,%xmm11
   .byte  68,15,89,208                        // mulps         %xmm0,%xmm10
@@ -57272,7 +56911,7 @@
   .byte  69,15,91,233                        // cvtdq2ps      %xmm9,%xmm13
   .byte  69,15,194,213,1                     // cmpltps       %xmm13,%xmm10
   .byte  69,15,194,220,1                     // cmpltps       %xmm12,%xmm11
-  .byte  68,15,40,13,56,28,0,0               // movaps        0x1c38(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,13,72,28,0,0               // movaps        0x1c48(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,84,217                        // andps         %xmm9,%xmm11
   .byte  69,15,84,209                        // andps         %xmm9,%xmm10
   .byte  69,15,87,246                        // xorps         %xmm14,%xmm14
@@ -57284,7 +56923,7 @@
   .byte  65,15,92,204                        // subps         %xmm12,%xmm1
   .byte  65,15,88,200                        // addps         %xmm8,%xmm1
   .byte  65,15,88,192                        // addps         %xmm8,%xmm0
-  .byte  68,15,40,5,36,33,0,0                // movaps        0x2124(%rip),%xmm8        # 3ba90 <_sk_srcover_bgra_8888_sse2_lowp+0x11c4>
+  .byte  68,15,40,5,52,33,0,0                // movaps        0x2134(%rip),%xmm8        # 3b2d0 <_sk_srcover_bgra_8888_sse2_lowp+0x11d4>
   .byte  65,15,84,192                        // andps         %xmm8,%xmm0
   .byte  65,15,84,200                        // andps         %xmm8,%xmm1
   .byte  65,15,95,206                        // maxps         %xmm14,%xmm1
@@ -57313,7 +56952,7 @@
   .byte  102,15,239,210                      // pxor          %xmm2,%xmm2
   .byte  73,131,248,2                        // cmp           $0x2,%r8
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
-  .byte  114,56                              // jb            399f4 <_sk_gradient_sse2_lowp+0x6c>
+  .byte  114,56                              // jb            39224 <_sk_gradient_sse2_lowp+0x6c>
   .byte  72,139,88,72                        // mov           0x48(%rax),%rbx
   .byte  73,255,200                          // dec           %r8
   .byte  72,131,195,4                        // add           $0x4,%rbx
@@ -57328,7 +56967,7 @@
   .byte  102,15,250,220                      // psubd         %xmm4,%xmm3
   .byte  72,131,195,4                        // add           $0x4,%rbx
   .byte  73,255,200                          // dec           %r8
-  .byte  117,219                             // jne           399cf <_sk_gradient_sse2_lowp+0x47>
+  .byte  117,219                             // jne           391ff <_sk_gradient_sse2_lowp+0x47>
   .byte  102,15,112,227,78                   // pshufd        $0x4e,%xmm3,%xmm4
   .byte  102,73,15,126,225                   // movq          %xmm4,%r9
   .byte  69,137,200                          // mov           %r9d,%r8d
@@ -57471,10 +57110,10 @@
   .byte  15,88,221                           // addps         %xmm5,%xmm3
   .byte  69,15,89,207                        // mulps         %xmm15,%xmm9
   .byte  68,15,88,204                        // addps         %xmm4,%xmm9
-  .byte  15,40,53,159,25,0,0                 // movaps        0x199f(%rip),%xmm6        # 3b650 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  .byte  15,40,53,175,25,0,0                 // movaps        0x19af(%rip),%xmm6        # 3ae90 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
   .byte  15,89,222                           // mulps         %xmm6,%xmm3
   .byte  68,15,89,206                        // mulps         %xmm6,%xmm9
-  .byte  15,40,37,161,24,0,0                 // movaps        0x18a1(%rip),%xmm4        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  15,40,37,177,24,0,0                 // movaps        0x18b1(%rip),%xmm4        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  68,15,88,204                        // addps         %xmm4,%xmm9
   .byte  15,88,220                           // addps         %xmm4,%xmm3
   .byte  243,15,91,219                       // cvttps2dq     %xmm3,%xmm3
@@ -57570,9 +57209,9 @@
   .byte  72,139,24                           // mov           (%rax),%rbx
   .byte  72,139,104,8                        // mov           0x8(%rax),%rbp
   .byte  72,255,203                          // dec           %rbx
-  .byte  120,7                               // js            39e38 <_sk_evenly_spaced_gradient_sse2_lowp+0x34>
+  .byte  120,7                               // js            39668 <_sk_evenly_spaced_gradient_sse2_lowp+0x34>
   .byte  243,72,15,42,211                    // cvtsi2ss      %rbx,%xmm2
-  .byte  235,21                              // jmp           39e4d <_sk_evenly_spaced_gradient_sse2_lowp+0x49>
+  .byte  235,21                              // jmp           3967d <_sk_evenly_spaced_gradient_sse2_lowp+0x49>
   .byte  73,137,216                          // mov           %rbx,%r8
   .byte  73,209,232                          // shr           %r8
   .byte  131,227,1                           // and           $0x1,%ebx
@@ -57727,10 +57366,10 @@
   .byte  15,40,68,36,176                     // movaps        -0x50(%rsp),%xmm0
   .byte  68,15,89,192                        // mulps         %xmm0,%xmm8
   .byte  68,15,88,193                        // addps         %xmm1,%xmm8
-  .byte  15,40,13,43,21,0,0                  // movaps        0x152b(%rip),%xmm1        # 3b650 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  .byte  15,40,13,59,21,0,0                  // movaps        0x153b(%rip),%xmm1        # 3ae90 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
   .byte  15,89,217                           // mulps         %xmm1,%xmm3
   .byte  68,15,89,193                        // mulps         %xmm1,%xmm8
-  .byte  15,40,13,45,20,0,0                  // movaps        0x142d(%rip),%xmm1        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  15,40,13,61,20,0,0                  // movaps        0x143d(%rip),%xmm1        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  68,15,88,193                        // addps         %xmm1,%xmm8
   .byte  15,88,217                           // addps         %xmm1,%xmm3
   .byte  243,15,91,219                       // cvttps2dq     %xmm3,%xmm3
@@ -57747,7 +57386,7 @@
   .byte  15,40,240                           // movaps        %xmm0,%xmm6
   .byte  68,15,89,206                        // mulps         %xmm6,%xmm9
   .byte  68,15,88,204                        // addps         %xmm4,%xmm9
-  .byte  15,40,5,207,20,0,0                  // movaps        0x14cf(%rip),%xmm0        # 3b650 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  .byte  15,40,5,223,20,0,0                  // movaps        0x14df(%rip),%xmm0        # 3ae90 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
   .byte  15,89,208                           // mulps         %xmm0,%xmm2
   .byte  68,15,89,200                        // mulps         %xmm0,%xmm9
   .byte  68,15,88,201                        // addps         %xmm1,%xmm9
@@ -57826,10 +57465,10 @@
   .byte  15,89,216                           // mulps         %xmm0,%xmm3
   .byte  65,15,88,216                        // addps         %xmm8,%xmm3
   .byte  65,15,88,208                        // addps         %xmm8,%xmm2
-  .byte  68,15,40,21,148,19,0,0              // movaps        0x1394(%rip),%xmm10        # 3b650 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  .byte  68,15,40,21,164,19,0,0              // movaps        0x13a4(%rip),%xmm10        # 3ae90 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
   .byte  65,15,89,210                        // mulps         %xmm10,%xmm2
   .byte  65,15,89,218                        // mulps         %xmm10,%xmm3
-  .byte  68,15,40,29,148,18,0,0              // movaps        0x1294(%rip),%xmm11        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  68,15,40,29,164,18,0,0              // movaps        0x12a4(%rip),%xmm11        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  65,15,88,219                        // addps         %xmm11,%xmm3
   .byte  65,15,88,211                        // addps         %xmm11,%xmm2
   .byte  243,15,91,210                       // cvttps2dq     %xmm2,%xmm2
@@ -57922,7 +57561,7 @@
   .byte  15,40,218                           // movaps        %xmm2,%xmm3
   .byte  15,40,209                           // movaps        %xmm1,%xmm2
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
-  .byte  68,15,40,37,72,22,0,0               // movaps        0x1648(%rip),%xmm12        # 3ba90 <_sk_srcover_bgra_8888_sse2_lowp+0x11c4>
+  .byte  68,15,40,37,88,22,0,0               // movaps        0x1658(%rip),%xmm12        # 3b2d0 <_sk_srcover_bgra_8888_sse2_lowp+0x11d4>
   .byte  68,15,40,194                        // movaps        %xmm2,%xmm8
   .byte  69,15,84,196                        // andps         %xmm12,%xmm8
   .byte  68,15,40,217                        // movaps        %xmm1,%xmm11
@@ -57956,26 +57595,26 @@
   .byte  69,15,89,246                        // mulps         %xmm14,%xmm14
   .byte  65,15,40,195                        // movaps        %xmm11,%xmm0
   .byte  15,89,192                           // mulps         %xmm0,%xmm0
-  .byte  68,15,40,37,43,22,0,0               // movaps        0x162b(%rip),%xmm12        # 3bb00 <_sk_srcover_bgra_8888_sse2_lowp+0x1234>
+  .byte  68,15,40,37,59,22,0,0               // movaps        0x163b(%rip),%xmm12        # 3b340 <_sk_srcover_bgra_8888_sse2_lowp+0x1244>
   .byte  68,15,40,232                        // movaps        %xmm0,%xmm13
   .byte  69,15,89,236                        // mulps         %xmm12,%xmm13
   .byte  69,15,89,230                        // mulps         %xmm14,%xmm12
-  .byte  68,15,40,61,39,22,0,0               // movaps        0x1627(%rip),%xmm15        # 3bb10 <_sk_srcover_bgra_8888_sse2_lowp+0x1244>
+  .byte  68,15,40,61,55,22,0,0               // movaps        0x1637(%rip),%xmm15        # 3b350 <_sk_srcover_bgra_8888_sse2_lowp+0x1254>
   .byte  69,15,88,231                        // addps         %xmm15,%xmm12
   .byte  69,15,88,239                        // addps         %xmm15,%xmm13
   .byte  68,15,89,232                        // mulps         %xmm0,%xmm13
   .byte  69,15,89,230                        // mulps         %xmm14,%xmm12
-  .byte  68,15,40,61,31,22,0,0               // movaps        0x161f(%rip),%xmm15        # 3bb20 <_sk_srcover_bgra_8888_sse2_lowp+0x1254>
+  .byte  68,15,40,61,47,22,0,0               // movaps        0x162f(%rip),%xmm15        # 3b360 <_sk_srcover_bgra_8888_sse2_lowp+0x1264>
   .byte  69,15,88,231                        // addps         %xmm15,%xmm12
   .byte  69,15,88,239                        // addps         %xmm15,%xmm13
   .byte  68,15,89,232                        // mulps         %xmm0,%xmm13
   .byte  69,15,89,230                        // mulps         %xmm14,%xmm12
-  .byte  15,40,5,24,22,0,0                   // movaps        0x1618(%rip),%xmm0        # 3bb30 <_sk_srcover_bgra_8888_sse2_lowp+0x1264>
+  .byte  15,40,5,40,22,0,0                   // movaps        0x1628(%rip),%xmm0        # 3b370 <_sk_srcover_bgra_8888_sse2_lowp+0x1274>
   .byte  68,15,88,224                        // addps         %xmm0,%xmm12
   .byte  68,15,88,232                        // addps         %xmm0,%xmm13
   .byte  69,15,89,235                        // mulps         %xmm11,%xmm13
   .byte  69,15,89,224                        // mulps         %xmm8,%xmm12
-  .byte  15,40,5,17,22,0,0                   // movaps        0x1611(%rip),%xmm0        # 3bb40 <_sk_srcover_bgra_8888_sse2_lowp+0x1274>
+  .byte  15,40,5,33,22,0,0                   // movaps        0x1621(%rip),%xmm0        # 3b380 <_sk_srcover_bgra_8888_sse2_lowp+0x1284>
   .byte  68,15,40,192                        // movaps        %xmm0,%xmm8
   .byte  65,15,92,197                        // subps         %xmm13,%xmm0
   .byte  65,15,84,194                        // andps         %xmm10,%xmm0
@@ -57987,7 +57626,7 @@
   .byte  69,15,86,200                        // orps          %xmm8,%xmm9
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  65,15,194,200,1                     // cmpltps       %xmm8,%xmm1
-  .byte  15,40,5,253,15,0,0                  // movaps        0xffd(%rip),%xmm0        # 3b560 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
+  .byte  15,40,5,13,16,0,0                   // movaps        0x100d(%rip),%xmm0        # 3ada0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
   .byte  68,15,40,216                        // movaps        %xmm0,%xmm11
   .byte  65,15,92,194                        // subps         %xmm10,%xmm0
   .byte  15,84,193                           // andps         %xmm1,%xmm0
@@ -58000,7 +57639,7 @@
   .byte  65,15,86,211                        // orps          %xmm11,%xmm2
   .byte  68,15,40,219                        // movaps        %xmm3,%xmm11
   .byte  69,15,194,216,1                     // cmpltps       %xmm8,%xmm11
-  .byte  68,15,40,13,213,15,0,0              // movaps        0xfd5(%rip),%xmm9        # 3b570 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  .byte  68,15,40,13,229,15,0,0              // movaps        0xfe5(%rip),%xmm9        # 3adb0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
   .byte  69,15,40,209                        // movaps        %xmm9,%xmm10
   .byte  68,15,92,201                        // subps         %xmm1,%xmm9
   .byte  69,15,84,203                        // andps         %xmm11,%xmm9
@@ -58058,26 +57697,26 @@
   .byte  65,254,202                          // dec           %r10b
   .byte  69,15,182,202                       // movzbl        %r10b,%r9d
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,38                              // ja            3a66b <_sk_srcover_rgba_8888_sse2_lowp+0x4b>
+  .byte  119,38                              // ja            39e9b <_sk_srcover_rgba_8888_sse2_lowp+0x4b>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  76,141,29,67,2,0,0                  // lea           0x243(%rip),%r11        # 3a894 <_sk_srcover_rgba_8888_sse2_lowp+0x274>
+  .byte  76,141,29,67,2,0,0                  // lea           0x243(%rip),%r11        # 3a0c4 <_sk_srcover_rgba_8888_sse2_lowp+0x274>
   .byte  75,99,4,139                         // movslq        (%r11,%r9,4),%rax
   .byte  76,1,216                            // add           %r11,%rax
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  255,224                             // jmpq          *%rax
   .byte  243,65,15,16,60,144                 // movss         (%r8,%rdx,4),%xmm7
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  235,102                             // jmp           3a6d1 <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
+  .byte  235,102                             // jmp           39f01 <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
   .byte  102,65,15,16,60,144                 // movupd        (%r8,%rdx,4),%xmm7
   .byte  243,69,15,111,68,144,16             // movdqu        0x10(%r8,%rdx,4),%xmm8
-  .byte  235,87                              // jmp           3a6d1 <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
+  .byte  235,87                              // jmp           39f01 <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
   .byte  102,65,15,110,100,144,8             // movd          0x8(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,69,15,18,4,144                  // movlpd        (%r8,%rdx,4),%xmm8
   .byte  102,65,15,40,248                    // movapd        %xmm8,%xmm7
   .byte  102,68,15,111,196                   // movdqa        %xmm4,%xmm8
-  .byte  235,52                              // jmp           3a6d1 <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
+  .byte  235,52                              // jmp           39f01 <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
   .byte  102,65,15,110,100,144,24            // movd          0x18(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  243,65,15,16,100,144,20             // movss         0x14(%r8,%rdx,4),%xmm4
@@ -58094,7 +57733,7 @@
   .byte  102,15,114,244,16                   // pslld         $0x10,%xmm4
   .byte  102,15,114,228,16                   // psrad         $0x10,%xmm4
   .byte  102,15,107,236                      // packssdw      %xmm4,%xmm5
-  .byte  102,68,15,111,37,21,14,0,0          // movdqa        0xe15(%rip),%xmm12        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,37,37,14,0,0          // movdqa        0xe25(%rip),%xmm12        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,111,229                      // movdqa        %xmm5,%xmm4
   .byte  102,65,15,219,228                   // pand          %xmm12,%xmm4
   .byte  102,15,113,213,8                    // psrlw         $0x8,%xmm5
@@ -58152,20 +57791,20 @@
   .byte  102,15,105,193                      // punpckhwd     %xmm1,%xmm0
   .byte  102,15,235,194                      // por           %xmm2,%xmm0
   .byte  65,128,250,6                        // cmp           $0x6,%r10b
-  .byte  119,24                              // ja            3a833 <_sk_srcover_rgba_8888_sse2_lowp+0x213>
-  .byte  76,141,21,142,0,0,0                 // lea           0x8e(%rip),%r10        # 3a8b0 <_sk_srcover_rgba_8888_sse2_lowp+0x290>
+  .byte  119,24                              // ja            3a063 <_sk_srcover_rgba_8888_sse2_lowp+0x213>
+  .byte  76,141,21,142,0,0,0                 // lea           0x8e(%rip),%r10        # 3a0e0 <_sk_srcover_rgba_8888_sse2_lowp+0x290>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,69,15,126,36,144                // movd          %xmm12,(%r8,%rdx,4)
-  .byte  235,73                              // jmp           3a87c <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
+  .byte  235,73                              // jmp           3a0ac <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
   .byte  243,69,15,127,36,144                // movdqu        %xmm12,(%r8,%rdx,4)
   .byte  243,65,15,127,68,144,16             // movdqu        %xmm0,0x10(%r8,%rdx,4)
-  .byte  235,58                              // jmp           3a87c <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
+  .byte  235,58                              // jmp           3a0ac <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
   .byte  102,65,15,112,196,78                // pshufd        $0x4e,%xmm12,%xmm0
   .byte  102,65,15,126,68,144,8              // movd          %xmm0,0x8(%r8,%rdx,4)
   .byte  102,69,15,214,36,144                // movq          %xmm12,(%r8,%rdx,4)
-  .byte  235,37                              // jmp           3a87c <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
+  .byte  235,37                              // jmp           3a0ac <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
   .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
   .byte  102,65,15,126,76,144,24             // movd          %xmm1,0x18(%r8,%rdx,4)
   .byte  102,15,112,200,229                  // pshufd        $0xe5,%xmm0,%xmm1
@@ -58198,7 +57837,7 @@
   .byte  254                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  123,255                             // jnp           3a8b1 <_sk_srcover_rgba_8888_sse2_lowp+0x291>
+  .byte  123,255                             // jnp           3a0e1 <_sk_srcover_rgba_8888_sse2_lowp+0x291>
   .byte  255                                 // (bad)
   .byte  255,159,255,255,255,146             // lcall         *-0x6d000001(%rdi)
   .byte  255                                 // (bad)
@@ -58230,26 +57869,26 @@
   .byte  65,254,202                          // dec           %r10b
   .byte  69,15,182,202                       // movzbl        %r10b,%r9d
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,38                              // ja            3a917 <_sk_srcover_bgra_8888_sse2_lowp+0x4b>
+  .byte  119,38                              // ja            3a147 <_sk_srcover_bgra_8888_sse2_lowp+0x4b>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  76,141,29,67,2,0,0                  // lea           0x243(%rip),%r11        # 3ab40 <_sk_srcover_bgra_8888_sse2_lowp+0x274>
+  .byte  76,141,29,67,2,0,0                  // lea           0x243(%rip),%r11        # 3a370 <_sk_srcover_bgra_8888_sse2_lowp+0x274>
   .byte  75,99,4,139                         // movslq        (%r11,%r9,4),%rax
   .byte  76,1,216                            // add           %r11,%rax
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  255,224                             // jmpq          *%rax
   .byte  243,65,15,16,60,144                 // movss         (%r8,%rdx,4),%xmm7
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  235,102                             // jmp           3a97d <_sk_srcover_bgra_8888_sse2_lowp+0xb1>
+  .byte  235,102                             // jmp           3a1ad <_sk_srcover_bgra_8888_sse2_lowp+0xb1>
   .byte  102,65,15,16,60,144                 // movupd        (%r8,%rdx,4),%xmm7
   .byte  243,69,15,111,68,144,16             // movdqu        0x10(%r8,%rdx,4),%xmm8
-  .byte  235,87                              // jmp           3a97d <_sk_srcover_bgra_8888_sse2_lowp+0xb1>
+  .byte  235,87                              // jmp           3a1ad <_sk_srcover_bgra_8888_sse2_lowp+0xb1>
   .byte  102,65,15,110,100,144,8             // movd          0x8(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,69,15,18,4,144                  // movlpd        (%r8,%rdx,4),%xmm8
   .byte  102,65,15,40,248                    // movapd        %xmm8,%xmm7
   .byte  102,68,15,111,196                   // movdqa        %xmm4,%xmm8
-  .byte  235,52                              // jmp           3a97d <_sk_srcover_bgra_8888_sse2_lowp+0xb1>
+  .byte  235,52                              // jmp           3a1ad <_sk_srcover_bgra_8888_sse2_lowp+0xb1>
   .byte  102,65,15,110,100,144,24            // movd          0x18(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  243,65,15,16,100,144,20             // movss         0x14(%r8,%rdx,4),%xmm4
@@ -58266,7 +57905,7 @@
   .byte  102,15,114,244,16                   // pslld         $0x10,%xmm4
   .byte  102,15,114,228,16                   // psrad         $0x10,%xmm4
   .byte  102,15,107,236                      // packssdw      %xmm4,%xmm5
-  .byte  102,68,15,111,37,105,11,0,0         // movdqa        0xb69(%rip),%xmm12        # 3b510 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  .byte  102,68,15,111,37,121,11,0,0         // movdqa        0xb79(%rip),%xmm12        # 3ad50 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
   .byte  102,15,111,245                      // movdqa        %xmm5,%xmm6
   .byte  102,65,15,219,244                   // pand          %xmm12,%xmm6
   .byte  102,15,113,213,8                    // psrlw         $0x8,%xmm5
@@ -58324,20 +57963,20 @@
   .byte  102,15,105,193                      // punpckhwd     %xmm1,%xmm0
   .byte  102,15,235,194                      // por           %xmm2,%xmm0
   .byte  65,128,250,6                        // cmp           $0x6,%r10b
-  .byte  119,24                              // ja            3aadf <_sk_srcover_bgra_8888_sse2_lowp+0x213>
-  .byte  76,141,21,142,0,0,0                 // lea           0x8e(%rip),%r10        # 3ab5c <_sk_srcover_bgra_8888_sse2_lowp+0x290>
+  .byte  119,24                              // ja            3a30f <_sk_srcover_bgra_8888_sse2_lowp+0x213>
+  .byte  76,141,21,142,0,0,0                 // lea           0x8e(%rip),%r10        # 3a38c <_sk_srcover_bgra_8888_sse2_lowp+0x290>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,69,15,126,36,144                // movd          %xmm12,(%r8,%rdx,4)
-  .byte  235,73                              // jmp           3ab28 <_sk_srcover_bgra_8888_sse2_lowp+0x25c>
+  .byte  235,73                              // jmp           3a358 <_sk_srcover_bgra_8888_sse2_lowp+0x25c>
   .byte  243,69,15,127,36,144                // movdqu        %xmm12,(%r8,%rdx,4)
   .byte  243,65,15,127,68,144,16             // movdqu        %xmm0,0x10(%r8,%rdx,4)
-  .byte  235,58                              // jmp           3ab28 <_sk_srcover_bgra_8888_sse2_lowp+0x25c>
+  .byte  235,58                              // jmp           3a358 <_sk_srcover_bgra_8888_sse2_lowp+0x25c>
   .byte  102,65,15,112,196,78                // pshufd        $0x4e,%xmm12,%xmm0
   .byte  102,65,15,126,68,144,8              // movd          %xmm0,0x8(%r8,%rdx,4)
   .byte  102,69,15,214,36,144                // movq          %xmm12,(%r8,%rdx,4)
-  .byte  235,37                              // jmp           3ab28 <_sk_srcover_bgra_8888_sse2_lowp+0x25c>
+  .byte  235,37                              // jmp           3a358 <_sk_srcover_bgra_8888_sse2_lowp+0x25c>
   .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
   .byte  102,65,15,126,76,144,24             // movd          %xmm1,0x18(%r8,%rdx,4)
   .byte  102,15,112,200,229                  // pshufd        $0xe5,%xmm0,%xmm1
@@ -58370,7 +58009,7 @@
   .byte  254                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  123,255                             // jnp           3ab5d <_sk_srcover_bgra_8888_sse2_lowp+0x291>
+  .byte  123,255                             // jnp           3a38d <_sk_srcover_bgra_8888_sse2_lowp+0x291>
   .byte  255                                 // (bad)
   .byte  255,159,255,255,255,146             // lcall         *-0x6d000001(%rdi)
   .byte  255                                 // (bad)
@@ -58403,14 +58042,14 @@
   .byte  252                                 // cld
   .byte  190,0,0,128,191                     // mov           $0xbf800000,%esi
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  224,64                              // loopne        3abdc <.literal4+0x64>
+  .byte  224,64                              // loopne        3a40c <.literal4+0x64>
   .byte  154                                 // (bad)
   .byte  153                                 // cltd
   .byte  153                                 // cltd
   .byte  62,61,10,23,63,174                  // ds            cmp $0xae3f170a,%eax
-  .byte  71,225,61                           // rex.RXB       loope 3abe5 <.literal4+0x6d>
+  .byte  71,225,61                           // rex.RXB       loope 3a415 <.literal4+0x6d>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  127,67                              // jg            3abef <.literal4+0x77>
+  .byte  127,67                              // jg            3a41f <.literal4+0x77>
   .byte  0,0                                 // add           %al,(%rax)
   .byte  128,127,145,131                     // cmpb          $0x83,-0x6f(%rdi)
   .byte  158                                 // sahf
@@ -58447,7 +58086,7 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  8,33                                // or            %ah,(%rcx)
   .byte  132,55                              // test          %dh,(%rdi)
-  .byte  224,7                               // loopne        3ac09 <.literal4+0x91>
+  .byte  224,7                               // loopne        3a439 <.literal4+0x91>
   .byte  0,0                                 // add           %al,(%rax)
   .byte  33,8                                // and           %ecx,(%rax)
   .byte  2,58                                // add           (%rdx),%bh
@@ -58458,8 +58097,8 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  0,52,255                            // add           %dh,(%rdi,%rdi,8)
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            3ac1c <.literal4+0xa4>
-  .byte  119,115                             // ja            3ac91 <.literal4+0x119>
+  .byte  127,0                               // jg            3a44c <.literal4+0xa4>
+  .byte  119,115                             // ja            3a4c1 <.literal4+0x119>
   .byte  248                                 // clc
   .byte  194,117,191                         // retq          $0xbf75
   .byte  191,63,249,68,180                   // mov           $0xb444f93f,%edi
@@ -58482,12 +58121,12 @@
   .byte  190,80,128,3,62                     // mov           $0x3e038050,%esi
   .byte  31                                  // (bad)
   .byte  215                                 // xlat          %ds:(%rbx)
-  .byte  118,63                              // jbe           3aca7 <.literal4+0x12f>
+  .byte  118,63                              // jbe           3a4d7 <.literal4+0x12f>
   .byte  246,64,83,63                        // testb         $0x3f,0x53(%rax)
   .byte  0,0                                 // add           %al,(%rax)
   .byte  248                                 // clc
   .byte  65,0,0                              // add           %al,(%r8)
-  .byte  124,66                              // jl            3acb6 <.literal4+0x13e>
+  .byte  124,66                              // jl            3a4e6 <.literal4+0x13e>
   .byte  0,240                               // add           %dh,%al
   .byte  0,0                                 // add           %al,(%rax)
   .byte  137,136,136,55,0,15                 // mov           %ecx,0xf003788(%rax)
@@ -58497,9 +58136,9 @@
   .byte  137,136,136,59,15,0                 // mov           %ecx,0xf3b88(%rax)
   .byte  0,0                                 // add           %al,(%rax)
   .byte  137,136,136,61,0,0                  // mov           %ecx,0x3d88(%rax)
-  .byte  112,65                              // jo            3acd9 <.literal4+0x161>
+  .byte  112,65                              // jo            3a509 <.literal4+0x161>
   .byte  0,255                               // add           %bh,%bh
-  .byte  127,71                              // jg            3ace3 <.literal4+0x16b>
+  .byte  127,71                              // jg            3a513 <.literal4+0x16b>
   .byte  89                                  // pop           %rcx
   .byte  23                                  // (bad)
   .byte  55                                  // (bad)
@@ -58517,18 +58156,18 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  128,0,0                             // addb          $0x0,(%rax)
   .byte  0,191,0,0,192,191                   // add           %bh,-0x40400000(%rdi)
-  .byte  114,28                              // jb            3ace6 <.literal4+0x16e>
+  .byte  114,28                              // jb            3a516 <.literal4+0x16e>
   .byte  199                                 // (bad)
   .byte  62,85                               // ds            push %rbp
   .byte  85                                  // push          %rbp
   .byte  149                                 // xchg          %eax,%ebp
   .byte  191,0,0,192,63                      // mov           $0x3fc00000,%edi
   .byte  57,142,99,61,114,249                // cmp           %ecx,-0x68dc29d(%rsi)
-  .byte  127,63                              // jg            3ad1b <_sk_srcover_bgra_8888_sse2_lowp+0x44f>
+  .byte  127,63                              // jg            3a54b <_sk_srcover_bgra_8888_sse2_lowp+0x44f>
   .byte  3,0                                 // add           (%rax),%eax
   .byte  0,0                                 // add           %al,(%rax)
   .byte  45,16,17,192,18                     // sub           $0x12c01110,%eax
-  .byte  120,57                              // js            3ad20 <_sk_srcover_bgra_8888_sse2_lowp+0x454>
+  .byte  120,57                              // js            3a550 <_sk_srcover_bgra_8888_sse2_lowp+0x454>
   .byte  64,32,148,90,62,4,157,30            // and           %dl,0x1e9d043e(%rdx,%rbx,2)
   .byte  62,0,24                             // add           %bl,%ds:(%rax)
   .byte  161,57,109,165,144,63,252,191,16    // movabs        0x10bffc3f90a56d39,%eax
@@ -58540,7 +58179,7 @@
   .byte  56,255                              // cmp           %bh,%bh
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            3ad0d <.literal4+0x195>
+  .byte  127,0                               // jg            3a53d <.literal4+0x195>
   .byte  0,128,56,0,64,254                   // add           %al,-0x1bfffc8(%rax)
   .byte  255                                 // .byte         0xff
 
@@ -58592,16 +58231,16 @@
   .byte  0,1                                 // add           %al,(%rcx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a03ad88 <_sk_srcover_bgra_8888_sse2_lowp+0xa0004bc>
+  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a03a5c8 <_sk_srcover_bgra_8888_sse2_lowp+0xa0004cc>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1203ad90 <_sk_srcover_bgra_8888_sse2_lowp+0x120004c4>
+  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1203a5d0 <_sk_srcover_bgra_8888_sse2_lowp+0x120004d4>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a03ad98 <_sk_srcover_bgra_8888_sse2_lowp+0x1a0004cc>
+  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a03a5d8 <_sk_srcover_bgra_8888_sse2_lowp+0x1a0004dc>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 303ada0 <_sk_srcover_bgra_8888_sse2_lowp+0x30004d4>
+  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 303a5e0 <_sk_srcover_bgra_8888_sse2_lowp+0x30004e4>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,6                               // incl          (%rsi)
@@ -58644,16 +58283,16 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  1,255                               // add           %edi,%edi
   .byte  255                                 // (bad)
-  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a03ade8 <_sk_srcover_bgra_8888_sse2_lowp+0xa00051c>
+  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a03a628 <_sk_srcover_bgra_8888_sse2_lowp+0xa00052c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1203adf0 <_sk_srcover_bgra_8888_sse2_lowp+0x12000524>
+  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1203a630 <_sk_srcover_bgra_8888_sse2_lowp+0x12000534>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a03adf8 <_sk_srcover_bgra_8888_sse2_lowp+0x1a00052c>
+  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a03a638 <_sk_srcover_bgra_8888_sse2_lowp+0x1a00053c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 303ae00 <_sk_srcover_bgra_8888_sse2_lowp+0x3000534>
+  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 303a640 <_sk_srcover_bgra_8888_sse2_lowp+0x3000544>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,6                               // incl          (%rsi)
@@ -58696,16 +58335,16 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  1,255                               // add           %edi,%edi
   .byte  255                                 // (bad)
-  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a03ae48 <_sk_srcover_bgra_8888_sse2_lowp+0xa00057c>
+  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a03a688 <_sk_srcover_bgra_8888_sse2_lowp+0xa00058c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1203ae50 <_sk_srcover_bgra_8888_sse2_lowp+0x12000584>
+  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1203a690 <_sk_srcover_bgra_8888_sse2_lowp+0x12000594>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a03ae58 <_sk_srcover_bgra_8888_sse2_lowp+0x1a00058c>
+  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a03a698 <_sk_srcover_bgra_8888_sse2_lowp+0x1a00059c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 303ae60 <_sk_srcover_bgra_8888_sse2_lowp+0x3000594>
+  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 303a6a0 <_sk_srcover_bgra_8888_sse2_lowp+0x30005a4>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,6                               // incl          (%rsi)
@@ -58748,16 +58387,16 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  1,255                               // add           %edi,%edi
   .byte  255                                 // (bad)
-  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a03aea8 <_sk_srcover_bgra_8888_sse2_lowp+0xa0005dc>
+  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a03a6e8 <_sk_srcover_bgra_8888_sse2_lowp+0xa0005ec>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1203aeb0 <_sk_srcover_bgra_8888_sse2_lowp+0x120005e4>
+  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1203a6f0 <_sk_srcover_bgra_8888_sse2_lowp+0x120005f4>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a03aeb8 <_sk_srcover_bgra_8888_sse2_lowp+0x1a0005ec>
+  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a03a6f8 <_sk_srcover_bgra_8888_sse2_lowp+0x1a0005fc>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 303aec0 <_sk_srcover_bgra_8888_sse2_lowp+0x30005f4>
+  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 303a700 <_sk_srcover_bgra_8888_sse2_lowp+0x3000604>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,6                               // incl          (%rsi)
@@ -58800,16 +58439,16 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  1,255                               // add           %edi,%edi
   .byte  255                                 // (bad)
-  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a03af08 <_sk_srcover_bgra_8888_sse2_lowp+0xa00063c>
+  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a03a748 <_sk_srcover_bgra_8888_sse2_lowp+0xa00064c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1203af10 <_sk_srcover_bgra_8888_sse2_lowp+0x12000644>
+  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1203a750 <_sk_srcover_bgra_8888_sse2_lowp+0x12000654>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a03af18 <_sk_srcover_bgra_8888_sse2_lowp+0x1a00064c>
+  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a03a758 <_sk_srcover_bgra_8888_sse2_lowp+0x1a00065c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 303af20 <_sk_srcover_bgra_8888_sse2_lowp+0x3000654>
+  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 303a760 <_sk_srcover_bgra_8888_sse2_lowp+0x3000664>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,6                               // incl          (%rsi)
@@ -58852,16 +58491,16 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  1,255                               // add           %edi,%edi
   .byte  255                                 // (bad)
-  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a03af68 <_sk_srcover_bgra_8888_sse2_lowp+0xa00069c>
+  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a03a7a8 <_sk_srcover_bgra_8888_sse2_lowp+0xa0006ac>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1203af70 <_sk_srcover_bgra_8888_sse2_lowp+0x120006a4>
+  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1203a7b0 <_sk_srcover_bgra_8888_sse2_lowp+0x120006b4>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a03af78 <_sk_srcover_bgra_8888_sse2_lowp+0x1a0006ac>
+  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a03a7b8 <_sk_srcover_bgra_8888_sse2_lowp+0x1a0006bc>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 303af80 <_sk_srcover_bgra_8888_sse2_lowp+0x30006b4>
+  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 303a7c0 <_sk_srcover_bgra_8888_sse2_lowp+0x30006c4>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,6                               // incl          (%rsi)
@@ -58904,16 +58543,16 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  1,255                               // add           %edi,%edi
   .byte  255                                 // (bad)
-  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a03afc8 <_sk_srcover_bgra_8888_sse2_lowp+0xa0006fc>
+  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a03a808 <_sk_srcover_bgra_8888_sse2_lowp+0xa00070c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1203afd0 <_sk_srcover_bgra_8888_sse2_lowp+0x12000704>
+  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1203a810 <_sk_srcover_bgra_8888_sse2_lowp+0x12000714>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a03afd8 <_sk_srcover_bgra_8888_sse2_lowp+0x1a00070c>
+  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a03a818 <_sk_srcover_bgra_8888_sse2_lowp+0x1a00071c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 303afe0 <_sk_srcover_bgra_8888_sse2_lowp+0x3000714>
+  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 303a820 <_sk_srcover_bgra_8888_sse2_lowp+0x3000724>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,6                               // incl          (%rsi)
@@ -58956,16 +58595,16 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  1,255                               // add           %edi,%edi
   .byte  255                                 // (bad)
-  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a03b028 <_sk_srcover_bgra_8888_sse2_lowp+0xa00075c>
+  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a03a868 <_sk_srcover_bgra_8888_sse2_lowp+0xa00076c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1203b030 <_sk_srcover_bgra_8888_sse2_lowp+0x12000764>
+  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1203a870 <_sk_srcover_bgra_8888_sse2_lowp+0x12000774>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a03b038 <_sk_srcover_bgra_8888_sse2_lowp+0x1a00076c>
+  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a03a878 <_sk_srcover_bgra_8888_sse2_lowp+0x1a00077c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 303b040 <_sk_srcover_bgra_8888_sse2_lowp+0x3000774>
+  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 303a880 <_sk_srcover_bgra_8888_sse2_lowp+0x3000784>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,6                               // incl          (%rsi)
@@ -59008,16 +58647,16 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  1,255                               // add           %edi,%edi
   .byte  255                                 // (bad)
-  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a03b088 <_sk_srcover_bgra_8888_sse2_lowp+0xa0007bc>
+  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a03a8c8 <_sk_srcover_bgra_8888_sse2_lowp+0xa0007cc>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1203b090 <_sk_srcover_bgra_8888_sse2_lowp+0x120007c4>
+  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1203a8d0 <_sk_srcover_bgra_8888_sse2_lowp+0x120007d4>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a03b098 <_sk_srcover_bgra_8888_sse2_lowp+0x1a0007cc>
+  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a03a8d8 <_sk_srcover_bgra_8888_sse2_lowp+0x1a0007dc>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 303b0a0 <_sk_srcover_bgra_8888_sse2_lowp+0x30007d4>
+  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 303a8e0 <_sk_srcover_bgra_8888_sse2_lowp+0x30007e4>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,6                               // incl          (%rsi)
@@ -59060,16 +58699,16 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  1,255                               // add           %edi,%edi
   .byte  255                                 // (bad)
-  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a03b0e8 <_sk_srcover_bgra_8888_sse2_lowp+0xa00081c>
+  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a03a928 <_sk_srcover_bgra_8888_sse2_lowp+0xa00082c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1203b0f0 <_sk_srcover_bgra_8888_sse2_lowp+0x12000824>
+  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1203a930 <_sk_srcover_bgra_8888_sse2_lowp+0x12000834>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a03b0f8 <_sk_srcover_bgra_8888_sse2_lowp+0x1a00082c>
+  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a03a938 <_sk_srcover_bgra_8888_sse2_lowp+0x1a00083c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 303b100 <_sk_srcover_bgra_8888_sse2_lowp+0x3000834>
+  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 303a940 <_sk_srcover_bgra_8888_sse2_lowp+0x3000844>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,6                               // incl          (%rsi)
@@ -59421,7 +59060,7 @@
   .byte  0,255                               // add           %bh,%bh
   .byte  0,0                                 // add           %al,(%rax)
   .byte  248                                 // clc
-  .byte  224,255                             // loopne        3b3b3 <.const+0x693>
+  .byte  224,255                             // loopne        3abf3 <.const+0x693>
   .byte  248                                 // clc
   .byte  0,63                                // add           %bh,(%rdi)
   .byte  0,31                                // add           %bl,(%rdi)
@@ -59682,11 +59321,11 @@
   .byte  0,128,191,0,0,128                   // add           %al,-0x7fffff41(%rax)
   .byte  191,0,0,224,64                      // mov           $0x40e00000,%edi
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  224,64                              // loopne        3b628 <.literal16+0x118>
+  .byte  224,64                              // loopne        3ae68 <.literal16+0x118>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  224,64                              // loopne        3b62c <.literal16+0x11c>
+  .byte  224,64                              // loopne        3ae6c <.literal16+0x11c>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  224,64                              // loopne        3b630 <.literal16+0x120>
+  .byte  224,64                              // loopne        3ae70 <.literal16+0x120>
   .byte  154                                 // (bad)
   .byte  153                                 // cltd
   .byte  153                                 // cltd
@@ -59706,13 +59345,13 @@
   .byte  10,23                               // or            (%rdi),%dl
   .byte  63                                  // (bad)
   .byte  174                                 // scas          %es:(%rdi),%al
-  .byte  71,225,61                           // rex.RXB       loope 3b651 <.literal16+0x141>
+  .byte  71,225,61                           // rex.RXB       loope 3ae91 <.literal16+0x141>
   .byte  174                                 // scas          %es:(%rdi),%al
-  .byte  71,225,61                           // rex.RXB       loope 3b655 <.literal16+0x145>
+  .byte  71,225,61                           // rex.RXB       loope 3ae95 <.literal16+0x145>
   .byte  174                                 // scas          %es:(%rdi),%al
-  .byte  71,225,61                           // rex.RXB       loope 3b659 <.literal16+0x149>
+  .byte  71,225,61                           // rex.RXB       loope 3ae99 <.literal16+0x149>
   .byte  174                                 // scas          %es:(%rdi),%al
-  .byte  71,225,61                           // rex.RXB       loope 3b65d <.literal16+0x14d>
+  .byte  71,225,61                           // rex.RXB       loope 3ae9d <.literal16+0x14d>
   .byte  255,0                               // incl          (%rax)
   .byte  0,0                                 // add           %al,(%rax)
   .byte  255,0                               // incl          (%rax)
@@ -59723,10 +59362,10 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  1,255                               // add           %edi,%edi
   .byte  255                                 // (bad)
-  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a03b638 <_sk_srcover_bgra_8888_sse2_lowp+0xa000d6c>
+  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a03ae78 <_sk_srcover_bgra_8888_sse2_lowp+0xa000d7c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,13,255,255,255,2                // decl          0x2ffffff(%rip)        # 303b640 <_sk_srcover_bgra_8888_sse2_lowp+0x3000d74>
+  .byte  255,13,255,255,255,2                // decl          0x2ffffff(%rip)        # 303ae80 <_sk_srcover_bgra_8888_sse2_lowp+0x3000d84>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,6                               // incl          (%rsi)
@@ -59741,11 +59380,11 @@
   .byte  255,0                               // incl          (%rax)
   .byte  0,127,67                            // add           %bh,0x43(%rdi)
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  127,67                              // jg            3b69b <.literal16+0x18b>
+  .byte  127,67                              // jg            3aedb <.literal16+0x18b>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  127,67                              // jg            3b69f <.literal16+0x18f>
+  .byte  127,67                              // jg            3aedf <.literal16+0x18f>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  127,67                              // jg            3b6a3 <.literal16+0x193>
+  .byte  127,67                              // jg            3aee3 <.literal16+0x193>
   .byte  0,0                                 // add           %al,(%rax)
   .byte  128,127,0,0                         // cmpb          $0x0,0x0(%rdi)
   .byte  128,127,0,0                         // cmpb          $0x0,0x0(%rdi)
@@ -59901,13 +59540,13 @@
   .byte  132,55                              // test          %dh,(%rdi)
   .byte  8,33                                // or            %ah,(%rcx)
   .byte  132,55                              // test          %dh,(%rdi)
-  .byte  224,7                               // loopne        3b7b9 <.literal16+0x2a9>
+  .byte  224,7                               // loopne        3aff9 <.literal16+0x2a9>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  224,7                               // loopne        3b7bd <.literal16+0x2ad>
+  .byte  224,7                               // loopne        3affd <.literal16+0x2ad>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  224,7                               // loopne        3b7c1 <.literal16+0x2b1>
+  .byte  224,7                               // loopne        3b001 <.literal16+0x2b1>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  224,7                               // loopne        3b7c5 <.literal16+0x2b5>
+  .byte  224,7                               // loopne        3b005 <.literal16+0x2b5>
   .byte  0,0                                 // add           %al,(%rax)
   .byte  33,8                                // and           %ecx,(%rax)
   .byte  2,58                                // add           (%rdx),%bh
@@ -59961,17 +59600,17 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  52,255                              // xor           $0xff,%al
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            3b834 <.literal16+0x324>
+  .byte  127,0                               // jg            3b074 <.literal16+0x324>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            3b838 <.literal16+0x328>
+  .byte  127,0                               // jg            3b078 <.literal16+0x328>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            3b83c <.literal16+0x32c>
+  .byte  127,0                               // jg            3b07c <.literal16+0x32c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            3b840 <.literal16+0x330>
-  .byte  119,115                             // ja            3b8b5 <.literal16+0x3a5>
+  .byte  127,0                               // jg            3b080 <.literal16+0x330>
+  .byte  119,115                             // ja            3b0f5 <.literal16+0x3a5>
   .byte  248                                 // clc
   .byte  194,119,115                         // retq          $0x7377
   .byte  248                                 // clc
@@ -59982,7 +59621,7 @@
   .byte  194,117,191                         // retq          $0xbf75
   .byte  191,63,117,191,191                  // mov           $0xbfbf753f,%edi
   .byte  63                                  // (bad)
-  .byte  117,191                             // jne           3b819 <.literal16+0x309>
+  .byte  117,191                             // jne           3b059 <.literal16+0x309>
   .byte  191,63,117,191,191                  // mov           $0xbfbf753f,%edi
   .byte  63                                  // (bad)
   .byte  249                                 // stc
@@ -59994,7 +59633,7 @@
   .byte  249                                 // stc
   .byte  68,180,62                           // rex.R         mov $0x3e,%spl
   .byte  163,233,220,63,163,233,220,63,163   // movabs        %eax,0xa33fdce9a33fdce9
-  .byte  233,220,63,163,233                  // jmpq          ffffffffe9a6f85a <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffe9a34f8e>
+  .byte  233,220,63,163,233                  // jmpq          ffffffffe9a6f09a <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffe9a34f9e>
   .byte  220,63                              // fdivrl        (%rdi)
   .byte  81                                  // push          %rcx
   .byte  140,242                             // mov           %?,%edx
@@ -60084,16 +59723,16 @@
   .byte  128,3,62                            // addb          $0x3e,(%rbx)
   .byte  31                                  // (bad)
   .byte  215                                 // xlat          %ds:(%rbx)
-  .byte  118,63                              // jbe           3b9a3 <.literal16+0x493>
+  .byte  118,63                              // jbe           3b1e3 <.literal16+0x493>
   .byte  31                                  // (bad)
   .byte  215                                 // xlat          %ds:(%rbx)
-  .byte  118,63                              // jbe           3b9a7 <.literal16+0x497>
+  .byte  118,63                              // jbe           3b1e7 <.literal16+0x497>
   .byte  31                                  // (bad)
   .byte  215                                 // xlat          %ds:(%rbx)
-  .byte  118,63                              // jbe           3b9ab <.literal16+0x49b>
+  .byte  118,63                              // jbe           3b1eb <.literal16+0x49b>
   .byte  31                                  // (bad)
   .byte  215                                 // xlat          %ds:(%rbx)
-  .byte  118,63                              // jbe           3b9af <.literal16+0x49f>
+  .byte  118,63                              // jbe           3b1ef <.literal16+0x49f>
   .byte  246,64,83,63                        // testb         $0x3f,0x53(%rax)
   .byte  246,64,83,63                        // testb         $0x3f,0x53(%rax)
   .byte  246,64,83,63                        // testb         $0x3f,0x53(%rax)
@@ -60114,13 +59753,13 @@
   .byte  65,0,0                              // add           %al,(%r8)
   .byte  248                                 // clc
   .byte  65,0,0                              // add           %al,(%r8)
-  .byte  124,66                              // jl            3b9e6 <.literal16+0x4d6>
+  .byte  124,66                              // jl            3b226 <.literal16+0x4d6>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  124,66                              // jl            3b9ea <.literal16+0x4da>
+  .byte  124,66                              // jl            3b22a <.literal16+0x4da>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  124,66                              // jl            3b9ee <.literal16+0x4de>
+  .byte  124,66                              // jl            3b22e <.literal16+0x4de>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  124,66                              // jl            3b9f2 <.literal16+0x4e2>
+  .byte  124,66                              // jl            3b232 <.literal16+0x4e2>
   .byte  0,240                               // add           %dh,%al
   .byte  0,0                                 // add           %al,(%rax)
   .byte  0,240                               // add           %dh,%al
@@ -60166,25 +59805,25 @@
   .byte  136,136,61,137,136,136              // mov           %cl,-0x777776c3(%rax)
   .byte  61,137,136,136,61                   // cmp           $0x3d888889,%eax
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  112,65                              // jo            3ba75 <.literal16+0x565>
+  .byte  112,65                              // jo            3b2b5 <.literal16+0x565>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  112,65                              // jo            3ba79 <.literal16+0x569>
+  .byte  112,65                              // jo            3b2b9 <.literal16+0x569>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  112,65                              // jo            3ba7d <.literal16+0x56d>
+  .byte  112,65                              // jo            3b2bd <.literal16+0x56d>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  112,65                              // jo            3ba81 <.literal16+0x571>
+  .byte  112,65                              // jo            3b2c1 <.literal16+0x571>
   .byte  0,128,0,0,0,128                     // add           %al,-0x80000000(%rax)
   .byte  0,0                                 // add           %al,(%rax)
   .byte  0,128,0,0,0,128                     // add           %al,-0x80000000(%rax)
   .byte  0,0                                 // add           %al,(%rax)
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            3ba53 <.literal16+0x543>
+  .byte  127,0                               // jg            3b293 <.literal16+0x543>
   .byte  0,255                               // add           %bh,%bh
-  .byte  127,0                               // jg            3ba57 <.literal16+0x547>
+  .byte  127,0                               // jg            3b297 <.literal16+0x547>
   .byte  0,255                               // add           %bh,%bh
-  .byte  127,0                               // jg            3ba5b <.literal16+0x54b>
+  .byte  127,0                               // jg            3b29b <.literal16+0x54b>
   .byte  0,255                               // add           %bh,%bh
-  .byte  127,0                               // jg            3ba5f <.literal16+0x54f>
+  .byte  127,0                               // jg            3b29f <.literal16+0x54f>
   .byte  0,0                                 // add           %al,(%rax)
   .byte  4,0                                 // add           $0x0,%al
   .byte  0,0                                 // add           %al,(%rax)
@@ -60210,13 +59849,13 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  127,255                             // jg            3ba98 <.literal16+0x588>
+  .byte  127,255                             // jg            3b2d8 <.literal16+0x588>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  127,255                             // jg            3ba9c <.literal16+0x58c>
+  .byte  127,255                             // jg            3b2dc <.literal16+0x58c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            3baa1 <.literal16+0x591>
+  .byte  127,0                               // jg            3b2e1 <.literal16+0x591>
   .byte  0,128,56,0,0,128                    // add           %al,-0x7fffffc8(%rax)
   .byte  56,0                                // cmp           %al,(%rax)
   .byte  0,128,56,0,0,128                    // add           %al,-0x7fffffc8(%rax)
@@ -60230,13 +59869,13 @@
   .byte  64,254                              // rex           (bad)
   .byte  255,0                               // incl          (%rax)
   .byte  255                                 // (bad)
-  .byte  127,71                              // jg            3bb0b <.literal16+0x5fb>
+  .byte  127,71                              // jg            3b34b <.literal16+0x5fb>
   .byte  0,255                               // add           %bh,%bh
-  .byte  127,71                              // jg            3bb0f <.literal16+0x5ff>
+  .byte  127,71                              // jg            3b34f <.literal16+0x5ff>
   .byte  0,255                               // add           %bh,%bh
-  .byte  127,71                              // jg            3bb13 <.literal16+0x603>
+  .byte  127,71                              // jg            3b353 <.literal16+0x603>
   .byte  0,255                               // add           %bh,%bh
-  .byte  127,71                              // jg            3bb17 <.literal16+0x607>
+  .byte  127,71                              // jg            3b357 <.literal16+0x607>
   .byte  208                                 // (bad)
   .byte  179,89                              // mov           $0x59,%bl
   .byte  62,208                              // ds            (bad)
@@ -60301,13 +59940,13 @@
   .byte  192,191,0,0,192,191,0               // sarb          $0x0,-0x40400000(%rdi)
   .byte  0,192                               // add           %al,%al
   .byte  191,0,0,192,191                     // mov           $0xbfc00000,%edi
-  .byte  114,28                              // jb            3bb8e <.literal16+0x67e>
+  .byte  114,28                              // jb            3b3ce <.literal16+0x67e>
   .byte  199                                 // (bad)
-  .byte  62,114,28                           // jb,pt         3bb92 <.literal16+0x682>
+  .byte  62,114,28                           // jb,pt         3b3d2 <.literal16+0x682>
   .byte  199                                 // (bad)
-  .byte  62,114,28                           // jb,pt         3bb96 <.literal16+0x686>
+  .byte  62,114,28                           // jb,pt         3b3d6 <.literal16+0x686>
   .byte  199                                 // (bad)
-  .byte  62,114,28                           // jb,pt         3bb9a <.literal16+0x68a>
+  .byte  62,114,28                           // jb,pt         3b3da <.literal16+0x68a>
   .byte  199                                 // (bad)
   .byte  62,85                               // ds            push %rbp
   .byte  85                                  // push          %rbp
@@ -60326,15 +59965,15 @@
   .byte  0,192                               // add           %al,%al
   .byte  63                                  // (bad)
   .byte  57,142,99,61,57,142                 // cmp           %ecx,-0x71c6c29d(%rsi)
-  .byte  99,61,57,142,99,61                  // movslq        0x3d638e39(%rip),%edi        # 3d6749e5 <_sk_srcover_bgra_8888_sse2_lowp+0x3d63a119>
+  .byte  99,61,57,142,99,61                  // movslq        0x3d638e39(%rip),%edi        # 3d674225 <_sk_srcover_bgra_8888_sse2_lowp+0x3d63a129>
   .byte  57,142,99,61,114,249                // cmp           %ecx,-0x68dc29d(%rsi)
-  .byte  127,63                              // jg            3bbf3 <.literal16+0x6e3>
-  .byte  114,249                             // jb            3bbaf <.literal16+0x69f>
-  .byte  127,63                              // jg            3bbf7 <.literal16+0x6e7>
-  .byte  114,249                             // jb            3bbb3 <.literal16+0x6a3>
-  .byte  127,63                              // jg            3bbfb <.literal16+0x6eb>
-  .byte  114,249                             // jb            3bbb7 <.literal16+0x6a7>
-  .byte  127,63                              // jg            3bbff <.literal16+0x6ef>
+  .byte  127,63                              // jg            3b433 <.literal16+0x6e3>
+  .byte  114,249                             // jb            3b3ef <.literal16+0x69f>
+  .byte  127,63                              // jg            3b437 <.literal16+0x6e7>
+  .byte  114,249                             // jb            3b3f3 <.literal16+0x6a3>
+  .byte  127,63                              // jg            3b43b <.literal16+0x6eb>
+  .byte  114,249                             // jb            3b3f7 <.literal16+0x6a7>
+  .byte  127,63                              // jg            3b43f <.literal16+0x6ef>
   .byte  3,0                                 // add           (%rax),%eax
   .byte  0,0                                 // add           %al,(%rax)
   .byte  3,0                                 // add           (%rax),%eax
@@ -60358,9 +59997,9 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,45,16,17,192,45                 // ljmp          *0x2dc01110(%rip)        # 2dc3ccf5 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc02429>
+  .byte  255,45,16,17,192,45                 // ljmp          *0x2dc01110(%rip)        # 2dc3c535 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc02439>
   .byte  16,17                               // adc           %dl,(%rcx)
-  .byte  192,45,16,17,192,45,16              // shrb          $0x10,0x2dc01110(%rip)        # 2dc3ccfe <_sk_srcover_bgra_8888_sse2_lowp+0x2dc02432>
+  .byte  192,45,16,17,192,45,16              // shrb          $0x10,0x2dc01110(%rip)        # 2dc3c53e <_sk_srcover_bgra_8888_sse2_lowp+0x2dc02442>
   .byte  17,192                              // adc           %eax,%eax
   .byte  18,120,57                           // adc           0x39(%rax),%bh
   .byte  64,18,120,57                        // adc           0x39(%rax),%dil
@@ -60464,14 +60103,14 @@
   .byte  0,248                               // add           %bh,%al
   .byte  0,248                               // add           %bh,%al
   .byte  0,248                               // add           %bh,%al
-  .byte  224,255                             // loopne        3bce1 <.literal16+0x7d1>
-  .byte  224,255                             // loopne        3bce3 <.literal16+0x7d3>
-  .byte  224,255                             // loopne        3bce5 <.literal16+0x7d5>
-  .byte  224,255                             // loopne        3bce7 <.literal16+0x7d7>
-  .byte  224,255                             // loopne        3bce9 <.literal16+0x7d9>
-  .byte  224,255                             // loopne        3bceb <.literal16+0x7db>
-  .byte  224,255                             // loopne        3bced <.literal16+0x7dd>
-  .byte  224,255                             // loopne        3bcef <.literal16+0x7df>
+  .byte  224,255                             // loopne        3b521 <.literal16+0x7d1>
+  .byte  224,255                             // loopne        3b523 <.literal16+0x7d3>
+  .byte  224,255                             // loopne        3b525 <.literal16+0x7d5>
+  .byte  224,255                             // loopne        3b527 <.literal16+0x7d7>
+  .byte  224,255                             // loopne        3b529 <.literal16+0x7d9>
+  .byte  224,255                             // loopne        3b52b <.literal16+0x7db>
+  .byte  224,255                             // loopne        3b52d <.literal16+0x7dd>
+  .byte  224,255                             // loopne        3b52f <.literal16+0x7df>
   .byte  15,0,15                             // str           (%rdi)
   .byte  0,15                                // add           %cl,(%rdi)
   .byte  0,15                                // add           %cl,(%rdi)
@@ -60544,9 +60183,9 @@
   .byte  4,0                                 // add           $0x0,%al
   .byte  0,0                                 // add           %al,(%rax)
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            3bd8b <.literal8+0x1b>
+  .byte  127,0                               // jg            3b5cb <.literal8+0x1b>
   .byte  0,255                               // add           %bh,%bh
-  .byte  127,0                               // jg            3bd8f <.literal8+0x1f>
+  .byte  127,0                               // jg            3b5cf <.literal8+0x1f>
   .byte  0,0                                 // add           %al,(%rax)
   .byte  128,0,0                             // addb          $0x0,(%rax)
   .byte  0                                   // .byte         0x0
diff --git a/src/jumper/SkJumper_generated_win.S b/src/jumper/SkJumper_generated_win.S
index 6a51175..f474638 100644
--- a/src/jumper/SkJumper_generated_win.S
+++ b/src/jumper/SkJumper_generated_win.S
@@ -120,10 +120,10 @@
   DB  197,249,110,201                     ; vmovd         %ecx,%xmm1
   DB  196,226,125,88,201                  ; vpbroadcastd  %xmm1,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
-  DB  196,226,125,24,21,23,51,3,0         ; vbroadcastss  0x33317(%rip),%ymm2        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,226,125,24,21,235,44,3,0        ; vbroadcastss  0x32ceb(%rip),%ymm2        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  197,244,88,202                      ; vaddps        %ymm2,%ymm1,%ymm1
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,21,12,51,3,0         ; vbroadcastss  0x3330c(%rip),%ymm2        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,21,224,44,3,0        ; vbroadcastss  0x32ce0(%rip),%ymm2        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,228,87,219                      ; vxorps        %ymm3,%ymm3,%ymm3
   DB  197,220,87,228                      ; vxorps        %ymm4,%ymm4,%ymm4
   DB  197,212,87,237                      ; vxorps        %ymm5,%ymm5,%ymm5
@@ -136,17 +136,17 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,121,110,194                     ; vmovd         %edx,%xmm8
   DB  196,66,125,88,192                   ; vpbroadcastd  %xmm8,%ymm8
-  DB  197,61,254,5,119,52,3,0             ; vpaddd        0x33477(%rip),%ymm8,%ymm8        # 33660 <_sk_srcover_bgra_8888_sse2_lowp+0x444>
+  DB  197,61,254,5,87,46,3,0              ; vpaddd        0x32e57(%rip),%ymm8,%ymm8        # 33040 <_sk_srcover_bgra_8888_sse2_lowp+0x450>
   DB  197,121,110,201                     ; vmovd         %ecx,%xmm9
   DB  196,66,125,88,201                   ; vpbroadcastd  %xmm9,%ymm9
   DB  196,65,53,239,200                   ; vpxor         %ymm8,%ymm9,%ymm9
-  DB  196,98,125,88,21,208,50,3,0         ; vpbroadcastd  0x332d0(%rip),%ymm10        # 334d0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b4>
+  DB  196,98,125,88,21,164,44,3,0         ; vpbroadcastd  0x32ca4(%rip),%ymm10        # 32ea4 <_sk_srcover_bgra_8888_sse2_lowp+0x2b4>
   DB  196,65,53,219,218                   ; vpand         %ymm10,%ymm9,%ymm11
   DB  196,193,37,114,243,5                ; vpslld        $0x5,%ymm11,%ymm11
   DB  196,65,61,219,210                   ; vpand         %ymm10,%ymm8,%ymm10
   DB  196,193,45,114,242,4                ; vpslld        $0x4,%ymm10,%ymm10
-  DB  196,98,125,88,37,181,50,3,0         ; vpbroadcastd  0x332b5(%rip),%ymm12        # 334d4 <_sk_srcover_bgra_8888_sse2_lowp+0x2b8>
-  DB  196,98,125,88,45,176,50,3,0         ; vpbroadcastd  0x332b0(%rip),%ymm13        # 334d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
+  DB  196,98,125,88,37,137,44,3,0         ; vpbroadcastd  0x32c89(%rip),%ymm12        # 32ea8 <_sk_srcover_bgra_8888_sse2_lowp+0x2b8>
+  DB  196,98,125,88,45,132,44,3,0         ; vpbroadcastd  0x32c84(%rip),%ymm13        # 32eac <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
   DB  196,65,53,219,245                   ; vpand         %ymm13,%ymm9,%ymm14
   DB  196,193,13,114,246,2                ; vpslld        $0x2,%ymm14,%ymm14
   DB  196,65,37,235,222                   ; vpor          %ymm14,%ymm11,%ymm11
@@ -161,8 +161,8 @@
   DB  196,65,61,235,195                   ; vpor          %ymm11,%ymm8,%ymm8
   DB  196,65,61,235,193                   ; vpor          %ymm9,%ymm8,%ymm8
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
-  DB  196,98,125,24,13,98,50,3,0          ; vbroadcastss  0x33262(%rip),%ymm9        # 334dc <_sk_srcover_bgra_8888_sse2_lowp+0x2c0>
-  DB  196,98,125,24,21,93,50,3,0          ; vbroadcastss  0x3325d(%rip),%ymm10        # 334e0 <_sk_srcover_bgra_8888_sse2_lowp+0x2c4>
+  DB  196,98,125,24,13,54,44,3,0          ; vbroadcastss  0x32c36(%rip),%ymm9        # 32eb0 <_sk_srcover_bgra_8888_sse2_lowp+0x2c0>
+  DB  196,98,125,24,21,49,44,3,0          ; vbroadcastss  0x32c31(%rip),%ymm10        # 32eb4 <_sk_srcover_bgra_8888_sse2_lowp+0x2c4>
   DB  196,66,61,184,209                   ; vfmadd231ps   %ymm9,%ymm8,%ymm10
   DB  196,98,125,24,0                     ; vbroadcastss  (%rax),%ymm8
   DB  196,65,44,89,192                    ; vmulps        %ymm8,%ymm10,%ymm8
@@ -192,7 +192,7 @@
 PUBLIC _sk_black_color_hsw
 _sk_black_color_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,229,49,3,0        ; vbroadcastss  0x331e5(%rip),%ymm3        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,29,185,43,3,0        ; vbroadcastss  0x32bb9(%rip),%ymm3        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  197,236,87,210                      ; vxorps        %ymm2,%ymm2,%ymm2
@@ -201,7 +201,7 @@
 PUBLIC _sk_white_color_hsw
 _sk_white_color_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,204,49,3,0         ; vbroadcastss  0x331cc(%rip),%ymm0        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,5,160,43,3,0         ; vbroadcastss  0x32ba0(%rip),%ymm0        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,252,40,200                      ; vmovaps       %ymm0,%ymm1
   DB  197,252,40,208                      ; vmovaps       %ymm0,%ymm2
   DB  197,252,40,216                      ; vmovaps       %ymm0,%ymm3
@@ -239,7 +239,7 @@
 PUBLIC _sk_srcatop_hsw
 _sk_srcatop_hsw LABEL PROC
   DB  197,252,89,199                      ; vmulps        %ymm7,%ymm0,%ymm0
-  DB  196,98,125,24,5,107,49,3,0          ; vbroadcastss  0x3316b(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,63,43,3,0           ; vbroadcastss  0x32b3f(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  196,226,61,184,196                  ; vfmadd231ps   %ymm4,%ymm8,%ymm0
   DB  197,244,89,207                      ; vmulps        %ymm7,%ymm1,%ymm1
@@ -253,7 +253,7 @@
 
 PUBLIC _sk_dstatop_hsw
 _sk_dstatop_hsw LABEL PROC
-  DB  196,98,125,24,5,58,49,3,0           ; vbroadcastss  0x3313a(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,14,43,3,0           ; vbroadcastss  0x32b0e(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,199                       ; vsubps        %ymm7,%ymm8,%ymm8
   DB  197,188,89,192                      ; vmulps        %ymm0,%ymm8,%ymm0
   DB  196,226,101,184,196                 ; vfmadd231ps   %ymm4,%ymm3,%ymm0
@@ -286,7 +286,7 @@
 
 PUBLIC _sk_srcout_hsw
 _sk_srcout_hsw LABEL PROC
-  DB  196,98,125,24,5,221,48,3,0          ; vbroadcastss  0x330dd(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,177,42,3,0          ; vbroadcastss  0x32ab1(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,199                       ; vsubps        %ymm7,%ymm8,%ymm8
   DB  197,188,89,192                      ; vmulps        %ymm0,%ymm8,%ymm0
   DB  197,188,89,201                      ; vmulps        %ymm1,%ymm8,%ymm1
@@ -297,7 +297,7 @@
 
 PUBLIC _sk_dstout_hsw
 _sk_dstout_hsw LABEL PROC
-  DB  196,226,125,24,5,188,48,3,0         ; vbroadcastss  0x330bc(%rip),%ymm0        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,5,144,42,3,0         ; vbroadcastss  0x32a90(%rip),%ymm0        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,252,92,219                      ; vsubps        %ymm3,%ymm0,%ymm3
   DB  197,228,89,196                      ; vmulps        %ymm4,%ymm3,%ymm0
   DB  197,228,89,205                      ; vmulps        %ymm5,%ymm3,%ymm1
@@ -308,7 +308,7 @@
 
 PUBLIC _sk_srcover_hsw
 _sk_srcover_hsw LABEL PROC
-  DB  196,98,125,24,5,155,48,3,0          ; vbroadcastss  0x3309b(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,111,42,3,0          ; vbroadcastss  0x32a6f(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  196,194,93,184,192                  ; vfmadd231ps   %ymm8,%ymm4,%ymm0
   DB  196,194,85,184,200                  ; vfmadd231ps   %ymm8,%ymm5,%ymm1
@@ -319,7 +319,7 @@
 
 PUBLIC _sk_dstover_hsw
 _sk_dstover_hsw LABEL PROC
-  DB  196,98,125,24,5,118,48,3,0          ; vbroadcastss  0x33076(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,74,42,3,0           ; vbroadcastss  0x32a4a(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,199                       ; vsubps        %ymm7,%ymm8,%ymm8
   DB  196,226,61,168,196                  ; vfmadd213ps   %ymm4,%ymm8,%ymm0
   DB  196,226,61,168,205                  ; vfmadd213ps   %ymm5,%ymm8,%ymm1
@@ -339,7 +339,7 @@
 
 PUBLIC _sk_multiply_hsw
 _sk_multiply_hsw LABEL PROC
-  DB  196,98,125,24,5,61,48,3,0           ; vbroadcastss  0x3303d(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,17,42,3,0           ; vbroadcastss  0x32a11(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,207                       ; vsubps        %ymm7,%ymm8,%ymm9
   DB  197,52,89,208                       ; vmulps        %ymm0,%ymm9,%ymm10
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
@@ -360,7 +360,7 @@
 PUBLIC _sk_plus__hsw
 _sk_plus__hsw LABEL PROC
   DB  197,252,88,196                      ; vaddps        %ymm4,%ymm0,%ymm0
-  DB  196,98,125,24,5,236,47,3,0          ; vbroadcastss  0x32fec(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,192,41,3,0          ; vbroadcastss  0x329c0(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
   DB  197,244,88,205                      ; vaddps        %ymm5,%ymm1,%ymm1
   DB  196,193,116,93,200                  ; vminps        %ymm8,%ymm1,%ymm1
@@ -386,7 +386,7 @@
 
 PUBLIC _sk_xor__hsw
 _sk_xor__hsw LABEL PROC
-  DB  196,98,125,24,5,151,47,3,0          ; vbroadcastss  0x32f97(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,107,41,3,0          ; vbroadcastss  0x3296b(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,207                       ; vsubps        %ymm7,%ymm8,%ymm9
   DB  197,180,89,192                      ; vmulps        %ymm0,%ymm9,%ymm0
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
@@ -418,7 +418,7 @@
   DB  197,100,89,206                      ; vmulps        %ymm6,%ymm3,%ymm9
   DB  196,193,108,95,209                  ; vmaxps        %ymm9,%ymm2,%ymm2
   DB  197,188,92,210                      ; vsubps        %ymm2,%ymm8,%ymm2
-  DB  196,98,125,24,5,27,47,3,0           ; vbroadcastss  0x32f1b(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,239,40,3,0          ; vbroadcastss  0x328ef(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  196,194,69,184,216                  ; vfmadd231ps   %ymm8,%ymm7,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -441,7 +441,7 @@
   DB  197,100,89,206                      ; vmulps        %ymm6,%ymm3,%ymm9
   DB  196,193,108,93,209                  ; vminps        %ymm9,%ymm2,%ymm2
   DB  197,188,92,210                      ; vsubps        %ymm2,%ymm8,%ymm2
-  DB  196,98,125,24,5,198,46,3,0          ; vbroadcastss  0x32ec6(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,154,40,3,0          ; vbroadcastss  0x3289a(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  196,194,69,184,216                  ; vfmadd231ps   %ymm8,%ymm7,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -467,7 +467,7 @@
   DB  196,193,108,93,209                  ; vminps        %ymm9,%ymm2,%ymm2
   DB  197,236,88,210                      ; vaddps        %ymm2,%ymm2,%ymm2
   DB  197,188,92,210                      ; vsubps        %ymm2,%ymm8,%ymm2
-  DB  196,98,125,24,5,101,46,3,0          ; vbroadcastss  0x32e65(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,57,40,3,0           ; vbroadcastss  0x32839(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  196,194,69,184,216                  ; vfmadd231ps   %ymm8,%ymm7,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -487,7 +487,7 @@
   DB  197,236,89,214                      ; vmulps        %ymm6,%ymm2,%ymm2
   DB  197,236,88,210                      ; vaddps        %ymm2,%ymm2,%ymm2
   DB  197,188,92,210                      ; vsubps        %ymm2,%ymm8,%ymm2
-  DB  196,98,125,24,5,31,46,3,0           ; vbroadcastss  0x32e1f(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,243,39,3,0          ; vbroadcastss  0x327f3(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  196,194,69,184,216                  ; vfmadd231ps   %ymm8,%ymm7,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -495,7 +495,7 @@
 
 PUBLIC _sk_colorburn_hsw
 _sk_colorburn_hsw LABEL PROC
-  DB  196,98,125,24,5,9,46,3,0            ; vbroadcastss  0x32e09(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,221,39,3,0          ; vbroadcastss  0x327dd(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,207                       ; vsubps        %ymm7,%ymm8,%ymm9
   DB  197,52,89,216                       ; vmulps        %ymm0,%ymm9,%ymm11
   DB  196,65,44,87,210                    ; vxorps        %ymm10,%ymm10,%ymm10
@@ -551,7 +551,7 @@
 PUBLIC _sk_colordodge_hsw
 _sk_colordodge_hsw LABEL PROC
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
-  DB  196,98,125,24,13,25,45,3,0          ; vbroadcastss  0x32d19(%rip),%ymm9        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,13,237,38,3,0         ; vbroadcastss  0x326ed(%rip),%ymm9        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,52,92,215                       ; vsubps        %ymm7,%ymm9,%ymm10
   DB  197,44,89,216                       ; vmulps        %ymm0,%ymm10,%ymm11
   DB  197,52,92,203                       ; vsubps        %ymm3,%ymm9,%ymm9
@@ -602,7 +602,7 @@
 
 PUBLIC _sk_hardlight_hsw
 _sk_hardlight_hsw LABEL PROC
-  DB  196,98,125,24,5,51,44,3,0           ; vbroadcastss  0x32c33(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,7,38,3,0            ; vbroadcastss  0x32607(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,215                       ; vsubps        %ymm7,%ymm8,%ymm10
   DB  197,44,89,216                       ; vmulps        %ymm0,%ymm10,%ymm11
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
@@ -651,7 +651,7 @@
 
 PUBLIC _sk_overlay_hsw
 _sk_overlay_hsw LABEL PROC
-  DB  196,98,125,24,5,103,43,3,0          ; vbroadcastss  0x32b67(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,59,37,3,0           ; vbroadcastss  0x3253b(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,215                       ; vsubps        %ymm7,%ymm8,%ymm10
   DB  197,44,89,216                       ; vmulps        %ymm0,%ymm10,%ymm11
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
@@ -711,10 +711,10 @@
   DB  196,65,20,88,197                    ; vaddps        %ymm13,%ymm13,%ymm8
   DB  196,65,60,88,192                    ; vaddps        %ymm8,%ymm8,%ymm8
   DB  196,66,61,168,192                   ; vfmadd213ps   %ymm8,%ymm8,%ymm8
-  DB  196,98,125,24,29,126,42,3,0         ; vbroadcastss  0x32a7e(%rip),%ymm11        # 334e4 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
+  DB  196,98,125,24,29,82,36,3,0          ; vbroadcastss  0x32452(%rip),%ymm11        # 32eb8 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
   DB  196,65,20,88,227                    ; vaddps        %ymm11,%ymm13,%ymm12
   DB  196,65,28,89,192                    ; vmulps        %ymm8,%ymm12,%ymm8
-  DB  196,98,125,24,37,111,42,3,0         ; vbroadcastss  0x32a6f(%rip),%ymm12        # 334e8 <_sk_srcover_bgra_8888_sse2_lowp+0x2cc>
+  DB  196,98,125,24,37,67,36,3,0          ; vbroadcastss  0x32443(%rip),%ymm12        # 32ebc <_sk_srcover_bgra_8888_sse2_lowp+0x2cc>
   DB  196,66,21,184,196                   ; vfmadd231ps   %ymm12,%ymm13,%ymm8
   DB  196,65,124,82,245                   ; vrsqrtps      %ymm13,%ymm14
   DB  196,65,124,83,246                   ; vrcpps        %ymm14,%ymm14
@@ -724,7 +724,7 @@
   DB  197,4,194,255,2                     ; vcmpleps      %ymm7,%ymm15,%ymm15
   DB  196,67,13,74,240,240                ; vblendvps     %ymm15,%ymm8,%ymm14,%ymm14
   DB  197,116,88,249                      ; vaddps        %ymm1,%ymm1,%ymm15
-  DB  196,98,125,24,5,30,42,3,0           ; vbroadcastss  0x32a1e(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,242,35,3,0          ; vbroadcastss  0x323f2(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,65,60,92,237                    ; vsubps        %ymm13,%ymm8,%ymm13
   DB  197,132,92,195                      ; vsubps        %ymm3,%ymm15,%ymm0
   DB  196,98,125,168,235                  ; vfmadd213ps   %ymm3,%ymm0,%ymm13
@@ -837,11 +837,11 @@
   DB  196,65,28,89,210                    ; vmulps        %ymm10,%ymm12,%ymm10
   DB  196,65,44,94,214                    ; vdivps        %ymm14,%ymm10,%ymm10
   DB  196,67,45,74,224,240                ; vblendvps     %ymm15,%ymm8,%ymm10,%ymm12
-  DB  196,98,125,24,53,49,40,3,0          ; vbroadcastss  0x32831(%rip),%ymm14        # 334ec <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
-  DB  196,98,125,24,61,44,40,3,0          ; vbroadcastss  0x3282c(%rip),%ymm15        # 334f0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
+  DB  196,98,125,24,53,5,34,3,0           ; vbroadcastss  0x32205(%rip),%ymm14        # 32ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  DB  196,98,125,24,61,0,34,3,0           ; vbroadcastss  0x32200(%rip),%ymm15        # 32ec4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
   DB  196,65,84,89,239                    ; vmulps        %ymm15,%ymm5,%ymm13
   DB  196,66,93,184,238                   ; vfmadd231ps   %ymm14,%ymm4,%ymm13
-  DB  196,226,125,24,5,29,40,3,0          ; vbroadcastss  0x3281d(%rip),%ymm0        # 334f4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
+  DB  196,226,125,24,5,241,33,3,0         ; vbroadcastss  0x321f1(%rip),%ymm0        # 32ec8 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
   DB  196,98,77,184,232                   ; vfmadd231ps   %ymm0,%ymm6,%ymm13
   DB  196,65,116,89,215                   ; vmulps        %ymm15,%ymm1,%ymm10
   DB  196,66,53,184,214                   ; vfmadd231ps   %ymm14,%ymm9,%ymm10
@@ -896,7 +896,7 @@
   DB  196,193,124,95,192                  ; vmaxps        %ymm8,%ymm0,%ymm0
   DB  196,65,36,95,200                    ; vmaxps        %ymm8,%ymm11,%ymm9
   DB  196,65,116,95,192                   ; vmaxps        %ymm8,%ymm1,%ymm8
-  DB  196,226,125,24,13,222,38,3,0        ; vbroadcastss  0x326de(%rip),%ymm1        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,13,178,32,3,0        ; vbroadcastss  0x320b2(%rip),%ymm1        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,116,92,215                      ; vsubps        %ymm7,%ymm1,%ymm10
   DB  197,172,89,210                      ; vmulps        %ymm2,%ymm10,%ymm2
   DB  197,116,92,219                      ; vsubps        %ymm3,%ymm1,%ymm11
@@ -950,11 +950,11 @@
   DB  196,65,28,89,210                    ; vmulps        %ymm10,%ymm12,%ymm10
   DB  196,65,44,94,214                    ; vdivps        %ymm14,%ymm10,%ymm10
   DB  196,67,45,74,224,240                ; vblendvps     %ymm15,%ymm8,%ymm10,%ymm12
-  DB  196,98,125,24,53,11,38,3,0          ; vbroadcastss  0x3260b(%rip),%ymm14        # 334ec <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
-  DB  196,98,125,24,61,6,38,3,0           ; vbroadcastss  0x32606(%rip),%ymm15        # 334f0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
+  DB  196,98,125,24,53,223,31,3,0         ; vbroadcastss  0x31fdf(%rip),%ymm14        # 32ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  DB  196,98,125,24,61,218,31,3,0         ; vbroadcastss  0x31fda(%rip),%ymm15        # 32ec4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
   DB  196,65,84,89,239                    ; vmulps        %ymm15,%ymm5,%ymm13
   DB  196,66,93,184,238                   ; vfmadd231ps   %ymm14,%ymm4,%ymm13
-  DB  196,226,125,24,5,247,37,3,0         ; vbroadcastss  0x325f7(%rip),%ymm0        # 334f4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
+  DB  196,226,125,24,5,203,31,3,0         ; vbroadcastss  0x31fcb(%rip),%ymm0        # 32ec8 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
   DB  196,98,77,184,232                   ; vfmadd231ps   %ymm0,%ymm6,%ymm13
   DB  196,65,116,89,215                   ; vmulps        %ymm15,%ymm1,%ymm10
   DB  196,66,53,184,214                   ; vfmadd231ps   %ymm14,%ymm9,%ymm10
@@ -1009,7 +1009,7 @@
   DB  196,193,124,95,192                  ; vmaxps        %ymm8,%ymm0,%ymm0
   DB  196,65,36,95,200                    ; vmaxps        %ymm8,%ymm11,%ymm9
   DB  196,65,116,95,192                   ; vmaxps        %ymm8,%ymm1,%ymm8
-  DB  196,226,125,24,13,184,36,3,0        ; vbroadcastss  0x324b8(%rip),%ymm1        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,13,140,30,3,0        ; vbroadcastss  0x31e8c(%rip),%ymm1        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,116,92,215                      ; vsubps        %ymm7,%ymm1,%ymm10
   DB  197,172,89,210                      ; vmulps        %ymm2,%ymm10,%ymm2
   DB  197,116,92,219                      ; vsubps        %ymm3,%ymm1,%ymm11
@@ -1037,11 +1037,11 @@
   DB  197,108,89,199                      ; vmulps        %ymm7,%ymm2,%ymm8
   DB  197,116,89,215                      ; vmulps        %ymm7,%ymm1,%ymm10
   DB  197,52,89,223                       ; vmulps        %ymm7,%ymm9,%ymm11
-  DB  196,98,125,24,45,103,36,3,0         ; vbroadcastss  0x32467(%rip),%ymm13        # 334ec <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
-  DB  196,98,125,24,53,98,36,3,0          ; vbroadcastss  0x32462(%rip),%ymm14        # 334f0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
+  DB  196,98,125,24,45,59,30,3,0          ; vbroadcastss  0x31e3b(%rip),%ymm13        # 32ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  DB  196,98,125,24,53,54,30,3,0          ; vbroadcastss  0x31e36(%rip),%ymm14        # 32ec4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
   DB  196,65,84,89,230                    ; vmulps        %ymm14,%ymm5,%ymm12
   DB  196,66,93,184,229                   ; vfmadd231ps   %ymm13,%ymm4,%ymm12
-  DB  196,98,125,24,61,83,36,3,0          ; vbroadcastss  0x32453(%rip),%ymm15        # 334f4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
+  DB  196,98,125,24,61,39,30,3,0          ; vbroadcastss  0x31e27(%rip),%ymm15        # 32ec8 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
   DB  196,66,77,184,231                   ; vfmadd231ps   %ymm15,%ymm6,%ymm12
   DB  196,65,44,89,206                    ; vmulps        %ymm14,%ymm10,%ymm9
   DB  196,66,61,184,205                   ; vfmadd231ps   %ymm13,%ymm8,%ymm9
@@ -1097,7 +1097,7 @@
   DB  196,193,116,95,206                  ; vmaxps        %ymm14,%ymm1,%ymm1
   DB  196,65,44,95,198                    ; vmaxps        %ymm14,%ymm10,%ymm8
   DB  196,65,124,95,206                   ; vmaxps        %ymm14,%ymm0,%ymm9
-  DB  196,226,125,24,5,9,35,3,0           ; vbroadcastss  0x32309(%rip),%ymm0        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,5,221,28,3,0         ; vbroadcastss  0x31cdd(%rip),%ymm0        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,124,92,215                      ; vsubps        %ymm7,%ymm0,%ymm10
   DB  197,172,89,210                      ; vmulps        %ymm2,%ymm10,%ymm2
   DB  197,124,92,219                      ; vsubps        %ymm3,%ymm0,%ymm11
@@ -1125,11 +1125,11 @@
   DB  197,100,89,196                      ; vmulps        %ymm4,%ymm3,%ymm8
   DB  197,100,89,213                      ; vmulps        %ymm5,%ymm3,%ymm10
   DB  197,100,89,222                      ; vmulps        %ymm6,%ymm3,%ymm11
-  DB  196,98,125,24,45,184,34,3,0         ; vbroadcastss  0x322b8(%rip),%ymm13        # 334ec <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
-  DB  196,98,125,24,53,179,34,3,0         ; vbroadcastss  0x322b3(%rip),%ymm14        # 334f0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
+  DB  196,98,125,24,45,140,28,3,0         ; vbroadcastss  0x31c8c(%rip),%ymm13        # 32ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  DB  196,98,125,24,53,135,28,3,0         ; vbroadcastss  0x31c87(%rip),%ymm14        # 32ec4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
   DB  196,65,116,89,230                   ; vmulps        %ymm14,%ymm1,%ymm12
   DB  196,66,109,184,229                  ; vfmadd231ps   %ymm13,%ymm2,%ymm12
-  DB  196,98,125,24,61,164,34,3,0         ; vbroadcastss  0x322a4(%rip),%ymm15        # 334f4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
+  DB  196,98,125,24,61,120,28,3,0         ; vbroadcastss  0x31c78(%rip),%ymm15        # 32ec8 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
   DB  196,66,53,184,231                   ; vfmadd231ps   %ymm15,%ymm9,%ymm12
   DB  196,65,44,89,206                    ; vmulps        %ymm14,%ymm10,%ymm9
   DB  196,66,61,184,205                   ; vfmadd231ps   %ymm13,%ymm8,%ymm9
@@ -1185,7 +1185,7 @@
   DB  196,193,116,95,206                  ; vmaxps        %ymm14,%ymm1,%ymm1
   DB  196,65,44,95,198                    ; vmaxps        %ymm14,%ymm10,%ymm8
   DB  196,65,124,95,206                   ; vmaxps        %ymm14,%ymm0,%ymm9
-  DB  196,226,125,24,5,90,33,3,0          ; vbroadcastss  0x3215a(%rip),%ymm0        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,5,46,27,3,0          ; vbroadcastss  0x31b2e(%rip),%ymm0        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,124,92,215                      ; vsubps        %ymm7,%ymm0,%ymm10
   DB  197,172,89,210                      ; vmulps        %ymm2,%ymm10,%ymm2
   DB  197,124,92,219                      ; vsubps        %ymm3,%ymm0,%ymm11
@@ -1206,27 +1206,25 @@
 PUBLIC _sk_srcover_rgba_8888_hsw
 _sk_srcover_rgba_8888_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,224,0,0,0                    ; jne           14b7 <_sk_srcover_rgba_8888_hsw+0x100>
-  DB  196,129,126,111,60,152              ; vmovdqu       (%r8,%r11,4),%ymm7
-  DB  197,197,219,37,155,34,3,0           ; vpand         0x3229b(%rip),%ymm7,%ymm4        # 33680 <_sk_srcover_bgra_8888_sse2_lowp+0x464>
+  DB  15,133,224,0,0,0                    ; jne           14b1 <_sk_srcover_rgba_8888_hsw+0xfa>
+  DB  196,193,126,111,60,144              ; vmovdqu       (%r8,%rdx,4),%ymm7
+  DB  197,197,219,37,129,28,3,0           ; vpand         0x31c81(%rip),%ymm7,%ymm4        # 33060 <_sk_srcover_bgra_8888_sse2_lowp+0x470>
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,226,69,0,45,174,34,3,0          ; vpshufb       0x322ae(%rip),%ymm7,%ymm5        # 336a0 <_sk_srcover_bgra_8888_sse2_lowp+0x484>
+  DB  196,226,69,0,45,148,28,3,0          ; vpshufb       0x31c94(%rip),%ymm7,%ymm5        # 33080 <_sk_srcover_bgra_8888_sse2_lowp+0x490>
   DB  197,252,91,237                      ; vcvtdq2ps     %ymm5,%ymm5
-  DB  196,226,69,0,53,193,34,3,0          ; vpshufb       0x322c1(%rip),%ymm7,%ymm6        # 336c0 <_sk_srcover_bgra_8888_sse2_lowp+0x4a4>
+  DB  196,226,69,0,53,167,28,3,0          ; vpshufb       0x31ca7(%rip),%ymm7,%ymm6        # 330a0 <_sk_srcover_bgra_8888_sse2_lowp+0x4b0>
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,252,91,246                      ; vcvtdq2ps     %ymm6,%ymm6
   DB  197,197,114,215,24                  ; vpsrld        $0x18,%ymm7,%ymm7
   DB  197,252,91,255                      ; vcvtdq2ps     %ymm7,%ymm7
-  DB  196,98,125,24,13,178,32,3,0         ; vbroadcastss  0x320b2(%rip),%ymm9        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,13,140,26,3,0         ; vbroadcastss  0x31a8c(%rip),%ymm9        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,52,92,203                       ; vsubps        %ymm3,%ymm9,%ymm9
-  DB  196,98,125,24,21,209,32,3,0         ; vbroadcastss  0x320d1(%rip),%ymm10        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  196,98,125,24,21,171,26,3,0         ; vbroadcastss  0x31aab(%rip),%ymm10        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   DB  196,193,124,89,194                  ; vmulps        %ymm10,%ymm0,%ymm0
   DB  196,194,93,184,193                  ; vfmadd231ps   %ymm9,%ymm4,%ymm0
   DB  196,193,116,89,202                  ; vmulps        %ymm10,%ymm1,%ymm1
@@ -1254,68 +1252,68 @@
   DB  196,65,37,235,192                   ; vpor          %ymm8,%ymm11,%ymm8
   DB  196,65,53,235,192                   ; vpor          %ymm8,%ymm9,%ymm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,65                              ; jne           14ee <_sk_srcover_rgba_8888_hsw+0x137>
-  DB  196,1,126,127,4,152                 ; vmovdqu       %ymm8,(%r8,%r11,4)
+  DB  117,58                              ; jne           14e1 <_sk_srcover_rgba_8888_hsw+0x12a>
+  DB  196,65,126,127,4,144                ; vmovdqu       %ymm8,(%r8,%rdx,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  197,197,239,255                     ; vpxor         %ymm7,%ymm7,%ymm7
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,14,255,255,255               ; ja            13dd <_sk_srcover_rgba_8888_hsw+0x26>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,254,0,0,0                 ; lea           0xfe(%rip),%r10        # 15d8 <_sk_srcover_rgba_8888_hsw+0x221>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
-  DB  255,224                             ; jmpq          *%rax
-  DB  196,129,121,110,60,152              ; vmovd         (%r8,%r11,4),%xmm7
-  DB  233,239,254,255,255                 ; jmpq          13dd <_sk_srcover_rgba_8888_hsw+0x26>
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,181                             ; ja            14b3 <_sk_srcover_rgba_8888_hsw+0xfc>
-  DB  65,15,182,193                       ; movzbl        %r9b,%eax
-  DB  76,141,13,235,0,0,0                 ; lea           0xeb(%rip),%r9        # 15f4 <_sk_srcover_rgba_8888_hsw+0x23d>
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  15,135,20,255,255,255               ; ja            13d7 <_sk_srcover_rgba_8888_hsw+0x20>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,247,0,0,0                 ; lea           0xf7(%rip),%r9        # 15c4 <_sk_srcover_rgba_8888_hsw+0x20d>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,1,121,126,4,152                 ; vmovd         %xmm8,(%r8,%r11,4)
-  DB  235,153                             ; jmp           14b3 <_sk_srcover_rgba_8888_hsw+0xfc>
-  DB  196,129,121,110,100,152,8           ; vmovd         0x8(%r8,%r11,4),%xmm4
+  DB  196,193,121,110,60,144              ; vmovd         (%r8,%rdx,4),%xmm7
+  DB  233,246,254,255,255                 ; jmpq          13d7 <_sk_srcover_rgba_8888_hsw+0x20>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,194                             ; ja            14ad <_sk_srcover_rgba_8888_hsw+0xf6>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,235,0,0,0                 ; lea           0xeb(%rip),%r9        # 15e0 <_sk_srcover_rgba_8888_hsw+0x229>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
+  DB  255,224                             ; jmpq          *%rax
+  DB  196,65,121,126,4,144                ; vmovd         %xmm8,(%r8,%rdx,4)
+  DB  235,167                             ; jmp           14ad <_sk_srcover_rgba_8888_hsw+0xf6>
+  DB  196,193,121,110,100,144,8           ; vmovd         0x8(%r8,%rdx,4),%xmm4
   DB  196,226,121,89,228                  ; vpbroadcastq  %xmm4,%xmm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
   DB  196,227,85,2,252,4                  ; vpblendd      $0x4,%ymm4,%ymm5,%ymm7
-  DB  196,129,122,126,36,152              ; vmovq         (%r8,%r11,4),%xmm4
+  DB  196,193,122,126,36,144              ; vmovq         (%r8,%rdx,4),%xmm4
   DB  196,227,69,2,252,3                  ; vpblendd      $0x3,%ymm4,%ymm7,%ymm7
-  DB  233,156,254,255,255                 ; jmpq          13dd <_sk_srcover_rgba_8888_hsw+0x26>
-  DB  196,129,121,110,100,152,24          ; vmovd         0x18(%r8,%r11,4),%xmm4
+  DB  233,170,254,255,255                 ; jmpq          13d7 <_sk_srcover_rgba_8888_hsw+0x20>
+  DB  196,193,121,110,100,144,24          ; vmovd         0x18(%r8,%rdx,4),%xmm4
   DB  196,226,125,89,228                  ; vpbroadcastq  %xmm4,%ymm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
   DB  196,227,85,2,252,64                 ; vpblendd      $0x40,%ymm4,%ymm5,%ymm7
   DB  196,227,125,57,252,1                ; vextracti128  $0x1,%ymm7,%xmm4
-  DB  196,131,89,34,100,152,20,1          ; vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm4,%xmm4
+  DB  196,195,89,34,100,144,20,1          ; vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm4,%xmm4
   DB  196,227,69,56,252,1                 ; vinserti128   $0x1,%xmm4,%ymm7,%ymm7
   DB  196,227,125,57,252,1                ; vextracti128  $0x1,%ymm7,%xmm4
-  DB  196,131,89,34,100,152,16,0          ; vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm4,%xmm4
+  DB  196,195,89,34,100,144,16,0          ; vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm4,%xmm4
   DB  196,227,69,56,252,1                 ; vinserti128   $0x1,%xmm4,%ymm7,%ymm7
-  DB  196,129,122,111,36,152              ; vmovdqu       (%r8,%r11,4),%xmm4
+  DB  196,193,122,111,36,144              ; vmovdqu       (%r8,%rdx,4),%xmm4
   DB  196,227,93,2,255,240                ; vpblendd      $0xf0,%ymm7,%ymm4,%ymm7
-  DB  233,77,254,255,255                  ; jmpq          13dd <_sk_srcover_rgba_8888_hsw+0x26>
-  DB  196,3,121,22,68,152,8,2             ; vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
-  DB  196,1,121,214,4,152                 ; vmovq         %xmm8,(%r8,%r11,4)
-  DB  233,16,255,255,255                  ; jmpq          14b3 <_sk_srcover_rgba_8888_hsw+0xfc>
+  DB  233,91,254,255,255                  ; jmpq          13d7 <_sk_srcover_rgba_8888_hsw+0x20>
+  DB  196,67,121,22,68,144,8,2            ; vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
+  DB  196,65,121,214,4,144                ; vmovq         %xmm8,(%r8,%rdx,4)
+  DB  233,30,255,255,255                  ; jmpq          14ad <_sk_srcover_rgba_8888_hsw+0xf6>
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
-  DB  196,3,121,22,76,152,24,2            ; vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
+  DB  196,67,121,22,76,144,24,2           ; vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
-  DB  196,3,121,22,76,152,20,1            ; vpextrd       $0x1,%xmm9,0x14(%r8,%r11,4)
+  DB  196,67,121,22,76,144,20,1           ; vpextrd       $0x1,%xmm9,0x14(%r8,%rdx,4)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
-  DB  196,1,121,126,76,152,16             ; vmovd         %xmm9,0x10(%r8,%r11,4)
-  DB  196,1,122,127,4,152                 ; vmovdqu       %xmm8,(%r8,%r11,4)
-  DB  233,220,254,255,255                 ; jmpq          14b3 <_sk_srcover_rgba_8888_hsw+0xfc>
+  DB  196,65,121,126,76,144,16            ; vmovd         %xmm9,0x10(%r8,%rdx,4)
+  DB  196,65,122,127,4,144                ; vmovdqu       %xmm8,(%r8,%rdx,4)
+  DB  233,234,254,255,255                 ; jmpq          14ad <_sk_srcover_rgba_8888_hsw+0xf6>
   DB  144                                 ; nop
-  DB  11,255                              ; or            %edi,%edi
+  DB  18,255                              ; adc           %bh,%bh
   DB  255                                 ; (bad)
   DB  255,88,255                          ; lcall         *-0x1(%rax)
   DB  255                                 ; (bad)
@@ -1325,7 +1323,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  127,255                             ; jg            15ed <_sk_srcover_rgba_8888_hsw+0x236>
+  DB  127,255                             ; jg            15d9 <_sk_srcover_rgba_8888_hsw+0x222>
   DB  255                                 ; (bad)
   DB  255,105,255                         ; ljmp          *-0x1(%rcx)
   DB  255                                 ; (bad)
@@ -1349,27 +1347,25 @@
 PUBLIC _sk_srcover_bgra_8888_hsw
 _sk_srcover_bgra_8888_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,224,0,0,0                    ; jne           1710 <_sk_srcover_bgra_8888_hsw+0x100>
-  DB  196,129,126,111,60,152              ; vmovdqu       (%r8,%r11,4),%ymm7
-  DB  197,197,219,37,162,32,3,0           ; vpand         0x320a2(%rip),%ymm7,%ymm4        # 336e0 <_sk_srcover_bgra_8888_sse2_lowp+0x4c4>
+  DB  15,133,224,0,0,0                    ; jne           16f6 <_sk_srcover_bgra_8888_hsw+0xfa>
+  DB  196,193,126,111,60,144              ; vmovdqu       (%r8,%rdx,4),%ymm7
+  DB  197,197,219,37,156,26,3,0           ; vpand         0x31a9c(%rip),%ymm7,%ymm4        # 330c0 <_sk_srcover_bgra_8888_sse2_lowp+0x4d0>
   DB  197,252,91,244                      ; vcvtdq2ps     %ymm4,%ymm6
-  DB  196,226,69,0,37,181,32,3,0          ; vpshufb       0x320b5(%rip),%ymm7,%ymm4        # 33700 <_sk_srcover_bgra_8888_sse2_lowp+0x4e4>
+  DB  196,226,69,0,37,175,26,3,0          ; vpshufb       0x31aaf(%rip),%ymm7,%ymm4        # 330e0 <_sk_srcover_bgra_8888_sse2_lowp+0x4f0>
   DB  197,252,91,236                      ; vcvtdq2ps     %ymm4,%ymm5
-  DB  196,226,69,0,37,200,32,3,0          ; vpshufb       0x320c8(%rip),%ymm7,%ymm4        # 33720 <_sk_srcover_bgra_8888_sse2_lowp+0x504>
+  DB  196,226,69,0,37,194,26,3,0          ; vpshufb       0x31ac2(%rip),%ymm7,%ymm4        # 33100 <_sk_srcover_bgra_8888_sse2_lowp+0x510>
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
   DB  197,197,114,215,24                  ; vpsrld        $0x18,%ymm7,%ymm7
   DB  197,252,91,255                      ; vcvtdq2ps     %ymm7,%ymm7
-  DB  196,98,125,24,13,89,30,3,0          ; vbroadcastss  0x31e59(%rip),%ymm9        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,13,71,24,3,0          ; vbroadcastss  0x31847(%rip),%ymm9        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,52,92,203                       ; vsubps        %ymm3,%ymm9,%ymm9
-  DB  196,98,125,24,21,120,30,3,0         ; vbroadcastss  0x31e78(%rip),%ymm10        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  196,98,125,24,21,102,24,3,0         ; vbroadcastss  0x31866(%rip),%ymm10        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   DB  196,193,124,89,194                  ; vmulps        %ymm10,%ymm0,%ymm0
   DB  196,194,93,184,193                  ; vfmadd231ps   %ymm9,%ymm4,%ymm0
   DB  196,193,116,89,202                  ; vmulps        %ymm10,%ymm1,%ymm1
@@ -1397,67 +1393,67 @@
   DB  196,65,37,235,192                   ; vpor          %ymm8,%ymm11,%ymm8
   DB  196,65,53,235,192                   ; vpor          %ymm8,%ymm9,%ymm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,65                              ; jne           1747 <_sk_srcover_bgra_8888_hsw+0x137>
-  DB  196,1,126,127,4,152                 ; vmovdqu       %ymm8,(%r8,%r11,4)
+  DB  117,58                              ; jne           1726 <_sk_srcover_bgra_8888_hsw+0x12a>
+  DB  196,65,126,127,4,144                ; vmovdqu       %ymm8,(%r8,%rdx,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  197,197,239,255                     ; vpxor         %ymm7,%ymm7,%ymm7
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,14,255,255,255               ; ja            1636 <_sk_srcover_bgra_8888_hsw+0x26>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,253,0,0,0                 ; lea           0xfd(%rip),%r10        # 1830 <_sk_srcover_bgra_8888_hsw+0x220>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
-  DB  255,224                             ; jmpq          *%rax
-  DB  196,129,121,110,60,152              ; vmovd         (%r8,%r11,4),%xmm7
-  DB  233,239,254,255,255                 ; jmpq          1636 <_sk_srcover_bgra_8888_hsw+0x26>
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,181                             ; ja            170c <_sk_srcover_bgra_8888_hsw+0xfc>
-  DB  65,15,182,193                       ; movzbl        %r9b,%eax
-  DB  76,141,13,234,0,0,0                 ; lea           0xea(%rip),%r9        # 184c <_sk_srcover_bgra_8888_hsw+0x23c>
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  15,135,20,255,255,255               ; ja            161c <_sk_srcover_bgra_8888_hsw+0x20>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,246,0,0,0                 ; lea           0xf6(%rip),%r9        # 1808 <_sk_srcover_bgra_8888_hsw+0x20c>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,1,121,126,4,152                 ; vmovd         %xmm8,(%r8,%r11,4)
-  DB  235,153                             ; jmp           170c <_sk_srcover_bgra_8888_hsw+0xfc>
-  DB  196,129,121,110,100,152,8           ; vmovd         0x8(%r8,%r11,4),%xmm4
+  DB  196,193,121,110,60,144              ; vmovd         (%r8,%rdx,4),%xmm7
+  DB  233,246,254,255,255                 ; jmpq          161c <_sk_srcover_bgra_8888_hsw+0x20>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,194                             ; ja            16f2 <_sk_srcover_bgra_8888_hsw+0xf6>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,234,0,0,0                 ; lea           0xea(%rip),%r9        # 1824 <_sk_srcover_bgra_8888_hsw+0x228>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
+  DB  255,224                             ; jmpq          *%rax
+  DB  196,65,121,126,4,144                ; vmovd         %xmm8,(%r8,%rdx,4)
+  DB  235,167                             ; jmp           16f2 <_sk_srcover_bgra_8888_hsw+0xf6>
+  DB  196,193,121,110,100,144,8           ; vmovd         0x8(%r8,%rdx,4),%xmm4
   DB  196,226,121,89,228                  ; vpbroadcastq  %xmm4,%xmm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
   DB  196,227,85,2,252,4                  ; vpblendd      $0x4,%ymm4,%ymm5,%ymm7
-  DB  196,129,122,126,36,152              ; vmovq         (%r8,%r11,4),%xmm4
+  DB  196,193,122,126,36,144              ; vmovq         (%r8,%rdx,4),%xmm4
   DB  196,227,69,2,252,3                  ; vpblendd      $0x3,%ymm4,%ymm7,%ymm7
-  DB  233,156,254,255,255                 ; jmpq          1636 <_sk_srcover_bgra_8888_hsw+0x26>
-  DB  196,129,121,110,100,152,24          ; vmovd         0x18(%r8,%r11,4),%xmm4
+  DB  233,170,254,255,255                 ; jmpq          161c <_sk_srcover_bgra_8888_hsw+0x20>
+  DB  196,193,121,110,100,144,24          ; vmovd         0x18(%r8,%rdx,4),%xmm4
   DB  196,226,125,89,228                  ; vpbroadcastq  %xmm4,%ymm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
   DB  196,227,85,2,252,64                 ; vpblendd      $0x40,%ymm4,%ymm5,%ymm7
   DB  196,227,125,57,252,1                ; vextracti128  $0x1,%ymm7,%xmm4
-  DB  196,131,89,34,100,152,20,1          ; vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm4,%xmm4
+  DB  196,195,89,34,100,144,20,1          ; vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm4,%xmm4
   DB  196,227,69,56,252,1                 ; vinserti128   $0x1,%xmm4,%ymm7,%ymm7
   DB  196,227,125,57,252,1                ; vextracti128  $0x1,%ymm7,%xmm4
-  DB  196,131,89,34,100,152,16,0          ; vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm4,%xmm4
+  DB  196,195,89,34,100,144,16,0          ; vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm4,%xmm4
   DB  196,227,69,56,252,1                 ; vinserti128   $0x1,%xmm4,%ymm7,%ymm7
-  DB  196,129,122,111,36,152              ; vmovdqu       (%r8,%r11,4),%xmm4
+  DB  196,193,122,111,36,144              ; vmovdqu       (%r8,%rdx,4),%xmm4
   DB  196,227,93,2,255,240                ; vpblendd      $0xf0,%ymm7,%ymm4,%ymm7
-  DB  233,77,254,255,255                  ; jmpq          1636 <_sk_srcover_bgra_8888_hsw+0x26>
-  DB  196,3,121,22,68,152,8,2             ; vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
-  DB  196,1,121,214,4,152                 ; vmovq         %xmm8,(%r8,%r11,4)
-  DB  233,16,255,255,255                  ; jmpq          170c <_sk_srcover_bgra_8888_hsw+0xfc>
+  DB  233,91,254,255,255                  ; jmpq          161c <_sk_srcover_bgra_8888_hsw+0x20>
+  DB  196,67,121,22,68,144,8,2            ; vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
+  DB  196,65,121,214,4,144                ; vmovq         %xmm8,(%r8,%rdx,4)
+  DB  233,30,255,255,255                  ; jmpq          16f2 <_sk_srcover_bgra_8888_hsw+0xf6>
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
-  DB  196,3,121,22,76,152,24,2            ; vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
+  DB  196,67,121,22,76,144,24,2           ; vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
-  DB  196,3,121,22,76,152,20,1            ; vpextrd       $0x1,%xmm9,0x14(%r8,%r11,4)
+  DB  196,67,121,22,76,144,20,1           ; vpextrd       $0x1,%xmm9,0x14(%r8,%rdx,4)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
-  DB  196,1,121,126,76,152,16             ; vmovd         %xmm9,0x10(%r8,%r11,4)
-  DB  196,1,122,127,4,152                 ; vmovdqu       %xmm8,(%r8,%r11,4)
-  DB  233,220,254,255,255                 ; jmpq          170c <_sk_srcover_bgra_8888_hsw+0xfc>
-  DB  12,255                              ; or            $0xff,%al
+  DB  196,65,121,126,76,144,16            ; vmovd         %xmm9,0x10(%r8,%rdx,4)
+  DB  196,65,122,127,4,144                ; vmovdqu       %xmm8,(%r8,%rdx,4)
+  DB  233,234,254,255,255                 ; jmpq          16f2 <_sk_srcover_bgra_8888_hsw+0xf6>
+  DB  19,255                              ; adc           %edi,%edi
   DB  255                                 ; (bad)
   DB  255,89,255                          ; lcall         *-0x1(%rcx)
   DB  255                                 ; (bad)
@@ -1499,7 +1495,7 @@
 
 PUBLIC _sk_clamp_1_hsw
 _sk_clamp_1_hsw LABEL PROC
-  DB  196,98,125,24,5,62,28,3,0           ; vbroadcastss  0x31c3e(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,58,22,3,0           ; vbroadcastss  0x3163a(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
   DB  196,193,116,93,200                  ; vminps        %ymm8,%ymm1,%ymm1
   DB  196,193,108,93,208                  ; vminps        %ymm8,%ymm2,%ymm2
@@ -1509,7 +1505,7 @@
 
 PUBLIC _sk_clamp_a_hsw
 _sk_clamp_a_hsw LABEL PROC
-  DB  196,98,125,24,5,29,28,3,0           ; vbroadcastss  0x31c1d(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,25,22,3,0           ; vbroadcastss  0x31619(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,100,93,216                  ; vminps        %ymm8,%ymm3,%ymm3
   DB  197,252,93,195                      ; vminps        %ymm3,%ymm0,%ymm0
   DB  197,244,93,203                      ; vminps        %ymm3,%ymm1,%ymm1
@@ -1519,7 +1515,7 @@
 
 PUBLIC _sk_clamp_a_dst_hsw
 _sk_clamp_a_dst_hsw LABEL PROC
-  DB  196,98,125,24,5,255,27,3,0          ; vbroadcastss  0x31bff(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,251,21,3,0          ; vbroadcastss  0x315fb(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,68,93,248                   ; vminps        %ymm8,%ymm7,%ymm7
   DB  197,220,93,231                      ; vminps        %ymm7,%ymm4,%ymm4
   DB  197,212,93,239                      ; vminps        %ymm7,%ymm5,%ymm5
@@ -1546,7 +1542,7 @@
 
 PUBLIC _sk_invert_hsw
 _sk_invert_hsw LABEL PROC
-  DB  196,98,125,24,5,186,27,3,0          ; vbroadcastss  0x31bba(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,182,21,3,0          ; vbroadcastss  0x315b6(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,188,92,192                      ; vsubps        %ymm0,%ymm8,%ymm0
   DB  197,188,92,201                      ; vsubps        %ymm1,%ymm8,%ymm1
   DB  197,188,92,210                      ; vsubps        %ymm2,%ymm8,%ymm2
@@ -1590,9 +1586,9 @@
 
 PUBLIC _sk_unpremul_hsw
 _sk_unpremul_hsw LABEL PROC
-  DB  196,98,125,24,5,85,27,3,0           ; vbroadcastss  0x31b55(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,81,21,3,0           ; vbroadcastss  0x31551(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,94,195                       ; vdivps        %ymm3,%ymm8,%ymm8
-  DB  196,98,125,24,13,120,27,3,0         ; vbroadcastss  0x31b78(%rip),%ymm9        # 334fc <_sk_srcover_bgra_8888_sse2_lowp+0x2e0>
+  DB  196,98,125,24,13,116,21,3,0         ; vbroadcastss  0x31574(%rip),%ymm9        # 32ed0 <_sk_srcover_bgra_8888_sse2_lowp+0x2e0>
   DB  196,65,60,194,201,1                 ; vcmpltps      %ymm9,%ymm8,%ymm9
   DB  196,65,44,87,210                    ; vxorps        %ymm10,%ymm10,%ymm10
   DB  196,67,45,74,192,144                ; vblendvps     %ymm9,%ymm8,%ymm10,%ymm8
@@ -1604,16 +1600,16 @@
 
 PUBLIC _sk_from_srgb_hsw
 _sk_from_srgb_hsw LABEL PROC
-  DB  196,98,125,24,5,82,27,3,0           ; vbroadcastss  0x31b52(%rip),%ymm8        # 33500 <_sk_srcover_bgra_8888_sse2_lowp+0x2e4>
+  DB  196,98,125,24,5,78,21,3,0           ; vbroadcastss  0x3154e(%rip),%ymm8        # 32ed4 <_sk_srcover_bgra_8888_sse2_lowp+0x2e4>
   DB  196,65,124,89,200                   ; vmulps        %ymm8,%ymm0,%ymm9
   DB  197,124,89,208                      ; vmulps        %ymm0,%ymm0,%ymm10
-  DB  196,98,125,24,29,68,27,3,0          ; vbroadcastss  0x31b44(%rip),%ymm11        # 33504 <_sk_srcover_bgra_8888_sse2_lowp+0x2e8>
-  DB  196,98,125,24,37,35,27,3,0          ; vbroadcastss  0x31b23(%rip),%ymm12        # 334ec <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  DB  196,98,125,24,29,64,21,3,0          ; vbroadcastss  0x31540(%rip),%ymm11        # 32ed8 <_sk_srcover_bgra_8888_sse2_lowp+0x2e8>
+  DB  196,98,125,24,37,31,21,3,0          ; vbroadcastss  0x3151f(%rip),%ymm12        # 32ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
   DB  196,65,124,40,236                   ; vmovaps       %ymm12,%ymm13
   DB  196,66,125,168,235                  ; vfmadd213ps   %ymm11,%ymm0,%ymm13
-  DB  196,98,125,24,53,44,27,3,0          ; vbroadcastss  0x31b2c(%rip),%ymm14        # 33508 <_sk_srcover_bgra_8888_sse2_lowp+0x2ec>
+  DB  196,98,125,24,53,40,21,3,0          ; vbroadcastss  0x31528(%rip),%ymm14        # 32edc <_sk_srcover_bgra_8888_sse2_lowp+0x2ec>
   DB  196,66,45,168,238                   ; vfmadd213ps   %ymm14,%ymm10,%ymm13
-  DB  196,98,125,24,21,34,27,3,0          ; vbroadcastss  0x31b22(%rip),%ymm10        # 3350c <_sk_srcover_bgra_8888_sse2_lowp+0x2f0>
+  DB  196,98,125,24,21,30,21,3,0          ; vbroadcastss  0x3151e(%rip),%ymm10        # 32ee0 <_sk_srcover_bgra_8888_sse2_lowp+0x2f0>
   DB  196,193,124,194,194,1               ; vcmpltps      %ymm10,%ymm0,%ymm0
   DB  196,195,21,74,193,0                 ; vblendvps     %ymm0,%ymm9,%ymm13,%ymm0
   DB  196,65,116,89,200                   ; vmulps        %ymm8,%ymm1,%ymm9
@@ -1634,16 +1630,16 @@
 
 PUBLIC _sk_from_srgb_dst_hsw
 _sk_from_srgb_dst_hsw LABEL PROC
-  DB  196,98,125,24,5,186,26,3,0          ; vbroadcastss  0x31aba(%rip),%ymm8        # 33500 <_sk_srcover_bgra_8888_sse2_lowp+0x2e4>
+  DB  196,98,125,24,5,182,20,3,0          ; vbroadcastss  0x314b6(%rip),%ymm8        # 32ed4 <_sk_srcover_bgra_8888_sse2_lowp+0x2e4>
   DB  196,65,92,89,200                    ; vmulps        %ymm8,%ymm4,%ymm9
   DB  197,92,89,212                       ; vmulps        %ymm4,%ymm4,%ymm10
-  DB  196,98,125,24,29,172,26,3,0         ; vbroadcastss  0x31aac(%rip),%ymm11        # 33504 <_sk_srcover_bgra_8888_sse2_lowp+0x2e8>
-  DB  196,98,125,24,37,139,26,3,0         ; vbroadcastss  0x31a8b(%rip),%ymm12        # 334ec <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  DB  196,98,125,24,29,168,20,3,0         ; vbroadcastss  0x314a8(%rip),%ymm11        # 32ed8 <_sk_srcover_bgra_8888_sse2_lowp+0x2e8>
+  DB  196,98,125,24,37,135,20,3,0         ; vbroadcastss  0x31487(%rip),%ymm12        # 32ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
   DB  196,65,124,40,236                   ; vmovaps       %ymm12,%ymm13
   DB  196,66,93,168,235                   ; vfmadd213ps   %ymm11,%ymm4,%ymm13
-  DB  196,98,125,24,53,148,26,3,0         ; vbroadcastss  0x31a94(%rip),%ymm14        # 33508 <_sk_srcover_bgra_8888_sse2_lowp+0x2ec>
+  DB  196,98,125,24,53,144,20,3,0         ; vbroadcastss  0x31490(%rip),%ymm14        # 32edc <_sk_srcover_bgra_8888_sse2_lowp+0x2ec>
   DB  196,66,45,168,238                   ; vfmadd213ps   %ymm14,%ymm10,%ymm13
-  DB  196,98,125,24,21,138,26,3,0         ; vbroadcastss  0x31a8a(%rip),%ymm10        # 3350c <_sk_srcover_bgra_8888_sse2_lowp+0x2f0>
+  DB  196,98,125,24,21,134,20,3,0         ; vbroadcastss  0x31486(%rip),%ymm10        # 32ee0 <_sk_srcover_bgra_8888_sse2_lowp+0x2f0>
   DB  196,193,92,194,226,1                ; vcmpltps      %ymm10,%ymm4,%ymm4
   DB  196,195,21,74,225,64                ; vblendvps     %ymm4,%ymm9,%ymm13,%ymm4
   DB  196,65,84,89,200                    ; vmulps        %ymm8,%ymm5,%ymm9
@@ -1665,19 +1661,19 @@
 PUBLIC _sk_to_srgb_hsw
 _sk_to_srgb_hsw LABEL PROC
   DB  197,124,82,200                      ; vrsqrtps      %ymm0,%ymm9
-  DB  196,98,125,24,5,46,26,3,0           ; vbroadcastss  0x31a2e(%rip),%ymm8        # 33510 <_sk_srcover_bgra_8888_sse2_lowp+0x2f4>
+  DB  196,98,125,24,5,42,20,3,0           ; vbroadcastss  0x3142a(%rip),%ymm8        # 32ee4 <_sk_srcover_bgra_8888_sse2_lowp+0x2f4>
   DB  196,65,124,89,208                   ; vmulps        %ymm8,%ymm0,%ymm10
-  DB  196,98,125,24,29,36,26,3,0          ; vbroadcastss  0x31a24(%rip),%ymm11        # 33514 <_sk_srcover_bgra_8888_sse2_lowp+0x2f8>
-  DB  196,98,125,24,37,31,26,3,0          ; vbroadcastss  0x31a1f(%rip),%ymm12        # 33518 <_sk_srcover_bgra_8888_sse2_lowp+0x2fc>
+  DB  196,98,125,24,29,32,20,3,0          ; vbroadcastss  0x31420(%rip),%ymm11        # 32ee8 <_sk_srcover_bgra_8888_sse2_lowp+0x2f8>
+  DB  196,98,125,24,37,27,20,3,0          ; vbroadcastss  0x3141b(%rip),%ymm12        # 32eec <_sk_srcover_bgra_8888_sse2_lowp+0x2fc>
   DB  196,65,124,40,236                   ; vmovaps       %ymm12,%ymm13
   DB  196,66,53,168,235                   ; vfmadd213ps   %ymm11,%ymm9,%ymm13
-  DB  196,98,125,24,53,16,26,3,0          ; vbroadcastss  0x31a10(%rip),%ymm14        # 3351c <_sk_srcover_bgra_8888_sse2_lowp+0x300>
+  DB  196,98,125,24,53,12,20,3,0          ; vbroadcastss  0x3140c(%rip),%ymm14        # 32ef0 <_sk_srcover_bgra_8888_sse2_lowp+0x300>
   DB  196,66,53,168,238                   ; vfmadd213ps   %ymm14,%ymm9,%ymm13
-  DB  196,98,125,24,61,6,26,3,0           ; vbroadcastss  0x31a06(%rip),%ymm15        # 33520 <_sk_srcover_bgra_8888_sse2_lowp+0x304>
+  DB  196,98,125,24,61,2,20,3,0           ; vbroadcastss  0x31402(%rip),%ymm15        # 32ef4 <_sk_srcover_bgra_8888_sse2_lowp+0x304>
   DB  196,65,52,88,207                    ; vaddps        %ymm15,%ymm9,%ymm9
   DB  196,65,124,83,201                   ; vrcpps        %ymm9,%ymm9
   DB  196,65,20,89,201                    ; vmulps        %ymm9,%ymm13,%ymm9
-  DB  196,98,125,24,45,242,25,3,0         ; vbroadcastss  0x319f2(%rip),%ymm13        # 33524 <_sk_srcover_bgra_8888_sse2_lowp+0x308>
+  DB  196,98,125,24,45,238,19,3,0         ; vbroadcastss  0x313ee(%rip),%ymm13        # 32ef8 <_sk_srcover_bgra_8888_sse2_lowp+0x308>
   DB  196,193,124,194,197,1               ; vcmpltps      %ymm13,%ymm0,%ymm0
   DB  196,195,53,74,194,0                 ; vblendvps     %ymm0,%ymm10,%ymm9,%ymm0
   DB  197,124,82,201                      ; vrsqrtps      %ymm1,%ymm9
@@ -1709,26 +1705,26 @@
   DB  197,116,93,202                      ; vminps        %ymm2,%ymm1,%ymm9
   DB  196,65,124,93,201                   ; vminps        %ymm9,%ymm0,%ymm9
   DB  196,65,60,92,209                    ; vsubps        %ymm9,%ymm8,%ymm10
-  DB  196,98,125,24,29,9,25,3,0           ; vbroadcastss  0x31909(%rip),%ymm11        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,29,5,19,3,0           ; vbroadcastss  0x31305(%rip),%ymm11        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,65,36,94,218                    ; vdivps        %ymm10,%ymm11,%ymm11
   DB  197,116,92,226                      ; vsubps        %ymm2,%ymm1,%ymm12
   DB  197,116,194,234,1                   ; vcmpltps      %ymm2,%ymm1,%ymm13
-  DB  196,98,125,24,53,78,25,3,0          ; vbroadcastss  0x3194e(%rip),%ymm14        # 33528 <_sk_srcover_bgra_8888_sse2_lowp+0x30c>
+  DB  196,98,125,24,53,74,19,3,0          ; vbroadcastss  0x3134a(%rip),%ymm14        # 32efc <_sk_srcover_bgra_8888_sse2_lowp+0x30c>
   DB  196,65,4,87,255                     ; vxorps        %ymm15,%ymm15,%ymm15
   DB  196,67,5,74,238,208                 ; vblendvps     %ymm13,%ymm14,%ymm15,%ymm13
   DB  196,66,37,168,229                   ; vfmadd213ps   %ymm13,%ymm11,%ymm12
   DB  197,236,92,208                      ; vsubps        %ymm0,%ymm2,%ymm2
   DB  197,124,92,233                      ; vsubps        %ymm1,%ymm0,%ymm13
-  DB  196,98,125,24,53,53,25,3,0          ; vbroadcastss  0x31935(%rip),%ymm14        # 33530 <_sk_srcover_bgra_8888_sse2_lowp+0x314>
+  DB  196,98,125,24,53,49,19,3,0          ; vbroadcastss  0x31331(%rip),%ymm14        # 32f04 <_sk_srcover_bgra_8888_sse2_lowp+0x314>
   DB  196,66,37,168,238                   ; vfmadd213ps   %ymm14,%ymm11,%ymm13
-  DB  196,98,125,24,53,35,25,3,0          ; vbroadcastss  0x31923(%rip),%ymm14        # 3352c <_sk_srcover_bgra_8888_sse2_lowp+0x310>
+  DB  196,98,125,24,53,31,19,3,0          ; vbroadcastss  0x3131f(%rip),%ymm14        # 32f00 <_sk_srcover_bgra_8888_sse2_lowp+0x310>
   DB  196,194,37,168,214                  ; vfmadd213ps   %ymm14,%ymm11,%ymm2
   DB  197,188,194,201,0                   ; vcmpeqps      %ymm1,%ymm8,%ymm1
   DB  196,227,21,74,202,16                ; vblendvps     %ymm1,%ymm2,%ymm13,%ymm1
   DB  197,188,194,192,0                   ; vcmpeqps      %ymm0,%ymm8,%ymm0
   DB  196,195,117,74,196,0                ; vblendvps     %ymm0,%ymm12,%ymm1,%ymm0
   DB  196,193,60,88,201                   ; vaddps        %ymm9,%ymm8,%ymm1
-  DB  196,98,125,24,29,150,24,3,0         ; vbroadcastss  0x31896(%rip),%ymm11        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,29,146,18,3,0         ; vbroadcastss  0x31292(%rip),%ymm11        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,193,116,89,211                  ; vmulps        %ymm11,%ymm1,%ymm2
   DB  197,36,194,218,1                    ; vcmpltps      %ymm2,%ymm11,%ymm11
   DB  196,65,12,92,224                    ; vsubps        %ymm8,%ymm14,%ymm12
@@ -1738,7 +1734,7 @@
   DB  197,172,94,201                      ; vdivps        %ymm1,%ymm10,%ymm1
   DB  196,195,125,74,199,128              ; vblendvps     %ymm8,%ymm15,%ymm0,%ymm0
   DB  196,195,117,74,207,128              ; vblendvps     %ymm8,%ymm15,%ymm1,%ymm1
-  DB  196,98,125,24,5,201,24,3,0          ; vbroadcastss  0x318c9(%rip),%ymm8        # 33534 <_sk_srcover_bgra_8888_sse2_lowp+0x318>
+  DB  196,98,125,24,5,197,18,3,0          ; vbroadcastss  0x312c5(%rip),%ymm8        # 32f08 <_sk_srcover_bgra_8888_sse2_lowp+0x318>
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -1753,30 +1749,30 @@
   DB  197,252,17,28,36                    ; vmovups       %ymm3,(%rsp)
   DB  197,252,40,233                      ; vmovaps       %ymm1,%ymm5
   DB  197,252,40,224                      ; vmovaps       %ymm0,%ymm4
-  DB  196,98,125,24,5,28,24,3,0           ; vbroadcastss  0x3181c(%rip),%ymm8        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,5,24,18,3,0           ; vbroadcastss  0x31218(%rip),%ymm8        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  197,60,194,202,2                    ; vcmpleps      %ymm2,%ymm8,%ymm9
   DB  197,84,89,210                       ; vmulps        %ymm2,%ymm5,%ymm10
   DB  196,65,84,92,218                    ; vsubps        %ymm10,%ymm5,%ymm11
   DB  196,67,45,74,203,144                ; vblendvps     %ymm9,%ymm11,%ymm10,%ymm9
   DB  197,52,88,210                       ; vaddps        %ymm2,%ymm9,%ymm10
-  DB  196,98,125,24,13,95,24,3,0          ; vbroadcastss  0x3185f(%rip),%ymm9        # 3352c <_sk_srcover_bgra_8888_sse2_lowp+0x310>
+  DB  196,98,125,24,13,91,18,3,0          ; vbroadcastss  0x3125b(%rip),%ymm9        # 32f00 <_sk_srcover_bgra_8888_sse2_lowp+0x310>
   DB  196,66,109,170,202                  ; vfmsub213ps   %ymm10,%ymm2,%ymm9
-  DB  196,98,125,24,29,93,24,3,0          ; vbroadcastss  0x3185d(%rip),%ymm11        # 33538 <_sk_srcover_bgra_8888_sse2_lowp+0x31c>
+  DB  196,98,125,24,29,89,18,3,0          ; vbroadcastss  0x31259(%rip),%ymm11        # 32f0c <_sk_srcover_bgra_8888_sse2_lowp+0x31c>
   DB  196,65,92,88,219                    ; vaddps        %ymm11,%ymm4,%ymm11
   DB  196,67,125,8,227,1                  ; vroundps      $0x1,%ymm11,%ymm12
   DB  196,65,36,92,252                    ; vsubps        %ymm12,%ymm11,%ymm15
   DB  196,65,44,92,217                    ; vsubps        %ymm9,%ymm10,%ymm11
-  DB  196,98,125,24,45,47,24,3,0          ; vbroadcastss  0x3182f(%rip),%ymm13        # 33528 <_sk_srcover_bgra_8888_sse2_lowp+0x30c>
+  DB  196,98,125,24,45,43,18,3,0          ; vbroadcastss  0x3122b(%rip),%ymm13        # 32efc <_sk_srcover_bgra_8888_sse2_lowp+0x30c>
   DB  196,193,4,89,197                    ; vmulps        %ymm13,%ymm15,%ymm0
-  DB  196,98,125,24,53,41,24,3,0          ; vbroadcastss  0x31829(%rip),%ymm14        # 33530 <_sk_srcover_bgra_8888_sse2_lowp+0x314>
+  DB  196,98,125,24,53,37,18,3,0          ; vbroadcastss  0x31225(%rip),%ymm14        # 32f04 <_sk_srcover_bgra_8888_sse2_lowp+0x314>
   DB  197,12,92,224                       ; vsubps        %ymm0,%ymm14,%ymm12
   DB  196,66,37,168,225                   ; vfmadd213ps   %ymm9,%ymm11,%ymm12
-  DB  196,226,125,24,29,35,24,3,0         ; vbroadcastss  0x31823(%rip),%ymm3        # 3353c <_sk_srcover_bgra_8888_sse2_lowp+0x320>
+  DB  196,226,125,24,29,31,18,3,0         ; vbroadcastss  0x3121f(%rip),%ymm3        # 32f10 <_sk_srcover_bgra_8888_sse2_lowp+0x320>
   DB  196,193,100,194,255,2               ; vcmpleps      %ymm15,%ymm3,%ymm7
   DB  196,195,29,74,249,112               ; vblendvps     %ymm7,%ymm9,%ymm12,%ymm7
   DB  196,65,60,194,231,2                 ; vcmpleps      %ymm15,%ymm8,%ymm12
   DB  196,227,45,74,255,192               ; vblendvps     %ymm12,%ymm7,%ymm10,%ymm7
-  DB  196,98,125,24,37,250,23,3,0         ; vbroadcastss  0x317fa(%rip),%ymm12        # 33534 <_sk_srcover_bgra_8888_sse2_lowp+0x318>
+  DB  196,98,125,24,37,246,17,3,0         ; vbroadcastss  0x311f6(%rip),%ymm12        # 32f08 <_sk_srcover_bgra_8888_sse2_lowp+0x318>
   DB  196,65,28,194,255,2                 ; vcmpleps      %ymm15,%ymm12,%ymm15
   DB  196,194,37,168,193                  ; vfmadd213ps   %ymm9,%ymm11,%ymm0
   DB  196,99,125,74,255,240               ; vblendvps     %ymm15,%ymm7,%ymm0,%ymm15
@@ -1792,7 +1788,7 @@
   DB  197,156,194,192,2                   ; vcmpleps      %ymm0,%ymm12,%ymm0
   DB  196,194,37,168,249                  ; vfmadd213ps   %ymm9,%ymm11,%ymm7
   DB  196,227,69,74,201,0                 ; vblendvps     %ymm0,%ymm1,%ymm7,%ymm1
-  DB  196,226,125,24,5,174,23,3,0         ; vbroadcastss  0x317ae(%rip),%ymm0        # 33540 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  DB  196,226,125,24,5,170,17,3,0         ; vbroadcastss  0x311aa(%rip),%ymm0        # 32f14 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
   DB  197,220,88,192                      ; vaddps        %ymm0,%ymm4,%ymm0
   DB  196,227,125,8,224,1                 ; vroundps      $0x1,%ymm0,%ymm4
   DB  197,252,92,196                      ; vsubps        %ymm4,%ymm0,%ymm0
@@ -1834,18 +1830,16 @@
 PUBLIC _sk_scale_u8_hsw
 _sk_scale_u8_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,58                              ; jne           1e87 <_sk_scale_u8_hsw+0x52>
-  DB  196,2,121,48,4,24                   ; vpmovzxbw     (%r8,%r11,1),%xmm8
-  DB  197,57,219,5,213,31,3,0             ; vpand         0x31fd5(%rip),%xmm8,%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  117,58                              ; jne           1e59 <_sk_scale_u8_hsw+0x4c>
+  DB  196,66,121,48,4,16                  ; vpmovzxbw     (%r8,%rdx,1),%xmm8
+  DB  197,57,219,5,227,25,3,0             ; vpand         0x319e3(%rip),%xmm8,%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  196,66,125,51,192                   ; vpmovzxwd     %xmm8,%ymm8
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
-  DB  196,98,125,24,13,214,22,3,0         ; vbroadcastss  0x316d6(%rip),%ymm9        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,98,125,24,13,216,16,3,0         ; vbroadcastss  0x310d8(%rip),%ymm9        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
   DB  197,188,89,192                      ; vmulps        %ymm0,%ymm8,%ymm0
   DB  197,188,89,201                      ; vmulps        %ymm1,%ymm8,%ymm1
@@ -1853,56 +1847,54 @@
   DB  197,188,89,219                      ; vmulps        %ymm3,%ymm8,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,183                             ; ja            1e53 <_sk_scale_u8_hsw+0x1e>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,121,0,0,0                 ; lea           0x79(%rip),%r10        # 1f20 <_sk_scale_u8_hsw+0xeb>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,189                             ; ja            1e25 <_sk_scale_u8_hsw+0x18>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,122,0,0,0                 ; lea           0x7a(%rip),%r9        # 1eec <_sk_scale_u8_hsw+0xdf>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  67,15,182,4,24                      ; movzbl        (%r8,%r11,1),%eax
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
-  DB  235,152                             ; jmp           1e53 <_sk_scale_u8_hsw+0x1e>
-  DB  67,15,182,68,24,2                   ; movzbl        0x2(%r8,%r11,1),%eax
+  DB  235,159                             ; jmp           1e25 <_sk_scale_u8_hsw+0x18>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  197,57,196,192,2                    ; vpinsrw       $0x2,%eax,%xmm8,%xmm8
-  DB  67,15,183,4,24                      ; movzwl        (%r8,%r11,1),%eax
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  197,121,110,200                     ; vmovd         %eax,%xmm9
   DB  196,66,121,48,201                   ; vpmovzxbw     %xmm9,%xmm9
   DB  196,67,57,2,193,1                   ; vpblendd      $0x1,%xmm9,%xmm8,%xmm8
-  DB  233,111,255,255,255                 ; jmpq          1e53 <_sk_scale_u8_hsw+0x1e>
-  DB  67,15,182,68,24,6                   ; movzbl        0x6(%r8,%r11,1),%eax
+  DB  233,118,255,255,255                 ; jmpq          1e25 <_sk_scale_u8_hsw+0x18>
+  DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  197,57,196,192,6                    ; vpinsrw       $0x6,%eax,%xmm8,%xmm8
-  DB  67,15,182,68,24,5                   ; movzbl        0x5(%r8,%r11,1),%eax
+  DB  65,15,182,68,16,5                   ; movzbl        0x5(%r8,%rdx,1),%eax
   DB  197,57,196,192,5                    ; vpinsrw       $0x5,%eax,%xmm8,%xmm8
-  DB  67,15,182,68,24,4                   ; movzbl        0x4(%r8,%r11,1),%eax
+  DB  65,15,182,68,16,4                   ; movzbl        0x4(%r8,%rdx,1),%eax
   DB  197,57,196,192,4                    ; vpinsrw       $0x4,%eax,%xmm8,%xmm8
-  DB  196,1,121,110,12,24                 ; vmovd         (%r8,%r11,1),%xmm9
+  DB  196,65,121,110,12,16                ; vmovd         (%r8,%rdx,1),%xmm9
   DB  196,66,121,48,201                   ; vpmovzxbw     %xmm9,%xmm9
   DB  196,67,49,2,192,12                  ; vpblendd      $0xc,%xmm8,%xmm9,%xmm8
-  DB  233,51,255,255,255                  ; jmpq          1e53 <_sk_scale_u8_hsw+0x1e>
+  DB  233,58,255,255,255                  ; jmpq          1e25 <_sk_scale_u8_hsw+0x18>
   DB  144                                 ; nop
+  DB  143                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,171,255,255,255,155             ; ljmp          *-0x64000001(%rbx)
+  DB  255,170,255,255,255,154             ; ljmp          *-0x65000001(%rdx)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  234                                 ; (bad)
+  DB  233,255,255,255,222                 ; jmpq          ffffffffdf001efc <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffdefcf30c>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  223,255                             ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,212                             ; callq         *%rsp
+  DB  255,211                             ; callq         *%rbx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,196                             ; inc           %esp
+  DB  255,195                             ; inc           %ebx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -1910,30 +1902,28 @@
 PUBLIC _sk_scale_565_hsw
 _sk_scale_565_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,161,0,0,0                    ; jne           1ffc <_sk_scale_565_hsw+0xc0>
-  DB  196,1,122,111,4,88                  ; vmovdqu       (%r8,%r11,2),%xmm8
+  DB  15,133,161,0,0,0                    ; jne           1fc2 <_sk_scale_565_hsw+0xba>
+  DB  196,65,122,111,4,80                 ; vmovdqu       (%r8,%rdx,2),%xmm8
   DB  196,66,125,51,192                   ; vpmovzxwd     %xmm8,%ymm8
-  DB  196,98,125,88,13,217,21,3,0         ; vpbroadcastd  0x315d9(%rip),%ymm9        # 33548 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  DB  196,98,125,88,13,231,15,3,0         ; vpbroadcastd  0x30fe7(%rip),%ymm9        # 32f1c <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
   DB  196,65,61,219,201                   ; vpand         %ymm9,%ymm8,%ymm9
   DB  196,65,124,91,201                   ; vcvtdq2ps     %ymm9,%ymm9
-  DB  196,98,125,24,21,202,21,3,0         ; vbroadcastss  0x315ca(%rip),%ymm10        # 3354c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  DB  196,98,125,24,21,216,15,3,0         ; vbroadcastss  0x30fd8(%rip),%ymm10        # 32f20 <_sk_srcover_bgra_8888_sse2_lowp+0x330>
   DB  196,65,52,89,202                    ; vmulps        %ymm10,%ymm9,%ymm9
-  DB  196,98,125,88,21,192,21,3,0         ; vpbroadcastd  0x315c0(%rip),%ymm10        # 33550 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  DB  196,98,125,88,21,206,15,3,0         ; vpbroadcastd  0x30fce(%rip),%ymm10        # 32f24 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
   DB  196,65,61,219,210                   ; vpand         %ymm10,%ymm8,%ymm10
   DB  196,65,124,91,210                   ; vcvtdq2ps     %ymm10,%ymm10
-  DB  196,98,125,24,29,177,21,3,0         ; vbroadcastss  0x315b1(%rip),%ymm11        # 33554 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  DB  196,98,125,24,29,191,15,3,0         ; vbroadcastss  0x30fbf(%rip),%ymm11        # 32f28 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
   DB  196,65,44,89,211                    ; vmulps        %ymm11,%ymm10,%ymm10
-  DB  196,98,125,88,29,167,21,3,0         ; vpbroadcastd  0x315a7(%rip),%ymm11        # 33558 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  DB  196,98,125,88,29,181,15,3,0         ; vpbroadcastd  0x30fb5(%rip),%ymm11        # 32f2c <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
   DB  196,65,61,219,195                   ; vpand         %ymm11,%ymm8,%ymm8
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
-  DB  196,98,125,24,29,152,21,3,0         ; vbroadcastss  0x31598(%rip),%ymm11        # 3355c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  DB  196,98,125,24,29,166,15,3,0         ; vbroadcastss  0x30fa6(%rip),%ymm11        # 32f30 <_sk_srcover_bgra_8888_sse2_lowp+0x340>
   DB  196,65,60,89,195                    ; vmulps        %ymm11,%ymm8,%ymm8
   DB  197,100,194,223,1                   ; vcmpltps      %ymm7,%ymm3,%ymm11
   DB  196,65,44,93,224                    ; vminps        %ymm8,%ymm10,%ymm12
@@ -1947,49 +1937,51 @@
   DB  197,164,89,219                      ; vmulps        %ymm3,%ymm11,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,76,255,255,255               ; ja            1f61 <_sk_scale_565_hsw+0x25>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,100,0,0,0                 ; lea           0x64(%rip),%r10        # 2084 <_sk_scale_565_hsw+0x148>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  15,135,82,255,255,255               ; ja            1f27 <_sk_scale_565_hsw+0x1f>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,101,0,0,0                 ; lea           0x65(%rip),%r9        # 2044 <_sk_scale_565_hsw+0x13c>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  67,15,183,4,88                      ; movzwl        (%r8,%r11,2),%eax
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
-  DB  233,42,255,255,255                  ; jmpq          1f61 <_sk_scale_565_hsw+0x25>
+  DB  233,49,255,255,255                  ; jmpq          1f27 <_sk_scale_565_hsw+0x1f>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
-  DB  196,1,57,196,68,88,4,2              ; vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm8,%xmm8
-  DB  196,1,121,110,12,88                 ; vmovd         (%r8,%r11,2),%xmm9
+  DB  196,65,57,196,68,80,4,2             ; vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm8,%xmm8
+  DB  196,65,121,110,12,80                ; vmovd         (%r8,%rdx,2),%xmm9
   DB  196,67,57,2,193,1                   ; vpblendd      $0x1,%xmm9,%xmm8,%xmm8
-  DB  233,12,255,255,255                  ; jmpq          1f61 <_sk_scale_565_hsw+0x25>
+  DB  233,19,255,255,255                  ; jmpq          1f27 <_sk_scale_565_hsw+0x1f>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
-  DB  196,1,57,196,68,88,12,6             ; vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm8,%xmm8
-  DB  196,1,57,196,68,88,10,5             ; vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm8,%xmm8
-  DB  196,1,57,196,68,88,8,4              ; vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm8,%xmm8
-  DB  196,1,122,126,12,88                 ; vmovq         (%r8,%r11,2),%xmm9
+  DB  196,65,57,196,68,80,12,6            ; vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm8,%xmm8
+  DB  196,65,57,196,68,80,10,5            ; vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm8,%xmm8
+  DB  196,65,57,196,68,80,8,4             ; vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm8,%xmm8
+  DB  196,65,122,126,12,80                ; vmovq         (%r8,%rdx,2),%xmm9
   DB  196,67,49,2,192,12                  ; vpblendd      $0xc,%xmm8,%xmm9,%xmm8
-  DB  233,222,254,255,255                 ; jmpq          1f61 <_sk_scale_565_hsw+0x25>
-  DB  144                                 ; nop
-  DB  165                                 ; movsl         %ds:(%rsi),%es:(%rdi)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,192                             ; inc           %eax
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,179,255,255,255,238             ; pushq         -0x11000001(%rbx)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,230                             ; jmpq          *%rsi
+  DB  233,229,254,255,255                 ; jmpq          1f27 <_sk_scale_565_hsw+0x1f>
+  DB  102,144                             ; xchg          %ax,%ax
+  DB  164                                 ; movsb         %ds:(%rsi),%es:(%rdi)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  222,255                             ; fdivrp        %st,%st(7)
+  DB  191,255,255,255,178                 ; mov           $0xb2ffffff,%edi
   DB  255                                 ; (bad)
-  DB  255,209                             ; callq         *%rcx
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  237                                 ; in            (%dx),%eax
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,229                             ; jmpq          *%rbp
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  221,255                             ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,208                             ; callq         *%rax
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -2012,18 +2004,16 @@
 PUBLIC _sk_lerp_u8_hsw
 _sk_lerp_u8_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,78                              ; jne           2135 <_sk_lerp_u8_hsw+0x66>
-  DB  196,2,121,48,4,24                   ; vpmovzxbw     (%r8,%r11,1),%xmm8
-  DB  197,57,219,5,59,29,3,0              ; vpand         0x31d3b(%rip),%xmm8,%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  117,78                              ; jne           20ef <_sk_lerp_u8_hsw+0x60>
+  DB  196,66,121,48,4,16                  ; vpmovzxbw     (%r8,%rdx,1),%xmm8
+  DB  197,57,219,5,97,23,3,0              ; vpand         0x31761(%rip),%xmm8,%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  196,66,125,51,192                   ; vpmovzxwd     %xmm8,%ymm8
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
-  DB  196,98,125,24,13,60,20,3,0          ; vbroadcastss  0x3143c(%rip),%ymm9        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,98,125,24,13,86,14,3,0          ; vbroadcastss  0x30e56(%rip),%ymm9        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
   DB  197,252,92,196                      ; vsubps        %ymm4,%ymm0,%ymm0
   DB  196,226,61,168,196                  ; vfmadd213ps   %ymm4,%ymm8,%ymm0
@@ -2035,53 +2025,56 @@
   DB  196,226,61,168,223                  ; vfmadd213ps   %ymm7,%ymm8,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,163                             ; ja            20ed <_sk_lerp_u8_hsw+0x1e>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,123,0,0,0                 ; lea           0x7b(%rip),%r10        # 21d0 <_sk_lerp_u8_hsw+0x101>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,169                             ; ja            20a7 <_sk_lerp_u8_hsw+0x18>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,124,0,0,0                 ; lea           0x7c(%rip),%r9        # 2184 <_sk_lerp_u8_hsw+0xf5>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  67,15,182,4,24                      ; movzbl        (%r8,%r11,1),%eax
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
-  DB  235,132                             ; jmp           20ed <_sk_lerp_u8_hsw+0x1e>
-  DB  67,15,182,68,24,2                   ; movzbl        0x2(%r8,%r11,1),%eax
+  DB  235,139                             ; jmp           20a7 <_sk_lerp_u8_hsw+0x18>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  197,57,196,192,2                    ; vpinsrw       $0x2,%eax,%xmm8,%xmm8
-  DB  67,15,183,4,24                      ; movzwl        (%r8,%r11,1),%eax
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  197,121,110,200                     ; vmovd         %eax,%xmm9
   DB  196,66,121,48,201                   ; vpmovzxbw     %xmm9,%xmm9
   DB  196,67,57,2,193,1                   ; vpblendd      $0x1,%xmm9,%xmm8,%xmm8
-  DB  233,91,255,255,255                  ; jmpq          20ed <_sk_lerp_u8_hsw+0x1e>
-  DB  67,15,182,68,24,6                   ; movzbl        0x6(%r8,%r11,1),%eax
+  DB  233,98,255,255,255                  ; jmpq          20a7 <_sk_lerp_u8_hsw+0x18>
+  DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  197,57,196,192,6                    ; vpinsrw       $0x6,%eax,%xmm8,%xmm8
-  DB  67,15,182,68,24,5                   ; movzbl        0x5(%r8,%r11,1),%eax
+  DB  65,15,182,68,16,5                   ; movzbl        0x5(%r8,%rdx,1),%eax
   DB  197,57,196,192,5                    ; vpinsrw       $0x5,%eax,%xmm8,%xmm8
-  DB  67,15,182,68,24,4                   ; movzbl        0x4(%r8,%r11,1),%eax
+  DB  65,15,182,68,16,4                   ; movzbl        0x4(%r8,%rdx,1),%eax
   DB  197,57,196,192,4                    ; vpinsrw       $0x4,%eax,%xmm8,%xmm8
-  DB  196,1,121,110,12,24                 ; vmovd         (%r8,%r11,1),%xmm9
+  DB  196,65,121,110,12,16                ; vmovd         (%r8,%rdx,1),%xmm9
   DB  196,66,121,48,201                   ; vpmovzxbw     %xmm9,%xmm9
   DB  196,67,49,2,192,12                  ; vpblendd      $0xc,%xmm8,%xmm9,%xmm8
-  DB  233,31,255,255,255                  ; jmpq          20ed <_sk_lerp_u8_hsw+0x1e>
-  DB  102,144                             ; xchg          %ax,%ax
-  DB  142,255                             ; mov           %edi,%?
+  DB  233,38,255,255,255                  ; jmpq          20a7 <_sk_lerp_u8_hsw+0x18>
+  DB  15,31,0                             ; nopl          (%rax)
+  DB  141                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,169,255,255,255,153             ; ljmp          *-0x66000001(%rcx)
+  DB  255                                 ; (bad)
+  DB  255,168,255,255,255,152             ; ljmp          *-0x67000001(%rax)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,231                             ; jmpq          *%rdi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  232,255,255,255,221                 ; callq         ffffffffde0021e0 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddfcefc4>
+  DB  220,255                             ; fdivr         %st,%st(7)
+  DB  255                                 ; (bad)
+  DB  255,209                             ; callq         *%rcx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,210                             ; callq         *%rdx
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,194                             ; inc           %edx
+  DB  255,193                             ; inc           %ecx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -2089,30 +2082,28 @@
 PUBLIC _sk_lerp_565_hsw
 _sk_lerp_565_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,181,0,0,0                    ; jne           22c0 <_sk_lerp_565_hsw+0xd4>
-  DB  196,1,122,111,4,88                  ; vmovdqu       (%r8,%r11,2),%xmm8
+  DB  15,133,181,0,0,0                    ; jne           226e <_sk_lerp_565_hsw+0xce>
+  DB  196,65,122,111,4,80                 ; vmovdqu       (%r8,%rdx,2),%xmm8
   DB  196,66,125,51,192                   ; vpmovzxwd     %xmm8,%ymm8
-  DB  196,98,125,88,13,41,19,3,0          ; vpbroadcastd  0x31329(%rip),%ymm9        # 33548 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  DB  196,98,125,88,13,79,13,3,0          ; vpbroadcastd  0x30d4f(%rip),%ymm9        # 32f1c <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
   DB  196,65,61,219,201                   ; vpand         %ymm9,%ymm8,%ymm9
   DB  196,65,124,91,201                   ; vcvtdq2ps     %ymm9,%ymm9
-  DB  196,98,125,24,21,26,19,3,0          ; vbroadcastss  0x3131a(%rip),%ymm10        # 3354c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  DB  196,98,125,24,21,64,13,3,0          ; vbroadcastss  0x30d40(%rip),%ymm10        # 32f20 <_sk_srcover_bgra_8888_sse2_lowp+0x330>
   DB  196,65,52,89,202                    ; vmulps        %ymm10,%ymm9,%ymm9
-  DB  196,98,125,88,21,16,19,3,0          ; vpbroadcastd  0x31310(%rip),%ymm10        # 33550 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  DB  196,98,125,88,21,54,13,3,0          ; vpbroadcastd  0x30d36(%rip),%ymm10        # 32f24 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
   DB  196,65,61,219,210                   ; vpand         %ymm10,%ymm8,%ymm10
   DB  196,65,124,91,210                   ; vcvtdq2ps     %ymm10,%ymm10
-  DB  196,98,125,24,29,1,19,3,0           ; vbroadcastss  0x31301(%rip),%ymm11        # 33554 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  DB  196,98,125,24,29,39,13,3,0          ; vbroadcastss  0x30d27(%rip),%ymm11        # 32f28 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
   DB  196,65,44,89,211                    ; vmulps        %ymm11,%ymm10,%ymm10
-  DB  196,98,125,88,29,247,18,3,0         ; vpbroadcastd  0x312f7(%rip),%ymm11        # 33558 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  DB  196,98,125,88,29,29,13,3,0          ; vpbroadcastd  0x30d1d(%rip),%ymm11        # 32f2c <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
   DB  196,65,61,219,195                   ; vpand         %ymm11,%ymm8,%ymm8
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
-  DB  196,98,125,24,29,232,18,3,0         ; vbroadcastss  0x312e8(%rip),%ymm11        # 3355c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  DB  196,98,125,24,29,14,13,3,0          ; vbroadcastss  0x30d0e(%rip),%ymm11        # 32f30 <_sk_srcover_bgra_8888_sse2_lowp+0x340>
   DB  196,65,60,89,195                    ; vmulps        %ymm11,%ymm8,%ymm8
   DB  197,100,194,223,1                   ; vcmpltps      %ymm7,%ymm3,%ymm11
   DB  196,65,44,93,224                    ; vminps        %ymm8,%ymm10,%ymm12
@@ -2130,49 +2121,51 @@
   DB  196,226,37,168,223                  ; vfmadd213ps   %ymm7,%ymm11,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,56,255,255,255               ; ja            2211 <_sk_lerp_565_hsw+0x25>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,100,0,0,0                 ; lea           0x64(%rip),%r10        # 2348 <_sk_lerp_565_hsw+0x15c>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  15,135,62,255,255,255               ; ja            21bf <_sk_lerp_565_hsw+0x1f>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,101,0,0,0                 ; lea           0x65(%rip),%r9        # 22f0 <_sk_lerp_565_hsw+0x150>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  67,15,183,4,88                      ; movzwl        (%r8,%r11,2),%eax
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
-  DB  233,22,255,255,255                  ; jmpq          2211 <_sk_lerp_565_hsw+0x25>
+  DB  233,29,255,255,255                  ; jmpq          21bf <_sk_lerp_565_hsw+0x1f>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
-  DB  196,1,57,196,68,88,4,2              ; vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm8,%xmm8
-  DB  196,1,121,110,12,88                 ; vmovd         (%r8,%r11,2),%xmm9
+  DB  196,65,57,196,68,80,4,2             ; vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm8,%xmm8
+  DB  196,65,121,110,12,80                ; vmovd         (%r8,%rdx,2),%xmm9
   DB  196,67,57,2,193,1                   ; vpblendd      $0x1,%xmm9,%xmm8,%xmm8
-  DB  233,248,254,255,255                 ; jmpq          2211 <_sk_lerp_565_hsw+0x25>
+  DB  233,255,254,255,255                 ; jmpq          21bf <_sk_lerp_565_hsw+0x1f>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
-  DB  196,1,57,196,68,88,12,6             ; vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm8,%xmm8
-  DB  196,1,57,196,68,88,10,5             ; vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm8,%xmm8
-  DB  196,1,57,196,68,88,8,4              ; vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm8,%xmm8
-  DB  196,1,122,126,12,88                 ; vmovq         (%r8,%r11,2),%xmm9
+  DB  196,65,57,196,68,80,12,6            ; vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm8,%xmm8
+  DB  196,65,57,196,68,80,10,5            ; vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm8,%xmm8
+  DB  196,65,57,196,68,80,8,4             ; vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm8,%xmm8
+  DB  196,65,122,126,12,80                ; vmovq         (%r8,%rdx,2),%xmm9
   DB  196,67,49,2,192,12                  ; vpblendd      $0xc,%xmm8,%xmm9,%xmm8
-  DB  233,202,254,255,255                 ; jmpq          2211 <_sk_lerp_565_hsw+0x25>
-  DB  144                                 ; nop
-  DB  165                                 ; movsl         %ds:(%rsi),%es:(%rdi)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,192                             ; inc           %eax
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,179,255,255,255,238             ; pushq         -0x11000001(%rbx)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,230                             ; jmpq          *%rsi
+  DB  233,209,254,255,255                 ; jmpq          21bf <_sk_lerp_565_hsw+0x1f>
+  DB  102,144                             ; xchg          %ax,%ax
+  DB  164                                 ; movsb         %ds:(%rsi),%es:(%rdi)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  222,255                             ; fdivrp        %st,%st(7)
+  DB  191,255,255,255,178                 ; mov           $0xb2ffffff,%edi
   DB  255                                 ; (bad)
-  DB  255,209                             ; callq         *%rcx
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  237                                 ; in            (%dx),%eax
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,229                             ; jmpq          *%rbp
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  221,255                             ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,208                             ; callq         *%rax
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -2182,9 +2175,9 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,116                             ; jne           23e2 <_sk_load_tables_hsw+0x7e>
+  DB  117,116                             ; jne           238a <_sk_load_tables_hsw+0x7e>
   DB  196,193,126,111,28,144              ; vmovdqu       (%r8,%rdx,4),%ymm3
-  DB  197,229,219,13,196,19,3,0           ; vpand         0x313c4(%rip),%ymm3,%ymm1        # 33740 <_sk_srcover_bgra_8888_sse2_lowp+0x524>
+  DB  197,229,219,13,252,13,3,0           ; vpand         0x30dfc(%rip),%ymm3,%ymm1        # 33120 <_sk_srcover_bgra_8888_sse2_lowp+0x530>
   DB  196,65,61,118,192                   ; vpcmpeqd      %ymm8,%ymm8,%ymm8
   DB  76,139,64,8                         ; mov           0x8(%rax),%r8
   DB  76,139,72,16                        ; mov           0x10(%rax),%r9
@@ -2192,16 +2185,16 @@
   DB  197,253,239,192                     ; vpxor         %ymm0,%ymm0,%ymm0
   DB  196,65,53,118,201                   ; vpcmpeqd      %ymm9,%ymm9,%ymm9
   DB  196,194,53,146,4,136                ; vgatherdps    %ymm9,(%r8,%ymm1,4),%ymm0
-  DB  196,98,101,0,13,187,19,3,0          ; vpshufb       0x313bb(%rip),%ymm3,%ymm9        # 33760 <_sk_srcover_bgra_8888_sse2_lowp+0x544>
+  DB  196,98,101,0,13,243,13,3,0          ; vpshufb       0x30df3(%rip),%ymm3,%ymm9        # 33140 <_sk_srcover_bgra_8888_sse2_lowp+0x550>
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  196,65,45,118,210                   ; vpcmpeqd      %ymm10,%ymm10,%ymm10
   DB  196,130,45,146,12,137               ; vgatherdps    %ymm10,(%r9,%ymm9,4),%ymm1
   DB  72,139,64,24                        ; mov           0x18(%rax),%rax
-  DB  196,98,101,0,13,191,19,3,0          ; vpshufb       0x313bf(%rip),%ymm3,%ymm9        # 33780 <_sk_srcover_bgra_8888_sse2_lowp+0x564>
+  DB  196,98,101,0,13,247,13,3,0          ; vpshufb       0x30df7(%rip),%ymm3,%ymm9        # 33160 <_sk_srcover_bgra_8888_sse2_lowp+0x570>
   DB  196,162,61,146,20,136               ; vgatherdps    %ymm8,(%rax,%ymm9,4),%ymm2
   DB  197,229,114,211,24                  ; vpsrld        $0x18,%ymm3,%ymm3
   DB  197,252,91,219                      ; vcvtdq2ps     %ymm3,%ymm3
-  DB  196,98,125,24,5,107,17,3,0          ; vbroadcastss  0x3116b(%rip),%ymm8        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,98,125,24,5,151,11,3,0          ; vbroadcastss  0x30b97(%rip),%ymm8        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  196,193,100,89,216                  ; vmulps        %ymm8,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -2210,21 +2203,21 @@
   DB  197,229,239,219                     ; vpxor         %ymm3,%ymm3,%ymm3
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,122,255,255,255              ; ja            2374 <_sk_load_tables_hsw+0x10>
+  DB  15,135,122,255,255,255              ; ja            231c <_sk_load_tables_hsw+0x10>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,139,0,0,0                 ; lea           0x8b(%rip),%r10        # 2490 <_sk_load_tables_hsw+0x12c>
+  DB  76,141,21,139,0,0,0                 ; lea           0x8b(%rip),%r10        # 2438 <_sk_load_tables_hsw+0x12c>
   DB  79,99,12,138                        ; movslq        (%r10,%r9,4),%r9
   DB  77,1,209                            ; add           %r10,%r9
   DB  65,255,225                          ; jmpq          *%r9
   DB  196,193,121,110,28,144              ; vmovd         (%r8,%rdx,4),%xmm3
-  DB  233,90,255,255,255                  ; jmpq          2374 <_sk_load_tables_hsw+0x10>
+  DB  233,90,255,255,255                  ; jmpq          231c <_sk_load_tables_hsw+0x10>
   DB  196,193,121,110,68,144,8            ; vmovd         0x8(%r8,%rdx,4),%xmm0
   DB  196,226,121,89,192                  ; vpbroadcastq  %xmm0,%xmm0
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
   DB  196,227,117,2,216,4                 ; vpblendd      $0x4,%ymm0,%ymm1,%ymm3
   DB  196,193,122,126,4,144               ; vmovq         (%r8,%rdx,4),%xmm0
   DB  196,227,101,2,216,3                 ; vpblendd      $0x3,%ymm0,%ymm3,%ymm3
-  DB  233,51,255,255,255                  ; jmpq          2374 <_sk_load_tables_hsw+0x10>
+  DB  233,51,255,255,255                  ; jmpq          231c <_sk_load_tables_hsw+0x10>
   DB  196,193,121,110,68,144,24           ; vmovd         0x18(%r8,%rdx,4),%xmm0
   DB  196,226,125,89,192                  ; vpbroadcastq  %xmm0,%ymm0
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
@@ -2237,8 +2230,8 @@
   DB  196,227,101,56,216,1                ; vinserti128   $0x1,%xmm0,%ymm3,%ymm3
   DB  196,193,122,111,4,144               ; vmovdqu       (%r8,%rdx,4),%xmm0
   DB  196,227,125,2,219,240               ; vpblendd      $0xf0,%ymm3,%ymm0,%ymm3
-  DB  233,228,254,255,255                 ; jmpq          2374 <_sk_load_tables_hsw+0x10>
-  DB  127,255                             ; jg            2491 <_sk_load_tables_hsw+0x12d>
+  DB  233,228,254,255,255                 ; jmpq          231c <_sk_load_tables_hsw+0x10>
+  DB  127,255                             ; jg            2439 <_sk_load_tables_hsw+0x12d>
   DB  255                                 ; (bad)
   DB  255,160,255,255,255,138             ; jmpq          *-0x75000001(%rax)
   DB  255                                 ; (bad)
@@ -2264,7 +2257,7 @@
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  76,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,215,0,0,0                    ; jne           2599 <_sk_load_tables_u16_be_hsw+0xed>
+  DB  15,133,215,0,0,0                    ; jne           2541 <_sk_load_tables_u16_be_hsw+0xed>
   DB  196,1,121,16,4,72                   ; vmovupd       (%r8,%r9,2),%xmm8
   DB  196,129,121,16,84,72,16             ; vmovupd       0x10(%r8,%r9,2),%xmm2
   DB  196,129,121,16,92,72,32             ; vmovupd       0x20(%r8,%r9,2),%xmm3
@@ -2280,7 +2273,7 @@
   DB  197,185,108,200                     ; vpunpcklqdq   %xmm0,%xmm8,%xmm1
   DB  197,57,109,192                      ; vpunpckhqdq   %xmm0,%xmm8,%xmm8
   DB  196,65,49,108,214                   ; vpunpcklqdq   %xmm14,%xmm9,%xmm10
-  DB  197,121,111,29,28,25,3,0            ; vmovdqa       0x3191c(%rip),%xmm11        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  197,121,111,29,84,19,3,0            ; vmovdqa       0x31354(%rip),%xmm11        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  196,193,113,219,195                 ; vpand         %xmm11,%xmm1,%xmm0
   DB  196,226,125,51,200                  ; vpmovzxwd     %xmm0,%ymm1
   DB  196,65,29,118,228                   ; vpcmpeqd      %ymm12,%ymm12,%ymm12
@@ -2305,36 +2298,36 @@
   DB  197,185,235,219                     ; vpor          %xmm3,%xmm8,%xmm3
   DB  196,226,125,51,219                  ; vpmovzxwd     %xmm3,%ymm3
   DB  197,252,91,219                      ; vcvtdq2ps     %ymm3,%ymm3
-  DB  196,98,125,24,5,208,15,3,0          ; vbroadcastss  0x30fd0(%rip),%ymm8        # 33560 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
+  DB  196,98,125,24,5,252,9,3,0           ; vbroadcastss  0x309fc(%rip),%ymm8        # 32f34 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
   DB  196,193,100,89,216                  ; vmulps        %ymm8,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,1,123,16,4,72                   ; vmovsd        (%r8,%r9,2),%xmm8
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,85                              ; je            25ff <_sk_load_tables_u16_be_hsw+0x153>
+  DB  116,85                              ; je            25a7 <_sk_load_tables_u16_be_hsw+0x153>
   DB  196,1,57,22,68,72,8                 ; vmovhpd       0x8(%r8,%r9,2),%xmm8,%xmm8
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,72                              ; jb            25ff <_sk_load_tables_u16_be_hsw+0x153>
+  DB  114,72                              ; jb            25a7 <_sk_load_tables_u16_be_hsw+0x153>
   DB  196,129,123,16,84,72,16             ; vmovsd        0x10(%r8,%r9,2),%xmm2
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  116,72                              ; je            260c <_sk_load_tables_u16_be_hsw+0x160>
+  DB  116,72                              ; je            25b4 <_sk_load_tables_u16_be_hsw+0x160>
   DB  196,129,105,22,84,72,24             ; vmovhpd       0x18(%r8,%r9,2),%xmm2,%xmm2
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,59                              ; jb            260c <_sk_load_tables_u16_be_hsw+0x160>
+  DB  114,59                              ; jb            25b4 <_sk_load_tables_u16_be_hsw+0x160>
   DB  196,129,123,16,92,72,32             ; vmovsd        0x20(%r8,%r9,2),%xmm3
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  15,132,251,254,255,255              ; je            24dd <_sk_load_tables_u16_be_hsw+0x31>
+  DB  15,132,251,254,255,255              ; je            2485 <_sk_load_tables_u16_be_hsw+0x31>
   DB  196,129,97,22,92,72,40              ; vmovhpd       0x28(%r8,%r9,2),%xmm3,%xmm3
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  15,130,234,254,255,255              ; jb            24dd <_sk_load_tables_u16_be_hsw+0x31>
+  DB  15,130,234,254,255,255              ; jb            2485 <_sk_load_tables_u16_be_hsw+0x31>
   DB  196,1,122,126,76,72,48              ; vmovq         0x30(%r8,%r9,2),%xmm9
-  DB  233,222,254,255,255                 ; jmpq          24dd <_sk_load_tables_u16_be_hsw+0x31>
+  DB  233,222,254,255,255                 ; jmpq          2485 <_sk_load_tables_u16_be_hsw+0x31>
   DB  197,225,87,219                      ; vxorpd        %xmm3,%xmm3,%xmm3
   DB  197,233,87,210                      ; vxorpd        %xmm2,%xmm2,%xmm2
-  DB  233,209,254,255,255                 ; jmpq          24dd <_sk_load_tables_u16_be_hsw+0x31>
+  DB  233,209,254,255,255                 ; jmpq          2485 <_sk_load_tables_u16_be_hsw+0x31>
   DB  197,225,87,219                      ; vxorpd        %xmm3,%xmm3,%xmm3
-  DB  233,200,254,255,255                 ; jmpq          24dd <_sk_load_tables_u16_be_hsw+0x31>
+  DB  233,200,254,255,255                 ; jmpq          2485 <_sk_load_tables_u16_be_hsw+0x31>
 
 PUBLIC _sk_load_tables_rgb_u16_be_hsw
 _sk_load_tables_rgb_u16_be_hsw LABEL PROC
@@ -2342,7 +2335,7 @@
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  76,141,12,82                        ; lea           (%rdx,%rdx,2),%r9
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,206,0,0,0                    ; jne           26f5 <_sk_load_tables_rgb_u16_be_hsw+0xe0>
+  DB  15,133,206,0,0,0                    ; jne           269d <_sk_load_tables_rgb_u16_be_hsw+0xe0>
   DB  196,1,122,111,28,72                 ; vmovdqu       (%r8,%r9,2),%xmm11
   DB  196,129,122,111,92,72,12            ; vmovdqu       0xc(%r8,%r9,2),%xmm3
   DB  196,129,122,111,84,72,24            ; vmovdqu       0x18(%r8,%r9,2),%xmm2
@@ -2363,7 +2356,7 @@
   DB  197,105,108,192                     ; vpunpcklqdq   %xmm0,%xmm2,%xmm8
   DB  197,241,108,195                     ; vpunpcklqdq   %xmm3,%xmm1,%xmm0
   DB  197,241,109,203                     ; vpunpckhqdq   %xmm3,%xmm1,%xmm1
-  DB  197,249,111,29,156,23,3,0           ; vmovdqa       0x3179c(%rip),%xmm3        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  197,249,111,29,212,17,3,0           ; vmovdqa       0x311d4(%rip),%xmm3        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  197,249,219,195                     ; vpand         %xmm3,%xmm0,%xmm0
   DB  196,98,125,51,200                   ; vpmovzxwd     %xmm0,%ymm9
   DB  196,65,45,118,210                   ; vpcmpeqd      %ymm10,%ymm10,%ymm10
@@ -2383,78 +2376,78 @@
   DB  196,226,125,51,219                  ; vpmovzxwd     %xmm3,%ymm3
   DB  196,226,45,146,20,152               ; vgatherdps    %ymm10,(%rax,%ymm3,4),%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,217,13,3,0        ; vbroadcastss  0x30dd9(%rip),%ymm3        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,29,5,8,3,0           ; vbroadcastss  0x30805(%rip),%ymm3        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  255,224                             ; jmpq          *%rax
   DB  196,129,121,110,4,72                ; vmovd         (%r8,%r9,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,1,121,196,92,72,4,2             ; vpinsrw       $0x2,0x4(%r8,%r9,2),%xmm0,%xmm11
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,31                              ; jne           272d <_sk_load_tables_rgb_u16_be_hsw+0x118>
+  DB  117,31                              ; jne           26d5 <_sk_load_tables_rgb_u16_be_hsw+0x118>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
   DB  196,65,41,239,210                   ; vpxor         %xmm10,%xmm10,%xmm10
   DB  197,225,239,219                     ; vpxor         %xmm3,%xmm3,%xmm3
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
-  DB  233,47,255,255,255                  ; jmpq          265c <_sk_load_tables_rgb_u16_be_hsw+0x47>
+  DB  233,47,255,255,255                  ; jmpq          2604 <_sk_load_tables_rgb_u16_be_hsw+0x47>
   DB  196,129,121,110,68,72,6             ; vmovd         0x6(%r8,%r9,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,1,121,196,68,72,10,2            ; vpinsrw       $0x2,0xa(%r8,%r9,2),%xmm0,%xmm8
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,48                              ; jb            2777 <_sk_load_tables_rgb_u16_be_hsw+0x162>
+  DB  114,48                              ; jb            271f <_sk_load_tables_rgb_u16_be_hsw+0x162>
   DB  196,129,121,110,68,72,12            ; vmovd         0xc(%r8,%r9,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,129,121,196,92,72,16,2          ; vpinsrw       $0x2,0x10(%r8,%r9,2),%xmm0,%xmm3
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  117,48                              ; jne           2791 <_sk_load_tables_rgb_u16_be_hsw+0x17c>
+  DB  117,48                              ; jne           2739 <_sk_load_tables_rgb_u16_be_hsw+0x17c>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
   DB  196,65,41,239,210                   ; vpxor         %xmm10,%xmm10,%xmm10
-  DB  233,229,254,255,255                 ; jmpq          265c <_sk_load_tables_rgb_u16_be_hsw+0x47>
+  DB  233,229,254,255,255                 ; jmpq          2604 <_sk_load_tables_rgb_u16_be_hsw+0x47>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
   DB  196,65,41,239,210                   ; vpxor         %xmm10,%xmm10,%xmm10
   DB  197,225,239,219                     ; vpxor         %xmm3,%xmm3,%xmm3
-  DB  233,203,254,255,255                 ; jmpq          265c <_sk_load_tables_rgb_u16_be_hsw+0x47>
+  DB  233,203,254,255,255                 ; jmpq          2604 <_sk_load_tables_rgb_u16_be_hsw+0x47>
   DB  196,129,121,110,68,72,18            ; vmovd         0x12(%r8,%r9,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,1,121,196,84,72,22,2            ; vpinsrw       $0x2,0x16(%r8,%r9,2),%xmm0,%xmm10
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,39                              ; jb            27d2 <_sk_load_tables_rgb_u16_be_hsw+0x1bd>
+  DB  114,39                              ; jb            277a <_sk_load_tables_rgb_u16_be_hsw+0x1bd>
   DB  196,129,121,110,68,72,24            ; vmovd         0x18(%r8,%r9,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,129,121,196,84,72,28,2          ; vpinsrw       $0x2,0x1c(%r8,%r9,2),%xmm0,%xmm2
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  117,30                              ; jne           27e3 <_sk_load_tables_rgb_u16_be_hsw+0x1ce>
+  DB  117,30                              ; jne           278b <_sk_load_tables_rgb_u16_be_hsw+0x1ce>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
-  DB  233,138,254,255,255                 ; jmpq          265c <_sk_load_tables_rgb_u16_be_hsw+0x47>
+  DB  233,138,254,255,255                 ; jmpq          2604 <_sk_load_tables_rgb_u16_be_hsw+0x47>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
-  DB  233,121,254,255,255                 ; jmpq          265c <_sk_load_tables_rgb_u16_be_hsw+0x47>
+  DB  233,121,254,255,255                 ; jmpq          2604 <_sk_load_tables_rgb_u16_be_hsw+0x47>
   DB  196,129,121,110,68,72,30            ; vmovd         0x1e(%r8,%r9,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,129,121,196,76,72,34,2          ; vpinsrw       $0x2,0x22(%r8,%r9,2),%xmm0,%xmm1
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  114,25                              ; jb            2816 <_sk_load_tables_rgb_u16_be_hsw+0x201>
+  DB  114,25                              ; jb            27be <_sk_load_tables_rgb_u16_be_hsw+0x201>
   DB  196,129,121,110,68,72,36            ; vmovd         0x24(%r8,%r9,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,129,121,196,68,72,40,2          ; vpinsrw       $0x2,0x28(%r8,%r9,2),%xmm0,%xmm0
-  DB  233,70,254,255,255                  ; jmpq          265c <_sk_load_tables_rgb_u16_be_hsw+0x47>
+  DB  233,70,254,255,255                  ; jmpq          2604 <_sk_load_tables_rgb_u16_be_hsw+0x47>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
-  DB  233,61,254,255,255                  ; jmpq          265c <_sk_load_tables_rgb_u16_be_hsw+0x47>
+  DB  233,61,254,255,255                  ; jmpq          2604 <_sk_load_tables_rgb_u16_be_hsw+0x47>
 
 PUBLIC _sk_byte_tables_hsw
 _sk_byte_tables_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,60,95,200                       ; vmaxps        %ymm0,%ymm8,%ymm9
-  DB  196,98,125,24,29,153,12,3,0         ; vbroadcastss  0x30c99(%rip),%ymm11        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,29,197,6,3,0          ; vbroadcastss  0x306c5(%rip),%ymm11        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,65,52,93,211                    ; vminps        %ymm11,%ymm9,%ymm10
-  DB  196,98,125,24,13,183,12,3,0         ; vbroadcastss  0x30cb7(%rip),%ymm9        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  196,98,125,24,13,227,6,3,0          ; vbroadcastss  0x306e3(%rip),%ymm9        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   DB  196,65,44,89,209                    ; vmulps        %ymm9,%ymm10,%ymm10
   DB  196,65,125,91,210                   ; vcvtps2dq     %ymm10,%ymm10
   DB  196,65,249,126,208                  ; vmovq         %xmm10,%r8
@@ -2590,7 +2583,7 @@
   DB  67,15,182,4,17                      ; movzbl        (%r9,%r10,1),%eax
   DB  196,194,125,49,194                  ; vpmovzxbd     %xmm10,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,5,109,10,3,0          ; vbroadcastss  0x30a6d(%rip),%ymm8        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,98,125,24,5,153,4,3,0           ; vbroadcastss  0x30499(%rip),%ymm8        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
   DB  196,226,125,49,201                  ; vpmovzxbd     %xmm1,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
@@ -2615,7 +2608,7 @@
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
   DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
   DB  197,52,95,208                       ; vmaxps        %ymm0,%ymm9,%ymm10
-  DB  196,98,125,24,29,146,9,3,0          ; vbroadcastss  0x30992(%rip),%ymm11        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,29,190,3,3,0          ; vbroadcastss  0x303be(%rip),%ymm11        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,65,44,93,211                    ; vminps        %ymm11,%ymm10,%ymm10
   DB  196,65,44,89,208                    ; vmulps        %ymm8,%ymm10,%ymm10
   DB  196,65,125,91,210                   ; vcvtps2dq     %ymm10,%ymm10
@@ -2718,7 +2711,7 @@
   DB  67,15,182,4,17                      ; movzbl        (%r9,%r10,1),%eax
   DB  196,194,125,49,194                  ; vpmovzxbd     %xmm10,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,5,22,8,3,0            ; vbroadcastss  0x30816(%rip),%ymm8        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,98,125,24,5,66,2,3,0            ; vbroadcastss  0x30242(%rip),%ymm8        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
   DB  196,226,125,49,201                  ; vpmovzxbd     %xmm1,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
@@ -2741,7 +2734,7 @@
   DB  196,65,124,91,200                   ; vcvtdq2ps     %ymm8,%ymm9
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,188,95,192                      ; vmaxps        %ymm0,%ymm8,%ymm0
-  DB  196,98,125,24,21,73,7,3,0           ; vbroadcastss  0x30749(%rip),%ymm10        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,21,117,1,3,0          ; vbroadcastss  0x30175(%rip),%ymm10        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,124,93,194                  ; vminps        %ymm10,%ymm0,%ymm0
   DB  196,193,124,89,193                  ; vmulps        %ymm9,%ymm0,%ymm0
   DB  197,253,91,192                      ; vcvtps2dq     %ymm0,%ymm0
@@ -2762,7 +2755,7 @@
   DB  196,65,124,91,200                   ; vcvtdq2ps     %ymm8,%ymm9
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,188,95,201                      ; vmaxps        %ymm1,%ymm8,%ymm1
-  DB  196,98,125,24,21,254,6,3,0          ; vbroadcastss  0x306fe(%rip),%ymm10        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,21,42,1,3,0           ; vbroadcastss  0x3012a(%rip),%ymm10        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,116,93,202                  ; vminps        %ymm10,%ymm1,%ymm1
   DB  196,193,116,89,201                  ; vmulps        %ymm9,%ymm1,%ymm1
   DB  197,253,91,201                      ; vcvtps2dq     %ymm1,%ymm1
@@ -2783,7 +2776,7 @@
   DB  196,65,124,91,200                   ; vcvtdq2ps     %ymm8,%ymm9
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,188,95,210                      ; vmaxps        %ymm2,%ymm8,%ymm2
-  DB  196,98,125,24,21,179,6,3,0          ; vbroadcastss  0x306b3(%rip),%ymm10        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,21,223,0,3,0          ; vbroadcastss  0x300df(%rip),%ymm10        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,108,93,210                  ; vminps        %ymm10,%ymm2,%ymm2
   DB  196,193,108,89,209                  ; vmulps        %ymm9,%ymm2,%ymm2
   DB  197,253,91,210                      ; vcvtps2dq     %ymm2,%ymm2
@@ -2804,7 +2797,7 @@
   DB  196,65,124,91,200                   ; vcvtdq2ps     %ymm8,%ymm9
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,188,95,219                      ; vmaxps        %ymm3,%ymm8,%ymm3
-  DB  196,98,125,24,21,104,6,3,0          ; vbroadcastss  0x30668(%rip),%ymm10        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,21,148,0,3,0          ; vbroadcastss  0x30094(%rip),%ymm10        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,100,93,218                  ; vminps        %ymm10,%ymm3,%ymm3
   DB  196,193,100,89,217                  ; vmulps        %ymm9,%ymm3,%ymm3
   DB  197,253,91,219                      ; vcvtps2dq     %ymm3,%ymm3
@@ -2829,33 +2822,33 @@
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
   DB  197,36,194,208,0                    ; vcmpeqps      %ymm0,%ymm11,%ymm10
   DB  196,65,124,91,235                   ; vcvtdq2ps     %ymm11,%ymm13
-  DB  196,98,125,24,53,147,6,3,0          ; vbroadcastss  0x30693(%rip),%ymm14        # 33564 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
-  DB  196,98,125,24,61,142,6,3,0          ; vbroadcastss  0x3068e(%rip),%ymm15        # 33568 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  DB  196,98,125,24,53,191,0,3,0          ; vbroadcastss  0x300bf(%rip),%ymm14        # 32f38 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  DB  196,98,125,24,61,186,0,3,0          ; vbroadcastss  0x300ba(%rip),%ymm15        # 32f3c <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   DB  196,65,36,84,223                    ; vandps        %ymm15,%ymm11,%ymm11
-  DB  196,98,125,24,61,224,5,3,0          ; vbroadcastss  0x305e0(%rip),%ymm15        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,61,12,0,3,0           ; vbroadcastss  0x3000c(%rip),%ymm15        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,65,36,86,223                    ; vorps         %ymm15,%ymm11,%ymm11
-  DB  196,98,125,24,61,118,6,3,0          ; vbroadcastss  0x30676(%rip),%ymm15        # 3356c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  DB  196,98,125,24,61,162,0,3,0          ; vbroadcastss  0x300a2(%rip),%ymm15        # 32f40 <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   DB  196,66,21,184,254                   ; vfmadd231ps   %ymm14,%ymm13,%ymm15
-  DB  196,98,125,24,45,108,6,3,0          ; vbroadcastss  0x3066c(%rip),%ymm13        # 33570 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  DB  196,98,125,24,45,152,0,3,0          ; vbroadcastss  0x30098(%rip),%ymm13        # 32f44 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   DB  196,66,37,172,239                   ; vfnmadd213ps  %ymm15,%ymm11,%ymm13
-  DB  196,98,125,24,53,98,6,3,0           ; vbroadcastss  0x30662(%rip),%ymm14        # 33574 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  DB  196,98,125,24,53,142,0,3,0          ; vbroadcastss  0x3008e(%rip),%ymm14        # 32f48 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   DB  196,65,36,88,222                    ; vaddps        %ymm14,%ymm11,%ymm11
-  DB  196,98,125,24,53,88,6,3,0           ; vbroadcastss  0x30658(%rip),%ymm14        # 33578 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  DB  196,98,125,24,53,132,0,3,0          ; vbroadcastss  0x30084(%rip),%ymm14        # 32f4c <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   DB  196,65,12,94,219                    ; vdivps        %ymm11,%ymm14,%ymm11
   DB  196,65,20,92,219                    ; vsubps        %ymm11,%ymm13,%ymm11
   DB  196,65,28,89,219                    ; vmulps        %ymm11,%ymm12,%ymm11
   DB  196,67,125,8,227,1                  ; vroundps      $0x1,%ymm11,%ymm12
   DB  196,65,36,92,228                    ; vsubps        %ymm12,%ymm11,%ymm12
-  DB  196,98,125,24,45,57,6,3,0           ; vbroadcastss  0x30639(%rip),%ymm13        # 3357c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  DB  196,98,125,24,45,101,0,3,0          ; vbroadcastss  0x30065(%rip),%ymm13        # 32f50 <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   DB  196,65,36,88,221                    ; vaddps        %ymm13,%ymm11,%ymm11
-  DB  196,98,125,24,45,47,6,3,0           ; vbroadcastss  0x3062f(%rip),%ymm13        # 33580 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  DB  196,98,125,24,45,91,0,3,0           ; vbroadcastss  0x3005b(%rip),%ymm13        # 32f54 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   DB  196,66,29,172,235                   ; vfnmadd213ps  %ymm11,%ymm12,%ymm13
-  DB  196,98,125,24,29,37,6,3,0           ; vbroadcastss  0x30625(%rip),%ymm11        # 33584 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  DB  196,98,125,24,29,81,0,3,0           ; vbroadcastss  0x30051(%rip),%ymm11        # 32f58 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   DB  196,65,36,92,220                    ; vsubps        %ymm12,%ymm11,%ymm11
-  DB  196,98,125,24,37,27,6,3,0           ; vbroadcastss  0x3061b(%rip),%ymm12        # 33588 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  DB  196,98,125,24,37,71,0,3,0           ; vbroadcastss  0x30047(%rip),%ymm12        # 32f5c <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   DB  196,65,28,94,219                    ; vdivps        %ymm11,%ymm12,%ymm11
   DB  196,65,20,88,219                    ; vaddps        %ymm11,%ymm13,%ymm11
-  DB  196,98,125,24,37,12,6,3,0           ; vbroadcastss  0x3060c(%rip),%ymm12        # 3358c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  DB  196,98,125,24,37,56,0,3,0           ; vbroadcastss  0x30038(%rip),%ymm12        # 32f60 <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   DB  196,65,36,89,220                    ; vmulps        %ymm12,%ymm11,%ymm11
   DB  196,65,125,91,219                   ; vcvtps2dq     %ymm11,%ymm11
   DB  196,99,37,74,208,160                ; vblendvps     %ymm10,%ymm0,%ymm11,%ymm10
@@ -2863,7 +2856,7 @@
   DB  196,65,44,88,211                    ; vaddps        %ymm11,%ymm10,%ymm10
   DB  196,67,45,74,193,128                ; vblendvps     %ymm8,%ymm9,%ymm10,%ymm8
   DB  197,188,95,192                      ; vmaxps        %ymm0,%ymm8,%ymm0
-  DB  196,98,125,24,5,30,5,3,0            ; vbroadcastss  0x3051e(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,74,255,2,0          ; vbroadcastss  0x2ff4a(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -2883,33 +2876,33 @@
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  197,36,194,209,0                    ; vcmpeqps      %ymm1,%ymm11,%ymm10
   DB  196,65,124,91,235                   ; vcvtdq2ps     %ymm11,%ymm13
-  DB  196,98,125,24,53,97,5,3,0           ; vbroadcastss  0x30561(%rip),%ymm14        # 33564 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
-  DB  196,98,125,24,61,92,5,3,0           ; vbroadcastss  0x3055c(%rip),%ymm15        # 33568 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  DB  196,98,125,24,53,141,255,2,0        ; vbroadcastss  0x2ff8d(%rip),%ymm14        # 32f38 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  DB  196,98,125,24,61,136,255,2,0        ; vbroadcastss  0x2ff88(%rip),%ymm15        # 32f3c <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   DB  196,65,36,84,223                    ; vandps        %ymm15,%ymm11,%ymm11
-  DB  196,98,125,24,61,174,4,3,0          ; vbroadcastss  0x304ae(%rip),%ymm15        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,61,218,254,2,0        ; vbroadcastss  0x2feda(%rip),%ymm15        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,65,36,86,223                    ; vorps         %ymm15,%ymm11,%ymm11
-  DB  196,98,125,24,61,68,5,3,0           ; vbroadcastss  0x30544(%rip),%ymm15        # 3356c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  DB  196,98,125,24,61,112,255,2,0        ; vbroadcastss  0x2ff70(%rip),%ymm15        # 32f40 <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   DB  196,66,21,184,254                   ; vfmadd231ps   %ymm14,%ymm13,%ymm15
-  DB  196,98,125,24,45,58,5,3,0           ; vbroadcastss  0x3053a(%rip),%ymm13        # 33570 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  DB  196,98,125,24,45,102,255,2,0        ; vbroadcastss  0x2ff66(%rip),%ymm13        # 32f44 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   DB  196,66,37,172,239                   ; vfnmadd213ps  %ymm15,%ymm11,%ymm13
-  DB  196,98,125,24,53,48,5,3,0           ; vbroadcastss  0x30530(%rip),%ymm14        # 33574 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  DB  196,98,125,24,53,92,255,2,0         ; vbroadcastss  0x2ff5c(%rip),%ymm14        # 32f48 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   DB  196,65,36,88,222                    ; vaddps        %ymm14,%ymm11,%ymm11
-  DB  196,98,125,24,53,38,5,3,0           ; vbroadcastss  0x30526(%rip),%ymm14        # 33578 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  DB  196,98,125,24,53,82,255,2,0         ; vbroadcastss  0x2ff52(%rip),%ymm14        # 32f4c <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   DB  196,65,12,94,219                    ; vdivps        %ymm11,%ymm14,%ymm11
   DB  196,65,20,92,219                    ; vsubps        %ymm11,%ymm13,%ymm11
   DB  196,65,28,89,219                    ; vmulps        %ymm11,%ymm12,%ymm11
   DB  196,67,125,8,227,1                  ; vroundps      $0x1,%ymm11,%ymm12
   DB  196,65,36,92,228                    ; vsubps        %ymm12,%ymm11,%ymm12
-  DB  196,98,125,24,45,7,5,3,0            ; vbroadcastss  0x30507(%rip),%ymm13        # 3357c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  DB  196,98,125,24,45,51,255,2,0         ; vbroadcastss  0x2ff33(%rip),%ymm13        # 32f50 <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   DB  196,65,36,88,221                    ; vaddps        %ymm13,%ymm11,%ymm11
-  DB  196,98,125,24,45,253,4,3,0          ; vbroadcastss  0x304fd(%rip),%ymm13        # 33580 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  DB  196,98,125,24,45,41,255,2,0         ; vbroadcastss  0x2ff29(%rip),%ymm13        # 32f54 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   DB  196,66,29,172,235                   ; vfnmadd213ps  %ymm11,%ymm12,%ymm13
-  DB  196,98,125,24,29,243,4,3,0          ; vbroadcastss  0x304f3(%rip),%ymm11        # 33584 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  DB  196,98,125,24,29,31,255,2,0         ; vbroadcastss  0x2ff1f(%rip),%ymm11        # 32f58 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   DB  196,65,36,92,220                    ; vsubps        %ymm12,%ymm11,%ymm11
-  DB  196,98,125,24,37,233,4,3,0          ; vbroadcastss  0x304e9(%rip),%ymm12        # 33588 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  DB  196,98,125,24,37,21,255,2,0         ; vbroadcastss  0x2ff15(%rip),%ymm12        # 32f5c <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   DB  196,65,28,94,219                    ; vdivps        %ymm11,%ymm12,%ymm11
   DB  196,65,20,88,219                    ; vaddps        %ymm11,%ymm13,%ymm11
-  DB  196,98,125,24,37,218,4,3,0          ; vbroadcastss  0x304da(%rip),%ymm12        # 3358c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  DB  196,98,125,24,37,6,255,2,0          ; vbroadcastss  0x2ff06(%rip),%ymm12        # 32f60 <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   DB  196,65,36,89,220                    ; vmulps        %ymm12,%ymm11,%ymm11
   DB  196,65,125,91,219                   ; vcvtps2dq     %ymm11,%ymm11
   DB  196,99,37,74,209,160                ; vblendvps     %ymm10,%ymm1,%ymm11,%ymm10
@@ -2917,7 +2910,7 @@
   DB  196,65,44,88,211                    ; vaddps        %ymm11,%ymm10,%ymm10
   DB  196,67,45,74,193,128                ; vblendvps     %ymm8,%ymm9,%ymm10,%ymm8
   DB  197,188,95,201                      ; vmaxps        %ymm1,%ymm8,%ymm1
-  DB  196,98,125,24,5,236,3,3,0           ; vbroadcastss  0x303ec(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,24,254,2,0          ; vbroadcastss  0x2fe18(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,116,93,200                  ; vminps        %ymm8,%ymm1,%ymm1
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -2937,33 +2930,33 @@
   DB  197,236,87,210                      ; vxorps        %ymm2,%ymm2,%ymm2
   DB  197,36,194,210,0                    ; vcmpeqps      %ymm2,%ymm11,%ymm10
   DB  196,65,124,91,235                   ; vcvtdq2ps     %ymm11,%ymm13
-  DB  196,98,125,24,53,47,4,3,0           ; vbroadcastss  0x3042f(%rip),%ymm14        # 33564 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
-  DB  196,98,125,24,61,42,4,3,0           ; vbroadcastss  0x3042a(%rip),%ymm15        # 33568 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  DB  196,98,125,24,53,91,254,2,0         ; vbroadcastss  0x2fe5b(%rip),%ymm14        # 32f38 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  DB  196,98,125,24,61,86,254,2,0         ; vbroadcastss  0x2fe56(%rip),%ymm15        # 32f3c <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   DB  196,65,36,84,223                    ; vandps        %ymm15,%ymm11,%ymm11
-  DB  196,98,125,24,61,124,3,3,0          ; vbroadcastss  0x3037c(%rip),%ymm15        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,61,168,253,2,0        ; vbroadcastss  0x2fda8(%rip),%ymm15        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,65,36,86,223                    ; vorps         %ymm15,%ymm11,%ymm11
-  DB  196,98,125,24,61,18,4,3,0           ; vbroadcastss  0x30412(%rip),%ymm15        # 3356c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  DB  196,98,125,24,61,62,254,2,0         ; vbroadcastss  0x2fe3e(%rip),%ymm15        # 32f40 <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   DB  196,66,21,184,254                   ; vfmadd231ps   %ymm14,%ymm13,%ymm15
-  DB  196,98,125,24,45,8,4,3,0            ; vbroadcastss  0x30408(%rip),%ymm13        # 33570 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  DB  196,98,125,24,45,52,254,2,0         ; vbroadcastss  0x2fe34(%rip),%ymm13        # 32f44 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   DB  196,66,37,172,239                   ; vfnmadd213ps  %ymm15,%ymm11,%ymm13
-  DB  196,98,125,24,53,254,3,3,0          ; vbroadcastss  0x303fe(%rip),%ymm14        # 33574 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  DB  196,98,125,24,53,42,254,2,0         ; vbroadcastss  0x2fe2a(%rip),%ymm14        # 32f48 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   DB  196,65,36,88,222                    ; vaddps        %ymm14,%ymm11,%ymm11
-  DB  196,98,125,24,53,244,3,3,0          ; vbroadcastss  0x303f4(%rip),%ymm14        # 33578 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  DB  196,98,125,24,53,32,254,2,0         ; vbroadcastss  0x2fe20(%rip),%ymm14        # 32f4c <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   DB  196,65,12,94,219                    ; vdivps        %ymm11,%ymm14,%ymm11
   DB  196,65,20,92,219                    ; vsubps        %ymm11,%ymm13,%ymm11
   DB  196,65,28,89,219                    ; vmulps        %ymm11,%ymm12,%ymm11
   DB  196,67,125,8,227,1                  ; vroundps      $0x1,%ymm11,%ymm12
   DB  196,65,36,92,228                    ; vsubps        %ymm12,%ymm11,%ymm12
-  DB  196,98,125,24,45,213,3,3,0          ; vbroadcastss  0x303d5(%rip),%ymm13        # 3357c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  DB  196,98,125,24,45,1,254,2,0          ; vbroadcastss  0x2fe01(%rip),%ymm13        # 32f50 <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   DB  196,65,36,88,221                    ; vaddps        %ymm13,%ymm11,%ymm11
-  DB  196,98,125,24,45,203,3,3,0          ; vbroadcastss  0x303cb(%rip),%ymm13        # 33580 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  DB  196,98,125,24,45,247,253,2,0        ; vbroadcastss  0x2fdf7(%rip),%ymm13        # 32f54 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   DB  196,66,29,172,235                   ; vfnmadd213ps  %ymm11,%ymm12,%ymm13
-  DB  196,98,125,24,29,193,3,3,0          ; vbroadcastss  0x303c1(%rip),%ymm11        # 33584 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  DB  196,98,125,24,29,237,253,2,0        ; vbroadcastss  0x2fded(%rip),%ymm11        # 32f58 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   DB  196,65,36,92,220                    ; vsubps        %ymm12,%ymm11,%ymm11
-  DB  196,98,125,24,37,183,3,3,0          ; vbroadcastss  0x303b7(%rip),%ymm12        # 33588 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  DB  196,98,125,24,37,227,253,2,0        ; vbroadcastss  0x2fde3(%rip),%ymm12        # 32f5c <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   DB  196,65,28,94,219                    ; vdivps        %ymm11,%ymm12,%ymm11
   DB  196,65,20,88,219                    ; vaddps        %ymm11,%ymm13,%ymm11
-  DB  196,98,125,24,37,168,3,3,0          ; vbroadcastss  0x303a8(%rip),%ymm12        # 3358c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  DB  196,98,125,24,37,212,253,2,0        ; vbroadcastss  0x2fdd4(%rip),%ymm12        # 32f60 <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   DB  196,65,36,89,220                    ; vmulps        %ymm12,%ymm11,%ymm11
   DB  196,65,125,91,219                   ; vcvtps2dq     %ymm11,%ymm11
   DB  196,99,37,74,210,160                ; vblendvps     %ymm10,%ymm2,%ymm11,%ymm10
@@ -2971,7 +2964,7 @@
   DB  196,65,44,88,211                    ; vaddps        %ymm11,%ymm10,%ymm10
   DB  196,67,45,74,193,128                ; vblendvps     %ymm8,%ymm9,%ymm10,%ymm8
   DB  197,188,95,210                      ; vmaxps        %ymm2,%ymm8,%ymm2
-  DB  196,98,125,24,5,186,2,3,0           ; vbroadcastss  0x302ba(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,230,252,2,0         ; vbroadcastss  0x2fce6(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,108,93,208                  ; vminps        %ymm8,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -2991,33 +2984,33 @@
   DB  197,228,87,219                      ; vxorps        %ymm3,%ymm3,%ymm3
   DB  197,36,194,211,0                    ; vcmpeqps      %ymm3,%ymm11,%ymm10
   DB  196,65,124,91,235                   ; vcvtdq2ps     %ymm11,%ymm13
-  DB  196,98,125,24,53,253,2,3,0          ; vbroadcastss  0x302fd(%rip),%ymm14        # 33564 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
-  DB  196,98,125,24,61,248,2,3,0          ; vbroadcastss  0x302f8(%rip),%ymm15        # 33568 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  DB  196,98,125,24,53,41,253,2,0         ; vbroadcastss  0x2fd29(%rip),%ymm14        # 32f38 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  DB  196,98,125,24,61,36,253,2,0         ; vbroadcastss  0x2fd24(%rip),%ymm15        # 32f3c <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   DB  196,65,36,84,223                    ; vandps        %ymm15,%ymm11,%ymm11
-  DB  196,98,125,24,61,74,2,3,0           ; vbroadcastss  0x3024a(%rip),%ymm15        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,61,118,252,2,0        ; vbroadcastss  0x2fc76(%rip),%ymm15        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,65,36,86,223                    ; vorps         %ymm15,%ymm11,%ymm11
-  DB  196,98,125,24,61,224,2,3,0          ; vbroadcastss  0x302e0(%rip),%ymm15        # 3356c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  DB  196,98,125,24,61,12,253,2,0         ; vbroadcastss  0x2fd0c(%rip),%ymm15        # 32f40 <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   DB  196,66,21,184,254                   ; vfmadd231ps   %ymm14,%ymm13,%ymm15
-  DB  196,98,125,24,45,214,2,3,0          ; vbroadcastss  0x302d6(%rip),%ymm13        # 33570 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  DB  196,98,125,24,45,2,253,2,0          ; vbroadcastss  0x2fd02(%rip),%ymm13        # 32f44 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   DB  196,66,37,172,239                   ; vfnmadd213ps  %ymm15,%ymm11,%ymm13
-  DB  196,98,125,24,53,204,2,3,0          ; vbroadcastss  0x302cc(%rip),%ymm14        # 33574 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  DB  196,98,125,24,53,248,252,2,0        ; vbroadcastss  0x2fcf8(%rip),%ymm14        # 32f48 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   DB  196,65,36,88,222                    ; vaddps        %ymm14,%ymm11,%ymm11
-  DB  196,98,125,24,53,194,2,3,0          ; vbroadcastss  0x302c2(%rip),%ymm14        # 33578 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  DB  196,98,125,24,53,238,252,2,0        ; vbroadcastss  0x2fcee(%rip),%ymm14        # 32f4c <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   DB  196,65,12,94,219                    ; vdivps        %ymm11,%ymm14,%ymm11
   DB  196,65,20,92,219                    ; vsubps        %ymm11,%ymm13,%ymm11
   DB  196,65,28,89,219                    ; vmulps        %ymm11,%ymm12,%ymm11
   DB  196,67,125,8,227,1                  ; vroundps      $0x1,%ymm11,%ymm12
   DB  196,65,36,92,228                    ; vsubps        %ymm12,%ymm11,%ymm12
-  DB  196,98,125,24,45,163,2,3,0          ; vbroadcastss  0x302a3(%rip),%ymm13        # 3357c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  DB  196,98,125,24,45,207,252,2,0        ; vbroadcastss  0x2fccf(%rip),%ymm13        # 32f50 <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   DB  196,65,36,88,221                    ; vaddps        %ymm13,%ymm11,%ymm11
-  DB  196,98,125,24,45,153,2,3,0          ; vbroadcastss  0x30299(%rip),%ymm13        # 33580 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  DB  196,98,125,24,45,197,252,2,0        ; vbroadcastss  0x2fcc5(%rip),%ymm13        # 32f54 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   DB  196,66,29,172,235                   ; vfnmadd213ps  %ymm11,%ymm12,%ymm13
-  DB  196,98,125,24,29,143,2,3,0          ; vbroadcastss  0x3028f(%rip),%ymm11        # 33584 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  DB  196,98,125,24,29,187,252,2,0        ; vbroadcastss  0x2fcbb(%rip),%ymm11        # 32f58 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   DB  196,65,36,92,220                    ; vsubps        %ymm12,%ymm11,%ymm11
-  DB  196,98,125,24,37,133,2,3,0          ; vbroadcastss  0x30285(%rip),%ymm12        # 33588 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  DB  196,98,125,24,37,177,252,2,0        ; vbroadcastss  0x2fcb1(%rip),%ymm12        # 32f5c <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   DB  196,65,28,94,219                    ; vdivps        %ymm11,%ymm12,%ymm11
   DB  196,65,20,88,219                    ; vaddps        %ymm11,%ymm13,%ymm11
-  DB  196,98,125,24,37,118,2,3,0          ; vbroadcastss  0x30276(%rip),%ymm12        # 3358c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  DB  196,98,125,24,37,162,252,2,0        ; vbroadcastss  0x2fca2(%rip),%ymm12        # 32f60 <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   DB  196,65,36,89,220                    ; vmulps        %ymm12,%ymm11,%ymm11
   DB  196,65,125,91,219                   ; vcvtps2dq     %ymm11,%ymm11
   DB  196,99,37,74,211,160                ; vblendvps     %ymm10,%ymm3,%ymm11,%ymm10
@@ -3025,7 +3018,7 @@
   DB  196,65,44,88,211                    ; vaddps        %ymm11,%ymm10,%ymm10
   DB  196,67,45,74,193,128                ; vblendvps     %ymm8,%ymm9,%ymm10,%ymm8
   DB  197,188,95,219                      ; vmaxps        %ymm3,%ymm8,%ymm3
-  DB  196,98,125,24,5,136,1,3,0           ; vbroadcastss  0x30188(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,180,251,2,0         ; vbroadcastss  0x2fbb4(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,100,93,216                  ; vminps        %ymm8,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -3041,24 +3034,24 @@
   DB  197,252,17,84,36,96                 ; vmovups       %ymm2,0x60(%rsp)
   DB  197,252,17,140,36,128,0,0,0         ; vmovups       %ymm1,0x80(%rsp)
   DB  197,124,91,208                      ; vcvtdq2ps     %ymm0,%ymm10
-  DB  196,98,125,24,29,199,1,3,0          ; vbroadcastss  0x301c7(%rip),%ymm11        # 33564 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
-  DB  196,226,125,24,37,194,1,3,0         ; vbroadcastss  0x301c2(%rip),%ymm4        # 33568 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  DB  196,98,125,24,29,243,251,2,0        ; vbroadcastss  0x2fbf3(%rip),%ymm11        # 32f38 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  DB  196,226,125,24,37,238,251,2,0       ; vbroadcastss  0x2fbee(%rip),%ymm4        # 32f3c <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   DB  197,124,84,228                      ; vandps        %ymm4,%ymm0,%ymm12
-  DB  196,226,125,24,29,21,1,3,0          ; vbroadcastss  0x30115(%rip),%ymm3        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,226,125,24,29,65,251,2,0        ; vbroadcastss  0x2fb41(%rip),%ymm3        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  197,252,17,156,36,160,0,0,0         ; vmovups       %ymm3,0xa0(%rsp)
   DB  197,28,86,227                       ; vorps         %ymm3,%ymm12,%ymm12
-  DB  196,98,125,24,45,163,1,3,0          ; vbroadcastss  0x301a3(%rip),%ymm13        # 3356c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  DB  196,98,125,24,45,207,251,2,0        ; vbroadcastss  0x2fbcf(%rip),%ymm13        # 32f40 <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   DB  196,66,37,168,213                   ; vfmadd213ps   %ymm13,%ymm11,%ymm10
   DB  197,124,91,241                      ; vcvtdq2ps     %ymm1,%ymm14
   DB  196,66,37,168,245                   ; vfmadd213ps   %ymm13,%ymm11,%ymm14
   DB  197,124,91,250                      ; vcvtdq2ps     %ymm2,%ymm15
   DB  196,66,37,168,253                   ; vfmadd213ps   %ymm13,%ymm11,%ymm15
-  DB  196,226,125,24,45,135,1,3,0         ; vbroadcastss  0x30187(%rip),%ymm5        # 33570 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  DB  196,226,125,24,45,179,251,2,0       ; vbroadcastss  0x2fbb3(%rip),%ymm5        # 32f44 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   DB  196,98,29,188,213                   ; vfnmadd231ps  %ymm5,%ymm12,%ymm10
-  DB  196,226,125,24,13,125,1,3,0         ; vbroadcastss  0x3017d(%rip),%ymm1        # 33574 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  DB  196,226,125,24,13,169,251,2,0       ; vbroadcastss  0x2fba9(%rip),%ymm1        # 32f48 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   DB  197,252,17,76,36,32                 ; vmovups       %ymm1,0x20(%rsp)
   DB  197,28,88,225                       ; vaddps        %ymm1,%ymm12,%ymm12
-  DB  196,98,125,24,5,110,1,3,0           ; vbroadcastss  0x3016e(%rip),%ymm8        # 33578 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  DB  196,98,125,24,5,154,251,2,0         ; vbroadcastss  0x2fb9a(%rip),%ymm8        # 32f4c <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   DB  196,65,60,94,228                    ; vdivps        %ymm12,%ymm8,%ymm12
   DB  197,124,17,4,36                     ; vmovups       %ymm8,(%rsp)
   DB  196,65,44,92,212                    ; vsubps        %ymm12,%ymm10,%ymm10
@@ -3067,18 +3060,18 @@
   DB  196,65,44,89,213                    ; vmulps        %ymm13,%ymm10,%ymm10
   DB  196,195,125,8,250,1                 ; vroundps      $0x1,%ymm10,%ymm7
   DB  197,172,92,255                      ; vsubps        %ymm7,%ymm10,%ymm7
-  DB  196,98,125,24,29,68,1,3,0           ; vbroadcastss  0x30144(%rip),%ymm11        # 3357c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  DB  196,98,125,24,29,112,251,2,0        ; vbroadcastss  0x2fb70(%rip),%ymm11        # 32f50 <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   DB  196,65,44,88,211                    ; vaddps        %ymm11,%ymm10,%ymm10
-  DB  196,98,125,24,37,58,1,3,0           ; vbroadcastss  0x3013a(%rip),%ymm12        # 33580 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  DB  196,98,125,24,37,102,251,2,0        ; vbroadcastss  0x2fb66(%rip),%ymm12        # 32f54 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   DB  196,66,69,188,212                   ; vfnmadd231ps  %ymm12,%ymm7,%ymm10
-  DB  196,98,125,24,13,48,1,3,0           ; vbroadcastss  0x30130(%rip),%ymm9        # 33584 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  DB  196,98,125,24,13,92,251,2,0         ; vbroadcastss  0x2fb5c(%rip),%ymm9        # 32f58 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   DB  197,180,92,255                      ; vsubps        %ymm7,%ymm9,%ymm7
-  DB  196,226,125,24,13,39,1,3,0          ; vbroadcastss  0x30127(%rip),%ymm1        # 33588 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  DB  196,226,125,24,13,83,251,2,0        ; vbroadcastss  0x2fb53(%rip),%ymm1        # 32f5c <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   DB  197,244,94,255                      ; vdivps        %ymm7,%ymm1,%ymm7
   DB  197,172,88,255                      ; vaddps        %ymm7,%ymm10,%ymm7
   DB  196,65,44,87,210                    ; vxorps        %ymm10,%ymm10,%ymm10
   DB  196,193,124,194,242,0               ; vcmpeqps      %ymm10,%ymm0,%ymm6
-  DB  196,226,125,24,29,15,1,3,0          ; vbroadcastss  0x3010f(%rip),%ymm3        # 3358c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  DB  196,226,125,24,29,59,251,2,0        ; vbroadcastss  0x2fb3b(%rip),%ymm3        # 32f60 <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   DB  197,196,89,251                      ; vmulps        %ymm3,%ymm7,%ymm7
   DB  197,253,91,255                      ; vcvtps2dq     %ymm7,%ymm7
   DB  196,195,69,74,194,96                ; vblendvps     %ymm6,%ymm10,%ymm7,%ymm0
@@ -3145,27 +3138,27 @@
   DB  197,252,17,140,36,192,0,0,0         ; vmovups       %ymm1,0xc0(%rsp)
   DB  197,252,17,132,36,160,0,0,0         ; vmovups       %ymm0,0xa0(%rsp)
   DB  197,124,91,212                      ; vcvtdq2ps     %ymm4,%ymm10
-  DB  196,98,125,24,29,125,255,2,0        ; vbroadcastss  0x2ff7d(%rip),%ymm11        # 33564 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
-  DB  196,226,125,24,5,120,255,2,0        ; vbroadcastss  0x2ff78(%rip),%ymm0        # 33568 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  DB  196,98,125,24,29,169,249,2,0        ; vbroadcastss  0x2f9a9(%rip),%ymm11        # 32f38 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  DB  196,226,125,24,5,164,249,2,0        ; vbroadcastss  0x2f9a4(%rip),%ymm0        # 32f3c <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   DB  197,92,84,224                       ; vandps        %ymm0,%ymm4,%ymm12
   DB  197,252,40,208                      ; vmovaps       %ymm0,%ymm2
   DB  197,252,40,220                      ; vmovaps       %ymm4,%ymm3
-  DB  196,226,125,24,5,195,254,2,0        ; vbroadcastss  0x2fec3(%rip),%ymm0        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,226,125,24,5,239,248,2,0        ; vbroadcastss  0x2f8ef(%rip),%ymm0        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  197,252,17,132,36,128,0,0,0         ; vmovups       %ymm0,0x80(%rsp)
   DB  197,28,86,224                       ; vorps         %ymm0,%ymm12,%ymm12
-  DB  196,98,125,24,45,81,255,2,0         ; vbroadcastss  0x2ff51(%rip),%ymm13        # 3356c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  DB  196,98,125,24,45,125,249,2,0        ; vbroadcastss  0x2f97d(%rip),%ymm13        # 32f40 <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   DB  196,66,37,168,213                   ; vfmadd213ps   %ymm13,%ymm11,%ymm10
   DB  197,252,40,197                      ; vmovaps       %ymm5,%ymm0
   DB  197,124,91,240                      ; vcvtdq2ps     %ymm0,%ymm14
   DB  196,66,37,168,245                   ; vfmadd213ps   %ymm13,%ymm11,%ymm14
   DB  197,124,91,60,36                    ; vcvtdq2ps     (%rsp),%ymm15
   DB  196,66,37,168,253                   ; vfmadd213ps   %ymm13,%ymm11,%ymm15
-  DB  196,226,125,24,45,48,255,2,0        ; vbroadcastss  0x2ff30(%rip),%ymm5        # 33570 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  DB  196,226,125,24,45,92,249,2,0        ; vbroadcastss  0x2f95c(%rip),%ymm5        # 32f44 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   DB  196,98,29,188,213                   ; vfnmadd231ps  %ymm5,%ymm12,%ymm10
-  DB  196,226,125,24,13,38,255,2,0        ; vbroadcastss  0x2ff26(%rip),%ymm1        # 33574 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  DB  196,226,125,24,13,82,249,2,0        ; vbroadcastss  0x2f952(%rip),%ymm1        # 32f48 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   DB  197,252,17,76,36,64                 ; vmovups       %ymm1,0x40(%rsp)
   DB  197,28,88,225                       ; vaddps        %ymm1,%ymm12,%ymm12
-  DB  196,98,125,24,13,23,255,2,0         ; vbroadcastss  0x2ff17(%rip),%ymm9        # 33578 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  DB  196,98,125,24,13,67,249,2,0         ; vbroadcastss  0x2f943(%rip),%ymm9        # 32f4c <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   DB  196,65,52,94,228                    ; vdivps        %ymm12,%ymm9,%ymm12
   DB  197,124,17,76,36,32                 ; vmovups       %ymm9,0x20(%rsp)
   DB  196,65,44,92,212                    ; vsubps        %ymm12,%ymm10,%ymm10
@@ -3174,18 +3167,18 @@
   DB  196,65,44,89,213                    ; vmulps        %ymm13,%ymm10,%ymm10
   DB  196,195,125,8,250,1                 ; vroundps      $0x1,%ymm10,%ymm7
   DB  197,172,92,255                      ; vsubps        %ymm7,%ymm10,%ymm7
-  DB  196,98,125,24,29,236,254,2,0        ; vbroadcastss  0x2feec(%rip),%ymm11        # 3357c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  DB  196,98,125,24,29,24,249,2,0         ; vbroadcastss  0x2f918(%rip),%ymm11        # 32f50 <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   DB  196,65,44,88,211                    ; vaddps        %ymm11,%ymm10,%ymm10
-  DB  196,98,125,24,37,226,254,2,0        ; vbroadcastss  0x2fee2(%rip),%ymm12        # 33580 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  DB  196,98,125,24,37,14,249,2,0         ; vbroadcastss  0x2f90e(%rip),%ymm12        # 32f54 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   DB  196,66,69,188,212                   ; vfnmadd231ps  %ymm12,%ymm7,%ymm10
-  DB  196,98,125,24,5,216,254,2,0         ; vbroadcastss  0x2fed8(%rip),%ymm8        # 33584 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  DB  196,98,125,24,5,4,249,2,0           ; vbroadcastss  0x2f904(%rip),%ymm8        # 32f58 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   DB  197,188,92,255                      ; vsubps        %ymm7,%ymm8,%ymm7
-  DB  196,226,125,24,13,207,254,2,0       ; vbroadcastss  0x2fecf(%rip),%ymm1        # 33588 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  DB  196,226,125,24,13,251,248,2,0       ; vbroadcastss  0x2f8fb(%rip),%ymm1        # 32f5c <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   DB  197,244,94,255                      ; vdivps        %ymm7,%ymm1,%ymm7
   DB  197,172,88,255                      ; vaddps        %ymm7,%ymm10,%ymm7
   DB  196,65,44,87,210                    ; vxorps        %ymm10,%ymm10,%ymm10
   DB  196,193,100,194,242,0               ; vcmpeqps      %ymm10,%ymm3,%ymm6
-  DB  196,226,125,24,29,183,254,2,0       ; vbroadcastss  0x2feb7(%rip),%ymm3        # 3358c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  DB  196,226,125,24,29,227,248,2,0       ; vbroadcastss  0x2f8e3(%rip),%ymm3        # 32f60 <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   DB  197,196,89,251                      ; vmulps        %ymm3,%ymm7,%ymm7
   DB  197,253,91,255                      ; vcvtps2dq     %ymm7,%ymm7
   DB  196,195,69,74,226,96                ; vblendvps     %ymm6,%ymm10,%ymm7,%ymm4
@@ -3244,26 +3237,26 @@
 
 PUBLIC _sk_lab_to_xyz_hsw
 _sk_lab_to_xyz_hsw LABEL PROC
-  DB  196,98,125,24,5,150,253,2,0         ; vbroadcastss  0x2fd96(%rip),%ymm8        # 33590 <_sk_srcover_bgra_8888_sse2_lowp+0x374>
-  DB  196,98,125,24,13,245,252,2,0        ; vbroadcastss  0x2fcf5(%rip),%ymm9        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
-  DB  196,98,125,24,21,136,253,2,0        ; vbroadcastss  0x2fd88(%rip),%ymm10        # 33594 <_sk_srcover_bgra_8888_sse2_lowp+0x378>
+  DB  196,98,125,24,5,194,247,2,0         ; vbroadcastss  0x2f7c2(%rip),%ymm8        # 32f64 <_sk_srcover_bgra_8888_sse2_lowp+0x374>
+  DB  196,98,125,24,13,33,247,2,0         ; vbroadcastss  0x2f721(%rip),%ymm9        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  196,98,125,24,21,180,247,2,0        ; vbroadcastss  0x2f7b4(%rip),%ymm10        # 32f68 <_sk_srcover_bgra_8888_sse2_lowp+0x378>
   DB  196,194,53,168,202                  ; vfmadd213ps   %ymm10,%ymm9,%ymm1
   DB  196,194,53,168,210                  ; vfmadd213ps   %ymm10,%ymm9,%ymm2
-  DB  196,98,125,24,13,121,253,2,0        ; vbroadcastss  0x2fd79(%rip),%ymm9        # 33598 <_sk_srcover_bgra_8888_sse2_lowp+0x37c>
+  DB  196,98,125,24,13,165,247,2,0        ; vbroadcastss  0x2f7a5(%rip),%ymm9        # 32f6c <_sk_srcover_bgra_8888_sse2_lowp+0x37c>
   DB  196,66,125,184,200                  ; vfmadd231ps   %ymm8,%ymm0,%ymm9
-  DB  196,226,125,24,5,111,253,2,0        ; vbroadcastss  0x2fd6f(%rip),%ymm0        # 3359c <_sk_srcover_bgra_8888_sse2_lowp+0x380>
+  DB  196,226,125,24,5,155,247,2,0        ; vbroadcastss  0x2f79b(%rip),%ymm0        # 32f70 <_sk_srcover_bgra_8888_sse2_lowp+0x380>
   DB  197,180,89,192                      ; vmulps        %ymm0,%ymm9,%ymm0
-  DB  196,98,125,24,5,102,253,2,0         ; vbroadcastss  0x2fd66(%rip),%ymm8        # 335a0 <_sk_srcover_bgra_8888_sse2_lowp+0x384>
+  DB  196,98,125,24,5,146,247,2,0         ; vbroadcastss  0x2f792(%rip),%ymm8        # 32f74 <_sk_srcover_bgra_8888_sse2_lowp+0x384>
   DB  196,98,117,168,192                  ; vfmadd213ps   %ymm0,%ymm1,%ymm8
-  DB  196,98,125,24,13,92,253,2,0         ; vbroadcastss  0x2fd5c(%rip),%ymm9        # 335a4 <_sk_srcover_bgra_8888_sse2_lowp+0x388>
+  DB  196,98,125,24,13,136,247,2,0        ; vbroadcastss  0x2f788(%rip),%ymm9        # 32f78 <_sk_srcover_bgra_8888_sse2_lowp+0x388>
   DB  196,98,109,172,200                  ; vfnmadd213ps  %ymm0,%ymm2,%ymm9
   DB  196,193,60,89,200                   ; vmulps        %ymm8,%ymm8,%ymm1
   DB  197,188,89,201                      ; vmulps        %ymm1,%ymm8,%ymm1
-  DB  196,226,125,24,21,73,253,2,0        ; vbroadcastss  0x2fd49(%rip),%ymm2        # 335a8 <_sk_srcover_bgra_8888_sse2_lowp+0x38c>
+  DB  196,226,125,24,21,117,247,2,0       ; vbroadcastss  0x2f775(%rip),%ymm2        # 32f7c <_sk_srcover_bgra_8888_sse2_lowp+0x38c>
   DB  197,108,194,209,1                   ; vcmpltps      %ymm1,%ymm2,%ymm10
-  DB  196,98,125,24,29,63,253,2,0         ; vbroadcastss  0x2fd3f(%rip),%ymm11        # 335ac <_sk_srcover_bgra_8888_sse2_lowp+0x390>
+  DB  196,98,125,24,29,107,247,2,0        ; vbroadcastss  0x2f76b(%rip),%ymm11        # 32f80 <_sk_srcover_bgra_8888_sse2_lowp+0x390>
   DB  196,65,60,88,195                    ; vaddps        %ymm11,%ymm8,%ymm8
-  DB  196,98,125,24,37,53,253,2,0         ; vbroadcastss  0x2fd35(%rip),%ymm12        # 335b0 <_sk_srcover_bgra_8888_sse2_lowp+0x394>
+  DB  196,98,125,24,37,97,247,2,0         ; vbroadcastss  0x2f761(%rip),%ymm12        # 32f84 <_sk_srcover_bgra_8888_sse2_lowp+0x394>
   DB  196,65,60,89,196                    ; vmulps        %ymm12,%ymm8,%ymm8
   DB  196,99,61,74,193,160                ; vblendvps     %ymm10,%ymm1,%ymm8,%ymm8
   DB  197,252,89,200                      ; vmulps        %ymm0,%ymm0,%ymm1
@@ -3278,9 +3271,9 @@
   DB  196,65,52,88,203                    ; vaddps        %ymm11,%ymm9,%ymm9
   DB  196,65,52,89,204                    ; vmulps        %ymm12,%ymm9,%ymm9
   DB  196,227,53,74,208,32                ; vblendvps     %ymm2,%ymm0,%ymm9,%ymm2
-  DB  196,226,125,24,5,234,252,2,0        ; vbroadcastss  0x2fcea(%rip),%ymm0        # 335b4 <_sk_srcover_bgra_8888_sse2_lowp+0x398>
+  DB  196,226,125,24,5,22,247,2,0         ; vbroadcastss  0x2f716(%rip),%ymm0        # 32f88 <_sk_srcover_bgra_8888_sse2_lowp+0x398>
   DB  197,188,89,192                      ; vmulps        %ymm0,%ymm8,%ymm0
-  DB  196,98,125,24,5,225,252,2,0         ; vbroadcastss  0x2fce1(%rip),%ymm8        # 335b8 <_sk_srcover_bgra_8888_sse2_lowp+0x39c>
+  DB  196,98,125,24,5,13,247,2,0          ; vbroadcastss  0x2f70d(%rip),%ymm8        # 32f8c <_sk_srcover_bgra_8888_sse2_lowp+0x39c>
   DB  196,193,108,89,208                  ; vmulps        %ymm8,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -3288,66 +3281,64 @@
 PUBLIC _sk_load_a8_hsw
 _sk_load_a8_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,52                              ; jne           392c <_sk_load_a8_hsw+0x4c>
-  DB  196,130,121,48,4,24                 ; vpmovzxbw     (%r8,%r11,1),%xmm0
-  DB  197,249,219,5,42,5,3,0              ; vpand         0x3052a(%rip),%xmm0,%xmm0        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  117,52                              ; jne           38ce <_sk_load_a8_hsw+0x46>
+  DB  196,194,121,48,4,16                 ; vpmovzxbw     (%r8,%rdx,1),%xmm0
+  DB  197,249,219,5,104,255,2,0           ; vpand         0x2ff68(%rip),%xmm0,%xmm0        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  196,226,125,51,192                  ; vpmovzxwd     %xmm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,44,252,2,0        ; vbroadcastss  0x2fc2c(%rip),%ymm1        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,226,125,24,13,94,246,2,0        ; vbroadcastss  0x2f65e(%rip),%ymm1        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  197,252,89,217                      ; vmulps        %ymm1,%ymm0,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  197,236,87,210                      ; vxorps        %ymm2,%ymm2,%ymm2
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,190                             ; ja            38fe <_sk_load_a8_hsw+0x1e>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,121,0,0,0                 ; lea           0x79(%rip),%r10        # 39c4 <_sk_load_a8_hsw+0xe4>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,196                             ; ja            38a0 <_sk_load_a8_hsw+0x18>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,118,0,0,0                 ; lea           0x76(%rip),%r9        # 395c <_sk_load_a8_hsw+0xd4>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  67,15,182,4,24                      ; movzbl        (%r8,%r11,1),%eax
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  197,249,110,192                     ; vmovd         %eax,%xmm0
-  DB  235,159                             ; jmp           38fe <_sk_load_a8_hsw+0x1e>
-  DB  67,15,182,68,24,2                   ; movzbl        0x2(%r8,%r11,1),%eax
+  DB  235,166                             ; jmp           38a0 <_sk_load_a8_hsw+0x18>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,249,196,192,2                   ; vpinsrw       $0x2,%eax,%xmm0,%xmm0
-  DB  67,15,183,4,24                      ; movzwl        (%r8,%r11,1),%eax
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  197,249,110,200                     ; vmovd         %eax,%xmm1
   DB  196,226,121,48,201                  ; vpmovzxbw     %xmm1,%xmm1
   DB  196,227,121,2,193,1                 ; vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  DB  233,119,255,255,255                 ; jmpq          38fe <_sk_load_a8_hsw+0x1e>
-  DB  67,15,182,68,24,6                   ; movzbl        0x6(%r8,%r11,1),%eax
+  DB  235,129                             ; jmp           38a0 <_sk_load_a8_hsw+0x18>
+  DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,249,196,192,6                   ; vpinsrw       $0x6,%eax,%xmm0,%xmm0
-  DB  67,15,182,68,24,5                   ; movzbl        0x5(%r8,%r11,1),%eax
+  DB  65,15,182,68,16,5                   ; movzbl        0x5(%r8,%rdx,1),%eax
   DB  197,249,196,192,5                   ; vpinsrw       $0x5,%eax,%xmm0,%xmm0
-  DB  67,15,182,68,24,4                   ; movzbl        0x4(%r8,%r11,1),%eax
+  DB  65,15,182,68,16,4                   ; movzbl        0x4(%r8,%rdx,1),%eax
   DB  197,249,196,192,4                   ; vpinsrw       $0x4,%eax,%xmm0,%xmm0
-  DB  196,129,121,110,12,24               ; vmovd         (%r8,%r11,1),%xmm1
+  DB  196,193,121,110,12,16               ; vmovd         (%r8,%rdx,1),%xmm1
   DB  196,226,121,48,201                  ; vpmovzxbw     %xmm1,%xmm1
   DB  196,227,113,2,192,12                ; vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  DB  233,60,255,255,255                  ; jmpq          38fe <_sk_load_a8_hsw+0x1e>
+  DB  233,70,255,255,255                  ; jmpq          38a0 <_sk_load_a8_hsw+0x18>
   DB  102,144                             ; xchg          %ax,%ax
-  DB  144                                 ; nop
+  DB  147                                 ; xchg          %eax,%ebx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,170,255,255,255,155             ; ljmp          *-0x64000001(%rdx)
+  DB  255,173,255,255,255,158             ; ljmp          *-0x61000001(%rbp)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  232,255,255,255,221                 ; callq         ffffffffde0039d4 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddfd07b8>
+  DB  232,255,255,255,221                 ; callq         ffffffffde00396c <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddfd0d7c>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,210                             ; callq         *%rdx
@@ -3361,66 +3352,64 @@
 PUBLIC _sk_load_a8_dst_hsw
 _sk_load_a8_dst_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,52                              ; jne           3a2c <_sk_load_a8_dst_hsw+0x4c>
-  DB  196,130,121,48,36,24                ; vpmovzxbw     (%r8,%r11,1),%xmm4
-  DB  197,217,219,37,42,4,3,0             ; vpand         0x3042a(%rip),%xmm4,%xmm4        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  117,52                              ; jne           39be <_sk_load_a8_dst_hsw+0x46>
+  DB  196,194,121,48,36,16                ; vpmovzxbw     (%r8,%rdx,1),%xmm4
+  DB  197,217,219,37,120,254,2,0          ; vpand         0x2fe78(%rip),%xmm4,%xmm4        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  196,226,125,51,228                  ; vpmovzxwd     %xmm4,%ymm4
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,226,125,24,45,44,251,2,0        ; vbroadcastss  0x2fb2c(%rip),%ymm5        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,226,125,24,45,110,245,2,0       ; vbroadcastss  0x2f56e(%rip),%ymm5        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  197,220,89,253                      ; vmulps        %ymm5,%ymm4,%ymm7
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,220,87,228                      ; vxorps        %ymm4,%ymm4,%ymm4
   DB  197,212,87,237                      ; vxorps        %ymm5,%ymm5,%ymm5
   DB  197,204,87,246                      ; vxorps        %ymm6,%ymm6,%ymm6
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,190                             ; ja            39fe <_sk_load_a8_dst_hsw+0x1e>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,121,0,0,0                 ; lea           0x79(%rip),%r10        # 3ac4 <_sk_load_a8_dst_hsw+0xe4>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,196                             ; ja            3990 <_sk_load_a8_dst_hsw+0x18>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,118,0,0,0                 ; lea           0x76(%rip),%r9        # 3a4c <_sk_load_a8_dst_hsw+0xd4>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  67,15,182,4,24                      ; movzbl        (%r8,%r11,1),%eax
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  197,249,110,224                     ; vmovd         %eax,%xmm4
-  DB  235,159                             ; jmp           39fe <_sk_load_a8_dst_hsw+0x1e>
-  DB  67,15,182,68,24,2                   ; movzbl        0x2(%r8,%r11,1),%eax
+  DB  235,166                             ; jmp           3990 <_sk_load_a8_dst_hsw+0x18>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  197,217,196,224,2                   ; vpinsrw       $0x2,%eax,%xmm4,%xmm4
-  DB  67,15,183,4,24                      ; movzwl        (%r8,%r11,1),%eax
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  197,249,110,232                     ; vmovd         %eax,%xmm5
   DB  196,226,121,48,237                  ; vpmovzxbw     %xmm5,%xmm5
   DB  196,227,89,2,229,1                  ; vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  DB  233,119,255,255,255                 ; jmpq          39fe <_sk_load_a8_dst_hsw+0x1e>
-  DB  67,15,182,68,24,6                   ; movzbl        0x6(%r8,%r11,1),%eax
+  DB  235,129                             ; jmp           3990 <_sk_load_a8_dst_hsw+0x18>
+  DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  197,217,196,224,6                   ; vpinsrw       $0x6,%eax,%xmm4,%xmm4
-  DB  67,15,182,68,24,5                   ; movzbl        0x5(%r8,%r11,1),%eax
+  DB  65,15,182,68,16,5                   ; movzbl        0x5(%r8,%rdx,1),%eax
   DB  197,217,196,224,5                   ; vpinsrw       $0x5,%eax,%xmm4,%xmm4
-  DB  67,15,182,68,24,4                   ; movzbl        0x4(%r8,%r11,1),%eax
+  DB  65,15,182,68,16,4                   ; movzbl        0x4(%r8,%rdx,1),%eax
   DB  197,217,196,224,4                   ; vpinsrw       $0x4,%eax,%xmm4,%xmm4
-  DB  196,129,121,110,44,24               ; vmovd         (%r8,%r11,1),%xmm5
+  DB  196,193,121,110,44,16               ; vmovd         (%r8,%rdx,1),%xmm5
   DB  196,226,121,48,237                  ; vpmovzxbw     %xmm5,%xmm5
   DB  196,227,81,2,228,12                 ; vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  DB  233,60,255,255,255                  ; jmpq          39fe <_sk_load_a8_dst_hsw+0x1e>
+  DB  233,70,255,255,255                  ; jmpq          3990 <_sk_load_a8_dst_hsw+0x18>
   DB  102,144                             ; xchg          %ax,%ax
-  DB  144                                 ; nop
+  DB  147                                 ; xchg          %eax,%ebx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,170,255,255,255,155             ; ljmp          *-0x64000001(%rdx)
+  DB  255,173,255,255,255,158             ; ljmp          *-0x61000001(%rbp)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  232,255,255,255,221                 ; callq         ffffffffde003ad4 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddfd08b8>
+  DB  232,255,255,255,221                 ; callq         ffffffffde003a5c <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddfd0e6c>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,210                             ; callq         *%rdx
@@ -3485,7 +3474,7 @@
   DB  196,227,121,32,192,7                ; vpinsrb       $0x7,%eax,%xmm0,%xmm0
   DB  196,226,125,49,192                  ; vpmovzxbd     %xmm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,115,249,2,0       ; vbroadcastss  0x2f973(%rip),%ymm1        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,226,125,24,13,191,243,2,0       ; vbroadcastss  0x2f3bf(%rip),%ymm1        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  197,252,89,217                      ; vmulps        %ymm1,%ymm0,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
@@ -3500,65 +3489,64 @@
 PUBLIC _sk_store_a8_hsw
 _sk_store_a8_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,60,95,195                       ; vmaxps        %ymm3,%ymm8,%ymm8
-  DB  196,98,125,24,13,187,248,2,0        ; vbroadcastss  0x2f8bb(%rip),%ymm9        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,13,13,243,2,0         ; vbroadcastss  0x2f30d(%rip),%ymm9        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,65,60,93,193                    ; vminps        %ymm9,%ymm8,%ymm8
-  DB  196,98,125,24,13,217,248,2,0        ; vbroadcastss  0x2f8d9(%rip),%ymm9        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  196,98,125,24,13,43,243,2,0         ; vbroadcastss  0x2f32b(%rip),%ymm9        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
   DB  196,65,125,91,192                   ; vcvtps2dq     %ymm8,%ymm8
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
   DB  196,66,57,43,193                    ; vpackusdw     %xmm9,%xmm8,%xmm8
   DB  197,57,103,192                      ; vpackuswb     %xmm0,%xmm8,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           3c47 <_sk_store_a8_hsw+0x5b>
-  DB  196,1,121,214,4,24                  ; vmovq         %xmm8,(%r8,%r11,1)
+  DB  117,10                              ; jne           3bc9 <_sk_store_a8_hsw+0x55>
+  DB  196,65,121,214,4,16                 ; vmovq         %xmm8,(%r8,%rdx,1)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,236                             ; ja            3c43 <_sk_store_a8_hsw+0x57>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,242                             ; ja            3bc5 <_sk_store_a8_hsw+0x51>
   DB  196,66,121,48,192                   ; vpmovzxbw     %xmm8,%xmm8
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,85,0,0,0                  ; lea           0x55(%rip),%r10        # 3cbc <_sk_store_a8_hsw+0xd0>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,86,0,0,0                  ; lea           0x56(%rip),%r9        # 3c38 <_sk_store_a8_hsw+0xc4>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,3,121,20,4,24,0                 ; vpextrb       $0x0,%xmm8,(%r8,%r11,1)
-  DB  235,202                             ; jmp           3c43 <_sk_store_a8_hsw+0x57>
-  DB  196,3,121,20,68,24,2,4              ; vpextrb       $0x4,%xmm8,0x2(%r8,%r11,1)
-  DB  196,98,57,0,5,182,1,3,0             ; vpshufb       0x301b6(%rip),%xmm8,%xmm8        # 33e40 <_sk_srcover_bgra_8888_sse2_lowp+0xc24>
-  DB  196,3,121,21,4,24,0                 ; vpextrw       $0x0,%xmm8,(%r8,%r11,1)
-  DB  235,176                             ; jmp           3c43 <_sk_store_a8_hsw+0x57>
-  DB  196,3,121,20,68,24,6,12             ; vpextrb       $0xc,%xmm8,0x6(%r8,%r11,1)
-  DB  196,3,121,20,68,24,5,10             ; vpextrb       $0xa,%xmm8,0x5(%r8,%r11,1)
-  DB  196,3,121,20,68,24,4,8              ; vpextrb       $0x8,%xmm8,0x4(%r8,%r11,1)
-  DB  196,98,57,0,5,156,1,3,0             ; vpshufb       0x3019c(%rip),%xmm8,%xmm8        # 33e50 <_sk_srcover_bgra_8888_sse2_lowp+0xc34>
-  DB  196,1,121,126,4,24                  ; vmovd         %xmm8,(%r8,%r11,1)
-  DB  235,135                             ; jmp           3c43 <_sk_store_a8_hsw+0x57>
-  DB  180,255                             ; mov           $0xff,%ah
+  DB  196,67,121,20,4,16,0                ; vpextrb       $0x0,%xmm8,(%r8,%rdx,1)
+  DB  235,209                             ; jmp           3bc5 <_sk_store_a8_hsw+0x51>
+  DB  196,67,121,20,68,16,2,4             ; vpextrb       $0x4,%xmm8,0x2(%r8,%rdx,1)
+  DB  196,98,57,0,5,27,252,2,0            ; vpshufb       0x2fc1b(%rip),%xmm8,%xmm8        # 33820 <_sk_srcover_bgra_8888_sse2_lowp+0xc30>
+  DB  196,67,121,21,4,16,0                ; vpextrw       $0x0,%xmm8,(%r8,%rdx,1)
+  DB  235,183                             ; jmp           3bc5 <_sk_store_a8_hsw+0x51>
+  DB  196,67,121,20,68,16,6,12            ; vpextrb       $0xc,%xmm8,0x6(%r8,%rdx,1)
+  DB  196,67,121,20,68,16,5,10            ; vpextrb       $0xa,%xmm8,0x5(%r8,%rdx,1)
+  DB  196,67,121,20,68,16,4,8             ; vpextrb       $0x8,%xmm8,0x4(%r8,%rdx,1)
+  DB  196,98,57,0,5,1,252,2,0             ; vpshufb       0x2fc01(%rip),%xmm8,%xmm8        # 33830 <_sk_srcover_bgra_8888_sse2_lowp+0xc40>
+  DB  196,65,121,126,4,16                 ; vmovd         %xmm8,(%r8,%rdx,1)
+  DB  235,142                             ; jmp           3bc5 <_sk_store_a8_hsw+0x51>
+  DB  144                                 ; nop
+  DB  179,255                             ; mov           $0xff,%bl
   DB  255                                 ; (bad)
-  DB  255,197                             ; inc           %ebp
+  DB  255,196                             ; inc           %esp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  189,255,255,255,239                 ; mov           $0xefffffff,%ebp
+  DB  188,255,255,255,238                 ; mov           $0xeeffffff,%esp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,231                             ; jmpq          *%rdi
+  DB  255,230                             ; jmpq          *%rsi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  223,255                             ; (bad)
+  DB  222,255                             ; fdivrp        %st,%st(7)
   DB  255                                 ; (bad)
-  DB  255,215                             ; callq         *%rdi
+  DB  255,214                             ; callq         *%rsi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -3566,72 +3554,70 @@
 PUBLIC _sk_load_g8_hsw
 _sk_load_g8_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,57                              ; jne           3d29 <_sk_load_g8_hsw+0x51>
-  DB  196,130,121,48,4,24                 ; vpmovzxbw     (%r8,%r11,1),%xmm0
-  DB  197,249,219,5,50,1,3,0              ; vpand         0x30132(%rip),%xmm0,%xmm0        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  117,57                              ; jne           3c9f <_sk_load_g8_hsw+0x4b>
+  DB  196,194,121,48,4,16                 ; vpmovzxbw     (%r8,%rdx,1),%xmm0
+  DB  197,249,219,5,156,251,2,0           ; vpand         0x2fb9c(%rip),%xmm0,%xmm0        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  196,226,125,51,192                  ; vpmovzxwd     %xmm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,52,248,2,0        ; vbroadcastss  0x2f834(%rip),%ymm1        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,226,125,24,13,146,242,2,0       ; vbroadcastss  0x2f292(%rip),%ymm1        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,173,247,2,0       ; vbroadcastss  0x2f7ad(%rip),%ymm3        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,29,11,242,2,0        ; vbroadcastss  0x2f20b(%rip),%ymm3        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,252,40,200                      ; vmovaps       %ymm0,%ymm1
   DB  197,252,40,208                      ; vmovaps       %ymm0,%ymm2
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,185                             ; ja            3cf6 <_sk_load_g8_hsw+0x1e>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,120,0,0,0                 ; lea           0x78(%rip),%r10        # 3dc0 <_sk_load_g8_hsw+0xe8>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,191                             ; ja            3c6c <_sk_load_g8_hsw+0x18>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,121,0,0,0                 ; lea           0x79(%rip),%r9        # 3d30 <_sk_load_g8_hsw+0xdc>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  67,15,182,4,24                      ; movzbl        (%r8,%r11,1),%eax
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  197,249,110,192                     ; vmovd         %eax,%xmm0
-  DB  235,154                             ; jmp           3cf6 <_sk_load_g8_hsw+0x1e>
-  DB  67,15,182,68,24,2                   ; movzbl        0x2(%r8,%r11,1),%eax
+  DB  235,161                             ; jmp           3c6c <_sk_load_g8_hsw+0x18>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,249,196,192,2                   ; vpinsrw       $0x2,%eax,%xmm0,%xmm0
-  DB  67,15,183,4,24                      ; movzwl        (%r8,%r11,1),%eax
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  197,249,110,200                     ; vmovd         %eax,%xmm1
   DB  196,226,121,48,201                  ; vpmovzxbw     %xmm1,%xmm1
   DB  196,227,121,2,193,1                 ; vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  DB  233,114,255,255,255                 ; jmpq          3cf6 <_sk_load_g8_hsw+0x1e>
-  DB  67,15,182,68,24,6                   ; movzbl        0x6(%r8,%r11,1),%eax
+  DB  233,121,255,255,255                 ; jmpq          3c6c <_sk_load_g8_hsw+0x18>
+  DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,249,196,192,6                   ; vpinsrw       $0x6,%eax,%xmm0,%xmm0
-  DB  67,15,182,68,24,5                   ; movzbl        0x5(%r8,%r11,1),%eax
+  DB  65,15,182,68,16,5                   ; movzbl        0x5(%r8,%rdx,1),%eax
   DB  197,249,196,192,5                   ; vpinsrw       $0x5,%eax,%xmm0,%xmm0
-  DB  67,15,182,68,24,4                   ; movzbl        0x4(%r8,%r11,1),%eax
+  DB  65,15,182,68,16,4                   ; movzbl        0x4(%r8,%rdx,1),%eax
   DB  197,249,196,192,4                   ; vpinsrw       $0x4,%eax,%xmm0,%xmm0
-  DB  196,129,121,110,12,24               ; vmovd         (%r8,%r11,1),%xmm1
+  DB  196,193,121,110,12,16               ; vmovd         (%r8,%rdx,1),%xmm1
   DB  196,226,121,48,201                  ; vpmovzxbw     %xmm1,%xmm1
   DB  196,227,113,2,192,12                ; vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  DB  233,55,255,255,255                  ; jmpq          3cf6 <_sk_load_g8_hsw+0x1e>
+  DB  233,62,255,255,255                  ; jmpq          3c6c <_sk_load_g8_hsw+0x18>
+  DB  102,144                             ; xchg          %ax,%ax
   DB  144                                 ; nop
-  DB  145                                 ; xchg          %eax,%ecx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,171,255,255,255,156             ; ljmp          *-0x63000001(%rbx)
+  DB  255,170,255,255,255,155             ; ljmp          *-0x64000001(%rdx)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  233,255,255,255,222                 ; jmpq          ffffffffdf003dd0 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffdefd0bb4>
+  DB  232,255,255,255,221                 ; callq         ffffffffde003d40 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddfd1150>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,211                             ; callq         *%rbx
+  DB  255,210                             ; callq         *%rdx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,196                             ; inc           %esp
+  DB  255,195                             ; inc           %ebx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -3639,72 +3625,70 @@
 PUBLIC _sk_load_g8_dst_hsw
 _sk_load_g8_dst_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,57                              ; jne           3e2d <_sk_load_g8_dst_hsw+0x51>
-  DB  196,130,121,48,36,24                ; vpmovzxbw     (%r8,%r11,1),%xmm4
-  DB  197,217,219,37,46,0,3,0             ; vpand         0x3002e(%rip),%xmm4,%xmm4        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  117,57                              ; jne           3d97 <_sk_load_g8_dst_hsw+0x4b>
+  DB  196,194,121,48,36,16                ; vpmovzxbw     (%r8,%rdx,1),%xmm4
+  DB  197,217,219,37,164,250,2,0          ; vpand         0x2faa4(%rip),%xmm4,%xmm4        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  196,226,125,51,228                  ; vpmovzxwd     %xmm4,%ymm4
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,226,125,24,45,48,247,2,0        ; vbroadcastss  0x2f730(%rip),%ymm5        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,226,125,24,45,154,241,2,0       ; vbroadcastss  0x2f19a(%rip),%ymm5        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  197,220,89,229                      ; vmulps        %ymm5,%ymm4,%ymm4
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,61,169,246,2,0       ; vbroadcastss  0x2f6a9(%rip),%ymm7        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,61,19,241,2,0        ; vbroadcastss  0x2f113(%rip),%ymm7        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,252,40,236                      ; vmovaps       %ymm4,%ymm5
   DB  197,252,40,244                      ; vmovaps       %ymm4,%ymm6
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,185                             ; ja            3dfa <_sk_load_g8_dst_hsw+0x1e>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,120,0,0,0                 ; lea           0x78(%rip),%r10        # 3ec4 <_sk_load_g8_dst_hsw+0xe8>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,191                             ; ja            3d64 <_sk_load_g8_dst_hsw+0x18>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,121,0,0,0                 ; lea           0x79(%rip),%r9        # 3e28 <_sk_load_g8_dst_hsw+0xdc>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  67,15,182,4,24                      ; movzbl        (%r8,%r11,1),%eax
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  197,249,110,224                     ; vmovd         %eax,%xmm4
-  DB  235,154                             ; jmp           3dfa <_sk_load_g8_dst_hsw+0x1e>
-  DB  67,15,182,68,24,2                   ; movzbl        0x2(%r8,%r11,1),%eax
+  DB  235,161                             ; jmp           3d64 <_sk_load_g8_dst_hsw+0x18>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  197,217,196,224,2                   ; vpinsrw       $0x2,%eax,%xmm4,%xmm4
-  DB  67,15,183,4,24                      ; movzwl        (%r8,%r11,1),%eax
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  197,249,110,232                     ; vmovd         %eax,%xmm5
   DB  196,226,121,48,237                  ; vpmovzxbw     %xmm5,%xmm5
   DB  196,227,89,2,229,1                  ; vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  DB  233,114,255,255,255                 ; jmpq          3dfa <_sk_load_g8_dst_hsw+0x1e>
-  DB  67,15,182,68,24,6                   ; movzbl        0x6(%r8,%r11,1),%eax
+  DB  233,121,255,255,255                 ; jmpq          3d64 <_sk_load_g8_dst_hsw+0x18>
+  DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  197,217,196,224,6                   ; vpinsrw       $0x6,%eax,%xmm4,%xmm4
-  DB  67,15,182,68,24,5                   ; movzbl        0x5(%r8,%r11,1),%eax
+  DB  65,15,182,68,16,5                   ; movzbl        0x5(%r8,%rdx,1),%eax
   DB  197,217,196,224,5                   ; vpinsrw       $0x5,%eax,%xmm4,%xmm4
-  DB  67,15,182,68,24,4                   ; movzbl        0x4(%r8,%r11,1),%eax
+  DB  65,15,182,68,16,4                   ; movzbl        0x4(%r8,%rdx,1),%eax
   DB  197,217,196,224,4                   ; vpinsrw       $0x4,%eax,%xmm4,%xmm4
-  DB  196,129,121,110,44,24               ; vmovd         (%r8,%r11,1),%xmm5
+  DB  196,193,121,110,44,16               ; vmovd         (%r8,%rdx,1),%xmm5
   DB  196,226,121,48,237                  ; vpmovzxbw     %xmm5,%xmm5
   DB  196,227,81,2,228,12                 ; vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  DB  233,55,255,255,255                  ; jmpq          3dfa <_sk_load_g8_dst_hsw+0x1e>
+  DB  233,62,255,255,255                  ; jmpq          3d64 <_sk_load_g8_dst_hsw+0x18>
+  DB  102,144                             ; xchg          %ax,%ax
   DB  144                                 ; nop
-  DB  145                                 ; xchg          %eax,%ecx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,171,255,255,255,156             ; ljmp          *-0x63000001(%rbx)
+  DB  255,170,255,255,255,155             ; ljmp          *-0x64000001(%rdx)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  233,255,255,255,222                 ; jmpq          ffffffffdf003ed4 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffdefd0cb8>
+  DB  232,255,255,255,221                 ; callq         ffffffffde003e38 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddfd1248>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,211                             ; callq         *%rbx
+  DB  255,210                             ; callq         *%rdx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,196                             ; inc           %esp
+  DB  255,195                             ; inc           %ebx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -3763,10 +3747,10 @@
   DB  196,227,121,32,192,7                ; vpinsrb       $0x7,%eax,%xmm0,%xmm0
   DB  196,226,125,49,192                  ; vpmovzxbd     %xmm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,115,245,2,0       ; vbroadcastss  0x2f573(%rip),%ymm1        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,226,125,24,13,227,239,2,0       ; vbroadcastss  0x2efe3(%rip),%ymm1        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,236,244,2,0       ; vbroadcastss  0x2f4ec(%rip),%ymm3        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,29,92,239,2,0        ; vbroadcastss  0x2ef5c(%rip),%ymm3        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,252,40,200                      ; vmovaps       %ymm0,%ymm1
   DB  197,252,40,208                      ; vmovaps       %ymm0,%ymm2
   DB  91                                  ; pop           %rbx
@@ -3778,137 +3762,58 @@
 PUBLIC _sk_load_565_hsw
 _sk_load_565_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,114                             ; jne           407e <_sk_load_565_hsw+0x8d>
-  DB  196,129,122,111,4,88                ; vmovdqu       (%r8,%r11,2),%xmm0
+  DB  117,114                             ; jne           3fdc <_sk_load_565_hsw+0x87>
+  DB  196,193,122,111,4,80                ; vmovdqu       (%r8,%rdx,2),%xmm0
   DB  196,226,125,51,208                  ; vpmovzxwd     %xmm0,%ymm2
-  DB  196,226,125,88,5,40,245,2,0         ; vpbroadcastd  0x2f528(%rip),%ymm0        # 33548 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  DB  196,226,125,88,5,158,239,2,0        ; vpbroadcastd  0x2ef9e(%rip),%ymm0        # 32f1c <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
   DB  197,237,219,192                     ; vpand         %ymm0,%ymm2,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,27,245,2,0        ; vbroadcastss  0x2f51b(%rip),%ymm1        # 3354c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  DB  196,226,125,24,13,145,239,2,0       ; vbroadcastss  0x2ef91(%rip),%ymm1        # 32f20 <_sk_srcover_bgra_8888_sse2_lowp+0x330>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
-  DB  196,226,125,88,13,18,245,2,0        ; vpbroadcastd  0x2f512(%rip),%ymm1        # 33550 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  DB  196,226,125,88,13,136,239,2,0       ; vpbroadcastd  0x2ef88(%rip),%ymm1        # 32f24 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
   DB  197,237,219,201                     ; vpand         %ymm1,%ymm2,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
-  DB  196,226,125,24,29,5,245,2,0         ; vbroadcastss  0x2f505(%rip),%ymm3        # 33554 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  DB  196,226,125,24,29,123,239,2,0       ; vbroadcastss  0x2ef7b(%rip),%ymm3        # 32f28 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
   DB  197,244,89,203                      ; vmulps        %ymm3,%ymm1,%ymm1
-  DB  196,226,125,88,29,252,244,2,0       ; vpbroadcastd  0x2f4fc(%rip),%ymm3        # 33558 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  DB  196,226,125,88,29,114,239,2,0       ; vpbroadcastd  0x2ef72(%rip),%ymm3        # 32f2c <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
   DB  197,237,219,211                     ; vpand         %ymm3,%ymm2,%ymm2
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
-  DB  196,226,125,24,29,239,244,2,0       ; vbroadcastss  0x2f4ef(%rip),%ymm3        # 3355c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  DB  196,226,125,24,29,101,239,2,0       ; vbroadcastss  0x2ef65(%rip),%ymm3        # 32f30 <_sk_srcover_bgra_8888_sse2_lowp+0x340>
   DB  197,236,89,211                      ; vmulps        %ymm3,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,80,244,2,0        ; vbroadcastss  0x2f450(%rip),%ymm3        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,29,198,238,2,0       ; vbroadcastss  0x2eec6(%rip),%ymm3        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,128                             ; ja            4012 <_sk_load_565_hsw+0x21>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,99,0,0,0                  ; lea           0x63(%rip),%r10        # 4100 <_sk_load_565_hsw+0x10f>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,134                             ; ja            3f70 <_sk_load_565_hsw+0x1b>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,100,0,0,0                 ; lea           0x64(%rip),%r9        # 4058 <_sk_load_565_hsw+0x103>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  67,15,183,4,88                      ; movzwl        (%r8,%r11,2),%eax
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  197,249,110,192                     ; vmovd         %eax,%xmm0
-  DB  233,94,255,255,255                  ; jmpq          4012 <_sk_load_565_hsw+0x21>
+  DB  233,101,255,255,255                 ; jmpq          3f70 <_sk_load_565_hsw+0x1b>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
-  DB  196,129,121,196,68,88,4,2           ; vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
-  DB  196,129,121,110,12,88               ; vmovd         (%r8,%r11,2),%xmm1
+  DB  196,193,121,196,68,80,4,2           ; vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm0,%xmm0
+  DB  196,193,121,110,12,80               ; vmovd         (%r8,%rdx,2),%xmm1
   DB  196,227,121,2,193,1                 ; vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  DB  233,65,255,255,255                  ; jmpq          4012 <_sk_load_565_hsw+0x21>
+  DB  233,72,255,255,255                  ; jmpq          3f70 <_sk_load_565_hsw+0x1b>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
-  DB  196,129,121,196,68,88,12,6          ; vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
-  DB  196,129,121,196,68,88,10,5          ; vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
-  DB  196,129,121,196,68,88,8,4           ; vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
-  DB  196,129,122,126,12,88               ; vmovq         (%r8,%r11,2),%xmm1
+  DB  196,193,121,196,68,80,12,6          ; vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm0,%xmm0
+  DB  196,193,121,196,68,80,10,5          ; vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm0,%xmm0
+  DB  196,193,121,196,68,80,8,4           ; vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm0,%xmm0
+  DB  196,193,122,126,12,80               ; vmovq         (%r8,%rdx,2),%xmm1
   DB  196,227,113,2,192,12                ; vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  DB  233,20,255,255,255                  ; jmpq          4012 <_sk_load_565_hsw+0x21>
-  DB  102,144                             ; xchg          %ax,%ax
-  DB  166                                 ; cmpsb         %es:(%rdi),%ds:(%rsi)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,192                             ; inc           %eax
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,180,255,255,255,237,255         ; pushq         -0x120001(%rdi,%rdi,8)
-  DB  255                                 ; (bad)
-  DB  255,229                             ; jmpq          *%rbp
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  221,255                             ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,209                             ; callq         *%rcx
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; .byte         0xff
-
-PUBLIC _sk_load_565_dst_hsw
-_sk_load_565_dst_hsw LABEL PROC
-  DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
-  DB  77,1,192                            ; add           %r8,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
-  DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,114                             ; jne           41a9 <_sk_load_565_dst_hsw+0x8d>
-  DB  196,129,122,111,36,88               ; vmovdqu       (%r8,%r11,2),%xmm4
-  DB  196,226,125,51,244                  ; vpmovzxwd     %xmm4,%ymm6
-  DB  196,226,125,88,37,253,243,2,0       ; vpbroadcastd  0x2f3fd(%rip),%ymm4        # 33548 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
-  DB  197,205,219,228                     ; vpand         %ymm4,%ymm6,%ymm4
-  DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,226,125,24,45,240,243,2,0       ; vbroadcastss  0x2f3f0(%rip),%ymm5        # 3354c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
-  DB  197,220,89,229                      ; vmulps        %ymm5,%ymm4,%ymm4
-  DB  196,226,125,88,45,231,243,2,0       ; vpbroadcastd  0x2f3e7(%rip),%ymm5        # 33550 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
-  DB  197,205,219,237                     ; vpand         %ymm5,%ymm6,%ymm5
-  DB  197,252,91,237                      ; vcvtdq2ps     %ymm5,%ymm5
-  DB  196,226,125,24,61,218,243,2,0       ; vbroadcastss  0x2f3da(%rip),%ymm7        # 33554 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
-  DB  197,212,89,239                      ; vmulps        %ymm7,%ymm5,%ymm5
-  DB  196,226,125,88,61,209,243,2,0       ; vpbroadcastd  0x2f3d1(%rip),%ymm7        # 33558 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
-  DB  197,205,219,247                     ; vpand         %ymm7,%ymm6,%ymm6
-  DB  197,252,91,246                      ; vcvtdq2ps     %ymm6,%ymm6
-  DB  196,226,125,24,61,196,243,2,0       ; vbroadcastss  0x2f3c4(%rip),%ymm7        # 3355c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
-  DB  197,204,89,247                      ; vmulps        %ymm7,%ymm6,%ymm6
-  DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,61,37,243,2,0        ; vbroadcastss  0x2f325(%rip),%ymm7        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
-  DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
-  DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,128                             ; ja            413d <_sk_load_565_dst_hsw+0x21>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,100,0,0,0                 ; lea           0x64(%rip),%r10        # 422c <_sk_load_565_dst_hsw+0x110>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
-  DB  255,224                             ; jmpq          *%rax
-  DB  67,15,183,4,88                      ; movzwl        (%r8,%r11,2),%eax
-  DB  197,249,110,224                     ; vmovd         %eax,%xmm4
-  DB  233,94,255,255,255                  ; jmpq          413d <_sk_load_565_dst_hsw+0x21>
-  DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
-  DB  196,129,89,196,100,88,4,2           ; vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
-  DB  196,129,121,110,44,88               ; vmovd         (%r8,%r11,2),%xmm5
-  DB  196,227,89,2,229,1                  ; vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  DB  233,65,255,255,255                  ; jmpq          413d <_sk_load_565_dst_hsw+0x21>
-  DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
-  DB  196,129,89,196,100,88,12,6          ; vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
-  DB  196,129,89,196,100,88,10,5          ; vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
-  DB  196,129,89,196,100,88,8,4           ; vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
-  DB  196,129,122,126,44,88               ; vmovq         (%r8,%r11,2),%xmm5
-  DB  196,227,81,2,228,12                 ; vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  DB  233,20,255,255,255                  ; jmpq          413d <_sk_load_565_dst_hsw+0x21>
+  DB  233,27,255,255,255                  ; jmpq          3f70 <_sk_load_565_hsw+0x1b>
   DB  15,31,0                             ; nopl          (%rax)
   DB  165                                 ; movsl         %ds:(%rsi),%es:(%rdi)
   DB  255                                 ; (bad)
@@ -3932,6 +3837,80 @@
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
 
+PUBLIC _sk_load_565_dst_hsw
+_sk_load_565_dst_hsw LABEL PROC
+  DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
+  DB  77,1,192                            ; add           %r8,%r8
+  DB  76,3,0                              ; add           (%rax),%r8
+  DB  72,133,255                          ; test          %rdi,%rdi
+  DB  117,114                             ; jne           40fb <_sk_load_565_dst_hsw+0x87>
+  DB  196,193,122,111,36,80               ; vmovdqu       (%r8,%rdx,2),%xmm4
+  DB  196,226,125,51,244                  ; vpmovzxwd     %xmm4,%ymm6
+  DB  196,226,125,88,37,127,238,2,0       ; vpbroadcastd  0x2ee7f(%rip),%ymm4        # 32f1c <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  DB  197,205,219,228                     ; vpand         %ymm4,%ymm6,%ymm4
+  DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
+  DB  196,226,125,24,45,114,238,2,0       ; vbroadcastss  0x2ee72(%rip),%ymm5        # 32f20 <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  DB  197,220,89,229                      ; vmulps        %ymm5,%ymm4,%ymm4
+  DB  196,226,125,88,45,105,238,2,0       ; vpbroadcastd  0x2ee69(%rip),%ymm5        # 32f24 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  DB  197,205,219,237                     ; vpand         %ymm5,%ymm6,%ymm5
+  DB  197,252,91,237                      ; vcvtdq2ps     %ymm5,%ymm5
+  DB  196,226,125,24,61,92,238,2,0        ; vbroadcastss  0x2ee5c(%rip),%ymm7        # 32f28 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  DB  197,212,89,239                      ; vmulps        %ymm7,%ymm5,%ymm5
+  DB  196,226,125,88,61,83,238,2,0        ; vpbroadcastd  0x2ee53(%rip),%ymm7        # 32f2c <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  DB  197,205,219,247                     ; vpand         %ymm7,%ymm6,%ymm6
+  DB  197,252,91,246                      ; vcvtdq2ps     %ymm6,%ymm6
+  DB  196,226,125,24,61,70,238,2,0        ; vbroadcastss  0x2ee46(%rip),%ymm7        # 32f30 <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  DB  197,204,89,247                      ; vmulps        %ymm7,%ymm6,%ymm6
+  DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  196,226,125,24,61,167,237,2,0       ; vbroadcastss  0x2eda7(%rip),%ymm7        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  255,224                             ; jmpq          *%rax
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
+  DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,134                             ; ja            408f <_sk_load_565_dst_hsw+0x1b>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,97,0,0,0                  ; lea           0x61(%rip),%r9        # 4174 <_sk_load_565_dst_hsw+0x100>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
+  DB  255,224                             ; jmpq          *%rax
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
+  DB  197,249,110,224                     ; vmovd         %eax,%xmm4
+  DB  233,101,255,255,255                 ; jmpq          408f <_sk_load_565_dst_hsw+0x1b>
+  DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
+  DB  196,193,89,196,100,80,4,2           ; vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm4,%xmm4
+  DB  196,193,121,110,44,80               ; vmovd         (%r8,%rdx,2),%xmm5
+  DB  196,227,89,2,229,1                  ; vpblendd      $0x1,%xmm5,%xmm4,%xmm4
+  DB  233,72,255,255,255                  ; jmpq          408f <_sk_load_565_dst_hsw+0x1b>
+  DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
+  DB  196,193,89,196,100,80,12,6          ; vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm4,%xmm4
+  DB  196,193,89,196,100,80,10,5          ; vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm4,%xmm4
+  DB  196,193,89,196,100,80,8,4           ; vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm4,%xmm4
+  DB  196,193,122,126,44,80               ; vmovq         (%r8,%rdx,2),%xmm5
+  DB  196,227,81,2,228,12                 ; vpblendd      $0xc,%xmm4,%xmm5,%xmm4
+  DB  233,27,255,255,255                  ; jmpq          408f <_sk_load_565_dst_hsw+0x1b>
+  DB  168,255                             ; test          $0xff,%al
+  DB  255                                 ; (bad)
+  DB  255,194                             ; inc           %edx
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,182,255,255,255,239             ; pushq         -0x10000001(%rsi)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,231                             ; jmpq          *%rdi
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  223,255                             ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,211                             ; callq         *%rbx
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255                                 ; .byte         0xff
+
 PUBLIC _sk_gather_565_hsw
 _sk_gather_565_hsw LABEL PROC
   DB  65,87                               ; push          %r15
@@ -3985,23 +3964,23 @@
   DB  65,15,183,4,88                      ; movzwl        (%r8,%rbx,2),%eax
   DB  197,249,196,192,7                   ; vpinsrw       $0x7,%eax,%xmm0,%xmm0
   DB  196,226,125,51,208                  ; vpmovzxwd     %xmm0,%ymm2
-  DB  196,226,125,88,5,24,242,2,0         ; vpbroadcastd  0x2f218(%rip),%ymm0        # 33548 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  DB  196,226,125,88,5,164,236,2,0        ; vpbroadcastd  0x2eca4(%rip),%ymm0        # 32f1c <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
   DB  197,237,219,192                     ; vpand         %ymm0,%ymm2,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,11,242,2,0        ; vbroadcastss  0x2f20b(%rip),%ymm1        # 3354c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  DB  196,226,125,24,13,151,236,2,0       ; vbroadcastss  0x2ec97(%rip),%ymm1        # 32f20 <_sk_srcover_bgra_8888_sse2_lowp+0x330>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
-  DB  196,226,125,88,13,2,242,2,0         ; vpbroadcastd  0x2f202(%rip),%ymm1        # 33550 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  DB  196,226,125,88,13,142,236,2,0       ; vpbroadcastd  0x2ec8e(%rip),%ymm1        # 32f24 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
   DB  197,237,219,201                     ; vpand         %ymm1,%ymm2,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
-  DB  196,226,125,24,29,245,241,2,0       ; vbroadcastss  0x2f1f5(%rip),%ymm3        # 33554 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  DB  196,226,125,24,29,129,236,2,0       ; vbroadcastss  0x2ec81(%rip),%ymm3        # 32f28 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
   DB  197,244,89,203                      ; vmulps        %ymm3,%ymm1,%ymm1
-  DB  196,226,125,88,29,236,241,2,0       ; vpbroadcastd  0x2f1ec(%rip),%ymm3        # 33558 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  DB  196,226,125,88,29,120,236,2,0       ; vpbroadcastd  0x2ec78(%rip),%ymm3        # 32f2c <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
   DB  197,237,219,211                     ; vpand         %ymm3,%ymm2,%ymm2
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
-  DB  196,226,125,24,29,223,241,2,0       ; vbroadcastss  0x2f1df(%rip),%ymm3        # 3355c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  DB  196,226,125,24,29,107,236,2,0       ; vbroadcastss  0x2ec6b(%rip),%ymm3        # 32f30 <_sk_srcover_bgra_8888_sse2_lowp+0x340>
   DB  197,236,89,211                      ; vmulps        %ymm3,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,64,241,2,0        ; vbroadcastss  0x2f140(%rip),%ymm3        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,29,204,235,2,0       ; vbroadcastss  0x2ebcc(%rip),%ymm3        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  91                                  ; pop           %rbx
   DB  65,92                               ; pop           %r12
   DB  65,94                               ; pop           %r14
@@ -4011,23 +3990,21 @@
 PUBLIC _sk_store_565_hsw
 _sk_store_565_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,60,95,200                       ; vmaxps        %ymm0,%ymm8,%ymm9
-  DB  196,98,125,24,21,15,241,2,0         ; vbroadcastss  0x2f10f(%rip),%ymm10        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,21,161,235,2,0        ; vbroadcastss  0x2eba1(%rip),%ymm10        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,65,52,93,202                    ; vminps        %ymm10,%ymm9,%ymm9
-  DB  196,98,125,24,29,241,241,2,0        ; vbroadcastss  0x2f1f1(%rip),%ymm11        # 335bc <_sk_srcover_bgra_8888_sse2_lowp+0x3a0>
+  DB  196,98,125,24,29,131,236,2,0        ; vbroadcastss  0x2ec83(%rip),%ymm11        # 32f90 <_sk_srcover_bgra_8888_sse2_lowp+0x3a0>
   DB  196,65,52,89,203                    ; vmulps        %ymm11,%ymm9,%ymm9
   DB  196,65,125,91,201                   ; vcvtps2dq     %ymm9,%ymm9
   DB  196,193,53,114,241,11               ; vpslld        $0xb,%ymm9,%ymm9
   DB  197,60,95,225                       ; vmaxps        %ymm1,%ymm8,%ymm12
   DB  196,65,28,93,226                    ; vminps        %ymm10,%ymm12,%ymm12
-  DB  196,98,125,24,45,211,241,2,0        ; vbroadcastss  0x2f1d3(%rip),%ymm13        # 335c0 <_sk_srcover_bgra_8888_sse2_lowp+0x3a4>
+  DB  196,98,125,24,45,101,236,2,0        ; vbroadcastss  0x2ec65(%rip),%ymm13        # 32f94 <_sk_srcover_bgra_8888_sse2_lowp+0x3a4>
   DB  196,65,28,89,229                    ; vmulps        %ymm13,%ymm12,%ymm12
   DB  196,65,125,91,228                   ; vcvtps2dq     %ymm12,%ymm12
   DB  196,193,29,114,244,5                ; vpslld        $0x5,%ymm12,%ymm12
@@ -4040,135 +4017,126 @@
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,66,57,43,193                    ; vpackusdw     %xmm9,%xmm8,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           4434 <_sk_store_565_hsw+0x9f>
-  DB  196,1,122,127,4,88                  ; vmovdqu       %xmm8,(%r8,%r11,2)
+  DB  117,10                              ; jne           4376 <_sk_store_565_hsw+0x99>
+  DB  196,65,122,127,4,80                 ; vmovdqu       %xmm8,(%r8,%rdx,2)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,236                             ; ja            4430 <_sk_store_565_hsw+0x9b>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,69,0,0,0                  ; lea           0x45(%rip),%r10        # 4494 <_sk_store_565_hsw+0xff>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,242                             ; ja            4372 <_sk_store_565_hsw+0x95>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,66,0,0,0                  ; lea           0x42(%rip),%r9        # 43cc <_sk_store_565_hsw+0xef>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,3,121,21,4,88,0                 ; vpextrw       $0x0,%xmm8,(%r8,%r11,2)
-  DB  235,207                             ; jmp           4430 <_sk_store_565_hsw+0x9b>
-  DB  196,3,121,21,68,88,4,2              ; vpextrw       $0x2,%xmm8,0x4(%r8,%r11,2)
-  DB  196,1,121,126,4,88                  ; vmovd         %xmm8,(%r8,%r11,2)
-  DB  235,191                             ; jmp           4430 <_sk_store_565_hsw+0x9b>
-  DB  196,3,121,21,68,88,12,6             ; vpextrw       $0x6,%xmm8,0xc(%r8,%r11,2)
-  DB  196,3,121,21,68,88,10,5             ; vpextrw       $0x5,%xmm8,0xa(%r8,%r11,2)
-  DB  196,3,121,21,68,88,8,4              ; vpextrw       $0x4,%xmm8,0x8(%r8,%r11,2)
-  DB  196,1,121,214,4,88                  ; vmovq         %xmm8,(%r8,%r11,2)
-  DB  235,159                             ; jmp           4430 <_sk_store_565_hsw+0x9b>
-  DB  15,31,0                             ; nopl          (%rax)
-  DB  196                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,213                             ; callq         *%rbp
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,205                             ; dec           %ebp
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,245                             ; push          %rbp
+  DB  196,67,121,21,4,80,0                ; vpextrw       $0x0,%xmm8,(%r8,%rdx,2)
+  DB  235,214                             ; jmp           4372 <_sk_store_565_hsw+0x95>
+  DB  196,67,121,21,68,80,4,2             ; vpextrw       $0x2,%xmm8,0x4(%r8,%rdx,2)
+  DB  196,65,121,126,4,80                 ; vmovd         %xmm8,(%r8,%rdx,2)
+  DB  235,198                             ; jmp           4372 <_sk_store_565_hsw+0x95>
+  DB  196,67,121,21,68,80,12,6            ; vpextrw       $0x6,%xmm8,0xc(%r8,%rdx,2)
+  DB  196,67,121,21,68,80,10,5            ; vpextrw       $0x5,%xmm8,0xa(%r8,%rdx,2)
+  DB  196,67,121,21,68,80,8,4             ; vpextrw       $0x4,%xmm8,0x8(%r8,%rdx,2)
+  DB  196,65,121,214,4,80                 ; vmovq         %xmm8,(%r8,%rdx,2)
+  DB  235,166                             ; jmp           4372 <_sk_store_565_hsw+0x95>
+  DB  199                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  237                                 ; in            (%dx),%eax
+  DB  216,255                             ; fdivr         %st(7),%st
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,229                             ; jmpq          *%rbp
+  DB  255,208                             ; callq         *%rax
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  221,255                             ; (bad)
+  DB  248                                 ; clc
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,240                             ; push          %rax
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  232,255,255,255,224                 ; callq         ffffffffe10043e4 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffe0fd17f4>
+  DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
 
 PUBLIC _sk_load_4444_hsw
 _sk_load_4444_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,138,0,0,0                    ; jne           4559 <_sk_load_4444_hsw+0xa9>
-  DB  196,129,122,111,4,88                ; vmovdqu       (%r8,%r11,2),%xmm0
+  DB  15,133,138,0,0,0                    ; jne           448b <_sk_load_4444_hsw+0xa3>
+  DB  196,193,122,111,4,80                ; vmovdqu       (%r8,%rdx,2),%xmm0
   DB  196,226,125,51,216                  ; vpmovzxwd     %xmm0,%ymm3
-  DB  196,226,125,88,5,225,240,2,0        ; vpbroadcastd  0x2f0e1(%rip),%ymm0        # 335c4 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
+  DB  196,226,125,88,5,131,235,2,0        ; vpbroadcastd  0x2eb83(%rip),%ymm0        # 32f98 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
   DB  197,229,219,192                     ; vpand         %ymm0,%ymm3,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,212,240,2,0       ; vbroadcastss  0x2f0d4(%rip),%ymm1        # 335c8 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
+  DB  196,226,125,24,13,118,235,2,0       ; vbroadcastss  0x2eb76(%rip),%ymm1        # 32f9c <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
-  DB  196,226,125,88,13,203,240,2,0       ; vpbroadcastd  0x2f0cb(%rip),%ymm1        # 335cc <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
+  DB  196,226,125,88,13,109,235,2,0       ; vpbroadcastd  0x2eb6d(%rip),%ymm1        # 32fa0 <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
   DB  197,229,219,201                     ; vpand         %ymm1,%ymm3,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
-  DB  196,226,125,24,21,190,240,2,0       ; vbroadcastss  0x2f0be(%rip),%ymm2        # 335d0 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
+  DB  196,226,125,24,21,96,235,2,0        ; vbroadcastss  0x2eb60(%rip),%ymm2        # 32fa4 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
   DB  197,244,89,202                      ; vmulps        %ymm2,%ymm1,%ymm1
-  DB  196,226,125,88,21,181,240,2,0       ; vpbroadcastd  0x2f0b5(%rip),%ymm2        # 335d4 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
+  DB  196,226,125,88,21,87,235,2,0        ; vpbroadcastd  0x2eb57(%rip),%ymm2        # 32fa8 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
   DB  197,229,219,210                     ; vpand         %ymm2,%ymm3,%ymm2
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
-  DB  196,98,125,24,5,168,240,2,0         ; vbroadcastss  0x2f0a8(%rip),%ymm8        # 335d8 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
+  DB  196,98,125,24,5,74,235,2,0          ; vbroadcastss  0x2eb4a(%rip),%ymm8        # 32fac <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
   DB  196,193,108,89,208                  ; vmulps        %ymm8,%ymm2,%ymm2
-  DB  196,98,125,88,5,158,240,2,0         ; vpbroadcastd  0x2f09e(%rip),%ymm8        # 335dc <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
+  DB  196,98,125,88,5,64,235,2,0          ; vpbroadcastd  0x2eb40(%rip),%ymm8        # 32fb0 <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
   DB  196,193,101,219,216                 ; vpand         %ymm8,%ymm3,%ymm3
   DB  197,252,91,219                      ; vcvtdq2ps     %ymm3,%ymm3
-  DB  196,98,125,24,5,144,240,2,0         ; vbroadcastss  0x2f090(%rip),%ymm8        # 335e0 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
+  DB  196,98,125,24,5,50,235,2,0          ; vbroadcastss  0x2eb32(%rip),%ymm8        # 32fb4 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
   DB  196,193,100,89,216                  ; vmulps        %ymm8,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,100,255,255,255              ; ja            44d5 <_sk_load_4444_hsw+0x25>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,100,0,0,0                 ; lea           0x64(%rip),%r10        # 45e0 <_sk_load_4444_hsw+0x130>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  15,135,106,255,255,255              ; ja            4407 <_sk_load_4444_hsw+0x1f>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,97,0,0,0                  ; lea           0x61(%rip),%r9        # 4508 <_sk_load_4444_hsw+0x120>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  67,15,183,4,88                      ; movzwl        (%r8,%r11,2),%eax
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  197,249,110,192                     ; vmovd         %eax,%xmm0
-  DB  233,66,255,255,255                  ; jmpq          44d5 <_sk_load_4444_hsw+0x25>
+  DB  233,73,255,255,255                  ; jmpq          4407 <_sk_load_4444_hsw+0x1f>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
-  DB  196,129,121,196,68,88,4,2           ; vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
-  DB  196,129,121,110,12,88               ; vmovd         (%r8,%r11,2),%xmm1
+  DB  196,193,121,196,68,80,4,2           ; vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm0,%xmm0
+  DB  196,193,121,110,12,80               ; vmovd         (%r8,%rdx,2),%xmm1
   DB  196,227,121,2,193,1                 ; vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  DB  233,37,255,255,255                  ; jmpq          44d5 <_sk_load_4444_hsw+0x25>
+  DB  233,44,255,255,255                  ; jmpq          4407 <_sk_load_4444_hsw+0x1f>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
-  DB  196,129,121,196,68,88,12,6          ; vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
-  DB  196,129,121,196,68,88,10,5          ; vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
-  DB  196,129,121,196,68,88,8,4           ; vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
-  DB  196,129,122,126,12,88               ; vmovq         (%r8,%r11,2),%xmm1
+  DB  196,193,121,196,68,80,12,6          ; vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm0,%xmm0
+  DB  196,193,121,196,68,80,10,5          ; vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm0,%xmm0
+  DB  196,193,121,196,68,80,8,4           ; vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm0,%xmm0
+  DB  196,193,122,126,12,80               ; vmovq         (%r8,%rdx,2),%xmm1
   DB  196,227,113,2,192,12                ; vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  DB  233,248,254,255,255                 ; jmpq          44d5 <_sk_load_4444_hsw+0x25>
-  DB  15,31,0                             ; nopl          (%rax)
-  DB  165                                 ; movsl         %ds:(%rsi),%es:(%rdi)
+  DB  233,255,254,255,255                 ; jmpq          4407 <_sk_load_4444_hsw+0x1f>
+  DB  168,255                             ; test          $0xff,%al
+  DB  255                                 ; (bad)
+  DB  255,194                             ; inc           %edx
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,182,255,255,255,239             ; pushq         -0x10000001(%rsi)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,231                             ; jmpq          *%rdi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  191,255,255,255,179                 ; mov           $0xb3ffffff,%edi
+  DB  223,255                             ; (bad)
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  236                                 ; in            (%dx),%al
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,228                             ; jmpq          *%rsp
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  220,255                             ; fdivr         %st,%st(7)
-  DB  255                                 ; (bad)
-  DB  255,208                             ; callq         *%rax
+  DB  255,211                             ; callq         *%rbx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -4176,83 +4144,77 @@
 PUBLIC _sk_load_4444_dst_hsw
 _sk_load_4444_dst_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,138,0,0,0                    ; jne           46a5 <_sk_load_4444_dst_hsw+0xa9>
-  DB  196,129,122,111,36,88               ; vmovdqu       (%r8,%r11,2),%xmm4
+  DB  15,133,138,0,0,0                    ; jne           45c7 <_sk_load_4444_dst_hsw+0xa3>
+  DB  196,193,122,111,36,80               ; vmovdqu       (%r8,%rdx,2),%xmm4
   DB  196,226,125,51,252                  ; vpmovzxwd     %xmm4,%ymm7
-  DB  196,226,125,88,37,149,239,2,0       ; vpbroadcastd  0x2ef95(%rip),%ymm4        # 335c4 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
+  DB  196,226,125,88,37,71,234,2,0        ; vpbroadcastd  0x2ea47(%rip),%ymm4        # 32f98 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
   DB  197,197,219,228                     ; vpand         %ymm4,%ymm7,%ymm4
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,226,125,24,45,136,239,2,0       ; vbroadcastss  0x2ef88(%rip),%ymm5        # 335c8 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
+  DB  196,226,125,24,45,58,234,2,0        ; vbroadcastss  0x2ea3a(%rip),%ymm5        # 32f9c <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
   DB  197,220,89,229                      ; vmulps        %ymm5,%ymm4,%ymm4
-  DB  196,226,125,88,45,127,239,2,0       ; vpbroadcastd  0x2ef7f(%rip),%ymm5        # 335cc <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
+  DB  196,226,125,88,45,49,234,2,0        ; vpbroadcastd  0x2ea31(%rip),%ymm5        # 32fa0 <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
   DB  197,197,219,237                     ; vpand         %ymm5,%ymm7,%ymm5
   DB  197,252,91,237                      ; vcvtdq2ps     %ymm5,%ymm5
-  DB  196,226,125,24,53,114,239,2,0       ; vbroadcastss  0x2ef72(%rip),%ymm6        # 335d0 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
+  DB  196,226,125,24,53,36,234,2,0        ; vbroadcastss  0x2ea24(%rip),%ymm6        # 32fa4 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
   DB  197,212,89,238                      ; vmulps        %ymm6,%ymm5,%ymm5
-  DB  196,226,125,88,53,105,239,2,0       ; vpbroadcastd  0x2ef69(%rip),%ymm6        # 335d4 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
+  DB  196,226,125,88,53,27,234,2,0        ; vpbroadcastd  0x2ea1b(%rip),%ymm6        # 32fa8 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
   DB  197,197,219,246                     ; vpand         %ymm6,%ymm7,%ymm6
   DB  197,252,91,246                      ; vcvtdq2ps     %ymm6,%ymm6
-  DB  196,98,125,24,5,92,239,2,0          ; vbroadcastss  0x2ef5c(%rip),%ymm8        # 335d8 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
+  DB  196,98,125,24,5,14,234,2,0          ; vbroadcastss  0x2ea0e(%rip),%ymm8        # 32fac <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
   DB  196,193,76,89,240                   ; vmulps        %ymm8,%ymm6,%ymm6
-  DB  196,98,125,88,5,82,239,2,0          ; vpbroadcastd  0x2ef52(%rip),%ymm8        # 335dc <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
+  DB  196,98,125,88,5,4,234,2,0           ; vpbroadcastd  0x2ea04(%rip),%ymm8        # 32fb0 <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
   DB  196,193,69,219,248                  ; vpand         %ymm8,%ymm7,%ymm7
   DB  197,252,91,255                      ; vcvtdq2ps     %ymm7,%ymm7
-  DB  196,98,125,24,5,68,239,2,0          ; vbroadcastss  0x2ef44(%rip),%ymm8        # 335e0 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
+  DB  196,98,125,24,5,246,233,2,0         ; vbroadcastss  0x2e9f6(%rip),%ymm8        # 32fb4 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
   DB  196,193,68,89,248                   ; vmulps        %ymm8,%ymm7,%ymm7
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,100,255,255,255              ; ja            4621 <_sk_load_4444_dst_hsw+0x25>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,100,0,0,0                 ; lea           0x64(%rip),%r10        # 472c <_sk_load_4444_dst_hsw+0x130>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  15,135,106,255,255,255              ; ja            4543 <_sk_load_4444_dst_hsw+0x1f>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,97,0,0,0                  ; lea           0x61(%rip),%r9        # 4644 <_sk_load_4444_dst_hsw+0x120>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  67,15,183,4,88                      ; movzwl        (%r8,%r11,2),%eax
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  197,249,110,224                     ; vmovd         %eax,%xmm4
-  DB  233,66,255,255,255                  ; jmpq          4621 <_sk_load_4444_dst_hsw+0x25>
+  DB  233,73,255,255,255                  ; jmpq          4543 <_sk_load_4444_dst_hsw+0x1f>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
-  DB  196,129,89,196,100,88,4,2           ; vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
-  DB  196,129,121,110,44,88               ; vmovd         (%r8,%r11,2),%xmm5
+  DB  196,193,89,196,100,80,4,2           ; vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm4,%xmm4
+  DB  196,193,121,110,44,80               ; vmovd         (%r8,%rdx,2),%xmm5
   DB  196,227,89,2,229,1                  ; vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  DB  233,37,255,255,255                  ; jmpq          4621 <_sk_load_4444_dst_hsw+0x25>
+  DB  233,44,255,255,255                  ; jmpq          4543 <_sk_load_4444_dst_hsw+0x1f>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
-  DB  196,129,89,196,100,88,12,6          ; vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
-  DB  196,129,89,196,100,88,10,5          ; vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
-  DB  196,129,89,196,100,88,8,4           ; vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
-  DB  196,129,122,126,44,88               ; vmovq         (%r8,%r11,2),%xmm5
+  DB  196,193,89,196,100,80,12,6          ; vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm4,%xmm4
+  DB  196,193,89,196,100,80,10,5          ; vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm4,%xmm4
+  DB  196,193,89,196,100,80,8,4           ; vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm4,%xmm4
+  DB  196,193,122,126,44,80               ; vmovq         (%r8,%rdx,2),%xmm5
   DB  196,227,81,2,228,12                 ; vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  DB  233,248,254,255,255                 ; jmpq          4621 <_sk_load_4444_dst_hsw+0x25>
-  DB  15,31,0                             ; nopl          (%rax)
-  DB  165                                 ; movsl         %ds:(%rsi),%es:(%rdi)
+  DB  233,255,254,255,255                 ; jmpq          4543 <_sk_load_4444_dst_hsw+0x1f>
+  DB  168,255                             ; test          $0xff,%al
+  DB  255                                 ; (bad)
+  DB  255,194                             ; inc           %edx
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,182,255,255,255,239             ; pushq         -0x10000001(%rsi)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,231                             ; jmpq          *%rdi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  191,255,255,255,179                 ; mov           $0xb3ffffff,%edi
+  DB  223,255                             ; (bad)
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  236                                 ; in            (%dx),%al
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,228                             ; jmpq          *%rsp
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  220,255                             ; fdivr         %st,%st(7)
-  DB  255                                 ; (bad)
-  DB  255,208                             ; callq         *%rax
+  DB  255,211                             ; callq         *%rbx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -4310,25 +4272,25 @@
   DB  65,15,183,4,88                      ; movzwl        (%r8,%rbx,2),%eax
   DB  197,249,196,192,7                   ; vpinsrw       $0x7,%eax,%xmm0,%xmm0
   DB  196,226,125,51,216                  ; vpmovzxwd     %xmm0,%ymm3
-  DB  196,226,125,88,5,148,237,2,0        ; vpbroadcastd  0x2ed94(%rip),%ymm0        # 335c4 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
+  DB  196,226,125,88,5,80,232,2,0         ; vpbroadcastd  0x2e850(%rip),%ymm0        # 32f98 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
   DB  197,229,219,192                     ; vpand         %ymm0,%ymm3,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,135,237,2,0       ; vbroadcastss  0x2ed87(%rip),%ymm1        # 335c8 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
+  DB  196,226,125,24,13,67,232,2,0        ; vbroadcastss  0x2e843(%rip),%ymm1        # 32f9c <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
-  DB  196,226,125,88,13,126,237,2,0       ; vpbroadcastd  0x2ed7e(%rip),%ymm1        # 335cc <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
+  DB  196,226,125,88,13,58,232,2,0        ; vpbroadcastd  0x2e83a(%rip),%ymm1        # 32fa0 <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
   DB  197,229,219,201                     ; vpand         %ymm1,%ymm3,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
-  DB  196,226,125,24,21,113,237,2,0       ; vbroadcastss  0x2ed71(%rip),%ymm2        # 335d0 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
+  DB  196,226,125,24,21,45,232,2,0        ; vbroadcastss  0x2e82d(%rip),%ymm2        # 32fa4 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
   DB  197,244,89,202                      ; vmulps        %ymm2,%ymm1,%ymm1
-  DB  196,226,125,88,21,104,237,2,0       ; vpbroadcastd  0x2ed68(%rip),%ymm2        # 335d4 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
+  DB  196,226,125,88,21,36,232,2,0        ; vpbroadcastd  0x2e824(%rip),%ymm2        # 32fa8 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
   DB  197,229,219,210                     ; vpand         %ymm2,%ymm3,%ymm2
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
-  DB  196,98,125,24,5,91,237,2,0          ; vbroadcastss  0x2ed5b(%rip),%ymm8        # 335d8 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
+  DB  196,98,125,24,5,23,232,2,0          ; vbroadcastss  0x2e817(%rip),%ymm8        # 32fac <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
   DB  196,193,108,89,208                  ; vmulps        %ymm8,%ymm2,%ymm2
-  DB  196,98,125,88,5,81,237,2,0          ; vpbroadcastd  0x2ed51(%rip),%ymm8        # 335dc <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
+  DB  196,98,125,88,5,13,232,2,0          ; vpbroadcastd  0x2e80d(%rip),%ymm8        # 32fb0 <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
   DB  196,193,101,219,216                 ; vpand         %ymm8,%ymm3,%ymm3
   DB  197,252,91,219                      ; vcvtdq2ps     %ymm3,%ymm3
-  DB  196,98,125,24,5,67,237,2,0          ; vbroadcastss  0x2ed43(%rip),%ymm8        # 335e0 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
+  DB  196,98,125,24,5,255,231,2,0         ; vbroadcastss  0x2e7ff(%rip),%ymm8        # 32fb4 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
   DB  196,193,100,89,216                  ; vmulps        %ymm8,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  91                                  ; pop           %rbx
@@ -4340,17 +4302,15 @@
 PUBLIC _sk_store_4444_hsw
 _sk_store_4444_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,60,95,200                       ; vmaxps        %ymm0,%ymm8,%ymm9
-  DB  196,98,125,24,21,247,235,2,0        ; vbroadcastss  0x2ebf7(%rip),%ymm10        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,21,185,230,2,0        ; vbroadcastss  0x2e6b9(%rip),%ymm10        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,65,52,93,202                    ; vminps        %ymm10,%ymm9,%ymm9
-  DB  196,98,125,24,29,1,237,2,0          ; vbroadcastss  0x2ed01(%rip),%ymm11        # 335e4 <_sk_srcover_bgra_8888_sse2_lowp+0x3c8>
+  DB  196,98,125,24,29,195,231,2,0        ; vbroadcastss  0x2e7c3(%rip),%ymm11        # 32fb8 <_sk_srcover_bgra_8888_sse2_lowp+0x3c8>
   DB  196,65,52,89,203                    ; vmulps        %ymm11,%ymm9,%ymm9
   DB  196,65,125,91,201                   ; vcvtps2dq     %ymm9,%ymm9
   DB  196,193,53,114,241,12               ; vpslld        $0xc,%ymm9,%ymm9
@@ -4374,73 +4334,73 @@
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,66,57,43,193                    ; vpackusdw     %xmm9,%xmm8,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           4961 <_sk_store_4444_hsw+0xb4>
-  DB  196,1,122,127,4,88                  ; vmovdqu       %xmm8,(%r8,%r11,2)
+  DB  117,10                              ; jne           4873 <_sk_store_4444_hsw+0xae>
+  DB  196,65,122,127,4,80                 ; vmovdqu       %xmm8,(%r8,%rdx,2)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,236                             ; ja            495d <_sk_store_4444_hsw+0xb0>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,68,0,0,0                  ; lea           0x44(%rip),%r10        # 49c0 <_sk_store_4444_hsw+0x113>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,242                             ; ja            486f <_sk_store_4444_hsw+0xaa>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,69,0,0,0                  ; lea           0x45(%rip),%r9        # 48cc <_sk_store_4444_hsw+0x107>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,3,121,21,4,88,0                 ; vpextrw       $0x0,%xmm8,(%r8,%r11,2)
-  DB  235,207                             ; jmp           495d <_sk_store_4444_hsw+0xb0>
-  DB  196,3,121,21,68,88,4,2              ; vpextrw       $0x2,%xmm8,0x4(%r8,%r11,2)
-  DB  196,1,121,126,4,88                  ; vmovd         %xmm8,(%r8,%r11,2)
-  DB  235,191                             ; jmp           495d <_sk_store_4444_hsw+0xb0>
-  DB  196,3,121,21,68,88,12,6             ; vpextrw       $0x6,%xmm8,0xc(%r8,%r11,2)
-  DB  196,3,121,21,68,88,10,5             ; vpextrw       $0x5,%xmm8,0xa(%r8,%r11,2)
-  DB  196,3,121,21,68,88,8,4              ; vpextrw       $0x4,%xmm8,0x8(%r8,%r11,2)
-  DB  196,1,121,214,4,88                  ; vmovq         %xmm8,(%r8,%r11,2)
-  DB  235,159                             ; jmp           495d <_sk_store_4444_hsw+0xb0>
-  DB  102,144                             ; xchg          %ax,%ax
-  DB  197,255,255                         ; (bad)
-  DB  255,214                             ; callq         *%rsi
+  DB  196,67,121,21,4,80,0                ; vpextrw       $0x0,%xmm8,(%r8,%rdx,2)
+  DB  235,214                             ; jmp           486f <_sk_store_4444_hsw+0xaa>
+  DB  196,67,121,21,68,80,4,2             ; vpextrw       $0x2,%xmm8,0x4(%r8,%rdx,2)
+  DB  196,65,121,126,4,80                 ; vmovd         %xmm8,(%r8,%rdx,2)
+  DB  235,198                             ; jmp           486f <_sk_store_4444_hsw+0xaa>
+  DB  196,67,121,21,68,80,12,6            ; vpextrw       $0x6,%xmm8,0xc(%r8,%rdx,2)
+  DB  196,67,121,21,68,80,10,5            ; vpextrw       $0x5,%xmm8,0xa(%r8,%rdx,2)
+  DB  196,67,121,21,68,80,8,4             ; vpextrw       $0x4,%xmm8,0x8(%r8,%rdx,2)
+  DB  196,65,121,214,4,80                 ; vmovq         %xmm8,(%r8,%rdx,2)
+  DB  235,166                             ; jmp           486f <_sk_store_4444_hsw+0xaa>
+  DB  15,31,0                             ; nopl          (%rax)
+  DB  196                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,206                             ; dec           %esi
+  DB  255,213                             ; callq         *%rbp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,246                             ; push          %rsi
+  DB  255,205                             ; dec           %ebp
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,245                             ; push          %rbp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  238                                 ; out           %al,(%dx)
+  DB  237                                 ; in            (%dx),%eax
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,230                             ; jmpq          *%rsi
+  DB  255,229                             ; jmpq          *%rbp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  222,255                             ; fdivrp        %st,%st(7)
+  DB  221,255                             ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
 
 PUBLIC _sk_load_8888_hsw
 _sk_load_8888_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,86                              ; jne           4a4e <_sk_load_8888_hsw+0x72>
-  DB  196,129,126,111,28,152              ; vmovdqu       (%r8,%r11,4),%ymm3
-  DB  197,229,219,5,154,237,2,0           ; vpand         0x2ed9a(%rip),%ymm3,%ymm0        # 337a0 <_sk_srcover_bgra_8888_sse2_lowp+0x584>
+  DB  117,86                              ; jne           4954 <_sk_load_8888_hsw+0x6c>
+  DB  196,193,126,111,28,144              ; vmovdqu       (%r8,%rdx,4),%ymm3
+  DB  197,229,219,5,116,232,2,0           ; vpand         0x2e874(%rip),%ymm3,%ymm0        # 33180 <_sk_srcover_bgra_8888_sse2_lowp+0x590>
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,5,49,235,2,0          ; vbroadcastss  0x2eb31(%rip),%ymm8        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,98,125,24,5,255,229,2,0         ; vbroadcastss  0x2e5ff(%rip),%ymm8        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
-  DB  196,226,101,0,13,159,237,2,0        ; vpshufb       0x2ed9f(%rip),%ymm3,%ymm1        # 337c0 <_sk_srcover_bgra_8888_sse2_lowp+0x5a4>
+  DB  196,226,101,0,13,121,232,2,0        ; vpshufb       0x2e879(%rip),%ymm3,%ymm1        # 331a0 <_sk_srcover_bgra_8888_sse2_lowp+0x5b0>
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
   DB  196,193,116,89,200                  ; vmulps        %ymm8,%ymm1,%ymm1
-  DB  196,226,101,0,21,173,237,2,0        ; vpshufb       0x2edad(%rip),%ymm3,%ymm2        # 337e0 <_sk_srcover_bgra_8888_sse2_lowp+0x5c4>
+  DB  196,226,101,0,21,135,232,2,0        ; vpshufb       0x2e887(%rip),%ymm3,%ymm2        # 331c0 <_sk_srcover_bgra_8888_sse2_lowp+0x5d0>
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
   DB  196,193,108,89,208                  ; vmulps        %ymm8,%ymm2,%ymm2
   DB  197,229,114,211,24                  ; vpsrld        $0x18,%ymm3,%ymm3
@@ -4448,80 +4408,74 @@
   DB  196,193,100,89,216                  ; vmulps        %ymm8,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  197,229,239,219                     ; vpxor         %ymm3,%ymm3,%ymm3
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,156                             ; ja            49fe <_sk_load_8888_hsw+0x22>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,135,0,0,0                 ; lea           0x87(%rip),%r10        # 4af4 <_sk_load_8888_hsw+0x118>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,162                             ; ja            4904 <_sk_load_8888_hsw+0x1c>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,136,0,0,0                 ; lea           0x88(%rip),%r9        # 49f4 <_sk_load_8888_hsw+0x10c>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,129,121,110,28,152              ; vmovd         (%r8,%r11,4),%xmm3
-  DB  235,128                             ; jmp           49fe <_sk_load_8888_hsw+0x22>
-  DB  196,129,121,110,68,152,8            ; vmovd         0x8(%r8,%r11,4),%xmm0
+  DB  196,193,121,110,28,144              ; vmovd         (%r8,%rdx,4),%xmm3
+  DB  235,135                             ; jmp           4904 <_sk_load_8888_hsw+0x1c>
+  DB  196,193,121,110,68,144,8            ; vmovd         0x8(%r8,%rdx,4),%xmm0
   DB  196,226,121,89,192                  ; vpbroadcastq  %xmm0,%xmm0
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
   DB  196,227,117,2,216,4                 ; vpblendd      $0x4,%ymm0,%ymm1,%ymm3
-  DB  196,129,122,126,4,152               ; vmovq         (%r8,%r11,4),%xmm0
+  DB  196,193,122,126,4,144               ; vmovq         (%r8,%rdx,4),%xmm0
   DB  196,227,101,2,216,3                 ; vpblendd      $0x3,%ymm0,%ymm3,%ymm3
-  DB  233,89,255,255,255                  ; jmpq          49fe <_sk_load_8888_hsw+0x22>
-  DB  196,129,121,110,68,152,24           ; vmovd         0x18(%r8,%r11,4),%xmm0
+  DB  233,96,255,255,255                  ; jmpq          4904 <_sk_load_8888_hsw+0x1c>
+  DB  196,193,121,110,68,144,24           ; vmovd         0x18(%r8,%rdx,4),%xmm0
   DB  196,226,125,89,192                  ; vpbroadcastq  %xmm0,%ymm0
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
   DB  196,227,117,2,216,64                ; vpblendd      $0x40,%ymm0,%ymm1,%ymm3
   DB  196,227,125,57,216,1                ; vextracti128  $0x1,%ymm3,%xmm0
-  DB  196,131,121,34,68,152,20,1          ; vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm0,%xmm0
+  DB  196,195,121,34,68,144,20,1          ; vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm0,%xmm0
   DB  196,227,101,56,216,1                ; vinserti128   $0x1,%xmm0,%ymm3,%ymm3
   DB  196,227,125,57,216,1                ; vextracti128  $0x1,%ymm3,%xmm0
-  DB  196,131,121,34,68,152,16,0          ; vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm0,%xmm0
+  DB  196,195,121,34,68,144,16,0          ; vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm0,%xmm0
   DB  196,227,101,56,216,1                ; vinserti128   $0x1,%xmm0,%ymm3,%ymm3
-  DB  196,129,122,111,4,152               ; vmovdqu       (%r8,%r11,4),%xmm0
+  DB  196,193,122,111,4,144               ; vmovdqu       (%r8,%rdx,4),%xmm0
   DB  196,227,125,2,219,240               ; vpblendd      $0xf0,%ymm3,%ymm0,%ymm3
-  DB  233,10,255,255,255                  ; jmpq          49fe <_sk_load_8888_hsw+0x22>
-  DB  130                                 ; (bad)
+  DB  233,17,255,255,255                  ; jmpq          4904 <_sk_load_8888_hsw+0x1c>
+  DB  144                                 ; nop
+  DB  129,255,255,255,159,255             ; cmp           $0xff9fffff,%edi
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,160,255,255,255,138             ; jmpq          *-0x75000001(%rax)
+  DB  255,137,255,255,255,238             ; decl          -0x11000001(%rcx)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  239                                 ; out           %eax,(%dx)
+  DB  218,255                             ; (bad)
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  219,255                             ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,199                             ; inc           %edi
+  DB  255,198                             ; inc           %esi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
-  DB  177,255                             ; mov           $0xff,%cl
+  DB  176,255                             ; mov           $0xff,%al
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
 
 PUBLIC _sk_load_8888_dst_hsw
 _sk_load_8888_dst_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,86                              ; jne           4b82 <_sk_load_8888_dst_hsw+0x72>
-  DB  196,129,126,111,60,152              ; vmovdqu       (%r8,%r11,4),%ymm7
-  DB  197,197,219,37,198,236,2,0          ; vpand         0x2ecc6(%rip),%ymm7,%ymm4        # 33800 <_sk_srcover_bgra_8888_sse2_lowp+0x5e4>
+  DB  117,86                              ; jne           4a7c <_sk_load_8888_dst_hsw+0x6c>
+  DB  196,193,126,111,60,144              ; vmovdqu       (%r8,%rdx,4),%ymm7
+  DB  197,197,219,37,172,231,2,0          ; vpand         0x2e7ac(%rip),%ymm7,%ymm4        # 331e0 <_sk_srcover_bgra_8888_sse2_lowp+0x5f0>
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,98,125,24,5,253,233,2,0         ; vbroadcastss  0x2e9fd(%rip),%ymm8        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,98,125,24,5,215,228,2,0         ; vbroadcastss  0x2e4d7(%rip),%ymm8        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  196,193,92,89,224                   ; vmulps        %ymm8,%ymm4,%ymm4
-  DB  196,226,69,0,45,203,236,2,0         ; vpshufb       0x2eccb(%rip),%ymm7,%ymm5        # 33820 <_sk_srcover_bgra_8888_sse2_lowp+0x604>
+  DB  196,226,69,0,45,177,231,2,0         ; vpshufb       0x2e7b1(%rip),%ymm7,%ymm5        # 33200 <_sk_srcover_bgra_8888_sse2_lowp+0x610>
   DB  197,252,91,237                      ; vcvtdq2ps     %ymm5,%ymm5
   DB  196,193,84,89,232                   ; vmulps        %ymm8,%ymm5,%ymm5
-  DB  196,226,69,0,53,217,236,2,0         ; vpshufb       0x2ecd9(%rip),%ymm7,%ymm6        # 33840 <_sk_srcover_bgra_8888_sse2_lowp+0x624>
+  DB  196,226,69,0,53,191,231,2,0         ; vpshufb       0x2e7bf(%rip),%ymm7,%ymm6        # 33220 <_sk_srcover_bgra_8888_sse2_lowp+0x630>
   DB  197,252,91,246                      ; vcvtdq2ps     %ymm6,%ymm6
   DB  196,193,76,89,240                   ; vmulps        %ymm8,%ymm6,%ymm6
   DB  197,197,114,215,24                  ; vpsrld        $0x18,%ymm7,%ymm7
@@ -4529,57 +4483,53 @@
   DB  196,193,68,89,248                   ; vmulps        %ymm8,%ymm7,%ymm7
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  197,197,239,255                     ; vpxor         %ymm7,%ymm7,%ymm7
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,156                             ; ja            4b32 <_sk_load_8888_dst_hsw+0x22>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,135,0,0,0                 ; lea           0x87(%rip),%r10        # 4c28 <_sk_load_8888_dst_hsw+0x118>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,162                             ; ja            4a2c <_sk_load_8888_dst_hsw+0x1c>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,136,0,0,0                 ; lea           0x88(%rip),%r9        # 4b1c <_sk_load_8888_dst_hsw+0x10c>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,129,121,110,60,152              ; vmovd         (%r8,%r11,4),%xmm7
-  DB  235,128                             ; jmp           4b32 <_sk_load_8888_dst_hsw+0x22>
-  DB  196,129,121,110,100,152,8           ; vmovd         0x8(%r8,%r11,4),%xmm4
+  DB  196,193,121,110,60,144              ; vmovd         (%r8,%rdx,4),%xmm7
+  DB  235,135                             ; jmp           4a2c <_sk_load_8888_dst_hsw+0x1c>
+  DB  196,193,121,110,100,144,8           ; vmovd         0x8(%r8,%rdx,4),%xmm4
   DB  196,226,121,89,228                  ; vpbroadcastq  %xmm4,%xmm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
   DB  196,227,85,2,252,4                  ; vpblendd      $0x4,%ymm4,%ymm5,%ymm7
-  DB  196,129,122,126,36,152              ; vmovq         (%r8,%r11,4),%xmm4
+  DB  196,193,122,126,36,144              ; vmovq         (%r8,%rdx,4),%xmm4
   DB  196,227,69,2,252,3                  ; vpblendd      $0x3,%ymm4,%ymm7,%ymm7
-  DB  233,89,255,255,255                  ; jmpq          4b32 <_sk_load_8888_dst_hsw+0x22>
-  DB  196,129,121,110,100,152,24          ; vmovd         0x18(%r8,%r11,4),%xmm4
+  DB  233,96,255,255,255                  ; jmpq          4a2c <_sk_load_8888_dst_hsw+0x1c>
+  DB  196,193,121,110,100,144,24          ; vmovd         0x18(%r8,%rdx,4),%xmm4
   DB  196,226,125,89,228                  ; vpbroadcastq  %xmm4,%ymm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
   DB  196,227,85,2,252,64                 ; vpblendd      $0x40,%ymm4,%ymm5,%ymm7
   DB  196,227,125,57,252,1                ; vextracti128  $0x1,%ymm7,%xmm4
-  DB  196,131,89,34,100,152,20,1          ; vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm4,%xmm4
+  DB  196,195,89,34,100,144,20,1          ; vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm4,%xmm4
   DB  196,227,69,56,252,1                 ; vinserti128   $0x1,%xmm4,%ymm7,%ymm7
   DB  196,227,125,57,252,1                ; vextracti128  $0x1,%ymm7,%xmm4
-  DB  196,131,89,34,100,152,16,0          ; vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm4,%xmm4
+  DB  196,195,89,34,100,144,16,0          ; vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm4,%xmm4
   DB  196,227,69,56,252,1                 ; vinserti128   $0x1,%xmm4,%ymm7,%ymm7
-  DB  196,129,122,111,36,152              ; vmovdqu       (%r8,%r11,4),%xmm4
+  DB  196,193,122,111,36,144              ; vmovdqu       (%r8,%rdx,4),%xmm4
   DB  196,227,93,2,255,240                ; vpblendd      $0xf0,%ymm7,%ymm4,%ymm7
-  DB  233,10,255,255,255                  ; jmpq          4b32 <_sk_load_8888_dst_hsw+0x22>
-  DB  130                                 ; (bad)
+  DB  233,17,255,255,255                  ; jmpq          4a2c <_sk_load_8888_dst_hsw+0x1c>
+  DB  144                                 ; nop
+  DB  129,255,255,255,159,255             ; cmp           $0xff9fffff,%edi
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,160,255,255,255,138             ; jmpq          *-0x75000001(%rax)
+  DB  255,137,255,255,255,238             ; decl          -0x11000001(%rcx)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  239                                 ; out           %eax,(%dx)
+  DB  218,255                             ; (bad)
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  219,255                             ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,199                             ; inc           %edi
+  DB  255,198                             ; inc           %esi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
-  DB  177,255                             ; mov           $0xff,%cl
+  DB  176,255                             ; mov           $0xff,%al
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
 
@@ -4603,14 +4553,14 @@
   DB  197,254,91,192                      ; vcvttps2dq    %ymm0,%ymm0
   DB  197,245,254,192                     ; vpaddd        %ymm0,%ymm1,%ymm0
   DB  196,66,101,144,4,128                ; vpgatherdd    %ymm3,(%r8,%ymm0,4),%ymm8
-  DB  197,189,219,5,197,235,2,0           ; vpand         0x2ebc5(%rip),%ymm8,%ymm0        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0x644>
+  DB  197,189,219,5,177,230,2,0           ; vpand         0x2e6b1(%rip),%ymm8,%ymm0        # 33240 <_sk_srcover_bgra_8888_sse2_lowp+0x650>
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,29,156,232,2,0       ; vbroadcastss  0x2e89c(%rip),%ymm3        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,226,125,24,29,124,227,2,0       ; vbroadcastss  0x2e37c(%rip),%ymm3        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  197,252,89,195                      ; vmulps        %ymm3,%ymm0,%ymm0
-  DB  196,226,61,0,13,203,235,2,0         ; vpshufb       0x2ebcb(%rip),%ymm8,%ymm1        # 33880 <_sk_srcover_bgra_8888_sse2_lowp+0x664>
+  DB  196,226,61,0,13,183,230,2,0         ; vpshufb       0x2e6b7(%rip),%ymm8,%ymm1        # 33260 <_sk_srcover_bgra_8888_sse2_lowp+0x670>
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
   DB  197,244,89,203                      ; vmulps        %ymm3,%ymm1,%ymm1
-  DB  196,226,61,0,21,218,235,2,0         ; vpshufb       0x2ebda(%rip),%ymm8,%ymm2        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0x684>
+  DB  196,226,61,0,21,198,230,2,0         ; vpshufb       0x2e6c6(%rip),%ymm8,%ymm2        # 33280 <_sk_srcover_bgra_8888_sse2_lowp+0x690>
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
   DB  197,236,89,211                      ; vmulps        %ymm3,%ymm2,%ymm2
   DB  196,193,61,114,208,24               ; vpsrld        $0x18,%ymm8,%ymm8
@@ -4622,17 +4572,15 @@
 PUBLIC _sk_store_8888_hsw
 _sk_store_8888_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,60,95,200                       ; vmaxps        %ymm0,%ymm8,%ymm9
-  DB  196,98,125,24,21,194,231,2,0        ; vbroadcastss  0x2e7c2(%rip),%ymm10        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,21,168,226,2,0        ; vbroadcastss  0x2e2a8(%rip),%ymm10        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,65,52,93,202                    ; vminps        %ymm10,%ymm9,%ymm9
-  DB  196,98,125,24,29,224,231,2,0        ; vbroadcastss  0x2e7e0(%rip),%ymm11        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  196,98,125,24,29,198,226,2,0        ; vbroadcastss  0x2e2c6(%rip),%ymm11        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   DB  196,65,52,89,203                    ; vmulps        %ymm11,%ymm9,%ymm9
   DB  196,65,125,91,201                   ; vcvtps2dq     %ymm9,%ymm9
   DB  197,60,95,225                       ; vmaxps        %ymm1,%ymm8,%ymm12
@@ -4654,49 +4602,51 @@
   DB  196,65,29,235,192                   ; vpor          %ymm8,%ymm12,%ymm8
   DB  196,65,53,235,192                   ; vpor          %ymm8,%ymm9,%ymm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           4d8b <_sk_store_8888_hsw+0xaa>
-  DB  196,1,126,127,4,152                 ; vmovdqu       %ymm8,(%r8,%r11,4)
+  DB  117,10                              ; jne           4c79 <_sk_store_8888_hsw+0xa4>
+  DB  196,65,126,127,4,144                ; vmovdqu       %ymm8,(%r8,%rdx,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,236                             ; ja            4d87 <_sk_store_8888_hsw+0xa6>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,82,0,0,0                  ; lea           0x52(%rip),%r10        # 4df8 <_sk_store_8888_hsw+0x117>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,242                             ; ja            4c75 <_sk_store_8888_hsw+0xa0>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,83,0,0,0                  ; lea           0x53(%rip),%r9        # 4ce0 <_sk_store_8888_hsw+0x10b>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,1,121,126,4,152                 ; vmovd         %xmm8,(%r8,%r11,4)
-  DB  235,208                             ; jmp           4d87 <_sk_store_8888_hsw+0xa6>
-  DB  196,3,121,22,68,152,8,2             ; vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
-  DB  196,1,121,214,4,152                 ; vmovq         %xmm8,(%r8,%r11,4)
-  DB  235,192                             ; jmp           4d87 <_sk_store_8888_hsw+0xa6>
+  DB  196,65,121,126,4,144                ; vmovd         %xmm8,(%r8,%rdx,4)
+  DB  235,215                             ; jmp           4c75 <_sk_store_8888_hsw+0xa0>
+  DB  196,67,121,22,68,144,8,2            ; vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
+  DB  196,65,121,214,4,144                ; vmovq         %xmm8,(%r8,%rdx,4)
+  DB  235,199                             ; jmp           4c75 <_sk_store_8888_hsw+0xa0>
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
-  DB  196,3,121,22,76,152,24,2            ; vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
+  DB  196,67,121,22,76,144,24,2           ; vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
-  DB  196,3,121,22,76,152,20,1            ; vpextrd       $0x1,%xmm9,0x14(%r8,%r11,4)
+  DB  196,67,121,22,76,144,20,1           ; vpextrd       $0x1,%xmm9,0x14(%r8,%rdx,4)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
-  DB  196,1,121,126,76,152,16             ; vmovd         %xmm9,0x10(%r8,%r11,4)
-  DB  196,1,122,127,4,152                 ; vmovdqu       %xmm8,(%r8,%r11,4)
-  DB  235,143                             ; jmp           4d87 <_sk_store_8888_hsw+0xa6>
-  DB  183,255                             ; mov           $0xff,%bh
+  DB  196,65,121,126,76,144,16            ; vmovd         %xmm9,0x10(%r8,%rdx,4)
+  DB  196,65,122,127,4,144                ; vmovdqu       %xmm8,(%r8,%rdx,4)
+  DB  235,150                             ; jmp           4c75 <_sk_store_8888_hsw+0xa0>
+  DB  144                                 ; nop
+  DB  182,255                             ; mov           $0xff,%dh
   DB  255                                 ; (bad)
-  DB  255,199                             ; inc           %edi
+  DB  255,198                             ; inc           %esi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  191,255,255,255,248                 ; mov           $0xf8ffffff,%edi
+  DB  190,255,255,255,247                 ; mov           $0xf7ffffff,%esi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  235,255                             ; jmp           4e09 <_sk_store_8888_hsw+0x128>
+  DB  234                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  221,255                             ; (bad)
   DB  255                                 ; (bad)
-  DB  255,207                             ; dec           %edi
+  DB  220,255                             ; fdivr         %st,%st(7)
+  DB  255                                 ; (bad)
+  DB  255,206                             ; dec           %esi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -4704,23 +4654,21 @@
 PUBLIC _sk_load_bgra_hsw
 _sk_load_bgra_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,86                              ; jne           4e86 <_sk_load_bgra_hsw+0x72>
-  DB  196,129,126,111,28,152              ; vmovdqu       (%r8,%r11,4),%ymm3
-  DB  197,229,219,5,130,234,2,0           ; vpand         0x2ea82(%rip),%ymm3,%ymm0        # 338c0 <_sk_srcover_bgra_8888_sse2_lowp+0x6a4>
+  DB  117,86                              ; jne           4d68 <_sk_load_bgra_hsw+0x6c>
+  DB  196,193,126,111,28,144              ; vmovdqu       (%r8,%rdx,4),%ymm3
+  DB  197,229,219,5,128,229,2,0           ; vpand         0x2e580(%rip),%ymm3,%ymm0        # 332a0 <_sk_srcover_bgra_8888_sse2_lowp+0x6b0>
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,5,249,230,2,0         ; vbroadcastss  0x2e6f9(%rip),%ymm8        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,98,125,24,5,235,225,2,0         ; vbroadcastss  0x2e1eb(%rip),%ymm8        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  196,193,124,89,208                  ; vmulps        %ymm8,%ymm0,%ymm2
-  DB  196,226,101,0,5,135,234,2,0         ; vpshufb       0x2ea87(%rip),%ymm3,%ymm0        # 338e0 <_sk_srcover_bgra_8888_sse2_lowp+0x6c4>
+  DB  196,226,101,0,5,133,229,2,0         ; vpshufb       0x2e585(%rip),%ymm3,%ymm0        # 332c0 <_sk_srcover_bgra_8888_sse2_lowp+0x6d0>
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
   DB  196,193,124,89,200                  ; vmulps        %ymm8,%ymm0,%ymm1
-  DB  196,226,101,0,5,149,234,2,0         ; vpshufb       0x2ea95(%rip),%ymm3,%ymm0        # 33900 <_sk_srcover_bgra_8888_sse2_lowp+0x6e4>
+  DB  196,226,101,0,5,147,229,2,0         ; vpshufb       0x2e593(%rip),%ymm3,%ymm0        # 332e0 <_sk_srcover_bgra_8888_sse2_lowp+0x6f0>
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
   DB  197,229,114,211,24                  ; vpsrld        $0x18,%ymm3,%ymm3
@@ -4728,80 +4676,74 @@
   DB  196,193,100,89,216                  ; vmulps        %ymm8,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  197,229,239,219                     ; vpxor         %ymm3,%ymm3,%ymm3
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,156                             ; ja            4e36 <_sk_load_bgra_hsw+0x22>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,135,0,0,0                 ; lea           0x87(%rip),%r10        # 4f2c <_sk_load_bgra_hsw+0x118>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,162                             ; ja            4d18 <_sk_load_bgra_hsw+0x1c>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,136,0,0,0                 ; lea           0x88(%rip),%r9        # 4e08 <_sk_load_bgra_hsw+0x10c>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,129,121,110,28,152              ; vmovd         (%r8,%r11,4),%xmm3
-  DB  235,128                             ; jmp           4e36 <_sk_load_bgra_hsw+0x22>
-  DB  196,129,121,110,68,152,8            ; vmovd         0x8(%r8,%r11,4),%xmm0
+  DB  196,193,121,110,28,144              ; vmovd         (%r8,%rdx,4),%xmm3
+  DB  235,135                             ; jmp           4d18 <_sk_load_bgra_hsw+0x1c>
+  DB  196,193,121,110,68,144,8            ; vmovd         0x8(%r8,%rdx,4),%xmm0
   DB  196,226,121,89,192                  ; vpbroadcastq  %xmm0,%xmm0
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
   DB  196,227,117,2,216,4                 ; vpblendd      $0x4,%ymm0,%ymm1,%ymm3
-  DB  196,129,122,126,4,152               ; vmovq         (%r8,%r11,4),%xmm0
+  DB  196,193,122,126,4,144               ; vmovq         (%r8,%rdx,4),%xmm0
   DB  196,227,101,2,216,3                 ; vpblendd      $0x3,%ymm0,%ymm3,%ymm3
-  DB  233,89,255,255,255                  ; jmpq          4e36 <_sk_load_bgra_hsw+0x22>
-  DB  196,129,121,110,68,152,24           ; vmovd         0x18(%r8,%r11,4),%xmm0
+  DB  233,96,255,255,255                  ; jmpq          4d18 <_sk_load_bgra_hsw+0x1c>
+  DB  196,193,121,110,68,144,24           ; vmovd         0x18(%r8,%rdx,4),%xmm0
   DB  196,226,125,89,192                  ; vpbroadcastq  %xmm0,%ymm0
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
   DB  196,227,117,2,216,64                ; vpblendd      $0x40,%ymm0,%ymm1,%ymm3
   DB  196,227,125,57,216,1                ; vextracti128  $0x1,%ymm3,%xmm0
-  DB  196,131,121,34,68,152,20,1          ; vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm0,%xmm0
+  DB  196,195,121,34,68,144,20,1          ; vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm0,%xmm0
   DB  196,227,101,56,216,1                ; vinserti128   $0x1,%xmm0,%ymm3,%ymm3
   DB  196,227,125,57,216,1                ; vextracti128  $0x1,%ymm3,%xmm0
-  DB  196,131,121,34,68,152,16,0          ; vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm0,%xmm0
+  DB  196,195,121,34,68,144,16,0          ; vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm0,%xmm0
   DB  196,227,101,56,216,1                ; vinserti128   $0x1,%xmm0,%ymm3,%ymm3
-  DB  196,129,122,111,4,152               ; vmovdqu       (%r8,%r11,4),%xmm0
+  DB  196,193,122,111,4,144               ; vmovdqu       (%r8,%rdx,4),%xmm0
   DB  196,227,125,2,219,240               ; vpblendd      $0xf0,%ymm3,%ymm0,%ymm3
-  DB  233,10,255,255,255                  ; jmpq          4e36 <_sk_load_bgra_hsw+0x22>
-  DB  130                                 ; (bad)
+  DB  233,17,255,255,255                  ; jmpq          4d18 <_sk_load_bgra_hsw+0x1c>
+  DB  144                                 ; nop
+  DB  129,255,255,255,159,255             ; cmp           $0xff9fffff,%edi
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,160,255,255,255,138             ; jmpq          *-0x75000001(%rax)
+  DB  255,137,255,255,255,238             ; decl          -0x11000001(%rcx)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  239                                 ; out           %eax,(%dx)
+  DB  218,255                             ; (bad)
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  219,255                             ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,199                             ; inc           %edi
+  DB  255,198                             ; inc           %esi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
-  DB  177,255                             ; mov           $0xff,%cl
+  DB  176,255                             ; mov           $0xff,%al
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
 
 PUBLIC _sk_load_bgra_dst_hsw
 _sk_load_bgra_dst_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,86                              ; jne           4fba <_sk_load_bgra_dst_hsw+0x72>
-  DB  196,129,126,111,60,152              ; vmovdqu       (%r8,%r11,4),%ymm7
-  DB  197,197,219,37,174,233,2,0          ; vpand         0x2e9ae(%rip),%ymm7,%ymm4        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0x704>
+  DB  117,86                              ; jne           4e90 <_sk_load_bgra_dst_hsw+0x6c>
+  DB  196,193,126,111,60,144              ; vmovdqu       (%r8,%rdx,4),%ymm7
+  DB  197,197,219,37,184,228,2,0          ; vpand         0x2e4b8(%rip),%ymm7,%ymm4        # 33300 <_sk_srcover_bgra_8888_sse2_lowp+0x710>
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,98,125,24,5,197,229,2,0         ; vbroadcastss  0x2e5c5(%rip),%ymm8        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,98,125,24,5,195,224,2,0         ; vbroadcastss  0x2e0c3(%rip),%ymm8        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  196,193,92,89,240                   ; vmulps        %ymm8,%ymm4,%ymm6
-  DB  196,226,69,0,37,179,233,2,0         ; vpshufb       0x2e9b3(%rip),%ymm7,%ymm4        # 33940 <_sk_srcover_bgra_8888_sse2_lowp+0x724>
+  DB  196,226,69,0,37,189,228,2,0         ; vpshufb       0x2e4bd(%rip),%ymm7,%ymm4        # 33320 <_sk_srcover_bgra_8888_sse2_lowp+0x730>
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
   DB  196,193,92,89,232                   ; vmulps        %ymm8,%ymm4,%ymm5
-  DB  196,226,69,0,37,193,233,2,0         ; vpshufb       0x2e9c1(%rip),%ymm7,%ymm4        # 33960 <_sk_srcover_bgra_8888_sse2_lowp+0x744>
+  DB  196,226,69,0,37,203,228,2,0         ; vpshufb       0x2e4cb(%rip),%ymm7,%ymm4        # 33340 <_sk_srcover_bgra_8888_sse2_lowp+0x750>
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
   DB  196,193,92,89,224                   ; vmulps        %ymm8,%ymm4,%ymm4
   DB  197,197,114,215,24                  ; vpsrld        $0x18,%ymm7,%ymm7
@@ -4809,57 +4751,53 @@
   DB  196,193,68,89,248                   ; vmulps        %ymm8,%ymm7,%ymm7
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  197,197,239,255                     ; vpxor         %ymm7,%ymm7,%ymm7
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,156                             ; ja            4f6a <_sk_load_bgra_dst_hsw+0x22>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,135,0,0,0                 ; lea           0x87(%rip),%r10        # 5060 <_sk_load_bgra_dst_hsw+0x118>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,162                             ; ja            4e40 <_sk_load_bgra_dst_hsw+0x1c>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,136,0,0,0                 ; lea           0x88(%rip),%r9        # 4f30 <_sk_load_bgra_dst_hsw+0x10c>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,129,121,110,60,152              ; vmovd         (%r8,%r11,4),%xmm7
-  DB  235,128                             ; jmp           4f6a <_sk_load_bgra_dst_hsw+0x22>
-  DB  196,129,121,110,100,152,8           ; vmovd         0x8(%r8,%r11,4),%xmm4
+  DB  196,193,121,110,60,144              ; vmovd         (%r8,%rdx,4),%xmm7
+  DB  235,135                             ; jmp           4e40 <_sk_load_bgra_dst_hsw+0x1c>
+  DB  196,193,121,110,100,144,8           ; vmovd         0x8(%r8,%rdx,4),%xmm4
   DB  196,226,121,89,228                  ; vpbroadcastq  %xmm4,%xmm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
   DB  196,227,85,2,252,4                  ; vpblendd      $0x4,%ymm4,%ymm5,%ymm7
-  DB  196,129,122,126,36,152              ; vmovq         (%r8,%r11,4),%xmm4
+  DB  196,193,122,126,36,144              ; vmovq         (%r8,%rdx,4),%xmm4
   DB  196,227,69,2,252,3                  ; vpblendd      $0x3,%ymm4,%ymm7,%ymm7
-  DB  233,89,255,255,255                  ; jmpq          4f6a <_sk_load_bgra_dst_hsw+0x22>
-  DB  196,129,121,110,100,152,24          ; vmovd         0x18(%r8,%r11,4),%xmm4
+  DB  233,96,255,255,255                  ; jmpq          4e40 <_sk_load_bgra_dst_hsw+0x1c>
+  DB  196,193,121,110,100,144,24          ; vmovd         0x18(%r8,%rdx,4),%xmm4
   DB  196,226,125,89,228                  ; vpbroadcastq  %xmm4,%ymm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
   DB  196,227,85,2,252,64                 ; vpblendd      $0x40,%ymm4,%ymm5,%ymm7
   DB  196,227,125,57,252,1                ; vextracti128  $0x1,%ymm7,%xmm4
-  DB  196,131,89,34,100,152,20,1          ; vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm4,%xmm4
+  DB  196,195,89,34,100,144,20,1          ; vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm4,%xmm4
   DB  196,227,69,56,252,1                 ; vinserti128   $0x1,%xmm4,%ymm7,%ymm7
   DB  196,227,125,57,252,1                ; vextracti128  $0x1,%ymm7,%xmm4
-  DB  196,131,89,34,100,152,16,0          ; vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm4,%xmm4
+  DB  196,195,89,34,100,144,16,0          ; vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm4,%xmm4
   DB  196,227,69,56,252,1                 ; vinserti128   $0x1,%xmm4,%ymm7,%ymm7
-  DB  196,129,122,111,36,152              ; vmovdqu       (%r8,%r11,4),%xmm4
+  DB  196,193,122,111,36,144              ; vmovdqu       (%r8,%rdx,4),%xmm4
   DB  196,227,93,2,255,240                ; vpblendd      $0xf0,%ymm7,%ymm4,%ymm7
-  DB  233,10,255,255,255                  ; jmpq          4f6a <_sk_load_bgra_dst_hsw+0x22>
-  DB  130                                 ; (bad)
+  DB  233,17,255,255,255                  ; jmpq          4e40 <_sk_load_bgra_dst_hsw+0x1c>
+  DB  144                                 ; nop
+  DB  129,255,255,255,159,255             ; cmp           $0xff9fffff,%edi
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,160,255,255,255,138             ; jmpq          *-0x75000001(%rax)
+  DB  255,137,255,255,255,238             ; decl          -0x11000001(%rcx)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  239                                 ; out           %eax,(%dx)
+  DB  218,255                             ; (bad)
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  219,255                             ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,199                             ; inc           %edi
+  DB  255,198                             ; inc           %esi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
-  DB  177,255                             ; mov           $0xff,%cl
+  DB  176,255                             ; mov           $0xff,%al
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
 
@@ -4883,14 +4821,14 @@
   DB  197,254,91,192                      ; vcvttps2dq    %ymm0,%ymm0
   DB  197,245,254,192                     ; vpaddd        %ymm0,%ymm1,%ymm0
   DB  196,66,101,144,4,128                ; vpgatherdd    %ymm3,(%r8,%ymm0,4),%ymm8
-  DB  197,189,219,5,173,232,2,0           ; vpand         0x2e8ad(%rip),%ymm8,%ymm0        # 33980 <_sk_srcover_bgra_8888_sse2_lowp+0x764>
+  DB  197,189,219,5,189,227,2,0           ; vpand         0x2e3bd(%rip),%ymm8,%ymm0        # 33360 <_sk_srcover_bgra_8888_sse2_lowp+0x770>
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,29,100,228,2,0       ; vbroadcastss  0x2e464(%rip),%ymm3        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,226,125,24,29,104,223,2,0       ; vbroadcastss  0x2df68(%rip),%ymm3        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  197,252,89,211                      ; vmulps        %ymm3,%ymm0,%ymm2
-  DB  196,226,61,0,5,179,232,2,0          ; vpshufb       0x2e8b3(%rip),%ymm8,%ymm0        # 339a0 <_sk_srcover_bgra_8888_sse2_lowp+0x784>
+  DB  196,226,61,0,5,195,227,2,0          ; vpshufb       0x2e3c3(%rip),%ymm8,%ymm0        # 33380 <_sk_srcover_bgra_8888_sse2_lowp+0x790>
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
   DB  197,252,89,203                      ; vmulps        %ymm3,%ymm0,%ymm1
-  DB  196,226,61,0,5,194,232,2,0          ; vpshufb       0x2e8c2(%rip),%ymm8,%ymm0        # 339c0 <_sk_srcover_bgra_8888_sse2_lowp+0x7a4>
+  DB  196,226,61,0,5,210,227,2,0          ; vpshufb       0x2e3d2(%rip),%ymm8,%ymm0        # 333a0 <_sk_srcover_bgra_8888_sse2_lowp+0x7b0>
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
   DB  197,252,89,195                      ; vmulps        %ymm3,%ymm0,%ymm0
   DB  196,193,61,114,208,24               ; vpsrld        $0x18,%ymm8,%ymm8
@@ -4902,17 +4840,15 @@
 PUBLIC _sk_store_bgra_hsw
 _sk_store_bgra_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,60,95,202                       ; vmaxps        %ymm2,%ymm8,%ymm9
-  DB  196,98,125,24,21,138,227,2,0        ; vbroadcastss  0x2e38a(%rip),%ymm10        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,21,148,222,2,0        ; vbroadcastss  0x2de94(%rip),%ymm10        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,65,52,93,202                    ; vminps        %ymm10,%ymm9,%ymm9
-  DB  196,98,125,24,29,168,227,2,0        ; vbroadcastss  0x2e3a8(%rip),%ymm11        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  196,98,125,24,29,178,222,2,0        ; vbroadcastss  0x2deb2(%rip),%ymm11        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   DB  196,65,52,89,203                    ; vmulps        %ymm11,%ymm9,%ymm9
   DB  196,65,125,91,201                   ; vcvtps2dq     %ymm9,%ymm9
   DB  197,60,95,225                       ; vmaxps        %ymm1,%ymm8,%ymm12
@@ -4934,49 +4870,51 @@
   DB  196,65,29,235,192                   ; vpor          %ymm8,%ymm12,%ymm8
   DB  196,65,53,235,192                   ; vpor          %ymm8,%ymm9,%ymm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           51c3 <_sk_store_bgra_hsw+0xaa>
-  DB  196,1,126,127,4,152                 ; vmovdqu       %ymm8,(%r8,%r11,4)
+  DB  117,10                              ; jne           508d <_sk_store_bgra_hsw+0xa4>
+  DB  196,65,126,127,4,144                ; vmovdqu       %ymm8,(%r8,%rdx,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,236                             ; ja            51bf <_sk_store_bgra_hsw+0xa6>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,82,0,0,0                  ; lea           0x52(%rip),%r10        # 5230 <_sk_store_bgra_hsw+0x117>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,242                             ; ja            5089 <_sk_store_bgra_hsw+0xa0>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,83,0,0,0                  ; lea           0x53(%rip),%r9        # 50f4 <_sk_store_bgra_hsw+0x10b>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,1,121,126,4,152                 ; vmovd         %xmm8,(%r8,%r11,4)
-  DB  235,208                             ; jmp           51bf <_sk_store_bgra_hsw+0xa6>
-  DB  196,3,121,22,68,152,8,2             ; vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
-  DB  196,1,121,214,4,152                 ; vmovq         %xmm8,(%r8,%r11,4)
-  DB  235,192                             ; jmp           51bf <_sk_store_bgra_hsw+0xa6>
+  DB  196,65,121,126,4,144                ; vmovd         %xmm8,(%r8,%rdx,4)
+  DB  235,215                             ; jmp           5089 <_sk_store_bgra_hsw+0xa0>
+  DB  196,67,121,22,68,144,8,2            ; vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
+  DB  196,65,121,214,4,144                ; vmovq         %xmm8,(%r8,%rdx,4)
+  DB  235,199                             ; jmp           5089 <_sk_store_bgra_hsw+0xa0>
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
-  DB  196,3,121,22,76,152,24,2            ; vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
+  DB  196,67,121,22,76,144,24,2           ; vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
-  DB  196,3,121,22,76,152,20,1            ; vpextrd       $0x1,%xmm9,0x14(%r8,%r11,4)
+  DB  196,67,121,22,76,144,20,1           ; vpextrd       $0x1,%xmm9,0x14(%r8,%rdx,4)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
-  DB  196,1,121,126,76,152,16             ; vmovd         %xmm9,0x10(%r8,%r11,4)
-  DB  196,1,122,127,4,152                 ; vmovdqu       %xmm8,(%r8,%r11,4)
-  DB  235,143                             ; jmp           51bf <_sk_store_bgra_hsw+0xa6>
-  DB  183,255                             ; mov           $0xff,%bh
+  DB  196,65,121,126,76,144,16            ; vmovd         %xmm9,0x10(%r8,%rdx,4)
+  DB  196,65,122,127,4,144                ; vmovdqu       %xmm8,(%r8,%rdx,4)
+  DB  235,150                             ; jmp           5089 <_sk_store_bgra_hsw+0xa0>
+  DB  144                                 ; nop
+  DB  182,255                             ; mov           $0xff,%dh
   DB  255                                 ; (bad)
-  DB  255,199                             ; inc           %edi
+  DB  255,198                             ; inc           %esi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  191,255,255,255,248                 ; mov           $0xf8ffffff,%edi
+  DB  190,255,255,255,247                 ; mov           $0xf7ffffff,%esi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  235,255                             ; jmp           5241 <_sk_store_bgra_hsw+0x128>
+  DB  234                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  221,255                             ; (bad)
   DB  255                                 ; (bad)
-  DB  255,207                             ; dec           %edi
+  DB  220,255                             ; fdivr         %st,%st(7)
+  DB  255                                 ; (bad)
+  DB  255,206                             ; dec           %esi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -4984,18 +4922,16 @@
 PUBLIC _sk_load_f16_hsw
 _sk_load_f16_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,3                        ; shl           $0x3,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,101                             ; jne           52cd <_sk_load_f16_hsw+0x81>
-  DB  196,65,121,16,4,192                 ; vmovupd       (%r8,%rax,8),%xmm8
-  DB  196,193,121,16,84,192,16            ; vmovupd       0x10(%r8,%rax,8),%xmm2
-  DB  196,193,121,16,92,192,32            ; vmovupd       0x20(%r8,%rax,8),%xmm3
-  DB  196,65,122,111,76,192,48            ; vmovdqu       0x30(%r8,%rax,8),%xmm9
+  DB  117,101                             ; jne           518b <_sk_load_f16_hsw+0x7b>
+  DB  196,65,121,16,4,208                 ; vmovupd       (%r8,%rdx,8),%xmm8
+  DB  196,193,121,16,84,208,16            ; vmovupd       0x10(%r8,%rdx,8),%xmm2
+  DB  196,193,121,16,92,208,32            ; vmovupd       0x20(%r8,%rdx,8),%xmm3
+  DB  196,65,122,111,76,208,48            ; vmovdqu       0x30(%r8,%rdx,8),%xmm9
   DB  197,185,97,194                      ; vpunpcklwd    %xmm2,%xmm8,%xmm0
   DB  197,185,105,210                     ; vpunpckhwd    %xmm2,%xmm8,%xmm2
   DB  196,193,97,97,201                   ; vpunpcklwd    %xmm9,%xmm3,%xmm1
@@ -5014,48 +4950,46 @@
   DB  196,226,125,19,219                  ; vcvtph2ps     %xmm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,65,123,16,4,192                 ; vmovsd        (%r8,%rax,8),%xmm8
+  DB  196,65,123,16,4,208                 ; vmovsd        (%r8,%rdx,8),%xmm8
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,85                              ; je            5333 <_sk_load_f16_hsw+0xe7>
-  DB  196,65,57,22,68,192,8               ; vmovhpd       0x8(%r8,%rax,8),%xmm8,%xmm8
+  DB  116,85                              ; je            51f1 <_sk_load_f16_hsw+0xe1>
+  DB  196,65,57,22,68,208,8               ; vmovhpd       0x8(%r8,%rdx,8),%xmm8,%xmm8
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,72                              ; jb            5333 <_sk_load_f16_hsw+0xe7>
-  DB  196,193,123,16,84,192,16            ; vmovsd        0x10(%r8,%rax,8),%xmm2
+  DB  114,72                              ; jb            51f1 <_sk_load_f16_hsw+0xe1>
+  DB  196,193,123,16,84,208,16            ; vmovsd        0x10(%r8,%rdx,8),%xmm2
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  116,72                              ; je            5340 <_sk_load_f16_hsw+0xf4>
-  DB  196,193,105,22,84,192,24            ; vmovhpd       0x18(%r8,%rax,8),%xmm2,%xmm2
+  DB  116,72                              ; je            51fe <_sk_load_f16_hsw+0xee>
+  DB  196,193,105,22,84,208,24            ; vmovhpd       0x18(%r8,%rdx,8),%xmm2,%xmm2
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,59                              ; jb            5340 <_sk_load_f16_hsw+0xf4>
-  DB  196,193,123,16,92,192,32            ; vmovsd        0x20(%r8,%rax,8),%xmm3
+  DB  114,59                              ; jb            51fe <_sk_load_f16_hsw+0xee>
+  DB  196,193,123,16,92,208,32            ; vmovsd        0x20(%r8,%rdx,8),%xmm3
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  15,132,109,255,255,255              ; je            5283 <_sk_load_f16_hsw+0x37>
-  DB  196,193,97,22,92,192,40             ; vmovhpd       0x28(%r8,%rax,8),%xmm3,%xmm3
+  DB  15,132,109,255,255,255              ; je            5141 <_sk_load_f16_hsw+0x31>
+  DB  196,193,97,22,92,208,40             ; vmovhpd       0x28(%r8,%rdx,8),%xmm3,%xmm3
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  15,130,92,255,255,255               ; jb            5283 <_sk_load_f16_hsw+0x37>
-  DB  196,65,122,126,76,192,48            ; vmovq         0x30(%r8,%rax,8),%xmm9
-  DB  233,80,255,255,255                  ; jmpq          5283 <_sk_load_f16_hsw+0x37>
+  DB  15,130,92,255,255,255               ; jb            5141 <_sk_load_f16_hsw+0x31>
+  DB  196,65,122,126,76,208,48            ; vmovq         0x30(%r8,%rdx,8),%xmm9
+  DB  233,80,255,255,255                  ; jmpq          5141 <_sk_load_f16_hsw+0x31>
   DB  197,225,87,219                      ; vxorpd        %xmm3,%xmm3,%xmm3
   DB  197,233,87,210                      ; vxorpd        %xmm2,%xmm2,%xmm2
-  DB  233,67,255,255,255                  ; jmpq          5283 <_sk_load_f16_hsw+0x37>
+  DB  233,67,255,255,255                  ; jmpq          5141 <_sk_load_f16_hsw+0x31>
   DB  197,225,87,219                      ; vxorpd        %xmm3,%xmm3,%xmm3
-  DB  233,58,255,255,255                  ; jmpq          5283 <_sk_load_f16_hsw+0x37>
+  DB  233,58,255,255,255                  ; jmpq          5141 <_sk_load_f16_hsw+0x31>
 
 PUBLIC _sk_load_f16_dst_hsw
 _sk_load_f16_dst_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,3                        ; shl           $0x3,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,101                             ; jne           53ca <_sk_load_f16_dst_hsw+0x81>
-  DB  196,65,121,16,4,192                 ; vmovupd       (%r8,%rax,8),%xmm8
-  DB  196,193,121,16,116,192,16           ; vmovupd       0x10(%r8,%rax,8),%xmm6
-  DB  196,193,121,16,124,192,32           ; vmovupd       0x20(%r8,%rax,8),%xmm7
-  DB  196,65,122,111,76,192,48            ; vmovdqu       0x30(%r8,%rax,8),%xmm9
+  DB  117,101                             ; jne           5282 <_sk_load_f16_dst_hsw+0x7b>
+  DB  196,65,121,16,4,208                 ; vmovupd       (%r8,%rdx,8),%xmm8
+  DB  196,193,121,16,116,208,16           ; vmovupd       0x10(%r8,%rdx,8),%xmm6
+  DB  196,193,121,16,124,208,32           ; vmovupd       0x20(%r8,%rdx,8),%xmm7
+  DB  196,65,122,111,76,208,48            ; vmovdqu       0x30(%r8,%rdx,8),%xmm9
   DB  197,185,97,230                      ; vpunpcklwd    %xmm6,%xmm8,%xmm4
   DB  197,185,105,246                     ; vpunpckhwd    %xmm6,%xmm8,%xmm6
   DB  196,193,65,97,233                   ; vpunpcklwd    %xmm9,%xmm7,%xmm5
@@ -5074,32 +5008,32 @@
   DB  196,226,125,19,255                  ; vcvtph2ps     %xmm7,%ymm7
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,65,123,16,4,192                 ; vmovsd        (%r8,%rax,8),%xmm8
+  DB  196,65,123,16,4,208                 ; vmovsd        (%r8,%rdx,8),%xmm8
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,85                              ; je            5430 <_sk_load_f16_dst_hsw+0xe7>
-  DB  196,65,57,22,68,192,8               ; vmovhpd       0x8(%r8,%rax,8),%xmm8,%xmm8
+  DB  116,85                              ; je            52e8 <_sk_load_f16_dst_hsw+0xe1>
+  DB  196,65,57,22,68,208,8               ; vmovhpd       0x8(%r8,%rdx,8),%xmm8,%xmm8
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,72                              ; jb            5430 <_sk_load_f16_dst_hsw+0xe7>
-  DB  196,193,123,16,116,192,16           ; vmovsd        0x10(%r8,%rax,8),%xmm6
+  DB  114,72                              ; jb            52e8 <_sk_load_f16_dst_hsw+0xe1>
+  DB  196,193,123,16,116,208,16           ; vmovsd        0x10(%r8,%rdx,8),%xmm6
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  116,72                              ; je            543d <_sk_load_f16_dst_hsw+0xf4>
-  DB  196,193,73,22,116,192,24            ; vmovhpd       0x18(%r8,%rax,8),%xmm6,%xmm6
+  DB  116,72                              ; je            52f5 <_sk_load_f16_dst_hsw+0xee>
+  DB  196,193,73,22,116,208,24            ; vmovhpd       0x18(%r8,%rdx,8),%xmm6,%xmm6
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,59                              ; jb            543d <_sk_load_f16_dst_hsw+0xf4>
-  DB  196,193,123,16,124,192,32           ; vmovsd        0x20(%r8,%rax,8),%xmm7
+  DB  114,59                              ; jb            52f5 <_sk_load_f16_dst_hsw+0xee>
+  DB  196,193,123,16,124,208,32           ; vmovsd        0x20(%r8,%rdx,8),%xmm7
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  15,132,109,255,255,255              ; je            5380 <_sk_load_f16_dst_hsw+0x37>
-  DB  196,193,65,22,124,192,40            ; vmovhpd       0x28(%r8,%rax,8),%xmm7,%xmm7
+  DB  15,132,109,255,255,255              ; je            5238 <_sk_load_f16_dst_hsw+0x31>
+  DB  196,193,65,22,124,208,40            ; vmovhpd       0x28(%r8,%rdx,8),%xmm7,%xmm7
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  15,130,92,255,255,255               ; jb            5380 <_sk_load_f16_dst_hsw+0x37>
-  DB  196,65,122,126,76,192,48            ; vmovq         0x30(%r8,%rax,8),%xmm9
-  DB  233,80,255,255,255                  ; jmpq          5380 <_sk_load_f16_dst_hsw+0x37>
+  DB  15,130,92,255,255,255               ; jb            5238 <_sk_load_f16_dst_hsw+0x31>
+  DB  196,65,122,126,76,208,48            ; vmovq         0x30(%r8,%rdx,8),%xmm9
+  DB  233,80,255,255,255                  ; jmpq          5238 <_sk_load_f16_dst_hsw+0x31>
   DB  197,193,87,255                      ; vxorpd        %xmm7,%xmm7,%xmm7
   DB  197,201,87,246                      ; vxorpd        %xmm6,%xmm6,%xmm6
-  DB  233,67,255,255,255                  ; jmpq          5380 <_sk_load_f16_dst_hsw+0x37>
+  DB  233,67,255,255,255                  ; jmpq          5238 <_sk_load_f16_dst_hsw+0x31>
   DB  197,193,87,255                      ; vxorpd        %xmm7,%xmm7,%xmm7
-  DB  233,58,255,255,255                  ; jmpq          5380 <_sk_load_f16_dst_hsw+0x37>
+  DB  233,58,255,255,255                  ; jmpq          5238 <_sk_load_f16_dst_hsw+0x31>
 
 PUBLIC _sk_gather_f16_hsw
 _sk_gather_f16_hsw LABEL PROC
@@ -5149,12 +5083,10 @@
 PUBLIC _sk_store_f16_hsw
 _sk_store_f16_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,3                        ; shl           $0x3,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  196,195,125,29,192,4                ; vcvtps2ph     $0x4,%ymm0,%xmm8
   DB  196,195,125,29,201,4                ; vcvtps2ph     $0x4,%ymm1,%xmm9
   DB  196,195,125,29,210,4                ; vcvtps2ph     $0x4,%ymm2,%xmm10
@@ -5168,48 +5100,46 @@
   DB  196,65,57,98,205                    ; vpunpckldq    %xmm13,%xmm8,%xmm9
   DB  196,65,57,106,197                   ; vpunpckhdq    %xmm13,%xmm8,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,31                              ; jne           557a <_sk_store_f16_hsw+0x7b>
-  DB  196,65,122,127,28,192               ; vmovdqu       %xmm11,(%r8,%rax,8)
-  DB  196,65,122,127,84,192,16            ; vmovdqu       %xmm10,0x10(%r8,%rax,8)
-  DB  196,65,122,127,76,192,32            ; vmovdqu       %xmm9,0x20(%r8,%rax,8)
-  DB  196,65,122,127,68,192,48            ; vmovdqu       %xmm8,0x30(%r8,%rax,8)
+  DB  117,31                              ; jne           542c <_sk_store_f16_hsw+0x75>
+  DB  196,65,122,127,28,208               ; vmovdqu       %xmm11,(%r8,%rdx,8)
+  DB  196,65,122,127,84,208,16            ; vmovdqu       %xmm10,0x10(%r8,%rdx,8)
+  DB  196,65,122,127,76,208,32            ; vmovdqu       %xmm9,0x20(%r8,%rdx,8)
+  DB  196,65,122,127,68,208,48            ; vmovdqu       %xmm8,0x30(%r8,%rdx,8)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,65,121,214,28,192               ; vmovq         %xmm11,(%r8,%rax,8)
+  DB  196,65,121,214,28,208               ; vmovq         %xmm11,(%r8,%rdx,8)
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,240                             ; je            5576 <_sk_store_f16_hsw+0x77>
-  DB  196,65,121,23,92,192,8              ; vmovhpd       %xmm11,0x8(%r8,%rax,8)
+  DB  116,240                             ; je            5428 <_sk_store_f16_hsw+0x71>
+  DB  196,65,121,23,92,208,8              ; vmovhpd       %xmm11,0x8(%r8,%rdx,8)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,227                             ; jb            5576 <_sk_store_f16_hsw+0x77>
-  DB  196,65,121,214,84,192,16            ; vmovq         %xmm10,0x10(%r8,%rax,8)
-  DB  116,218                             ; je            5576 <_sk_store_f16_hsw+0x77>
-  DB  196,65,121,23,84,192,24             ; vmovhpd       %xmm10,0x18(%r8,%rax,8)
+  DB  114,227                             ; jb            5428 <_sk_store_f16_hsw+0x71>
+  DB  196,65,121,214,84,208,16            ; vmovq         %xmm10,0x10(%r8,%rdx,8)
+  DB  116,218                             ; je            5428 <_sk_store_f16_hsw+0x71>
+  DB  196,65,121,23,84,208,24             ; vmovhpd       %xmm10,0x18(%r8,%rdx,8)
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,205                             ; jb            5576 <_sk_store_f16_hsw+0x77>
-  DB  196,65,121,214,76,192,32            ; vmovq         %xmm9,0x20(%r8,%rax,8)
-  DB  116,196                             ; je            5576 <_sk_store_f16_hsw+0x77>
-  DB  196,65,121,23,76,192,40             ; vmovhpd       %xmm9,0x28(%r8,%rax,8)
+  DB  114,205                             ; jb            5428 <_sk_store_f16_hsw+0x71>
+  DB  196,65,121,214,76,208,32            ; vmovq         %xmm9,0x20(%r8,%rdx,8)
+  DB  116,196                             ; je            5428 <_sk_store_f16_hsw+0x71>
+  DB  196,65,121,23,76,208,40             ; vmovhpd       %xmm9,0x28(%r8,%rdx,8)
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  114,183                             ; jb            5576 <_sk_store_f16_hsw+0x77>
-  DB  196,65,121,214,68,192,48            ; vmovq         %xmm8,0x30(%r8,%rax,8)
-  DB  235,174                             ; jmp           5576 <_sk_store_f16_hsw+0x77>
+  DB  114,183                             ; jb            5428 <_sk_store_f16_hsw+0x71>
+  DB  196,65,121,214,68,208,48            ; vmovq         %xmm8,0x30(%r8,%rdx,8)
+  DB  235,174                             ; jmp           5428 <_sk_store_f16_hsw+0x71>
 
 PUBLIC _sk_load_u16_be_hsw
 _sk_load_u16_be_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9d
-  DB  76,99,80,8                          ; movslq        0x8(%rax),%r10
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,194                       ; imul          %r10,%r8
-  DB  77,1,192                            ; add           %r8,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  73,99,193                           ; movslq        %r9d,%rax
+  DB  76,141,4,149,0,0,0,0                ; lea           0x0(,%rdx,4),%r8
+  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  77,1,201                            ; add           %r9,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,204,0,0,0                    ; jne           56bb <_sk_load_u16_be_hsw+0xf3>
-  DB  196,65,121,16,4,64                  ; vmovupd       (%r8,%rax,2),%xmm8
-  DB  196,193,121,16,84,64,16             ; vmovupd       0x10(%r8,%rax,2),%xmm2
-  DB  196,193,121,16,92,64,32             ; vmovupd       0x20(%r8,%rax,2),%xmm3
-  DB  196,65,122,111,76,64,48             ; vmovdqu       0x30(%r8,%rax,2),%xmm9
+  DB  15,133,204,0,0,0                    ; jne           5567 <_sk_load_u16_be_hsw+0xed>
+  DB  196,1,121,16,4,65                   ; vmovupd       (%r9,%r8,2),%xmm8
+  DB  196,129,121,16,84,65,16             ; vmovupd       0x10(%r9,%r8,2),%xmm2
+  DB  196,129,121,16,92,65,32             ; vmovupd       0x20(%r9,%r8,2),%xmm3
+  DB  196,1,122,111,76,65,48              ; vmovdqu       0x30(%r9,%r8,2),%xmm9
   DB  197,185,97,194                      ; vpunpcklwd    %xmm2,%xmm8,%xmm0
   DB  197,185,105,210                     ; vpunpckhwd    %xmm2,%xmm8,%xmm2
   DB  196,193,97,97,201                   ; vpunpcklwd    %xmm9,%xmm3,%xmm1
@@ -5224,7 +5154,7 @@
   DB  197,241,235,192                     ; vpor          %xmm0,%xmm1,%xmm0
   DB  196,226,125,51,192                  ; vpmovzxwd     %xmm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,21,16,223,2,0         ; vbroadcastss  0x2df10(%rip),%ymm10        # 33560 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
+  DB  196,98,125,24,21,56,218,2,0         ; vbroadcastss  0x2da38(%rip),%ymm10        # 32f34 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
   DB  196,193,124,89,194                  ; vmulps        %ymm10,%ymm0,%ymm0
   DB  197,185,109,202                     ; vpunpckhqdq   %xmm2,%xmm8,%xmm1
   DB  197,233,113,241,8                   ; vpsllw        $0x8,%xmm1,%xmm2
@@ -5249,51 +5179,47 @@
   DB  196,193,100,89,218                  ; vmulps        %ymm10,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,65,123,16,4,64                  ; vmovsd        (%r8,%rax,2),%xmm8
+  DB  196,1,123,16,4,65                   ; vmovsd        (%r9,%r8,2),%xmm8
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,85                              ; je            5721 <_sk_load_u16_be_hsw+0x159>
-  DB  196,65,57,22,68,64,8                ; vmovhpd       0x8(%r8,%rax,2),%xmm8,%xmm8
+  DB  116,85                              ; je            55cd <_sk_load_u16_be_hsw+0x153>
+  DB  196,1,57,22,68,65,8                 ; vmovhpd       0x8(%r9,%r8,2),%xmm8,%xmm8
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,72                              ; jb            5721 <_sk_load_u16_be_hsw+0x159>
-  DB  196,193,123,16,84,64,16             ; vmovsd        0x10(%r8,%rax,2),%xmm2
+  DB  114,72                              ; jb            55cd <_sk_load_u16_be_hsw+0x153>
+  DB  196,129,123,16,84,65,16             ; vmovsd        0x10(%r9,%r8,2),%xmm2
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  116,72                              ; je            572e <_sk_load_u16_be_hsw+0x166>
-  DB  196,193,105,22,84,64,24             ; vmovhpd       0x18(%r8,%rax,2),%xmm2,%xmm2
+  DB  116,72                              ; je            55da <_sk_load_u16_be_hsw+0x160>
+  DB  196,129,105,22,84,65,24             ; vmovhpd       0x18(%r9,%r8,2),%xmm2,%xmm2
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,59                              ; jb            572e <_sk_load_u16_be_hsw+0x166>
-  DB  196,193,123,16,92,64,32             ; vmovsd        0x20(%r8,%rax,2),%xmm3
+  DB  114,59                              ; jb            55da <_sk_load_u16_be_hsw+0x160>
+  DB  196,129,123,16,92,65,32             ; vmovsd        0x20(%r9,%r8,2),%xmm3
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  15,132,6,255,255,255                ; je            560a <_sk_load_u16_be_hsw+0x42>
-  DB  196,193,97,22,92,64,40              ; vmovhpd       0x28(%r8,%rax,2),%xmm3,%xmm3
+  DB  15,132,6,255,255,255                ; je            54b6 <_sk_load_u16_be_hsw+0x3c>
+  DB  196,129,97,22,92,65,40              ; vmovhpd       0x28(%r9,%r8,2),%xmm3,%xmm3
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  15,130,245,254,255,255              ; jb            560a <_sk_load_u16_be_hsw+0x42>
-  DB  196,65,122,126,76,64,48             ; vmovq         0x30(%r8,%rax,2),%xmm9
-  DB  233,233,254,255,255                 ; jmpq          560a <_sk_load_u16_be_hsw+0x42>
+  DB  15,130,245,254,255,255              ; jb            54b6 <_sk_load_u16_be_hsw+0x3c>
+  DB  196,1,122,126,76,65,48              ; vmovq         0x30(%r9,%r8,2),%xmm9
+  DB  233,233,254,255,255                 ; jmpq          54b6 <_sk_load_u16_be_hsw+0x3c>
   DB  197,225,87,219                      ; vxorpd        %xmm3,%xmm3,%xmm3
   DB  197,233,87,210                      ; vxorpd        %xmm2,%xmm2,%xmm2
-  DB  233,220,254,255,255                 ; jmpq          560a <_sk_load_u16_be_hsw+0x42>
+  DB  233,220,254,255,255                 ; jmpq          54b6 <_sk_load_u16_be_hsw+0x3c>
   DB  197,225,87,219                      ; vxorpd        %xmm3,%xmm3,%xmm3
-  DB  233,211,254,255,255                 ; jmpq          560a <_sk_load_u16_be_hsw+0x42>
+  DB  233,211,254,255,255                 ; jmpq          54b6 <_sk_load_u16_be_hsw+0x3c>
 
 PUBLIC _sk_load_rgb_u16_be_hsw
 _sk_load_rgb_u16_be_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  76,141,4,82                         ; lea           (%rdx,%rdx,2),%r8
   DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
-  DB  77,1,192                            ; add           %r8,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,137,208                          ; mov           %rdx,%rax
-  DB  72,193,224,32                       ; shl           $0x20,%rax
-  DB  72,141,4,64                         ; lea           (%rax,%rax,2),%rax
-  DB  72,193,248,32                       ; sar           $0x20,%rax
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  77,1,201                            ; add           %r9,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,205,0,0,0                    ; jne           582f <_sk_load_rgb_u16_be_hsw+0xf8>
-  DB  196,65,122,111,28,64                ; vmovdqu       (%r8,%rax,2),%xmm11
-  DB  196,193,122,111,92,64,12            ; vmovdqu       0xc(%r8,%rax,2),%xmm3
-  DB  196,193,122,111,84,64,24            ; vmovdqu       0x18(%r8,%rax,2),%xmm2
-  DB  196,193,122,111,68,64,32            ; vmovdqu       0x20(%r8,%rax,2),%xmm0
+  DB  15,133,205,0,0,0                    ; jne           56cd <_sk_load_rgb_u16_be_hsw+0xea>
+  DB  196,1,122,111,28,65                 ; vmovdqu       (%r9,%r8,2),%xmm11
+  DB  196,129,122,111,92,65,12            ; vmovdqu       0xc(%r9,%r8,2),%xmm3
+  DB  196,129,122,111,84,65,24            ; vmovdqu       0x18(%r9,%r8,2),%xmm2
+  DB  196,129,122,111,68,65,32            ; vmovdqu       0x20(%r9,%r8,2),%xmm0
   DB  197,249,115,216,4                   ; vpsrldq       $0x4,%xmm0,%xmm0
   DB  196,193,57,115,219,6                ; vpsrldq       $0x6,%xmm11,%xmm8
   DB  197,169,115,219,6                   ; vpsrldq       $0x6,%xmm3,%xmm10
@@ -5314,7 +5240,7 @@
   DB  197,241,235,192                     ; vpor          %xmm0,%xmm1,%xmm0
   DB  196,226,125,51,192                  ; vpmovzxwd     %xmm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,13,127,221,2,0        ; vbroadcastss  0x2dd7f(%rip),%ymm9        # 33560 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
+  DB  196,98,125,24,13,181,216,2,0        ; vbroadcastss  0x2d8b5(%rip),%ymm9        # 32f34 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
   DB  196,193,124,89,193                  ; vmulps        %ymm9,%ymm0,%ymm0
   DB  197,185,109,203                     ; vpunpckhqdq   %xmm3,%xmm8,%xmm1
   DB  197,225,113,241,8                   ; vpsllw        $0x8,%xmm1,%xmm3
@@ -5330,85 +5256,83 @@
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
   DB  196,193,108,89,209                  ; vmulps        %ymm9,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,159,220,2,0       ; vbroadcastss  0x2dc9f(%rip),%ymm3        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,29,213,215,2,0       ; vbroadcastss  0x2d7d5(%rip),%ymm3        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  255,224                             ; jmpq          *%rax
-  DB  196,193,121,110,4,64                ; vmovd         (%r8,%rax,2),%xmm0
+  DB  196,129,121,110,4,65                ; vmovd         (%r9,%r8,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
-  DB  196,65,121,196,92,64,4,2            ; vpinsrw       $0x2,0x4(%r8,%rax,2),%xmm0,%xmm11
+  DB  196,1,121,196,92,65,4,2             ; vpinsrw       $0x2,0x4(%r9,%r8,2),%xmm0,%xmm11
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,31                              ; jne           5867 <_sk_load_rgb_u16_be_hsw+0x130>
+  DB  117,31                              ; jne           5705 <_sk_load_rgb_u16_be_hsw+0x122>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
   DB  196,65,41,239,210                   ; vpxor         %xmm10,%xmm10,%xmm10
   DB  197,225,239,219                     ; vpxor         %xmm3,%xmm3,%xmm3
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
-  DB  233,48,255,255,255                  ; jmpq          5797 <_sk_load_rgb_u16_be_hsw+0x60>
-  DB  196,193,121,110,68,64,6             ; vmovd         0x6(%r8,%rax,2),%xmm0
+  DB  233,48,255,255,255                  ; jmpq          5635 <_sk_load_rgb_u16_be_hsw+0x52>
+  DB  196,129,121,110,68,65,6             ; vmovd         0x6(%r9,%r8,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
-  DB  196,65,121,196,68,64,10,2           ; vpinsrw       $0x2,0xa(%r8,%rax,2),%xmm0,%xmm8
+  DB  196,1,121,196,68,65,10,2            ; vpinsrw       $0x2,0xa(%r9,%r8,2),%xmm0,%xmm8
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,48                              ; jb            58b1 <_sk_load_rgb_u16_be_hsw+0x17a>
-  DB  196,193,121,110,68,64,12            ; vmovd         0xc(%r8,%rax,2),%xmm0
+  DB  114,48                              ; jb            574f <_sk_load_rgb_u16_be_hsw+0x16c>
+  DB  196,129,121,110,68,65,12            ; vmovd         0xc(%r9,%r8,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
-  DB  196,193,121,196,92,64,16,2          ; vpinsrw       $0x2,0x10(%r8,%rax,2),%xmm0,%xmm3
+  DB  196,129,121,196,92,65,16,2          ; vpinsrw       $0x2,0x10(%r9,%r8,2),%xmm0,%xmm3
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  117,48                              ; jne           58cb <_sk_load_rgb_u16_be_hsw+0x194>
+  DB  117,48                              ; jne           5769 <_sk_load_rgb_u16_be_hsw+0x186>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
   DB  196,65,41,239,210                   ; vpxor         %xmm10,%xmm10,%xmm10
-  DB  233,230,254,255,255                 ; jmpq          5797 <_sk_load_rgb_u16_be_hsw+0x60>
+  DB  233,230,254,255,255                 ; jmpq          5635 <_sk_load_rgb_u16_be_hsw+0x52>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
   DB  196,65,41,239,210                   ; vpxor         %xmm10,%xmm10,%xmm10
   DB  197,225,239,219                     ; vpxor         %xmm3,%xmm3,%xmm3
-  DB  233,204,254,255,255                 ; jmpq          5797 <_sk_load_rgb_u16_be_hsw+0x60>
-  DB  196,193,121,110,68,64,18            ; vmovd         0x12(%r8,%rax,2),%xmm0
+  DB  233,204,254,255,255                 ; jmpq          5635 <_sk_load_rgb_u16_be_hsw+0x52>
+  DB  196,129,121,110,68,65,18            ; vmovd         0x12(%r9,%r8,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
-  DB  196,65,121,196,84,64,22,2           ; vpinsrw       $0x2,0x16(%r8,%rax,2),%xmm0,%xmm10
+  DB  196,1,121,196,84,65,22,2            ; vpinsrw       $0x2,0x16(%r9,%r8,2),%xmm0,%xmm10
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,39                              ; jb            590c <_sk_load_rgb_u16_be_hsw+0x1d5>
-  DB  196,193,121,110,68,64,24            ; vmovd         0x18(%r8,%rax,2),%xmm0
+  DB  114,39                              ; jb            57aa <_sk_load_rgb_u16_be_hsw+0x1c7>
+  DB  196,129,121,110,68,65,24            ; vmovd         0x18(%r9,%r8,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
-  DB  196,193,121,196,84,64,28,2          ; vpinsrw       $0x2,0x1c(%r8,%rax,2),%xmm0,%xmm2
+  DB  196,129,121,196,84,65,28,2          ; vpinsrw       $0x2,0x1c(%r9,%r8,2),%xmm0,%xmm2
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  117,30                              ; jne           591d <_sk_load_rgb_u16_be_hsw+0x1e6>
+  DB  117,30                              ; jne           57bb <_sk_load_rgb_u16_be_hsw+0x1d8>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
-  DB  233,139,254,255,255                 ; jmpq          5797 <_sk_load_rgb_u16_be_hsw+0x60>
+  DB  233,139,254,255,255                 ; jmpq          5635 <_sk_load_rgb_u16_be_hsw+0x52>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
-  DB  233,122,254,255,255                 ; jmpq          5797 <_sk_load_rgb_u16_be_hsw+0x60>
-  DB  196,193,121,110,68,64,30            ; vmovd         0x1e(%r8,%rax,2),%xmm0
+  DB  233,122,254,255,255                 ; jmpq          5635 <_sk_load_rgb_u16_be_hsw+0x52>
+  DB  196,129,121,110,68,65,30            ; vmovd         0x1e(%r9,%r8,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
-  DB  196,193,121,196,76,64,34,2          ; vpinsrw       $0x2,0x22(%r8,%rax,2),%xmm0,%xmm1
+  DB  196,129,121,196,76,65,34,2          ; vpinsrw       $0x2,0x22(%r9,%r8,2),%xmm0,%xmm1
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  114,25                              ; jb            5950 <_sk_load_rgb_u16_be_hsw+0x219>
-  DB  196,193,121,110,68,64,36            ; vmovd         0x24(%r8,%rax,2),%xmm0
+  DB  114,25                              ; jb            57ee <_sk_load_rgb_u16_be_hsw+0x20b>
+  DB  196,129,121,110,68,65,36            ; vmovd         0x24(%r9,%r8,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
-  DB  196,193,121,196,68,64,40,2          ; vpinsrw       $0x2,0x28(%r8,%rax,2),%xmm0,%xmm0
-  DB  233,71,254,255,255                  ; jmpq          5797 <_sk_load_rgb_u16_be_hsw+0x60>
+  DB  196,129,121,196,68,65,40,2          ; vpinsrw       $0x2,0x28(%r9,%r8,2),%xmm0,%xmm0
+  DB  233,71,254,255,255                  ; jmpq          5635 <_sk_load_rgb_u16_be_hsw+0x52>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
-  DB  233,62,254,255,255                  ; jmpq          5797 <_sk_load_rgb_u16_be_hsw+0x60>
+  DB  233,62,254,255,255                  ; jmpq          5635 <_sk_load_rgb_u16_be_hsw+0x52>
 
 PUBLIC _sk_store_u16_be_hsw
 _sk_store_u16_be_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9d
-  DB  76,99,80,8                          ; movslq        0x8(%rax),%r10
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,194                       ; imul          %r10,%r8
-  DB  77,1,192                            ; add           %r8,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  73,99,193                           ; movslq        %r9d,%rax
+  DB  76,141,4,149,0,0,0,0                ; lea           0x0(,%rdx,4),%r8
+  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  77,1,201                            ; add           %r9,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,60,95,200                       ; vmaxps        %ymm0,%ymm8,%ymm9
-  DB  196,98,125,24,21,67,219,2,0         ; vbroadcastss  0x2db43(%rip),%ymm10        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,21,127,214,2,0        ; vbroadcastss  0x2d67f(%rip),%ymm10        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,65,52,93,202                    ; vminps        %ymm10,%ymm9,%ymm9
-  DB  196,98,125,24,29,81,220,2,0         ; vbroadcastss  0x2dc51(%rip),%ymm11        # 335e8 <_sk_srcover_bgra_8888_sse2_lowp+0x3cc>
+  DB  196,98,125,24,29,141,215,2,0        ; vbroadcastss  0x2d78d(%rip),%ymm11        # 32fbc <_sk_srcover_bgra_8888_sse2_lowp+0x3cc>
   DB  196,65,52,89,203                    ; vmulps        %ymm11,%ymm9,%ymm9
   DB  196,65,125,91,201                   ; vcvtps2dq     %ymm9,%ymm9
   DB  196,67,125,25,204,1                 ; vextractf128  $0x1,%ymm9,%xmm12
@@ -5452,31 +5376,31 @@
   DB  196,65,25,98,200                    ; vpunpckldq    %xmm8,%xmm12,%xmm9
   DB  196,65,25,106,192                   ; vpunpckhdq    %xmm8,%xmm12,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,31                              ; jne           5a96 <_sk_store_u16_be_hsw+0x13d>
-  DB  196,65,122,127,28,64                ; vmovdqu       %xmm11,(%r8,%rax,2)
-  DB  196,65,122,127,84,64,16             ; vmovdqu       %xmm10,0x10(%r8,%rax,2)
-  DB  196,65,122,127,76,64,32             ; vmovdqu       %xmm9,0x20(%r8,%rax,2)
-  DB  196,65,122,127,68,64,48             ; vmovdqu       %xmm8,0x30(%r8,%rax,2)
+  DB  117,31                              ; jne           592e <_sk_store_u16_be_hsw+0x137>
+  DB  196,1,122,127,28,65                 ; vmovdqu       %xmm11,(%r9,%r8,2)
+  DB  196,1,122,127,84,65,16              ; vmovdqu       %xmm10,0x10(%r9,%r8,2)
+  DB  196,1,122,127,76,65,32              ; vmovdqu       %xmm9,0x20(%r9,%r8,2)
+  DB  196,1,122,127,68,65,48              ; vmovdqu       %xmm8,0x30(%r9,%r8,2)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,65,121,214,28,64                ; vmovq         %xmm11,(%r8,%rax,2)
+  DB  196,1,121,214,28,65                 ; vmovq         %xmm11,(%r9,%r8,2)
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,240                             ; je            5a92 <_sk_store_u16_be_hsw+0x139>
-  DB  196,65,121,23,92,64,8               ; vmovhpd       %xmm11,0x8(%r8,%rax,2)
+  DB  116,240                             ; je            592a <_sk_store_u16_be_hsw+0x133>
+  DB  196,1,121,23,92,65,8                ; vmovhpd       %xmm11,0x8(%r9,%r8,2)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,227                             ; jb            5a92 <_sk_store_u16_be_hsw+0x139>
-  DB  196,65,121,214,84,64,16             ; vmovq         %xmm10,0x10(%r8,%rax,2)
-  DB  116,218                             ; je            5a92 <_sk_store_u16_be_hsw+0x139>
-  DB  196,65,121,23,84,64,24              ; vmovhpd       %xmm10,0x18(%r8,%rax,2)
+  DB  114,227                             ; jb            592a <_sk_store_u16_be_hsw+0x133>
+  DB  196,1,121,214,84,65,16              ; vmovq         %xmm10,0x10(%r9,%r8,2)
+  DB  116,218                             ; je            592a <_sk_store_u16_be_hsw+0x133>
+  DB  196,1,121,23,84,65,24               ; vmovhpd       %xmm10,0x18(%r9,%r8,2)
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,205                             ; jb            5a92 <_sk_store_u16_be_hsw+0x139>
-  DB  196,65,121,214,76,64,32             ; vmovq         %xmm9,0x20(%r8,%rax,2)
-  DB  116,196                             ; je            5a92 <_sk_store_u16_be_hsw+0x139>
-  DB  196,65,121,23,76,64,40              ; vmovhpd       %xmm9,0x28(%r8,%rax,2)
+  DB  114,205                             ; jb            592a <_sk_store_u16_be_hsw+0x133>
+  DB  196,1,121,214,76,65,32              ; vmovq         %xmm9,0x20(%r9,%r8,2)
+  DB  116,196                             ; je            592a <_sk_store_u16_be_hsw+0x133>
+  DB  196,1,121,23,76,65,40               ; vmovhpd       %xmm9,0x28(%r9,%r8,2)
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  114,183                             ; jb            5a92 <_sk_store_u16_be_hsw+0x139>
-  DB  196,65,121,214,68,64,48             ; vmovq         %xmm8,0x30(%r8,%rax,2)
-  DB  235,174                             ; jmp           5a92 <_sk_store_u16_be_hsw+0x139>
+  DB  114,183                             ; jb            592a <_sk_store_u16_be_hsw+0x133>
+  DB  196,1,121,214,68,65,48              ; vmovq         %xmm8,0x30(%r9,%r8,2)
+  DB  235,174                             ; jmp           592a <_sk_store_u16_be_hsw+0x133>
 
 PUBLIC _sk_load_f32_hsw
 _sk_load_f32_hsw LABEL PROC
@@ -5484,19 +5408,17 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,253,87,192                      ; vxorpd        %ymm0,%ymm0,%ymm0
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  15,135,94,1,0,0                     ; ja            5c59 <_sk_load_f32_hsw+0x175>
+  DB  15,135,88,1,0,0                     ; ja            5aeb <_sk_load_f32_hsw+0x16f>
   DB  197,253,17,36,36                    ; vmovupd       %ymm4,(%rsp)
   DB  197,253,17,108,36,32                ; vmovupd       %ymm5,0x20(%rsp)
   DB  197,253,17,116,36,64                ; vmovupd       %ymm6,0x40(%rsp)
   DB  197,253,17,124,36,96                ; vmovupd       %ymm7,0x60(%rsp)
-  DB  68,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9d
-  DB  76,99,80,8                          ; movslq        0x8(%rax),%r10
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,194                       ; imul          %r10,%r8
-  DB  73,193,224,2                        ; shl           $0x2,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  77,99,201                           ; movslq        %r9d,%r9
-  DB  76,141,21,50,1,0,0                  ; lea           0x132(%rip),%r10        # 5c68 <_sk_load_f32_hsw+0x184>
+  DB  76,141,4,149,0,0,0,0                ; lea           0x0(,%rdx,4),%r8
+  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  73,193,225,2                        ; shl           $0x2,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
+  DB  76,141,21,52,1,0,0                  ; lea           0x134(%rip),%r10        # 5afc <_sk_load_f32_hsw+0x180>
   DB  73,99,4,186                         ; movslq        (%r10,%rdi,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  197,221,87,228                      ; vxorpd        %ymm4,%ymm4,%ymm4
@@ -5515,31 +5437,31 @@
   DB  196,65,45,87,210                    ; vxorpd        %ymm10,%ymm10,%ymm10
   DB  197,197,87,255                      ; vxorpd        %ymm7,%ymm7,%ymm7
   DB  255,224                             ; jmpq          *%rax
-  DB  196,129,121,16,68,136,112           ; vmovupd       0x70(%r8,%r9,4),%xmm0
+  DB  196,129,121,16,68,129,112           ; vmovupd       0x70(%r9,%r8,4),%xmm0
   DB  196,227,125,6,192,40                ; vperm2f128    $0x28,%ymm0,%ymm0,%ymm0
-  DB  196,129,121,16,76,136,96            ; vmovupd       0x60(%r8,%r9,4),%xmm1
+  DB  196,129,121,16,76,129,96            ; vmovupd       0x60(%r9,%r8,4),%xmm1
   DB  196,227,125,6,225,40                ; vperm2f128    $0x28,%ymm1,%ymm0,%ymm4
-  DB  196,129,121,16,76,136,80            ; vmovupd       0x50(%r8,%r9,4),%xmm1
+  DB  196,129,121,16,76,129,80            ; vmovupd       0x50(%r9,%r8,4),%xmm1
   DB  196,227,125,6,209,40                ; vperm2f128    $0x28,%ymm1,%ymm0,%ymm2
   DB  197,125,40,204                      ; vmovapd       %ymm4,%ymm9
-  DB  196,129,121,16,76,136,64            ; vmovupd       0x40(%r8,%r9,4),%xmm1
+  DB  196,129,121,16,76,129,64            ; vmovupd       0x40(%r9,%r8,4),%xmm1
   DB  196,99,125,6,193,40                 ; vperm2f128    $0x28,%ymm1,%ymm0,%ymm8
   DB  196,65,125,40,217                   ; vmovapd       %ymm9,%ymm11
   DB  197,125,40,226                      ; vmovapd       %ymm2,%ymm12
-  DB  196,129,121,16,76,136,48            ; vmovupd       0x30(%r8,%r9,4),%xmm1
+  DB  196,129,121,16,76,129,48            ; vmovupd       0x30(%r9,%r8,4),%xmm1
   DB  196,227,117,13,192,12               ; vblendpd      $0xc,%ymm0,%ymm1,%ymm0
   DB  196,65,125,40,243                   ; vmovapd       %ymm11,%ymm14
   DB  197,125,41,230                      ; vmovapd       %ymm12,%ymm6
   DB  196,65,125,40,248                   ; vmovapd       %ymm8,%ymm15
-  DB  196,129,121,16,76,136,32            ; vmovupd       0x20(%r8,%r9,4),%xmm1
+  DB  196,129,121,16,76,129,32            ; vmovupd       0x20(%r9,%r8,4),%xmm1
   DB  196,195,117,13,206,12               ; vblendpd      $0xc,%ymm14,%ymm1,%ymm1
   DB  197,125,40,238                      ; vmovapd       %ymm6,%ymm13
   DB  197,125,41,253                      ; vmovapd       %ymm15,%ymm5
-  DB  196,129,121,16,84,136,16            ; vmovupd       0x10(%r8,%r9,4),%xmm2
+  DB  196,129,121,16,84,129,16            ; vmovupd       0x10(%r9,%r8,4),%xmm2
   DB  196,67,109,13,213,12                ; vblendpd      $0xc,%ymm13,%ymm2,%ymm10
   DB  197,253,40,217                      ; vmovapd       %ymm1,%ymm3
   DB  197,253,40,253                      ; vmovapd       %ymm5,%ymm7
-  DB  196,129,121,16,12,136               ; vmovupd       (%r8,%r9,4),%xmm1
+  DB  196,129,121,16,12,129               ; vmovupd       (%r9,%r8,4),%xmm1
   DB  196,227,117,13,207,12               ; vblendpd      $0xc,%ymm7,%ymm1,%ymm1
   DB  197,252,16,124,36,96                ; vmovups       0x60(%rsp),%ymm7
   DB  197,252,16,116,36,64                ; vmovups       0x40(%rsp),%ymm6
@@ -5559,18 +5481,22 @@
   DB  197,229,87,219                      ; vxorpd        %ymm3,%ymm3,%ymm3
   DB  196,65,45,87,210                    ; vxorpd        %ymm10,%ymm10,%ymm10
   DB  197,245,87,201                      ; vxorpd        %ymm1,%ymm1,%ymm1
-  DB  235,196                             ; jmp           5c2c <_sk_load_f32_hsw+0x148>
-  DB  27,255                              ; sbb           %edi,%edi
+  DB  235,196                             ; jmp           5abe <_sk_load_f32_hsw+0x142>
+  DB  102,144                             ; xchg          %ax,%ax
+  DB  25,255                              ; sbb           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,161,255,255,255,140             ; jmpq          *-0x73000001(%rcx)
+  DB  255,159,255,255,255,138             ; lcall         *-0x75000001(%rdi)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,119,255                         ; pushq         -0x1(%rdi)
+  DB  255,117,255                         ; pushq         -0x1(%rbp)
   DB  255                                 ; (bad)
-  DB  255,92,255,255                      ; lcall         *-0x1(%rdi,%rdi,8)
-  DB  255,70,255                          ; incl          -0x1(%rsi)
+  DB  255,90,255                          ; lcall         *-0x1(%rdx)
   DB  255                                 ; (bad)
-  DB  255,53,255,255,255,40               ; pushq         0x28ffffff(%rip)        # 29005c84 <_sk_srcover_bgra_8888_sse2_lowp+0x28fd2a68>
+  DB  255,68,255,255                      ; incl          -0x1(%rdi,%rdi,8)
+  DB  255,51                              ; pushq         (%rbx)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,38                              ; jmpq          *(%rsi)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -5581,19 +5507,17 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,221,87,228                      ; vxorpd        %ymm4,%ymm4,%ymm4
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  15,135,94,1,0,0                     ; ja            5dfd <_sk_load_f32_dst_hsw+0x175>
+  DB  15,135,88,1,0,0                     ; ja            5c8b <_sk_load_f32_dst_hsw+0x16f>
   DB  197,253,17,4,36                     ; vmovupd       %ymm0,(%rsp)
   DB  197,253,17,76,36,32                 ; vmovupd       %ymm1,0x20(%rsp)
   DB  197,253,17,84,36,64                 ; vmovupd       %ymm2,0x40(%rsp)
   DB  197,253,17,92,36,96                 ; vmovupd       %ymm3,0x60(%rsp)
-  DB  68,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9d
-  DB  76,99,80,8                          ; movslq        0x8(%rax),%r10
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,194                       ; imul          %r10,%r8
-  DB  73,193,224,2                        ; shl           $0x2,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  77,99,201                           ; movslq        %r9d,%r9
-  DB  76,141,21,50,1,0,0                  ; lea           0x132(%rip),%r10        # 5e0c <_sk_load_f32_dst_hsw+0x184>
+  DB  76,141,4,149,0,0,0,0                ; lea           0x0(,%rdx,4),%r8
+  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  73,193,225,2                        ; shl           $0x2,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
+  DB  76,141,21,52,1,0,0                  ; lea           0x134(%rip),%r10        # 5c9c <_sk_load_f32_dst_hsw+0x180>
   DB  73,99,4,186                         ; movslq        (%r10,%rdi,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  197,253,87,192                      ; vxorpd        %ymm0,%ymm0,%ymm0
@@ -5612,31 +5536,31 @@
   DB  196,65,45,87,210                    ; vxorpd        %ymm10,%ymm10,%ymm10
   DB  197,229,87,219                      ; vxorpd        %ymm3,%ymm3,%ymm3
   DB  255,224                             ; jmpq          *%rax
-  DB  196,129,121,16,68,136,112           ; vmovupd       0x70(%r8,%r9,4),%xmm0
+  DB  196,129,121,16,68,129,112           ; vmovupd       0x70(%r9,%r8,4),%xmm0
   DB  196,227,125,6,224,40                ; vperm2f128    $0x28,%ymm0,%ymm0,%ymm4
-  DB  196,129,121,16,68,136,96            ; vmovupd       0x60(%r8,%r9,4),%xmm0
+  DB  196,129,121,16,68,129,96            ; vmovupd       0x60(%r9,%r8,4),%xmm0
   DB  196,227,125,6,192,40                ; vperm2f128    $0x28,%ymm0,%ymm0,%ymm0
-  DB  196,129,121,16,76,136,80            ; vmovupd       0x50(%r8,%r9,4),%xmm1
+  DB  196,129,121,16,76,129,80            ; vmovupd       0x50(%r9,%r8,4),%xmm1
   DB  196,227,125,6,241,40                ; vperm2f128    $0x28,%ymm1,%ymm0,%ymm6
   DB  197,125,40,200                      ; vmovapd       %ymm0,%ymm9
-  DB  196,129,121,16,68,136,64            ; vmovupd       0x40(%r8,%r9,4),%xmm0
+  DB  196,129,121,16,68,129,64            ; vmovupd       0x40(%r9,%r8,4),%xmm0
   DB  196,99,125,6,192,40                 ; vperm2f128    $0x28,%ymm0,%ymm0,%ymm8
   DB  196,65,125,40,217                   ; vmovapd       %ymm9,%ymm11
   DB  197,125,40,230                      ; vmovapd       %ymm6,%ymm12
-  DB  196,129,121,16,68,136,48            ; vmovupd       0x30(%r8,%r9,4),%xmm0
+  DB  196,129,121,16,68,129,48            ; vmovupd       0x30(%r9,%r8,4),%xmm0
   DB  196,227,125,13,228,12               ; vblendpd      $0xc,%ymm4,%ymm0,%ymm4
   DB  196,65,125,40,243                   ; vmovapd       %ymm11,%ymm14
   DB  197,125,41,226                      ; vmovapd       %ymm12,%ymm2
   DB  196,65,125,40,248                   ; vmovapd       %ymm8,%ymm15
-  DB  196,129,121,16,68,136,32            ; vmovupd       0x20(%r8,%r9,4),%xmm0
+  DB  196,129,121,16,68,129,32            ; vmovupd       0x20(%r9,%r8,4),%xmm0
   DB  196,195,125,13,238,12               ; vblendpd      $0xc,%ymm14,%ymm0,%ymm5
   DB  197,125,40,234                      ; vmovapd       %ymm2,%ymm13
   DB  197,125,41,249                      ; vmovapd       %ymm15,%ymm1
-  DB  196,129,121,16,68,136,16            ; vmovupd       0x10(%r8,%r9,4),%xmm0
+  DB  196,129,121,16,68,129,16            ; vmovupd       0x10(%r9,%r8,4),%xmm0
   DB  196,67,125,13,213,12                ; vblendpd      $0xc,%ymm13,%ymm0,%ymm10
   DB  197,253,40,253                      ; vmovapd       %ymm5,%ymm7
   DB  197,253,40,217                      ; vmovapd       %ymm1,%ymm3
-  DB  196,129,121,16,4,136                ; vmovupd       (%r8,%r9,4),%xmm0
+  DB  196,129,121,16,4,129                ; vmovupd       (%r9,%r8,4),%xmm0
   DB  196,227,125,13,235,12               ; vblendpd      $0xc,%ymm3,%ymm0,%ymm5
   DB  197,252,16,92,36,96                 ; vmovups       0x60(%rsp),%ymm3
   DB  197,252,16,84,36,64                 ; vmovups       0x40(%rsp),%ymm2
@@ -5656,18 +5580,22 @@
   DB  197,197,87,255                      ; vxorpd        %ymm7,%ymm7,%ymm7
   DB  196,65,45,87,210                    ; vxorpd        %ymm10,%ymm10,%ymm10
   DB  197,213,87,237                      ; vxorpd        %ymm5,%ymm5,%ymm5
-  DB  235,196                             ; jmp           5dd0 <_sk_load_f32_dst_hsw+0x148>
-  DB  27,255                              ; sbb           %edi,%edi
+  DB  235,196                             ; jmp           5c5e <_sk_load_f32_dst_hsw+0x142>
+  DB  102,144                             ; xchg          %ax,%ax
+  DB  25,255                              ; sbb           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,161,255,255,255,140             ; jmpq          *-0x73000001(%rcx)
+  DB  255,159,255,255,255,138             ; lcall         *-0x75000001(%rdi)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,119,255                         ; pushq         -0x1(%rdi)
+  DB  255,117,255                         ; pushq         -0x1(%rbp)
   DB  255                                 ; (bad)
-  DB  255,92,255,255                      ; lcall         *-0x1(%rdi,%rdi,8)
-  DB  255,70,255                          ; incl          -0x1(%rsi)
+  DB  255,90,255                          ; lcall         *-0x1(%rdx)
   DB  255                                 ; (bad)
-  DB  255,53,255,255,255,40               ; pushq         0x28ffffff(%rip)        # 29005e28 <_sk_srcover_bgra_8888_sse2_lowp+0x28fd2c0c>
+  DB  255,68,255,255                      ; incl          -0x1(%rdi,%rdi,8)
+  DB  255,51                              ; pushq         (%rbx)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,38                              ; jmpq          *(%rsi)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -5675,13 +5603,11 @@
 PUBLIC _sk_store_f32_hsw
 _sk_store_f32_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9d
-  DB  76,99,80,8                          ; movslq        0x8(%rax),%r10
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,194                       ; imul          %r10,%r8
-  DB  73,193,224,2                        ; shl           $0x2,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  73,99,193                           ; movslq        %r9d,%rax
+  DB  76,141,4,149,0,0,0,0                ; lea           0x0(,%rdx,4),%r8
+  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  73,193,225,2                        ; shl           $0x2,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
   DB  197,124,20,193                      ; vunpcklps     %ymm1,%ymm0,%ymm8
   DB  197,124,21,217                      ; vunpckhps     %ymm1,%ymm0,%ymm11
   DB  197,108,20,203                      ; vunpcklps     %ymm3,%ymm2,%ymm9
@@ -5691,35 +5617,35 @@
   DB  196,65,37,20,196                    ; vunpcklpd     %ymm12,%ymm11,%ymm8
   DB  196,65,37,21,220                    ; vunpckhpd     %ymm12,%ymm11,%ymm11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,55                              ; jne           5eab <_sk_store_f32_hsw+0x7f>
+  DB  117,55                              ; jne           5d35 <_sk_store_f32_hsw+0x79>
   DB  196,67,45,24,225,1                  ; vinsertf128   $0x1,%xmm9,%ymm10,%ymm12
   DB  196,67,61,24,235,1                  ; vinsertf128   $0x1,%xmm11,%ymm8,%ymm13
   DB  196,67,45,6,201,49                  ; vperm2f128    $0x31,%ymm9,%ymm10,%ymm9
   DB  196,67,61,6,195,49                  ; vperm2f128    $0x31,%ymm11,%ymm8,%ymm8
-  DB  196,65,125,17,36,128                ; vmovupd       %ymm12,(%r8,%rax,4)
-  DB  196,65,125,17,108,128,32            ; vmovupd       %ymm13,0x20(%r8,%rax,4)
-  DB  196,65,125,17,76,128,64             ; vmovupd       %ymm9,0x40(%r8,%rax,4)
-  DB  196,65,125,17,68,128,96             ; vmovupd       %ymm8,0x60(%r8,%rax,4)
+  DB  196,1,125,17,36,129                 ; vmovupd       %ymm12,(%r9,%r8,4)
+  DB  196,1,125,17,108,129,32             ; vmovupd       %ymm13,0x20(%r9,%r8,4)
+  DB  196,1,125,17,76,129,64              ; vmovupd       %ymm9,0x40(%r9,%r8,4)
+  DB  196,1,125,17,68,129,96              ; vmovupd       %ymm8,0x60(%r9,%r8,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,65,121,17,20,128                ; vmovupd       %xmm10,(%r8,%rax,4)
+  DB  196,1,121,17,20,129                 ; vmovupd       %xmm10,(%r9,%r8,4)
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,240                             ; je            5ea7 <_sk_store_f32_hsw+0x7b>
-  DB  196,65,121,17,76,128,16             ; vmovupd       %xmm9,0x10(%r8,%rax,4)
+  DB  116,240                             ; je            5d31 <_sk_store_f32_hsw+0x75>
+  DB  196,1,121,17,76,129,16              ; vmovupd       %xmm9,0x10(%r9,%r8,4)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,227                             ; jb            5ea7 <_sk_store_f32_hsw+0x7b>
-  DB  196,65,121,17,68,128,32             ; vmovupd       %xmm8,0x20(%r8,%rax,4)
-  DB  116,218                             ; je            5ea7 <_sk_store_f32_hsw+0x7b>
-  DB  196,65,121,17,92,128,48             ; vmovupd       %xmm11,0x30(%r8,%rax,4)
+  DB  114,227                             ; jb            5d31 <_sk_store_f32_hsw+0x75>
+  DB  196,1,121,17,68,129,32              ; vmovupd       %xmm8,0x20(%r9,%r8,4)
+  DB  116,218                             ; je            5d31 <_sk_store_f32_hsw+0x75>
+  DB  196,1,121,17,92,129,48              ; vmovupd       %xmm11,0x30(%r9,%r8,4)
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,205                             ; jb            5ea7 <_sk_store_f32_hsw+0x7b>
-  DB  196,67,125,25,84,128,64,1           ; vextractf128  $0x1,%ymm10,0x40(%r8,%rax,4)
-  DB  116,195                             ; je            5ea7 <_sk_store_f32_hsw+0x7b>
-  DB  196,67,125,25,76,128,80,1           ; vextractf128  $0x1,%ymm9,0x50(%r8,%rax,4)
+  DB  114,205                             ; jb            5d31 <_sk_store_f32_hsw+0x75>
+  DB  196,3,125,25,84,129,64,1            ; vextractf128  $0x1,%ymm10,0x40(%r9,%r8,4)
+  DB  116,195                             ; je            5d31 <_sk_store_f32_hsw+0x75>
+  DB  196,3,125,25,76,129,80,1            ; vextractf128  $0x1,%ymm9,0x50(%r9,%r8,4)
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  114,181                             ; jb            5ea7 <_sk_store_f32_hsw+0x7b>
-  DB  196,67,125,25,68,128,96,1           ; vextractf128  $0x1,%ymm8,0x60(%r8,%rax,4)
-  DB  235,171                             ; jmp           5ea7 <_sk_store_f32_hsw+0x7b>
+  DB  114,181                             ; jb            5d31 <_sk_store_f32_hsw+0x75>
+  DB  196,3,125,25,68,129,96,1            ; vextractf128  $0x1,%ymm8,0x60(%r9,%r8,4)
+  DB  235,171                             ; jmp           5d31 <_sk_store_f32_hsw+0x75>
 
 PUBLIC _sk_repeat_x_hsw
 _sk_repeat_x_hsw LABEL PROC
@@ -5752,7 +5678,7 @@
   DB  196,65,124,92,218                   ; vsubps        %ymm10,%ymm0,%ymm11
   DB  196,193,58,88,192                   ; vaddss        %xmm8,%xmm8,%xmm0
   DB  196,98,125,24,192                   ; vbroadcastss  %xmm0,%ymm8
-  DB  197,178,89,5,101,213,2,0            ; vmulss        0x2d565(%rip),%xmm9,%xmm0        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  197,178,89,5,175,208,2,0            ; vmulss        0x2d0af(%rip),%xmm9,%xmm0        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,226,125,24,192                  ; vbroadcastss  %xmm0,%ymm0
   DB  197,164,89,192                      ; vmulps        %ymm0,%ymm11,%ymm0
   DB  196,227,125,8,192,1                 ; vroundps      $0x1,%ymm0,%ymm0
@@ -5773,7 +5699,7 @@
   DB  196,65,116,92,218                   ; vsubps        %ymm10,%ymm1,%ymm11
   DB  196,193,58,88,200                   ; vaddss        %xmm8,%xmm8,%xmm1
   DB  196,98,125,24,193                   ; vbroadcastss  %xmm1,%ymm8
-  DB  197,178,89,13,20,213,2,0            ; vmulss        0x2d514(%rip),%xmm9,%xmm1        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  197,178,89,13,94,208,2,0            ; vmulss        0x2d05e(%rip),%xmm9,%xmm1        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,226,125,24,201                  ; vbroadcastss  %xmm1,%ymm1
   DB  197,164,89,201                      ; vmulps        %ymm1,%ymm11,%ymm1
   DB  196,227,125,8,201,1                 ; vroundps      $0x1,%ymm1,%ymm1
@@ -5789,7 +5715,7 @@
 _sk_clamp_x_1_hsw LABEL PROC
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,188,95,192                      ; vmaxps        %ymm0,%ymm8,%ymm0
-  DB  196,98,125,24,5,220,212,2,0         ; vbroadcastss  0x2d4dc(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,38,208,2,0          ; vbroadcastss  0x2d026(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -5800,16 +5726,16 @@
   DB  196,193,124,92,192                  ; vsubps        %ymm8,%ymm0,%ymm0
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,188,95,192                      ; vmaxps        %ymm0,%ymm8,%ymm0
-  DB  196,98,125,24,5,182,212,2,0         ; vbroadcastss  0x2d4b6(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,0,208,2,0           ; vbroadcastss  0x2d000(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
 
 PUBLIC _sk_mirror_x_1_hsw
 _sk_mirror_x_1_hsw LABEL PROC
-  DB  196,98,125,24,5,188,212,2,0         ; vbroadcastss  0x2d4bc(%rip),%ymm8        # 334e4 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
+  DB  196,98,125,24,5,6,208,2,0           ; vbroadcastss  0x2d006(%rip),%ymm8        # 32eb8 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
   DB  196,193,124,88,192                  ; vaddps        %ymm8,%ymm0,%ymm0
-  DB  196,98,125,24,13,146,212,2,0        ; vbroadcastss  0x2d492(%rip),%ymm9        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,13,220,207,2,0        ; vbroadcastss  0x2cfdc(%rip),%ymm9        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,65,124,89,201                   ; vmulps        %ymm9,%ymm0,%ymm9
   DB  196,67,125,8,201,1                  ; vroundps      $0x1,%ymm9,%ymm9
   DB  196,65,52,88,201                    ; vaddps        %ymm9,%ymm9,%ymm9
@@ -5819,18 +5745,18 @@
   DB  197,60,92,200                       ; vsubps        %ymm0,%ymm8,%ymm9
   DB  197,180,84,192                      ; vandps        %ymm0,%ymm9,%ymm0
   DB  197,188,95,192                      ; vmaxps        %ymm0,%ymm8,%ymm0
-  DB  196,98,125,24,5,98,212,2,0          ; vbroadcastss  0x2d462(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,172,207,2,0         ; vbroadcastss  0x2cfac(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
 
 PUBLIC _sk_luminance_to_alpha_hsw
 _sk_luminance_to_alpha_hsw LABEL PROC
-  DB  196,226,125,24,29,112,213,2,0       ; vbroadcastss  0x2d570(%rip),%ymm3        # 335ec <_sk_srcover_bgra_8888_sse2_lowp+0x3d0>
-  DB  196,98,125,24,5,107,213,2,0         ; vbroadcastss  0x2d56b(%rip),%ymm8        # 335f0 <_sk_srcover_bgra_8888_sse2_lowp+0x3d4>
+  DB  196,226,125,24,29,186,208,2,0       ; vbroadcastss  0x2d0ba(%rip),%ymm3        # 32fc0 <_sk_srcover_bgra_8888_sse2_lowp+0x3d0>
+  DB  196,98,125,24,5,181,208,2,0         ; vbroadcastss  0x2d0b5(%rip),%ymm8        # 32fc4 <_sk_srcover_bgra_8888_sse2_lowp+0x3d4>
   DB  196,193,116,89,200                  ; vmulps        %ymm8,%ymm1,%ymm1
   DB  196,226,125,184,203                 ; vfmadd231ps   %ymm3,%ymm0,%ymm1
-  DB  196,226,125,24,29,92,213,2,0        ; vbroadcastss  0x2d55c(%rip),%ymm3        # 335f4 <_sk_srcover_bgra_8888_sse2_lowp+0x3d8>
+  DB  196,226,125,24,29,166,208,2,0       ; vbroadcastss  0x2d0a6(%rip),%ymm3        # 32fc8 <_sk_srcover_bgra_8888_sse2_lowp+0x3d8>
   DB  196,226,109,168,217                 ; vfmadd213ps   %ymm1,%ymm2,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
@@ -6013,9 +5939,9 @@
   DB  76,139,64,8                         ; mov           0x8(%rax),%r8
   DB  77,137,202                          ; mov           %r9,%r10
   DB  73,255,202                          ; dec           %r10
-  DB  120,7                               ; js            6390 <_sk_evenly_spaced_gradient_hsw+0x18>
+  DB  120,7                               ; js            621a <_sk_evenly_spaced_gradient_hsw+0x18>
   DB  196,193,242,42,202                  ; vcvtsi2ss     %r10,%xmm1,%xmm1
-  DB  235,22                              ; jmp           63a6 <_sk_evenly_spaced_gradient_hsw+0x2e>
+  DB  235,22                              ; jmp           6230 <_sk_evenly_spaced_gradient_hsw+0x2e>
   DB  77,137,211                          ; mov           %r10,%r11
   DB  73,209,235                          ; shr           %r11
   DB  65,131,226,1                        ; and           $0x1,%r10d
@@ -6026,7 +5952,7 @@
   DB  197,244,89,200                      ; vmulps        %ymm0,%ymm1,%ymm1
   DB  197,126,91,225                      ; vcvttps2dq    %ymm1,%ymm12
   DB  73,131,249,8                        ; cmp           $0x8,%r9
-  DB  119,73                              ; ja            6402 <_sk_evenly_spaced_gradient_hsw+0x8a>
+  DB  119,73                              ; ja            628c <_sk_evenly_spaced_gradient_hsw+0x8a>
   DB  196,66,29,22,0                      ; vpermps       (%r8),%ymm12,%ymm8
   DB  76,139,64,40                        ; mov           0x28(%rax),%r8
   DB  196,66,29,22,8                      ; vpermps       (%r8),%ymm12,%ymm9
@@ -6042,7 +5968,7 @@
   DB  196,194,29,22,24                    ; vpermps       (%r8),%ymm12,%ymm3
   DB  72,139,64,64                        ; mov           0x40(%rax),%rax
   DB  196,98,29,22,16                     ; vpermps       (%rax),%ymm12,%ymm10
-  DB  233,147,0,0,0                       ; jmpq          6495 <_sk_evenly_spaced_gradient_hsw+0x11d>
+  DB  233,147,0,0,0                       ; jmpq          631f <_sk_evenly_spaced_gradient_hsw+0x11d>
   DB  196,65,13,118,246                   ; vpcmpeqd      %ymm14,%ymm14,%ymm14
   DB  196,65,44,87,210                    ; vxorps        %ymm10,%ymm10,%ymm10
   DB  197,245,118,201                     ; vpcmpeqd      %ymm1,%ymm1,%ymm1
@@ -6087,11 +6013,11 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  73,131,248,1                        ; cmp           $0x1,%r8
-  DB  15,134,220,0,0,0                    ; jbe           659c <_sk_gradient_hsw+0xeb>
+  DB  15,134,220,0,0,0                    ; jbe           6426 <_sk_gradient_hsw+0xeb>
   DB  76,139,72,72                        ; mov           0x48(%rax),%r9
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  65,186,1,0,0,0                      ; mov           $0x1,%r10d
-  DB  196,226,125,24,21,249,207,2,0       ; vbroadcastss  0x2cff9(%rip),%ymm2        # 334d0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b4>
+  DB  196,226,125,24,21,67,203,2,0        ; vbroadcastss  0x2cb43(%rip),%ymm2        # 32ea4 <_sk_srcover_bgra_8888_sse2_lowp+0x2b4>
   DB  196,65,53,239,201                   ; vpxor         %ymm9,%ymm9,%ymm9
   DB  196,130,125,24,28,145               ; vbroadcastss  (%r9,%r10,4),%ymm3
   DB  197,228,194,216,2                   ; vcmpleps      %ymm0,%ymm3,%ymm3
@@ -6099,10 +6025,10 @@
   DB  197,53,254,203                      ; vpaddd        %ymm3,%ymm9,%ymm9
   DB  73,255,194                          ; inc           %r10
   DB  77,57,208                           ; cmp           %r10,%r8
-  DB  117,227                             ; jne           64dc <_sk_gradient_hsw+0x2b>
+  DB  117,227                             ; jne           6366 <_sk_gradient_hsw+0x2b>
   DB  76,139,72,8                         ; mov           0x8(%rax),%r9
   DB  73,131,248,8                        ; cmp           $0x8,%r8
-  DB  15,134,158,0,0,0                    ; jbe           65a5 <_sk_gradient_hsw+0xf4>
+  DB  15,134,158,0,0,0                    ; jbe           642f <_sk_gradient_hsw+0xf4>
   DB  196,65,13,118,246                   ; vpcmpeqd      %ymm14,%ymm14,%ymm14
   DB  196,65,36,87,219                    ; vxorps        %ymm11,%ymm11,%ymm11
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
@@ -6134,7 +6060,7 @@
   DB  196,130,5,146,28,136                ; vgatherdps    %ymm15,(%r8,%ymm9,4),%ymm3
   DB  72,139,64,64                        ; mov           0x40(%rax),%rax
   DB  196,34,13,146,28,136                ; vgatherdps    %ymm14,(%rax,%ymm9,4),%ymm11
-  DB  235,77                              ; jmp           65e9 <_sk_gradient_hsw+0x138>
+  DB  235,77                              ; jmp           6473 <_sk_gradient_hsw+0x138>
   DB  76,139,72,8                         ; mov           0x8(%rax),%r9
   DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
   DB  196,66,53,22,1                      ; vpermps       (%r9),%ymm9,%ymm8
@@ -6190,24 +6116,24 @@
   DB  196,65,52,95,226                    ; vmaxps        %ymm10,%ymm9,%ymm12
   DB  196,65,36,94,220                    ; vdivps        %ymm12,%ymm11,%ymm11
   DB  196,65,36,89,227                    ; vmulps        %ymm11,%ymm11,%ymm12
-  DB  196,98,125,24,45,116,207,2,0        ; vbroadcastss  0x2cf74(%rip),%ymm13        # 335f8 <_sk_srcover_bgra_8888_sse2_lowp+0x3dc>
-  DB  196,98,125,24,53,111,207,2,0        ; vbroadcastss  0x2cf6f(%rip),%ymm14        # 335fc <_sk_srcover_bgra_8888_sse2_lowp+0x3e0>
+  DB  196,98,125,24,45,190,202,2,0        ; vbroadcastss  0x2cabe(%rip),%ymm13        # 32fcc <_sk_srcover_bgra_8888_sse2_lowp+0x3dc>
+  DB  196,98,125,24,53,185,202,2,0        ; vbroadcastss  0x2cab9(%rip),%ymm14        # 32fd0 <_sk_srcover_bgra_8888_sse2_lowp+0x3e0>
   DB  196,66,29,184,245                   ; vfmadd231ps   %ymm13,%ymm12,%ymm14
-  DB  196,98,125,24,45,101,207,2,0        ; vbroadcastss  0x2cf65(%rip),%ymm13        # 33600 <_sk_srcover_bgra_8888_sse2_lowp+0x3e4>
+  DB  196,98,125,24,45,175,202,2,0        ; vbroadcastss  0x2caaf(%rip),%ymm13        # 32fd4 <_sk_srcover_bgra_8888_sse2_lowp+0x3e4>
   DB  196,66,29,184,238                   ; vfmadd231ps   %ymm14,%ymm12,%ymm13
-  DB  196,98,125,24,53,91,207,2,0         ; vbroadcastss  0x2cf5b(%rip),%ymm14        # 33604 <_sk_srcover_bgra_8888_sse2_lowp+0x3e8>
+  DB  196,98,125,24,53,165,202,2,0        ; vbroadcastss  0x2caa5(%rip),%ymm14        # 32fd8 <_sk_srcover_bgra_8888_sse2_lowp+0x3e8>
   DB  196,66,29,184,245                   ; vfmadd231ps   %ymm13,%ymm12,%ymm14
   DB  196,65,36,89,222                    ; vmulps        %ymm14,%ymm11,%ymm11
   DB  196,65,52,194,202,1                 ; vcmpltps      %ymm10,%ymm9,%ymm9
-  DB  196,98,125,24,21,70,207,2,0         ; vbroadcastss  0x2cf46(%rip),%ymm10        # 33608 <_sk_srcover_bgra_8888_sse2_lowp+0x3ec>
+  DB  196,98,125,24,21,144,202,2,0        ; vbroadcastss  0x2ca90(%rip),%ymm10        # 32fdc <_sk_srcover_bgra_8888_sse2_lowp+0x3ec>
   DB  196,65,44,92,211                    ; vsubps        %ymm11,%ymm10,%ymm10
   DB  196,67,37,74,202,144                ; vblendvps     %ymm9,%ymm10,%ymm11,%ymm9
   DB  196,193,124,194,192,1               ; vcmpltps      %ymm8,%ymm0,%ymm0
-  DB  196,98,125,24,21,236,205,2,0        ; vbroadcastss  0x2cdec(%rip),%ymm10        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,21,54,201,2,0         ; vbroadcastss  0x2c936(%rip),%ymm10        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,65,44,92,209                    ; vsubps        %ymm9,%ymm10,%ymm10
   DB  196,195,53,74,194,0                 ; vblendvps     %ymm0,%ymm10,%ymm9,%ymm0
   DB  196,65,116,194,200,1                ; vcmpltps      %ymm8,%ymm1,%ymm9
-  DB  196,98,125,24,21,214,205,2,0        ; vbroadcastss  0x2cdd6(%rip),%ymm10        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,21,32,201,2,0         ; vbroadcastss  0x2c920(%rip),%ymm10        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,44,92,208                       ; vsubps        %ymm0,%ymm10,%ymm10
   DB  196,195,125,74,194,144              ; vblendvps     %ymm9,%ymm10,%ymm0,%ymm0
   DB  196,65,124,194,200,3                ; vcmpunordps   %ymm8,%ymm0,%ymm9
@@ -6225,7 +6151,7 @@
 
 PUBLIC _sk_negate_x_hsw
 _sk_negate_x_hsw LABEL PROC
-  DB  196,98,125,24,5,225,206,2,0         ; vbroadcastss  0x2cee1(%rip),%ymm8        # 3360c <_sk_srcover_bgra_8888_sse2_lowp+0x3f0>
+  DB  196,98,125,24,5,43,202,2,0          ; vbroadcastss  0x2ca2b(%rip),%ymm8        # 32fe0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f0>
   DB  196,193,124,87,192                  ; vxorps        %ymm8,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -6291,7 +6217,7 @@
 
 PUBLIC _sk_alter_2pt_conical_unswap_hsw
 _sk_alter_2pt_conical_unswap_hsw LABEL PROC
-  DB  196,98,125,24,5,248,204,2,0         ; vbroadcastss  0x2ccf8(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,66,200,2,0          ; vbroadcastss  0x2c842(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,188,92,192                      ; vsubps        %ymm0,%ymm8,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -6334,7 +6260,7 @@
 PUBLIC _sk_save_xy_hsw
 _sk_save_xy_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,98,125,24,5,124,204,2,0         ; vbroadcastss  0x2cc7c(%rip),%ymm8        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,5,198,199,2,0         ; vbroadcastss  0x2c7c6(%rip),%ymm8        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,65,124,88,200                   ; vaddps        %ymm8,%ymm0,%ymm9
   DB  196,67,125,8,209,1                  ; vroundps      $0x1,%ymm9,%ymm10
   DB  196,65,52,92,202                    ; vsubps        %ymm10,%ymm9,%ymm9
@@ -6364,9 +6290,9 @@
 PUBLIC _sk_bilinear_nx_hsw
 _sk_bilinear_nx_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,78,205,2,0         ; vbroadcastss  0x2cd4e(%rip),%ymm0        # 33610 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  DB  196,226,125,24,5,152,200,2,0        ; vbroadcastss  0x2c898(%rip),%ymm0        # 32fe4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   DB  197,252,88,0                        ; vaddps        (%rax),%ymm0,%ymm0
-  DB  196,98,125,24,5,253,203,2,0         ; vbroadcastss  0x2cbfd(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,71,199,2,0          ; vbroadcastss  0x2c747(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,128,128,0,0,0             ; vsubps        0x80(%rax),%ymm8,%ymm8
   DB  197,124,17,128,0,1,0,0              ; vmovups       %ymm8,0x100(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -6375,7 +6301,7 @@
 PUBLIC _sk_bilinear_px_hsw
 _sk_bilinear_px_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,218,203,2,0        ; vbroadcastss  0x2cbda(%rip),%ymm0        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,226,125,24,5,36,199,2,0         ; vbroadcastss  0x2c724(%rip),%ymm0        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  197,252,88,0                        ; vaddps        (%rax),%ymm0,%ymm0
   DB  197,124,16,128,128,0,0,0            ; vmovups       0x80(%rax),%ymm8
   DB  197,124,17,128,0,1,0,0              ; vmovups       %ymm8,0x100(%rax)
@@ -6385,9 +6311,9 @@
 PUBLIC _sk_bilinear_ny_hsw
 _sk_bilinear_ny_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,13,255,204,2,0       ; vbroadcastss  0x2ccff(%rip),%ymm1        # 33610 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  DB  196,226,125,24,13,73,200,2,0        ; vbroadcastss  0x2c849(%rip),%ymm1        # 32fe4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   DB  197,244,88,72,64                    ; vaddps        0x40(%rax),%ymm1,%ymm1
-  DB  196,98,125,24,5,173,203,2,0         ; vbroadcastss  0x2cbad(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,247,198,2,0         ; vbroadcastss  0x2c6f7(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,128,192,0,0,0             ; vsubps        0xc0(%rax),%ymm8,%ymm8
   DB  197,124,17,128,64,1,0,0             ; vmovups       %ymm8,0x140(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -6396,7 +6322,7 @@
 PUBLIC _sk_bilinear_py_hsw
 _sk_bilinear_py_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,13,138,203,2,0       ; vbroadcastss  0x2cb8a(%rip),%ymm1        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,226,125,24,13,212,198,2,0       ; vbroadcastss  0x2c6d4(%rip),%ymm1        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  197,244,88,72,64                    ; vaddps        0x40(%rax),%ymm1,%ymm1
   DB  197,124,16,128,192,0,0,0            ; vmovups       0xc0(%rax),%ymm8
   DB  197,124,17,128,64,1,0,0             ; vmovups       %ymm8,0x140(%rax)
@@ -6406,13 +6332,13 @@
 PUBLIC _sk_bicubic_n3x_hsw
 _sk_bicubic_n3x_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,178,204,2,0        ; vbroadcastss  0x2ccb2(%rip),%ymm0        # 33614 <_sk_srcover_bgra_8888_sse2_lowp+0x3f8>
+  DB  196,226,125,24,5,252,199,2,0        ; vbroadcastss  0x2c7fc(%rip),%ymm0        # 32fe8 <_sk_srcover_bgra_8888_sse2_lowp+0x3f8>
   DB  197,252,88,0                        ; vaddps        (%rax),%ymm0,%ymm0
-  DB  196,98,125,24,5,93,203,2,0          ; vbroadcastss  0x2cb5d(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,167,198,2,0         ; vbroadcastss  0x2c6a7(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,128,128,0,0,0             ; vsubps        0x80(%rax),%ymm8,%ymm8
   DB  196,65,60,89,200                    ; vmulps        %ymm8,%ymm8,%ymm9
-  DB  196,98,125,24,21,187,203,2,0        ; vbroadcastss  0x2cbbb(%rip),%ymm10        # 33540 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
-  DB  196,98,125,24,29,138,204,2,0        ; vbroadcastss  0x2cc8a(%rip),%ymm11        # 33618 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
+  DB  196,98,125,24,21,5,199,2,0          ; vbroadcastss  0x2c705(%rip),%ymm10        # 32f14 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  DB  196,98,125,24,29,212,199,2,0        ; vbroadcastss  0x2c7d4(%rip),%ymm11        # 32fec <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
   DB  196,66,61,168,218                   ; vfmadd213ps   %ymm10,%ymm8,%ymm11
   DB  196,65,36,89,193                    ; vmulps        %ymm9,%ymm11,%ymm8
   DB  197,124,17,128,0,1,0,0              ; vmovups       %ymm8,0x100(%rax)
@@ -6422,16 +6348,16 @@
 PUBLIC _sk_bicubic_n1x_hsw
 _sk_bicubic_n1x_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,97,204,2,0         ; vbroadcastss  0x2cc61(%rip),%ymm0        # 33610 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  DB  196,226,125,24,5,171,199,2,0        ; vbroadcastss  0x2c7ab(%rip),%ymm0        # 32fe4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   DB  197,252,88,0                        ; vaddps        (%rax),%ymm0,%ymm0
-  DB  196,98,125,24,5,16,203,2,0          ; vbroadcastss  0x2cb10(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,90,198,2,0          ; vbroadcastss  0x2c65a(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,128,128,0,0,0             ; vsubps        0x80(%rax),%ymm8,%ymm8
-  DB  196,98,125,24,13,79,204,2,0         ; vbroadcastss  0x2cc4f(%rip),%ymm9        # 3361c <_sk_srcover_bgra_8888_sse2_lowp+0x400>
-  DB  196,98,125,24,21,74,204,2,0         ; vbroadcastss  0x2cc4a(%rip),%ymm10        # 33620 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  DB  196,98,125,24,13,153,199,2,0        ; vbroadcastss  0x2c799(%rip),%ymm9        # 32ff0 <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  DB  196,98,125,24,21,148,199,2,0        ; vbroadcastss  0x2c794(%rip),%ymm10        # 32ff4 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
   DB  196,66,61,168,209                   ; vfmadd213ps   %ymm9,%ymm8,%ymm10
-  DB  196,98,125,24,13,228,202,2,0        ; vbroadcastss  0x2cae4(%rip),%ymm9        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,13,46,198,2,0         ; vbroadcastss  0x2c62e(%rip),%ymm9        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,66,61,184,202                   ; vfmadd231ps   %ymm10,%ymm8,%ymm9
-  DB  196,98,125,24,21,50,204,2,0         ; vbroadcastss  0x2cc32(%rip),%ymm10        # 33624 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
+  DB  196,98,125,24,21,124,199,2,0        ; vbroadcastss  0x2c77c(%rip),%ymm10        # 32ff8 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
   DB  196,66,61,184,209                   ; vfmadd231ps   %ymm9,%ymm8,%ymm10
   DB  197,124,17,144,0,1,0,0              ; vmovups       %ymm10,0x100(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -6440,14 +6366,14 @@
 PUBLIC _sk_bicubic_p1x_hsw
 _sk_bicubic_p1x_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,98,125,24,5,186,202,2,0         ; vbroadcastss  0x2caba(%rip),%ymm8        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,5,4,198,2,0           ; vbroadcastss  0x2c604(%rip),%ymm8        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  197,188,88,0                        ; vaddps        (%rax),%ymm8,%ymm0
   DB  197,124,16,136,128,0,0,0            ; vmovups       0x80(%rax),%ymm9
-  DB  196,98,125,24,21,249,203,2,0        ; vbroadcastss  0x2cbf9(%rip),%ymm10        # 3361c <_sk_srcover_bgra_8888_sse2_lowp+0x400>
-  DB  196,98,125,24,29,244,203,2,0        ; vbroadcastss  0x2cbf4(%rip),%ymm11        # 33620 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  DB  196,98,125,24,21,67,199,2,0         ; vbroadcastss  0x2c743(%rip),%ymm10        # 32ff0 <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  DB  196,98,125,24,29,62,199,2,0         ; vbroadcastss  0x2c73e(%rip),%ymm11        # 32ff4 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
   DB  196,66,53,168,218                   ; vfmadd213ps   %ymm10,%ymm9,%ymm11
   DB  196,66,53,168,216                   ; vfmadd213ps   %ymm8,%ymm9,%ymm11
-  DB  196,98,125,24,5,229,203,2,0         ; vbroadcastss  0x2cbe5(%rip),%ymm8        # 33624 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
+  DB  196,98,125,24,5,47,199,2,0          ; vbroadcastss  0x2c72f(%rip),%ymm8        # 32ff8 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
   DB  196,66,53,184,195                   ; vfmadd231ps   %ymm11,%ymm9,%ymm8
   DB  197,124,17,128,0,1,0,0              ; vmovups       %ymm8,0x100(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -6456,12 +6382,12 @@
 PUBLIC _sk_bicubic_p3x_hsw
 _sk_bicubic_p3x_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,193,203,2,0        ; vbroadcastss  0x2cbc1(%rip),%ymm0        # 3361c <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  DB  196,226,125,24,5,11,199,2,0         ; vbroadcastss  0x2c70b(%rip),%ymm0        # 32ff0 <_sk_srcover_bgra_8888_sse2_lowp+0x400>
   DB  197,252,88,0                        ; vaddps        (%rax),%ymm0,%ymm0
   DB  197,124,16,128,128,0,0,0            ; vmovups       0x80(%rax),%ymm8
   DB  196,65,60,89,200                    ; vmulps        %ymm8,%ymm8,%ymm9
-  DB  196,98,125,24,21,203,202,2,0        ; vbroadcastss  0x2cacb(%rip),%ymm10        # 33540 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
-  DB  196,98,125,24,29,154,203,2,0        ; vbroadcastss  0x2cb9a(%rip),%ymm11        # 33618 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
+  DB  196,98,125,24,21,21,198,2,0         ; vbroadcastss  0x2c615(%rip),%ymm10        # 32f14 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  DB  196,98,125,24,29,228,198,2,0        ; vbroadcastss  0x2c6e4(%rip),%ymm11        # 32fec <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
   DB  196,66,61,168,218                   ; vfmadd213ps   %ymm10,%ymm8,%ymm11
   DB  196,65,52,89,195                    ; vmulps        %ymm11,%ymm9,%ymm8
   DB  197,124,17,128,0,1,0,0              ; vmovups       %ymm8,0x100(%rax)
@@ -6471,13 +6397,13 @@
 PUBLIC _sk_bicubic_n3y_hsw
 _sk_bicubic_n3y_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,13,117,203,2,0       ; vbroadcastss  0x2cb75(%rip),%ymm1        # 33614 <_sk_srcover_bgra_8888_sse2_lowp+0x3f8>
+  DB  196,226,125,24,13,191,198,2,0       ; vbroadcastss  0x2c6bf(%rip),%ymm1        # 32fe8 <_sk_srcover_bgra_8888_sse2_lowp+0x3f8>
   DB  197,244,88,72,64                    ; vaddps        0x40(%rax),%ymm1,%ymm1
-  DB  196,98,125,24,5,31,202,2,0          ; vbroadcastss  0x2ca1f(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,105,197,2,0         ; vbroadcastss  0x2c569(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,128,192,0,0,0             ; vsubps        0xc0(%rax),%ymm8,%ymm8
   DB  196,65,60,89,200                    ; vmulps        %ymm8,%ymm8,%ymm9
-  DB  196,98,125,24,21,125,202,2,0        ; vbroadcastss  0x2ca7d(%rip),%ymm10        # 33540 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
-  DB  196,98,125,24,29,76,203,2,0         ; vbroadcastss  0x2cb4c(%rip),%ymm11        # 33618 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
+  DB  196,98,125,24,21,199,197,2,0        ; vbroadcastss  0x2c5c7(%rip),%ymm10        # 32f14 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  DB  196,98,125,24,29,150,198,2,0        ; vbroadcastss  0x2c696(%rip),%ymm11        # 32fec <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
   DB  196,66,61,168,218                   ; vfmadd213ps   %ymm10,%ymm8,%ymm11
   DB  196,65,36,89,193                    ; vmulps        %ymm9,%ymm11,%ymm8
   DB  197,124,17,128,64,1,0,0             ; vmovups       %ymm8,0x140(%rax)
@@ -6487,16 +6413,16 @@
 PUBLIC _sk_bicubic_n1y_hsw
 _sk_bicubic_n1y_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,13,35,203,2,0        ; vbroadcastss  0x2cb23(%rip),%ymm1        # 33610 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  DB  196,226,125,24,13,109,198,2,0       ; vbroadcastss  0x2c66d(%rip),%ymm1        # 32fe4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   DB  197,244,88,72,64                    ; vaddps        0x40(%rax),%ymm1,%ymm1
-  DB  196,98,125,24,5,209,201,2,0         ; vbroadcastss  0x2c9d1(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,27,197,2,0          ; vbroadcastss  0x2c51b(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,128,192,0,0,0             ; vsubps        0xc0(%rax),%ymm8,%ymm8
-  DB  196,98,125,24,13,16,203,2,0         ; vbroadcastss  0x2cb10(%rip),%ymm9        # 3361c <_sk_srcover_bgra_8888_sse2_lowp+0x400>
-  DB  196,98,125,24,21,11,203,2,0         ; vbroadcastss  0x2cb0b(%rip),%ymm10        # 33620 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  DB  196,98,125,24,13,90,198,2,0         ; vbroadcastss  0x2c65a(%rip),%ymm9        # 32ff0 <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  DB  196,98,125,24,21,85,198,2,0         ; vbroadcastss  0x2c655(%rip),%ymm10        # 32ff4 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
   DB  196,66,61,168,209                   ; vfmadd213ps   %ymm9,%ymm8,%ymm10
-  DB  196,98,125,24,13,165,201,2,0        ; vbroadcastss  0x2c9a5(%rip),%ymm9        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,13,239,196,2,0        ; vbroadcastss  0x2c4ef(%rip),%ymm9        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,66,61,184,202                   ; vfmadd231ps   %ymm10,%ymm8,%ymm9
-  DB  196,98,125,24,21,243,202,2,0        ; vbroadcastss  0x2caf3(%rip),%ymm10        # 33624 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
+  DB  196,98,125,24,21,61,198,2,0         ; vbroadcastss  0x2c63d(%rip),%ymm10        # 32ff8 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
   DB  196,66,61,184,209                   ; vfmadd231ps   %ymm9,%ymm8,%ymm10
   DB  197,124,17,144,64,1,0,0             ; vmovups       %ymm10,0x140(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -6505,14 +6431,14 @@
 PUBLIC _sk_bicubic_p1y_hsw
 _sk_bicubic_p1y_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,98,125,24,5,123,201,2,0         ; vbroadcastss  0x2c97b(%rip),%ymm8        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,5,197,196,2,0         ; vbroadcastss  0x2c4c5(%rip),%ymm8        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  197,188,88,72,64                    ; vaddps        0x40(%rax),%ymm8,%ymm1
   DB  197,124,16,136,192,0,0,0            ; vmovups       0xc0(%rax),%ymm9
-  DB  196,98,125,24,21,185,202,2,0        ; vbroadcastss  0x2cab9(%rip),%ymm10        # 3361c <_sk_srcover_bgra_8888_sse2_lowp+0x400>
-  DB  196,98,125,24,29,180,202,2,0        ; vbroadcastss  0x2cab4(%rip),%ymm11        # 33620 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  DB  196,98,125,24,21,3,198,2,0          ; vbroadcastss  0x2c603(%rip),%ymm10        # 32ff0 <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  DB  196,98,125,24,29,254,197,2,0        ; vbroadcastss  0x2c5fe(%rip),%ymm11        # 32ff4 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
   DB  196,66,53,168,218                   ; vfmadd213ps   %ymm10,%ymm9,%ymm11
   DB  196,66,53,168,216                   ; vfmadd213ps   %ymm8,%ymm9,%ymm11
-  DB  196,98,125,24,5,165,202,2,0         ; vbroadcastss  0x2caa5(%rip),%ymm8        # 33624 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
+  DB  196,98,125,24,5,239,197,2,0         ; vbroadcastss  0x2c5ef(%rip),%ymm8        # 32ff8 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
   DB  196,66,53,184,195                   ; vfmadd231ps   %ymm11,%ymm9,%ymm8
   DB  197,124,17,128,64,1,0,0             ; vmovups       %ymm8,0x140(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -6521,12 +6447,12 @@
 PUBLIC _sk_bicubic_p3y_hsw
 _sk_bicubic_p3y_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,13,129,202,2,0       ; vbroadcastss  0x2ca81(%rip),%ymm1        # 3361c <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  DB  196,226,125,24,13,203,197,2,0       ; vbroadcastss  0x2c5cb(%rip),%ymm1        # 32ff0 <_sk_srcover_bgra_8888_sse2_lowp+0x400>
   DB  197,244,88,72,64                    ; vaddps        0x40(%rax),%ymm1,%ymm1
   DB  197,124,16,128,192,0,0,0            ; vmovups       0xc0(%rax),%ymm8
   DB  196,65,60,89,200                    ; vmulps        %ymm8,%ymm8,%ymm9
-  DB  196,98,125,24,21,138,201,2,0        ; vbroadcastss  0x2c98a(%rip),%ymm10        # 33540 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
-  DB  196,98,125,24,29,89,202,2,0         ; vbroadcastss  0x2ca59(%rip),%ymm11        # 33618 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
+  DB  196,98,125,24,21,212,196,2,0        ; vbroadcastss  0x2c4d4(%rip),%ymm10        # 32f14 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  DB  196,98,125,24,29,163,197,2,0        ; vbroadcastss  0x2c5a3(%rip),%ymm11        # 32fec <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
   DB  196,66,61,168,218                   ; vfmadd213ps   %ymm10,%ymm8,%ymm11
   DB  196,65,52,89,195                    ; vmulps        %ymm11,%ymm9,%ymm8
   DB  197,124,17,128,64,1,0,0             ; vmovups       %ymm8,0x140(%rax)
@@ -6654,7 +6580,7 @@
   DB  196,98,93,64,218                    ; vpmulld       %ymm2,%ymm4,%ymm11
   DB  72,139,0                            ; mov           (%rax),%rax
   DB  197,165,254,193                     ; vpaddd        %ymm1,%ymm11,%ymm0
-  DB  196,98,125,88,61,40,200,2,0         ; vpbroadcastd  0x2c828(%rip),%ymm15        # 3362c <_sk_srcover_bgra_8888_sse2_lowp+0x410>
+  DB  196,98,125,88,61,114,195,2,0        ; vpbroadcastd  0x2c372(%rip),%ymm15        # 33000 <_sk_srcover_bgra_8888_sse2_lowp+0x410>
   DB  196,194,125,64,199                  ; vpmulld       %ymm15,%ymm0,%ymm0
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
   DB  197,237,118,210                     ; vpcmpeqd      %ymm2,%ymm2,%ymm2
@@ -6666,13 +6592,13 @@
   DB  197,213,118,237                     ; vpcmpeqd      %ymm5,%ymm5,%ymm5
   DB  196,226,85,146,60,144               ; vgatherdps    %ymm5,(%rax,%ymm2,4),%ymm7
   DB  197,252,17,188,36,128,2,0,0         ; vmovups       %ymm7,0x280(%rsp)
-  DB  196,226,125,88,61,142,198,2,0       ; vpbroadcastd  0x2c68e(%rip),%ymm7        # 334d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
+  DB  196,226,125,88,61,216,193,2,0       ; vpbroadcastd  0x2c1d8(%rip),%ymm7        # 32eac <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
   DB  197,253,254,199                     ; vpaddd        %ymm7,%ymm0,%ymm0
   DB  197,236,87,210                      ; vxorps        %ymm2,%ymm2,%ymm2
   DB  197,213,118,237                     ; vpcmpeqd      %ymm5,%ymm5,%ymm5
   DB  196,226,85,146,20,128               ; vgatherdps    %ymm5,(%rax,%ymm0,4),%ymm2
   DB  197,252,17,148,36,160,1,0,0         ; vmovups       %ymm2,0x1a0(%rsp)
-  DB  196,226,125,24,5,186,199,2,0        ; vbroadcastss  0x2c7ba(%rip),%ymm0        # 33628 <_sk_srcover_bgra_8888_sse2_lowp+0x40c>
+  DB  196,226,125,24,5,4,195,2,0          ; vbroadcastss  0x2c304(%rip),%ymm0        # 32ffc <_sk_srcover_bgra_8888_sse2_lowp+0x40c>
   DB  197,172,88,232                      ; vaddps        %ymm0,%ymm10,%ymm5
   DB  197,254,91,237                      ; vcvttps2dq    %ymm5,%ymm5
   DB  196,226,93,64,213                   ; vpmulld       %ymm5,%ymm4,%ymm2
@@ -6932,7 +6858,7 @@
   DB  197,254,127,132,36,128,1,0,0        ; vmovdqu       %ymm0,0x180(%rsp)
   DB  196,98,109,64,200                   ; vpmulld       %ymm0,%ymm2,%ymm9
   DB  197,181,254,199                     ; vpaddd        %ymm7,%ymm9,%ymm0
-  DB  196,98,125,88,21,60,194,2,0         ; vpbroadcastd  0x2c23c(%rip),%ymm10        # 3362c <_sk_srcover_bgra_8888_sse2_lowp+0x410>
+  DB  196,98,125,88,21,134,189,2,0        ; vpbroadcastd  0x2bd86(%rip),%ymm10        # 33000 <_sk_srcover_bgra_8888_sse2_lowp+0x410>
   DB  196,194,125,64,194                  ; vpmulld       %ymm10,%ymm0,%ymm0
   DB  197,213,118,237                     ; vpcmpeqd      %ymm5,%ymm5,%ymm5
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
@@ -6944,13 +6870,13 @@
   DB  196,65,36,87,219                    ; vxorps        %ymm11,%ymm11,%ymm11
   DB  196,98,61,146,28,168                ; vgatherdps    %ymm8,(%rax,%ymm5,4),%ymm11
   DB  197,124,17,156,36,64,1,0,0          ; vmovups       %ymm11,0x140(%rsp)
-  DB  196,98,125,88,29,159,192,2,0        ; vpbroadcastd  0x2c09f(%rip),%ymm11        # 334d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
+  DB  196,98,125,88,29,233,187,2,0        ; vpbroadcastd  0x2bbe9(%rip),%ymm11        # 32eac <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
   DB  196,193,125,254,195                 ; vpaddd        %ymm11,%ymm0,%ymm0
   DB  196,65,61,118,192                   ; vpcmpeqd      %ymm8,%ymm8,%ymm8
   DB  197,212,87,237                      ; vxorps        %ymm5,%ymm5,%ymm5
   DB  196,226,61,146,44,128               ; vgatherdps    %ymm8,(%rax,%ymm0,4),%ymm5
   DB  197,252,17,172,36,160,0,0,0         ; vmovups       %ymm5,0xa0(%rsp)
-  DB  196,226,125,24,5,201,193,2,0        ; vbroadcastss  0x2c1c9(%rip),%ymm0        # 33628 <_sk_srcover_bgra_8888_sse2_lowp+0x40c>
+  DB  196,226,125,24,5,19,189,2,0         ; vbroadcastss  0x2bd13(%rip),%ymm0        # 32ffc <_sk_srcover_bgra_8888_sse2_lowp+0x40c>
   DB  197,116,88,192                      ; vaddps        %ymm0,%ymm1,%ymm8
   DB  196,65,126,91,192                   ; vcvttps2dq    %ymm8,%ymm8
   DB  196,194,109,64,232                  ; vpmulld       %ymm8,%ymm2,%ymm5
@@ -7383,7 +7309,7 @@
   DB  196,193,100,92,210                  ; vsubps        %ymm10,%ymm3,%ymm2
   DB  196,194,77,168,210                  ; vfmadd213ps   %ymm10,%ymm6,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,145,182,2,0       ; vbroadcastss  0x2b691(%rip),%ymm3        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,29,219,177,2,0       ; vbroadcastss  0x2b1db(%rip),%ymm3        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,252,16,164,36,224,6,0,0         ; vmovups       0x6e0(%rsp),%ymm4
   DB  197,252,16,172,36,0,7,0,0           ; vmovups       0x700(%rsp),%ymm5
   DB  197,252,16,180,36,32,7,0,0          ; vmovups       0x720(%rsp),%ymm6
@@ -7393,14 +7319,14 @@
 
 PUBLIC _sk_gauss_a_to_rgba_hsw
 _sk_gauss_a_to_rgba_hsw LABEL PROC
-  DB  196,226,125,24,5,191,183,2,0        ; vbroadcastss  0x2b7bf(%rip),%ymm0        # 33630 <_sk_srcover_bgra_8888_sse2_lowp+0x414>
-  DB  196,226,125,24,13,186,183,2,0       ; vbroadcastss  0x2b7ba(%rip),%ymm1        # 33634 <_sk_srcover_bgra_8888_sse2_lowp+0x418>
+  DB  196,226,125,24,5,9,179,2,0          ; vbroadcastss  0x2b309(%rip),%ymm0        # 33004 <_sk_srcover_bgra_8888_sse2_lowp+0x414>
+  DB  196,226,125,24,13,4,179,2,0         ; vbroadcastss  0x2b304(%rip),%ymm1        # 33008 <_sk_srcover_bgra_8888_sse2_lowp+0x418>
   DB  196,226,101,168,200                 ; vfmadd213ps   %ymm0,%ymm3,%ymm1
-  DB  196,226,125,24,5,176,183,2,0        ; vbroadcastss  0x2b7b0(%rip),%ymm0        # 33638 <_sk_srcover_bgra_8888_sse2_lowp+0x41c>
+  DB  196,226,125,24,5,250,178,2,0        ; vbroadcastss  0x2b2fa(%rip),%ymm0        # 3300c <_sk_srcover_bgra_8888_sse2_lowp+0x41c>
   DB  196,226,101,184,193                 ; vfmadd231ps   %ymm1,%ymm3,%ymm0
-  DB  196,226,125,24,13,166,183,2,0       ; vbroadcastss  0x2b7a6(%rip),%ymm1        # 3363c <_sk_srcover_bgra_8888_sse2_lowp+0x420>
+  DB  196,226,125,24,13,240,178,2,0       ; vbroadcastss  0x2b2f0(%rip),%ymm1        # 33010 <_sk_srcover_bgra_8888_sse2_lowp+0x420>
   DB  196,226,101,184,200                 ; vfmadd231ps   %ymm0,%ymm3,%ymm1
-  DB  196,226,125,24,5,156,183,2,0        ; vbroadcastss  0x2b79c(%rip),%ymm0        # 33640 <_sk_srcover_bgra_8888_sse2_lowp+0x424>
+  DB  196,226,125,24,5,230,178,2,0        ; vbroadcastss  0x2b2e6(%rip),%ymm0        # 33014 <_sk_srcover_bgra_8888_sse2_lowp+0x424>
   DB  196,226,101,184,193                 ; vfmadd231ps   %ymm1,%ymm3,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,252,40,200                      ; vmovaps       %ymm0,%ymm1
@@ -7416,7 +7342,7 @@
   DB  197,252,17,108,36,64                ; vmovups       %ymm5,0x40(%rsp)
   DB  197,252,17,100,36,32                ; vmovups       %ymm4,0x20(%rsp)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,37,226,181,2,0       ; vbroadcastss  0x2b5e2(%rip),%ymm4        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,226,125,24,37,44,177,2,0        ; vbroadcastss  0x2b12c(%rip),%ymm4        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  197,252,88,212                      ; vaddps        %ymm4,%ymm0,%ymm2
   DB  196,227,125,8,218,1                 ; vroundps      $0x1,%ymm2,%ymm3
   DB  197,108,92,235                      ; vsubps        %ymm3,%ymm2,%ymm13
@@ -7424,7 +7350,7 @@
   DB  197,244,88,204                      ; vaddps        %ymm4,%ymm1,%ymm1
   DB  196,227,125,8,209,1                 ; vroundps      $0x1,%ymm1,%ymm2
   DB  197,244,92,210                      ; vsubps        %ymm2,%ymm1,%ymm2
-  DB  196,226,125,24,13,184,181,2,0       ; vbroadcastss  0x2b5b8(%rip),%ymm1        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,13,2,177,2,0         ; vbroadcastss  0x2b102(%rip),%ymm1        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,116,92,221                  ; vsubps        %ymm13,%ymm1,%ymm3
   DB  197,252,17,156,36,64,1,0,0          ; vmovups       %ymm3,0x140(%rsp)
   DB  197,252,17,148,36,0,1,0,0           ; vmovups       %ymm2,0x100(%rsp)
@@ -7439,8 +7365,8 @@
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  196,226,125,24,72,8                 ; vbroadcastss  0x8(%rax),%ymm1
   DB  197,252,17,140,36,192,0,0,0         ; vmovups       %ymm1,0xc0(%rsp)
-  DB  197,250,16,13,157,182,2,0           ; vmovss        0x2b69d(%rip),%xmm1        # 33610 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
-  DB  196,226,125,24,61,200,181,2,0       ; vbroadcastss  0x2b5c8(%rip),%ymm7        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  197,250,16,13,231,177,2,0           ; vmovss        0x2b1e7(%rip),%xmm1        # 32fe4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  DB  196,226,125,24,61,18,177,2,0        ; vbroadcastss  0x2b112(%rip),%ymm7        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  197,228,87,219                      ; vxorps        %ymm3,%ymm3,%ymm3
   DB  197,237,239,210                     ; vpxor         %ymm2,%ymm2,%ymm2
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
@@ -7451,14 +7377,14 @@
   DB  197,220,87,228                      ; vxorps        %ymm4,%ymm4,%ymm4
   DB  197,220,95,201                      ; vmaxps        %ymm1,%ymm4,%ymm1
   DB  197,248,41,108,36,16                ; vmovaps       %xmm5,0x10(%rsp)
-  DB  197,248,46,45,142,182,2,0           ; vucomiss      0x2b68e(%rip),%xmm5        # 33644 <_sk_srcover_bgra_8888_sse2_lowp+0x428>
+  DB  197,248,46,45,216,177,2,0           ; vucomiss      0x2b1d8(%rip),%xmm5        # 33018 <_sk_srcover_bgra_8888_sse2_lowp+0x428>
   DB  197,124,16,164,36,0,1,0,0           ; vmovups       0x100(%rsp),%ymm12
-  DB  119,9                               ; ja            7fca <_sk_bilerp_clamp_8888_hsw+0x111>
+  DB  119,9                               ; ja            7e54 <_sk_bilerp_clamp_8888_hsw+0x111>
   DB  197,124,16,164,36,160,0,0,0         ; vmovups       0xa0(%rsp),%ymm12
   DB  197,244,93,140,36,224,0,0,0         ; vminps        0xe0(%rsp),%ymm1,%ymm1
   DB  197,254,91,201                      ; vcvttps2dq    %ymm1,%ymm1
   DB  196,226,117,64,164,36,192,0,0,0     ; vpmulld       0xc0(%rsp),%ymm1,%ymm4
-  DB  197,250,16,53,39,182,2,0            ; vmovss        0x2b627(%rip),%xmm6        # 33610 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  DB  197,250,16,53,113,177,2,0           ; vmovss        0x2b171(%rip),%xmm6        # 32fe4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   DB  196,226,125,24,206                  ; vbroadcastss  %xmm6,%ymm1
   DB  197,244,88,200                      ; vaddps        %ymm0,%ymm1,%ymm1
   DB  197,212,87,237                      ; vxorps        %ymm5,%ymm5,%ymm5
@@ -7469,36 +7395,36 @@
   DB  197,213,118,237                     ; vpcmpeqd      %ymm5,%ymm5,%ymm5
   DB  196,65,45,239,210                   ; vpxor         %ymm10,%ymm10,%ymm10
   DB  196,66,85,144,20,136                ; vpgatherdd    %ymm5,(%r8,%ymm1,4),%ymm10
-  DB  197,173,219,13,194,185,2,0          ; vpand         0x2b9c2(%rip),%ymm10,%ymm1        # 339e0 <_sk_srcover_bgra_8888_sse2_lowp+0x7c4>
+  DB  197,173,219,13,24,181,2,0           ; vpand         0x2b518(%rip),%ymm10,%ymm1        # 333c0 <_sk_srcover_bgra_8888_sse2_lowp+0x7d0>
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
   DB  197,116,89,223                      ; vmulps        %ymm7,%ymm1,%ymm11
-  DB  196,226,45,0,13,209,185,2,0         ; vpshufb       0x2b9d1(%rip),%ymm10,%ymm1        # 33a00 <_sk_srcover_bgra_8888_sse2_lowp+0x7e4>
+  DB  196,226,45,0,13,39,181,2,0          ; vpshufb       0x2b527(%rip),%ymm10,%ymm1        # 333e0 <_sk_srcover_bgra_8888_sse2_lowp+0x7f0>
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
   DB  197,244,89,239                      ; vmulps        %ymm7,%ymm1,%ymm5
-  DB  196,226,45,0,13,224,185,2,0         ; vpshufb       0x2b9e0(%rip),%ymm10,%ymm1        # 33a20 <_sk_srcover_bgra_8888_sse2_lowp+0x804>
+  DB  196,226,45,0,13,54,181,2,0          ; vpshufb       0x2b536(%rip),%ymm10,%ymm1        # 33400 <_sk_srcover_bgra_8888_sse2_lowp+0x810>
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
   DB  197,244,89,207                      ; vmulps        %ymm7,%ymm1,%ymm1
   DB  196,193,45,114,210,24               ; vpsrld        $0x18,%ymm10,%ymm10
   DB  196,65,124,91,210                   ; vcvtdq2ps     %ymm10,%ymm10
   DB  197,44,89,255                       ; vmulps        %ymm7,%ymm10,%ymm15
-  DB  197,248,46,53,229,181,2,0           ; vucomiss      0x2b5e5(%rip),%xmm6        # 33644 <_sk_srcover_bgra_8888_sse2_lowp+0x428>
+  DB  197,248,46,53,47,177,2,0            ; vucomiss      0x2b12f(%rip),%xmm6        # 33018 <_sk_srcover_bgra_8888_sse2_lowp+0x428>
   DB  196,65,124,40,213                   ; vmovaps       %ymm13,%ymm10
-  DB  119,9                               ; ja            806f <_sk_bilerp_clamp_8888_hsw+0x1b6>
+  DB  119,9                               ; ja            7ef9 <_sk_bilerp_clamp_8888_hsw+0x1b6>
   DB  197,124,16,148,36,64,1,0,0          ; vmovups       0x140(%rsp),%ymm10
   DB  196,65,28,89,210                    ; vmulps        %ymm10,%ymm12,%ymm10
   DB  196,66,45,184,203                   ; vfmadd231ps   %ymm11,%ymm10,%ymm9
   DB  196,98,45,184,197                   ; vfmadd231ps   %ymm5,%ymm10,%ymm8
   DB  196,226,45,184,209                  ; vfmadd231ps   %ymm1,%ymm10,%ymm2
   DB  196,194,45,184,223                  ; vfmadd231ps   %ymm15,%ymm10,%ymm3
-  DB  197,202,88,53,60,180,2,0            ; vaddss        0x2b43c(%rip),%xmm6,%xmm6        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
-  DB  197,250,16,13,48,180,2,0            ; vmovss        0x2b430(%rip),%xmm1        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  197,202,88,53,134,175,2,0           ; vaddss        0x2af86(%rip),%xmm6,%xmm6        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  197,250,16,13,122,175,2,0           ; vmovss        0x2af7a(%rip),%xmm1        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  197,248,46,206                      ; vucomiss      %xmm6,%xmm1
-  DB  15,131,71,255,255,255               ; jae           7fe9 <_sk_bilerp_clamp_8888_hsw+0x130>
+  DB  15,131,71,255,255,255               ; jae           7e73 <_sk_bilerp_clamp_8888_hsw+0x130>
   DB  197,248,40,108,36,16                ; vmovaps       0x10(%rsp),%xmm5
-  DB  197,210,88,45,28,180,2,0            ; vaddss        0x2b41c(%rip),%xmm5,%xmm5        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
-  DB  197,250,16,13,16,180,2,0            ; vmovss        0x2b410(%rip),%xmm1        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  197,210,88,45,102,175,2,0           ; vaddss        0x2af66(%rip),%xmm5,%xmm5        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  197,250,16,13,90,175,2,0            ; vmovss        0x2af5a(%rip),%xmm1        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  197,248,46,205                      ; vucomiss      %xmm5,%xmm1
-  DB  15,131,208,254,255,255              ; jae           7f92 <_sk_bilerp_clamp_8888_hsw+0xd9>
+  DB  15,131,208,254,255,255              ; jae           7e1c <_sk_bilerp_clamp_8888_hsw+0xd9>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,124,41,200                      ; vmovaps       %ymm9,%ymm0
   DB  197,124,41,193                      ; vmovaps       %ymm8,%ymm1
@@ -7508,6 +7434,8 @@
   DB  197,252,16,188,36,128,0,0,0         ; vmovups       0x80(%rsp),%ymm7
   DB  72,129,196,120,1,0,0                ; add           $0x178,%rsp
   DB  255,224                             ; jmpq          *%rax
+  DB  144                                 ; nop
+  DB  144                                 ; nop
 
 PUBLIC _sk_start_pipeline_avx
 _sk_start_pipeline_avx LABEL PROC
@@ -7540,13 +7468,13 @@
   DB  73,137,246                          ; mov           %rsi,%r14
   DB  76,137,141,8,255,255,255            ; mov           %r9,-0xf8(%rbp)
   DB  76,57,203                           ; cmp           %r9,%rbx
-  DB  15,131,169,0,0,0                    ; jae           821c <_sk_start_pipeline_avx+0x12c>
+  DB  15,131,169,0,0,0                    ; jae           80a8 <_sk_start_pipeline_avx+0x12c>
   DB  72,139,133,24,255,255,255           ; mov           -0xe8(%rbp),%rax
   DB  72,141,64,8                         ; lea           0x8(%rax),%rax
   DB  72,137,133,16,255,255,255           ; mov           %rax,-0xf0(%rbp)
   DB  72,139,149,24,255,255,255           ; mov           -0xe8(%rbp),%rdx
   DB  76,57,189,16,255,255,255            ; cmp           %r15,-0xf0(%rbp)
-  DB  119,70                              ; ja            81db <_sk_start_pipeline_avx+0xeb>
+  DB  119,70                              ; ja            8067 <_sk_start_pipeline_avx+0xeb>
   DB  76,139,165,24,255,255,255           ; mov           -0xe8(%rbp),%r12
   DB  49,255                              ; xor           %edi,%edi
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
@@ -7565,10 +7493,10 @@
   DB  73,131,196,16                       ; add           $0x10,%r12
   DB  77,57,252                           ; cmp           %r15,%r12
   DB  73,137,212                          ; mov           %rdx,%r12
-  DB  118,193                             ; jbe           819c <_sk_start_pipeline_avx+0xac>
+  DB  118,193                             ; jbe           8028 <_sk_start_pipeline_avx+0xac>
   DB  76,137,255                          ; mov           %r15,%rdi
   DB  72,41,215                           ; sub           %rdx,%rdi
-  DB  116,41                              ; je            820c <_sk_start_pipeline_avx+0x11c>
+  DB  116,41                              ; je            8098 <_sk_start_pipeline_avx+0x11c>
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  197,236,87,210                      ; vxorps        %ymm2,%ymm2,%ymm2
@@ -7582,7 +7510,7 @@
   DB  65,255,213                          ; callq         *%r13
   DB  72,255,195                          ; inc           %rbx
   DB  72,59,157,8,255,255,255             ; cmp           -0xf8(%rbp),%rbx
-  DB  15,133,105,255,255,255              ; jne           8185 <_sk_start_pipeline_avx+0x95>
+  DB  15,133,105,255,255,255              ; jne           8011 <_sk_start_pipeline_avx+0x95>
   DB  197,248,40,181,32,255,255,255       ; vmovaps       -0xe0(%rbp),%xmm6
   DB  197,248,40,189,48,255,255,255       ; vmovaps       -0xd0(%rbp),%xmm7
   DB  197,120,40,133,64,255,255,255       ; vmovaps       -0xc0(%rbp),%xmm8
@@ -7621,10 +7549,10 @@
   DB  197,249,112,201,0                   ; vpshufd       $0x0,%xmm1,%xmm1
   DB  196,227,117,24,201,1                ; vinsertf128   $0x1,%xmm1,%ymm1,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
-  DB  196,226,125,24,21,27,178,2,0        ; vbroadcastss  0x2b21b(%rip),%ymm2        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,226,125,24,21,99,173,2,0        ; vbroadcastss  0x2ad63(%rip),%ymm2        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  197,244,88,202                      ; vaddps        %ymm2,%ymm1,%ymm1
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,21,16,178,2,0        ; vbroadcastss  0x2b210(%rip),%ymm2        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,21,88,173,2,0        ; vbroadcastss  0x2ad58(%rip),%ymm2        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,228,87,219                      ; vxorps        %ymm3,%ymm3,%ymm3
   DB  197,220,87,228                      ; vxorps        %ymm4,%ymm4,%ymm4
   DB  197,212,87,237                      ; vxorps        %ymm5,%ymm5,%ymm5
@@ -7636,46 +7564,46 @@
 _sk_dither_avx LABEL PROC
   DB  197,121,110,194                     ; vmovd         %edx,%xmm8
   DB  196,65,121,112,192,0                ; vpshufd       $0x0,%xmm8,%xmm8
-  DB  197,57,254,13,124,187,2,0           ; vpaddd        0x2bb7c(%rip),%xmm8,%xmm9        # 33e60 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
-  DB  197,57,254,5,132,187,2,0            ; vpaddd        0x2bb84(%rip),%xmm8,%xmm8        # 33e70 <_sk_srcover_bgra_8888_sse2_lowp+0xc54>
+  DB  197,57,254,13,208,182,2,0           ; vpaddd        0x2b6d0(%rip),%xmm8,%xmm9        # 33840 <_sk_srcover_bgra_8888_sse2_lowp+0xc50>
+  DB  197,57,254,5,216,182,2,0            ; vpaddd        0x2b6d8(%rip),%xmm8,%xmm8        # 33850 <_sk_srcover_bgra_8888_sse2_lowp+0xc60>
   DB  196,67,53,24,208,1                  ; vinsertf128   $0x1,%xmm8,%ymm9,%ymm10
   DB  197,121,110,217                     ; vmovd         %ecx,%xmm11
   DB  196,65,121,112,219,0                ; vpshufd       $0x0,%xmm11,%xmm11
   DB  196,67,37,24,219,1                  ; vinsertf128   $0x1,%xmm11,%ymm11,%ymm11
   DB  196,65,36,87,218                    ; vxorps        %ymm10,%ymm11,%ymm11
-  DB  196,98,125,24,21,192,177,2,0        ; vbroadcastss  0x2b1c0(%rip),%ymm10        # 334d0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b4>
+  DB  196,98,125,24,21,8,173,2,0          ; vbroadcastss  0x2ad08(%rip),%ymm10        # 32ea4 <_sk_srcover_bgra_8888_sse2_lowp+0x2b4>
   DB  196,65,36,84,210                    ; vandps        %ymm10,%ymm11,%ymm10
   DB  196,193,25,114,242,5                ; vpslld        $0x5,%xmm10,%xmm12
   DB  196,67,125,25,210,1                 ; vextractf128  $0x1,%ymm10,%xmm10
   DB  196,193,41,114,242,5                ; vpslld        $0x5,%xmm10,%xmm10
   DB  196,67,29,24,210,1                  ; vinsertf128   $0x1,%xmm10,%ymm12,%ymm10
-  DB  197,123,18,37,91,195,2,0            ; vmovddup      0x2c35b(%rip),%xmm12        # 34690 <_sk_srcover_bgra_8888_sse2_lowp+0x1474>
+  DB  197,123,18,37,175,190,2,0           ; vmovddup      0x2beaf(%rip),%xmm12        # 34070 <_sk_srcover_bgra_8888_sse2_lowp+0x1480>
   DB  196,65,49,219,236                   ; vpand         %xmm12,%xmm9,%xmm13
   DB  196,193,17,114,245,4                ; vpslld        $0x4,%xmm13,%xmm13
   DB  196,65,57,219,228                   ; vpand         %xmm12,%xmm8,%xmm12
   DB  196,193,25,114,244,4                ; vpslld        $0x4,%xmm12,%xmm12
   DB  196,67,21,24,228,1                  ; vinsertf128   $0x1,%xmm12,%ymm13,%ymm12
-  DB  196,98,125,24,45,126,177,2,0        ; vbroadcastss  0x2b17e(%rip),%ymm13        # 334d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
+  DB  196,98,125,24,45,198,172,2,0        ; vbroadcastss  0x2acc6(%rip),%ymm13        # 32eac <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
   DB  196,65,36,84,237                    ; vandps        %ymm13,%ymm11,%ymm13
   DB  196,193,9,114,245,2                 ; vpslld        $0x2,%xmm13,%xmm14
   DB  196,67,125,25,237,1                 ; vextractf128  $0x1,%ymm13,%xmm13
   DB  196,193,17,114,245,2                ; vpslld        $0x2,%xmm13,%xmm13
   DB  196,67,13,24,237,1                  ; vinsertf128   $0x1,%xmm13,%ymm14,%ymm13
-  DB  197,123,18,53,25,195,2,0            ; vmovddup      0x2c319(%rip),%xmm14        # 34698 <_sk_srcover_bgra_8888_sse2_lowp+0x147c>
+  DB  197,123,18,53,109,190,2,0           ; vmovddup      0x2be6d(%rip),%xmm14        # 34078 <_sk_srcover_bgra_8888_sse2_lowp+0x1488>
   DB  196,65,49,219,254                   ; vpand         %xmm14,%xmm9,%xmm15
   DB  196,65,1,254,255                    ; vpaddd        %xmm15,%xmm15,%xmm15
   DB  196,65,57,219,246                   ; vpand         %xmm14,%xmm8,%xmm14
   DB  196,65,9,254,246                    ; vpaddd        %xmm14,%xmm14,%xmm14
   DB  196,67,5,24,246,1                   ; vinsertf128   $0x1,%xmm14,%ymm15,%ymm14
   DB  196,65,12,86,228                    ; vorps         %ymm12,%ymm14,%ymm12
-  DB  196,98,125,24,53,45,177,2,0         ; vbroadcastss  0x2b12d(%rip),%ymm14        # 334d4 <_sk_srcover_bgra_8888_sse2_lowp+0x2b8>
+  DB  196,98,125,24,53,117,172,2,0        ; vbroadcastss  0x2ac75(%rip),%ymm14        # 32ea8 <_sk_srcover_bgra_8888_sse2_lowp+0x2b8>
   DB  196,65,36,84,222                    ; vandps        %ymm14,%ymm11,%ymm11
   DB  196,193,9,114,211,1                 ; vpsrld        $0x1,%xmm11,%xmm14
   DB  196,67,125,25,219,1                 ; vextractf128  $0x1,%ymm11,%xmm11
   DB  196,193,33,114,211,1                ; vpsrld        $0x1,%xmm11,%xmm11
   DB  196,67,13,24,219,1                  ; vinsertf128   $0x1,%xmm11,%ymm14,%ymm11
   DB  196,65,20,86,219                    ; vorps         %ymm11,%ymm13,%ymm11
-  DB  197,123,18,45,207,194,2,0           ; vmovddup      0x2c2cf(%rip),%xmm13        # 346a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1484>
+  DB  197,123,18,45,35,190,2,0            ; vmovddup      0x2be23(%rip),%xmm13        # 34080 <_sk_srcover_bgra_8888_sse2_lowp+0x1490>
   DB  196,65,49,219,205                   ; vpand         %xmm13,%xmm9,%xmm9
   DB  196,65,57,219,197                   ; vpand         %xmm13,%xmm8,%xmm8
   DB  196,193,49,114,209,2                ; vpsrld        $0x2,%xmm9,%xmm9
@@ -7686,9 +7614,9 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  196,65,60,86,195                    ; vorps         %ymm11,%ymm8,%ymm8
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
-  DB  196,98,125,24,13,208,176,2,0        ; vbroadcastss  0x2b0d0(%rip),%ymm9        # 334dc <_sk_srcover_bgra_8888_sse2_lowp+0x2c0>
+  DB  196,98,125,24,13,24,172,2,0         ; vbroadcastss  0x2ac18(%rip),%ymm9        # 32eb0 <_sk_srcover_bgra_8888_sse2_lowp+0x2c0>
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
-  DB  196,98,125,24,13,198,176,2,0        ; vbroadcastss  0x2b0c6(%rip),%ymm9        # 334e0 <_sk_srcover_bgra_8888_sse2_lowp+0x2c4>
+  DB  196,98,125,24,13,14,172,2,0         ; vbroadcastss  0x2ac0e(%rip),%ymm9        # 32eb4 <_sk_srcover_bgra_8888_sse2_lowp+0x2c4>
   DB  196,65,60,88,193                    ; vaddps        %ymm9,%ymm8,%ymm8
   DB  196,98,125,24,8                     ; vbroadcastss  (%rax),%ymm9
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
@@ -7718,7 +7646,7 @@
 PUBLIC _sk_black_color_avx
 _sk_black_color_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,78,176,2,0        ; vbroadcastss  0x2b04e(%rip),%ymm3        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,29,150,171,2,0       ; vbroadcastss  0x2ab96(%rip),%ymm3        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  197,236,87,210                      ; vxorps        %ymm2,%ymm2,%ymm2
@@ -7727,7 +7655,7 @@
 PUBLIC _sk_white_color_avx
 _sk_white_color_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,53,176,2,0         ; vbroadcastss  0x2b035(%rip),%ymm0        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,5,125,171,2,0        ; vbroadcastss  0x2ab7d(%rip),%ymm0        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,252,40,200                      ; vmovaps       %ymm0,%ymm1
   DB  197,252,40,208                      ; vmovaps       %ymm0,%ymm2
   DB  197,252,40,216                      ; vmovaps       %ymm0,%ymm3
@@ -7765,7 +7693,7 @@
 PUBLIC _sk_srcatop_avx
 _sk_srcatop_avx LABEL PROC
   DB  197,252,89,199                      ; vmulps        %ymm7,%ymm0,%ymm0
-  DB  196,98,125,24,5,212,175,2,0         ; vbroadcastss  0x2afd4(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,28,171,2,0          ; vbroadcastss  0x2ab1c(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  197,60,89,204                       ; vmulps        %ymm4,%ymm8,%ymm9
   DB  197,180,88,192                      ; vaddps        %ymm0,%ymm9,%ymm0
@@ -7784,7 +7712,7 @@
 PUBLIC _sk_dstatop_avx
 _sk_dstatop_avx LABEL PROC
   DB  197,100,89,196                      ; vmulps        %ymm4,%ymm3,%ymm8
-  DB  196,98,125,24,13,146,175,2,0        ; vbroadcastss  0x2af92(%rip),%ymm9        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,13,218,170,2,0        ; vbroadcastss  0x2aada(%rip),%ymm9        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,52,92,207                       ; vsubps        %ymm7,%ymm9,%ymm9
   DB  197,180,89,192                      ; vmulps        %ymm0,%ymm9,%ymm0
   DB  197,188,88,192                      ; vaddps        %ymm0,%ymm8,%ymm0
@@ -7820,7 +7748,7 @@
 
 PUBLIC _sk_srcout_avx
 _sk_srcout_avx LABEL PROC
-  DB  196,98,125,24,5,45,175,2,0          ; vbroadcastss  0x2af2d(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,117,170,2,0         ; vbroadcastss  0x2aa75(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,199                       ; vsubps        %ymm7,%ymm8,%ymm8
   DB  197,188,89,192                      ; vmulps        %ymm0,%ymm8,%ymm0
   DB  197,188,89,201                      ; vmulps        %ymm1,%ymm8,%ymm1
@@ -7831,7 +7759,7 @@
 
 PUBLIC _sk_dstout_avx
 _sk_dstout_avx LABEL PROC
-  DB  196,226,125,24,5,12,175,2,0         ; vbroadcastss  0x2af0c(%rip),%ymm0        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,5,84,170,2,0         ; vbroadcastss  0x2aa54(%rip),%ymm0        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,252,92,219                      ; vsubps        %ymm3,%ymm0,%ymm3
   DB  197,228,89,196                      ; vmulps        %ymm4,%ymm3,%ymm0
   DB  197,228,89,205                      ; vmulps        %ymm5,%ymm3,%ymm1
@@ -7842,7 +7770,7 @@
 
 PUBLIC _sk_srcover_avx
 _sk_srcover_avx LABEL PROC
-  DB  196,98,125,24,5,235,174,2,0         ; vbroadcastss  0x2aeeb(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,51,170,2,0          ; vbroadcastss  0x2aa33(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  197,60,89,204                       ; vmulps        %ymm4,%ymm8,%ymm9
   DB  197,180,88,192                      ; vaddps        %ymm0,%ymm9,%ymm0
@@ -7857,7 +7785,7 @@
 
 PUBLIC _sk_dstover_avx
 _sk_dstover_avx LABEL PROC
-  DB  196,98,125,24,5,186,174,2,0         ; vbroadcastss  0x2aeba(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,2,170,2,0           ; vbroadcastss  0x2aa02(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,199                       ; vsubps        %ymm7,%ymm8,%ymm8
   DB  197,188,89,192                      ; vmulps        %ymm0,%ymm8,%ymm0
   DB  197,252,88,196                      ; vaddps        %ymm4,%ymm0,%ymm0
@@ -7881,7 +7809,7 @@
 
 PUBLIC _sk_multiply_avx
 _sk_multiply_avx LABEL PROC
-  DB  196,98,125,24,5,117,174,2,0         ; vbroadcastss  0x2ae75(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,189,169,2,0         ; vbroadcastss  0x2a9bd(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,207                       ; vsubps        %ymm7,%ymm8,%ymm9
   DB  197,52,89,208                       ; vmulps        %ymm0,%ymm9,%ymm10
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
@@ -7910,7 +7838,7 @@
 PUBLIC _sk_plus__avx
 _sk_plus__avx LABEL PROC
   DB  197,252,88,196                      ; vaddps        %ymm4,%ymm0,%ymm0
-  DB  196,98,125,24,5,4,174,2,0           ; vbroadcastss  0x2ae04(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,76,169,2,0          ; vbroadcastss  0x2a94c(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
   DB  197,244,88,205                      ; vaddps        %ymm5,%ymm1,%ymm1
   DB  196,193,116,93,200                  ; vminps        %ymm8,%ymm1,%ymm1
@@ -7940,7 +7868,7 @@
 
 PUBLIC _sk_xor__avx
 _sk_xor__avx LABEL PROC
-  DB  196,98,125,24,5,163,173,2,0         ; vbroadcastss  0x2ada3(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,235,168,2,0         ; vbroadcastss  0x2a8eb(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,207                       ; vsubps        %ymm7,%ymm8,%ymm9
   DB  197,180,89,192                      ; vmulps        %ymm0,%ymm9,%ymm0
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
@@ -7975,7 +7903,7 @@
   DB  197,100,89,206                      ; vmulps        %ymm6,%ymm3,%ymm9
   DB  196,193,108,95,209                  ; vmaxps        %ymm9,%ymm2,%ymm2
   DB  197,188,92,210                      ; vsubps        %ymm2,%ymm8,%ymm2
-  DB  196,98,125,24,5,31,173,2,0          ; vbroadcastss  0x2ad1f(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,103,168,2,0         ; vbroadcastss  0x2a867(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  197,60,89,199                       ; vmulps        %ymm7,%ymm8,%ymm8
   DB  197,188,88,219                      ; vaddps        %ymm3,%ymm8,%ymm3
@@ -7999,7 +7927,7 @@
   DB  197,100,89,206                      ; vmulps        %ymm6,%ymm3,%ymm9
   DB  196,193,108,93,209                  ; vminps        %ymm9,%ymm2,%ymm2
   DB  197,188,92,210                      ; vsubps        %ymm2,%ymm8,%ymm2
-  DB  196,98,125,24,5,199,172,2,0         ; vbroadcastss  0x2acc7(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,15,168,2,0          ; vbroadcastss  0x2a80f(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  197,60,89,199                       ; vmulps        %ymm7,%ymm8,%ymm8
   DB  197,188,88,219                      ; vaddps        %ymm3,%ymm8,%ymm3
@@ -8026,7 +7954,7 @@
   DB  196,193,108,93,209                  ; vminps        %ymm9,%ymm2,%ymm2
   DB  197,236,88,210                      ; vaddps        %ymm2,%ymm2,%ymm2
   DB  197,188,92,210                      ; vsubps        %ymm2,%ymm8,%ymm2
-  DB  196,98,125,24,5,99,172,2,0          ; vbroadcastss  0x2ac63(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,171,167,2,0         ; vbroadcastss  0x2a7ab(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  197,60,89,199                       ; vmulps        %ymm7,%ymm8,%ymm8
   DB  197,188,88,219                      ; vaddps        %ymm3,%ymm8,%ymm3
@@ -8047,7 +7975,7 @@
   DB  197,236,89,214                      ; vmulps        %ymm6,%ymm2,%ymm2
   DB  197,236,88,210                      ; vaddps        %ymm2,%ymm2,%ymm2
   DB  197,188,92,210                      ; vsubps        %ymm2,%ymm8,%ymm2
-  DB  196,98,125,24,5,26,172,2,0          ; vbroadcastss  0x2ac1a(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,98,167,2,0          ; vbroadcastss  0x2a762(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  197,60,89,199                       ; vmulps        %ymm7,%ymm8,%ymm8
   DB  197,188,88,219                      ; vaddps        %ymm3,%ymm8,%ymm3
@@ -8056,7 +7984,7 @@
 
 PUBLIC _sk_colorburn_avx
 _sk_colorburn_avx LABEL PROC
-  DB  196,98,125,24,5,1,172,2,0           ; vbroadcastss  0x2ac01(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,73,167,2,0          ; vbroadcastss  0x2a749(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,207                       ; vsubps        %ymm7,%ymm8,%ymm9
   DB  197,52,89,216                       ; vmulps        %ymm0,%ymm9,%ymm11
   DB  196,65,44,87,210                    ; vxorps        %ymm10,%ymm10,%ymm10
@@ -8116,7 +8044,7 @@
 PUBLIC _sk_colordodge_avx
 _sk_colordodge_avx LABEL PROC
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
-  DB  196,98,125,24,13,5,171,2,0          ; vbroadcastss  0x2ab05(%rip),%ymm9        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,13,77,166,2,0         ; vbroadcastss  0x2a64d(%rip),%ymm9        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,52,92,215                       ; vsubps        %ymm7,%ymm9,%ymm10
   DB  197,44,89,216                       ; vmulps        %ymm0,%ymm10,%ymm11
   DB  197,52,92,203                       ; vsubps        %ymm3,%ymm9,%ymm9
@@ -8171,7 +8099,7 @@
 
 PUBLIC _sk_hardlight_avx
 _sk_hardlight_avx LABEL PROC
-  DB  196,98,125,24,5,16,170,2,0          ; vbroadcastss  0x2aa10(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,88,165,2,0          ; vbroadcastss  0x2a558(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,215                       ; vsubps        %ymm7,%ymm8,%ymm10
   DB  197,44,89,200                       ; vmulps        %ymm0,%ymm10,%ymm9
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
@@ -8224,7 +8152,7 @@
 
 PUBLIC _sk_overlay_avx
 _sk_overlay_avx LABEL PROC
-  DB  196,98,125,24,5,53,169,2,0          ; vbroadcastss  0x2a935(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,125,164,2,0         ; vbroadcastss  0x2a47d(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,215                       ; vsubps        %ymm7,%ymm8,%ymm10
   DB  197,44,89,200                       ; vmulps        %ymm0,%ymm10,%ymm9
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
@@ -8289,10 +8217,10 @@
   DB  196,65,60,88,192                    ; vaddps        %ymm8,%ymm8,%ymm8
   DB  196,65,60,89,216                    ; vmulps        %ymm8,%ymm8,%ymm11
   DB  196,65,60,88,195                    ; vaddps        %ymm11,%ymm8,%ymm8
-  DB  196,98,125,24,29,56,168,2,0         ; vbroadcastss  0x2a838(%rip),%ymm11        # 334e4 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
+  DB  196,98,125,24,29,128,163,2,0        ; vbroadcastss  0x2a380(%rip),%ymm11        # 32eb8 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
   DB  196,65,28,88,235                    ; vaddps        %ymm11,%ymm12,%ymm13
   DB  196,65,20,89,192                    ; vmulps        %ymm8,%ymm13,%ymm8
-  DB  196,98,125,24,45,41,168,2,0         ; vbroadcastss  0x2a829(%rip),%ymm13        # 334e8 <_sk_srcover_bgra_8888_sse2_lowp+0x2cc>
+  DB  196,98,125,24,45,113,163,2,0        ; vbroadcastss  0x2a371(%rip),%ymm13        # 32ebc <_sk_srcover_bgra_8888_sse2_lowp+0x2cc>
   DB  196,65,28,89,245                    ; vmulps        %ymm13,%ymm12,%ymm14
   DB  196,65,12,88,192                    ; vaddps        %ymm8,%ymm14,%ymm8
   DB  196,65,124,82,244                   ; vrsqrtps      %ymm12,%ymm14
@@ -8303,7 +8231,7 @@
   DB  197,4,194,255,2                     ; vcmpleps      %ymm7,%ymm15,%ymm15
   DB  196,67,13,74,240,240                ; vblendvps     %ymm15,%ymm8,%ymm14,%ymm14
   DB  197,116,88,249                      ; vaddps        %ymm1,%ymm1,%ymm15
-  DB  196,98,125,24,5,211,167,2,0         ; vbroadcastss  0x2a7d3(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,27,163,2,0          ; vbroadcastss  0x2a31b(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,65,60,92,228                    ; vsubps        %ymm12,%ymm8,%ymm12
   DB  197,132,92,195                      ; vsubps        %ymm3,%ymm15,%ymm0
   DB  196,65,124,89,228                   ; vmulps        %ymm12,%ymm0,%ymm12
@@ -8430,12 +8358,12 @@
   DB  196,65,28,89,219                    ; vmulps        %ymm11,%ymm12,%ymm11
   DB  196,65,36,94,222                    ; vdivps        %ymm14,%ymm11,%ymm11
   DB  196,67,37,74,224,240                ; vblendvps     %ymm15,%ymm8,%ymm11,%ymm12
-  DB  196,98,125,24,53,177,165,2,0        ; vbroadcastss  0x2a5b1(%rip),%ymm14        # 334ec <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  DB  196,98,125,24,53,249,160,2,0        ; vbroadcastss  0x2a0f9(%rip),%ymm14        # 32ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
   DB  196,65,92,89,222                    ; vmulps        %ymm14,%ymm4,%ymm11
-  DB  196,98,125,24,61,167,165,2,0        ; vbroadcastss  0x2a5a7(%rip),%ymm15        # 334f0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
+  DB  196,98,125,24,61,239,160,2,0        ; vbroadcastss  0x2a0ef(%rip),%ymm15        # 32ec4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
   DB  196,65,84,89,239                    ; vmulps        %ymm15,%ymm5,%ymm13
   DB  196,65,36,88,221                    ; vaddps        %ymm13,%ymm11,%ymm11
-  DB  196,226,125,24,5,152,165,2,0        ; vbroadcastss  0x2a598(%rip),%ymm0        # 334f4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
+  DB  196,226,125,24,5,224,160,2,0        ; vbroadcastss  0x2a0e0(%rip),%ymm0        # 32ec8 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
   DB  197,76,89,232                       ; vmulps        %ymm0,%ymm6,%ymm13
   DB  196,65,36,88,221                    ; vaddps        %ymm13,%ymm11,%ymm11
   DB  196,65,52,89,238                    ; vmulps        %ymm14,%ymm9,%ymm13
@@ -8496,7 +8424,7 @@
   DB  196,65,36,95,208                    ; vmaxps        %ymm8,%ymm11,%ymm10
   DB  196,195,109,74,209,240              ; vblendvps     %ymm15,%ymm9,%ymm2,%ymm2
   DB  196,193,108,95,208                  ; vmaxps        %ymm8,%ymm2,%ymm2
-  DB  196,98,125,24,5,69,164,2,0          ; vbroadcastss  0x2a445(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,141,159,2,0         ; vbroadcastss  0x29f8d(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,207                       ; vsubps        %ymm7,%ymm8,%ymm9
   DB  197,180,89,201                      ; vmulps        %ymm1,%ymm9,%ymm1
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
@@ -8553,12 +8481,12 @@
   DB  196,65,28,89,219                    ; vmulps        %ymm11,%ymm12,%ymm11
   DB  196,65,36,94,222                    ; vdivps        %ymm14,%ymm11,%ymm11
   DB  196,67,37,74,224,240                ; vblendvps     %ymm15,%ymm8,%ymm11,%ymm12
-  DB  196,98,125,24,53,105,163,2,0        ; vbroadcastss  0x2a369(%rip),%ymm14        # 334ec <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  DB  196,98,125,24,53,177,158,2,0        ; vbroadcastss  0x29eb1(%rip),%ymm14        # 32ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
   DB  196,65,92,89,222                    ; vmulps        %ymm14,%ymm4,%ymm11
-  DB  196,98,125,24,61,95,163,2,0         ; vbroadcastss  0x2a35f(%rip),%ymm15        # 334f0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
+  DB  196,98,125,24,61,167,158,2,0        ; vbroadcastss  0x29ea7(%rip),%ymm15        # 32ec4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
   DB  196,65,84,89,239                    ; vmulps        %ymm15,%ymm5,%ymm13
   DB  196,65,36,88,221                    ; vaddps        %ymm13,%ymm11,%ymm11
-  DB  196,226,125,24,5,80,163,2,0         ; vbroadcastss  0x2a350(%rip),%ymm0        # 334f4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
+  DB  196,226,125,24,5,152,158,2,0        ; vbroadcastss  0x29e98(%rip),%ymm0        # 32ec8 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
   DB  197,76,89,232                       ; vmulps        %ymm0,%ymm6,%ymm13
   DB  196,65,36,88,221                    ; vaddps        %ymm13,%ymm11,%ymm11
   DB  196,65,52,89,238                    ; vmulps        %ymm14,%ymm9,%ymm13
@@ -8619,7 +8547,7 @@
   DB  196,65,36,95,208                    ; vmaxps        %ymm8,%ymm11,%ymm10
   DB  196,195,109,74,209,240              ; vblendvps     %ymm15,%ymm9,%ymm2,%ymm2
   DB  196,193,108,95,208                  ; vmaxps        %ymm8,%ymm2,%ymm2
-  DB  196,98,125,24,5,253,161,2,0         ; vbroadcastss  0x2a1fd(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,69,157,2,0          ; vbroadcastss  0x29d45(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,207                       ; vsubps        %ymm7,%ymm8,%ymm9
   DB  197,180,89,201                      ; vmulps        %ymm1,%ymm9,%ymm1
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
@@ -8648,12 +8576,12 @@
   DB  197,252,17,68,36,32                 ; vmovups       %ymm0,0x20(%rsp)
   DB  197,124,89,199                      ; vmulps        %ymm7,%ymm0,%ymm8
   DB  197,116,89,207                      ; vmulps        %ymm7,%ymm1,%ymm9
-  DB  196,98,125,24,45,169,161,2,0        ; vbroadcastss  0x2a1a9(%rip),%ymm13        # 334ec <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  DB  196,98,125,24,45,241,156,2,0        ; vbroadcastss  0x29cf1(%rip),%ymm13        # 32ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
   DB  196,65,92,89,213                    ; vmulps        %ymm13,%ymm4,%ymm10
-  DB  196,98,125,24,53,159,161,2,0        ; vbroadcastss  0x2a19f(%rip),%ymm14        # 334f0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
+  DB  196,98,125,24,53,231,156,2,0        ; vbroadcastss  0x29ce7(%rip),%ymm14        # 32ec4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
   DB  196,65,84,89,222                    ; vmulps        %ymm14,%ymm5,%ymm11
   DB  196,65,44,88,211                    ; vaddps        %ymm11,%ymm10,%ymm10
-  DB  196,98,125,24,61,144,161,2,0        ; vbroadcastss  0x2a190(%rip),%ymm15        # 334f4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
+  DB  196,98,125,24,61,216,156,2,0        ; vbroadcastss  0x29cd8(%rip),%ymm15        # 32ec8 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
   DB  196,65,76,89,223                    ; vmulps        %ymm15,%ymm6,%ymm11
   DB  196,193,44,88,195                   ; vaddps        %ymm11,%ymm10,%ymm0
   DB  196,65,60,89,221                    ; vmulps        %ymm13,%ymm8,%ymm11
@@ -8716,7 +8644,7 @@
   DB  196,65,44,95,207                    ; vmaxps        %ymm15,%ymm10,%ymm9
   DB  196,195,37,74,192,0                 ; vblendvps     %ymm0,%ymm8,%ymm11,%ymm0
   DB  196,65,124,95,199                   ; vmaxps        %ymm15,%ymm0,%ymm8
-  DB  196,226,125,24,5,43,160,2,0         ; vbroadcastss  0x2a02b(%rip),%ymm0        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,5,115,155,2,0        ; vbroadcastss  0x29b73(%rip),%ymm0        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,124,92,215                      ; vsubps        %ymm7,%ymm0,%ymm10
   DB  197,172,89,84,36,32                 ; vmulps        0x20(%rsp),%ymm10,%ymm2
   DB  197,124,92,219                      ; vsubps        %ymm3,%ymm0,%ymm11
@@ -8746,12 +8674,12 @@
   DB  197,252,40,208                      ; vmovaps       %ymm0,%ymm2
   DB  197,100,89,196                      ; vmulps        %ymm4,%ymm3,%ymm8
   DB  197,100,89,205                      ; vmulps        %ymm5,%ymm3,%ymm9
-  DB  196,98,125,24,45,211,159,2,0        ; vbroadcastss  0x29fd3(%rip),%ymm13        # 334ec <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  DB  196,98,125,24,45,27,155,2,0         ; vbroadcastss  0x29b1b(%rip),%ymm13        # 32ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
   DB  196,65,108,89,213                   ; vmulps        %ymm13,%ymm2,%ymm10
-  DB  196,98,125,24,53,201,159,2,0        ; vbroadcastss  0x29fc9(%rip),%ymm14        # 334f0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
+  DB  196,98,125,24,53,17,155,2,0         ; vbroadcastss  0x29b11(%rip),%ymm14        # 32ec4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d4>
   DB  196,65,116,89,222                   ; vmulps        %ymm14,%ymm1,%ymm11
   DB  196,65,44,88,211                    ; vaddps        %ymm11,%ymm10,%ymm10
-  DB  196,98,125,24,61,186,159,2,0        ; vbroadcastss  0x29fba(%rip),%ymm15        # 334f4 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
+  DB  196,98,125,24,61,2,155,2,0          ; vbroadcastss  0x29b02(%rip),%ymm15        # 32ec8 <_sk_srcover_bgra_8888_sse2_lowp+0x2d8>
   DB  196,65,28,89,223                    ; vmulps        %ymm15,%ymm12,%ymm11
   DB  196,193,44,88,195                   ; vaddps        %ymm11,%ymm10,%ymm0
   DB  196,65,60,89,221                    ; vmulps        %ymm13,%ymm8,%ymm11
@@ -8814,7 +8742,7 @@
   DB  196,65,44,95,207                    ; vmaxps        %ymm15,%ymm10,%ymm9
   DB  196,195,37,74,192,0                 ; vblendvps     %ymm0,%ymm8,%ymm11,%ymm0
   DB  196,65,124,95,199                   ; vmaxps        %ymm15,%ymm0,%ymm8
-  DB  196,226,125,24,5,85,158,2,0         ; vbroadcastss  0x29e55(%rip),%ymm0        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,5,157,153,2,0        ; vbroadcastss  0x2999d(%rip),%ymm0        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,124,92,215                      ; vsubps        %ymm7,%ymm0,%ymm10
   DB  197,172,89,210                      ; vmulps        %ymm2,%ymm10,%ymm2
   DB  197,124,92,219                      ; vsubps        %ymm3,%ymm0,%ymm11
@@ -8838,16 +8766,14 @@
 PUBLIC _sk_srcover_rgba_8888_avx
 _sk_srcover_rgba_8888_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,87,1,0,0                     ; jne           983c <_sk_srcover_rgba_8888_avx+0x177>
-  DB  196,1,125,16,12,152                 ; vmovupd       (%r8,%r11,4),%ymm9
-  DB  197,125,40,5,109,163,2,0            ; vmovapd       0x2a36d(%rip),%ymm8        # 33a60 <_sk_srcover_bgra_8888_sse2_lowp+0x844>
+  DB  15,133,87,1,0,0                     ; jne           96c2 <_sk_srcover_rgba_8888_avx+0x171>
+  DB  196,65,125,16,12,144                ; vmovupd       (%r8,%rdx,4),%ymm9
+  DB  197,125,40,5,199,158,2,0            ; vmovapd       0x29ec7(%rip),%ymm8        # 33440 <_sk_srcover_bgra_8888_sse2_lowp+0x850>
   DB  196,193,53,84,224                   ; vandpd        %ymm8,%ymm9,%ymm4
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
   DB  196,193,81,114,209,8                ; vpsrld        $0x8,%xmm9,%xmm5
@@ -8866,9 +8792,9 @@
   DB  197,193,114,215,24                  ; vpsrld        $0x18,%xmm7,%xmm7
   DB  196,227,53,24,255,1                 ; vinsertf128   $0x1,%xmm7,%ymm9,%ymm7
   DB  197,252,91,255                      ; vcvtdq2ps     %ymm7,%ymm7
-  DB  196,98,125,24,13,115,157,2,0        ; vbroadcastss  0x29d73(%rip),%ymm9        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,13,193,152,2,0        ; vbroadcastss  0x298c1(%rip),%ymm9        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,52,92,211                       ; vsubps        %ymm3,%ymm9,%ymm10
-  DB  196,98,125,24,13,146,157,2,0        ; vbroadcastss  0x29d92(%rip),%ymm9        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  196,98,125,24,13,224,152,2,0        ; vbroadcastss  0x298e0(%rip),%ymm9        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   DB  196,193,124,89,193                  ; vmulps        %ymm9,%ymm0,%ymm0
   DB  197,44,89,220                       ; vmulps        %ymm4,%ymm10,%ymm11
   DB  196,193,124,88,195                  ; vaddps        %ymm11,%ymm0,%ymm0
@@ -8909,70 +8835,71 @@
   DB  196,65,37,86,192                    ; vorpd         %ymm8,%ymm11,%ymm8
   DB  196,65,45,86,192                    ; vorpd         %ymm8,%ymm10,%ymm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,66                              ; jne           9874 <_sk_srcover_rgba_8888_avx+0x1af>
-  DB  196,1,124,17,4,152                  ; vmovups       %ymm8,(%r8,%r11,4)
+  DB  117,59                              ; jne           96f3 <_sk_srcover_rgba_8888_avx+0x1a2>
+  DB  196,65,124,17,4,144                 ; vmovups       %ymm8,(%r8,%rdx,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,150,254,255,255              ; ja            96eb <_sk_srcover_rgba_8888_avx+0x26>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,4,1,0,0                   ; lea           0x104(%rip),%r10        # 9964 <_sk_srcover_rgba_8888_avx+0x29f>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
-  DB  255,224                             ; jmpq          *%rax
-  DB  196,1,122,16,12,152                 ; vmovss        (%r8,%r11,4),%xmm9
-  DB  233,119,254,255,255                 ; jmpq          96eb <_sk_srcover_rgba_8888_avx+0x26>
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,180                             ; ja            9838 <_sk_srcover_rgba_8888_avx+0x173>
-  DB  65,15,182,193                       ; movzbl        %r9b,%eax
-  DB  76,141,13,241,0,0,0                 ; lea           0xf1(%rip),%r9        # 9980 <_sk_srcover_rgba_8888_avx+0x2bb>
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  15,135,156,254,255,255              ; ja            9571 <_sk_srcover_rgba_8888_avx+0x20>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,253,0,0,0                 ; lea           0xfd(%rip),%r9        # 97dc <_sk_srcover_rgba_8888_avx+0x28b>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,1,121,126,4,152                 ; vmovd         %xmm8,(%r8,%r11,4)
-  DB  235,152                             ; jmp           9838 <_sk_srcover_rgba_8888_avx+0x173>
-  DB  196,129,121,110,100,152,8           ; vmovd         0x8(%r8,%r11,4),%xmm4
+  DB  196,65,122,16,12,144                ; vmovss        (%r8,%rdx,4),%xmm9
+  DB  233,126,254,255,255                 ; jmpq          9571 <_sk_srcover_rgba_8888_avx+0x20>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,193                             ; ja            96be <_sk_srcover_rgba_8888_avx+0x16d>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,241,0,0,0                 ; lea           0xf1(%rip),%r9        # 97f8 <_sk_srcover_rgba_8888_avx+0x2a7>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
+  DB  255,224                             ; jmpq          *%rax
+  DB  196,65,121,126,4,144                ; vmovd         %xmm8,(%r8,%rdx,4)
+  DB  235,166                             ; jmp           96be <_sk_srcover_rgba_8888_avx+0x16d>
+  DB  196,193,121,110,100,144,8           ; vmovd         0x8(%r8,%rdx,4),%xmm4
   DB  197,249,112,228,68                  ; vpshufd       $0x44,%xmm4,%xmm4
   DB  197,212,87,237                      ; vxorps        %ymm5,%ymm5,%ymm5
   DB  196,99,85,12,204,4                  ; vblendps      $0x4,%ymm4,%ymm5,%ymm9
-  DB  196,129,123,16,36,152               ; vmovsd        (%r8,%r11,4),%xmm4
+  DB  196,193,123,16,36,144               ; vmovsd        (%r8,%rdx,4),%xmm4
   DB  196,99,53,13,204,1                  ; vblendpd      $0x1,%ymm4,%ymm9,%ymm9
-  DB  233,36,254,255,255                  ; jmpq          96eb <_sk_srcover_rgba_8888_avx+0x26>
-  DB  196,129,121,110,100,152,24          ; vmovd         0x18(%r8,%r11,4),%xmm4
+  DB  233,50,254,255,255                  ; jmpq          9571 <_sk_srcover_rgba_8888_avx+0x20>
+  DB  196,193,121,110,100,144,24          ; vmovd         0x18(%r8,%rdx,4),%xmm4
   DB  197,249,112,228,68                  ; vpshufd       $0x44,%xmm4,%xmm4
   DB  196,227,125,24,228,1                ; vinsertf128   $0x1,%xmm4,%ymm0,%ymm4
   DB  197,212,87,237                      ; vxorps        %ymm5,%ymm5,%ymm5
   DB  196,99,85,12,204,64                 ; vblendps      $0x40,%ymm4,%ymm5,%ymm9
   DB  196,99,125,25,204,1                 ; vextractf128  $0x1,%ymm9,%xmm4
-  DB  196,131,89,34,100,152,20,1          ; vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm4,%xmm4
+  DB  196,195,89,34,100,144,20,1          ; vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm4,%xmm4
   DB  196,99,53,24,204,1                  ; vinsertf128   $0x1,%xmm4,%ymm9,%ymm9
   DB  196,99,125,25,204,1                 ; vextractf128  $0x1,%ymm9,%xmm4
-  DB  196,131,89,34,100,152,16,0          ; vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm4,%xmm4
+  DB  196,195,89,34,100,144,16,0          ; vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm4,%xmm4
   DB  196,99,53,24,204,1                  ; vinsertf128   $0x1,%xmm4,%ymm9,%ymm9
-  DB  196,129,121,16,36,152               ; vmovupd       (%r8,%r11,4),%xmm4
+  DB  196,193,121,16,36,144               ; vmovupd       (%r8,%rdx,4),%xmm4
   DB  196,67,93,13,201,12                 ; vblendpd      $0xc,%ymm9,%ymm4,%ymm9
-  DB  233,207,253,255,255                 ; jmpq          96eb <_sk_srcover_rgba_8888_avx+0x26>
-  DB  196,3,121,22,68,152,8,2             ; vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
-  DB  196,1,121,214,4,152                 ; vmovq         %xmm8,(%r8,%r11,4)
-  DB  233,9,255,255,255                   ; jmpq          9838 <_sk_srcover_rgba_8888_avx+0x173>
+  DB  233,221,253,255,255                 ; jmpq          9571 <_sk_srcover_rgba_8888_avx+0x20>
+  DB  196,67,121,22,68,144,8,2            ; vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
+  DB  196,65,121,214,4,144                ; vmovq         %xmm8,(%r8,%rdx,4)
+  DB  233,23,255,255,255                  ; jmpq          96be <_sk_srcover_rgba_8888_avx+0x16d>
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
-  DB  196,3,121,22,76,152,24,2            ; vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
+  DB  196,67,121,22,76,144,24,2           ; vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
-  DB  196,3,121,22,76,152,20,1            ; vpextrd       $0x1,%xmm9,0x14(%r8,%r11,4)
+  DB  196,67,121,22,76,144,20,1           ; vpextrd       $0x1,%xmm9,0x14(%r8,%rdx,4)
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
-  DB  196,1,121,126,76,152,16             ; vmovd         %xmm9,0x10(%r8,%r11,4)
-  DB  196,1,121,17,4,152                  ; vmovupd       %xmm8,(%r8,%r11,4)
-  DB  233,213,254,255,255                 ; jmpq          9838 <_sk_srcover_rgba_8888_avx+0x173>
+  DB  196,65,121,126,76,144,16            ; vmovd         %xmm9,0x10(%r8,%rdx,4)
+  DB  196,65,121,17,4,144                 ; vmovupd       %xmm8,(%r8,%rdx,4)
+  DB  233,227,254,255,255                 ; jmpq          96be <_sk_srcover_rgba_8888_avx+0x16d>
   DB  144                                 ; nop
-  DB  5,255,255,255,82                    ; add           $0x52ffffff,%eax
+  DB  12,255                              ; or            $0xff,%al
   DB  255                                 ; (bad)
+  DB  255,82,255                          ; callq         *-0x1(%rdx)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  60,255                              ; cmp           $0xff,%al
@@ -8981,7 +8908,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  127,255                             ; jg            9979 <_sk_srcover_rgba_8888_avx+0x2b4>
+  DB  127,255                             ; jg            97f1 <_sk_srcover_rgba_8888_avx+0x2a0>
   DB  255                                 ; (bad)
   DB  255,99,255                          ; jmpq          *-0x1(%rbx)
   DB  255                                 ; (bad)
@@ -9005,16 +8932,14 @@
 PUBLIC _sk_srcover_bgra_8888_avx
 _sk_srcover_bgra_8888_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,87,1,0,0                     ; jne           9b13 <_sk_srcover_bgra_8888_avx+0x177>
-  DB  196,1,125,16,12,152                 ; vmovupd       (%r8,%r11,4),%ymm9
-  DB  197,125,40,5,182,160,2,0            ; vmovapd       0x2a0b6(%rip),%ymm8        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0x864>
+  DB  15,133,87,1,0,0                     ; jne           9985 <_sk_srcover_bgra_8888_avx+0x171>
+  DB  196,65,125,16,12,144                ; vmovupd       (%r8,%rdx,4),%ymm9
+  DB  197,125,40,5,36,156,2,0             ; vmovapd       0x29c24(%rip),%ymm8        # 33460 <_sk_srcover_bgra_8888_sse2_lowp+0x870>
   DB  196,193,53,84,232                   ; vandpd        %ymm8,%ymm9,%ymm5
   DB  197,252,91,245                      ; vcvtdq2ps     %ymm5,%ymm6
   DB  196,193,81,114,209,8                ; vpsrld        $0x8,%xmm9,%xmm5
@@ -9033,9 +8958,9 @@
   DB  197,193,114,215,24                  ; vpsrld        $0x18,%xmm7,%xmm7
   DB  196,227,53,24,255,1                 ; vinsertf128   $0x1,%xmm7,%ymm9,%ymm7
   DB  197,252,91,255                      ; vcvtdq2ps     %ymm7,%ymm7
-  DB  196,98,125,24,13,156,154,2,0        ; vbroadcastss  0x29a9c(%rip),%ymm9        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,13,254,149,2,0        ; vbroadcastss  0x295fe(%rip),%ymm9        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,52,92,211                       ; vsubps        %ymm3,%ymm9,%ymm10
-  DB  196,98,125,24,13,187,154,2,0        ; vbroadcastss  0x29abb(%rip),%ymm9        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  196,98,125,24,13,29,150,2,0         ; vbroadcastss  0x2961d(%rip),%ymm9        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   DB  196,193,124,89,193                  ; vmulps        %ymm9,%ymm0,%ymm0
   DB  197,44,89,220                       ; vmulps        %ymm4,%ymm10,%ymm11
   DB  196,193,124,88,195                  ; vaddps        %ymm11,%ymm0,%ymm0
@@ -9076,69 +9001,69 @@
   DB  196,65,37,86,192                    ; vorpd         %ymm8,%ymm11,%ymm8
   DB  196,65,45,86,192                    ; vorpd         %ymm8,%ymm10,%ymm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,66                              ; jne           9b4b <_sk_srcover_bgra_8888_avx+0x1af>
-  DB  196,1,124,17,4,152                  ; vmovups       %ymm8,(%r8,%r11,4)
+  DB  117,59                              ; jne           99b6 <_sk_srcover_bgra_8888_avx+0x1a2>
+  DB  196,65,124,17,4,144                 ; vmovups       %ymm8,(%r8,%rdx,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,150,254,255,255              ; ja            99c2 <_sk_srcover_bgra_8888_avx+0x26>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,5,1,0,0                   ; lea           0x105(%rip),%r10        # 9c3c <_sk_srcover_bgra_8888_avx+0x2a0>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
-  DB  255,224                             ; jmpq          *%rax
-  DB  196,1,122,16,12,152                 ; vmovss        (%r8,%r11,4),%xmm9
-  DB  233,119,254,255,255                 ; jmpq          99c2 <_sk_srcover_bgra_8888_avx+0x26>
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,180                             ; ja            9b0f <_sk_srcover_bgra_8888_avx+0x173>
-  DB  65,15,182,193                       ; movzbl        %r9b,%eax
-  DB  76,141,13,242,0,0,0                 ; lea           0xf2(%rip),%r9        # 9c58 <_sk_srcover_bgra_8888_avx+0x2bc>
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  15,135,156,254,255,255              ; ja            9834 <_sk_srcover_bgra_8888_avx+0x20>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,254,0,0,0                 ; lea           0xfe(%rip),%r9        # 9aa0 <_sk_srcover_bgra_8888_avx+0x28c>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,1,121,126,4,152                 ; vmovd         %xmm8,(%r8,%r11,4)
-  DB  235,152                             ; jmp           9b0f <_sk_srcover_bgra_8888_avx+0x173>
-  DB  196,129,121,110,100,152,8           ; vmovd         0x8(%r8,%r11,4),%xmm4
+  DB  196,65,122,16,12,144                ; vmovss        (%r8,%rdx,4),%xmm9
+  DB  233,126,254,255,255                 ; jmpq          9834 <_sk_srcover_bgra_8888_avx+0x20>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,193                             ; ja            9981 <_sk_srcover_bgra_8888_avx+0x16d>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,242,0,0,0                 ; lea           0xf2(%rip),%r9        # 9abc <_sk_srcover_bgra_8888_avx+0x2a8>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
+  DB  255,224                             ; jmpq          *%rax
+  DB  196,65,121,126,4,144                ; vmovd         %xmm8,(%r8,%rdx,4)
+  DB  235,166                             ; jmp           9981 <_sk_srcover_bgra_8888_avx+0x16d>
+  DB  196,193,121,110,100,144,8           ; vmovd         0x8(%r8,%rdx,4),%xmm4
   DB  197,249,112,228,68                  ; vpshufd       $0x44,%xmm4,%xmm4
   DB  197,212,87,237                      ; vxorps        %ymm5,%ymm5,%ymm5
   DB  196,99,85,12,204,4                  ; vblendps      $0x4,%ymm4,%ymm5,%ymm9
-  DB  196,129,123,16,36,152               ; vmovsd        (%r8,%r11,4),%xmm4
+  DB  196,193,123,16,36,144               ; vmovsd        (%r8,%rdx,4),%xmm4
   DB  196,99,53,13,204,1                  ; vblendpd      $0x1,%ymm4,%ymm9,%ymm9
-  DB  233,36,254,255,255                  ; jmpq          99c2 <_sk_srcover_bgra_8888_avx+0x26>
-  DB  196,129,121,110,100,152,24          ; vmovd         0x18(%r8,%r11,4),%xmm4
+  DB  233,50,254,255,255                  ; jmpq          9834 <_sk_srcover_bgra_8888_avx+0x20>
+  DB  196,193,121,110,100,144,24          ; vmovd         0x18(%r8,%rdx,4),%xmm4
   DB  197,249,112,228,68                  ; vpshufd       $0x44,%xmm4,%xmm4
   DB  196,227,125,24,228,1                ; vinsertf128   $0x1,%xmm4,%ymm0,%ymm4
   DB  197,212,87,237                      ; vxorps        %ymm5,%ymm5,%ymm5
   DB  196,99,85,12,204,64                 ; vblendps      $0x40,%ymm4,%ymm5,%ymm9
   DB  196,99,125,25,204,1                 ; vextractf128  $0x1,%ymm9,%xmm4
-  DB  196,131,89,34,100,152,20,1          ; vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm4,%xmm4
+  DB  196,195,89,34,100,144,20,1          ; vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm4,%xmm4
   DB  196,99,53,24,204,1                  ; vinsertf128   $0x1,%xmm4,%ymm9,%ymm9
   DB  196,99,125,25,204,1                 ; vextractf128  $0x1,%ymm9,%xmm4
-  DB  196,131,89,34,100,152,16,0          ; vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm4,%xmm4
+  DB  196,195,89,34,100,144,16,0          ; vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm4,%xmm4
   DB  196,99,53,24,204,1                  ; vinsertf128   $0x1,%xmm4,%ymm9,%ymm9
-  DB  196,129,121,16,36,152               ; vmovupd       (%r8,%r11,4),%xmm4
+  DB  196,193,121,16,36,144               ; vmovupd       (%r8,%rdx,4),%xmm4
   DB  196,67,93,13,201,12                 ; vblendpd      $0xc,%ymm9,%ymm4,%ymm9
-  DB  233,207,253,255,255                 ; jmpq          99c2 <_sk_srcover_bgra_8888_avx+0x26>
-  DB  196,3,121,22,68,152,8,2             ; vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
-  DB  196,1,121,214,4,152                 ; vmovq         %xmm8,(%r8,%r11,4)
-  DB  233,9,255,255,255                   ; jmpq          9b0f <_sk_srcover_bgra_8888_avx+0x173>
+  DB  233,221,253,255,255                 ; jmpq          9834 <_sk_srcover_bgra_8888_avx+0x20>
+  DB  196,67,121,22,68,144,8,2            ; vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
+  DB  196,65,121,214,4,144                ; vmovq         %xmm8,(%r8,%rdx,4)
+  DB  233,23,255,255,255                  ; jmpq          9981 <_sk_srcover_bgra_8888_avx+0x16d>
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
-  DB  196,3,121,22,76,152,24,2            ; vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
+  DB  196,67,121,22,76,144,24,2           ; vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
-  DB  196,3,121,22,76,152,20,1            ; vpextrd       $0x1,%xmm9,0x14(%r8,%r11,4)
+  DB  196,67,121,22,76,144,20,1           ; vpextrd       $0x1,%xmm9,0x14(%r8,%rdx,4)
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
-  DB  196,1,121,126,76,152,16             ; vmovd         %xmm9,0x10(%r8,%r11,4)
-  DB  196,1,121,17,4,152                  ; vmovupd       %xmm8,(%r8,%r11,4)
-  DB  233,213,254,255,255                 ; jmpq          9b0f <_sk_srcover_bgra_8888_avx+0x173>
+  DB  196,65,121,126,76,144,16            ; vmovd         %xmm9,0x10(%r8,%rdx,4)
+  DB  196,65,121,17,4,144                 ; vmovupd       %xmm8,(%r8,%rdx,4)
+  DB  233,227,254,255,255                 ; jmpq          9981 <_sk_srcover_bgra_8888_avx+0x16d>
   DB  102,144                             ; xchg          %ax,%ax
-  DB  4,255                               ; add           $0xff,%al
+  DB  11,255                              ; or            %edi,%edi
   DB  255                                 ; (bad)
   DB  255,81,255                          ; callq         *-0x1(%rcx)
   DB  255                                 ; (bad)
@@ -9149,7 +9074,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  126,255                             ; jle           9c51 <_sk_srcover_bgra_8888_avx+0x2b5>
+  DB  126,255                             ; jle           9ab5 <_sk_srcover_bgra_8888_avx+0x2a1>
   DB  255                                 ; (bad)
   DB  255,98,255                          ; jmpq          *-0x1(%rdx)
   DB  255                                 ; (bad)
@@ -9183,7 +9108,7 @@
 
 PUBLIC _sk_clamp_1_avx
 _sk_clamp_1_avx LABEL PROC
-  DB  196,98,125,24,5,50,152,2,0          ; vbroadcastss  0x29832(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,162,147,2,0         ; vbroadcastss  0x293a2(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
   DB  196,193,116,93,200                  ; vminps        %ymm8,%ymm1,%ymm1
   DB  196,193,108,93,208                  ; vminps        %ymm8,%ymm2,%ymm2
@@ -9193,7 +9118,7 @@
 
 PUBLIC _sk_clamp_a_avx
 _sk_clamp_a_avx LABEL PROC
-  DB  196,98,125,24,5,17,152,2,0          ; vbroadcastss  0x29811(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,129,147,2,0         ; vbroadcastss  0x29381(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,100,93,216                  ; vminps        %ymm8,%ymm3,%ymm3
   DB  197,252,93,195                      ; vminps        %ymm3,%ymm0,%ymm0
   DB  197,244,93,203                      ; vminps        %ymm3,%ymm1,%ymm1
@@ -9203,7 +9128,7 @@
 
 PUBLIC _sk_clamp_a_dst_avx
 _sk_clamp_a_dst_avx LABEL PROC
-  DB  196,98,125,24,5,243,151,2,0         ; vbroadcastss  0x297f3(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,99,147,2,0          ; vbroadcastss  0x29363(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,68,93,248                   ; vminps        %ymm8,%ymm7,%ymm7
   DB  197,220,93,231                      ; vminps        %ymm7,%ymm4,%ymm4
   DB  197,212,93,239                      ; vminps        %ymm7,%ymm5,%ymm5
@@ -9230,7 +9155,7 @@
 
 PUBLIC _sk_invert_avx
 _sk_invert_avx LABEL PROC
-  DB  196,98,125,24,5,174,151,2,0         ; vbroadcastss  0x297ae(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,30,147,2,0          ; vbroadcastss  0x2931e(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,188,92,192                      ; vsubps        %ymm0,%ymm8,%ymm0
   DB  197,188,92,201                      ; vsubps        %ymm1,%ymm8,%ymm1
   DB  197,188,92,210                      ; vsubps        %ymm2,%ymm8,%ymm2
@@ -9274,9 +9199,9 @@
 
 PUBLIC _sk_unpremul_avx
 _sk_unpremul_avx LABEL PROC
-  DB  196,98,125,24,5,73,151,2,0          ; vbroadcastss  0x29749(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,185,146,2,0         ; vbroadcastss  0x292b9(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,94,195                       ; vdivps        %ymm3,%ymm8,%ymm8
-  DB  196,98,125,24,13,108,151,2,0        ; vbroadcastss  0x2976c(%rip),%ymm9        # 334fc <_sk_srcover_bgra_8888_sse2_lowp+0x2e0>
+  DB  196,98,125,24,13,220,146,2,0        ; vbroadcastss  0x292dc(%rip),%ymm9        # 32ed0 <_sk_srcover_bgra_8888_sse2_lowp+0x2e0>
   DB  196,65,60,194,201,1                 ; vcmpltps      %ymm9,%ymm8,%ymm9
   DB  196,65,44,87,210                    ; vxorps        %ymm10,%ymm10,%ymm10
   DB  196,67,45,74,192,144                ; vblendvps     %ymm9,%ymm8,%ymm10,%ymm8
@@ -9288,17 +9213,17 @@
 
 PUBLIC _sk_from_srgb_avx
 _sk_from_srgb_avx LABEL PROC
-  DB  196,98,125,24,5,70,151,2,0          ; vbroadcastss  0x29746(%rip),%ymm8        # 33500 <_sk_srcover_bgra_8888_sse2_lowp+0x2e4>
+  DB  196,98,125,24,5,182,146,2,0         ; vbroadcastss  0x292b6(%rip),%ymm8        # 32ed4 <_sk_srcover_bgra_8888_sse2_lowp+0x2e4>
   DB  196,65,124,89,200                   ; vmulps        %ymm8,%ymm0,%ymm9
   DB  197,124,89,208                      ; vmulps        %ymm0,%ymm0,%ymm10
-  DB  196,98,125,24,29,32,151,2,0         ; vbroadcastss  0x29720(%rip),%ymm11        # 334ec <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  DB  196,98,125,24,29,144,146,2,0        ; vbroadcastss  0x29290(%rip),%ymm11        # 32ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
   DB  196,65,124,89,227                   ; vmulps        %ymm11,%ymm0,%ymm12
-  DB  196,98,125,24,45,42,151,2,0         ; vbroadcastss  0x2972a(%rip),%ymm13        # 33504 <_sk_srcover_bgra_8888_sse2_lowp+0x2e8>
+  DB  196,98,125,24,45,154,146,2,0        ; vbroadcastss  0x2929a(%rip),%ymm13        # 32ed8 <_sk_srcover_bgra_8888_sse2_lowp+0x2e8>
   DB  196,65,28,88,229                    ; vaddps        %ymm13,%ymm12,%ymm12
   DB  196,65,44,89,212                    ; vmulps        %ymm12,%ymm10,%ymm10
-  DB  196,98,125,24,37,27,151,2,0         ; vbroadcastss  0x2971b(%rip),%ymm12        # 33508 <_sk_srcover_bgra_8888_sse2_lowp+0x2ec>
+  DB  196,98,125,24,37,139,146,2,0        ; vbroadcastss  0x2928b(%rip),%ymm12        # 32edc <_sk_srcover_bgra_8888_sse2_lowp+0x2ec>
   DB  196,65,44,88,212                    ; vaddps        %ymm12,%ymm10,%ymm10
-  DB  196,98,125,24,53,17,151,2,0         ; vbroadcastss  0x29711(%rip),%ymm14        # 3350c <_sk_srcover_bgra_8888_sse2_lowp+0x2f0>
+  DB  196,98,125,24,53,129,146,2,0        ; vbroadcastss  0x29281(%rip),%ymm14        # 32ee0 <_sk_srcover_bgra_8888_sse2_lowp+0x2f0>
   DB  196,193,124,194,198,1               ; vcmpltps      %ymm14,%ymm0,%ymm0
   DB  196,195,45,74,193,0                 ; vblendvps     %ymm0,%ymm9,%ymm10,%ymm0
   DB  196,65,116,89,200                   ; vmulps        %ymm8,%ymm1,%ymm9
@@ -9322,17 +9247,17 @@
 
 PUBLIC _sk_from_srgb_dst_avx
 _sk_from_srgb_dst_avx LABEL PROC
-  DB  196,98,125,24,5,154,150,2,0         ; vbroadcastss  0x2969a(%rip),%ymm8        # 33500 <_sk_srcover_bgra_8888_sse2_lowp+0x2e4>
+  DB  196,98,125,24,5,10,146,2,0          ; vbroadcastss  0x2920a(%rip),%ymm8        # 32ed4 <_sk_srcover_bgra_8888_sse2_lowp+0x2e4>
   DB  196,65,92,89,200                    ; vmulps        %ymm8,%ymm4,%ymm9
   DB  197,92,89,212                       ; vmulps        %ymm4,%ymm4,%ymm10
-  DB  196,98,125,24,29,116,150,2,0        ; vbroadcastss  0x29674(%rip),%ymm11        # 334ec <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
+  DB  196,98,125,24,29,228,145,2,0        ; vbroadcastss  0x291e4(%rip),%ymm11        # 32ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x2d0>
   DB  196,65,92,89,227                    ; vmulps        %ymm11,%ymm4,%ymm12
-  DB  196,98,125,24,45,126,150,2,0        ; vbroadcastss  0x2967e(%rip),%ymm13        # 33504 <_sk_srcover_bgra_8888_sse2_lowp+0x2e8>
+  DB  196,98,125,24,45,238,145,2,0        ; vbroadcastss  0x291ee(%rip),%ymm13        # 32ed8 <_sk_srcover_bgra_8888_sse2_lowp+0x2e8>
   DB  196,65,28,88,229                    ; vaddps        %ymm13,%ymm12,%ymm12
   DB  196,65,44,89,212                    ; vmulps        %ymm12,%ymm10,%ymm10
-  DB  196,98,125,24,37,111,150,2,0        ; vbroadcastss  0x2966f(%rip),%ymm12        # 33508 <_sk_srcover_bgra_8888_sse2_lowp+0x2ec>
+  DB  196,98,125,24,37,223,145,2,0        ; vbroadcastss  0x291df(%rip),%ymm12        # 32edc <_sk_srcover_bgra_8888_sse2_lowp+0x2ec>
   DB  196,65,44,88,212                    ; vaddps        %ymm12,%ymm10,%ymm10
-  DB  196,98,125,24,53,101,150,2,0        ; vbroadcastss  0x29665(%rip),%ymm14        # 3350c <_sk_srcover_bgra_8888_sse2_lowp+0x2f0>
+  DB  196,98,125,24,53,213,145,2,0        ; vbroadcastss  0x291d5(%rip),%ymm14        # 32ee0 <_sk_srcover_bgra_8888_sse2_lowp+0x2f0>
   DB  196,193,92,194,230,1                ; vcmpltps      %ymm14,%ymm4,%ymm4
   DB  196,195,45,74,225,64                ; vblendvps     %ymm4,%ymm9,%ymm10,%ymm4
   DB  196,65,84,89,200                    ; vmulps        %ymm8,%ymm5,%ymm9
@@ -9357,20 +9282,20 @@
 PUBLIC _sk_to_srgb_avx
 _sk_to_srgb_avx LABEL PROC
   DB  197,124,82,200                      ; vrsqrtps      %ymm0,%ymm9
-  DB  196,98,125,24,5,250,149,2,0         ; vbroadcastss  0x295fa(%rip),%ymm8        # 33510 <_sk_srcover_bgra_8888_sse2_lowp+0x2f4>
+  DB  196,98,125,24,5,106,145,2,0         ; vbroadcastss  0x2916a(%rip),%ymm8        # 32ee4 <_sk_srcover_bgra_8888_sse2_lowp+0x2f4>
   DB  196,65,124,89,208                   ; vmulps        %ymm8,%ymm0,%ymm10
-  DB  196,98,125,24,29,244,149,2,0        ; vbroadcastss  0x295f4(%rip),%ymm11        # 33518 <_sk_srcover_bgra_8888_sse2_lowp+0x2fc>
+  DB  196,98,125,24,29,100,145,2,0        ; vbroadcastss  0x29164(%rip),%ymm11        # 32eec <_sk_srcover_bgra_8888_sse2_lowp+0x2fc>
   DB  196,65,52,89,227                    ; vmulps        %ymm11,%ymm9,%ymm12
-  DB  196,98,125,24,45,226,149,2,0        ; vbroadcastss  0x295e2(%rip),%ymm13        # 33514 <_sk_srcover_bgra_8888_sse2_lowp+0x2f8>
+  DB  196,98,125,24,45,82,145,2,0         ; vbroadcastss  0x29152(%rip),%ymm13        # 32ee8 <_sk_srcover_bgra_8888_sse2_lowp+0x2f8>
   DB  196,65,28,88,229                    ; vaddps        %ymm13,%ymm12,%ymm12
   DB  196,65,52,89,228                    ; vmulps        %ymm12,%ymm9,%ymm12
-  DB  196,98,125,24,53,215,149,2,0        ; vbroadcastss  0x295d7(%rip),%ymm14        # 3351c <_sk_srcover_bgra_8888_sse2_lowp+0x300>
+  DB  196,98,125,24,53,71,145,2,0         ; vbroadcastss  0x29147(%rip),%ymm14        # 32ef0 <_sk_srcover_bgra_8888_sse2_lowp+0x300>
   DB  196,65,28,88,230                    ; vaddps        %ymm14,%ymm12,%ymm12
-  DB  196,98,125,24,61,205,149,2,0        ; vbroadcastss  0x295cd(%rip),%ymm15        # 33520 <_sk_srcover_bgra_8888_sse2_lowp+0x304>
+  DB  196,98,125,24,61,61,145,2,0         ; vbroadcastss  0x2913d(%rip),%ymm15        # 32ef4 <_sk_srcover_bgra_8888_sse2_lowp+0x304>
   DB  196,65,52,88,207                    ; vaddps        %ymm15,%ymm9,%ymm9
   DB  196,65,124,83,201                   ; vrcpps        %ymm9,%ymm9
   DB  196,65,52,89,204                    ; vmulps        %ymm12,%ymm9,%ymm9
-  DB  196,98,125,24,37,185,149,2,0        ; vbroadcastss  0x295b9(%rip),%ymm12        # 33524 <_sk_srcover_bgra_8888_sse2_lowp+0x308>
+  DB  196,98,125,24,37,41,145,2,0         ; vbroadcastss  0x29129(%rip),%ymm12        # 32ef8 <_sk_srcover_bgra_8888_sse2_lowp+0x308>
   DB  196,193,124,194,196,1               ; vcmpltps      %ymm12,%ymm0,%ymm0
   DB  196,195,53,74,194,0                 ; vblendvps     %ymm0,%ymm10,%ymm9,%ymm0
   DB  197,124,82,201                      ; vrsqrtps      %ymm1,%ymm9
@@ -9405,7 +9330,7 @@
   DB  197,116,93,202                      ; vminps        %ymm2,%ymm1,%ymm9
   DB  196,65,124,93,201                   ; vminps        %ymm9,%ymm0,%ymm9
   DB  196,65,60,92,209                    ; vsubps        %ymm9,%ymm8,%ymm10
-  DB  196,98,125,24,29,193,148,2,0        ; vbroadcastss  0x294c1(%rip),%ymm11        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,29,49,144,2,0         ; vbroadcastss  0x29031(%rip),%ymm11        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,65,36,94,218                    ; vdivps        %ymm10,%ymm11,%ymm11
   DB  197,116,92,226                      ; vsubps        %ymm2,%ymm1,%ymm12
   DB  196,65,28,89,227                    ; vmulps        %ymm11,%ymm12,%ymm12
@@ -9415,19 +9340,19 @@
   DB  196,193,108,89,211                  ; vmulps        %ymm11,%ymm2,%ymm2
   DB  197,252,92,201                      ; vsubps        %ymm1,%ymm0,%ymm1
   DB  196,193,116,89,203                  ; vmulps        %ymm11,%ymm1,%ymm1
-  DB  196,98,125,24,29,242,148,2,0        ; vbroadcastss  0x294f2(%rip),%ymm11        # 33530 <_sk_srcover_bgra_8888_sse2_lowp+0x314>
+  DB  196,98,125,24,29,98,144,2,0         ; vbroadcastss  0x29062(%rip),%ymm11        # 32f04 <_sk_srcover_bgra_8888_sse2_lowp+0x314>
   DB  196,193,116,88,203                  ; vaddps        %ymm11,%ymm1,%ymm1
-  DB  196,98,125,24,29,224,148,2,0        ; vbroadcastss  0x294e0(%rip),%ymm11        # 3352c <_sk_srcover_bgra_8888_sse2_lowp+0x310>
+  DB  196,98,125,24,29,80,144,2,0         ; vbroadcastss  0x29050(%rip),%ymm11        # 32f00 <_sk_srcover_bgra_8888_sse2_lowp+0x310>
   DB  196,193,108,88,211                  ; vaddps        %ymm11,%ymm2,%ymm2
   DB  196,227,117,74,202,224              ; vblendvps     %ymm14,%ymm2,%ymm1,%ymm1
-  DB  196,226,125,24,21,200,148,2,0       ; vbroadcastss  0x294c8(%rip),%ymm2        # 33528 <_sk_srcover_bgra_8888_sse2_lowp+0x30c>
+  DB  196,226,125,24,21,56,144,2,0        ; vbroadcastss  0x29038(%rip),%ymm2        # 32efc <_sk_srcover_bgra_8888_sse2_lowp+0x30c>
   DB  196,65,12,87,246                    ; vxorps        %ymm14,%ymm14,%ymm14
   DB  196,227,13,74,210,208               ; vblendvps     %ymm13,%ymm2,%ymm14,%ymm2
   DB  197,188,194,192,0                   ; vcmpeqps      %ymm0,%ymm8,%ymm0
   DB  196,193,108,88,212                  ; vaddps        %ymm12,%ymm2,%ymm2
   DB  196,227,117,74,194,0                ; vblendvps     %ymm0,%ymm2,%ymm1,%ymm0
   DB  196,193,60,88,201                   ; vaddps        %ymm9,%ymm8,%ymm1
-  DB  196,98,125,24,37,63,148,2,0         ; vbroadcastss  0x2943f(%rip),%ymm12        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,37,175,143,2,0        ; vbroadcastss  0x28faf(%rip),%ymm12        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,193,116,89,212                  ; vmulps        %ymm12,%ymm1,%ymm2
   DB  197,28,194,226,1                    ; vcmpltps      %ymm2,%ymm12,%ymm12
   DB  196,65,36,92,216                    ; vsubps        %ymm8,%ymm11,%ymm11
@@ -9437,7 +9362,7 @@
   DB  197,172,94,201                      ; vdivps        %ymm1,%ymm10,%ymm1
   DB  196,195,125,74,198,128              ; vblendvps     %ymm8,%ymm14,%ymm0,%ymm0
   DB  196,195,117,74,206,128              ; vblendvps     %ymm8,%ymm14,%ymm1,%ymm1
-  DB  196,98,125,24,5,114,148,2,0         ; vbroadcastss  0x29472(%rip),%ymm8        # 33534 <_sk_srcover_bgra_8888_sse2_lowp+0x318>
+  DB  196,98,125,24,5,226,143,2,0         ; vbroadcastss  0x28fe2(%rip),%ymm8        # 32f08 <_sk_srcover_bgra_8888_sse2_lowp+0x318>
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -9452,7 +9377,7 @@
   DB  197,252,17,28,36                    ; vmovups       %ymm3,(%rsp)
   DB  197,252,40,225                      ; vmovaps       %ymm1,%ymm4
   DB  197,252,40,216                      ; vmovaps       %ymm0,%ymm3
-  DB  196,98,125,24,5,197,147,2,0         ; vbroadcastss  0x293c5(%rip),%ymm8        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,5,53,143,2,0          ; vbroadcastss  0x28f35(%rip),%ymm8        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  197,60,194,202,2                    ; vcmpleps      %ymm2,%ymm8,%ymm9
   DB  197,92,89,210                       ; vmulps        %ymm2,%ymm4,%ymm10
   DB  196,65,92,92,218                    ; vsubps        %ymm10,%ymm4,%ymm11
@@ -9460,23 +9385,23 @@
   DB  197,52,88,210                       ; vaddps        %ymm2,%ymm9,%ymm10
   DB  197,108,88,202                      ; vaddps        %ymm2,%ymm2,%ymm9
   DB  196,65,52,92,202                    ; vsubps        %ymm10,%ymm9,%ymm9
-  DB  196,98,125,24,29,11,148,2,0         ; vbroadcastss  0x2940b(%rip),%ymm11        # 33538 <_sk_srcover_bgra_8888_sse2_lowp+0x31c>
+  DB  196,98,125,24,29,123,143,2,0        ; vbroadcastss  0x28f7b(%rip),%ymm11        # 32f0c <_sk_srcover_bgra_8888_sse2_lowp+0x31c>
   DB  196,65,100,88,219                   ; vaddps        %ymm11,%ymm3,%ymm11
   DB  196,67,125,8,227,1                  ; vroundps      $0x1,%ymm11,%ymm12
   DB  196,65,36,92,252                    ; vsubps        %ymm12,%ymm11,%ymm15
   DB  196,65,44,92,217                    ; vsubps        %ymm9,%ymm10,%ymm11
-  DB  196,98,125,24,37,221,147,2,0        ; vbroadcastss  0x293dd(%rip),%ymm12        # 33528 <_sk_srcover_bgra_8888_sse2_lowp+0x30c>
+  DB  196,98,125,24,37,77,143,2,0         ; vbroadcastss  0x28f4d(%rip),%ymm12        # 32efc <_sk_srcover_bgra_8888_sse2_lowp+0x30c>
   DB  196,193,4,89,196                    ; vmulps        %ymm12,%ymm15,%ymm0
-  DB  196,98,125,24,45,215,147,2,0        ; vbroadcastss  0x293d7(%rip),%ymm13        # 33530 <_sk_srcover_bgra_8888_sse2_lowp+0x314>
+  DB  196,98,125,24,45,71,143,2,0         ; vbroadcastss  0x28f47(%rip),%ymm13        # 32f04 <_sk_srcover_bgra_8888_sse2_lowp+0x314>
   DB  197,20,92,240                       ; vsubps        %ymm0,%ymm13,%ymm14
   DB  196,65,36,89,246                    ; vmulps        %ymm14,%ymm11,%ymm14
   DB  196,65,52,88,246                    ; vaddps        %ymm14,%ymm9,%ymm14
-  DB  196,226,125,24,13,204,147,2,0       ; vbroadcastss  0x293cc(%rip),%ymm1        # 3353c <_sk_srcover_bgra_8888_sse2_lowp+0x320>
+  DB  196,226,125,24,13,60,143,2,0        ; vbroadcastss  0x28f3c(%rip),%ymm1        # 32f10 <_sk_srcover_bgra_8888_sse2_lowp+0x320>
   DB  196,193,116,194,255,2               ; vcmpleps      %ymm15,%ymm1,%ymm7
   DB  196,195,13,74,249,112               ; vblendvps     %ymm7,%ymm9,%ymm14,%ymm7
   DB  196,65,60,194,247,2                 ; vcmpleps      %ymm15,%ymm8,%ymm14
   DB  196,227,45,74,255,224               ; vblendvps     %ymm14,%ymm7,%ymm10,%ymm7
-  DB  196,98,125,24,53,163,147,2,0        ; vbroadcastss  0x293a3(%rip),%ymm14        # 33534 <_sk_srcover_bgra_8888_sse2_lowp+0x318>
+  DB  196,98,125,24,53,19,143,2,0         ; vbroadcastss  0x28f13(%rip),%ymm14        # 32f08 <_sk_srcover_bgra_8888_sse2_lowp+0x318>
   DB  196,65,12,194,255,2                 ; vcmpleps      %ymm15,%ymm14,%ymm15
   DB  196,193,124,89,195                  ; vmulps        %ymm11,%ymm0,%ymm0
   DB  197,180,88,192                      ; vaddps        %ymm0,%ymm9,%ymm0
@@ -9495,7 +9420,7 @@
   DB  197,164,89,247                      ; vmulps        %ymm7,%ymm11,%ymm6
   DB  197,180,88,246                      ; vaddps        %ymm6,%ymm9,%ymm6
   DB  196,227,77,74,237,0                 ; vblendvps     %ymm0,%ymm5,%ymm6,%ymm5
-  DB  196,226,125,24,5,77,147,2,0         ; vbroadcastss  0x2934d(%rip),%ymm0        # 33540 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  DB  196,226,125,24,5,189,142,2,0        ; vbroadcastss  0x28ebd(%rip),%ymm0        # 32f14 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
   DB  197,228,88,192                      ; vaddps        %ymm0,%ymm3,%ymm0
   DB  196,227,125,8,216,1                 ; vroundps      $0x1,%ymm0,%ymm3
   DB  197,252,92,195                      ; vsubps        %ymm3,%ymm0,%ymm0
@@ -9539,21 +9464,19 @@
 PUBLIC _sk_scale_u8_avx
 _sk_scale_u8_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,75                              ; jne           a2ff <_sk_scale_u8_avx+0x63>
-  DB  196,2,121,48,4,24                   ; vpmovzxbw     (%r8,%r11,1),%xmm8
-  DB  197,57,219,5,110,155,2,0            ; vpand         0x29b6e(%rip),%xmm8,%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  117,75                              ; jne           a15d <_sk_scale_u8_avx+0x5d>
+  DB  196,66,121,48,4,16                  ; vpmovzxbw     (%r8,%rdx,1),%xmm8
+  DB  197,57,219,5,240,150,2,0            ; vpand         0x296f0(%rip),%xmm8,%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  196,66,121,51,200                   ; vpmovzxwd     %xmm8,%xmm9
   DB  196,65,121,112,192,78               ; vpshufd       $0x4e,%xmm8,%xmm8
   DB  196,66,121,51,192                   ; vpmovzxwd     %xmm8,%xmm8
   DB  196,67,53,24,192,1                  ; vinsertf128   $0x1,%xmm8,%ymm9,%ymm8
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
-  DB  196,98,125,24,13,94,146,2,0         ; vbroadcastss  0x2925e(%rip),%ymm9        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,98,125,24,13,212,141,2,0        ; vbroadcastss  0x28dd4(%rip),%ymm9        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
   DB  197,188,89,192                      ; vmulps        %ymm0,%ymm8,%ymm0
   DB  197,188,89,201                      ; vmulps        %ymm1,%ymm8,%ymm1
@@ -9561,56 +9484,54 @@
   DB  197,188,89,219                      ; vmulps        %ymm3,%ymm8,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,166                             ; ja            a2ba <_sk_scale_u8_avx+0x1e>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,121,0,0,0                 ; lea           0x79(%rip),%r10        # a398 <_sk_scale_u8_avx+0xfc>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,172                             ; ja            a118 <_sk_scale_u8_avx+0x18>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,122,0,0,0                 ; lea           0x7a(%rip),%r9        # a1f0 <_sk_scale_u8_avx+0xf0>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  67,15,182,4,24                      ; movzbl        (%r8,%r11,1),%eax
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
-  DB  235,135                             ; jmp           a2ba <_sk_scale_u8_avx+0x1e>
-  DB  67,15,182,68,24,2                   ; movzbl        0x2(%r8,%r11,1),%eax
+  DB  235,142                             ; jmp           a118 <_sk_scale_u8_avx+0x18>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  197,57,196,192,2                    ; vpinsrw       $0x2,%eax,%xmm8,%xmm8
-  DB  67,15,183,4,24                      ; movzwl        (%r8,%r11,1),%eax
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  197,121,110,200                     ; vmovd         %eax,%xmm9
   DB  196,66,121,48,201                   ; vpmovzxbw     %xmm9,%xmm9
   DB  196,67,57,14,193,3                  ; vpblendw      $0x3,%xmm9,%xmm8,%xmm8
-  DB  233,94,255,255,255                  ; jmpq          a2ba <_sk_scale_u8_avx+0x1e>
-  DB  67,15,182,68,24,6                   ; movzbl        0x6(%r8,%r11,1),%eax
+  DB  233,101,255,255,255                 ; jmpq          a118 <_sk_scale_u8_avx+0x18>
+  DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  197,57,196,192,6                    ; vpinsrw       $0x6,%eax,%xmm8,%xmm8
-  DB  67,15,182,68,24,5                   ; movzbl        0x5(%r8,%r11,1),%eax
+  DB  65,15,182,68,16,5                   ; movzbl        0x5(%r8,%rdx,1),%eax
   DB  197,57,196,192,5                    ; vpinsrw       $0x5,%eax,%xmm8,%xmm8
-  DB  67,15,182,68,24,4                   ; movzbl        0x4(%r8,%r11,1),%eax
+  DB  65,15,182,68,16,4                   ; movzbl        0x4(%r8,%rdx,1),%eax
   DB  197,57,196,192,4                    ; vpinsrw       $0x4,%eax,%xmm8,%xmm8
-  DB  196,1,121,110,12,24                 ; vmovd         (%r8,%r11,1),%xmm9
+  DB  196,65,121,110,12,16                ; vmovd         (%r8,%rdx,1),%xmm9
   DB  196,66,121,48,201                   ; vpmovzxbw     %xmm9,%xmm9
   DB  196,67,49,14,192,240                ; vpblendw      $0xf0,%xmm8,%xmm9,%xmm8
-  DB  233,34,255,255,255                  ; jmpq          a2ba <_sk_scale_u8_avx+0x1e>
+  DB  233,41,255,255,255                  ; jmpq          a118 <_sk_scale_u8_avx+0x18>
   DB  144                                 ; nop
+  DB  143                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,171,255,255,255,155             ; ljmp          *-0x64000001(%rbx)
+  DB  255,170,255,255,255,154             ; ljmp          *-0x65000001(%rdx)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  234                                 ; (bad)
+  DB  233,255,255,255,222                 ; jmpq          ffffffffdf00a200 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffdefd7610>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  223,255                             ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,212                             ; callq         *%rsp
+  DB  255,211                             ; callq         *%rbx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,196                             ; inc           %esp
+  DB  255,195                             ; inc           %ebx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -9618,33 +9539,31 @@
 PUBLIC _sk_scale_565_avx
 _sk_scale_565_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,178,0,0,0                    ; jne           a485 <_sk_scale_565_avx+0xd1>
-  DB  196,1,122,111,4,88                  ; vmovdqu       (%r8,%r11,2),%xmm8
+  DB  15,133,178,0,0,0                    ; jne           a2d7 <_sk_scale_565_avx+0xcb>
+  DB  196,65,122,111,4,80                 ; vmovdqu       (%r8,%rdx,2),%xmm8
   DB  196,66,121,51,200                   ; vpmovzxwd     %xmm8,%xmm9
   DB  196,65,121,112,192,78               ; vpshufd       $0x4e,%xmm8,%xmm8
   DB  196,66,121,51,192                   ; vpmovzxwd     %xmm8,%xmm8
   DB  196,67,53,24,192,1                  ; vinsertf128   $0x1,%xmm8,%ymm9,%ymm8
-  DB  196,98,125,24,13,80,145,2,0         ; vbroadcastss  0x29150(%rip),%ymm9        # 33548 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  DB  196,98,125,24,13,210,140,2,0        ; vbroadcastss  0x28cd2(%rip),%ymm9        # 32f1c <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
   DB  196,65,60,84,201                    ; vandps        %ymm9,%ymm8,%ymm9
   DB  196,65,124,91,201                   ; vcvtdq2ps     %ymm9,%ymm9
-  DB  196,98,125,24,21,65,145,2,0         ; vbroadcastss  0x29141(%rip),%ymm10        # 3354c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  DB  196,98,125,24,21,195,140,2,0        ; vbroadcastss  0x28cc3(%rip),%ymm10        # 32f20 <_sk_srcover_bgra_8888_sse2_lowp+0x330>
   DB  196,65,52,89,202                    ; vmulps        %ymm10,%ymm9,%ymm9
-  DB  196,98,125,24,21,55,145,2,0         ; vbroadcastss  0x29137(%rip),%ymm10        # 33550 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  DB  196,98,125,24,21,185,140,2,0        ; vbroadcastss  0x28cb9(%rip),%ymm10        # 32f24 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
   DB  196,65,60,84,210                    ; vandps        %ymm10,%ymm8,%ymm10
   DB  196,65,124,91,210                   ; vcvtdq2ps     %ymm10,%ymm10
-  DB  196,98,125,24,29,40,145,2,0         ; vbroadcastss  0x29128(%rip),%ymm11        # 33554 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  DB  196,98,125,24,29,170,140,2,0        ; vbroadcastss  0x28caa(%rip),%ymm11        # 32f28 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
   DB  196,65,44,89,211                    ; vmulps        %ymm11,%ymm10,%ymm10
-  DB  196,98,125,24,29,30,145,2,0         ; vbroadcastss  0x2911e(%rip),%ymm11        # 33558 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  DB  196,98,125,24,29,160,140,2,0        ; vbroadcastss  0x28ca0(%rip),%ymm11        # 32f2c <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
   DB  196,65,60,84,195                    ; vandps        %ymm11,%ymm8,%ymm8
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
-  DB  196,98,125,24,29,15,145,2,0         ; vbroadcastss  0x2910f(%rip),%ymm11        # 3355c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  DB  196,98,125,24,29,145,140,2,0        ; vbroadcastss  0x28c91(%rip),%ymm11        # 32f30 <_sk_srcover_bgra_8888_sse2_lowp+0x340>
   DB  196,65,60,89,195                    ; vmulps        %ymm11,%ymm8,%ymm8
   DB  197,100,194,223,1                   ; vcmpltps      %ymm7,%ymm3,%ymm11
   DB  196,65,44,93,224                    ; vminps        %ymm8,%ymm10,%ymm12
@@ -9658,47 +9577,49 @@
   DB  197,164,89,219                      ; vmulps        %ymm3,%ymm11,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,59,255,255,255               ; ja            a3d9 <_sk_scale_565_avx+0x25>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,99,0,0,0                  ; lea           0x63(%rip),%r10        # a50c <_sk_scale_565_avx+0x158>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  15,135,65,255,255,255               ; ja            a22b <_sk_scale_565_avx+0x1f>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,100,0,0,0                 ; lea           0x64(%rip),%r9        # a358 <_sk_scale_565_avx+0x14c>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  67,15,183,4,88                      ; movzwl        (%r8,%r11,2),%eax
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
-  DB  233,25,255,255,255                  ; jmpq          a3d9 <_sk_scale_565_avx+0x25>
+  DB  233,32,255,255,255                  ; jmpq          a22b <_sk_scale_565_avx+0x1f>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
-  DB  196,1,57,196,68,88,4,2              ; vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm8,%xmm8
-  DB  196,1,121,110,12,88                 ; vmovd         (%r8,%r11,2),%xmm9
+  DB  196,65,57,196,68,80,4,2             ; vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm8,%xmm8
+  DB  196,65,121,110,12,80                ; vmovd         (%r8,%rdx,2),%xmm9
   DB  196,67,57,14,193,3                  ; vpblendw      $0x3,%xmm9,%xmm8,%xmm8
-  DB  233,251,254,255,255                 ; jmpq          a3d9 <_sk_scale_565_avx+0x25>
+  DB  233,2,255,255,255                   ; jmpq          a22b <_sk_scale_565_avx+0x1f>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
-  DB  196,1,57,196,68,88,12,6             ; vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm8,%xmm8
-  DB  196,1,57,196,68,88,10,5             ; vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm8,%xmm8
-  DB  196,1,57,196,68,88,8,4              ; vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm8,%xmm8
-  DB  196,1,122,126,12,88                 ; vmovq         (%r8,%r11,2),%xmm9
+  DB  196,65,57,196,68,80,12,6            ; vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm8,%xmm8
+  DB  196,65,57,196,68,80,10,5            ; vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm8,%xmm8
+  DB  196,65,57,196,68,80,8,4             ; vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm8,%xmm8
+  DB  196,65,122,126,12,80                ; vmovq         (%r8,%rdx,2),%xmm9
   DB  196,67,49,14,192,240                ; vpblendw      $0xf0,%xmm8,%xmm9,%xmm8
-  DB  233,205,254,255,255                 ; jmpq          a3d9 <_sk_scale_565_avx+0x25>
-  DB  166                                 ; cmpsb         %es:(%rdi),%ds:(%rsi)
+  DB  233,212,254,255,255                 ; jmpq          a22b <_sk_scale_565_avx+0x1f>
+  DB  144                                 ; nop
+  DB  165                                 ; movsl         %ds:(%rsi),%es:(%rdi)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,193                             ; inc           %ecx
+  DB  255,192                             ; inc           %eax
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,180,255,255,255,239,255         ; pushq         -0x100001(%rdi,%rdi,8)
+  DB  255,179,255,255,255,238             ; pushq         -0x11000001(%rbx)
   DB  255                                 ; (bad)
-  DB  255,231                             ; jmpq          *%rdi
+  DB  255                                 ; (bad)
+  DB  255,230                             ; jmpq          *%rsi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  223,255                             ; (bad)
+  DB  222,255                             ; fdivrp        %st,%st(7)
   DB  255                                 ; (bad)
-  DB  255,210                             ; callq         *%rdx
+  DB  255,209                             ; callq         *%rcx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -9725,21 +9646,19 @@
 PUBLIC _sk_lerp_u8_avx
 _sk_lerp_u8_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,111                             ; jne           a5ee <_sk_lerp_u8_avx+0x87>
-  DB  196,2,121,48,4,24                   ; vpmovzxbw     (%r8,%r11,1),%xmm8
-  DB  197,57,219,5,163,152,2,0            ; vpand         0x298a3(%rip),%xmm8,%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  117,111                             ; jne           a434 <_sk_lerp_u8_avx+0x81>
+  DB  196,66,121,48,4,16                  ; vpmovzxbw     (%r8,%rdx,1),%xmm8
+  DB  197,57,219,5,61,148,2,0             ; vpand         0x2943d(%rip),%xmm8,%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  196,66,121,51,200                   ; vpmovzxwd     %xmm8,%xmm9
   DB  196,65,121,112,192,78               ; vpshufd       $0x4e,%xmm8,%xmm8
   DB  196,66,121,51,192                   ; vpmovzxwd     %xmm8,%xmm8
   DB  196,67,53,24,192,1                  ; vinsertf128   $0x1,%xmm8,%ymm9,%ymm8
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
-  DB  196,98,125,24,13,147,143,2,0        ; vbroadcastss  0x28f93(%rip),%ymm9        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,98,125,24,13,33,139,2,0         ; vbroadcastss  0x28b21(%rip),%ymm9        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
   DB  197,252,92,196                      ; vsubps        %ymm4,%ymm0,%ymm0
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
@@ -9755,53 +9674,55 @@
   DB  197,228,88,223                      ; vaddps        %ymm7,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,130                             ; ja            a585 <_sk_lerp_u8_avx+0x1e>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,126,0,0,0                 ; lea           0x7e(%rip),%r10        # a68c <_sk_lerp_u8_avx+0x125>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,136                             ; ja            a3cb <_sk_lerp_u8_avx+0x18>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,127,0,0,0                 ; lea           0x7f(%rip),%r9        # a4cc <_sk_lerp_u8_avx+0x119>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  67,15,182,4,24                      ; movzbl        (%r8,%r11,1),%eax
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
-  DB  233,96,255,255,255                  ; jmpq          a585 <_sk_lerp_u8_avx+0x1e>
-  DB  67,15,182,68,24,2                   ; movzbl        0x2(%r8,%r11,1),%eax
+  DB  233,103,255,255,255                 ; jmpq          a3cb <_sk_lerp_u8_avx+0x18>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  197,57,196,192,2                    ; vpinsrw       $0x2,%eax,%xmm8,%xmm8
-  DB  67,15,183,4,24                      ; movzwl        (%r8,%r11,1),%eax
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  197,121,110,200                     ; vmovd         %eax,%xmm9
   DB  196,66,121,48,201                   ; vpmovzxbw     %xmm9,%xmm9
   DB  196,67,57,14,193,3                  ; vpblendw      $0x3,%xmm9,%xmm8,%xmm8
-  DB  233,55,255,255,255                  ; jmpq          a585 <_sk_lerp_u8_avx+0x1e>
-  DB  67,15,182,68,24,6                   ; movzbl        0x6(%r8,%r11,1),%eax
+  DB  233,62,255,255,255                  ; jmpq          a3cb <_sk_lerp_u8_avx+0x18>
+  DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  197,57,196,192,6                    ; vpinsrw       $0x6,%eax,%xmm8,%xmm8
-  DB  67,15,182,68,24,5                   ; movzbl        0x5(%r8,%r11,1),%eax
+  DB  65,15,182,68,16,5                   ; movzbl        0x5(%r8,%rdx,1),%eax
   DB  197,57,196,192,5                    ; vpinsrw       $0x5,%eax,%xmm8,%xmm8
-  DB  67,15,182,68,24,4                   ; movzbl        0x4(%r8,%r11,1),%eax
+  DB  65,15,182,68,16,4                   ; movzbl        0x4(%r8,%rdx,1),%eax
   DB  197,57,196,192,4                    ; vpinsrw       $0x4,%eax,%xmm8,%xmm8
-  DB  196,1,121,110,12,24                 ; vmovd         (%r8,%r11,1),%xmm9
+  DB  196,65,121,110,12,16                ; vmovd         (%r8,%rdx,1),%xmm9
   DB  196,66,121,48,201                   ; vpmovzxbw     %xmm9,%xmm9
   DB  196,67,49,14,192,240                ; vpblendw      $0xf0,%xmm8,%xmm9,%xmm8
-  DB  233,251,254,255,255                 ; jmpq          a585 <_sk_lerp_u8_avx+0x1e>
-  DB  102,144                             ; xchg          %ax,%ax
-  DB  139,255                             ; mov           %edi,%edi
+  DB  233,2,255,255,255                   ; jmpq          a3cb <_sk_lerp_u8_avx+0x18>
+  DB  15,31,0                             ; nopl          (%rax)
+  DB  138,255                             ; mov           %bh,%bh
   DB  255                                 ; (bad)
-  DB  255,169,255,255,255,153             ; ljmp          *-0x66000001(%rcx)
+  DB  255,168,255,255,255,152             ; ljmp          *-0x67000001(%rax)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,231                             ; jmpq          *%rdi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  232,255,255,255,221                 ; callq         ffffffffde00a69c <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddfd7480>
+  DB  220,255                             ; fdivr         %st,%st(7)
+  DB  255                                 ; (bad)
+  DB  255,209                             ; callq         *%rcx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,210                             ; callq         *%rdx
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,194                             ; inc           %edx
+  DB  255,193                             ; inc           %ecx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -9809,33 +9730,31 @@
 PUBLIC _sk_lerp_565_avx
 _sk_lerp_565_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,214,0,0,0                    ; jne           a79d <_sk_lerp_565_avx+0xf5>
-  DB  196,1,122,111,4,88                  ; vmovdqu       (%r8,%r11,2),%xmm8
+  DB  15,133,214,0,0,0                    ; jne           a5d7 <_sk_lerp_565_avx+0xef>
+  DB  196,65,122,111,4,80                 ; vmovdqu       (%r8,%rdx,2),%xmm8
   DB  196,66,121,51,200                   ; vpmovzxwd     %xmm8,%xmm9
   DB  196,65,121,112,192,78               ; vpshufd       $0x4e,%xmm8,%xmm8
   DB  196,66,121,51,192                   ; vpmovzxwd     %xmm8,%xmm8
   DB  196,67,53,24,192,1                  ; vinsertf128   $0x1,%xmm8,%ymm9,%ymm8
-  DB  196,98,125,24,13,92,142,2,0         ; vbroadcastss  0x28e5c(%rip),%ymm9        # 33548 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  DB  196,98,125,24,13,246,137,2,0        ; vbroadcastss  0x289f6(%rip),%ymm9        # 32f1c <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
   DB  196,65,60,84,201                    ; vandps        %ymm9,%ymm8,%ymm9
   DB  196,65,124,91,201                   ; vcvtdq2ps     %ymm9,%ymm9
-  DB  196,98,125,24,21,77,142,2,0         ; vbroadcastss  0x28e4d(%rip),%ymm10        # 3354c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  DB  196,98,125,24,21,231,137,2,0        ; vbroadcastss  0x289e7(%rip),%ymm10        # 32f20 <_sk_srcover_bgra_8888_sse2_lowp+0x330>
   DB  196,65,52,89,202                    ; vmulps        %ymm10,%ymm9,%ymm9
-  DB  196,98,125,24,21,67,142,2,0         ; vbroadcastss  0x28e43(%rip),%ymm10        # 33550 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  DB  196,98,125,24,21,221,137,2,0        ; vbroadcastss  0x289dd(%rip),%ymm10        # 32f24 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
   DB  196,65,60,84,210                    ; vandps        %ymm10,%ymm8,%ymm10
   DB  196,65,124,91,210                   ; vcvtdq2ps     %ymm10,%ymm10
-  DB  196,98,125,24,29,52,142,2,0         ; vbroadcastss  0x28e34(%rip),%ymm11        # 33554 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  DB  196,98,125,24,29,206,137,2,0        ; vbroadcastss  0x289ce(%rip),%ymm11        # 32f28 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
   DB  196,65,44,89,211                    ; vmulps        %ymm11,%ymm10,%ymm10
-  DB  196,98,125,24,29,42,142,2,0         ; vbroadcastss  0x28e2a(%rip),%ymm11        # 33558 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  DB  196,98,125,24,29,196,137,2,0        ; vbroadcastss  0x289c4(%rip),%ymm11        # 32f2c <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
   DB  196,65,60,84,195                    ; vandps        %ymm11,%ymm8,%ymm8
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
-  DB  196,98,125,24,29,27,142,2,0         ; vbroadcastss  0x28e1b(%rip),%ymm11        # 3355c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  DB  196,98,125,24,29,181,137,2,0        ; vbroadcastss  0x289b5(%rip),%ymm11        # 32f30 <_sk_srcover_bgra_8888_sse2_lowp+0x340>
   DB  196,65,60,89,195                    ; vmulps        %ymm11,%ymm8,%ymm8
   DB  197,100,194,223,1                   ; vcmpltps      %ymm7,%ymm3,%ymm11
   DB  196,65,44,93,224                    ; vminps        %ymm8,%ymm10,%ymm12
@@ -9857,47 +9776,49 @@
   DB  197,228,88,223                      ; vaddps        %ymm7,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,23,255,255,255               ; ja            a6cd <_sk_lerp_565_avx+0x25>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,99,0,0,0                  ; lea           0x63(%rip),%r10        # a824 <_sk_lerp_565_avx+0x17c>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  15,135,29,255,255,255               ; ja            a507 <_sk_lerp_565_avx+0x1f>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,100,0,0,0                 ; lea           0x64(%rip),%r9        # a658 <_sk_lerp_565_avx+0x170>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  67,15,183,4,88                      ; movzwl        (%r8,%r11,2),%eax
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
-  DB  233,245,254,255,255                 ; jmpq          a6cd <_sk_lerp_565_avx+0x25>
+  DB  233,252,254,255,255                 ; jmpq          a507 <_sk_lerp_565_avx+0x1f>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
-  DB  196,1,57,196,68,88,4,2              ; vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm8,%xmm8
-  DB  196,1,121,110,12,88                 ; vmovd         (%r8,%r11,2),%xmm9
+  DB  196,65,57,196,68,80,4,2             ; vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm8,%xmm8
+  DB  196,65,121,110,12,80                ; vmovd         (%r8,%rdx,2),%xmm9
   DB  196,67,57,14,193,3                  ; vpblendw      $0x3,%xmm9,%xmm8,%xmm8
-  DB  233,215,254,255,255                 ; jmpq          a6cd <_sk_lerp_565_avx+0x25>
+  DB  233,222,254,255,255                 ; jmpq          a507 <_sk_lerp_565_avx+0x1f>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
-  DB  196,1,57,196,68,88,12,6             ; vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm8,%xmm8
-  DB  196,1,57,196,68,88,10,5             ; vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm8,%xmm8
-  DB  196,1,57,196,68,88,8,4              ; vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm8,%xmm8
-  DB  196,1,122,126,12,88                 ; vmovq         (%r8,%r11,2),%xmm9
+  DB  196,65,57,196,68,80,12,6            ; vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm8,%xmm8
+  DB  196,65,57,196,68,80,10,5            ; vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm8,%xmm8
+  DB  196,65,57,196,68,80,8,4             ; vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm8,%xmm8
+  DB  196,65,122,126,12,80                ; vmovq         (%r8,%rdx,2),%xmm9
   DB  196,67,49,14,192,240                ; vpblendw      $0xf0,%xmm8,%xmm9,%xmm8
-  DB  233,169,254,255,255                 ; jmpq          a6cd <_sk_lerp_565_avx+0x25>
-  DB  166                                 ; cmpsb         %es:(%rdi),%ds:(%rsi)
+  DB  233,176,254,255,255                 ; jmpq          a507 <_sk_lerp_565_avx+0x1f>
+  DB  144                                 ; nop
+  DB  165                                 ; movsl         %ds:(%rsi),%es:(%rdi)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,193                             ; inc           %ecx
+  DB  255,192                             ; inc           %eax
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,180,255,255,255,239,255         ; pushq         -0x100001(%rdi,%rdi,8)
+  DB  255,179,255,255,255,238             ; pushq         -0x11000001(%rbx)
   DB  255                                 ; (bad)
-  DB  255,231                             ; jmpq          *%rdi
+  DB  255                                 ; (bad)
+  DB  255,230                             ; jmpq          *%rsi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  223,255                             ; (bad)
+  DB  222,255                             ; fdivrp        %st,%st(7)
   DB  255                                 ; (bad)
-  DB  255,210                             ; callq         *%rdx
+  DB  255,209                             ; callq         *%rcx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -9909,9 +9830,9 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,7,2,0,0                      ; jne           aa5e <_sk_load_tables_avx+0x21e>
+  DB  15,133,7,2,0,0                      ; jne           a892 <_sk_load_tables_avx+0x21e>
   DB  196,65,125,16,20,144                ; vmovupd       (%r8,%rdx,4),%ymm10
-  DB  197,125,40,13,59,146,2,0            ; vmovapd       0x2923b(%rip),%ymm9        # 33aa0 <_sk_srcover_bgra_8888_sse2_lowp+0x884>
+  DB  197,125,40,13,231,141,2,0           ; vmovapd       0x28de7(%rip),%ymm9        # 33480 <_sk_srcover_bgra_8888_sse2_lowp+0x890>
   DB  196,193,45,84,201                   ; vandpd        %ymm9,%ymm10,%ymm1
   DB  196,227,125,25,200,1                ; vextractf128  $0x1,%ymm1,%xmm0
   DB  196,193,249,126,192                 ; vmovq         %xmm0,%r8
@@ -10003,7 +9924,7 @@
   DB  196,193,65,114,213,24               ; vpsrld        $0x18,%xmm13,%xmm7
   DB  196,227,101,24,223,1                ; vinsertf128   $0x1,%xmm7,%ymm3,%ymm3
   DB  197,252,91,219                      ; vcvtdq2ps     %ymm3,%ymm3
-  DB  196,226,125,24,61,247,138,2,0       ; vbroadcastss  0x28af7(%rip),%ymm7        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,226,125,24,61,151,134,2,0       ; vbroadcastss  0x28697(%rip),%ymm7        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  197,228,89,223                      ; vmulps        %ymm7,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,252,16,60,36                    ; vmovups       (%rsp),%ymm7
@@ -10014,21 +9935,21 @@
   DB  196,65,44,87,210                    ; vxorps        %ymm10,%ymm10,%ymm10
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,230,253,255,255              ; ja            a85d <_sk_load_tables_avx+0x1d>
+  DB  15,135,230,253,255,255              ; ja            a691 <_sk_load_tables_avx+0x1d>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,146,0,0,0                 ; lea           0x92(%rip),%r10        # ab14 <_sk_load_tables_avx+0x2d4>
+  DB  76,141,21,146,0,0,0                 ; lea           0x92(%rip),%r10        # a948 <_sk_load_tables_avx+0x2d4>
   DB  79,99,12,138                        ; movslq        (%r10,%r9,4),%r9
   DB  77,1,209                            ; add           %r10,%r9
   DB  65,255,225                          ; jmpq          *%r9
   DB  196,65,122,16,20,144                ; vmovss        (%r8,%rdx,4),%xmm10
-  DB  233,198,253,255,255                 ; jmpq          a85d <_sk_load_tables_avx+0x1d>
+  DB  233,198,253,255,255                 ; jmpq          a691 <_sk_load_tables_avx+0x1d>
   DB  196,193,121,110,68,144,8            ; vmovd         0x8(%r8,%rdx,4),%xmm0
   DB  197,249,112,192,68                  ; vpshufd       $0x44,%xmm0,%xmm0
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  196,99,117,12,208,4                 ; vblendps      $0x4,%ymm0,%ymm1,%ymm10
   DB  196,193,123,16,4,144                ; vmovsd        (%r8,%rdx,4),%xmm0
   DB  196,99,45,13,208,1                  ; vblendpd      $0x1,%ymm0,%ymm10,%ymm10
-  DB  233,159,253,255,255                 ; jmpq          a85d <_sk_load_tables_avx+0x1d>
+  DB  233,159,253,255,255                 ; jmpq          a691 <_sk_load_tables_avx+0x1d>
   DB  196,193,121,110,68,144,24           ; vmovd         0x18(%r8,%rdx,4),%xmm0
   DB  197,249,112,192,68                  ; vpshufd       $0x44,%xmm0,%xmm0
   DB  196,227,125,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
@@ -10042,9 +9963,9 @@
   DB  196,99,45,24,208,1                  ; vinsertf128   $0x1,%xmm0,%ymm10,%ymm10
   DB  196,193,121,16,4,144                ; vmovupd       (%r8,%rdx,4),%xmm0
   DB  196,67,125,13,210,12                ; vblendpd      $0xc,%ymm10,%ymm0,%ymm10
-  DB  233,74,253,255,255                  ; jmpq          a85d <_sk_load_tables_avx+0x1d>
+  DB  233,74,253,255,255                  ; jmpq          a691 <_sk_load_tables_avx+0x1d>
   DB  144                                 ; nop
-  DB  120,255                             ; js            ab15 <_sk_load_tables_avx+0x2d5>
+  DB  120,255                             ; js            a949 <_sk_load_tables_avx+0x2d5>
   DB  255                                 ; (bad)
   DB  255,153,255,255,255,131             ; lcall         *-0x7c000001(%rcx)
   DB  255                                 ; (bad)
@@ -10074,7 +9995,7 @@
   DB  72,133,255                          ; test          %rdi,%rdi
   DB  197,252,17,124,36,32                ; vmovups       %ymm7,0x20(%rsp)
   DB  197,252,17,52,36                    ; vmovups       %ymm6,(%rsp)
-  DB  15,133,78,2,0,0                     ; jne           ada3 <_sk_load_tables_u16_be_avx+0x273>
+  DB  15,133,78,2,0,0                     ; jne           abd7 <_sk_load_tables_u16_be_avx+0x273>
   DB  196,1,121,16,4,72                   ; vmovupd       (%r8,%r9,2),%xmm8
   DB  196,129,121,16,84,72,16             ; vmovupd       0x10(%r8,%r9,2),%xmm2
   DB  196,129,121,16,92,72,32             ; vmovupd       0x20(%r8,%r9,2),%xmm3
@@ -10090,7 +10011,7 @@
   DB  197,177,108,208                     ; vpunpcklqdq   %xmm0,%xmm9,%xmm2
   DB  197,49,109,232                      ; vpunpckhqdq   %xmm0,%xmm9,%xmm13
   DB  196,65,57,108,212                   ; vpunpcklqdq   %xmm12,%xmm8,%xmm10
-  DB  197,121,111,29,137,146,2,0          ; vmovdqa       0x29289(%rip),%xmm11        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  197,121,111,29,53,142,2,0           ; vmovdqa       0x28e35(%rip),%xmm11        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  196,193,105,219,195                 ; vpand         %xmm11,%xmm2,%xmm0
   DB  197,249,112,208,78                  ; vpshufd       $0x4e,%xmm0,%xmm2
   DB  196,226,121,51,210                  ; vpmovzxwd     %xmm2,%xmm2
@@ -10184,7 +10105,7 @@
   DB  196,226,121,51,219                  ; vpmovzxwd     %xmm3,%xmm3
   DB  196,227,77,24,219,1                 ; vinsertf128   $0x1,%xmm3,%ymm6,%ymm3
   DB  197,252,91,219                      ; vcvtdq2ps     %ymm3,%ymm3
-  DB  196,226,125,24,53,212,135,2,0       ; vbroadcastss  0x287d4(%rip),%ymm6        # 33560 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
+  DB  196,226,125,24,53,116,131,2,0       ; vbroadcastss  0x28374(%rip),%ymm6        # 32f34 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
   DB  197,228,89,222                      ; vmulps        %ymm6,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,252,16,52,36                    ; vmovups       (%rsp),%ymm6
@@ -10194,29 +10115,29 @@
   DB  196,1,123,16,4,72                   ; vmovsd        (%r8,%r9,2),%xmm8
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,85                              ; je            ae09 <_sk_load_tables_u16_be_avx+0x2d9>
+  DB  116,85                              ; je            ac3d <_sk_load_tables_u16_be_avx+0x2d9>
   DB  196,1,57,22,68,72,8                 ; vmovhpd       0x8(%r8,%r9,2),%xmm8,%xmm8
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,72                              ; jb            ae09 <_sk_load_tables_u16_be_avx+0x2d9>
+  DB  114,72                              ; jb            ac3d <_sk_load_tables_u16_be_avx+0x2d9>
   DB  196,129,123,16,84,72,16             ; vmovsd        0x10(%r8,%r9,2),%xmm2
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  116,72                              ; je            ae16 <_sk_load_tables_u16_be_avx+0x2e6>
+  DB  116,72                              ; je            ac4a <_sk_load_tables_u16_be_avx+0x2e6>
   DB  196,129,105,22,84,72,24             ; vmovhpd       0x18(%r8,%r9,2),%xmm2,%xmm2
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,59                              ; jb            ae16 <_sk_load_tables_u16_be_avx+0x2e6>
+  DB  114,59                              ; jb            ac4a <_sk_load_tables_u16_be_avx+0x2e6>
   DB  196,129,123,16,92,72,32             ; vmovsd        0x20(%r8,%r9,2),%xmm3
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  15,132,132,253,255,255              ; je            ab70 <_sk_load_tables_u16_be_avx+0x40>
+  DB  15,132,132,253,255,255              ; je            a9a4 <_sk_load_tables_u16_be_avx+0x40>
   DB  196,129,97,22,92,72,40              ; vmovhpd       0x28(%r8,%r9,2),%xmm3,%xmm3
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  15,130,115,253,255,255              ; jb            ab70 <_sk_load_tables_u16_be_avx+0x40>
+  DB  15,130,115,253,255,255              ; jb            a9a4 <_sk_load_tables_u16_be_avx+0x40>
   DB  196,1,122,126,76,72,48              ; vmovq         0x30(%r8,%r9,2),%xmm9
-  DB  233,103,253,255,255                 ; jmpq          ab70 <_sk_load_tables_u16_be_avx+0x40>
+  DB  233,103,253,255,255                 ; jmpq          a9a4 <_sk_load_tables_u16_be_avx+0x40>
   DB  197,225,87,219                      ; vxorpd        %xmm3,%xmm3,%xmm3
   DB  197,233,87,210                      ; vxorpd        %xmm2,%xmm2,%xmm2
-  DB  233,90,253,255,255                  ; jmpq          ab70 <_sk_load_tables_u16_be_avx+0x40>
+  DB  233,90,253,255,255                  ; jmpq          a9a4 <_sk_load_tables_u16_be_avx+0x40>
   DB  197,225,87,219                      ; vxorpd        %xmm3,%xmm3,%xmm3
-  DB  233,81,253,255,255                  ; jmpq          ab70 <_sk_load_tables_u16_be_avx+0x40>
+  DB  233,81,253,255,255                  ; jmpq          a9a4 <_sk_load_tables_u16_be_avx+0x40>
 
 PUBLIC _sk_load_tables_rgb_u16_be_avx
 _sk_load_tables_rgb_u16_be_avx LABEL PROC
@@ -10227,7 +10148,7 @@
   DB  72,133,255                          ; test          %rdi,%rdi
   DB  197,252,17,124,36,32                ; vmovups       %ymm7,0x20(%rsp)
   DB  197,252,17,52,36                    ; vmovups       %ymm6,(%rsp)
-  DB  15,133,57,2,0,0                     ; jne           b079 <_sk_load_tables_rgb_u16_be_avx+0x25a>
+  DB  15,133,57,2,0,0                     ; jne           aead <_sk_load_tables_rgb_u16_be_avx+0x25a>
   DB  196,1,122,111,28,72                 ; vmovdqu       (%r8,%r9,2),%xmm11
   DB  196,129,122,111,92,72,12            ; vmovdqu       0xc(%r8,%r9,2),%xmm3
   DB  196,129,122,111,84,72,24            ; vmovdqu       0x18(%r8,%r9,2),%xmm2
@@ -10248,7 +10169,7 @@
   DB  197,105,108,216                     ; vpunpcklqdq   %xmm0,%xmm2,%xmm11
   DB  197,241,108,211                     ; vpunpcklqdq   %xmm3,%xmm1,%xmm2
   DB  197,241,109,203                     ; vpunpckhqdq   %xmm3,%xmm1,%xmm1
-  DB  197,121,111,53,131,143,2,0          ; vmovdqa       0x28f83(%rip),%xmm14        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  197,121,111,53,47,139,2,0           ; vmovdqa       0x28b2f(%rip),%xmm14        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  196,193,105,219,214                 ; vpand         %xmm14,%xmm2,%xmm2
   DB  197,249,112,218,78                  ; vpshufd       $0x4e,%xmm2,%xmm3
   DB  196,226,121,51,219                  ; vpmovzxwd     %xmm3,%xmm3
@@ -10334,7 +10255,7 @@
   DB  196,227,105,33,215,48               ; vinsertps     $0x30,%xmm7,%xmm2,%xmm2
   DB  196,227,77,24,210,1                 ; vinsertf128   $0x1,%xmm2,%ymm6,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,100,132,2,0       ; vbroadcastss  0x28464(%rip),%ymm3        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,29,4,128,2,0         ; vbroadcastss  0x28004(%rip),%ymm3        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,252,16,52,36                    ; vmovups       (%rsp),%ymm6
   DB  197,252,16,124,36,32                ; vmovups       0x20(%rsp),%ymm7
   DB  72,131,196,88                       ; add           $0x58,%rsp
@@ -10343,63 +10264,63 @@
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,1,121,196,92,72,4,2             ; vpinsrw       $0x2,0x4(%r8,%r9,2),%xmm0,%xmm11
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,31                              ; jne           b0b1 <_sk_load_tables_rgb_u16_be_avx+0x292>
+  DB  117,31                              ; jne           aee5 <_sk_load_tables_rgb_u16_be_avx+0x292>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
   DB  196,65,41,239,210                   ; vpxor         %xmm10,%xmm10,%xmm10
   DB  197,225,239,219                     ; vpxor         %xmm3,%xmm3,%xmm3
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
-  DB  233,196,253,255,255                 ; jmpq          ae75 <_sk_load_tables_rgb_u16_be_avx+0x56>
+  DB  233,196,253,255,255                 ; jmpq          aca9 <_sk_load_tables_rgb_u16_be_avx+0x56>
   DB  196,129,121,110,68,72,6             ; vmovd         0x6(%r8,%r9,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,1,121,196,68,72,10,2            ; vpinsrw       $0x2,0xa(%r8,%r9,2),%xmm0,%xmm8
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,48                              ; jb            b0fb <_sk_load_tables_rgb_u16_be_avx+0x2dc>
+  DB  114,48                              ; jb            af2f <_sk_load_tables_rgb_u16_be_avx+0x2dc>
   DB  196,129,121,110,68,72,12            ; vmovd         0xc(%r8,%r9,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,129,121,196,92,72,16,2          ; vpinsrw       $0x2,0x10(%r8,%r9,2),%xmm0,%xmm3
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  117,48                              ; jne           b115 <_sk_load_tables_rgb_u16_be_avx+0x2f6>
+  DB  117,48                              ; jne           af49 <_sk_load_tables_rgb_u16_be_avx+0x2f6>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
   DB  196,65,41,239,210                   ; vpxor         %xmm10,%xmm10,%xmm10
-  DB  233,122,253,255,255                 ; jmpq          ae75 <_sk_load_tables_rgb_u16_be_avx+0x56>
+  DB  233,122,253,255,255                 ; jmpq          aca9 <_sk_load_tables_rgb_u16_be_avx+0x56>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
   DB  196,65,41,239,210                   ; vpxor         %xmm10,%xmm10,%xmm10
   DB  197,225,239,219                     ; vpxor         %xmm3,%xmm3,%xmm3
-  DB  233,96,253,255,255                  ; jmpq          ae75 <_sk_load_tables_rgb_u16_be_avx+0x56>
+  DB  233,96,253,255,255                  ; jmpq          aca9 <_sk_load_tables_rgb_u16_be_avx+0x56>
   DB  196,129,121,110,68,72,18            ; vmovd         0x12(%r8,%r9,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,1,121,196,84,72,22,2            ; vpinsrw       $0x2,0x16(%r8,%r9,2),%xmm0,%xmm10
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,39                              ; jb            b156 <_sk_load_tables_rgb_u16_be_avx+0x337>
+  DB  114,39                              ; jb            af8a <_sk_load_tables_rgb_u16_be_avx+0x337>
   DB  196,129,121,110,68,72,24            ; vmovd         0x18(%r8,%r9,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,129,121,196,84,72,28,2          ; vpinsrw       $0x2,0x1c(%r8,%r9,2),%xmm0,%xmm2
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  117,30                              ; jne           b167 <_sk_load_tables_rgb_u16_be_avx+0x348>
+  DB  117,30                              ; jne           af9b <_sk_load_tables_rgb_u16_be_avx+0x348>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
-  DB  233,31,253,255,255                  ; jmpq          ae75 <_sk_load_tables_rgb_u16_be_avx+0x56>
+  DB  233,31,253,255,255                  ; jmpq          aca9 <_sk_load_tables_rgb_u16_be_avx+0x56>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
-  DB  233,14,253,255,255                  ; jmpq          ae75 <_sk_load_tables_rgb_u16_be_avx+0x56>
+  DB  233,14,253,255,255                  ; jmpq          aca9 <_sk_load_tables_rgb_u16_be_avx+0x56>
   DB  196,129,121,110,68,72,30            ; vmovd         0x1e(%r8,%r9,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,129,121,196,76,72,34,2          ; vpinsrw       $0x2,0x22(%r8,%r9,2),%xmm0,%xmm1
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  114,25                              ; jb            b19a <_sk_load_tables_rgb_u16_be_avx+0x37b>
+  DB  114,25                              ; jb            afce <_sk_load_tables_rgb_u16_be_avx+0x37b>
   DB  196,129,121,110,68,72,36            ; vmovd         0x24(%r8,%r9,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,129,121,196,68,72,40,2          ; vpinsrw       $0x2,0x28(%r8,%r9,2),%xmm0,%xmm0
-  DB  233,219,252,255,255                 ; jmpq          ae75 <_sk_load_tables_rgb_u16_be_avx+0x56>
+  DB  233,219,252,255,255                 ; jmpq          aca9 <_sk_load_tables_rgb_u16_be_avx+0x56>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
-  DB  233,210,252,255,255                 ; jmpq          ae75 <_sk_load_tables_rgb_u16_be_avx+0x56>
+  DB  233,210,252,255,255                 ; jmpq          aca9 <_sk_load_tables_rgb_u16_be_avx+0x56>
 
 PUBLIC _sk_byte_tables_avx
 _sk_byte_tables_avx LABEL PROC
@@ -10411,9 +10332,9 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
   DB  197,180,95,192                      ; vmaxps        %ymm0,%ymm9,%ymm0
-  DB  196,98,125,24,5,0,131,2,0           ; vbroadcastss  0x28300(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,160,126,2,0         ; vbroadcastss  0x27ea0(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
-  DB  196,98,125,24,21,30,131,2,0         ; vbroadcastss  0x2831e(%rip),%ymm10        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  196,98,125,24,21,190,126,2,0        ; vbroadcastss  0x27ebe(%rip),%ymm10        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   DB  196,193,124,89,194                  ; vmulps        %ymm10,%ymm0,%ymm0
   DB  197,125,91,216                      ; vcvtps2dq     %ymm0,%ymm11
   DB  196,65,249,126,216                  ; vmovq         %xmm11,%r8
@@ -10551,7 +10472,7 @@
   DB  196,194,121,49,205                  ; vpmovzxbd     %xmm13,%xmm1
   DB  196,227,125,24,193,1                ; vinsertf128   $0x1,%xmm1,%ymm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,13,207,128,2,0        ; vbroadcastss  0x280cf(%rip),%ymm9        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,98,125,24,13,111,124,2,0        ; vbroadcastss  0x27c6f(%rip),%ymm9        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  196,193,124,89,193                  ; vmulps        %ymm9,%ymm0,%ymm0
   DB  196,194,121,49,204                  ; vpmovzxbd     %xmm12,%xmm1
   DB  196,194,121,49,214                  ; vpmovzxbd     %xmm14,%xmm2
@@ -10588,7 +10509,7 @@
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
   DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
   DB  197,180,95,192                      ; vmaxps        %ymm0,%ymm9,%ymm0
-  DB  196,98,125,24,21,183,127,2,0        ; vbroadcastss  0x27fb7(%rip),%ymm10        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,21,87,123,2,0         ; vbroadcastss  0x27b57(%rip),%ymm10        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,124,93,194                  ; vminps        %ymm10,%ymm0,%ymm0
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
   DB  197,125,91,216                      ; vcvtps2dq     %ymm0,%ymm11
@@ -10693,7 +10614,7 @@
   DB  196,194,121,49,205                  ; vpmovzxbd     %xmm13,%xmm1
   DB  196,227,125,24,193,1                ; vinsertf128   $0x1,%xmm1,%ymm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,13,53,126,2,0         ; vbroadcastss  0x27e35(%rip),%ymm9        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,98,125,24,13,213,121,2,0        ; vbroadcastss  0x279d5(%rip),%ymm9        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  196,193,124,89,193                  ; vmulps        %ymm9,%ymm0,%ymm0
   DB  196,194,121,49,204                  ; vpmovzxbd     %xmm12,%xmm1
   DB  196,194,121,49,214                  ; vpmovzxbd     %xmm14,%xmm2
@@ -10725,7 +10646,7 @@
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
   DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
   DB  197,180,95,192                      ; vmaxps        %ymm0,%ymm9,%ymm0
-  DB  196,98,125,24,13,68,125,2,0         ; vbroadcastss  0x27d44(%rip),%ymm9        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,13,228,120,2,0        ; vbroadcastss  0x278e4(%rip),%ymm9        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,124,93,193                  ; vminps        %ymm9,%ymm0,%ymm0
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
   DB  197,253,91,192                      ; vcvtps2dq     %ymm0,%ymm0
@@ -10778,7 +10699,7 @@
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
   DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
   DB  197,180,95,201                      ; vmaxps        %ymm1,%ymm9,%ymm1
-  DB  196,98,125,24,13,107,124,2,0        ; vbroadcastss  0x27c6b(%rip),%ymm9        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,13,11,120,2,0         ; vbroadcastss  0x2780b(%rip),%ymm9        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,116,93,201                  ; vminps        %ymm9,%ymm1,%ymm1
   DB  196,193,116,89,200                  ; vmulps        %ymm8,%ymm1,%ymm1
   DB  197,253,91,201                      ; vcvtps2dq     %ymm1,%ymm1
@@ -10831,7 +10752,7 @@
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
   DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
   DB  197,180,95,210                      ; vmaxps        %ymm2,%ymm9,%ymm2
-  DB  196,98,125,24,13,146,123,2,0        ; vbroadcastss  0x27b92(%rip),%ymm9        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,13,50,119,2,0         ; vbroadcastss  0x27732(%rip),%ymm9        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,108,93,209                  ; vminps        %ymm9,%ymm2,%ymm2
   DB  196,193,108,89,208                  ; vmulps        %ymm8,%ymm2,%ymm2
   DB  197,253,91,210                      ; vcvtps2dq     %ymm2,%ymm2
@@ -10884,7 +10805,7 @@
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
   DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
   DB  197,180,95,219                      ; vmaxps        %ymm3,%ymm9,%ymm3
-  DB  196,98,125,24,13,185,122,2,0        ; vbroadcastss  0x27ab9(%rip),%ymm9        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,13,89,118,2,0         ; vbroadcastss  0x27659(%rip),%ymm9        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,100,93,217                  ; vminps        %ymm9,%ymm3,%ymm3
   DB  196,193,100,89,216                  ; vmulps        %ymm8,%ymm3,%ymm3
   DB  197,253,91,219                      ; vcvtps2dq     %ymm3,%ymm3
@@ -10938,36 +10859,36 @@
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
   DB  197,36,194,208,0                    ; vcmpeqps      %ymm0,%ymm11,%ymm10
   DB  196,65,124,91,235                   ; vcvtdq2ps     %ymm11,%ymm13
-  DB  196,98,125,24,53,92,122,2,0         ; vbroadcastss  0x27a5c(%rip),%ymm14        # 33564 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  DB  196,98,125,24,53,252,117,2,0        ; vbroadcastss  0x275fc(%rip),%ymm14        # 32f38 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
   DB  196,65,20,89,238                    ; vmulps        %ymm14,%ymm13,%ymm13
-  DB  196,98,125,24,53,82,122,2,0         ; vbroadcastss  0x27a52(%rip),%ymm14        # 33568 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  DB  196,98,125,24,53,242,117,2,0        ; vbroadcastss  0x275f2(%rip),%ymm14        # 32f3c <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   DB  196,65,36,84,222                    ; vandps        %ymm14,%ymm11,%ymm11
-  DB  196,98,125,24,53,164,121,2,0        ; vbroadcastss  0x279a4(%rip),%ymm14        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,53,68,117,2,0         ; vbroadcastss  0x27544(%rip),%ymm14        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,65,36,86,222                    ; vorps         %ymm14,%ymm11,%ymm11
-  DB  196,98,125,24,53,58,122,2,0         ; vbroadcastss  0x27a3a(%rip),%ymm14        # 3356c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  DB  196,98,125,24,53,218,117,2,0        ; vbroadcastss  0x275da(%rip),%ymm14        # 32f40 <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   DB  196,65,20,88,238                    ; vaddps        %ymm14,%ymm13,%ymm13
-  DB  196,98,125,24,53,48,122,2,0         ; vbroadcastss  0x27a30(%rip),%ymm14        # 33570 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  DB  196,98,125,24,53,208,117,2,0        ; vbroadcastss  0x275d0(%rip),%ymm14        # 32f44 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   DB  196,65,36,89,246                    ; vmulps        %ymm14,%ymm11,%ymm14
   DB  196,65,20,92,238                    ; vsubps        %ymm14,%ymm13,%ymm13
-  DB  196,98,125,24,53,33,122,2,0         ; vbroadcastss  0x27a21(%rip),%ymm14        # 33574 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  DB  196,98,125,24,53,193,117,2,0        ; vbroadcastss  0x275c1(%rip),%ymm14        # 32f48 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   DB  196,65,36,88,222                    ; vaddps        %ymm14,%ymm11,%ymm11
-  DB  196,98,125,24,53,23,122,2,0         ; vbroadcastss  0x27a17(%rip),%ymm14        # 33578 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  DB  196,98,125,24,53,183,117,2,0        ; vbroadcastss  0x275b7(%rip),%ymm14        # 32f4c <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   DB  196,65,12,94,219                    ; vdivps        %ymm11,%ymm14,%ymm11
   DB  196,65,20,92,219                    ; vsubps        %ymm11,%ymm13,%ymm11
   DB  196,65,28,89,219                    ; vmulps        %ymm11,%ymm12,%ymm11
   DB  196,67,125,8,227,1                  ; vroundps      $0x1,%ymm11,%ymm12
   DB  196,65,36,92,228                    ; vsubps        %ymm12,%ymm11,%ymm12
-  DB  196,98,125,24,45,248,121,2,0        ; vbroadcastss  0x279f8(%rip),%ymm13        # 3357c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  DB  196,98,125,24,45,152,117,2,0        ; vbroadcastss  0x27598(%rip),%ymm13        # 32f50 <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   DB  196,65,36,88,221                    ; vaddps        %ymm13,%ymm11,%ymm11
-  DB  196,98,125,24,45,238,121,2,0        ; vbroadcastss  0x279ee(%rip),%ymm13        # 33580 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  DB  196,98,125,24,45,142,117,2,0        ; vbroadcastss  0x2758e(%rip),%ymm13        # 32f54 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   DB  196,65,28,89,237                    ; vmulps        %ymm13,%ymm12,%ymm13
   DB  196,65,36,92,221                    ; vsubps        %ymm13,%ymm11,%ymm11
-  DB  196,98,125,24,45,223,121,2,0        ; vbroadcastss  0x279df(%rip),%ymm13        # 33584 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  DB  196,98,125,24,45,127,117,2,0        ; vbroadcastss  0x2757f(%rip),%ymm13        # 32f58 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   DB  196,65,20,92,228                    ; vsubps        %ymm12,%ymm13,%ymm12
-  DB  196,98,125,24,45,213,121,2,0        ; vbroadcastss  0x279d5(%rip),%ymm13        # 33588 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  DB  196,98,125,24,45,117,117,2,0        ; vbroadcastss  0x27575(%rip),%ymm13        # 32f5c <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   DB  196,65,20,94,228                    ; vdivps        %ymm12,%ymm13,%ymm12
   DB  196,65,36,88,220                    ; vaddps        %ymm12,%ymm11,%ymm11
-  DB  196,98,125,24,37,198,121,2,0        ; vbroadcastss  0x279c6(%rip),%ymm12        # 3358c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  DB  196,98,125,24,37,102,117,2,0        ; vbroadcastss  0x27566(%rip),%ymm12        # 32f60 <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   DB  196,65,36,89,220                    ; vmulps        %ymm12,%ymm11,%ymm11
   DB  196,65,125,91,219                   ; vcvtps2dq     %ymm11,%ymm11
   DB  196,99,37,74,208,160                ; vblendvps     %ymm10,%ymm0,%ymm11,%ymm10
@@ -10975,7 +10896,7 @@
   DB  196,65,44,88,211                    ; vaddps        %ymm11,%ymm10,%ymm10
   DB  196,67,45,74,193,128                ; vblendvps     %ymm8,%ymm9,%ymm10,%ymm8
   DB  197,188,95,192                      ; vmaxps        %ymm0,%ymm8,%ymm0
-  DB  196,98,125,24,5,216,120,2,0         ; vbroadcastss  0x278d8(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,120,116,2,0         ; vbroadcastss  0x27478(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -10997,36 +10918,36 @@
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  197,36,194,209,0                    ; vcmpeqps      %ymm1,%ymm11,%ymm10
   DB  196,65,124,91,235                   ; vcvtdq2ps     %ymm11,%ymm13
-  DB  196,98,125,24,53,19,121,2,0         ; vbroadcastss  0x27913(%rip),%ymm14        # 33564 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  DB  196,98,125,24,53,179,116,2,0        ; vbroadcastss  0x274b3(%rip),%ymm14        # 32f38 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
   DB  196,65,20,89,238                    ; vmulps        %ymm14,%ymm13,%ymm13
-  DB  196,98,125,24,53,9,121,2,0          ; vbroadcastss  0x27909(%rip),%ymm14        # 33568 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  DB  196,98,125,24,53,169,116,2,0        ; vbroadcastss  0x274a9(%rip),%ymm14        # 32f3c <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   DB  196,65,36,84,222                    ; vandps        %ymm14,%ymm11,%ymm11
-  DB  196,98,125,24,53,91,120,2,0         ; vbroadcastss  0x2785b(%rip),%ymm14        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,53,251,115,2,0        ; vbroadcastss  0x273fb(%rip),%ymm14        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,65,36,86,222                    ; vorps         %ymm14,%ymm11,%ymm11
-  DB  196,98,125,24,53,241,120,2,0        ; vbroadcastss  0x278f1(%rip),%ymm14        # 3356c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  DB  196,98,125,24,53,145,116,2,0        ; vbroadcastss  0x27491(%rip),%ymm14        # 32f40 <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   DB  196,65,20,88,238                    ; vaddps        %ymm14,%ymm13,%ymm13
-  DB  196,98,125,24,53,231,120,2,0        ; vbroadcastss  0x278e7(%rip),%ymm14        # 33570 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  DB  196,98,125,24,53,135,116,2,0        ; vbroadcastss  0x27487(%rip),%ymm14        # 32f44 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   DB  196,65,36,89,246                    ; vmulps        %ymm14,%ymm11,%ymm14
   DB  196,65,20,92,238                    ; vsubps        %ymm14,%ymm13,%ymm13
-  DB  196,98,125,24,53,216,120,2,0        ; vbroadcastss  0x278d8(%rip),%ymm14        # 33574 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  DB  196,98,125,24,53,120,116,2,0        ; vbroadcastss  0x27478(%rip),%ymm14        # 32f48 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   DB  196,65,36,88,222                    ; vaddps        %ymm14,%ymm11,%ymm11
-  DB  196,98,125,24,53,206,120,2,0        ; vbroadcastss  0x278ce(%rip),%ymm14        # 33578 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  DB  196,98,125,24,53,110,116,2,0        ; vbroadcastss  0x2746e(%rip),%ymm14        # 32f4c <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   DB  196,65,12,94,219                    ; vdivps        %ymm11,%ymm14,%ymm11
   DB  196,65,20,92,219                    ; vsubps        %ymm11,%ymm13,%ymm11
   DB  196,65,28,89,219                    ; vmulps        %ymm11,%ymm12,%ymm11
   DB  196,67,125,8,227,1                  ; vroundps      $0x1,%ymm11,%ymm12
   DB  196,65,36,92,228                    ; vsubps        %ymm12,%ymm11,%ymm12
-  DB  196,98,125,24,45,175,120,2,0        ; vbroadcastss  0x278af(%rip),%ymm13        # 3357c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  DB  196,98,125,24,45,79,116,2,0         ; vbroadcastss  0x2744f(%rip),%ymm13        # 32f50 <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   DB  196,65,36,88,221                    ; vaddps        %ymm13,%ymm11,%ymm11
-  DB  196,98,125,24,45,165,120,2,0        ; vbroadcastss  0x278a5(%rip),%ymm13        # 33580 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  DB  196,98,125,24,45,69,116,2,0         ; vbroadcastss  0x27445(%rip),%ymm13        # 32f54 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   DB  196,65,28,89,237                    ; vmulps        %ymm13,%ymm12,%ymm13
   DB  196,65,36,92,221                    ; vsubps        %ymm13,%ymm11,%ymm11
-  DB  196,98,125,24,45,150,120,2,0        ; vbroadcastss  0x27896(%rip),%ymm13        # 33584 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  DB  196,98,125,24,45,54,116,2,0         ; vbroadcastss  0x27436(%rip),%ymm13        # 32f58 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   DB  196,65,20,92,228                    ; vsubps        %ymm12,%ymm13,%ymm12
-  DB  196,98,125,24,45,140,120,2,0        ; vbroadcastss  0x2788c(%rip),%ymm13        # 33588 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  DB  196,98,125,24,45,44,116,2,0         ; vbroadcastss  0x2742c(%rip),%ymm13        # 32f5c <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   DB  196,65,20,94,228                    ; vdivps        %ymm12,%ymm13,%ymm12
   DB  196,65,36,88,220                    ; vaddps        %ymm12,%ymm11,%ymm11
-  DB  196,98,125,24,37,125,120,2,0        ; vbroadcastss  0x2787d(%rip),%ymm12        # 3358c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  DB  196,98,125,24,37,29,116,2,0         ; vbroadcastss  0x2741d(%rip),%ymm12        # 32f60 <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   DB  196,65,36,89,220                    ; vmulps        %ymm12,%ymm11,%ymm11
   DB  196,65,125,91,219                   ; vcvtps2dq     %ymm11,%ymm11
   DB  196,99,37,74,209,160                ; vblendvps     %ymm10,%ymm1,%ymm11,%ymm10
@@ -11034,7 +10955,7 @@
   DB  196,65,44,88,211                    ; vaddps        %ymm11,%ymm10,%ymm10
   DB  196,67,45,74,193,128                ; vblendvps     %ymm8,%ymm9,%ymm10,%ymm8
   DB  197,188,95,201                      ; vmaxps        %ymm1,%ymm8,%ymm1
-  DB  196,98,125,24,5,143,119,2,0         ; vbroadcastss  0x2778f(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,47,115,2,0          ; vbroadcastss  0x2732f(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,116,93,200                  ; vminps        %ymm8,%ymm1,%ymm1
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -11056,36 +10977,36 @@
   DB  197,236,87,210                      ; vxorps        %ymm2,%ymm2,%ymm2
   DB  197,36,194,210,0                    ; vcmpeqps      %ymm2,%ymm11,%ymm10
   DB  196,65,124,91,235                   ; vcvtdq2ps     %ymm11,%ymm13
-  DB  196,98,125,24,53,202,119,2,0        ; vbroadcastss  0x277ca(%rip),%ymm14        # 33564 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  DB  196,98,125,24,53,106,115,2,0        ; vbroadcastss  0x2736a(%rip),%ymm14        # 32f38 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
   DB  196,65,20,89,238                    ; vmulps        %ymm14,%ymm13,%ymm13
-  DB  196,98,125,24,53,192,119,2,0        ; vbroadcastss  0x277c0(%rip),%ymm14        # 33568 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  DB  196,98,125,24,53,96,115,2,0         ; vbroadcastss  0x27360(%rip),%ymm14        # 32f3c <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   DB  196,65,36,84,222                    ; vandps        %ymm14,%ymm11,%ymm11
-  DB  196,98,125,24,53,18,119,2,0         ; vbroadcastss  0x27712(%rip),%ymm14        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,53,178,114,2,0        ; vbroadcastss  0x272b2(%rip),%ymm14        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,65,36,86,222                    ; vorps         %ymm14,%ymm11,%ymm11
-  DB  196,98,125,24,53,168,119,2,0        ; vbroadcastss  0x277a8(%rip),%ymm14        # 3356c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  DB  196,98,125,24,53,72,115,2,0         ; vbroadcastss  0x27348(%rip),%ymm14        # 32f40 <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   DB  196,65,20,88,238                    ; vaddps        %ymm14,%ymm13,%ymm13
-  DB  196,98,125,24,53,158,119,2,0        ; vbroadcastss  0x2779e(%rip),%ymm14        # 33570 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  DB  196,98,125,24,53,62,115,2,0         ; vbroadcastss  0x2733e(%rip),%ymm14        # 32f44 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   DB  196,65,36,89,246                    ; vmulps        %ymm14,%ymm11,%ymm14
   DB  196,65,20,92,238                    ; vsubps        %ymm14,%ymm13,%ymm13
-  DB  196,98,125,24,53,143,119,2,0        ; vbroadcastss  0x2778f(%rip),%ymm14        # 33574 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  DB  196,98,125,24,53,47,115,2,0         ; vbroadcastss  0x2732f(%rip),%ymm14        # 32f48 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   DB  196,65,36,88,222                    ; vaddps        %ymm14,%ymm11,%ymm11
-  DB  196,98,125,24,53,133,119,2,0        ; vbroadcastss  0x27785(%rip),%ymm14        # 33578 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  DB  196,98,125,24,53,37,115,2,0         ; vbroadcastss  0x27325(%rip),%ymm14        # 32f4c <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   DB  196,65,12,94,219                    ; vdivps        %ymm11,%ymm14,%ymm11
   DB  196,65,20,92,219                    ; vsubps        %ymm11,%ymm13,%ymm11
   DB  196,65,28,89,219                    ; vmulps        %ymm11,%ymm12,%ymm11
   DB  196,67,125,8,227,1                  ; vroundps      $0x1,%ymm11,%ymm12
   DB  196,65,36,92,228                    ; vsubps        %ymm12,%ymm11,%ymm12
-  DB  196,98,125,24,45,102,119,2,0        ; vbroadcastss  0x27766(%rip),%ymm13        # 3357c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  DB  196,98,125,24,45,6,115,2,0          ; vbroadcastss  0x27306(%rip),%ymm13        # 32f50 <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   DB  196,65,36,88,221                    ; vaddps        %ymm13,%ymm11,%ymm11
-  DB  196,98,125,24,45,92,119,2,0         ; vbroadcastss  0x2775c(%rip),%ymm13        # 33580 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  DB  196,98,125,24,45,252,114,2,0        ; vbroadcastss  0x272fc(%rip),%ymm13        # 32f54 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   DB  196,65,28,89,237                    ; vmulps        %ymm13,%ymm12,%ymm13
   DB  196,65,36,92,221                    ; vsubps        %ymm13,%ymm11,%ymm11
-  DB  196,98,125,24,45,77,119,2,0         ; vbroadcastss  0x2774d(%rip),%ymm13        # 33584 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  DB  196,98,125,24,45,237,114,2,0        ; vbroadcastss  0x272ed(%rip),%ymm13        # 32f58 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   DB  196,65,20,92,228                    ; vsubps        %ymm12,%ymm13,%ymm12
-  DB  196,98,125,24,45,67,119,2,0         ; vbroadcastss  0x27743(%rip),%ymm13        # 33588 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  DB  196,98,125,24,45,227,114,2,0        ; vbroadcastss  0x272e3(%rip),%ymm13        # 32f5c <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   DB  196,65,20,94,228                    ; vdivps        %ymm12,%ymm13,%ymm12
   DB  196,65,36,88,220                    ; vaddps        %ymm12,%ymm11,%ymm11
-  DB  196,98,125,24,37,52,119,2,0         ; vbroadcastss  0x27734(%rip),%ymm12        # 3358c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  DB  196,98,125,24,37,212,114,2,0        ; vbroadcastss  0x272d4(%rip),%ymm12        # 32f60 <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   DB  196,65,36,89,220                    ; vmulps        %ymm12,%ymm11,%ymm11
   DB  196,65,125,91,219                   ; vcvtps2dq     %ymm11,%ymm11
   DB  196,99,37,74,210,160                ; vblendvps     %ymm10,%ymm2,%ymm11,%ymm10
@@ -11093,7 +11014,7 @@
   DB  196,65,44,88,211                    ; vaddps        %ymm11,%ymm10,%ymm10
   DB  196,67,45,74,193,128                ; vblendvps     %ymm8,%ymm9,%ymm10,%ymm8
   DB  197,188,95,210                      ; vmaxps        %ymm2,%ymm8,%ymm2
-  DB  196,98,125,24,5,70,118,2,0          ; vbroadcastss  0x27646(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,230,113,2,0         ; vbroadcastss  0x271e6(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,108,93,208                  ; vminps        %ymm8,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -11115,36 +11036,36 @@
   DB  197,228,87,219                      ; vxorps        %ymm3,%ymm3,%ymm3
   DB  197,36,194,211,0                    ; vcmpeqps      %ymm3,%ymm11,%ymm10
   DB  196,65,124,91,235                   ; vcvtdq2ps     %ymm11,%ymm13
-  DB  196,98,125,24,53,129,118,2,0        ; vbroadcastss  0x27681(%rip),%ymm14        # 33564 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  DB  196,98,125,24,53,33,114,2,0         ; vbroadcastss  0x27221(%rip),%ymm14        # 32f38 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
   DB  196,65,20,89,238                    ; vmulps        %ymm14,%ymm13,%ymm13
-  DB  196,98,125,24,53,119,118,2,0        ; vbroadcastss  0x27677(%rip),%ymm14        # 33568 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  DB  196,98,125,24,53,23,114,2,0         ; vbroadcastss  0x27217(%rip),%ymm14        # 32f3c <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   DB  196,65,36,84,222                    ; vandps        %ymm14,%ymm11,%ymm11
-  DB  196,98,125,24,53,201,117,2,0        ; vbroadcastss  0x275c9(%rip),%ymm14        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,53,105,113,2,0        ; vbroadcastss  0x27169(%rip),%ymm14        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,65,36,86,222                    ; vorps         %ymm14,%ymm11,%ymm11
-  DB  196,98,125,24,53,95,118,2,0         ; vbroadcastss  0x2765f(%rip),%ymm14        # 3356c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  DB  196,98,125,24,53,255,113,2,0        ; vbroadcastss  0x271ff(%rip),%ymm14        # 32f40 <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   DB  196,65,20,88,238                    ; vaddps        %ymm14,%ymm13,%ymm13
-  DB  196,98,125,24,53,85,118,2,0         ; vbroadcastss  0x27655(%rip),%ymm14        # 33570 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  DB  196,98,125,24,53,245,113,2,0        ; vbroadcastss  0x271f5(%rip),%ymm14        # 32f44 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   DB  196,65,36,89,246                    ; vmulps        %ymm14,%ymm11,%ymm14
   DB  196,65,20,92,238                    ; vsubps        %ymm14,%ymm13,%ymm13
-  DB  196,98,125,24,53,70,118,2,0         ; vbroadcastss  0x27646(%rip),%ymm14        # 33574 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  DB  196,98,125,24,53,230,113,2,0        ; vbroadcastss  0x271e6(%rip),%ymm14        # 32f48 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   DB  196,65,36,88,222                    ; vaddps        %ymm14,%ymm11,%ymm11
-  DB  196,98,125,24,53,60,118,2,0         ; vbroadcastss  0x2763c(%rip),%ymm14        # 33578 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  DB  196,98,125,24,53,220,113,2,0        ; vbroadcastss  0x271dc(%rip),%ymm14        # 32f4c <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   DB  196,65,12,94,219                    ; vdivps        %ymm11,%ymm14,%ymm11
   DB  196,65,20,92,219                    ; vsubps        %ymm11,%ymm13,%ymm11
   DB  196,65,28,89,219                    ; vmulps        %ymm11,%ymm12,%ymm11
   DB  196,67,125,8,227,1                  ; vroundps      $0x1,%ymm11,%ymm12
   DB  196,65,36,92,228                    ; vsubps        %ymm12,%ymm11,%ymm12
-  DB  196,98,125,24,45,29,118,2,0         ; vbroadcastss  0x2761d(%rip),%ymm13        # 3357c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  DB  196,98,125,24,45,189,113,2,0        ; vbroadcastss  0x271bd(%rip),%ymm13        # 32f50 <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   DB  196,65,36,88,221                    ; vaddps        %ymm13,%ymm11,%ymm11
-  DB  196,98,125,24,45,19,118,2,0         ; vbroadcastss  0x27613(%rip),%ymm13        # 33580 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  DB  196,98,125,24,45,179,113,2,0        ; vbroadcastss  0x271b3(%rip),%ymm13        # 32f54 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   DB  196,65,28,89,237                    ; vmulps        %ymm13,%ymm12,%ymm13
   DB  196,65,36,92,221                    ; vsubps        %ymm13,%ymm11,%ymm11
-  DB  196,98,125,24,45,4,118,2,0          ; vbroadcastss  0x27604(%rip),%ymm13        # 33584 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  DB  196,98,125,24,45,164,113,2,0        ; vbroadcastss  0x271a4(%rip),%ymm13        # 32f58 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   DB  196,65,20,92,228                    ; vsubps        %ymm12,%ymm13,%ymm12
-  DB  196,98,125,24,45,250,117,2,0        ; vbroadcastss  0x275fa(%rip),%ymm13        # 33588 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  DB  196,98,125,24,45,154,113,2,0        ; vbroadcastss  0x2719a(%rip),%ymm13        # 32f5c <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   DB  196,65,20,94,228                    ; vdivps        %ymm12,%ymm13,%ymm12
   DB  196,65,36,88,220                    ; vaddps        %ymm12,%ymm11,%ymm11
-  DB  196,98,125,24,37,235,117,2,0        ; vbroadcastss  0x275eb(%rip),%ymm12        # 3358c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  DB  196,98,125,24,37,139,113,2,0        ; vbroadcastss  0x2718b(%rip),%ymm12        # 32f60 <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   DB  196,65,36,89,220                    ; vmulps        %ymm12,%ymm11,%ymm11
   DB  196,65,125,91,219                   ; vcvtps2dq     %ymm11,%ymm11
   DB  196,99,37,74,211,160                ; vblendvps     %ymm10,%ymm3,%ymm11,%ymm10
@@ -11152,7 +11073,7 @@
   DB  196,65,44,88,211                    ; vaddps        %ymm11,%ymm10,%ymm10
   DB  196,67,45,74,193,128                ; vblendvps     %ymm8,%ymm9,%ymm10,%ymm8
   DB  197,188,95,219                      ; vmaxps        %ymm3,%ymm8,%ymm3
-  DB  196,98,125,24,5,253,116,2,0         ; vbroadcastss  0x274fd(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,157,112,2,0         ; vbroadcastss  0x2709d(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,100,93,216                  ; vminps        %ymm8,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -11169,22 +11090,22 @@
   DB  197,252,17,12,36                    ; vmovups       %ymm1,(%rsp)
   DB  197,252,40,224                      ; vmovaps       %ymm0,%ymm4
   DB  197,252,91,204                      ; vcvtdq2ps     %ymm4,%ymm1
-  DB  196,226,125,24,5,60,117,2,0         ; vbroadcastss  0x2753c(%rip),%ymm0        # 33564 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  DB  196,226,125,24,5,220,112,2,0        ; vbroadcastss  0x270dc(%rip),%ymm0        # 32f38 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
   DB  197,244,89,200                      ; vmulps        %ymm0,%ymm1,%ymm1
   DB  197,124,40,192                      ; vmovaps       %ymm0,%ymm8
   DB  197,124,17,68,36,32                 ; vmovups       %ymm8,0x20(%rsp)
-  DB  196,98,125,24,13,41,117,2,0         ; vbroadcastss  0x27529(%rip),%ymm9        # 33568 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  DB  196,98,125,24,13,201,112,2,0        ; vbroadcastss  0x270c9(%rip),%ymm9        # 32f3c <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   DB  196,193,92,84,209                   ; vandps        %ymm9,%ymm4,%ymm2
-  DB  196,98,125,24,21,123,116,2,0        ; vbroadcastss  0x2747b(%rip),%ymm10        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,21,27,112,2,0         ; vbroadcastss  0x2701b(%rip),%ymm10        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,193,108,86,210                  ; vorps         %ymm10,%ymm2,%ymm2
-  DB  196,98,125,24,29,17,117,2,0         ; vbroadcastss  0x27511(%rip),%ymm11        # 3356c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  DB  196,98,125,24,29,177,112,2,0        ; vbroadcastss  0x270b1(%rip),%ymm11        # 32f40 <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   DB  196,193,116,88,203                  ; vaddps        %ymm11,%ymm1,%ymm1
-  DB  196,98,125,24,37,7,117,2,0          ; vbroadcastss  0x27507(%rip),%ymm12        # 33570 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  DB  196,98,125,24,37,167,112,2,0        ; vbroadcastss  0x270a7(%rip),%ymm12        # 32f44 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   DB  196,193,108,89,220                  ; vmulps        %ymm12,%ymm2,%ymm3
   DB  197,244,92,203                      ; vsubps        %ymm3,%ymm1,%ymm1
-  DB  196,98,125,24,45,249,116,2,0        ; vbroadcastss  0x274f9(%rip),%ymm13        # 33574 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  DB  196,98,125,24,45,153,112,2,0        ; vbroadcastss  0x27099(%rip),%ymm13        # 32f48 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   DB  196,193,108,88,213                  ; vaddps        %ymm13,%ymm2,%ymm2
-  DB  196,98,125,24,53,239,116,2,0        ; vbroadcastss  0x274ef(%rip),%ymm14        # 33578 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  DB  196,98,125,24,53,143,112,2,0        ; vbroadcastss  0x2708f(%rip),%ymm14        # 32f4c <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   DB  197,140,94,210                      ; vdivps        %ymm2,%ymm14,%ymm2
   DB  197,244,92,202                      ; vsubps        %ymm2,%ymm1,%ymm1
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -11192,19 +11113,19 @@
   DB  197,244,89,206                      ; vmulps        %ymm6,%ymm1,%ymm1
   DB  196,227,125,8,209,1                 ; vroundps      $0x1,%ymm1,%ymm2
   DB  197,244,92,234                      ; vsubps        %ymm2,%ymm1,%ymm5
-  DB  196,98,125,24,61,205,116,2,0        ; vbroadcastss  0x274cd(%rip),%ymm15        # 3357c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  DB  196,98,125,24,61,109,112,2,0        ; vbroadcastss  0x2706d(%rip),%ymm15        # 32f50 <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   DB  196,193,116,88,207                  ; vaddps        %ymm15,%ymm1,%ymm1
-  DB  196,226,125,24,61,195,116,2,0       ; vbroadcastss  0x274c3(%rip),%ymm7        # 33580 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  DB  196,226,125,24,61,99,112,2,0        ; vbroadcastss  0x27063(%rip),%ymm7        # 32f54 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   DB  197,212,89,215                      ; vmulps        %ymm7,%ymm5,%ymm2
   DB  197,244,92,194                      ; vsubps        %ymm2,%ymm1,%ymm0
-  DB  196,226,125,24,29,182,116,2,0       ; vbroadcastss  0x274b6(%rip),%ymm3        # 33584 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  DB  196,226,125,24,29,86,112,2,0        ; vbroadcastss  0x27056(%rip),%ymm3        # 32f58 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   DB  197,228,92,237                      ; vsubps        %ymm5,%ymm3,%ymm5
-  DB  196,226,125,24,21,173,116,2,0       ; vbroadcastss  0x274ad(%rip),%ymm2        # 33588 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  DB  196,226,125,24,21,77,112,2,0        ; vbroadcastss  0x2704d(%rip),%ymm2        # 32f5c <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   DB  197,236,94,237                      ; vdivps        %ymm5,%ymm2,%ymm5
   DB  197,252,88,197                      ; vaddps        %ymm5,%ymm0,%ymm0
   DB  197,212,87,237                      ; vxorps        %ymm5,%ymm5,%ymm5
   DB  197,220,194,205,0                   ; vcmpeqps      %ymm5,%ymm4,%ymm1
-  DB  196,226,125,24,37,151,116,2,0       ; vbroadcastss  0x27497(%rip),%ymm4        # 3358c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  DB  196,226,125,24,37,55,112,2,0        ; vbroadcastss  0x27037(%rip),%ymm4        # 32f60 <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   DB  197,252,89,196                      ; vmulps        %ymm4,%ymm0,%ymm0
   DB  197,253,91,192                      ; vcvtps2dq     %ymm0,%ymm0
   DB  196,227,125,74,197,16               ; vblendvps     %ymm1,%ymm5,%ymm0,%ymm0
@@ -11284,23 +11205,23 @@
   DB  197,252,17,140,36,224,0,0,0         ; vmovups       %ymm1,0xe0(%rsp)
   DB  197,252,17,132,36,192,0,0,0         ; vmovups       %ymm0,0xc0(%rsp)
   DB  197,252,91,196                      ; vcvtdq2ps     %ymm4,%ymm0
-  DB  196,226,125,24,29,220,114,2,0       ; vbroadcastss  0x272dc(%rip),%ymm3        # 33564 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
+  DB  196,226,125,24,29,124,110,2,0       ; vbroadcastss  0x26e7c(%rip),%ymm3        # 32f38 <_sk_srcover_bgra_8888_sse2_lowp+0x348>
   DB  197,252,89,195                      ; vmulps        %ymm3,%ymm0,%ymm0
-  DB  196,226,125,24,13,211,114,2,0       ; vbroadcastss  0x272d3(%rip),%ymm1        # 33568 <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
+  DB  196,226,125,24,13,115,110,2,0       ; vbroadcastss  0x26e73(%rip),%ymm1        # 32f3c <_sk_srcover_bgra_8888_sse2_lowp+0x34c>
   DB  197,252,17,140,36,128,0,0,0         ; vmovups       %ymm1,0x80(%rsp)
   DB  197,220,84,201                      ; vandps        %ymm1,%ymm4,%ymm1
-  DB  196,226,125,24,21,29,114,2,0        ; vbroadcastss  0x2721d(%rip),%ymm2        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,226,125,24,21,189,109,2,0       ; vbroadcastss  0x26dbd(%rip),%ymm2        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  197,252,17,84,36,96                 ; vmovups       %ymm2,0x60(%rsp)
   DB  197,244,86,202                      ; vorps         %ymm2,%ymm1,%ymm1
-  DB  196,226,125,24,21,174,114,2,0       ; vbroadcastss  0x272ae(%rip),%ymm2        # 3356c <_sk_srcover_bgra_8888_sse2_lowp+0x350>
+  DB  196,226,125,24,21,78,110,2,0        ; vbroadcastss  0x26e4e(%rip),%ymm2        # 32f40 <_sk_srcover_bgra_8888_sse2_lowp+0x350>
   DB  197,252,17,84,36,64                 ; vmovups       %ymm2,0x40(%rsp)
   DB  197,252,88,194                      ; vaddps        %ymm2,%ymm0,%ymm0
-  DB  196,98,125,24,37,159,114,2,0        ; vbroadcastss  0x2729f(%rip),%ymm12        # 33570 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
+  DB  196,98,125,24,37,63,110,2,0         ; vbroadcastss  0x26e3f(%rip),%ymm12        # 32f44 <_sk_srcover_bgra_8888_sse2_lowp+0x354>
   DB  196,193,116,89,212                  ; vmulps        %ymm12,%ymm1,%ymm2
   DB  197,252,92,194                      ; vsubps        %ymm2,%ymm0,%ymm0
-  DB  196,98,125,24,45,145,114,2,0        ; vbroadcastss  0x27291(%rip),%ymm13        # 33574 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
+  DB  196,98,125,24,45,49,110,2,0         ; vbroadcastss  0x26e31(%rip),%ymm13        # 32f48 <_sk_srcover_bgra_8888_sse2_lowp+0x358>
   DB  196,193,116,88,205                  ; vaddps        %ymm13,%ymm1,%ymm1
-  DB  196,98,125,24,53,135,114,2,0        ; vbroadcastss  0x27287(%rip),%ymm14        # 33578 <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
+  DB  196,98,125,24,53,39,110,2,0         ; vbroadcastss  0x26e27(%rip),%ymm14        # 32f4c <_sk_srcover_bgra_8888_sse2_lowp+0x35c>
   DB  197,140,94,201                      ; vdivps        %ymm1,%ymm14,%ymm1
   DB  197,252,92,193                      ; vsubps        %ymm1,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -11308,19 +11229,19 @@
   DB  197,252,89,197                      ; vmulps        %ymm5,%ymm0,%ymm0
   DB  196,227,125,8,200,1                 ; vroundps      $0x1,%ymm0,%ymm1
   DB  197,252,92,201                      ; vsubps        %ymm1,%ymm0,%ymm1
-  DB  196,98,125,24,61,101,114,2,0        ; vbroadcastss  0x27265(%rip),%ymm15        # 3357c <_sk_srcover_bgra_8888_sse2_lowp+0x360>
+  DB  196,98,125,24,61,5,110,2,0          ; vbroadcastss  0x26e05(%rip),%ymm15        # 32f50 <_sk_srcover_bgra_8888_sse2_lowp+0x360>
   DB  196,193,124,88,199                  ; vaddps        %ymm15,%ymm0,%ymm0
-  DB  196,98,125,24,29,91,114,2,0         ; vbroadcastss  0x2725b(%rip),%ymm11        # 33580 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
+  DB  196,98,125,24,29,251,109,2,0        ; vbroadcastss  0x26dfb(%rip),%ymm11        # 32f54 <_sk_srcover_bgra_8888_sse2_lowp+0x364>
   DB  196,193,116,89,211                  ; vmulps        %ymm11,%ymm1,%ymm2
   DB  197,252,92,194                      ; vsubps        %ymm2,%ymm0,%ymm0
-  DB  196,98,125,24,21,77,114,2,0         ; vbroadcastss  0x2724d(%rip),%ymm10        # 33584 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
+  DB  196,98,125,24,21,237,109,2,0        ; vbroadcastss  0x26ded(%rip),%ymm10        # 32f58 <_sk_srcover_bgra_8888_sse2_lowp+0x368>
   DB  197,172,92,241                      ; vsubps        %ymm1,%ymm10,%ymm6
-  DB  196,98,125,24,13,68,114,2,0         ; vbroadcastss  0x27244(%rip),%ymm9        # 33588 <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
+  DB  196,98,125,24,13,228,109,2,0        ; vbroadcastss  0x26de4(%rip),%ymm9        # 32f5c <_sk_srcover_bgra_8888_sse2_lowp+0x36c>
   DB  197,180,94,246                      ; vdivps        %ymm6,%ymm9,%ymm6
   DB  197,252,88,198                      ; vaddps        %ymm6,%ymm0,%ymm0
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  197,220,194,225,0                   ; vcmpeqps      %ymm1,%ymm4,%ymm4
-  DB  196,226,125,24,61,46,114,2,0        ; vbroadcastss  0x2722e(%rip),%ymm7        # 3358c <_sk_srcover_bgra_8888_sse2_lowp+0x370>
+  DB  196,226,125,24,61,206,109,2,0       ; vbroadcastss  0x26dce(%rip),%ymm7        # 32f60 <_sk_srcover_bgra_8888_sse2_lowp+0x370>
   DB  197,252,89,199                      ; vmulps        %ymm7,%ymm0,%ymm0
   DB  197,253,91,192                      ; vcvtps2dq     %ymm0,%ymm0
   DB  196,227,125,74,193,64               ; vblendvps     %ymm4,%ymm1,%ymm0,%ymm0
@@ -11392,31 +11313,31 @@
 
 PUBLIC _sk_lab_to_xyz_avx
 _sk_lab_to_xyz_avx LABEL PROC
-  DB  196,98,125,24,5,205,112,2,0         ; vbroadcastss  0x270cd(%rip),%ymm8        # 33590 <_sk_srcover_bgra_8888_sse2_lowp+0x374>
+  DB  196,98,125,24,5,109,108,2,0         ; vbroadcastss  0x26c6d(%rip),%ymm8        # 32f64 <_sk_srcover_bgra_8888_sse2_lowp+0x374>
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
-  DB  196,98,125,24,5,39,112,2,0          ; vbroadcastss  0x27027(%rip),%ymm8        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  196,98,125,24,5,199,107,2,0         ; vbroadcastss  0x26bc7(%rip),%ymm8        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   DB  196,193,116,89,200                  ; vmulps        %ymm8,%ymm1,%ymm1
-  DB  196,98,125,24,13,181,112,2,0        ; vbroadcastss  0x270b5(%rip),%ymm9        # 33594 <_sk_srcover_bgra_8888_sse2_lowp+0x378>
+  DB  196,98,125,24,13,85,108,2,0         ; vbroadcastss  0x26c55(%rip),%ymm9        # 32f68 <_sk_srcover_bgra_8888_sse2_lowp+0x378>
   DB  196,193,116,88,201                  ; vaddps        %ymm9,%ymm1,%ymm1
   DB  196,193,108,89,208                  ; vmulps        %ymm8,%ymm2,%ymm2
   DB  196,193,108,88,209                  ; vaddps        %ymm9,%ymm2,%ymm2
-  DB  196,98,125,24,5,161,112,2,0         ; vbroadcastss  0x270a1(%rip),%ymm8        # 33598 <_sk_srcover_bgra_8888_sse2_lowp+0x37c>
+  DB  196,98,125,24,5,65,108,2,0          ; vbroadcastss  0x26c41(%rip),%ymm8        # 32f6c <_sk_srcover_bgra_8888_sse2_lowp+0x37c>
   DB  196,193,124,88,192                  ; vaddps        %ymm8,%ymm0,%ymm0
-  DB  196,98,125,24,5,151,112,2,0         ; vbroadcastss  0x27097(%rip),%ymm8        # 3359c <_sk_srcover_bgra_8888_sse2_lowp+0x380>
+  DB  196,98,125,24,5,55,108,2,0          ; vbroadcastss  0x26c37(%rip),%ymm8        # 32f70 <_sk_srcover_bgra_8888_sse2_lowp+0x380>
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
-  DB  196,98,125,24,5,141,112,2,0         ; vbroadcastss  0x2708d(%rip),%ymm8        # 335a0 <_sk_srcover_bgra_8888_sse2_lowp+0x384>
+  DB  196,98,125,24,5,45,108,2,0          ; vbroadcastss  0x26c2d(%rip),%ymm8        # 32f74 <_sk_srcover_bgra_8888_sse2_lowp+0x384>
   DB  196,193,116,89,200                  ; vmulps        %ymm8,%ymm1,%ymm1
   DB  197,252,88,201                      ; vaddps        %ymm1,%ymm0,%ymm1
-  DB  196,98,125,24,5,127,112,2,0         ; vbroadcastss  0x2707f(%rip),%ymm8        # 335a4 <_sk_srcover_bgra_8888_sse2_lowp+0x388>
+  DB  196,98,125,24,5,31,108,2,0          ; vbroadcastss  0x26c1f(%rip),%ymm8        # 32f78 <_sk_srcover_bgra_8888_sse2_lowp+0x388>
   DB  196,193,108,89,208                  ; vmulps        %ymm8,%ymm2,%ymm2
   DB  197,252,92,210                      ; vsubps        %ymm2,%ymm0,%ymm2
   DB  197,116,89,193                      ; vmulps        %ymm1,%ymm1,%ymm8
   DB  196,65,116,89,192                   ; vmulps        %ymm8,%ymm1,%ymm8
-  DB  196,98,125,24,13,104,112,2,0        ; vbroadcastss  0x27068(%rip),%ymm9        # 335a8 <_sk_srcover_bgra_8888_sse2_lowp+0x38c>
+  DB  196,98,125,24,13,8,108,2,0          ; vbroadcastss  0x26c08(%rip),%ymm9        # 32f7c <_sk_srcover_bgra_8888_sse2_lowp+0x38c>
   DB  196,65,52,194,208,1                 ; vcmpltps      %ymm8,%ymm9,%ymm10
-  DB  196,98,125,24,29,93,112,2,0         ; vbroadcastss  0x2705d(%rip),%ymm11        # 335ac <_sk_srcover_bgra_8888_sse2_lowp+0x390>
+  DB  196,98,125,24,29,253,107,2,0        ; vbroadcastss  0x26bfd(%rip),%ymm11        # 32f80 <_sk_srcover_bgra_8888_sse2_lowp+0x390>
   DB  196,193,116,88,203                  ; vaddps        %ymm11,%ymm1,%ymm1
-  DB  196,98,125,24,37,83,112,2,0         ; vbroadcastss  0x27053(%rip),%ymm12        # 335b0 <_sk_srcover_bgra_8888_sse2_lowp+0x394>
+  DB  196,98,125,24,37,243,107,2,0        ; vbroadcastss  0x26bf3(%rip),%ymm12        # 32f84 <_sk_srcover_bgra_8888_sse2_lowp+0x394>
   DB  196,193,116,89,204                  ; vmulps        %ymm12,%ymm1,%ymm1
   DB  196,67,117,74,192,160               ; vblendvps     %ymm10,%ymm8,%ymm1,%ymm8
   DB  197,252,89,200                      ; vmulps        %ymm0,%ymm0,%ymm1
@@ -11431,9 +11352,9 @@
   DB  196,193,108,88,211                  ; vaddps        %ymm11,%ymm2,%ymm2
   DB  196,193,108,89,212                  ; vmulps        %ymm12,%ymm2,%ymm2
   DB  196,227,109,74,208,144              ; vblendvps     %ymm9,%ymm0,%ymm2,%ymm2
-  DB  196,226,125,24,5,9,112,2,0          ; vbroadcastss  0x27009(%rip),%ymm0        # 335b4 <_sk_srcover_bgra_8888_sse2_lowp+0x398>
+  DB  196,226,125,24,5,169,107,2,0        ; vbroadcastss  0x26ba9(%rip),%ymm0        # 32f88 <_sk_srcover_bgra_8888_sse2_lowp+0x398>
   DB  197,188,89,192                      ; vmulps        %ymm0,%ymm8,%ymm0
-  DB  196,98,125,24,5,0,112,2,0           ; vbroadcastss  0x27000(%rip),%ymm8        # 335b8 <_sk_srcover_bgra_8888_sse2_lowp+0x39c>
+  DB  196,98,125,24,5,160,107,2,0         ; vbroadcastss  0x26ba0(%rip),%ymm8        # 32f8c <_sk_srcover_bgra_8888_sse2_lowp+0x39c>
   DB  196,193,108,89,208                  ; vmulps        %ymm8,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -11441,136 +11362,58 @@
 PUBLIC _sk_load_a8_avx
 _sk_load_a8_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,68                              ; jne           c61d <_sk_load_a8_avx+0x5c>
-  DB  196,130,121,48,4,24                 ; vpmovzxbw     (%r8,%r11,1),%xmm0
-  DB  197,249,219,5,73,120,2,0            ; vpand         0x27849(%rip),%xmm0,%xmm0        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  117,68                              ; jne           c44b <_sk_load_a8_avx+0x56>
+  DB  196,194,121,48,4,16                 ; vpmovzxbw     (%r8,%rdx,1),%xmm0
+  DB  197,249,219,5,251,115,2,0           ; vpand         0x273fb(%rip),%xmm0,%xmm0        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  196,226,121,51,200                  ; vpmovzxwd     %xmm0,%xmm1
   DB  197,249,112,192,78                  ; vpshufd       $0x4e,%xmm0,%xmm0
   DB  196,226,121,51,192                  ; vpmovzxwd     %xmm0,%xmm0
   DB  196,227,117,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,59,111,2,0        ; vbroadcastss  0x26f3b(%rip),%ymm1        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,226,125,24,13,225,106,2,0       ; vbroadcastss  0x26ae1(%rip),%ymm1        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  197,252,89,217                      ; vmulps        %ymm1,%ymm0,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  197,236,87,210                      ; vxorps        %ymm2,%ymm2,%ymm2
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,174                             ; ja            c5df <_sk_load_a8_avx+0x1e>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,120,0,0,0                 ; lea           0x78(%rip),%r10        # c6b4 <_sk_load_a8_avx+0xf3>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,180                             ; ja            c40d <_sk_load_a8_avx+0x18>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,121,0,0,0                 ; lea           0x79(%rip),%r9        # c4dc <_sk_load_a8_avx+0xe7>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  67,15,182,4,24                      ; movzbl        (%r8,%r11,1),%eax
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  197,249,110,192                     ; vmovd         %eax,%xmm0
-  DB  235,143                             ; jmp           c5df <_sk_load_a8_avx+0x1e>
-  DB  67,15,182,68,24,2                   ; movzbl        0x2(%r8,%r11,1),%eax
+  DB  235,150                             ; jmp           c40d <_sk_load_a8_avx+0x18>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,249,196,192,2                   ; vpinsrw       $0x2,%eax,%xmm0,%xmm0
-  DB  67,15,183,4,24                      ; movzwl        (%r8,%r11,1),%eax
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  197,249,110,200                     ; vmovd         %eax,%xmm1
   DB  196,226,121,48,201                  ; vpmovzxbw     %xmm1,%xmm1
   DB  196,227,121,14,193,3                ; vpblendw      $0x3,%xmm1,%xmm0,%xmm0
-  DB  233,103,255,255,255                 ; jmpq          c5df <_sk_load_a8_avx+0x1e>
-  DB  67,15,182,68,24,6                   ; movzbl        0x6(%r8,%r11,1),%eax
+  DB  233,110,255,255,255                 ; jmpq          c40d <_sk_load_a8_avx+0x18>
+  DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,249,196,192,6                   ; vpinsrw       $0x6,%eax,%xmm0,%xmm0
-  DB  67,15,182,68,24,5                   ; movzbl        0x5(%r8,%r11,1),%eax
+  DB  65,15,182,68,16,5                   ; movzbl        0x5(%r8,%rdx,1),%eax
   DB  197,249,196,192,5                   ; vpinsrw       $0x5,%eax,%xmm0,%xmm0
-  DB  67,15,182,68,24,4                   ; movzbl        0x4(%r8,%r11,1),%eax
+  DB  65,15,182,68,16,4                   ; movzbl        0x4(%r8,%rdx,1),%eax
   DB  197,249,196,192,4                   ; vpinsrw       $0x4,%eax,%xmm0,%xmm0
-  DB  196,129,121,110,12,24               ; vmovd         (%r8,%r11,1),%xmm1
+  DB  196,193,121,110,12,16               ; vmovd         (%r8,%rdx,1),%xmm1
   DB  196,226,121,48,201                  ; vpmovzxbw     %xmm1,%xmm1
   DB  196,227,113,14,192,240              ; vpblendw      $0xf0,%xmm0,%xmm1,%xmm0
-  DB  233,44,255,255,255                  ; jmpq          c5df <_sk_load_a8_avx+0x1e>
-  DB  144                                 ; nop
-  DB  145                                 ; xchg          %eax,%ecx
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,171,255,255,255,156             ; ljmp          *-0x63000001(%rbx)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  233,255,255,255,222                 ; jmpq          ffffffffdf00c6c4 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffdefd94a8>
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,211                             ; callq         *%rbx
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,196                             ; inc           %esp
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; .byte         0xff
-
-PUBLIC _sk_load_a8_dst_avx
-_sk_load_a8_dst_avx LABEL PROC
-  DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
-  DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,68                              ; jne           c72c <_sk_load_a8_dst_avx+0x5c>
-  DB  196,130,121,48,36,24                ; vpmovzxbw     (%r8,%r11,1),%xmm4
-  DB  197,217,219,37,58,119,2,0           ; vpand         0x2773a(%rip),%xmm4,%xmm4        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
-  DB  196,226,121,51,236                  ; vpmovzxwd     %xmm4,%xmm5
-  DB  197,249,112,228,78                  ; vpshufd       $0x4e,%xmm4,%xmm4
-  DB  196,226,121,51,228                  ; vpmovzxwd     %xmm4,%xmm4
-  DB  196,227,85,24,228,1                 ; vinsertf128   $0x1,%xmm4,%ymm5,%ymm4
-  DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,226,125,24,45,44,110,2,0        ; vbroadcastss  0x26e2c(%rip),%ymm5        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
-  DB  197,220,89,253                      ; vmulps        %ymm5,%ymm4,%ymm7
-  DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  197,220,87,228                      ; vxorps        %ymm4,%ymm4,%ymm4
-  DB  197,212,87,237                      ; vxorps        %ymm5,%ymm5,%ymm5
-  DB  197,204,87,246                      ; vxorps        %ymm6,%ymm6,%ymm6
-  DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
-  DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,174                             ; ja            c6ee <_sk_load_a8_dst_avx+0x1e>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,121,0,0,0                 ; lea           0x79(%rip),%r10        # c7c4 <_sk_load_a8_dst_avx+0xf4>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
-  DB  255,224                             ; jmpq          *%rax
-  DB  67,15,182,4,24                      ; movzbl        (%r8,%r11,1),%eax
-  DB  197,249,110,224                     ; vmovd         %eax,%xmm4
-  DB  235,143                             ; jmp           c6ee <_sk_load_a8_dst_avx+0x1e>
-  DB  67,15,182,68,24,2                   ; movzbl        0x2(%r8,%r11,1),%eax
-  DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
-  DB  197,217,196,224,2                   ; vpinsrw       $0x2,%eax,%xmm4,%xmm4
-  DB  67,15,183,4,24                      ; movzwl        (%r8,%r11,1),%eax
-  DB  197,249,110,232                     ; vmovd         %eax,%xmm5
-  DB  196,226,121,48,237                  ; vpmovzxbw     %xmm5,%xmm5
-  DB  196,227,89,14,229,3                 ; vpblendw      $0x3,%xmm5,%xmm4,%xmm4
-  DB  233,103,255,255,255                 ; jmpq          c6ee <_sk_load_a8_dst_avx+0x1e>
-  DB  67,15,182,68,24,6                   ; movzbl        0x6(%r8,%r11,1),%eax
-  DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
-  DB  197,217,196,224,6                   ; vpinsrw       $0x6,%eax,%xmm4,%xmm4
-  DB  67,15,182,68,24,5                   ; movzbl        0x5(%r8,%r11,1),%eax
-  DB  197,217,196,224,5                   ; vpinsrw       $0x5,%eax,%xmm4,%xmm4
-  DB  67,15,182,68,24,4                   ; movzbl        0x4(%r8,%r11,1),%eax
-  DB  197,217,196,224,4                   ; vpinsrw       $0x4,%eax,%xmm4,%xmm4
-  DB  196,129,121,110,44,24               ; vmovd         (%r8,%r11,1),%xmm5
-  DB  196,226,121,48,237                  ; vpmovzxbw     %xmm5,%xmm5
-  DB  196,227,81,14,228,240               ; vpblendw      $0xf0,%xmm4,%xmm5,%xmm4
-  DB  233,44,255,255,255                  ; jmpq          c6ee <_sk_load_a8_dst_avx+0x1e>
+  DB  233,51,255,255,255                  ; jmpq          c40d <_sk_load_a8_avx+0x18>
   DB  102,144                             ; xchg          %ax,%ax
   DB  144                                 ; nop
   DB  255                                 ; (bad)
@@ -11579,7 +11422,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  232,255,255,255,221                 ; callq         ffffffffde00c7d4 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddfd95b8>
+  DB  232,255,255,255,221                 ; callq         ffffffffde00c4ec <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddfd98fc>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,210                             ; callq         *%rdx
@@ -11590,6 +11433,82 @@
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
 
+PUBLIC _sk_load_a8_dst_avx
+_sk_load_a8_dst_avx LABEL PROC
+  DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
+  DB  76,3,0                              ; add           (%rax),%r8
+  DB  72,133,255                          ; test          %rdi,%rdi
+  DB  117,68                              ; jne           c54e <_sk_load_a8_dst_avx+0x56>
+  DB  196,194,121,48,36,16                ; vpmovzxbw     (%r8,%rdx,1),%xmm4
+  DB  197,217,219,37,248,114,2,0          ; vpand         0x272f8(%rip),%xmm4,%xmm4        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
+  DB  196,226,121,51,236                  ; vpmovzxwd     %xmm4,%xmm5
+  DB  197,249,112,228,78                  ; vpshufd       $0x4e,%xmm4,%xmm4
+  DB  196,226,121,51,228                  ; vpmovzxwd     %xmm4,%xmm4
+  DB  196,227,85,24,228,1                 ; vinsertf128   $0x1,%xmm4,%ymm5,%ymm4
+  DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
+  DB  196,226,125,24,45,222,105,2,0       ; vbroadcastss  0x269de(%rip),%ymm5        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  197,220,89,253                      ; vmulps        %ymm5,%ymm4,%ymm7
+  DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  197,220,87,228                      ; vxorps        %ymm4,%ymm4,%ymm4
+  DB  197,212,87,237                      ; vxorps        %ymm5,%ymm5,%ymm5
+  DB  197,204,87,246                      ; vxorps        %ymm6,%ymm6,%ymm6
+  DB  255,224                             ; jmpq          *%rax
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
+  DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,180                             ; ja            c510 <_sk_load_a8_dst_avx+0x18>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,122,0,0,0                 ; lea           0x7a(%rip),%r9        # c5e0 <_sk_load_a8_dst_avx+0xe8>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
+  DB  255,224                             ; jmpq          *%rax
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
+  DB  197,249,110,224                     ; vmovd         %eax,%xmm4
+  DB  235,150                             ; jmp           c510 <_sk_load_a8_dst_avx+0x18>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
+  DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
+  DB  197,217,196,224,2                   ; vpinsrw       $0x2,%eax,%xmm4,%xmm4
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
+  DB  197,249,110,232                     ; vmovd         %eax,%xmm5
+  DB  196,226,121,48,237                  ; vpmovzxbw     %xmm5,%xmm5
+  DB  196,227,89,14,229,3                 ; vpblendw      $0x3,%xmm5,%xmm4,%xmm4
+  DB  233,110,255,255,255                 ; jmpq          c510 <_sk_load_a8_dst_avx+0x18>
+  DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
+  DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
+  DB  197,217,196,224,6                   ; vpinsrw       $0x6,%eax,%xmm4,%xmm4
+  DB  65,15,182,68,16,5                   ; movzbl        0x5(%r8,%rdx,1),%eax
+  DB  197,217,196,224,5                   ; vpinsrw       $0x5,%eax,%xmm4,%xmm4
+  DB  65,15,182,68,16,4                   ; movzbl        0x4(%r8,%rdx,1),%eax
+  DB  197,217,196,224,4                   ; vpinsrw       $0x4,%eax,%xmm4,%xmm4
+  DB  196,193,121,110,44,16               ; vmovd         (%r8,%rdx,1),%xmm5
+  DB  196,226,121,48,237                  ; vpmovzxbw     %xmm5,%xmm5
+  DB  196,227,81,14,228,240               ; vpblendw      $0xf0,%xmm4,%xmm5,%xmm4
+  DB  233,51,255,255,255                  ; jmpq          c510 <_sk_load_a8_dst_avx+0x18>
+  DB  15,31,0                             ; nopl          (%rax)
+  DB  143                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,169,255,255,255,154             ; ljmp          *-0x65000001(%rcx)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,231                             ; jmpq          *%rdi
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  220,255                             ; fdivr         %st,%st(7)
+  DB  255                                 ; (bad)
+  DB  255,209                             ; callq         *%rcx
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,194                             ; inc           %edx
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255                                 ; .byte         0xff
+
 PUBLIC _sk_gather_a8_avx
 _sk_gather_a8_avx LABEL PROC
   DB  85                                  ; push          %rbp
@@ -11657,7 +11576,7 @@
   DB  196,226,121,49,201                  ; vpmovzxbd     %xmm1,%xmm1
   DB  196,227,125,24,193,1                ; vinsertf128   $0x1,%xmm1,%ymm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,50,108,2,0        ; vbroadcastss  0x26c32(%rip),%ymm1        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,226,125,24,13,234,103,2,0       ; vbroadcastss  0x267ea(%rip),%ymm1        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  197,252,89,217                      ; vmulps        %ymm1,%ymm0,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
@@ -11673,66 +11592,64 @@
 PUBLIC _sk_store_a8_avx
 _sk_store_a8_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,60,95,195                       ; vmaxps        %ymm3,%ymm8,%ymm8
-  DB  196,98,125,24,13,121,107,2,0        ; vbroadcastss  0x26b79(%rip),%ymm9        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,13,55,103,2,0         ; vbroadcastss  0x26737(%rip),%ymm9        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,65,60,93,193                    ; vminps        %ymm9,%ymm8,%ymm8
-  DB  196,98,125,24,13,151,107,2,0        ; vbroadcastss  0x26b97(%rip),%ymm9        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  196,98,125,24,13,85,103,2,0         ; vbroadcastss  0x26755(%rip),%ymm9        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
   DB  196,65,125,91,192                   ; vcvtps2dq     %ymm8,%ymm8
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
   DB  196,66,57,43,193                    ; vpackusdw     %xmm9,%xmm8,%xmm8
   DB  197,57,103,192                      ; vpackuswb     %xmm0,%xmm8,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           c989 <_sk_store_a8_avx+0x5b>
-  DB  196,1,121,214,4,24                  ; vmovq         %xmm8,(%r8,%r11,1)
+  DB  117,10                              ; jne           c79f <_sk_store_a8_avx+0x55>
+  DB  196,65,121,214,4,16                 ; vmovq         %xmm8,(%r8,%rdx,1)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,236                             ; ja            c985 <_sk_store_a8_avx+0x57>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,242                             ; ja            c79b <_sk_store_a8_avx+0x51>
   DB  196,66,121,48,192                   ; vpmovzxbw     %xmm8,%xmm8
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,87,0,0,0                  ; lea           0x57(%rip),%r10        # ca00 <_sk_store_a8_avx+0xd2>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,88,0,0,0                  ; lea           0x58(%rip),%r9        # c810 <_sk_store_a8_avx+0xc6>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,3,121,20,4,24,0                 ; vpextrb       $0x0,%xmm8,(%r8,%r11,1)
-  DB  235,202                             ; jmp           c985 <_sk_store_a8_avx+0x57>
-  DB  196,3,121,20,68,24,2,4              ; vpextrb       $0x4,%xmm8,0x2(%r8,%r11,1)
-  DB  196,98,57,0,5,116,116,2,0           ; vpshufb       0x27474(%rip),%xmm8,%xmm8        # 33e40 <_sk_srcover_bgra_8888_sse2_lowp+0xc24>
-  DB  196,3,121,21,4,24,0                 ; vpextrw       $0x0,%xmm8,(%r8,%r11,1)
-  DB  235,176                             ; jmp           c985 <_sk_store_a8_avx+0x57>
-  DB  196,3,121,20,68,24,6,12             ; vpextrb       $0xc,%xmm8,0x6(%r8,%r11,1)
-  DB  196,3,121,20,68,24,5,10             ; vpextrb       $0xa,%xmm8,0x5(%r8,%r11,1)
-  DB  196,3,121,20,68,24,4,8              ; vpextrb       $0x8,%xmm8,0x4(%r8,%r11,1)
-  DB  196,98,57,0,5,90,116,2,0            ; vpshufb       0x2745a(%rip),%xmm8,%xmm8        # 33e50 <_sk_srcover_bgra_8888_sse2_lowp+0xc34>
-  DB  196,1,121,126,4,24                  ; vmovd         %xmm8,(%r8,%r11,1)
-  DB  235,135                             ; jmp           c985 <_sk_store_a8_avx+0x57>
-  DB  102,144                             ; xchg          %ax,%ax
-  DB  178,255                             ; mov           $0xff,%dl
+  DB  196,67,121,20,4,16,0                ; vpextrb       $0x0,%xmm8,(%r8,%rdx,1)
+  DB  235,209                             ; jmp           c79b <_sk_store_a8_avx+0x51>
+  DB  196,67,121,20,68,16,2,4             ; vpextrb       $0x4,%xmm8,0x2(%r8,%rdx,1)
+  DB  196,98,57,0,5,69,112,2,0            ; vpshufb       0x27045(%rip),%xmm8,%xmm8        # 33820 <_sk_srcover_bgra_8888_sse2_lowp+0xc30>
+  DB  196,67,121,21,4,16,0                ; vpextrw       $0x0,%xmm8,(%r8,%rdx,1)
+  DB  235,183                             ; jmp           c79b <_sk_store_a8_avx+0x51>
+  DB  196,67,121,20,68,16,6,12            ; vpextrb       $0xc,%xmm8,0x6(%r8,%rdx,1)
+  DB  196,67,121,20,68,16,5,10            ; vpextrb       $0xa,%xmm8,0x5(%r8,%rdx,1)
+  DB  196,67,121,20,68,16,4,8             ; vpextrb       $0x8,%xmm8,0x4(%r8,%rdx,1)
+  DB  196,98,57,0,5,43,112,2,0            ; vpshufb       0x2702b(%rip),%xmm8,%xmm8        # 33830 <_sk_srcover_bgra_8888_sse2_lowp+0xc40>
+  DB  196,65,121,126,4,16                 ; vmovd         %xmm8,(%r8,%rdx,1)
+  DB  235,142                             ; jmp           c79b <_sk_store_a8_avx+0x51>
+  DB  15,31,0                             ; nopl          (%rax)
+  DB  177,255                             ; mov           $0xff,%cl
   DB  255                                 ; (bad)
-  DB  255,195                             ; inc           %ebx
+  DB  255,194                             ; inc           %edx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  187,255,255,255,237                 ; mov           $0xedffffff,%ebx
+  DB  186,255,255,255,236                 ; mov           $0xecffffff,%edx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,229                             ; jmpq          *%rbp
+  DB  255,228                             ; jmpq          *%rsp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  221,255                             ; (bad)
+  DB  220,255                             ; fdivr         %st,%st(7)
   DB  255                                 ; (bad)
-  DB  255,213                             ; callq         *%rbp
+  DB  255,212                             ; callq         *%rsp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -11740,75 +11657,73 @@
 PUBLIC _sk_load_g8_avx
 _sk_load_g8_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,73                              ; jne           ca7d <_sk_load_g8_avx+0x61>
-  DB  196,130,121,48,4,24                 ; vpmovzxbw     (%r8,%r11,1),%xmm0
-  DB  197,249,219,5,238,115,2,0           ; vpand         0x273ee(%rip),%xmm0,%xmm0        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  117,73                              ; jne           c887 <_sk_load_g8_avx+0x5b>
+  DB  196,194,121,48,4,16                 ; vpmovzxbw     (%r8,%rdx,1),%xmm0
+  DB  197,249,219,5,196,111,2,0           ; vpand         0x26fc4(%rip),%xmm0,%xmm0        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  196,226,121,51,200                  ; vpmovzxwd     %xmm0,%xmm1
   DB  197,249,112,192,78                  ; vpshufd       $0x4e,%xmm0,%xmm0
   DB  196,226,121,51,192                  ; vpmovzxwd     %xmm0,%xmm0
   DB  196,227,117,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,224,106,2,0       ; vbroadcastss  0x26ae0(%rip),%ymm1        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,226,125,24,13,170,102,2,0       ; vbroadcastss  0x266aa(%rip),%ymm1        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,89,106,2,0        ; vbroadcastss  0x26a59(%rip),%ymm3        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,29,35,102,2,0        ; vbroadcastss  0x26623(%rip),%ymm3        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,252,40,200                      ; vmovaps       %ymm0,%ymm1
   DB  197,252,40,208                      ; vmovaps       %ymm0,%ymm2
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,169                             ; ja            ca3a <_sk_load_g8_avx+0x1e>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,120,0,0,0                 ; lea           0x78(%rip),%r10        # cb14 <_sk_load_g8_avx+0xf8>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,175                             ; ja            c844 <_sk_load_g8_avx+0x18>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,121,0,0,0                 ; lea           0x79(%rip),%r9        # c918 <_sk_load_g8_avx+0xec>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  67,15,182,4,24                      ; movzbl        (%r8,%r11,1),%eax
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  197,249,110,192                     ; vmovd         %eax,%xmm0
-  DB  235,138                             ; jmp           ca3a <_sk_load_g8_avx+0x1e>
-  DB  67,15,182,68,24,2                   ; movzbl        0x2(%r8,%r11,1),%eax
+  DB  235,145                             ; jmp           c844 <_sk_load_g8_avx+0x18>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,249,196,192,2                   ; vpinsrw       $0x2,%eax,%xmm0,%xmm0
-  DB  67,15,183,4,24                      ; movzwl        (%r8,%r11,1),%eax
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  197,249,110,200                     ; vmovd         %eax,%xmm1
   DB  196,226,121,48,201                  ; vpmovzxbw     %xmm1,%xmm1
   DB  196,227,121,14,193,3                ; vpblendw      $0x3,%xmm1,%xmm0,%xmm0
-  DB  233,98,255,255,255                  ; jmpq          ca3a <_sk_load_g8_avx+0x1e>
-  DB  67,15,182,68,24,6                   ; movzbl        0x6(%r8,%r11,1),%eax
+  DB  233,105,255,255,255                 ; jmpq          c844 <_sk_load_g8_avx+0x18>
+  DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,249,196,192,6                   ; vpinsrw       $0x6,%eax,%xmm0,%xmm0
-  DB  67,15,182,68,24,5                   ; movzbl        0x5(%r8,%r11,1),%eax
+  DB  65,15,182,68,16,5                   ; movzbl        0x5(%r8,%rdx,1),%eax
   DB  197,249,196,192,5                   ; vpinsrw       $0x5,%eax,%xmm0,%xmm0
-  DB  67,15,182,68,24,4                   ; movzbl        0x4(%r8,%r11,1),%eax
+  DB  65,15,182,68,16,4                   ; movzbl        0x4(%r8,%rdx,1),%eax
   DB  197,249,196,192,4                   ; vpinsrw       $0x4,%eax,%xmm0,%xmm0
-  DB  196,129,121,110,12,24               ; vmovd         (%r8,%r11,1),%xmm1
+  DB  196,193,121,110,12,16               ; vmovd         (%r8,%rdx,1),%xmm1
   DB  196,226,121,48,201                  ; vpmovzxbw     %xmm1,%xmm1
   DB  196,227,113,14,192,240              ; vpblendw      $0xf0,%xmm0,%xmm1,%xmm0
-  DB  233,39,255,255,255                  ; jmpq          ca3a <_sk_load_g8_avx+0x1e>
+  DB  233,46,255,255,255                  ; jmpq          c844 <_sk_load_g8_avx+0x18>
+  DB  102,144                             ; xchg          %ax,%ax
   DB  144                                 ; nop
-  DB  145                                 ; xchg          %eax,%ecx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,171,255,255,255,156             ; ljmp          *-0x63000001(%rbx)
+  DB  255,170,255,255,255,155             ; ljmp          *-0x64000001(%rdx)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  233,255,255,255,222                 ; jmpq          ffffffffdf00cb24 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffdefd9908>
+  DB  232,255,255,255,221                 ; callq         ffffffffde00c928 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddfd9d38>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,211                             ; callq         *%rbx
+  DB  255,210                             ; callq         *%rdx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,196                             ; inc           %esp
+  DB  255,195                             ; inc           %ebx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -11816,75 +11731,73 @@
 PUBLIC _sk_load_g8_dst_avx
 _sk_load_g8_dst_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,73                              ; jne           cb91 <_sk_load_g8_dst_avx+0x61>
-  DB  196,130,121,48,36,24                ; vpmovzxbw     (%r8,%r11,1),%xmm4
-  DB  197,217,219,37,218,114,2,0          ; vpand         0x272da(%rip),%xmm4,%xmm4        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  117,73                              ; jne           c98f <_sk_load_g8_dst_avx+0x5b>
+  DB  196,194,121,48,36,16                ; vpmovzxbw     (%r8,%rdx,1),%xmm4
+  DB  197,217,219,37,188,110,2,0          ; vpand         0x26ebc(%rip),%xmm4,%xmm4        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  196,226,121,51,236                  ; vpmovzxwd     %xmm4,%xmm5
   DB  197,249,112,228,78                  ; vpshufd       $0x4e,%xmm4,%xmm4
   DB  196,226,121,51,228                  ; vpmovzxwd     %xmm4,%xmm4
   DB  196,227,85,24,228,1                 ; vinsertf128   $0x1,%xmm4,%ymm5,%ymm4
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,226,125,24,45,204,105,2,0       ; vbroadcastss  0x269cc(%rip),%ymm5        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,226,125,24,45,162,101,2,0       ; vbroadcastss  0x265a2(%rip),%ymm5        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  197,220,89,229                      ; vmulps        %ymm5,%ymm4,%ymm4
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,61,69,105,2,0        ; vbroadcastss  0x26945(%rip),%ymm7        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,61,27,101,2,0        ; vbroadcastss  0x2651b(%rip),%ymm7        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,252,40,236                      ; vmovaps       %ymm4,%ymm5
   DB  197,252,40,244                      ; vmovaps       %ymm4,%ymm6
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,169                             ; ja            cb4e <_sk_load_g8_dst_avx+0x1e>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,120,0,0,0                 ; lea           0x78(%rip),%r10        # cc28 <_sk_load_g8_dst_avx+0xf8>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,175                             ; ja            c94c <_sk_load_g8_dst_avx+0x18>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,121,0,0,0                 ; lea           0x79(%rip),%r9        # ca20 <_sk_load_g8_dst_avx+0xec>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  67,15,182,4,24                      ; movzbl        (%r8,%r11,1),%eax
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  197,249,110,224                     ; vmovd         %eax,%xmm4
-  DB  235,138                             ; jmp           cb4e <_sk_load_g8_dst_avx+0x1e>
-  DB  67,15,182,68,24,2                   ; movzbl        0x2(%r8,%r11,1),%eax
+  DB  235,145                             ; jmp           c94c <_sk_load_g8_dst_avx+0x18>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  197,217,196,224,2                   ; vpinsrw       $0x2,%eax,%xmm4,%xmm4
-  DB  67,15,183,4,24                      ; movzwl        (%r8,%r11,1),%eax
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  197,249,110,232                     ; vmovd         %eax,%xmm5
   DB  196,226,121,48,237                  ; vpmovzxbw     %xmm5,%xmm5
   DB  196,227,89,14,229,3                 ; vpblendw      $0x3,%xmm5,%xmm4,%xmm4
-  DB  233,98,255,255,255                  ; jmpq          cb4e <_sk_load_g8_dst_avx+0x1e>
-  DB  67,15,182,68,24,6                   ; movzbl        0x6(%r8,%r11,1),%eax
+  DB  233,105,255,255,255                 ; jmpq          c94c <_sk_load_g8_dst_avx+0x18>
+  DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  197,217,196,224,6                   ; vpinsrw       $0x6,%eax,%xmm4,%xmm4
-  DB  67,15,182,68,24,5                   ; movzbl        0x5(%r8,%r11,1),%eax
+  DB  65,15,182,68,16,5                   ; movzbl        0x5(%r8,%rdx,1),%eax
   DB  197,217,196,224,5                   ; vpinsrw       $0x5,%eax,%xmm4,%xmm4
-  DB  67,15,182,68,24,4                   ; movzbl        0x4(%r8,%r11,1),%eax
+  DB  65,15,182,68,16,4                   ; movzbl        0x4(%r8,%rdx,1),%eax
   DB  197,217,196,224,4                   ; vpinsrw       $0x4,%eax,%xmm4,%xmm4
-  DB  196,129,121,110,44,24               ; vmovd         (%r8,%r11,1),%xmm5
+  DB  196,193,121,110,44,16               ; vmovd         (%r8,%rdx,1),%xmm5
   DB  196,226,121,48,237                  ; vpmovzxbw     %xmm5,%xmm5
   DB  196,227,81,14,228,240               ; vpblendw      $0xf0,%xmm4,%xmm5,%xmm4
-  DB  233,39,255,255,255                  ; jmpq          cb4e <_sk_load_g8_dst_avx+0x1e>
+  DB  233,46,255,255,255                  ; jmpq          c94c <_sk_load_g8_dst_avx+0x18>
+  DB  102,144                             ; xchg          %ax,%ax
   DB  144                                 ; nop
-  DB  145                                 ; xchg          %eax,%ecx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,171,255,255,255,156             ; ljmp          *-0x63000001(%rbx)
+  DB  255,170,255,255,255,155             ; ljmp          *-0x64000001(%rdx)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  233,255,255,255,222                 ; jmpq          ffffffffdf00cc38 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffdefd9a1c>
+  DB  232,255,255,255,221                 ; callq         ffffffffde00ca30 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddfd9e40>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,211                             ; callq         *%rbx
+  DB  255,210                             ; callq         *%rdx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,196                             ; inc           %esp
+  DB  255,195                             ; inc           %ebx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -11956,10 +11869,10 @@
   DB  196,226,121,49,201                  ; vpmovzxbd     %xmm1,%xmm1
   DB  196,227,125,24,193,1                ; vinsertf128   $0x1,%xmm1,%ymm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,206,103,2,0       ; vbroadcastss  0x267ce(%rip),%ymm1        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,226,125,24,13,170,99,2,0        ; vbroadcastss  0x263aa(%rip),%ymm1        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,71,103,2,0        ; vbroadcastss  0x26747(%rip),%ymm3        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,29,35,99,2,0         ; vbroadcastss  0x26323(%rip),%ymm3        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,252,40,200                      ; vmovaps       %ymm0,%ymm1
   DB  197,252,40,208                      ; vmovaps       %ymm0,%ymm2
   DB  91                                  ; pop           %rbx
@@ -11972,63 +11885,140 @@
 PUBLIC _sk_load_565_avx
 _sk_load_565_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,130,0,0,0                    ; jne           ce38 <_sk_load_565_avx+0xa1>
-  DB  196,129,122,111,4,88                ; vmovdqu       (%r8,%r11,2),%xmm0
+  DB  15,133,130,0,0,0                    ; jne           cc2a <_sk_load_565_avx+0x9b>
+  DB  196,193,122,111,4,80                ; vmovdqu       (%r8,%rdx,2),%xmm0
   DB  196,226,121,51,200                  ; vpmovzxwd     %xmm0,%xmm1
   DB  197,249,112,192,78                  ; vpshufd       $0x4e,%xmm0,%xmm0
   DB  196,226,121,51,192                  ; vpmovzxwd     %xmm0,%xmm0
   DB  196,227,117,24,208,1                ; vinsertf128   $0x1,%xmm0,%ymm1,%ymm2
-  DB  196,226,125,24,5,110,103,2,0        ; vbroadcastss  0x2676e(%rip),%ymm0        # 33548 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  DB  196,226,125,24,5,80,99,2,0          ; vbroadcastss  0x26350(%rip),%ymm0        # 32f1c <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
   DB  197,236,84,192                      ; vandps        %ymm0,%ymm2,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,97,103,2,0        ; vbroadcastss  0x26761(%rip),%ymm1        # 3354c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  DB  196,226,125,24,13,67,99,2,0         ; vbroadcastss  0x26343(%rip),%ymm1        # 32f20 <_sk_srcover_bgra_8888_sse2_lowp+0x330>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
-  DB  196,226,125,24,13,88,103,2,0        ; vbroadcastss  0x26758(%rip),%ymm1        # 33550 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  DB  196,226,125,24,13,58,99,2,0         ; vbroadcastss  0x2633a(%rip),%ymm1        # 32f24 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
   DB  197,236,84,201                      ; vandps        %ymm1,%ymm2,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
-  DB  196,226,125,24,29,75,103,2,0        ; vbroadcastss  0x2674b(%rip),%ymm3        # 33554 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  DB  196,226,125,24,29,45,99,2,0         ; vbroadcastss  0x2632d(%rip),%ymm3        # 32f28 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
   DB  197,244,89,203                      ; vmulps        %ymm3,%ymm1,%ymm1
-  DB  196,226,125,24,29,66,103,2,0        ; vbroadcastss  0x26742(%rip),%ymm3        # 33558 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  DB  196,226,125,24,29,36,99,2,0         ; vbroadcastss  0x26324(%rip),%ymm3        # 32f2c <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
   DB  197,236,84,211                      ; vandps        %ymm3,%ymm2,%ymm2
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
-  DB  196,226,125,24,29,53,103,2,0        ; vbroadcastss  0x26735(%rip),%ymm3        # 3355c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  DB  196,226,125,24,29,23,99,2,0         ; vbroadcastss  0x26317(%rip),%ymm3        # 32f30 <_sk_srcover_bgra_8888_sse2_lowp+0x340>
   DB  197,236,89,211                      ; vmulps        %ymm3,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,150,102,2,0       ; vbroadcastss  0x26696(%rip),%ymm3        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,29,120,98,2,0        ; vbroadcastss  0x26278(%rip),%ymm3        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,108,255,255,255              ; ja            cdbc <_sk_load_565_avx+0x25>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,97,0,0,0                  ; lea           0x61(%rip),%r10        # cebc <_sk_load_565_avx+0x125>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  15,135,114,255,255,255              ; ja            cbae <_sk_load_565_avx+0x1f>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,98,0,0,0                  ; lea           0x62(%rip),%r9        # cca8 <_sk_load_565_avx+0x119>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  67,15,183,4,88                      ; movzwl        (%r8,%r11,2),%eax
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  197,249,110,192                     ; vmovd         %eax,%xmm0
-  DB  233,74,255,255,255                  ; jmpq          cdbc <_sk_load_565_avx+0x25>
+  DB  233,81,255,255,255                  ; jmpq          cbae <_sk_load_565_avx+0x1f>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
-  DB  196,129,121,196,68,88,4,2           ; vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
-  DB  196,129,121,110,12,88               ; vmovd         (%r8,%r11,2),%xmm1
+  DB  196,193,121,196,68,80,4,2           ; vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm0,%xmm0
+  DB  196,193,121,110,12,80               ; vmovd         (%r8,%rdx,2),%xmm1
   DB  196,227,121,14,193,3                ; vpblendw      $0x3,%xmm1,%xmm0,%xmm0
-  DB  233,45,255,255,255                  ; jmpq          cdbc <_sk_load_565_avx+0x25>
+  DB  233,52,255,255,255                  ; jmpq          cbae <_sk_load_565_avx+0x1f>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
-  DB  196,129,121,196,68,88,12,6          ; vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
-  DB  196,129,121,196,68,88,10,5          ; vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
-  DB  196,129,121,196,68,88,8,4           ; vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
-  DB  196,129,122,126,12,88               ; vmovq         (%r8,%r11,2),%xmm1
+  DB  196,193,121,196,68,80,12,6          ; vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm0,%xmm0
+  DB  196,193,121,196,68,80,10,5          ; vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm0,%xmm0
+  DB  196,193,121,196,68,80,8,4           ; vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm0,%xmm0
+  DB  196,193,122,126,12,80               ; vmovq         (%r8,%rdx,2),%xmm1
   DB  196,227,113,14,192,240              ; vpblendw      $0xf0,%xmm0,%xmm1,%xmm0
-  DB  233,0,255,255,255                   ; jmpq          cdbc <_sk_load_565_avx+0x25>
+  DB  233,7,255,255,255                   ; jmpq          cbae <_sk_load_565_avx+0x1f>
+  DB  144                                 ; nop
+  DB  167                                 ; cmpsl         %es:(%rdi),%ds:(%rsi)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,193                             ; inc           %ecx
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,181,255,255,255,238             ; pushq         -0x11000001(%rbp)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,230                             ; jmpq          *%rsi
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  222,255                             ; fdivrp        %st,%st(7)
+  DB  255                                 ; (bad)
+  DB  255,210                             ; callq         *%rdx
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255                                 ; .byte         0xff
+
+PUBLIC _sk_load_565_dst_avx
+_sk_load_565_dst_avx LABEL PROC
+  DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
+  DB  77,1,192                            ; add           %r8,%r8
+  DB  76,3,0                              ; add           (%rax),%r8
+  DB  72,133,255                          ; test          %rdi,%rdi
+  DB  15,133,130,0,0,0                    ; jne           cd5f <_sk_load_565_dst_avx+0x9b>
+  DB  196,193,122,111,36,80               ; vmovdqu       (%r8,%rdx,2),%xmm4
+  DB  196,226,121,51,236                  ; vpmovzxwd     %xmm4,%xmm5
+  DB  197,249,112,228,78                  ; vpshufd       $0x4e,%xmm4,%xmm4
+  DB  196,226,121,51,228                  ; vpmovzxwd     %xmm4,%xmm4
+  DB  196,227,85,24,244,1                 ; vinsertf128   $0x1,%xmm4,%ymm5,%ymm6
+  DB  196,226,125,24,37,27,98,2,0         ; vbroadcastss  0x2621b(%rip),%ymm4        # 32f1c <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  DB  197,204,84,228                      ; vandps        %ymm4,%ymm6,%ymm4
+  DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
+  DB  196,226,125,24,45,14,98,2,0         ; vbroadcastss  0x2620e(%rip),%ymm5        # 32f20 <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  DB  197,220,89,229                      ; vmulps        %ymm5,%ymm4,%ymm4
+  DB  196,226,125,24,45,5,98,2,0          ; vbroadcastss  0x26205(%rip),%ymm5        # 32f24 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  DB  197,204,84,237                      ; vandps        %ymm5,%ymm6,%ymm5
+  DB  197,252,91,237                      ; vcvtdq2ps     %ymm5,%ymm5
+  DB  196,226,125,24,61,248,97,2,0        ; vbroadcastss  0x261f8(%rip),%ymm7        # 32f28 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  DB  197,212,89,239                      ; vmulps        %ymm7,%ymm5,%ymm5
+  DB  196,226,125,24,61,239,97,2,0        ; vbroadcastss  0x261ef(%rip),%ymm7        # 32f2c <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  DB  197,204,84,247                      ; vandps        %ymm7,%ymm6,%ymm6
+  DB  197,252,91,246                      ; vcvtdq2ps     %ymm6,%ymm6
+  DB  196,226,125,24,61,226,97,2,0        ; vbroadcastss  0x261e2(%rip),%ymm7        # 32f30 <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  DB  197,204,89,247                      ; vmulps        %ymm7,%ymm6,%ymm6
+  DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  196,226,125,24,61,67,97,2,0         ; vbroadcastss  0x26143(%rip),%ymm7        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  255,224                             ; jmpq          *%rax
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
+  DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  15,135,114,255,255,255              ; ja            cce3 <_sk_load_565_dst_avx+0x1f>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,97,0,0,0                  ; lea           0x61(%rip),%r9        # cddc <_sk_load_565_dst_avx+0x118>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
+  DB  255,224                             ; jmpq          *%rax
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
+  DB  197,249,110,224                     ; vmovd         %eax,%xmm4
+  DB  233,81,255,255,255                  ; jmpq          cce3 <_sk_load_565_dst_avx+0x1f>
+  DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
+  DB  196,193,89,196,100,80,4,2           ; vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm4,%xmm4
+  DB  196,193,121,110,44,80               ; vmovd         (%r8,%rdx,2),%xmm5
+  DB  196,227,89,14,229,3                 ; vpblendw      $0x3,%xmm5,%xmm4,%xmm4
+  DB  233,52,255,255,255                  ; jmpq          cce3 <_sk_load_565_dst_avx+0x1f>
+  DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
+  DB  196,193,89,196,100,80,12,6          ; vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm4,%xmm4
+  DB  196,193,89,196,100,80,10,5          ; vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm4,%xmm4
+  DB  196,193,89,196,100,80,8,4           ; vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm4,%xmm4
+  DB  196,193,122,126,44,80               ; vmovq         (%r8,%rdx,2),%xmm5
+  DB  196,227,81,14,228,240               ; vpblendw      $0xf0,%xmm4,%xmm5,%xmm4
+  DB  233,7,255,255,255                   ; jmpq          cce3 <_sk_load_565_dst_avx+0x1f>
   DB  168,255                             ; test          $0xff,%al
   DB  255                                 ; (bad)
   DB  255,194                             ; inc           %edx
@@ -12048,89 +12038,6 @@
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
 
-PUBLIC _sk_load_565_dst_avx
-_sk_load_565_dst_avx LABEL PROC
-  DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
-  DB  77,1,192                            ; add           %r8,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
-  DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,130,0,0,0                    ; jne           cf79 <_sk_load_565_dst_avx+0xa1>
-  DB  196,129,122,111,36,88               ; vmovdqu       (%r8,%r11,2),%xmm4
-  DB  196,226,121,51,236                  ; vpmovzxwd     %xmm4,%xmm5
-  DB  197,249,112,228,78                  ; vpshufd       $0x4e,%xmm4,%xmm4
-  DB  196,226,121,51,228                  ; vpmovzxwd     %xmm4,%xmm4
-  DB  196,227,85,24,244,1                 ; vinsertf128   $0x1,%xmm4,%ymm5,%ymm6
-  DB  196,226,125,24,37,45,102,2,0        ; vbroadcastss  0x2662d(%rip),%ymm4        # 33548 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
-  DB  197,204,84,228                      ; vandps        %ymm4,%ymm6,%ymm4
-  DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,226,125,24,45,32,102,2,0        ; vbroadcastss  0x26620(%rip),%ymm5        # 3354c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
-  DB  197,220,89,229                      ; vmulps        %ymm5,%ymm4,%ymm4
-  DB  196,226,125,24,45,23,102,2,0        ; vbroadcastss  0x26617(%rip),%ymm5        # 33550 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
-  DB  197,204,84,237                      ; vandps        %ymm5,%ymm6,%ymm5
-  DB  197,252,91,237                      ; vcvtdq2ps     %ymm5,%ymm5
-  DB  196,226,125,24,61,10,102,2,0        ; vbroadcastss  0x2660a(%rip),%ymm7        # 33554 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
-  DB  197,212,89,239                      ; vmulps        %ymm7,%ymm5,%ymm5
-  DB  196,226,125,24,61,1,102,2,0         ; vbroadcastss  0x26601(%rip),%ymm7        # 33558 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
-  DB  197,204,84,247                      ; vandps        %ymm7,%ymm6,%ymm6
-  DB  197,252,91,246                      ; vcvtdq2ps     %ymm6,%ymm6
-  DB  196,226,125,24,61,244,101,2,0       ; vbroadcastss  0x265f4(%rip),%ymm7        # 3355c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
-  DB  197,204,89,247                      ; vmulps        %ymm7,%ymm6,%ymm6
-  DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,61,85,101,2,0        ; vbroadcastss  0x26555(%rip),%ymm7        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
-  DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
-  DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,108,255,255,255              ; ja            cefd <_sk_load_565_dst_avx+0x25>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,100,0,0,0                 ; lea           0x64(%rip),%r10        # d000 <_sk_load_565_dst_avx+0x128>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
-  DB  255,224                             ; jmpq          *%rax
-  DB  67,15,183,4,88                      ; movzwl        (%r8,%r11,2),%eax
-  DB  197,249,110,224                     ; vmovd         %eax,%xmm4
-  DB  233,74,255,255,255                  ; jmpq          cefd <_sk_load_565_dst_avx+0x25>
-  DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
-  DB  196,129,89,196,100,88,4,2           ; vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
-  DB  196,129,121,110,44,88               ; vmovd         (%r8,%r11,2),%xmm5
-  DB  196,227,89,14,229,3                 ; vpblendw      $0x3,%xmm5,%xmm4,%xmm4
-  DB  233,45,255,255,255                  ; jmpq          cefd <_sk_load_565_dst_avx+0x25>
-  DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
-  DB  196,129,89,196,100,88,12,6          ; vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
-  DB  196,129,89,196,100,88,10,5          ; vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
-  DB  196,129,89,196,100,88,8,4           ; vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
-  DB  196,129,122,126,44,88               ; vmovq         (%r8,%r11,2),%xmm5
-  DB  196,227,81,14,228,240               ; vpblendw      $0xf0,%xmm4,%xmm5,%xmm4
-  DB  233,0,255,255,255                   ; jmpq          cefd <_sk_load_565_dst_avx+0x25>
-  DB  15,31,0                             ; nopl          (%rax)
-  DB  165                                 ; movsl         %ds:(%rsi),%es:(%rdi)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  191,255,255,255,179                 ; mov           $0xb3ffffff,%edi
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  236                                 ; in            (%dx),%al
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,228                             ; jmpq          *%rsp
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  220,255                             ; fdivr         %st,%st(7)
-  DB  255                                 ; (bad)
-  DB  255,208                             ; callq         *%rax
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; .byte         0xff
-
 PUBLIC _sk_gather_565_avx
 _sk_gather_565_avx LABEL PROC
   DB  85                                  ; push          %rbp
@@ -12198,23 +12105,23 @@
   DB  197,249,112,192,78                  ; vpshufd       $0x4e,%xmm0,%xmm0
   DB  196,226,121,51,192                  ; vpmovzxwd     %xmm0,%xmm0
   DB  196,227,117,24,208,1                ; vinsertf128   $0x1,%xmm0,%ymm1,%ymm2
-  DB  196,226,125,24,5,253,99,2,0         ; vbroadcastss  0x263fd(%rip),%ymm0        # 33548 <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
+  DB  196,226,125,24,5,245,95,2,0         ; vbroadcastss  0x25ff5(%rip),%ymm0        # 32f1c <_sk_srcover_bgra_8888_sse2_lowp+0x32c>
   DB  197,236,84,192                      ; vandps        %ymm0,%ymm2,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,240,99,2,0        ; vbroadcastss  0x263f0(%rip),%ymm1        # 3354c <_sk_srcover_bgra_8888_sse2_lowp+0x330>
+  DB  196,226,125,24,13,232,95,2,0        ; vbroadcastss  0x25fe8(%rip),%ymm1        # 32f20 <_sk_srcover_bgra_8888_sse2_lowp+0x330>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
-  DB  196,226,125,24,13,231,99,2,0        ; vbroadcastss  0x263e7(%rip),%ymm1        # 33550 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
+  DB  196,226,125,24,13,223,95,2,0        ; vbroadcastss  0x25fdf(%rip),%ymm1        # 32f24 <_sk_srcover_bgra_8888_sse2_lowp+0x334>
   DB  197,236,84,201                      ; vandps        %ymm1,%ymm2,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
-  DB  196,226,125,24,29,218,99,2,0        ; vbroadcastss  0x263da(%rip),%ymm3        # 33554 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
+  DB  196,226,125,24,29,210,95,2,0        ; vbroadcastss  0x25fd2(%rip),%ymm3        # 32f28 <_sk_srcover_bgra_8888_sse2_lowp+0x338>
   DB  197,244,89,203                      ; vmulps        %ymm3,%ymm1,%ymm1
-  DB  196,226,125,24,29,209,99,2,0        ; vbroadcastss  0x263d1(%rip),%ymm3        # 33558 <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
+  DB  196,226,125,24,29,201,95,2,0        ; vbroadcastss  0x25fc9(%rip),%ymm3        # 32f2c <_sk_srcover_bgra_8888_sse2_lowp+0x33c>
   DB  197,236,84,211                      ; vandps        %ymm3,%ymm2,%ymm2
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
-  DB  196,226,125,24,29,196,99,2,0        ; vbroadcastss  0x263c4(%rip),%ymm3        # 3355c <_sk_srcover_bgra_8888_sse2_lowp+0x340>
+  DB  196,226,125,24,29,188,95,2,0        ; vbroadcastss  0x25fbc(%rip),%ymm3        # 32f30 <_sk_srcover_bgra_8888_sse2_lowp+0x340>
   DB  197,236,89,211                      ; vmulps        %ymm3,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,37,99,2,0         ; vbroadcastss  0x26325(%rip),%ymm3        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,29,29,95,2,0         ; vbroadcastss  0x25f1d(%rip),%ymm3        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  91                                  ; pop           %rbx
   DB  65,92                               ; pop           %r12
   DB  65,94                               ; pop           %r14
@@ -12225,17 +12132,15 @@
 PUBLIC _sk_store_565_avx
 _sk_store_565_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,60,95,200                       ; vmaxps        %ymm0,%ymm8,%ymm9
-  DB  196,98,125,24,21,243,98,2,0         ; vbroadcastss  0x262f3(%rip),%ymm10        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,21,241,94,2,0         ; vbroadcastss  0x25ef1(%rip),%ymm10        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,65,52,93,202                    ; vminps        %ymm10,%ymm9,%ymm9
-  DB  196,98,125,24,29,213,99,2,0         ; vbroadcastss  0x263d5(%rip),%ymm11        # 335bc <_sk_srcover_bgra_8888_sse2_lowp+0x3a0>
+  DB  196,98,125,24,29,211,95,2,0         ; vbroadcastss  0x25fd3(%rip),%ymm11        # 32f90 <_sk_srcover_bgra_8888_sse2_lowp+0x3a0>
   DB  196,65,52,89,203                    ; vmulps        %ymm11,%ymm9,%ymm9
   DB  196,65,125,91,201                   ; vcvtps2dq     %ymm9,%ymm9
   DB  196,193,25,114,241,11               ; vpslld        $0xb,%xmm9,%xmm12
@@ -12244,7 +12149,7 @@
   DB  196,67,29,24,201,1                  ; vinsertf128   $0x1,%xmm9,%ymm12,%ymm9
   DB  197,60,95,225                       ; vmaxps        %ymm1,%ymm8,%ymm12
   DB  196,65,28,93,226                    ; vminps        %ymm10,%ymm12,%ymm12
-  DB  196,98,125,24,45,165,99,2,0         ; vbroadcastss  0x263a5(%rip),%ymm13        # 335c0 <_sk_srcover_bgra_8888_sse2_lowp+0x3a4>
+  DB  196,98,125,24,45,163,95,2,0         ; vbroadcastss  0x25fa3(%rip),%ymm13        # 32f94 <_sk_srcover_bgra_8888_sse2_lowp+0x3a4>
   DB  196,65,28,89,229                    ; vmulps        %ymm13,%ymm12,%ymm12
   DB  196,65,125,91,228                   ; vcvtps2dq     %ymm12,%ymm12
   DB  196,193,17,114,244,5                ; vpslld        $0x5,%xmm12,%xmm13
@@ -12260,138 +12165,129 @@
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
   DB  196,66,57,43,193                    ; vpackusdw     %xmm9,%xmm8,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           d274 <_sk_store_565_avx+0xc3>
-  DB  196,1,122,127,4,88                  ; vmovdqu       %xmm8,(%r8,%r11,2)
+  DB  117,10                              ; jne           d04a <_sk_store_565_avx+0xbd>
+  DB  196,65,122,127,4,80                 ; vmovdqu       %xmm8,(%r8,%rdx,2)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,236                             ; ja            d270 <_sk_store_565_avx+0xbf>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,69,0,0,0                  ; lea           0x45(%rip),%r10        # d2d4 <_sk_store_565_avx+0x123>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,242                             ; ja            d046 <_sk_store_565_avx+0xb9>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,66,0,0,0                  ; lea           0x42(%rip),%r9        # d0a0 <_sk_store_565_avx+0x113>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,3,121,21,4,88,0                 ; vpextrw       $0x0,%xmm8,(%r8,%r11,2)
-  DB  235,207                             ; jmp           d270 <_sk_store_565_avx+0xbf>
-  DB  196,3,121,21,68,88,4,2              ; vpextrw       $0x2,%xmm8,0x4(%r8,%r11,2)
-  DB  196,1,121,126,4,88                  ; vmovd         %xmm8,(%r8,%r11,2)
-  DB  235,191                             ; jmp           d270 <_sk_store_565_avx+0xbf>
-  DB  196,3,121,21,68,88,12,6             ; vpextrw       $0x6,%xmm8,0xc(%r8,%r11,2)
-  DB  196,3,121,21,68,88,10,5             ; vpextrw       $0x5,%xmm8,0xa(%r8,%r11,2)
-  DB  196,3,121,21,68,88,8,4              ; vpextrw       $0x4,%xmm8,0x8(%r8,%r11,2)
-  DB  196,1,121,214,4,88                  ; vmovq         %xmm8,(%r8,%r11,2)
-  DB  235,159                             ; jmp           d270 <_sk_store_565_avx+0xbf>
-  DB  15,31,0                             ; nopl          (%rax)
-  DB  196                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,213                             ; callq         *%rbp
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,205                             ; dec           %ebp
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,245                             ; push          %rbp
+  DB  196,67,121,21,4,80,0                ; vpextrw       $0x0,%xmm8,(%r8,%rdx,2)
+  DB  235,214                             ; jmp           d046 <_sk_store_565_avx+0xb9>
+  DB  196,67,121,21,68,80,4,2             ; vpextrw       $0x2,%xmm8,0x4(%r8,%rdx,2)
+  DB  196,65,121,126,4,80                 ; vmovd         %xmm8,(%r8,%rdx,2)
+  DB  235,198                             ; jmp           d046 <_sk_store_565_avx+0xb9>
+  DB  196,67,121,21,68,80,12,6            ; vpextrw       $0x6,%xmm8,0xc(%r8,%rdx,2)
+  DB  196,67,121,21,68,80,10,5            ; vpextrw       $0x5,%xmm8,0xa(%r8,%rdx,2)
+  DB  196,67,121,21,68,80,8,4             ; vpextrw       $0x4,%xmm8,0x8(%r8,%rdx,2)
+  DB  196,65,121,214,4,80                 ; vmovq         %xmm8,(%r8,%rdx,2)
+  DB  235,166                             ; jmp           d046 <_sk_store_565_avx+0xb9>
+  DB  199                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  237                                 ; in            (%dx),%eax
+  DB  216,255                             ; fdivr         %st(7),%st
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,229                             ; jmpq          *%rbp
+  DB  255,208                             ; callq         *%rax
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  221,255                             ; (bad)
+  DB  248                                 ; clc
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,240                             ; push          %rax
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  232,255,255,255,224                 ; callq         ffffffffe100d0b8 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffe0fda4c8>
+  DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
 
 PUBLIC _sk_load_4444_avx
 _sk_load_4444_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,154,0,0,0                    ; jne           d3a9 <_sk_load_4444_avx+0xb9>
-  DB  196,129,122,111,4,88                ; vmovdqu       (%r8,%r11,2),%xmm0
+  DB  15,133,154,0,0,0                    ; jne           d16f <_sk_load_4444_avx+0xb3>
+  DB  196,193,122,111,4,80                ; vmovdqu       (%r8,%rdx,2),%xmm0
   DB  196,226,121,51,200                  ; vpmovzxwd     %xmm0,%xmm1
   DB  197,249,112,192,78                  ; vpshufd       $0x4e,%xmm0,%xmm0
   DB  196,226,121,51,192                  ; vpmovzxwd     %xmm0,%xmm0
   DB  196,227,117,24,216,1                ; vinsertf128   $0x1,%xmm0,%ymm1,%ymm3
-  DB  196,226,125,24,5,145,98,2,0         ; vbroadcastss  0x26291(%rip),%ymm0        # 335c4 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
+  DB  196,226,125,24,5,159,94,2,0         ; vbroadcastss  0x25e9f(%rip),%ymm0        # 32f98 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
   DB  197,228,84,192                      ; vandps        %ymm0,%ymm3,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,132,98,2,0        ; vbroadcastss  0x26284(%rip),%ymm1        # 335c8 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
+  DB  196,226,125,24,13,146,94,2,0        ; vbroadcastss  0x25e92(%rip),%ymm1        # 32f9c <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
-  DB  196,226,125,24,13,123,98,2,0        ; vbroadcastss  0x2627b(%rip),%ymm1        # 335cc <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
+  DB  196,226,125,24,13,137,94,2,0        ; vbroadcastss  0x25e89(%rip),%ymm1        # 32fa0 <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
   DB  197,228,84,201                      ; vandps        %ymm1,%ymm3,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
-  DB  196,226,125,24,21,110,98,2,0        ; vbroadcastss  0x2626e(%rip),%ymm2        # 335d0 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
+  DB  196,226,125,24,21,124,94,2,0        ; vbroadcastss  0x25e7c(%rip),%ymm2        # 32fa4 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
   DB  197,244,89,202                      ; vmulps        %ymm2,%ymm1,%ymm1
-  DB  196,226,125,24,21,101,98,2,0        ; vbroadcastss  0x26265(%rip),%ymm2        # 335d4 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
+  DB  196,226,125,24,21,115,94,2,0        ; vbroadcastss  0x25e73(%rip),%ymm2        # 32fa8 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
   DB  197,228,84,210                      ; vandps        %ymm2,%ymm3,%ymm2
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
-  DB  196,98,125,24,5,88,98,2,0           ; vbroadcastss  0x26258(%rip),%ymm8        # 335d8 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
+  DB  196,98,125,24,5,102,94,2,0          ; vbroadcastss  0x25e66(%rip),%ymm8        # 32fac <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
   DB  196,193,108,89,208                  ; vmulps        %ymm8,%ymm2,%ymm2
-  DB  196,98,125,24,5,78,98,2,0           ; vbroadcastss  0x2624e(%rip),%ymm8        # 335dc <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
+  DB  196,98,125,24,5,92,94,2,0           ; vbroadcastss  0x25e5c(%rip),%ymm8        # 32fb0 <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
   DB  196,193,100,84,216                  ; vandps        %ymm8,%ymm3,%ymm3
   DB  197,252,91,219                      ; vcvtdq2ps     %ymm3,%ymm3
-  DB  196,98,125,24,5,64,98,2,0           ; vbroadcastss  0x26240(%rip),%ymm8        # 335e0 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
+  DB  196,98,125,24,5,78,94,2,0           ; vbroadcastss  0x25e4e(%rip),%ymm8        # 32fb4 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
   DB  196,193,100,89,216                  ; vmulps        %ymm8,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,84,255,255,255               ; ja            d315 <_sk_load_4444_avx+0x25>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,100,0,0,0                 ; lea           0x64(%rip),%r10        # d430 <_sk_load_4444_avx+0x140>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  15,135,90,255,255,255               ; ja            d0db <_sk_load_4444_avx+0x1f>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,97,0,0,0                  ; lea           0x61(%rip),%r9        # d1ec <_sk_load_4444_avx+0x130>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  67,15,183,4,88                      ; movzwl        (%r8,%r11,2),%eax
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  197,249,110,192                     ; vmovd         %eax,%xmm0
-  DB  233,50,255,255,255                  ; jmpq          d315 <_sk_load_4444_avx+0x25>
+  DB  233,57,255,255,255                  ; jmpq          d0db <_sk_load_4444_avx+0x1f>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
-  DB  196,129,121,196,68,88,4,2           ; vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
-  DB  196,129,121,110,12,88               ; vmovd         (%r8,%r11,2),%xmm1
+  DB  196,193,121,196,68,80,4,2           ; vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm0,%xmm0
+  DB  196,193,121,110,12,80               ; vmovd         (%r8,%rdx,2),%xmm1
   DB  196,227,121,14,193,3                ; vpblendw      $0x3,%xmm1,%xmm0,%xmm0
-  DB  233,21,255,255,255                  ; jmpq          d315 <_sk_load_4444_avx+0x25>
+  DB  233,28,255,255,255                  ; jmpq          d0db <_sk_load_4444_avx+0x1f>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
-  DB  196,129,121,196,68,88,12,6          ; vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
-  DB  196,129,121,196,68,88,10,5          ; vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
-  DB  196,129,121,196,68,88,8,4           ; vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
-  DB  196,129,122,126,12,88               ; vmovq         (%r8,%r11,2),%xmm1
+  DB  196,193,121,196,68,80,12,6          ; vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm0,%xmm0
+  DB  196,193,121,196,68,80,10,5          ; vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm0,%xmm0
+  DB  196,193,121,196,68,80,8,4           ; vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm0,%xmm0
+  DB  196,193,122,126,12,80               ; vmovq         (%r8,%rdx,2),%xmm1
   DB  196,227,113,14,192,240              ; vpblendw      $0xf0,%xmm0,%xmm1,%xmm0
-  DB  233,232,254,255,255                 ; jmpq          d315 <_sk_load_4444_avx+0x25>
-  DB  15,31,0                             ; nopl          (%rax)
-  DB  165                                 ; movsl         %ds:(%rsi),%es:(%rdi)
+  DB  233,239,254,255,255                 ; jmpq          d0db <_sk_load_4444_avx+0x1f>
+  DB  168,255                             ; test          $0xff,%al
+  DB  255                                 ; (bad)
+  DB  255,194                             ; inc           %edx
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,182,255,255,255,239             ; pushq         -0x10000001(%rsi)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,231                             ; jmpq          *%rdi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  191,255,255,255,179                 ; mov           $0xb3ffffff,%edi
+  DB  223,255                             ; (bad)
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  236                                 ; in            (%dx),%al
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,228                             ; jmpq          *%rsp
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  220,255                             ; fdivr         %st,%st(7)
-  DB  255                                 ; (bad)
-  DB  255,208                             ; callq         *%rax
+  DB  255,211                             ; callq         *%rbx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -12399,86 +12295,80 @@
 PUBLIC _sk_load_4444_dst_avx
 _sk_load_4444_dst_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,154,0,0,0                    ; jne           d505 <_sk_load_4444_dst_avx+0xb9>
-  DB  196,129,122,111,36,88               ; vmovdqu       (%r8,%r11,2),%xmm4
+  DB  15,133,154,0,0,0                    ; jne           d2bb <_sk_load_4444_dst_avx+0xb3>
+  DB  196,193,122,111,36,80               ; vmovdqu       (%r8,%rdx,2),%xmm4
   DB  196,226,121,51,236                  ; vpmovzxwd     %xmm4,%xmm5
   DB  197,249,112,228,78                  ; vpshufd       $0x4e,%xmm4,%xmm4
   DB  196,226,121,51,228                  ; vpmovzxwd     %xmm4,%xmm4
   DB  196,227,85,24,252,1                 ; vinsertf128   $0x1,%xmm4,%ymm5,%ymm7
-  DB  196,226,125,24,37,53,97,2,0         ; vbroadcastss  0x26135(%rip),%ymm4        # 335c4 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
+  DB  196,226,125,24,37,83,93,2,0         ; vbroadcastss  0x25d53(%rip),%ymm4        # 32f98 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
   DB  197,196,84,228                      ; vandps        %ymm4,%ymm7,%ymm4
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,226,125,24,45,40,97,2,0         ; vbroadcastss  0x26128(%rip),%ymm5        # 335c8 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
+  DB  196,226,125,24,45,70,93,2,0         ; vbroadcastss  0x25d46(%rip),%ymm5        # 32f9c <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
   DB  197,220,89,229                      ; vmulps        %ymm5,%ymm4,%ymm4
-  DB  196,226,125,24,45,31,97,2,0         ; vbroadcastss  0x2611f(%rip),%ymm5        # 335cc <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
+  DB  196,226,125,24,45,61,93,2,0         ; vbroadcastss  0x25d3d(%rip),%ymm5        # 32fa0 <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
   DB  197,196,84,237                      ; vandps        %ymm5,%ymm7,%ymm5
   DB  197,252,91,237                      ; vcvtdq2ps     %ymm5,%ymm5
-  DB  196,226,125,24,53,18,97,2,0         ; vbroadcastss  0x26112(%rip),%ymm6        # 335d0 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
+  DB  196,226,125,24,53,48,93,2,0         ; vbroadcastss  0x25d30(%rip),%ymm6        # 32fa4 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
   DB  197,212,89,238                      ; vmulps        %ymm6,%ymm5,%ymm5
-  DB  196,226,125,24,53,9,97,2,0          ; vbroadcastss  0x26109(%rip),%ymm6        # 335d4 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
+  DB  196,226,125,24,53,39,93,2,0         ; vbroadcastss  0x25d27(%rip),%ymm6        # 32fa8 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
   DB  197,196,84,246                      ; vandps        %ymm6,%ymm7,%ymm6
   DB  197,252,91,246                      ; vcvtdq2ps     %ymm6,%ymm6
-  DB  196,98,125,24,5,252,96,2,0          ; vbroadcastss  0x260fc(%rip),%ymm8        # 335d8 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
+  DB  196,98,125,24,5,26,93,2,0           ; vbroadcastss  0x25d1a(%rip),%ymm8        # 32fac <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
   DB  196,193,76,89,240                   ; vmulps        %ymm8,%ymm6,%ymm6
-  DB  196,98,125,24,5,242,96,2,0          ; vbroadcastss  0x260f2(%rip),%ymm8        # 335dc <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
+  DB  196,98,125,24,5,16,93,2,0           ; vbroadcastss  0x25d10(%rip),%ymm8        # 32fb0 <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
   DB  196,193,68,84,248                   ; vandps        %ymm8,%ymm7,%ymm7
   DB  197,252,91,255                      ; vcvtdq2ps     %ymm7,%ymm7
-  DB  196,98,125,24,5,228,96,2,0          ; vbroadcastss  0x260e4(%rip),%ymm8        # 335e0 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
+  DB  196,98,125,24,5,2,93,2,0            ; vbroadcastss  0x25d02(%rip),%ymm8        # 32fb4 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
   DB  196,193,68,89,248                   ; vmulps        %ymm8,%ymm7,%ymm7
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,84,255,255,255               ; ja            d471 <_sk_load_4444_dst_avx+0x25>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,100,0,0,0                 ; lea           0x64(%rip),%r10        # d58c <_sk_load_4444_dst_avx+0x140>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  15,135,90,255,255,255               ; ja            d227 <_sk_load_4444_dst_avx+0x1f>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,97,0,0,0                  ; lea           0x61(%rip),%r9        # d338 <_sk_load_4444_dst_avx+0x130>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  67,15,183,4,88                      ; movzwl        (%r8,%r11,2),%eax
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  197,249,110,224                     ; vmovd         %eax,%xmm4
-  DB  233,50,255,255,255                  ; jmpq          d471 <_sk_load_4444_dst_avx+0x25>
+  DB  233,57,255,255,255                  ; jmpq          d227 <_sk_load_4444_dst_avx+0x1f>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
-  DB  196,129,89,196,100,88,4,2           ; vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
-  DB  196,129,121,110,44,88               ; vmovd         (%r8,%r11,2),%xmm5
+  DB  196,193,89,196,100,80,4,2           ; vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm4,%xmm4
+  DB  196,193,121,110,44,80               ; vmovd         (%r8,%rdx,2),%xmm5
   DB  196,227,89,14,229,3                 ; vpblendw      $0x3,%xmm5,%xmm4,%xmm4
-  DB  233,21,255,255,255                  ; jmpq          d471 <_sk_load_4444_dst_avx+0x25>
+  DB  233,28,255,255,255                  ; jmpq          d227 <_sk_load_4444_dst_avx+0x1f>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
-  DB  196,129,89,196,100,88,12,6          ; vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
-  DB  196,129,89,196,100,88,10,5          ; vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
-  DB  196,129,89,196,100,88,8,4           ; vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
-  DB  196,129,122,126,44,88               ; vmovq         (%r8,%r11,2),%xmm5
+  DB  196,193,89,196,100,80,12,6          ; vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm4,%xmm4
+  DB  196,193,89,196,100,80,10,5          ; vpinsrw       $0x5,0xa(%r8,%rdx,2),%xmm4,%xmm4
+  DB  196,193,89,196,100,80,8,4           ; vpinsrw       $0x4,0x8(%r8,%rdx,2),%xmm4,%xmm4
+  DB  196,193,122,126,44,80               ; vmovq         (%r8,%rdx,2),%xmm5
   DB  196,227,81,14,228,240               ; vpblendw      $0xf0,%xmm4,%xmm5,%xmm4
-  DB  233,232,254,255,255                 ; jmpq          d471 <_sk_load_4444_dst_avx+0x25>
-  DB  15,31,0                             ; nopl          (%rax)
-  DB  165                                 ; movsl         %ds:(%rsi),%es:(%rdi)
+  DB  233,239,254,255,255                 ; jmpq          d227 <_sk_load_4444_dst_avx+0x1f>
+  DB  168,255                             ; test          $0xff,%al
+  DB  255                                 ; (bad)
+  DB  255,194                             ; inc           %edx
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,182,255,255,255,239             ; pushq         -0x10000001(%rsi)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,231                             ; jmpq          *%rdi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  191,255,255,255,179                 ; mov           $0xb3ffffff,%edi
+  DB  223,255                             ; (bad)
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  236                                 ; in            (%dx),%al
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,228                             ; jmpq          *%rsp
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  220,255                             ; fdivr         %st,%st(7)
-  DB  255                                 ; (bad)
-  DB  255,208                             ; callq         *%rax
+  DB  255,211                             ; callq         *%rbx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -12550,25 +12440,25 @@
   DB  197,249,112,192,78                  ; vpshufd       $0x4e,%xmm0,%xmm0
   DB  196,226,121,51,192                  ; vpmovzxwd     %xmm0,%xmm0
   DB  196,227,117,24,216,1                ; vinsertf128   $0x1,%xmm0,%ymm1,%ymm3
-  DB  196,226,125,24,5,237,94,2,0         ; vbroadcastss  0x25eed(%rip),%ymm0        # 335c4 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
+  DB  196,226,125,24,5,21,91,2,0          ; vbroadcastss  0x25b15(%rip),%ymm0        # 32f98 <_sk_srcover_bgra_8888_sse2_lowp+0x3a8>
   DB  197,228,84,192                      ; vandps        %ymm0,%ymm3,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,224,94,2,0        ; vbroadcastss  0x25ee0(%rip),%ymm1        # 335c8 <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
+  DB  196,226,125,24,13,8,91,2,0          ; vbroadcastss  0x25b08(%rip),%ymm1        # 32f9c <_sk_srcover_bgra_8888_sse2_lowp+0x3ac>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
-  DB  196,226,125,24,13,215,94,2,0        ; vbroadcastss  0x25ed7(%rip),%ymm1        # 335cc <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
+  DB  196,226,125,24,13,255,90,2,0        ; vbroadcastss  0x25aff(%rip),%ymm1        # 32fa0 <_sk_srcover_bgra_8888_sse2_lowp+0x3b0>
   DB  197,228,84,201                      ; vandps        %ymm1,%ymm3,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
-  DB  196,226,125,24,21,202,94,2,0        ; vbroadcastss  0x25eca(%rip),%ymm2        # 335d0 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
+  DB  196,226,125,24,21,242,90,2,0        ; vbroadcastss  0x25af2(%rip),%ymm2        # 32fa4 <_sk_srcover_bgra_8888_sse2_lowp+0x3b4>
   DB  197,244,89,202                      ; vmulps        %ymm2,%ymm1,%ymm1
-  DB  196,226,125,24,21,193,94,2,0        ; vbroadcastss  0x25ec1(%rip),%ymm2        # 335d4 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
+  DB  196,226,125,24,21,233,90,2,0        ; vbroadcastss  0x25ae9(%rip),%ymm2        # 32fa8 <_sk_srcover_bgra_8888_sse2_lowp+0x3b8>
   DB  197,228,84,210                      ; vandps        %ymm2,%ymm3,%ymm2
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
-  DB  196,98,125,24,5,180,94,2,0          ; vbroadcastss  0x25eb4(%rip),%ymm8        # 335d8 <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
+  DB  196,98,125,24,5,220,90,2,0          ; vbroadcastss  0x25adc(%rip),%ymm8        # 32fac <_sk_srcover_bgra_8888_sse2_lowp+0x3bc>
   DB  196,193,108,89,208                  ; vmulps        %ymm8,%ymm2,%ymm2
-  DB  196,98,125,24,5,170,94,2,0          ; vbroadcastss  0x25eaa(%rip),%ymm8        # 335dc <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
+  DB  196,98,125,24,5,210,90,2,0          ; vbroadcastss  0x25ad2(%rip),%ymm8        # 32fb0 <_sk_srcover_bgra_8888_sse2_lowp+0x3c0>
   DB  196,193,100,84,216                  ; vandps        %ymm8,%ymm3,%ymm3
   DB  197,252,91,219                      ; vcvtdq2ps     %ymm3,%ymm3
-  DB  196,98,125,24,5,156,94,2,0          ; vbroadcastss  0x25e9c(%rip),%ymm8        # 335e0 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
+  DB  196,98,125,24,5,196,90,2,0          ; vbroadcastss  0x25ac4(%rip),%ymm8        # 32fb4 <_sk_srcover_bgra_8888_sse2_lowp+0x3c4>
   DB  196,193,100,89,216                  ; vmulps        %ymm8,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  91                                  ; pop           %rbx
@@ -12581,17 +12471,15 @@
 PUBLIC _sk_store_4444_avx
 _sk_store_4444_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,60,95,208                       ; vmaxps        %ymm0,%ymm8,%ymm10
-  DB  196,98,125,24,13,79,93,2,0          ; vbroadcastss  0x25d4f(%rip),%ymm9        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,13,125,89,2,0         ; vbroadcastss  0x2597d(%rip),%ymm9        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,65,44,93,209                    ; vminps        %ymm9,%ymm10,%ymm10
-  DB  196,98,125,24,29,89,94,2,0          ; vbroadcastss  0x25e59(%rip),%ymm11        # 335e4 <_sk_srcover_bgra_8888_sse2_lowp+0x3c8>
+  DB  196,98,125,24,29,135,90,2,0         ; vbroadcastss  0x25a87(%rip),%ymm11        # 32fb8 <_sk_srcover_bgra_8888_sse2_lowp+0x3c8>
   DB  196,65,44,89,211                    ; vmulps        %ymm11,%ymm10,%ymm10
   DB  196,65,125,91,210                   ; vcvtps2dq     %ymm10,%ymm10
   DB  196,193,25,114,242,12               ; vpslld        $0xc,%xmm10,%xmm12
@@ -12624,68 +12512,69 @@
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
   DB  196,66,57,43,193                    ; vpackusdw     %xmm9,%xmm8,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           d83f <_sk_store_4444_avx+0xea>
-  DB  196,1,122,127,4,88                  ; vmovdqu       %xmm8,(%r8,%r11,2)
+  DB  117,10                              ; jne           d5e5 <_sk_store_4444_avx+0xe4>
+  DB  196,65,122,127,4,80                 ; vmovdqu       %xmm8,(%r8,%rdx,2)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,236                             ; ja            d83b <_sk_store_4444_avx+0xe6>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,66,0,0,0                  ; lea           0x42(%rip),%r10        # d89c <_sk_store_4444_avx+0x147>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,242                             ; ja            d5e1 <_sk_store_4444_avx+0xe0>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,67,0,0,0                  ; lea           0x43(%rip),%r9        # d63c <_sk_store_4444_avx+0x13b>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,3,121,21,4,88,0                 ; vpextrw       $0x0,%xmm8,(%r8,%r11,2)
-  DB  235,207                             ; jmp           d83b <_sk_store_4444_avx+0xe6>
-  DB  196,3,121,21,68,88,4,2              ; vpextrw       $0x2,%xmm8,0x4(%r8,%r11,2)
-  DB  196,1,121,126,4,88                  ; vmovd         %xmm8,(%r8,%r11,2)
-  DB  235,191                             ; jmp           d83b <_sk_store_4444_avx+0xe6>
-  DB  196,3,121,21,68,88,12,6             ; vpextrw       $0x6,%xmm8,0xc(%r8,%r11,2)
-  DB  196,3,121,21,68,88,10,5             ; vpextrw       $0x5,%xmm8,0xa(%r8,%r11,2)
-  DB  196,3,121,21,68,88,8,4              ; vpextrw       $0x4,%xmm8,0x8(%r8,%r11,2)
-  DB  196,1,121,214,4,88                  ; vmovq         %xmm8,(%r8,%r11,2)
-  DB  235,159                             ; jmp           d83b <_sk_store_4444_avx+0xe6>
-  DB  199                                 ; (bad)
+  DB  196,67,121,21,4,80,0                ; vpextrw       $0x0,%xmm8,(%r8,%rdx,2)
+  DB  235,214                             ; jmp           d5e1 <_sk_store_4444_avx+0xe0>
+  DB  196,67,121,21,68,80,4,2             ; vpextrw       $0x2,%xmm8,0x4(%r8,%rdx,2)
+  DB  196,65,121,126,4,80                 ; vmovd         %xmm8,(%r8,%rdx,2)
+  DB  235,198                             ; jmp           d5e1 <_sk_store_4444_avx+0xe0>
+  DB  196,67,121,21,68,80,12,6            ; vpextrw       $0x6,%xmm8,0xc(%r8,%rdx,2)
+  DB  196,67,121,21,68,80,10,5            ; vpextrw       $0x5,%xmm8,0xa(%r8,%rdx,2)
+  DB  196,67,121,21,68,80,8,4             ; vpextrw       $0x4,%xmm8,0x8(%r8,%rdx,2)
+  DB  196,65,121,214,4,80                 ; vmovq         %xmm8,(%r8,%rdx,2)
+  DB  235,166                             ; jmp           d5e1 <_sk_store_4444_avx+0xe0>
+  DB  144                                 ; nop
+  DB  198                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,215                             ; callq         *%rdi
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,207                             ; dec           %edi
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,247                             ; push          %rdi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  216,255                             ; fdivr         %st(7),%st
+  DB  239                                 ; out           %eax,(%dx)
   DB  255                                 ; (bad)
-  DB  255,208                             ; callq         *%rax
+  DB  255                                 ; (bad)
+  DB  255,231                             ; jmpq          *%rdi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  248                                 ; clc
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,240                             ; push          %rax
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  232,255,255,255,224                 ; callq         ffffffffe100d8b4 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffe0fda698>
-  DB  255                                 ; (bad)
+  DB  223,255                             ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
 
 PUBLIC _sk_load_8888_avx
 _sk_load_8888_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,135,0,0,0                    ; jne           d95f <_sk_load_8888_avx+0xa7>
-  DB  196,1,125,16,12,152                 ; vmovupd       (%r8,%r11,4),%ymm9
-  DB  197,125,40,21,218,97,2,0            ; vmovapd       0x261da(%rip),%ymm10        # 33ac0 <_sk_srcover_bgra_8888_sse2_lowp+0x8a4>
+  DB  15,133,135,0,0,0                    ; jne           d6f9 <_sk_load_8888_avx+0xa1>
+  DB  196,65,125,16,12,144                ; vmovupd       (%r8,%rdx,4),%ymm9
+  DB  197,125,40,21,32,94,2,0             ; vmovapd       0x25e20(%rip),%ymm10        # 334a0 <_sk_srcover_bgra_8888_sse2_lowp+0x8b0>
   DB  196,193,53,84,194                   ; vandpd        %ymm10,%ymm9,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,5,76,92,2,0           ; vbroadcastss  0x25c4c(%rip),%ymm8        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,98,125,24,5,134,88,2,0          ; vbroadcastss  0x25886(%rip),%ymm8        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
   DB  196,193,113,114,209,8               ; vpsrld        $0x8,%xmm9,%xmm1
   DB  196,99,125,25,203,1                 ; vextractf128  $0x1,%ymm9,%xmm3
@@ -12707,58 +12596,58 @@
   DB  196,193,100,89,216                  ; vmulps        %ymm8,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,102,255,255,255              ; ja            d8de <_sk_load_8888_avx+0x26>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,145,0,0,0                 ; lea           0x91(%rip),%r10        # da14 <_sk_load_8888_avx+0x15c>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  15,135,108,255,255,255              ; ja            d678 <_sk_load_8888_avx+0x20>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,146,0,0,0                 ; lea           0x92(%rip),%r9        # d7a8 <_sk_load_8888_avx+0x150>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,1,122,16,12,152                 ; vmovss        (%r8,%r11,4),%xmm9
-  DB  233,71,255,255,255                  ; jmpq          d8de <_sk_load_8888_avx+0x26>
-  DB  196,129,121,110,68,152,8            ; vmovd         0x8(%r8,%r11,4),%xmm0
+  DB  196,65,122,16,12,144                ; vmovss        (%r8,%rdx,4),%xmm9
+  DB  233,78,255,255,255                  ; jmpq          d678 <_sk_load_8888_avx+0x20>
+  DB  196,193,121,110,68,144,8            ; vmovd         0x8(%r8,%rdx,4),%xmm0
   DB  197,249,112,192,68                  ; vpshufd       $0x44,%xmm0,%xmm0
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  196,99,117,12,200,4                 ; vblendps      $0x4,%ymm0,%ymm1,%ymm9
-  DB  196,129,123,16,4,152                ; vmovsd        (%r8,%r11,4),%xmm0
+  DB  196,193,123,16,4,144                ; vmovsd        (%r8,%rdx,4),%xmm0
   DB  196,99,53,13,200,1                  ; vblendpd      $0x1,%ymm0,%ymm9,%ymm9
-  DB  233,32,255,255,255                  ; jmpq          d8de <_sk_load_8888_avx+0x26>
-  DB  196,129,121,110,68,152,24           ; vmovd         0x18(%r8,%r11,4),%xmm0
+  DB  233,39,255,255,255                  ; jmpq          d678 <_sk_load_8888_avx+0x20>
+  DB  196,193,121,110,68,144,24           ; vmovd         0x18(%r8,%rdx,4),%xmm0
   DB  197,249,112,192,68                  ; vpshufd       $0x44,%xmm0,%xmm0
   DB  196,227,125,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  196,99,117,12,200,64                ; vblendps      $0x40,%ymm0,%ymm1,%ymm9
   DB  196,99,125,25,200,1                 ; vextractf128  $0x1,%ymm9,%xmm0
-  DB  196,131,121,34,68,152,20,1          ; vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm0,%xmm0
+  DB  196,195,121,34,68,144,20,1          ; vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm0,%xmm0
   DB  196,99,53,24,200,1                  ; vinsertf128   $0x1,%xmm0,%ymm9,%ymm9
   DB  196,99,125,25,200,1                 ; vextractf128  $0x1,%ymm9,%xmm0
-  DB  196,131,121,34,68,152,16,0          ; vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm0,%xmm0
+  DB  196,195,121,34,68,144,16,0          ; vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm0,%xmm0
   DB  196,99,53,24,200,1                  ; vinsertf128   $0x1,%xmm0,%ymm9,%ymm9
-  DB  196,129,121,16,4,152                ; vmovupd       (%r8,%r11,4),%xmm0
+  DB  196,193,121,16,4,144                ; vmovupd       (%r8,%rdx,4),%xmm0
   DB  196,67,125,13,201,12                ; vblendpd      $0xc,%ymm9,%ymm0,%ymm9
-  DB  233,203,254,255,255                 ; jmpq          d8de <_sk_load_8888_avx+0x26>
-  DB  144                                 ; nop
-  DB  120,255                             ; js            da15 <_sk_load_8888_avx+0x15d>
+  DB  233,210,254,255,255                 ; jmpq          d678 <_sk_load_8888_avx+0x20>
+  DB  102,144                             ; xchg          %ax,%ax
+  DB  119,255                             ; ja            d7a9 <_sk_load_8888_avx+0x151>
   DB  255                                 ; (bad)
-  DB  255,153,255,255,255,131             ; lcall         *-0x7c000001(%rcx)
+  DB  255,152,255,255,255,130             ; lcall         *-0x7d000001(%rax)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  238                                 ; out           %al,(%dx)
+  DB  237                                 ; in            (%dx),%eax
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  218,255                             ; (bad)
+  DB  217,255                             ; fcos
   DB  255                                 ; (bad)
-  DB  255,198                             ; inc           %esi
+  DB  255,197                             ; inc           %ebp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
-  DB  170                                 ; stos          %al,%es:(%rdi)
+  DB  169                                 ; .byte         0xa9
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -12766,19 +12655,17 @@
 PUBLIC _sk_load_8888_dst_avx
 _sk_load_8888_dst_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,135,0,0,0                    ; jne           dad7 <_sk_load_8888_dst_avx+0xa7>
-  DB  196,1,125,16,12,152                 ; vmovupd       (%r8,%r11,4),%ymm9
-  DB  197,125,40,21,130,96,2,0            ; vmovapd       0x26082(%rip),%ymm10        # 33ae0 <_sk_srcover_bgra_8888_sse2_lowp+0x8c4>
+  DB  15,133,135,0,0,0                    ; jne           d865 <_sk_load_8888_dst_avx+0xa1>
+  DB  196,65,125,16,12,144                ; vmovupd       (%r8,%rdx,4),%ymm9
+  DB  197,125,40,21,212,92,2,0            ; vmovapd       0x25cd4(%rip),%ymm10        # 334c0 <_sk_srcover_bgra_8888_sse2_lowp+0x8d0>
   DB  196,193,53,84,226                   ; vandpd        %ymm10,%ymm9,%ymm4
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,98,125,24,5,212,90,2,0          ; vbroadcastss  0x25ad4(%rip),%ymm8        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,98,125,24,5,26,87,2,0           ; vbroadcastss  0x2571a(%rip),%ymm8        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  196,193,92,89,224                   ; vmulps        %ymm8,%ymm4,%ymm4
   DB  196,193,81,114,209,8                ; vpsrld        $0x8,%xmm9,%xmm5
   DB  196,99,125,25,207,1                 ; vextractf128  $0x1,%ymm9,%xmm7
@@ -12800,58 +12687,58 @@
   DB  196,193,68,89,248                   ; vmulps        %ymm8,%ymm7,%ymm7
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,102,255,255,255              ; ja            da56 <_sk_load_8888_dst_avx+0x26>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,145,0,0,0                 ; lea           0x91(%rip),%r10        # db8c <_sk_load_8888_dst_avx+0x15c>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  15,135,108,255,255,255              ; ja            d7e4 <_sk_load_8888_dst_avx+0x20>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,146,0,0,0                 ; lea           0x92(%rip),%r9        # d914 <_sk_load_8888_dst_avx+0x150>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,1,122,16,12,152                 ; vmovss        (%r8,%r11,4),%xmm9
-  DB  233,71,255,255,255                  ; jmpq          da56 <_sk_load_8888_dst_avx+0x26>
-  DB  196,129,121,110,100,152,8           ; vmovd         0x8(%r8,%r11,4),%xmm4
+  DB  196,65,122,16,12,144                ; vmovss        (%r8,%rdx,4),%xmm9
+  DB  233,78,255,255,255                  ; jmpq          d7e4 <_sk_load_8888_dst_avx+0x20>
+  DB  196,193,121,110,100,144,8           ; vmovd         0x8(%r8,%rdx,4),%xmm4
   DB  197,249,112,228,68                  ; vpshufd       $0x44,%xmm4,%xmm4
   DB  197,212,87,237                      ; vxorps        %ymm5,%ymm5,%ymm5
   DB  196,99,85,12,204,4                  ; vblendps      $0x4,%ymm4,%ymm5,%ymm9
-  DB  196,129,123,16,36,152               ; vmovsd        (%r8,%r11,4),%xmm4
+  DB  196,193,123,16,36,144               ; vmovsd        (%r8,%rdx,4),%xmm4
   DB  196,99,53,13,204,1                  ; vblendpd      $0x1,%ymm4,%ymm9,%ymm9
-  DB  233,32,255,255,255                  ; jmpq          da56 <_sk_load_8888_dst_avx+0x26>
-  DB  196,129,121,110,100,152,24          ; vmovd         0x18(%r8,%r11,4),%xmm4
+  DB  233,39,255,255,255                  ; jmpq          d7e4 <_sk_load_8888_dst_avx+0x20>
+  DB  196,193,121,110,100,144,24          ; vmovd         0x18(%r8,%rdx,4),%xmm4
   DB  197,249,112,228,68                  ; vpshufd       $0x44,%xmm4,%xmm4
   DB  196,227,125,24,228,1                ; vinsertf128   $0x1,%xmm4,%ymm0,%ymm4
   DB  197,212,87,237                      ; vxorps        %ymm5,%ymm5,%ymm5
   DB  196,99,85,12,204,64                 ; vblendps      $0x40,%ymm4,%ymm5,%ymm9
   DB  196,99,125,25,204,1                 ; vextractf128  $0x1,%ymm9,%xmm4
-  DB  196,131,89,34,100,152,20,1          ; vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm4,%xmm4
+  DB  196,195,89,34,100,144,20,1          ; vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm4,%xmm4
   DB  196,99,53,24,204,1                  ; vinsertf128   $0x1,%xmm4,%ymm9,%ymm9
   DB  196,99,125,25,204,1                 ; vextractf128  $0x1,%ymm9,%xmm4
-  DB  196,131,89,34,100,152,16,0          ; vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm4,%xmm4
+  DB  196,195,89,34,100,144,16,0          ; vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm4,%xmm4
   DB  196,99,53,24,204,1                  ; vinsertf128   $0x1,%xmm4,%ymm9,%ymm9
-  DB  196,129,121,16,36,152               ; vmovupd       (%r8,%r11,4),%xmm4
+  DB  196,193,121,16,36,144               ; vmovupd       (%r8,%rdx,4),%xmm4
   DB  196,67,93,13,201,12                 ; vblendpd      $0xc,%ymm9,%ymm4,%ymm9
-  DB  233,203,254,255,255                 ; jmpq          da56 <_sk_load_8888_dst_avx+0x26>
-  DB  144                                 ; nop
-  DB  120,255                             ; js            db8d <_sk_load_8888_dst_avx+0x15d>
+  DB  233,210,254,255,255                 ; jmpq          d7e4 <_sk_load_8888_dst_avx+0x20>
+  DB  102,144                             ; xchg          %ax,%ax
+  DB  119,255                             ; ja            d915 <_sk_load_8888_dst_avx+0x151>
   DB  255                                 ; (bad)
-  DB  255,153,255,255,255,131             ; lcall         *-0x7c000001(%rcx)
+  DB  255,152,255,255,255,130             ; lcall         *-0x7d000001(%rax)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  238                                 ; out           %al,(%dx)
+  DB  237                                 ; in            (%dx),%eax
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  218,255                             ; (bad)
+  DB  217,255                             ; fcos
   DB  255                                 ; (bad)
-  DB  255,198                             ; inc           %esi
+  DB  255,197                             ; inc           %ebp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
-  DB  170                                 ; stos          %al,%es:(%rdi)
+  DB  169                                 ; .byte         0xa9
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -12911,10 +12798,10 @@
   DB  196,131,121,34,4,176,2              ; vpinsrd       $0x2,(%r8,%r14,4),%xmm0,%xmm0
   DB  196,195,121,34,28,152,3             ; vpinsrd       $0x3,(%r8,%rbx,4),%xmm0,%xmm3
   DB  196,227,61,24,195,1                 ; vinsertf128   $0x1,%xmm3,%ymm8,%ymm0
-  DB  197,124,40,21,84,94,2,0             ; vmovaps       0x25e54(%rip),%ymm10        # 33b00 <_sk_srcover_bgra_8888_sse2_lowp+0x8e4>
+  DB  197,124,40,21,172,90,2,0            ; vmovaps       0x25aac(%rip),%ymm10        # 334e0 <_sk_srcover_bgra_8888_sse2_lowp+0x8f0>
   DB  196,193,124,84,194                  ; vandps        %ymm10,%ymm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,13,134,88,2,0         ; vbroadcastss  0x25886(%rip),%ymm9        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,98,125,24,13,210,84,2,0         ; vbroadcastss  0x254d2(%rip),%ymm9        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  196,193,124,89,193                  ; vmulps        %ymm9,%ymm0,%ymm0
   DB  196,193,113,114,208,8               ; vpsrld        $0x8,%xmm8,%xmm1
   DB  197,233,114,211,8                   ; vpsrld        $0x8,%xmm3,%xmm2
@@ -12943,17 +12830,15 @@
 PUBLIC _sk_store_8888_avx
 _sk_store_8888_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,60,95,200                       ; vmaxps        %ymm0,%ymm8,%ymm9
-  DB  196,98,125,24,21,125,87,2,0         ; vbroadcastss  0x2577d(%rip),%ymm10        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,21,207,83,2,0         ; vbroadcastss  0x253cf(%rip),%ymm10        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,65,52,93,202                    ; vminps        %ymm10,%ymm9,%ymm9
-  DB  196,98,125,24,29,155,87,2,0         ; vbroadcastss  0x2579b(%rip),%ymm11        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  196,98,125,24,29,237,83,2,0         ; vbroadcastss  0x253ed(%rip),%ymm11        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   DB  196,65,52,89,203                    ; vmulps        %ymm11,%ymm9,%ymm9
   DB  196,65,125,91,201                   ; vcvtps2dq     %ymm9,%ymm9
   DB  197,60,95,225                       ; vmaxps        %ymm1,%ymm8,%ymm12
@@ -12984,51 +12869,48 @@
   DB  196,65,29,86,192                    ; vorpd         %ymm8,%ymm12,%ymm8
   DB  196,65,53,86,192                    ; vorpd         %ymm8,%ymm9,%ymm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           de06 <_sk_store_8888_avx+0xe0>
-  DB  196,1,124,17,4,152                  ; vmovups       %ymm8,(%r8,%r11,4)
+  DB  117,10                              ; jne           db88 <_sk_store_8888_avx+0xda>
+  DB  196,65,124,17,4,144                 ; vmovups       %ymm8,(%r8,%rdx,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,236                             ; ja            de02 <_sk_store_8888_avx+0xdc>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,83,0,0,0                  ; lea           0x53(%rip),%r10        # de74 <_sk_store_8888_avx+0x14e>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,242                             ; ja            db84 <_sk_store_8888_avx+0xd6>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,84,0,0,0                  ; lea           0x54(%rip),%r9        # dbf0 <_sk_store_8888_avx+0x142>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,1,121,126,4,152                 ; vmovd         %xmm8,(%r8,%r11,4)
-  DB  235,208                             ; jmp           de02 <_sk_store_8888_avx+0xdc>
-  DB  196,3,121,22,68,152,8,2             ; vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
-  DB  196,1,121,214,4,152                 ; vmovq         %xmm8,(%r8,%r11,4)
-  DB  235,192                             ; jmp           de02 <_sk_store_8888_avx+0xdc>
+  DB  196,65,121,126,4,144                ; vmovd         %xmm8,(%r8,%rdx,4)
+  DB  235,215                             ; jmp           db84 <_sk_store_8888_avx+0xd6>
+  DB  196,67,121,22,68,144,8,2            ; vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
+  DB  196,65,121,214,4,144                ; vmovq         %xmm8,(%r8,%rdx,4)
+  DB  235,199                             ; jmp           db84 <_sk_store_8888_avx+0xd6>
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
-  DB  196,3,121,22,76,152,24,2            ; vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
+  DB  196,67,121,22,76,144,24,2           ; vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
-  DB  196,3,121,22,76,152,20,1            ; vpextrd       $0x1,%xmm9,0x14(%r8,%r11,4)
+  DB  196,67,121,22,76,144,20,1           ; vpextrd       $0x1,%xmm9,0x14(%r8,%rdx,4)
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
-  DB  196,1,122,17,76,152,16              ; vmovss        %xmm9,0x10(%r8,%r11,4)
-  DB  196,1,121,17,4,152                  ; vmovupd       %xmm8,(%r8,%r11,4)
-  DB  235,143                             ; jmp           de02 <_sk_store_8888_avx+0xdc>
-  DB  144                                 ; nop
-  DB  182,255                             ; mov           $0xff,%dh
+  DB  196,65,122,17,76,144,16             ; vmovss        %xmm9,0x10(%r8,%rdx,4)
+  DB  196,65,121,17,4,144                 ; vmovupd       %xmm8,(%r8,%rdx,4)
+  DB  235,150                             ; jmp           db84 <_sk_store_8888_avx+0xd6>
+  DB  102,144                             ; xchg          %ax,%ax
+  DB  181,255                             ; mov           $0xff,%ch
   DB  255                                 ; (bad)
-  DB  255,198                             ; inc           %esi
+  DB  255,197                             ; inc           %ebp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  190,255,255,255,247                 ; mov           $0xf7ffffff,%esi
+  DB  189,255,255,255,246                 ; mov           $0xf6ffffff,%ebp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  234                                 ; (bad)
+  DB  233,255,255,255,219                 ; jmpq          ffffffffdc00dc04 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffdbfdb014>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  220,255                             ; fdivr         %st,%st(7)
-  DB  255                                 ; (bad)
-  DB  255,206                             ; dec           %esi
+  DB  255,205                             ; dec           %ebp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -13036,19 +12918,17 @@
 PUBLIC _sk_load_bgra_avx
 _sk_load_bgra_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,135,0,0,0                    ; jne           df37 <_sk_load_bgra_avx+0xa7>
-  DB  196,1,125,16,12,152                 ; vmovupd       (%r8,%r11,4),%ymm9
-  DB  197,125,40,21,98,92,2,0             ; vmovapd       0x25c62(%rip),%ymm10        # 33b20 <_sk_srcover_bgra_8888_sse2_lowp+0x904>
+  DB  15,133,135,0,0,0                    ; jne           dcad <_sk_load_bgra_avx+0xa1>
+  DB  196,65,125,16,12,144                ; vmovupd       (%r8,%rdx,4),%ymm9
+  DB  197,125,40,21,204,88,2,0            ; vmovapd       0x258cc(%rip),%ymm10        # 33500 <_sk_srcover_bgra_8888_sse2_lowp+0x910>
   DB  196,193,53,84,202                   ; vandpd        %ymm10,%ymm9,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
-  DB  196,98,125,24,5,116,86,2,0          ; vbroadcastss  0x25674(%rip),%ymm8        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,98,125,24,5,210,82,2,0          ; vbroadcastss  0x252d2(%rip),%ymm8        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  196,193,116,89,208                  ; vmulps        %ymm8,%ymm1,%ymm2
   DB  196,193,113,114,209,8               ; vpsrld        $0x8,%xmm9,%xmm1
   DB  196,99,125,25,203,1                 ; vextractf128  $0x1,%ymm9,%xmm3
@@ -13070,58 +12950,58 @@
   DB  196,193,100,89,216                  ; vmulps        %ymm8,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,102,255,255,255              ; ja            deb6 <_sk_load_bgra_avx+0x26>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,145,0,0,0                 ; lea           0x91(%rip),%r10        # dfec <_sk_load_bgra_avx+0x15c>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  15,135,108,255,255,255              ; ja            dc2c <_sk_load_bgra_avx+0x20>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,146,0,0,0                 ; lea           0x92(%rip),%r9        # dd5c <_sk_load_bgra_avx+0x150>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,1,122,16,12,152                 ; vmovss        (%r8,%r11,4),%xmm9
-  DB  233,71,255,255,255                  ; jmpq          deb6 <_sk_load_bgra_avx+0x26>
-  DB  196,129,121,110,68,152,8            ; vmovd         0x8(%r8,%r11,4),%xmm0
+  DB  196,65,122,16,12,144                ; vmovss        (%r8,%rdx,4),%xmm9
+  DB  233,78,255,255,255                  ; jmpq          dc2c <_sk_load_bgra_avx+0x20>
+  DB  196,193,121,110,68,144,8            ; vmovd         0x8(%r8,%rdx,4),%xmm0
   DB  197,249,112,192,68                  ; vpshufd       $0x44,%xmm0,%xmm0
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  196,99,117,12,200,4                 ; vblendps      $0x4,%ymm0,%ymm1,%ymm9
-  DB  196,129,123,16,4,152                ; vmovsd        (%r8,%r11,4),%xmm0
+  DB  196,193,123,16,4,144                ; vmovsd        (%r8,%rdx,4),%xmm0
   DB  196,99,53,13,200,1                  ; vblendpd      $0x1,%ymm0,%ymm9,%ymm9
-  DB  233,32,255,255,255                  ; jmpq          deb6 <_sk_load_bgra_avx+0x26>
-  DB  196,129,121,110,68,152,24           ; vmovd         0x18(%r8,%r11,4),%xmm0
+  DB  233,39,255,255,255                  ; jmpq          dc2c <_sk_load_bgra_avx+0x20>
+  DB  196,193,121,110,68,144,24           ; vmovd         0x18(%r8,%rdx,4),%xmm0
   DB  197,249,112,192,68                  ; vpshufd       $0x44,%xmm0,%xmm0
   DB  196,227,125,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  196,99,117,12,200,64                ; vblendps      $0x40,%ymm0,%ymm1,%ymm9
   DB  196,99,125,25,200,1                 ; vextractf128  $0x1,%ymm9,%xmm0
-  DB  196,131,121,34,68,152,20,1          ; vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm0,%xmm0
+  DB  196,195,121,34,68,144,20,1          ; vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm0,%xmm0
   DB  196,99,53,24,200,1                  ; vinsertf128   $0x1,%xmm0,%ymm9,%ymm9
   DB  196,99,125,25,200,1                 ; vextractf128  $0x1,%ymm9,%xmm0
-  DB  196,131,121,34,68,152,16,0          ; vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm0,%xmm0
+  DB  196,195,121,34,68,144,16,0          ; vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm0,%xmm0
   DB  196,99,53,24,200,1                  ; vinsertf128   $0x1,%xmm0,%ymm9,%ymm9
-  DB  196,129,121,16,4,152                ; vmovupd       (%r8,%r11,4),%xmm0
+  DB  196,193,121,16,4,144                ; vmovupd       (%r8,%rdx,4),%xmm0
   DB  196,67,125,13,201,12                ; vblendpd      $0xc,%ymm9,%ymm0,%ymm9
-  DB  233,203,254,255,255                 ; jmpq          deb6 <_sk_load_bgra_avx+0x26>
-  DB  144                                 ; nop
-  DB  120,255                             ; js            dfed <_sk_load_bgra_avx+0x15d>
+  DB  233,210,254,255,255                 ; jmpq          dc2c <_sk_load_bgra_avx+0x20>
+  DB  102,144                             ; xchg          %ax,%ax
+  DB  119,255                             ; ja            dd5d <_sk_load_bgra_avx+0x151>
   DB  255                                 ; (bad)
-  DB  255,153,255,255,255,131             ; lcall         *-0x7c000001(%rcx)
+  DB  255,152,255,255,255,130             ; lcall         *-0x7d000001(%rax)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  238                                 ; out           %al,(%dx)
+  DB  237                                 ; in            (%dx),%eax
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  218,255                             ; (bad)
+  DB  217,255                             ; fcos
   DB  255                                 ; (bad)
-  DB  255,198                             ; inc           %esi
+  DB  255,197                             ; inc           %ebp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
-  DB  170                                 ; stos          %al,%es:(%rdi)
+  DB  169                                 ; .byte         0xa9
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -13129,19 +13009,17 @@
 PUBLIC _sk_load_bgra_dst_avx
 _sk_load_bgra_dst_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,135,0,0,0                    ; jne           e0af <_sk_load_bgra_dst_avx+0xa7>
-  DB  196,1,125,16,12,152                 ; vmovupd       (%r8,%r11,4),%ymm9
-  DB  197,125,40,21,10,91,2,0             ; vmovapd       0x25b0a(%rip),%ymm10        # 33b40 <_sk_srcover_bgra_8888_sse2_lowp+0x924>
+  DB  15,133,135,0,0,0                    ; jne           de19 <_sk_load_bgra_dst_avx+0xa1>
+  DB  196,65,125,16,12,144                ; vmovupd       (%r8,%rdx,4),%ymm9
+  DB  197,125,40,21,128,87,2,0            ; vmovapd       0x25780(%rip),%ymm10        # 33520 <_sk_srcover_bgra_8888_sse2_lowp+0x930>
   DB  196,193,53,84,234                   ; vandpd        %ymm10,%ymm9,%ymm5
   DB  197,252,91,237                      ; vcvtdq2ps     %ymm5,%ymm5
-  DB  196,98,125,24,5,252,84,2,0          ; vbroadcastss  0x254fc(%rip),%ymm8        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,98,125,24,5,102,81,2,0          ; vbroadcastss  0x25166(%rip),%ymm8        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  196,193,84,89,240                   ; vmulps        %ymm8,%ymm5,%ymm6
   DB  196,193,81,114,209,8                ; vpsrld        $0x8,%xmm9,%xmm5
   DB  196,99,125,25,207,1                 ; vextractf128  $0x1,%ymm9,%xmm7
@@ -13163,58 +13041,58 @@
   DB  196,193,68,89,248                   ; vmulps        %ymm8,%ymm7,%ymm7
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
   DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,102,255,255,255              ; ja            e02e <_sk_load_bgra_dst_avx+0x26>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,145,0,0,0                 ; lea           0x91(%rip),%r10        # e164 <_sk_load_bgra_dst_avx+0x15c>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  15,135,108,255,255,255              ; ja            dd98 <_sk_load_bgra_dst_avx+0x20>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,146,0,0,0                 ; lea           0x92(%rip),%r9        # dec8 <_sk_load_bgra_dst_avx+0x150>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,1,122,16,12,152                 ; vmovss        (%r8,%r11,4),%xmm9
-  DB  233,71,255,255,255                  ; jmpq          e02e <_sk_load_bgra_dst_avx+0x26>
-  DB  196,129,121,110,100,152,8           ; vmovd         0x8(%r8,%r11,4),%xmm4
+  DB  196,65,122,16,12,144                ; vmovss        (%r8,%rdx,4),%xmm9
+  DB  233,78,255,255,255                  ; jmpq          dd98 <_sk_load_bgra_dst_avx+0x20>
+  DB  196,193,121,110,100,144,8           ; vmovd         0x8(%r8,%rdx,4),%xmm4
   DB  197,249,112,228,68                  ; vpshufd       $0x44,%xmm4,%xmm4
   DB  197,212,87,237                      ; vxorps        %ymm5,%ymm5,%ymm5
   DB  196,99,85,12,204,4                  ; vblendps      $0x4,%ymm4,%ymm5,%ymm9
-  DB  196,129,123,16,36,152               ; vmovsd        (%r8,%r11,4),%xmm4
+  DB  196,193,123,16,36,144               ; vmovsd        (%r8,%rdx,4),%xmm4
   DB  196,99,53,13,204,1                  ; vblendpd      $0x1,%ymm4,%ymm9,%ymm9
-  DB  233,32,255,255,255                  ; jmpq          e02e <_sk_load_bgra_dst_avx+0x26>
-  DB  196,129,121,110,100,152,24          ; vmovd         0x18(%r8,%r11,4),%xmm4
+  DB  233,39,255,255,255                  ; jmpq          dd98 <_sk_load_bgra_dst_avx+0x20>
+  DB  196,193,121,110,100,144,24          ; vmovd         0x18(%r8,%rdx,4),%xmm4
   DB  197,249,112,228,68                  ; vpshufd       $0x44,%xmm4,%xmm4
   DB  196,227,125,24,228,1                ; vinsertf128   $0x1,%xmm4,%ymm0,%ymm4
   DB  197,212,87,237                      ; vxorps        %ymm5,%ymm5,%ymm5
   DB  196,99,85,12,204,64                 ; vblendps      $0x40,%ymm4,%ymm5,%ymm9
   DB  196,99,125,25,204,1                 ; vextractf128  $0x1,%ymm9,%xmm4
-  DB  196,131,89,34,100,152,20,1          ; vpinsrd       $0x1,0x14(%r8,%r11,4),%xmm4,%xmm4
+  DB  196,195,89,34,100,144,20,1          ; vpinsrd       $0x1,0x14(%r8,%rdx,4),%xmm4,%xmm4
   DB  196,99,53,24,204,1                  ; vinsertf128   $0x1,%xmm4,%ymm9,%ymm9
   DB  196,99,125,25,204,1                 ; vextractf128  $0x1,%ymm9,%xmm4
-  DB  196,131,89,34,100,152,16,0          ; vpinsrd       $0x0,0x10(%r8,%r11,4),%xmm4,%xmm4
+  DB  196,195,89,34,100,144,16,0          ; vpinsrd       $0x0,0x10(%r8,%rdx,4),%xmm4,%xmm4
   DB  196,99,53,24,204,1                  ; vinsertf128   $0x1,%xmm4,%ymm9,%ymm9
-  DB  196,129,121,16,36,152               ; vmovupd       (%r8,%r11,4),%xmm4
+  DB  196,193,121,16,36,144               ; vmovupd       (%r8,%rdx,4),%xmm4
   DB  196,67,93,13,201,12                 ; vblendpd      $0xc,%ymm9,%ymm4,%ymm9
-  DB  233,203,254,255,255                 ; jmpq          e02e <_sk_load_bgra_dst_avx+0x26>
-  DB  144                                 ; nop
-  DB  120,255                             ; js            e165 <_sk_load_bgra_dst_avx+0x15d>
+  DB  233,210,254,255,255                 ; jmpq          dd98 <_sk_load_bgra_dst_avx+0x20>
+  DB  102,144                             ; xchg          %ax,%ax
+  DB  119,255                             ; ja            dec9 <_sk_load_bgra_dst_avx+0x151>
   DB  255                                 ; (bad)
-  DB  255,153,255,255,255,131             ; lcall         *-0x7c000001(%rcx)
+  DB  255,152,255,255,255,130             ; lcall         *-0x7d000001(%rax)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  238                                 ; out           %al,(%dx)
+  DB  237                                 ; in            (%dx),%eax
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  218,255                             ; (bad)
+  DB  217,255                             ; fcos
   DB  255                                 ; (bad)
-  DB  255,198                             ; inc           %esi
+  DB  255,197                             ; inc           %ebp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
-  DB  170                                 ; stos          %al,%es:(%rdi)
+  DB  169                                 ; .byte         0xa9
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -13274,10 +13152,10 @@
   DB  196,131,121,34,4,176,2              ; vpinsrd       $0x2,(%r8,%r14,4),%xmm0,%xmm0
   DB  196,195,121,34,28,152,3             ; vpinsrd       $0x3,(%r8,%rbx,4),%xmm0,%xmm3
   DB  196,227,61,24,195,1                 ; vinsertf128   $0x1,%xmm3,%ymm8,%ymm0
-  DB  197,124,40,13,220,88,2,0            ; vmovaps       0x258dc(%rip),%ymm9        # 33b60 <_sk_srcover_bgra_8888_sse2_lowp+0x944>
+  DB  197,124,40,13,88,85,2,0             ; vmovaps       0x25558(%rip),%ymm9        # 33540 <_sk_srcover_bgra_8888_sse2_lowp+0x950>
   DB  196,193,124,84,193                  ; vandps        %ymm9,%ymm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,21,174,82,2,0         ; vbroadcastss  0x252ae(%rip),%ymm10        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  196,98,125,24,21,30,79,2,0          ; vbroadcastss  0x24f1e(%rip),%ymm10        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  196,193,124,89,210                  ; vmulps        %ymm10,%ymm0,%ymm2
   DB  196,193,121,114,208,8               ; vpsrld        $0x8,%xmm8,%xmm0
   DB  197,241,114,211,8                   ; vpsrld        $0x8,%xmm3,%xmm1
@@ -13306,17 +13184,15 @@
 PUBLIC _sk_store_bgra_avx
 _sk_store_bgra_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,218                           ; movslq        %edx,%r11
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,60,95,202                       ; vmaxps        %ymm2,%ymm8,%ymm9
-  DB  196,98,125,24,21,165,81,2,0         ; vbroadcastss  0x251a5(%rip),%ymm10        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,21,27,78,2,0          ; vbroadcastss  0x24e1b(%rip),%ymm10        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,65,52,93,202                    ; vminps        %ymm10,%ymm9,%ymm9
-  DB  196,98,125,24,29,195,81,2,0         ; vbroadcastss  0x251c3(%rip),%ymm11        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  196,98,125,24,29,57,78,2,0          ; vbroadcastss  0x24e39(%rip),%ymm11        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   DB  196,65,52,89,203                    ; vmulps        %ymm11,%ymm9,%ymm9
   DB  196,65,125,91,201                   ; vcvtps2dq     %ymm9,%ymm9
   DB  197,60,95,225                       ; vmaxps        %ymm1,%ymm8,%ymm12
@@ -13347,51 +13223,48 @@
   DB  196,65,29,86,192                    ; vorpd         %ymm8,%ymm12,%ymm8
   DB  196,65,53,86,192                    ; vorpd         %ymm8,%ymm9,%ymm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           e3de <_sk_store_bgra_avx+0xe0>
-  DB  196,1,124,17,4,152                  ; vmovups       %ymm8,(%r8,%r11,4)
+  DB  117,10                              ; jne           e13c <_sk_store_bgra_avx+0xda>
+  DB  196,65,124,17,4,144                 ; vmovups       %ymm8,(%r8,%rdx,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,7                        ; and           $0x7,%r9b
-  DB  65,254,201                          ; dec           %r9b
-  DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,236                             ; ja            e3da <_sk_store_bgra_avx+0xdc>
-  DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,83,0,0,0                  ; lea           0x53(%rip),%r10        # e44c <_sk_store_bgra_avx+0x14e>
-  DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
-  DB  76,1,208                            ; add           %r10,%rax
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,7                                ; and           $0x7,%al
+  DB  254,200                             ; dec           %al
+  DB  60,6                                ; cmp           $0x6,%al
+  DB  119,242                             ; ja            e138 <_sk_store_bgra_avx+0xd6>
+  DB  15,182,192                          ; movzbl        %al,%eax
+  DB  76,141,13,84,0,0,0                  ; lea           0x54(%rip),%r9        # e1a4 <_sk_store_bgra_avx+0x142>
+  DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
+  DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,1,121,126,4,152                 ; vmovd         %xmm8,(%r8,%r11,4)
-  DB  235,208                             ; jmp           e3da <_sk_store_bgra_avx+0xdc>
-  DB  196,3,121,22,68,152,8,2             ; vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
-  DB  196,1,121,214,4,152                 ; vmovq         %xmm8,(%r8,%r11,4)
-  DB  235,192                             ; jmp           e3da <_sk_store_bgra_avx+0xdc>
+  DB  196,65,121,126,4,144                ; vmovd         %xmm8,(%r8,%rdx,4)
+  DB  235,215                             ; jmp           e138 <_sk_store_bgra_avx+0xd6>
+  DB  196,67,121,22,68,144,8,2            ; vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
+  DB  196,65,121,214,4,144                ; vmovq         %xmm8,(%r8,%rdx,4)
+  DB  235,199                             ; jmp           e138 <_sk_store_bgra_avx+0xd6>
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
-  DB  196,3,121,22,76,152,24,2            ; vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
+  DB  196,67,121,22,76,144,24,2           ; vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
-  DB  196,3,121,22,76,152,20,1            ; vpextrd       $0x1,%xmm9,0x14(%r8,%r11,4)
+  DB  196,67,121,22,76,144,20,1           ; vpextrd       $0x1,%xmm9,0x14(%r8,%rdx,4)
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
-  DB  196,1,122,17,76,152,16              ; vmovss        %xmm9,0x10(%r8,%r11,4)
-  DB  196,1,121,17,4,152                  ; vmovupd       %xmm8,(%r8,%r11,4)
-  DB  235,143                             ; jmp           e3da <_sk_store_bgra_avx+0xdc>
-  DB  144                                 ; nop
-  DB  182,255                             ; mov           $0xff,%dh
+  DB  196,65,122,17,76,144,16             ; vmovss        %xmm9,0x10(%r8,%rdx,4)
+  DB  196,65,121,17,4,144                 ; vmovupd       %xmm8,(%r8,%rdx,4)
+  DB  235,150                             ; jmp           e138 <_sk_store_bgra_avx+0xd6>
+  DB  102,144                             ; xchg          %ax,%ax
+  DB  181,255                             ; mov           $0xff,%ch
   DB  255                                 ; (bad)
-  DB  255,198                             ; inc           %esi
+  DB  255,197                             ; inc           %ebp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  190,255,255,255,247                 ; mov           $0xf7ffffff,%esi
+  DB  189,255,255,255,246                 ; mov           $0xf6ffffff,%ebp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  234                                 ; (bad)
+  DB  233,255,255,255,219                 ; jmpq          ffffffffdc00e1b8 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffdbfdb5c8>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  220,255                             ; fdivr         %st,%st(7)
-  DB  255                                 ; (bad)
-  DB  255,206                             ; dec           %esi
+  DB  255,205                             ; dec           %ebp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -13400,22 +13273,20 @@
 _sk_load_f16_avx LABEL PROC
   DB  72,129,236,152,0,0,0                ; sub           $0x98,%rsp
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,3                        ; shl           $0x3,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
   DB  197,252,17,124,36,96                ; vmovups       %ymm7,0x60(%rsp)
   DB  197,252,17,116,36,64                ; vmovups       %ymm6,0x40(%rsp)
   DB  197,252,17,108,36,32                ; vmovups       %ymm5,0x20(%rsp)
   DB  197,252,17,36,36                    ; vmovups       %ymm4,(%rsp)
-  DB  15,133,33,2,0,0                     ; jne           e6c7 <_sk_load_f16_avx+0x25f>
-  DB  196,65,121,16,4,192                 ; vmovupd       (%r8,%rax,8),%xmm8
-  DB  196,193,121,16,84,192,16            ; vmovupd       0x10(%r8,%rax,8),%xmm2
-  DB  196,193,121,16,92,192,32            ; vmovupd       0x20(%r8,%rax,8),%xmm3
-  DB  196,65,122,111,76,192,48            ; vmovdqu       0x30(%r8,%rax,8),%xmm9
+  DB  15,133,33,2,0,0                     ; jne           e419 <_sk_load_f16_avx+0x259>
+  DB  196,65,121,16,4,208                 ; vmovupd       (%r8,%rdx,8),%xmm8
+  DB  196,193,121,16,84,208,16            ; vmovupd       0x10(%r8,%rdx,8),%xmm2
+  DB  196,193,121,16,92,208,32            ; vmovupd       0x20(%r8,%rdx,8),%xmm3
+  DB  196,65,122,111,76,208,48            ; vmovdqu       0x30(%r8,%rdx,8),%xmm9
   DB  197,185,97,194                      ; vpunpcklwd    %xmm2,%xmm8,%xmm0
   DB  197,185,105,210                     ; vpunpckhwd    %xmm2,%xmm8,%xmm2
   DB  196,193,97,97,201                   ; vpunpcklwd    %xmm9,%xmm3,%xmm1
@@ -13428,14 +13299,14 @@
   DB  196,226,121,51,200                  ; vpmovzxwd     %xmm0,%xmm1
   DB  197,249,112,192,78                  ; vpshufd       $0x4e,%xmm0,%xmm0
   DB  196,226,121,51,192                  ; vpmovzxwd     %xmm0,%xmm0
-  DB  197,123,18,21,169,97,2,0            ; vmovddup      0x261a9(%rip),%xmm10        # 346a8 <_sk_srcover_bgra_8888_sse2_lowp+0x148c>
+  DB  197,123,18,21,55,94,2,0             ; vmovddup      0x25e37(%rip),%xmm10        # 34088 <_sk_srcover_bgra_8888_sse2_lowp+0x1498>
   DB  196,193,121,219,218                 ; vpand         %xmm10,%xmm0,%xmm3
-  DB  196,98,121,24,29,59,81,2,0          ; vbroadcastss  0x2513b(%rip),%xmm11        # 33648 <_sk_srcover_bgra_8888_sse2_lowp+0x42c>
+  DB  196,98,121,24,29,189,77,2,0         ; vbroadcastss  0x24dbd(%rip),%xmm11        # 3301c <_sk_srcover_bgra_8888_sse2_lowp+0x42c>
   DB  197,33,102,227                      ; vpcmpgtd      %xmm3,%xmm11,%xmm12
   DB  196,193,113,219,210                 ; vpand         %xmm10,%xmm1,%xmm2
   DB  197,33,102,234                      ; vpcmpgtd      %xmm2,%xmm11,%xmm13
   DB  196,195,21,24,252,1                 ; vinsertf128   $0x1,%xmm12,%ymm13,%ymm7
-  DB  197,123,18,37,136,97,2,0            ; vmovddup      0x26188(%rip),%xmm12        # 346b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1494>
+  DB  197,123,18,37,22,94,2,0             ; vmovddup      0x25e16(%rip),%xmm12        # 34090 <_sk_srcover_bgra_8888_sse2_lowp+0x14a0>
   DB  196,193,113,219,204                 ; vpand         %xmm12,%xmm1,%xmm1
   DB  197,241,114,241,16                  ; vpslld        $0x10,%xmm1,%xmm1
   DB  196,193,121,219,196                 ; vpand         %xmm12,%xmm0,%xmm0
@@ -13444,7 +13315,7 @@
   DB  197,241,235,202                     ; vpor          %xmm2,%xmm1,%xmm1
   DB  197,233,114,243,13                  ; vpslld        $0xd,%xmm3,%xmm2
   DB  197,249,235,194                     ; vpor          %xmm2,%xmm0,%xmm0
-  DB  196,226,121,24,29,245,80,2,0        ; vbroadcastss  0x250f5(%rip),%xmm3        # 3364c <_sk_srcover_bgra_8888_sse2_lowp+0x430>
+  DB  196,226,121,24,29,119,77,2,0        ; vbroadcastss  0x24d77(%rip),%xmm3        # 33020 <_sk_srcover_bgra_8888_sse2_lowp+0x430>
   DB  197,249,254,195                     ; vpaddd        %xmm3,%xmm0,%xmm0
   DB  197,241,254,203                     ; vpaddd        %xmm3,%xmm1,%xmm1
   DB  196,227,117,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
@@ -13520,53 +13391,51 @@
   DB  197,252,16,124,36,96                ; vmovups       0x60(%rsp),%ymm7
   DB  72,129,196,152,0,0,0                ; add           $0x98,%rsp
   DB  255,224                             ; jmpq          *%rax
-  DB  196,65,123,16,4,192                 ; vmovsd        (%r8,%rax,8),%xmm8
+  DB  196,65,123,16,4,208                 ; vmovsd        (%r8,%rdx,8),%xmm8
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,85                              ; je            e72d <_sk_load_f16_avx+0x2c5>
-  DB  196,65,57,22,68,192,8               ; vmovhpd       0x8(%r8,%rax,8),%xmm8,%xmm8
+  DB  116,85                              ; je            e47f <_sk_load_f16_avx+0x2bf>
+  DB  196,65,57,22,68,208,8               ; vmovhpd       0x8(%r8,%rdx,8),%xmm8,%xmm8
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,72                              ; jb            e72d <_sk_load_f16_avx+0x2c5>
-  DB  196,193,123,16,84,192,16            ; vmovsd        0x10(%r8,%rax,8),%xmm2
+  DB  114,72                              ; jb            e47f <_sk_load_f16_avx+0x2bf>
+  DB  196,193,123,16,84,208,16            ; vmovsd        0x10(%r8,%rdx,8),%xmm2
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  116,72                              ; je            e73a <_sk_load_f16_avx+0x2d2>
-  DB  196,193,105,22,84,192,24            ; vmovhpd       0x18(%r8,%rax,8),%xmm2,%xmm2
+  DB  116,72                              ; je            e48c <_sk_load_f16_avx+0x2cc>
+  DB  196,193,105,22,84,208,24            ; vmovhpd       0x18(%r8,%rdx,8),%xmm2,%xmm2
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,59                              ; jb            e73a <_sk_load_f16_avx+0x2d2>
-  DB  196,193,123,16,92,192,32            ; vmovsd        0x20(%r8,%rax,8),%xmm3
+  DB  114,59                              ; jb            e48c <_sk_load_f16_avx+0x2cc>
+  DB  196,193,123,16,92,208,32            ; vmovsd        0x20(%r8,%rdx,8),%xmm3
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  15,132,177,253,255,255              ; je            e4c1 <_sk_load_f16_avx+0x59>
-  DB  196,193,97,22,92,192,40             ; vmovhpd       0x28(%r8,%rax,8),%xmm3,%xmm3
+  DB  15,132,177,253,255,255              ; je            e213 <_sk_load_f16_avx+0x53>
+  DB  196,193,97,22,92,208,40             ; vmovhpd       0x28(%r8,%rdx,8),%xmm3,%xmm3
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  15,130,160,253,255,255              ; jb            e4c1 <_sk_load_f16_avx+0x59>
-  DB  196,65,122,126,76,192,48            ; vmovq         0x30(%r8,%rax,8),%xmm9
-  DB  233,148,253,255,255                 ; jmpq          e4c1 <_sk_load_f16_avx+0x59>
+  DB  15,130,160,253,255,255              ; jb            e213 <_sk_load_f16_avx+0x53>
+  DB  196,65,122,126,76,208,48            ; vmovq         0x30(%r8,%rdx,8),%xmm9
+  DB  233,148,253,255,255                 ; jmpq          e213 <_sk_load_f16_avx+0x53>
   DB  197,225,87,219                      ; vxorpd        %xmm3,%xmm3,%xmm3
   DB  197,233,87,210                      ; vxorpd        %xmm2,%xmm2,%xmm2
-  DB  233,135,253,255,255                 ; jmpq          e4c1 <_sk_load_f16_avx+0x59>
+  DB  233,135,253,255,255                 ; jmpq          e213 <_sk_load_f16_avx+0x53>
   DB  197,225,87,219                      ; vxorpd        %xmm3,%xmm3,%xmm3
-  DB  233,126,253,255,255                 ; jmpq          e4c1 <_sk_load_f16_avx+0x59>
+  DB  233,126,253,255,255                 ; jmpq          e213 <_sk_load_f16_avx+0x53>
 
 PUBLIC _sk_load_f16_dst_avx
 _sk_load_f16_dst_avx LABEL PROC
   DB  72,129,236,152,0,0,0                ; sub           $0x98,%rsp
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,3                        ; shl           $0x3,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
   DB  197,252,17,92,36,96                 ; vmovups       %ymm3,0x60(%rsp)
   DB  197,252,17,84,36,64                 ; vmovups       %ymm2,0x40(%rsp)
   DB  197,252,17,76,36,32                 ; vmovups       %ymm1,0x20(%rsp)
   DB  197,252,17,4,36                     ; vmovups       %ymm0,(%rsp)
-  DB  15,133,33,2,0,0                     ; jne           e9a2 <_sk_load_f16_dst_avx+0x25f>
-  DB  196,65,121,16,4,192                 ; vmovupd       (%r8,%rax,8),%xmm8
-  DB  196,193,121,16,116,192,16           ; vmovupd       0x10(%r8,%rax,8),%xmm6
-  DB  196,193,121,16,124,192,32           ; vmovupd       0x20(%r8,%rax,8),%xmm7
-  DB  196,65,122,111,76,192,48            ; vmovdqu       0x30(%r8,%rax,8),%xmm9
+  DB  15,133,33,2,0,0                     ; jne           e6ee <_sk_load_f16_dst_avx+0x259>
+  DB  196,65,121,16,4,208                 ; vmovupd       (%r8,%rdx,8),%xmm8
+  DB  196,193,121,16,116,208,16           ; vmovupd       0x10(%r8,%rdx,8),%xmm6
+  DB  196,193,121,16,124,208,32           ; vmovupd       0x20(%r8,%rdx,8),%xmm7
+  DB  196,65,122,111,76,208,48            ; vmovdqu       0x30(%r8,%rdx,8),%xmm9
   DB  197,185,97,230                      ; vpunpcklwd    %xmm6,%xmm8,%xmm4
   DB  197,185,105,246                     ; vpunpckhwd    %xmm6,%xmm8,%xmm6
   DB  196,193,65,97,233                   ; vpunpcklwd    %xmm9,%xmm7,%xmm5
@@ -13579,14 +13448,14 @@
   DB  196,226,121,51,236                  ; vpmovzxwd     %xmm4,%xmm5
   DB  197,249,112,228,78                  ; vpshufd       $0x4e,%xmm4,%xmm4
   DB  196,226,121,51,228                  ; vpmovzxwd     %xmm4,%xmm4
-  DB  197,123,18,21,206,94,2,0            ; vmovddup      0x25ece(%rip),%xmm10        # 346a8 <_sk_srcover_bgra_8888_sse2_lowp+0x148c>
+  DB  197,123,18,21,98,91,2,0             ; vmovddup      0x25b62(%rip),%xmm10        # 34088 <_sk_srcover_bgra_8888_sse2_lowp+0x1498>
   DB  196,193,89,219,250                  ; vpand         %xmm10,%xmm4,%xmm7
-  DB  196,98,121,24,29,96,78,2,0          ; vbroadcastss  0x24e60(%rip),%xmm11        # 33648 <_sk_srcover_bgra_8888_sse2_lowp+0x42c>
+  DB  196,98,121,24,29,232,74,2,0         ; vbroadcastss  0x24ae8(%rip),%xmm11        # 3301c <_sk_srcover_bgra_8888_sse2_lowp+0x42c>
   DB  197,33,102,231                      ; vpcmpgtd      %xmm7,%xmm11,%xmm12
   DB  196,193,81,219,242                  ; vpand         %xmm10,%xmm5,%xmm6
   DB  197,33,102,238                      ; vpcmpgtd      %xmm6,%xmm11,%xmm13
   DB  196,195,21,24,220,1                 ; vinsertf128   $0x1,%xmm12,%ymm13,%ymm3
-  DB  197,123,18,37,173,94,2,0            ; vmovddup      0x25ead(%rip),%xmm12        # 346b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1494>
+  DB  197,123,18,37,65,91,2,0             ; vmovddup      0x25b41(%rip),%xmm12        # 34090 <_sk_srcover_bgra_8888_sse2_lowp+0x14a0>
   DB  196,193,81,219,236                  ; vpand         %xmm12,%xmm5,%xmm5
   DB  197,209,114,245,16                  ; vpslld        $0x10,%xmm5,%xmm5
   DB  196,193,89,219,228                  ; vpand         %xmm12,%xmm4,%xmm4
@@ -13595,7 +13464,7 @@
   DB  197,209,235,238                     ; vpor          %xmm6,%xmm5,%xmm5
   DB  197,201,114,247,13                  ; vpslld        $0xd,%xmm7,%xmm6
   DB  197,217,235,230                     ; vpor          %xmm6,%xmm4,%xmm4
-  DB  196,226,121,24,61,26,78,2,0         ; vbroadcastss  0x24e1a(%rip),%xmm7        # 3364c <_sk_srcover_bgra_8888_sse2_lowp+0x430>
+  DB  196,226,121,24,61,162,74,2,0        ; vbroadcastss  0x24aa2(%rip),%xmm7        # 33020 <_sk_srcover_bgra_8888_sse2_lowp+0x430>
   DB  197,217,254,231                     ; vpaddd        %xmm7,%xmm4,%xmm4
   DB  197,209,254,239                     ; vpaddd        %xmm7,%xmm5,%xmm5
   DB  196,227,85,24,228,1                 ; vinsertf128   $0x1,%xmm4,%ymm5,%ymm4
@@ -13671,32 +13540,32 @@
   DB  197,252,16,92,36,96                 ; vmovups       0x60(%rsp),%ymm3
   DB  72,129,196,152,0,0,0                ; add           $0x98,%rsp
   DB  255,224                             ; jmpq          *%rax
-  DB  196,65,123,16,4,192                 ; vmovsd        (%r8,%rax,8),%xmm8
+  DB  196,65,123,16,4,208                 ; vmovsd        (%r8,%rdx,8),%xmm8
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,85                              ; je            ea08 <_sk_load_f16_dst_avx+0x2c5>
-  DB  196,65,57,22,68,192,8               ; vmovhpd       0x8(%r8,%rax,8),%xmm8,%xmm8
+  DB  116,85                              ; je            e754 <_sk_load_f16_dst_avx+0x2bf>
+  DB  196,65,57,22,68,208,8               ; vmovhpd       0x8(%r8,%rdx,8),%xmm8,%xmm8
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,72                              ; jb            ea08 <_sk_load_f16_dst_avx+0x2c5>
-  DB  196,193,123,16,116,192,16           ; vmovsd        0x10(%r8,%rax,8),%xmm6
+  DB  114,72                              ; jb            e754 <_sk_load_f16_dst_avx+0x2bf>
+  DB  196,193,123,16,116,208,16           ; vmovsd        0x10(%r8,%rdx,8),%xmm6
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  116,72                              ; je            ea15 <_sk_load_f16_dst_avx+0x2d2>
-  DB  196,193,73,22,116,192,24            ; vmovhpd       0x18(%r8,%rax,8),%xmm6,%xmm6
+  DB  116,72                              ; je            e761 <_sk_load_f16_dst_avx+0x2cc>
+  DB  196,193,73,22,116,208,24            ; vmovhpd       0x18(%r8,%rdx,8),%xmm6,%xmm6
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,59                              ; jb            ea15 <_sk_load_f16_dst_avx+0x2d2>
-  DB  196,193,123,16,124,192,32           ; vmovsd        0x20(%r8,%rax,8),%xmm7
+  DB  114,59                              ; jb            e761 <_sk_load_f16_dst_avx+0x2cc>
+  DB  196,193,123,16,124,208,32           ; vmovsd        0x20(%r8,%rdx,8),%xmm7
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  15,132,177,253,255,255              ; je            e79c <_sk_load_f16_dst_avx+0x59>
-  DB  196,193,65,22,124,192,40            ; vmovhpd       0x28(%r8,%rax,8),%xmm7,%xmm7
+  DB  15,132,177,253,255,255              ; je            e4e8 <_sk_load_f16_dst_avx+0x53>
+  DB  196,193,65,22,124,208,40            ; vmovhpd       0x28(%r8,%rdx,8),%xmm7,%xmm7
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  15,130,160,253,255,255              ; jb            e79c <_sk_load_f16_dst_avx+0x59>
-  DB  196,65,122,126,76,192,48            ; vmovq         0x30(%r8,%rax,8),%xmm9
-  DB  233,148,253,255,255                 ; jmpq          e79c <_sk_load_f16_dst_avx+0x59>
+  DB  15,130,160,253,255,255              ; jb            e4e8 <_sk_load_f16_dst_avx+0x53>
+  DB  196,65,122,126,76,208,48            ; vmovq         0x30(%r8,%rdx,8),%xmm9
+  DB  233,148,253,255,255                 ; jmpq          e4e8 <_sk_load_f16_dst_avx+0x53>
   DB  197,193,87,255                      ; vxorpd        %xmm7,%xmm7,%xmm7
   DB  197,201,87,246                      ; vxorpd        %xmm6,%xmm6,%xmm6
-  DB  233,135,253,255,255                 ; jmpq          e79c <_sk_load_f16_dst_avx+0x59>
+  DB  233,135,253,255,255                 ; jmpq          e4e8 <_sk_load_f16_dst_avx+0x53>
   DB  197,193,87,255                      ; vxorpd        %xmm7,%xmm7,%xmm7
-  DB  233,126,253,255,255                 ; jmpq          e79c <_sk_load_f16_dst_avx+0x59>
+  DB  233,126,253,255,255                 ; jmpq          e4e8 <_sk_load_f16_dst_avx+0x53>
 
 PUBLIC _sk_gather_f16_avx
 _sk_gather_f16_avx LABEL PROC
@@ -13773,14 +13642,14 @@
   DB  196,226,121,51,208                  ; vpmovzxwd     %xmm0,%xmm2
   DB  197,249,112,192,78                  ; vpshufd       $0x4e,%xmm0,%xmm0
   DB  196,226,121,51,192                  ; vpmovzxwd     %xmm0,%xmm0
-  DB  197,123,18,29,48,91,2,0             ; vmovddup      0x25b30(%rip),%xmm11        # 346a8 <_sk_srcover_bgra_8888_sse2_lowp+0x148c>
+  DB  197,123,18,29,196,87,2,0            ; vmovddup      0x257c4(%rip),%xmm11        # 34088 <_sk_srcover_bgra_8888_sse2_lowp+0x1498>
   DB  196,193,121,219,219                 ; vpand         %xmm11,%xmm0,%xmm3
-  DB  196,98,121,24,37,194,74,2,0         ; vbroadcastss  0x24ac2(%rip),%xmm12        # 33648 <_sk_srcover_bgra_8888_sse2_lowp+0x42c>
+  DB  196,98,121,24,37,74,71,2,0          ; vbroadcastss  0x2474a(%rip),%xmm12        # 3301c <_sk_srcover_bgra_8888_sse2_lowp+0x42c>
   DB  197,25,102,235                      ; vpcmpgtd      %xmm3,%xmm12,%xmm13
   DB  196,193,105,219,203                 ; vpand         %xmm11,%xmm2,%xmm1
   DB  197,25,102,193                      ; vpcmpgtd      %xmm1,%xmm12,%xmm8
   DB  196,67,61,24,197,1                  ; vinsertf128   $0x1,%xmm13,%ymm8,%ymm8
-  DB  197,123,18,45,15,91,2,0             ; vmovddup      0x25b0f(%rip),%xmm13        # 346b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1494>
+  DB  197,123,18,45,163,87,2,0            ; vmovddup      0x257a3(%rip),%xmm13        # 34090 <_sk_srcover_bgra_8888_sse2_lowp+0x14a0>
   DB  196,193,105,219,213                 ; vpand         %xmm13,%xmm2,%xmm2
   DB  197,233,114,242,16                  ; vpslld        $0x10,%xmm2,%xmm2
   DB  197,241,114,241,13                  ; vpslld        $0xd,%xmm1,%xmm1
@@ -13789,7 +13658,7 @@
   DB  197,249,114,240,16                  ; vpslld        $0x10,%xmm0,%xmm0
   DB  197,233,114,243,13                  ; vpslld        $0xd,%xmm3,%xmm2
   DB  197,249,235,194                     ; vpor          %xmm2,%xmm0,%xmm0
-  DB  196,226,121,24,29,124,74,2,0        ; vbroadcastss  0x24a7c(%rip),%xmm3        # 3364c <_sk_srcover_bgra_8888_sse2_lowp+0x430>
+  DB  196,226,121,24,29,4,71,2,0          ; vbroadcastss  0x24704(%rip),%xmm3        # 33020 <_sk_srcover_bgra_8888_sse2_lowp+0x430>
   DB  197,249,254,195                     ; vpaddd        %xmm3,%xmm0,%xmm0
   DB  197,241,254,203                     ; vpaddd        %xmm3,%xmm1,%xmm1
   DB  196,227,117,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
@@ -13877,12 +13746,12 @@
   DB  197,252,17,108,36,64                ; vmovups       %ymm5,0x40(%rsp)
   DB  197,252,17,100,36,32                ; vmovups       %ymm4,0x20(%rsp)
   DB  197,252,40,225                      ; vmovaps       %ymm1,%ymm4
-  DB  196,98,125,24,5,153,72,2,0          ; vbroadcastss  0x24899(%rip),%ymm8        # 3360c <_sk_srcover_bgra_8888_sse2_lowp+0x3f0>
+  DB  196,98,125,24,5,33,69,2,0           ; vbroadcastss  0x24521(%rip),%ymm8        # 32fe0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f0>
   DB  196,65,124,84,216                   ; vandps        %ymm8,%ymm0,%ymm11
-  DB  196,98,125,24,21,207,72,2,0         ; vbroadcastss  0x248cf(%rip),%ymm10        # 33650 <_sk_srcover_bgra_8888_sse2_lowp+0x434>
+  DB  196,98,125,24,21,87,69,2,0          ; vbroadcastss  0x24557(%rip),%ymm10        # 33024 <_sk_srcover_bgra_8888_sse2_lowp+0x434>
   DB  196,65,124,84,226                   ; vandps        %ymm10,%ymm0,%ymm12
   DB  196,67,125,25,229,1                 ; vextractf128  $0x1,%ymm12,%xmm13
-  DB  196,98,121,24,13,191,72,2,0         ; vbroadcastss  0x248bf(%rip),%xmm9        # 33654 <_sk_srcover_bgra_8888_sse2_lowp+0x438>
+  DB  196,98,121,24,13,71,69,2,0          ; vbroadcastss  0x24547(%rip),%xmm9        # 33028 <_sk_srcover_bgra_8888_sse2_lowp+0x438>
   DB  196,65,49,102,245                   ; vpcmpgtd      %xmm13,%xmm9,%xmm14
   DB  196,65,49,102,252                   ; vpcmpgtd      %xmm12,%xmm9,%xmm15
   DB  196,67,5,24,246,1                   ; vinsertf128   $0x1,%xmm14,%ymm15,%ymm14
@@ -13893,7 +13762,7 @@
   DB  196,65,17,254,239                   ; vpaddd        %xmm15,%xmm13,%xmm13
   DB  196,193,25,114,212,13               ; vpsrld        $0xd,%xmm12,%xmm12
   DB  196,65,25,254,227                   ; vpaddd        %xmm11,%xmm12,%xmm12
-  DB  196,98,121,24,29,130,72,2,0         ; vbroadcastss  0x24882(%rip),%xmm11        # 33658 <_sk_srcover_bgra_8888_sse2_lowp+0x43c>
+  DB  196,98,121,24,29,10,69,2,0          ; vbroadcastss  0x2450a(%rip),%xmm11        # 3302c <_sk_srcover_bgra_8888_sse2_lowp+0x43c>
   DB  196,65,17,254,235                   ; vpaddd        %xmm11,%xmm13,%xmm13
   DB  196,65,25,254,227                   ; vpaddd        %xmm11,%xmm12,%xmm12
   DB  196,67,29,24,237,1                  ; vinsertf128   $0x1,%xmm13,%ymm12,%ymm13
@@ -13969,18 +13838,16 @@
   DB  197,105,98,201                      ; vpunpckldq    %xmm1,%xmm2,%xmm9
   DB  197,105,106,193                     ; vpunpckhdq    %xmm1,%xmm2,%xmm8
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,3                        ; shl           $0x3,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,74                              ; jne           efb2 <_sk_store_f16_avx+0x26e>
-  DB  196,65,122,127,28,192               ; vmovdqu       %xmm11,(%r8,%rax,8)
-  DB  196,65,122,127,84,192,16            ; vmovdqu       %xmm10,0x10(%r8,%rax,8)
-  DB  196,65,122,127,76,192,32            ; vmovdqu       %xmm9,0x20(%r8,%rax,8)
-  DB  196,65,122,127,68,192,48            ; vmovdqu       %xmm8,0x30(%r8,%rax,8)
+  DB  117,74                              ; jne           ecf8 <_sk_store_f16_avx+0x268>
+  DB  196,65,122,127,28,208               ; vmovdqu       %xmm11,(%r8,%rdx,8)
+  DB  196,65,122,127,84,208,16            ; vmovdqu       %xmm10,0x10(%r8,%rdx,8)
+  DB  196,65,122,127,76,208,32            ; vmovdqu       %xmm9,0x20(%r8,%rdx,8)
+  DB  196,65,122,127,68,208,48            ; vmovdqu       %xmm8,0x30(%r8,%rdx,8)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,252,16,12,36                    ; vmovups       (%rsp),%ymm1
   DB  197,124,41,250                      ; vmovaps       %ymm15,%ymm2
@@ -13990,41 +13857,39 @@
   DB  197,252,16,188,36,128,0,0,0         ; vmovups       0x80(%rsp),%ymm7
   DB  72,129,196,184,0,0,0                ; add           $0xb8,%rsp
   DB  255,224                             ; jmpq          *%rax
-  DB  196,65,121,214,28,192               ; vmovq         %xmm11,(%r8,%rax,8)
+  DB  196,65,121,214,28,208               ; vmovq         %xmm11,(%r8,%rdx,8)
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,197                             ; je            ef83 <_sk_store_f16_avx+0x23f>
-  DB  196,65,121,23,92,192,8              ; vmovhpd       %xmm11,0x8(%r8,%rax,8)
+  DB  116,197                             ; je            ecc9 <_sk_store_f16_avx+0x239>
+  DB  196,65,121,23,92,208,8              ; vmovhpd       %xmm11,0x8(%r8,%rdx,8)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,184                             ; jb            ef83 <_sk_store_f16_avx+0x23f>
-  DB  196,65,121,214,84,192,16            ; vmovq         %xmm10,0x10(%r8,%rax,8)
-  DB  116,175                             ; je            ef83 <_sk_store_f16_avx+0x23f>
-  DB  196,65,121,23,84,192,24             ; vmovhpd       %xmm10,0x18(%r8,%rax,8)
+  DB  114,184                             ; jb            ecc9 <_sk_store_f16_avx+0x239>
+  DB  196,65,121,214,84,208,16            ; vmovq         %xmm10,0x10(%r8,%rdx,8)
+  DB  116,175                             ; je            ecc9 <_sk_store_f16_avx+0x239>
+  DB  196,65,121,23,84,208,24             ; vmovhpd       %xmm10,0x18(%r8,%rdx,8)
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,162                             ; jb            ef83 <_sk_store_f16_avx+0x23f>
-  DB  196,65,121,214,76,192,32            ; vmovq         %xmm9,0x20(%r8,%rax,8)
-  DB  116,153                             ; je            ef83 <_sk_store_f16_avx+0x23f>
-  DB  196,65,121,23,76,192,40             ; vmovhpd       %xmm9,0x28(%r8,%rax,8)
+  DB  114,162                             ; jb            ecc9 <_sk_store_f16_avx+0x239>
+  DB  196,65,121,214,76,208,32            ; vmovq         %xmm9,0x20(%r8,%rdx,8)
+  DB  116,153                             ; je            ecc9 <_sk_store_f16_avx+0x239>
+  DB  196,65,121,23,76,208,40             ; vmovhpd       %xmm9,0x28(%r8,%rdx,8)
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  114,140                             ; jb            ef83 <_sk_store_f16_avx+0x23f>
-  DB  196,65,121,214,68,192,48            ; vmovq         %xmm8,0x30(%r8,%rax,8)
-  DB  235,131                             ; jmp           ef83 <_sk_store_f16_avx+0x23f>
+  DB  114,140                             ; jb            ecc9 <_sk_store_f16_avx+0x239>
+  DB  196,65,121,214,68,208,48            ; vmovq         %xmm8,0x30(%r8,%rdx,8)
+  DB  235,131                             ; jmp           ecc9 <_sk_store_f16_avx+0x239>
 
 PUBLIC _sk_load_u16_be_avx
 _sk_load_u16_be_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9d
-  DB  76,99,80,8                          ; movslq        0x8(%rax),%r10
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,194                       ; imul          %r10,%r8
-  DB  77,1,192                            ; add           %r8,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  73,99,193                           ; movslq        %r9d,%rax
+  DB  76,141,4,149,0,0,0,0                ; lea           0x0(,%rdx,4),%r8
+  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  77,1,201                            ; add           %r9,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,12,1,0,0                     ; jne           f133 <_sk_load_u16_be_avx+0x133>
-  DB  196,65,121,16,4,64                  ; vmovupd       (%r8,%rax,2),%xmm8
-  DB  196,193,121,16,84,64,16             ; vmovupd       0x10(%r8,%rax,2),%xmm2
-  DB  196,193,121,16,92,64,32             ; vmovupd       0x20(%r8,%rax,2),%xmm3
-  DB  196,65,122,111,76,64,48             ; vmovdqu       0x30(%r8,%rax,2),%xmm9
+  DB  15,133,12,1,0,0                     ; jne           ee73 <_sk_load_u16_be_avx+0x12d>
+  DB  196,1,121,16,4,65                   ; vmovupd       (%r9,%r8,2),%xmm8
+  DB  196,129,121,16,84,65,16             ; vmovupd       0x10(%r9,%r8,2),%xmm2
+  DB  196,129,121,16,92,65,32             ; vmovupd       0x20(%r9,%r8,2),%xmm3
+  DB  196,1,122,111,76,65,48              ; vmovdqu       0x30(%r9,%r8,2),%xmm9
   DB  197,185,97,194                      ; vpunpcklwd    %xmm2,%xmm8,%xmm0
   DB  197,185,105,210                     ; vpunpckhwd    %xmm2,%xmm8,%xmm2
   DB  196,193,97,97,201                   ; vpunpcklwd    %xmm9,%xmm3,%xmm1
@@ -14042,7 +13907,7 @@
   DB  196,226,121,51,192                  ; vpmovzxwd     %xmm0,%xmm0
   DB  196,227,117,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,13,200,68,2,0         ; vbroadcastss  0x244c8(%rip),%ymm9        # 33560 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
+  DB  196,98,125,24,13,92,65,2,0          ; vbroadcastss  0x2415c(%rip),%ymm9        # 32f34 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
   DB  196,193,124,89,193                  ; vmulps        %ymm9,%ymm0,%ymm0
   DB  197,169,109,202                     ; vpunpckhqdq   %xmm2,%xmm10,%xmm1
   DB  197,233,113,241,8                   ; vpsllw        $0x8,%xmm1,%xmm2
@@ -14076,51 +13941,47 @@
   DB  196,193,100,89,217                  ; vmulps        %ymm9,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,65,123,16,4,64                  ; vmovsd        (%r8,%rax,2),%xmm8
+  DB  196,1,123,16,4,65                   ; vmovsd        (%r9,%r8,2),%xmm8
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,85                              ; je            f199 <_sk_load_u16_be_avx+0x199>
-  DB  196,65,57,22,68,64,8                ; vmovhpd       0x8(%r8,%rax,2),%xmm8,%xmm8
+  DB  116,85                              ; je            eed9 <_sk_load_u16_be_avx+0x193>
+  DB  196,1,57,22,68,65,8                 ; vmovhpd       0x8(%r9,%r8,2),%xmm8,%xmm8
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,72                              ; jb            f199 <_sk_load_u16_be_avx+0x199>
-  DB  196,193,123,16,84,64,16             ; vmovsd        0x10(%r8,%rax,2),%xmm2
+  DB  114,72                              ; jb            eed9 <_sk_load_u16_be_avx+0x193>
+  DB  196,129,123,16,84,65,16             ; vmovsd        0x10(%r9,%r8,2),%xmm2
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  116,72                              ; je            f1a6 <_sk_load_u16_be_avx+0x1a6>
-  DB  196,193,105,22,84,64,24             ; vmovhpd       0x18(%r8,%rax,2),%xmm2,%xmm2
+  DB  116,72                              ; je            eee6 <_sk_load_u16_be_avx+0x1a0>
+  DB  196,129,105,22,84,65,24             ; vmovhpd       0x18(%r9,%r8,2),%xmm2,%xmm2
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,59                              ; jb            f1a6 <_sk_load_u16_be_avx+0x1a6>
-  DB  196,193,123,16,92,64,32             ; vmovsd        0x20(%r8,%rax,2),%xmm3
+  DB  114,59                              ; jb            eee6 <_sk_load_u16_be_avx+0x1a0>
+  DB  196,129,123,16,92,65,32             ; vmovsd        0x20(%r9,%r8,2),%xmm3
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  15,132,198,254,255,255              ; je            f042 <_sk_load_u16_be_avx+0x42>
-  DB  196,193,97,22,92,64,40              ; vmovhpd       0x28(%r8,%rax,2),%xmm3,%xmm3
+  DB  15,132,198,254,255,255              ; je            ed82 <_sk_load_u16_be_avx+0x3c>
+  DB  196,129,97,22,92,65,40              ; vmovhpd       0x28(%r9,%r8,2),%xmm3,%xmm3
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  15,130,181,254,255,255              ; jb            f042 <_sk_load_u16_be_avx+0x42>
-  DB  196,65,122,126,76,64,48             ; vmovq         0x30(%r8,%rax,2),%xmm9
-  DB  233,169,254,255,255                 ; jmpq          f042 <_sk_load_u16_be_avx+0x42>
+  DB  15,130,181,254,255,255              ; jb            ed82 <_sk_load_u16_be_avx+0x3c>
+  DB  196,1,122,126,76,65,48              ; vmovq         0x30(%r9,%r8,2),%xmm9
+  DB  233,169,254,255,255                 ; jmpq          ed82 <_sk_load_u16_be_avx+0x3c>
   DB  197,225,87,219                      ; vxorpd        %xmm3,%xmm3,%xmm3
   DB  197,233,87,210                      ; vxorpd        %xmm2,%xmm2,%xmm2
-  DB  233,156,254,255,255                 ; jmpq          f042 <_sk_load_u16_be_avx+0x42>
+  DB  233,156,254,255,255                 ; jmpq          ed82 <_sk_load_u16_be_avx+0x3c>
   DB  197,225,87,219                      ; vxorpd        %xmm3,%xmm3,%xmm3
-  DB  233,147,254,255,255                 ; jmpq          f042 <_sk_load_u16_be_avx+0x42>
+  DB  233,147,254,255,255                 ; jmpq          ed82 <_sk_load_u16_be_avx+0x3c>
 
 PUBLIC _sk_load_rgb_u16_be_avx
 _sk_load_rgb_u16_be_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  76,141,4,82                         ; lea           (%rdx,%rdx,2),%r8
   DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
-  DB  77,1,192                            ; add           %r8,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,137,208                          ; mov           %rdx,%rax
-  DB  72,193,224,32                       ; shl           $0x20,%rax
-  DB  72,141,4,64                         ; lea           (%rax,%rax,2),%rax
-  DB  72,193,248,32                       ; sar           $0x20,%rax
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  77,1,201                            ; add           %r9,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,253,0,0,0                    ; jne           f2d7 <_sk_load_rgb_u16_be_avx+0x128>
-  DB  196,65,122,111,28,64                ; vmovdqu       (%r8,%rax,2),%xmm11
-  DB  196,193,122,111,92,64,12            ; vmovdqu       0xc(%r8,%rax,2),%xmm3
-  DB  196,193,122,111,84,64,24            ; vmovdqu       0x18(%r8,%rax,2),%xmm2
-  DB  196,193,122,111,68,64,32            ; vmovdqu       0x20(%r8,%rax,2),%xmm0
+  DB  15,133,253,0,0,0                    ; jne           f009 <_sk_load_rgb_u16_be_avx+0x11a>
+  DB  196,1,122,111,28,65                 ; vmovdqu       (%r9,%r8,2),%xmm11
+  DB  196,129,122,111,92,65,12            ; vmovdqu       0xc(%r9,%r8,2),%xmm3
+  DB  196,129,122,111,84,65,24            ; vmovdqu       0x18(%r9,%r8,2),%xmm2
+  DB  196,129,122,111,68,65,32            ; vmovdqu       0x20(%r9,%r8,2),%xmm0
   DB  197,249,115,216,4                   ; vpsrldq       $0x4,%xmm0,%xmm0
   DB  196,193,57,115,219,6                ; vpsrldq       $0x6,%xmm11,%xmm8
   DB  197,169,115,219,6                   ; vpsrldq       $0x6,%xmm3,%xmm10
@@ -14144,7 +14005,7 @@
   DB  196,226,121,51,192                  ; vpmovzxwd     %xmm0,%xmm0
   DB  196,227,117,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,13,247,66,2,0         ; vbroadcastss  0x242f7(%rip),%ymm9        # 33560 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
+  DB  196,98,125,24,13,153,63,2,0         ; vbroadcastss  0x23f99(%rip),%ymm9        # 32f34 <_sk_srcover_bgra_8888_sse2_lowp+0x344>
   DB  196,193,124,89,193                  ; vmulps        %ymm9,%ymm0,%ymm0
   DB  197,185,109,203                     ; vpunpckhqdq   %xmm3,%xmm8,%xmm1
   DB  197,225,113,241,8                   ; vpsllw        $0x8,%xmm1,%xmm3
@@ -14166,85 +14027,83 @@
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
   DB  196,193,108,89,209                  ; vmulps        %ymm9,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,247,65,2,0        ; vbroadcastss  0x241f7(%rip),%ymm3        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,29,153,62,2,0        ; vbroadcastss  0x23e99(%rip),%ymm3        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  255,224                             ; jmpq          *%rax
-  DB  196,193,121,110,4,64                ; vmovd         (%r8,%rax,2),%xmm0
+  DB  196,129,121,110,4,65                ; vmovd         (%r9,%r8,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
-  DB  196,65,121,196,92,64,4,2            ; vpinsrw       $0x2,0x4(%r8,%rax,2),%xmm0,%xmm11
+  DB  196,1,121,196,92,65,4,2             ; vpinsrw       $0x2,0x4(%r9,%r8,2),%xmm0,%xmm11
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,31                              ; jne           f30f <_sk_load_rgb_u16_be_avx+0x160>
+  DB  117,31                              ; jne           f041 <_sk_load_rgb_u16_be_avx+0x152>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
   DB  196,65,41,239,210                   ; vpxor         %xmm10,%xmm10,%xmm10
   DB  197,225,239,219                     ; vpxor         %xmm3,%xmm3,%xmm3
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
-  DB  233,0,255,255,255                   ; jmpq          f20f <_sk_load_rgb_u16_be_avx+0x60>
-  DB  196,193,121,110,68,64,6             ; vmovd         0x6(%r8,%rax,2),%xmm0
+  DB  233,0,255,255,255                   ; jmpq          ef41 <_sk_load_rgb_u16_be_avx+0x52>
+  DB  196,129,121,110,68,65,6             ; vmovd         0x6(%r9,%r8,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
-  DB  196,65,121,196,68,64,10,2           ; vpinsrw       $0x2,0xa(%r8,%rax,2),%xmm0,%xmm8
+  DB  196,1,121,196,68,65,10,2            ; vpinsrw       $0x2,0xa(%r9,%r8,2),%xmm0,%xmm8
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,48                              ; jb            f359 <_sk_load_rgb_u16_be_avx+0x1aa>
-  DB  196,193,121,110,68,64,12            ; vmovd         0xc(%r8,%rax,2),%xmm0
+  DB  114,48                              ; jb            f08b <_sk_load_rgb_u16_be_avx+0x19c>
+  DB  196,129,121,110,68,65,12            ; vmovd         0xc(%r9,%r8,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
-  DB  196,193,121,196,92,64,16,2          ; vpinsrw       $0x2,0x10(%r8,%rax,2),%xmm0,%xmm3
+  DB  196,129,121,196,92,65,16,2          ; vpinsrw       $0x2,0x10(%r9,%r8,2),%xmm0,%xmm3
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  117,48                              ; jne           f373 <_sk_load_rgb_u16_be_avx+0x1c4>
+  DB  117,48                              ; jne           f0a5 <_sk_load_rgb_u16_be_avx+0x1b6>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
   DB  196,65,41,239,210                   ; vpxor         %xmm10,%xmm10,%xmm10
-  DB  233,182,254,255,255                 ; jmpq          f20f <_sk_load_rgb_u16_be_avx+0x60>
+  DB  233,182,254,255,255                 ; jmpq          ef41 <_sk_load_rgb_u16_be_avx+0x52>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
   DB  196,65,41,239,210                   ; vpxor         %xmm10,%xmm10,%xmm10
   DB  197,225,239,219                     ; vpxor         %xmm3,%xmm3,%xmm3
-  DB  233,156,254,255,255                 ; jmpq          f20f <_sk_load_rgb_u16_be_avx+0x60>
-  DB  196,193,121,110,68,64,18            ; vmovd         0x12(%r8,%rax,2),%xmm0
+  DB  233,156,254,255,255                 ; jmpq          ef41 <_sk_load_rgb_u16_be_avx+0x52>
+  DB  196,129,121,110,68,65,18            ; vmovd         0x12(%r9,%r8,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
-  DB  196,65,121,196,84,64,22,2           ; vpinsrw       $0x2,0x16(%r8,%rax,2),%xmm0,%xmm10
+  DB  196,1,121,196,84,65,22,2            ; vpinsrw       $0x2,0x16(%r9,%r8,2),%xmm0,%xmm10
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,39                              ; jb            f3b4 <_sk_load_rgb_u16_be_avx+0x205>
-  DB  196,193,121,110,68,64,24            ; vmovd         0x18(%r8,%rax,2),%xmm0
+  DB  114,39                              ; jb            f0e6 <_sk_load_rgb_u16_be_avx+0x1f7>
+  DB  196,129,121,110,68,65,24            ; vmovd         0x18(%r9,%r8,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
-  DB  196,193,121,196,84,64,28,2          ; vpinsrw       $0x2,0x1c(%r8,%rax,2),%xmm0,%xmm2
+  DB  196,129,121,196,84,65,28,2          ; vpinsrw       $0x2,0x1c(%r9,%r8,2),%xmm0,%xmm2
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  117,30                              ; jne           f3c5 <_sk_load_rgb_u16_be_avx+0x216>
+  DB  117,30                              ; jne           f0f7 <_sk_load_rgb_u16_be_avx+0x208>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
-  DB  233,91,254,255,255                  ; jmpq          f20f <_sk_load_rgb_u16_be_avx+0x60>
+  DB  233,91,254,255,255                  ; jmpq          ef41 <_sk_load_rgb_u16_be_avx+0x52>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
-  DB  233,74,254,255,255                  ; jmpq          f20f <_sk_load_rgb_u16_be_avx+0x60>
-  DB  196,193,121,110,68,64,30            ; vmovd         0x1e(%r8,%rax,2),%xmm0
+  DB  233,74,254,255,255                  ; jmpq          ef41 <_sk_load_rgb_u16_be_avx+0x52>
+  DB  196,129,121,110,68,65,30            ; vmovd         0x1e(%r9,%r8,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
-  DB  196,193,121,196,76,64,34,2          ; vpinsrw       $0x2,0x22(%r8,%rax,2),%xmm0,%xmm1
+  DB  196,129,121,196,76,65,34,2          ; vpinsrw       $0x2,0x22(%r9,%r8,2),%xmm0,%xmm1
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  114,25                              ; jb            f3f8 <_sk_load_rgb_u16_be_avx+0x249>
-  DB  196,193,121,110,68,64,36            ; vmovd         0x24(%r8,%rax,2),%xmm0
+  DB  114,25                              ; jb            f12a <_sk_load_rgb_u16_be_avx+0x23b>
+  DB  196,129,121,110,68,65,36            ; vmovd         0x24(%r9,%r8,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
-  DB  196,193,121,196,68,64,40,2          ; vpinsrw       $0x2,0x28(%r8,%rax,2),%xmm0,%xmm0
-  DB  233,23,254,255,255                  ; jmpq          f20f <_sk_load_rgb_u16_be_avx+0x60>
+  DB  196,129,121,196,68,65,40,2          ; vpinsrw       $0x2,0x28(%r9,%r8,2),%xmm0,%xmm0
+  DB  233,23,254,255,255                  ; jmpq          ef41 <_sk_load_rgb_u16_be_avx+0x52>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
-  DB  233,14,254,255,255                  ; jmpq          f20f <_sk_load_rgb_u16_be_avx+0x60>
+  DB  233,14,254,255,255                  ; jmpq          ef41 <_sk_load_rgb_u16_be_avx+0x52>
 
 PUBLIC _sk_store_u16_be_avx
 _sk_store_u16_be_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9d
-  DB  76,99,80,8                          ; movslq        0x8(%rax),%r10
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,194                       ; imul          %r10,%r8
-  DB  77,1,192                            ; add           %r8,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  73,99,193                           ; movslq        %r9d,%rax
+  DB  76,141,4,149,0,0,0,0                ; lea           0x0(,%rdx,4),%r8
+  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  77,1,201                            ; add           %r9,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,60,95,200                       ; vmaxps        %ymm0,%ymm8,%ymm9
-  DB  196,98,125,24,21,155,64,2,0         ; vbroadcastss  0x2409b(%rip),%ymm10        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,21,67,61,2,0          ; vbroadcastss  0x23d43(%rip),%ymm10        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,65,52,93,202                    ; vminps        %ymm10,%ymm9,%ymm9
-  DB  196,98,125,24,29,169,65,2,0         ; vbroadcastss  0x241a9(%rip),%ymm11        # 335e8 <_sk_srcover_bgra_8888_sse2_lowp+0x3cc>
+  DB  196,98,125,24,29,81,62,2,0          ; vbroadcastss  0x23e51(%rip),%ymm11        # 32fbc <_sk_srcover_bgra_8888_sse2_lowp+0x3cc>
   DB  196,65,52,89,203                    ; vmulps        %ymm11,%ymm9,%ymm9
   DB  196,65,125,91,201                   ; vcvtps2dq     %ymm9,%ymm9
   DB  196,67,125,25,204,1                 ; vextractf128  $0x1,%ymm9,%xmm12
@@ -14288,31 +14147,31 @@
   DB  196,65,25,98,200                    ; vpunpckldq    %xmm8,%xmm12,%xmm9
   DB  196,65,25,106,192                   ; vpunpckhdq    %xmm8,%xmm12,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,31                              ; jne           f53e <_sk_store_u16_be_avx+0x13d>
-  DB  196,65,122,127,28,64                ; vmovdqu       %xmm11,(%r8,%rax,2)
-  DB  196,65,122,127,84,64,16             ; vmovdqu       %xmm10,0x10(%r8,%rax,2)
-  DB  196,65,122,127,76,64,32             ; vmovdqu       %xmm9,0x20(%r8,%rax,2)
-  DB  196,65,122,127,68,64,48             ; vmovdqu       %xmm8,0x30(%r8,%rax,2)
+  DB  117,31                              ; jne           f26a <_sk_store_u16_be_avx+0x137>
+  DB  196,1,122,127,28,65                 ; vmovdqu       %xmm11,(%r9,%r8,2)
+  DB  196,1,122,127,84,65,16              ; vmovdqu       %xmm10,0x10(%r9,%r8,2)
+  DB  196,1,122,127,76,65,32              ; vmovdqu       %xmm9,0x20(%r9,%r8,2)
+  DB  196,1,122,127,68,65,48              ; vmovdqu       %xmm8,0x30(%r9,%r8,2)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,65,121,214,28,64                ; vmovq         %xmm11,(%r8,%rax,2)
+  DB  196,1,121,214,28,65                 ; vmovq         %xmm11,(%r9,%r8,2)
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,240                             ; je            f53a <_sk_store_u16_be_avx+0x139>
-  DB  196,65,121,23,92,64,8               ; vmovhpd       %xmm11,0x8(%r8,%rax,2)
+  DB  116,240                             ; je            f266 <_sk_store_u16_be_avx+0x133>
+  DB  196,1,121,23,92,65,8                ; vmovhpd       %xmm11,0x8(%r9,%r8,2)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,227                             ; jb            f53a <_sk_store_u16_be_avx+0x139>
-  DB  196,65,121,214,84,64,16             ; vmovq         %xmm10,0x10(%r8,%rax,2)
-  DB  116,218                             ; je            f53a <_sk_store_u16_be_avx+0x139>
-  DB  196,65,121,23,84,64,24              ; vmovhpd       %xmm10,0x18(%r8,%rax,2)
+  DB  114,227                             ; jb            f266 <_sk_store_u16_be_avx+0x133>
+  DB  196,1,121,214,84,65,16              ; vmovq         %xmm10,0x10(%r9,%r8,2)
+  DB  116,218                             ; je            f266 <_sk_store_u16_be_avx+0x133>
+  DB  196,1,121,23,84,65,24               ; vmovhpd       %xmm10,0x18(%r9,%r8,2)
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,205                             ; jb            f53a <_sk_store_u16_be_avx+0x139>
-  DB  196,65,121,214,76,64,32             ; vmovq         %xmm9,0x20(%r8,%rax,2)
-  DB  116,196                             ; je            f53a <_sk_store_u16_be_avx+0x139>
-  DB  196,65,121,23,76,64,40              ; vmovhpd       %xmm9,0x28(%r8,%rax,2)
+  DB  114,205                             ; jb            f266 <_sk_store_u16_be_avx+0x133>
+  DB  196,1,121,214,76,65,32              ; vmovq         %xmm9,0x20(%r9,%r8,2)
+  DB  116,196                             ; je            f266 <_sk_store_u16_be_avx+0x133>
+  DB  196,1,121,23,76,65,40               ; vmovhpd       %xmm9,0x28(%r9,%r8,2)
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  114,183                             ; jb            f53a <_sk_store_u16_be_avx+0x139>
-  DB  196,65,121,214,68,64,48             ; vmovq         %xmm8,0x30(%r8,%rax,2)
-  DB  235,174                             ; jmp           f53a <_sk_store_u16_be_avx+0x139>
+  DB  114,183                             ; jb            f266 <_sk_store_u16_be_avx+0x133>
+  DB  196,1,121,214,68,65,48              ; vmovq         %xmm8,0x30(%r9,%r8,2)
+  DB  235,174                             ; jmp           f266 <_sk_store_u16_be_avx+0x133>
 
 PUBLIC _sk_load_f32_avx
 _sk_load_f32_avx LABEL PROC
@@ -14320,19 +14179,17 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,253,87,192                      ; vxorpd        %ymm0,%ymm0,%ymm0
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  15,135,94,1,0,0                     ; ja            f701 <_sk_load_f32_avx+0x175>
+  DB  15,135,88,1,0,0                     ; ja            f427 <_sk_load_f32_avx+0x16f>
   DB  197,253,17,36,36                    ; vmovupd       %ymm4,(%rsp)
   DB  197,253,17,108,36,32                ; vmovupd       %ymm5,0x20(%rsp)
   DB  197,253,17,116,36,64                ; vmovupd       %ymm6,0x40(%rsp)
   DB  197,253,17,124,36,96                ; vmovupd       %ymm7,0x60(%rsp)
-  DB  68,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9d
-  DB  76,99,80,8                          ; movslq        0x8(%rax),%r10
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,194                       ; imul          %r10,%r8
-  DB  73,193,224,2                        ; shl           $0x2,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  77,99,201                           ; movslq        %r9d,%r9
-  DB  76,141,21,50,1,0,0                  ; lea           0x132(%rip),%r10        # f710 <_sk_load_f32_avx+0x184>
+  DB  76,141,4,149,0,0,0,0                ; lea           0x0(,%rdx,4),%r8
+  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  73,193,225,2                        ; shl           $0x2,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
+  DB  76,141,21,52,1,0,0                  ; lea           0x134(%rip),%r10        # f438 <_sk_load_f32_avx+0x180>
   DB  73,99,4,186                         ; movslq        (%r10,%rdi,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  197,221,87,228                      ; vxorpd        %ymm4,%ymm4,%ymm4
@@ -14351,31 +14208,31 @@
   DB  196,65,45,87,210                    ; vxorpd        %ymm10,%ymm10,%ymm10
   DB  197,197,87,255                      ; vxorpd        %ymm7,%ymm7,%ymm7
   DB  255,224                             ; jmpq          *%rax
-  DB  196,129,121,16,68,136,112           ; vmovupd       0x70(%r8,%r9,4),%xmm0
+  DB  196,129,121,16,68,129,112           ; vmovupd       0x70(%r9,%r8,4),%xmm0
   DB  196,227,125,6,192,40                ; vperm2f128    $0x28,%ymm0,%ymm0,%ymm0
-  DB  196,129,121,16,76,136,96            ; vmovupd       0x60(%r8,%r9,4),%xmm1
+  DB  196,129,121,16,76,129,96            ; vmovupd       0x60(%r9,%r8,4),%xmm1
   DB  196,227,125,6,225,40                ; vperm2f128    $0x28,%ymm1,%ymm0,%ymm4
-  DB  196,129,121,16,76,136,80            ; vmovupd       0x50(%r8,%r9,4),%xmm1
+  DB  196,129,121,16,76,129,80            ; vmovupd       0x50(%r9,%r8,4),%xmm1
   DB  196,227,125,6,209,40                ; vperm2f128    $0x28,%ymm1,%ymm0,%ymm2
   DB  197,125,40,204                      ; vmovapd       %ymm4,%ymm9
-  DB  196,129,121,16,76,136,64            ; vmovupd       0x40(%r8,%r9,4),%xmm1
+  DB  196,129,121,16,76,129,64            ; vmovupd       0x40(%r9,%r8,4),%xmm1
   DB  196,99,125,6,193,40                 ; vperm2f128    $0x28,%ymm1,%ymm0,%ymm8
   DB  196,65,125,40,217                   ; vmovapd       %ymm9,%ymm11
   DB  197,125,40,226                      ; vmovapd       %ymm2,%ymm12
-  DB  196,129,121,16,76,136,48            ; vmovupd       0x30(%r8,%r9,4),%xmm1
+  DB  196,129,121,16,76,129,48            ; vmovupd       0x30(%r9,%r8,4),%xmm1
   DB  196,227,117,13,192,12               ; vblendpd      $0xc,%ymm0,%ymm1,%ymm0
   DB  196,65,125,40,243                   ; vmovapd       %ymm11,%ymm14
   DB  197,125,41,230                      ; vmovapd       %ymm12,%ymm6
   DB  196,65,125,40,248                   ; vmovapd       %ymm8,%ymm15
-  DB  196,129,121,16,76,136,32            ; vmovupd       0x20(%r8,%r9,4),%xmm1
+  DB  196,129,121,16,76,129,32            ; vmovupd       0x20(%r9,%r8,4),%xmm1
   DB  196,195,117,13,206,12               ; vblendpd      $0xc,%ymm14,%ymm1,%ymm1
   DB  197,125,40,238                      ; vmovapd       %ymm6,%ymm13
   DB  197,125,41,253                      ; vmovapd       %ymm15,%ymm5
-  DB  196,129,121,16,84,136,16            ; vmovupd       0x10(%r8,%r9,4),%xmm2
+  DB  196,129,121,16,84,129,16            ; vmovupd       0x10(%r9,%r8,4),%xmm2
   DB  196,67,109,13,213,12                ; vblendpd      $0xc,%ymm13,%ymm2,%ymm10
   DB  197,253,40,217                      ; vmovapd       %ymm1,%ymm3
   DB  197,253,40,253                      ; vmovapd       %ymm5,%ymm7
-  DB  196,129,121,16,12,136               ; vmovupd       (%r8,%r9,4),%xmm1
+  DB  196,129,121,16,12,129               ; vmovupd       (%r9,%r8,4),%xmm1
   DB  196,227,117,13,207,12               ; vblendpd      $0xc,%ymm7,%ymm1,%ymm1
   DB  197,252,16,124,36,96                ; vmovups       0x60(%rsp),%ymm7
   DB  197,252,16,116,36,64                ; vmovups       0x40(%rsp),%ymm6
@@ -14395,18 +14252,22 @@
   DB  197,229,87,219                      ; vxorpd        %ymm3,%ymm3,%ymm3
   DB  196,65,45,87,210                    ; vxorpd        %ymm10,%ymm10,%ymm10
   DB  197,245,87,201                      ; vxorpd        %ymm1,%ymm1,%ymm1
-  DB  235,196                             ; jmp           f6d4 <_sk_load_f32_avx+0x148>
-  DB  27,255                              ; sbb           %edi,%edi
+  DB  235,196                             ; jmp           f3fa <_sk_load_f32_avx+0x142>
+  DB  102,144                             ; xchg          %ax,%ax
+  DB  25,255                              ; sbb           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,161,255,255,255,140             ; jmpq          *-0x73000001(%rcx)
+  DB  255,159,255,255,255,138             ; lcall         *-0x75000001(%rdi)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,119,255                         ; pushq         -0x1(%rdi)
+  DB  255,117,255                         ; pushq         -0x1(%rbp)
   DB  255                                 ; (bad)
-  DB  255,92,255,255                      ; lcall         *-0x1(%rdi,%rdi,8)
-  DB  255,70,255                          ; incl          -0x1(%rsi)
+  DB  255,90,255                          ; lcall         *-0x1(%rdx)
   DB  255                                 ; (bad)
-  DB  255,53,255,255,255,40               ; pushq         0x28ffffff(%rip)        # 2900f72c <_sk_srcover_bgra_8888_sse2_lowp+0x28fdc510>
+  DB  255,68,255,255                      ; incl          -0x1(%rdi,%rdi,8)
+  DB  255,51                              ; pushq         (%rbx)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,38                              ; jmpq          *(%rsi)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -14417,19 +14278,17 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,221,87,228                      ; vxorpd        %ymm4,%ymm4,%ymm4
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  15,135,94,1,0,0                     ; ja            f8a5 <_sk_load_f32_dst_avx+0x175>
+  DB  15,135,88,1,0,0                     ; ja            f5c7 <_sk_load_f32_dst_avx+0x16f>
   DB  197,253,17,4,36                     ; vmovupd       %ymm0,(%rsp)
   DB  197,253,17,76,36,32                 ; vmovupd       %ymm1,0x20(%rsp)
   DB  197,253,17,84,36,64                 ; vmovupd       %ymm2,0x40(%rsp)
   DB  197,253,17,92,36,96                 ; vmovupd       %ymm3,0x60(%rsp)
-  DB  68,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9d
-  DB  76,99,80,8                          ; movslq        0x8(%rax),%r10
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,194                       ; imul          %r10,%r8
-  DB  73,193,224,2                        ; shl           $0x2,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  77,99,201                           ; movslq        %r9d,%r9
-  DB  76,141,21,50,1,0,0                  ; lea           0x132(%rip),%r10        # f8b4 <_sk_load_f32_dst_avx+0x184>
+  DB  76,141,4,149,0,0,0,0                ; lea           0x0(,%rdx,4),%r8
+  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  73,193,225,2                        ; shl           $0x2,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
+  DB  76,141,21,52,1,0,0                  ; lea           0x134(%rip),%r10        # f5d8 <_sk_load_f32_dst_avx+0x180>
   DB  73,99,4,186                         ; movslq        (%r10,%rdi,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  197,253,87,192                      ; vxorpd        %ymm0,%ymm0,%ymm0
@@ -14448,31 +14307,31 @@
   DB  196,65,45,87,210                    ; vxorpd        %ymm10,%ymm10,%ymm10
   DB  197,229,87,219                      ; vxorpd        %ymm3,%ymm3,%ymm3
   DB  255,224                             ; jmpq          *%rax
-  DB  196,129,121,16,68,136,112           ; vmovupd       0x70(%r8,%r9,4),%xmm0
+  DB  196,129,121,16,68,129,112           ; vmovupd       0x70(%r9,%r8,4),%xmm0
   DB  196,227,125,6,224,40                ; vperm2f128    $0x28,%ymm0,%ymm0,%ymm4
-  DB  196,129,121,16,68,136,96            ; vmovupd       0x60(%r8,%r9,4),%xmm0
+  DB  196,129,121,16,68,129,96            ; vmovupd       0x60(%r9,%r8,4),%xmm0
   DB  196,227,125,6,192,40                ; vperm2f128    $0x28,%ymm0,%ymm0,%ymm0
-  DB  196,129,121,16,76,136,80            ; vmovupd       0x50(%r8,%r9,4),%xmm1
+  DB  196,129,121,16,76,129,80            ; vmovupd       0x50(%r9,%r8,4),%xmm1
   DB  196,227,125,6,241,40                ; vperm2f128    $0x28,%ymm1,%ymm0,%ymm6
   DB  197,125,40,200                      ; vmovapd       %ymm0,%ymm9
-  DB  196,129,121,16,68,136,64            ; vmovupd       0x40(%r8,%r9,4),%xmm0
+  DB  196,129,121,16,68,129,64            ; vmovupd       0x40(%r9,%r8,4),%xmm0
   DB  196,99,125,6,192,40                 ; vperm2f128    $0x28,%ymm0,%ymm0,%ymm8
   DB  196,65,125,40,217                   ; vmovapd       %ymm9,%ymm11
   DB  197,125,40,230                      ; vmovapd       %ymm6,%ymm12
-  DB  196,129,121,16,68,136,48            ; vmovupd       0x30(%r8,%r9,4),%xmm0
+  DB  196,129,121,16,68,129,48            ; vmovupd       0x30(%r9,%r8,4),%xmm0
   DB  196,227,125,13,228,12               ; vblendpd      $0xc,%ymm4,%ymm0,%ymm4
   DB  196,65,125,40,243                   ; vmovapd       %ymm11,%ymm14
   DB  197,125,41,226                      ; vmovapd       %ymm12,%ymm2
   DB  196,65,125,40,248                   ; vmovapd       %ymm8,%ymm15
-  DB  196,129,121,16,68,136,32            ; vmovupd       0x20(%r8,%r9,4),%xmm0
+  DB  196,129,121,16,68,129,32            ; vmovupd       0x20(%r9,%r8,4),%xmm0
   DB  196,195,125,13,238,12               ; vblendpd      $0xc,%ymm14,%ymm0,%ymm5
   DB  197,125,40,234                      ; vmovapd       %ymm2,%ymm13
   DB  197,125,41,249                      ; vmovapd       %ymm15,%ymm1
-  DB  196,129,121,16,68,136,16            ; vmovupd       0x10(%r8,%r9,4),%xmm0
+  DB  196,129,121,16,68,129,16            ; vmovupd       0x10(%r9,%r8,4),%xmm0
   DB  196,67,125,13,213,12                ; vblendpd      $0xc,%ymm13,%ymm0,%ymm10
   DB  197,253,40,253                      ; vmovapd       %ymm5,%ymm7
   DB  197,253,40,217                      ; vmovapd       %ymm1,%ymm3
-  DB  196,129,121,16,4,136                ; vmovupd       (%r8,%r9,4),%xmm0
+  DB  196,129,121,16,4,129                ; vmovupd       (%r9,%r8,4),%xmm0
   DB  196,227,125,13,235,12               ; vblendpd      $0xc,%ymm3,%ymm0,%ymm5
   DB  197,252,16,92,36,96                 ; vmovups       0x60(%rsp),%ymm3
   DB  197,252,16,84,36,64                 ; vmovups       0x40(%rsp),%ymm2
@@ -14492,18 +14351,22 @@
   DB  197,197,87,255                      ; vxorpd        %ymm7,%ymm7,%ymm7
   DB  196,65,45,87,210                    ; vxorpd        %ymm10,%ymm10,%ymm10
   DB  197,213,87,237                      ; vxorpd        %ymm5,%ymm5,%ymm5
-  DB  235,196                             ; jmp           f878 <_sk_load_f32_dst_avx+0x148>
-  DB  27,255                              ; sbb           %edi,%edi
+  DB  235,196                             ; jmp           f59a <_sk_load_f32_dst_avx+0x142>
+  DB  102,144                             ; xchg          %ax,%ax
+  DB  25,255                              ; sbb           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,161,255,255,255,140             ; jmpq          *-0x73000001(%rcx)
+  DB  255,159,255,255,255,138             ; lcall         *-0x75000001(%rdi)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,119,255                         ; pushq         -0x1(%rdi)
+  DB  255,117,255                         ; pushq         -0x1(%rbp)
   DB  255                                 ; (bad)
-  DB  255,92,255,255                      ; lcall         *-0x1(%rdi,%rdi,8)
-  DB  255,70,255                          ; incl          -0x1(%rsi)
+  DB  255,90,255                          ; lcall         *-0x1(%rdx)
   DB  255                                 ; (bad)
-  DB  255,53,255,255,255,40               ; pushq         0x28ffffff(%rip)        # 2900f8d0 <_sk_srcover_bgra_8888_sse2_lowp+0x28fdc6b4>
+  DB  255,68,255,255                      ; incl          -0x1(%rdi,%rdi,8)
+  DB  255,51                              ; pushq         (%rbx)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,38                              ; jmpq          *(%rsi)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -14511,13 +14374,11 @@
 PUBLIC _sk_store_f32_avx
 _sk_store_f32_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9d
-  DB  76,99,80,8                          ; movslq        0x8(%rax),%r10
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,194                       ; imul          %r10,%r8
-  DB  73,193,224,2                        ; shl           $0x2,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  73,99,193                           ; movslq        %r9d,%rax
+  DB  76,141,4,149,0,0,0,0                ; lea           0x0(,%rdx,4),%r8
+  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  73,193,225,2                        ; shl           $0x2,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
   DB  197,124,20,193                      ; vunpcklps     %ymm1,%ymm0,%ymm8
   DB  197,124,21,217                      ; vunpckhps     %ymm1,%ymm0,%ymm11
   DB  197,108,20,203                      ; vunpcklps     %ymm3,%ymm2,%ymm9
@@ -14527,35 +14388,35 @@
   DB  196,65,37,20,196                    ; vunpcklpd     %ymm12,%ymm11,%ymm8
   DB  196,65,37,21,220                    ; vunpckhpd     %ymm12,%ymm11,%ymm11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,55                              ; jne           f953 <_sk_store_f32_avx+0x7f>
+  DB  117,55                              ; jne           f671 <_sk_store_f32_avx+0x79>
   DB  196,67,45,24,225,1                  ; vinsertf128   $0x1,%xmm9,%ymm10,%ymm12
   DB  196,67,61,24,235,1                  ; vinsertf128   $0x1,%xmm11,%ymm8,%ymm13
   DB  196,67,45,6,201,49                  ; vperm2f128    $0x31,%ymm9,%ymm10,%ymm9
   DB  196,67,61,6,195,49                  ; vperm2f128    $0x31,%ymm11,%ymm8,%ymm8
-  DB  196,65,124,17,36,128                ; vmovups       %ymm12,(%r8,%rax,4)
-  DB  196,65,124,17,108,128,32            ; vmovups       %ymm13,0x20(%r8,%rax,4)
-  DB  196,65,125,17,76,128,64             ; vmovupd       %ymm9,0x40(%r8,%rax,4)
-  DB  196,65,125,17,68,128,96             ; vmovupd       %ymm8,0x60(%r8,%rax,4)
+  DB  196,1,124,17,36,129                 ; vmovups       %ymm12,(%r9,%r8,4)
+  DB  196,1,124,17,108,129,32             ; vmovups       %ymm13,0x20(%r9,%r8,4)
+  DB  196,1,125,17,76,129,64              ; vmovupd       %ymm9,0x40(%r9,%r8,4)
+  DB  196,1,125,17,68,129,96              ; vmovupd       %ymm8,0x60(%r9,%r8,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  196,65,121,17,20,128                ; vmovupd       %xmm10,(%r8,%rax,4)
+  DB  196,1,121,17,20,129                 ; vmovupd       %xmm10,(%r9,%r8,4)
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,240                             ; je            f94f <_sk_store_f32_avx+0x7b>
-  DB  196,65,121,17,76,128,16             ; vmovupd       %xmm9,0x10(%r8,%rax,4)
+  DB  116,240                             ; je            f66d <_sk_store_f32_avx+0x75>
+  DB  196,1,121,17,76,129,16              ; vmovupd       %xmm9,0x10(%r9,%r8,4)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,227                             ; jb            f94f <_sk_store_f32_avx+0x7b>
-  DB  196,65,121,17,68,128,32             ; vmovupd       %xmm8,0x20(%r8,%rax,4)
-  DB  116,218                             ; je            f94f <_sk_store_f32_avx+0x7b>
-  DB  196,65,121,17,92,128,48             ; vmovupd       %xmm11,0x30(%r8,%rax,4)
+  DB  114,227                             ; jb            f66d <_sk_store_f32_avx+0x75>
+  DB  196,1,121,17,68,129,32              ; vmovupd       %xmm8,0x20(%r9,%r8,4)
+  DB  116,218                             ; je            f66d <_sk_store_f32_avx+0x75>
+  DB  196,1,121,17,92,129,48              ; vmovupd       %xmm11,0x30(%r9,%r8,4)
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,205                             ; jb            f94f <_sk_store_f32_avx+0x7b>
-  DB  196,67,125,25,84,128,64,1           ; vextractf128  $0x1,%ymm10,0x40(%r8,%rax,4)
-  DB  116,195                             ; je            f94f <_sk_store_f32_avx+0x7b>
-  DB  196,67,125,25,76,128,80,1           ; vextractf128  $0x1,%ymm9,0x50(%r8,%rax,4)
+  DB  114,205                             ; jb            f66d <_sk_store_f32_avx+0x75>
+  DB  196,3,125,25,84,129,64,1            ; vextractf128  $0x1,%ymm10,0x40(%r9,%r8,4)
+  DB  116,195                             ; je            f66d <_sk_store_f32_avx+0x75>
+  DB  196,3,125,25,76,129,80,1            ; vextractf128  $0x1,%ymm9,0x50(%r9,%r8,4)
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  114,181                             ; jb            f94f <_sk_store_f32_avx+0x7b>
-  DB  196,67,125,25,68,128,96,1           ; vextractf128  $0x1,%ymm8,0x60(%r8,%rax,4)
-  DB  235,171                             ; jmp           f94f <_sk_store_f32_avx+0x7b>
+  DB  114,181                             ; jb            f66d <_sk_store_f32_avx+0x75>
+  DB  196,3,125,25,68,129,96,1            ; vextractf128  $0x1,%ymm8,0x60(%r9,%r8,4)
+  DB  235,171                             ; jmp           f66d <_sk_store_f32_avx+0x75>
 
 PUBLIC _sk_repeat_x_avx
 _sk_repeat_x_avx LABEL PROC
@@ -14592,7 +14453,7 @@
   DB  196,193,58,88,192                   ; vaddss        %xmm8,%xmm8,%xmm0
   DB  196,227,121,4,192,0                 ; vpermilps     $0x0,%xmm0,%xmm0
   DB  196,99,125,24,192,1                 ; vinsertf128   $0x1,%xmm0,%ymm0,%ymm8
-  DB  197,178,89,5,165,58,2,0             ; vmulss        0x23aa5(%rip),%xmm9,%xmm0        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  197,178,89,5,91,55,2,0              ; vmulss        0x2375b(%rip),%xmm9,%xmm0        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,227,121,4,192,0                 ; vpermilps     $0x0,%xmm0,%xmm0
   DB  196,227,125,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
   DB  197,164,89,192                      ; vmulps        %ymm0,%ymm11,%ymm0
@@ -14617,7 +14478,7 @@
   DB  196,193,58,88,200                   ; vaddss        %xmm8,%xmm8,%xmm1
   DB  196,227,121,4,201,0                 ; vpermilps     $0x0,%xmm1,%xmm1
   DB  196,99,117,24,193,1                 ; vinsertf128   $0x1,%xmm1,%ymm1,%ymm8
-  DB  197,178,89,13,59,58,2,0             ; vmulss        0x23a3b(%rip),%xmm9,%xmm1        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  197,178,89,13,241,54,2,0            ; vmulss        0x236f1(%rip),%xmm9,%xmm1        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,227,121,4,201,0                 ; vpermilps     $0x0,%xmm1,%xmm1
   DB  196,227,117,24,201,1                ; vinsertf128   $0x1,%xmm1,%ymm1,%ymm1
   DB  197,164,89,201                      ; vmulps        %ymm1,%ymm11,%ymm1
@@ -14635,7 +14496,7 @@
 _sk_clamp_x_1_avx LABEL PROC
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,188,95,192                      ; vmaxps        %ymm0,%ymm8,%ymm0
-  DB  196,98,125,24,5,248,57,2,0          ; vbroadcastss  0x239f8(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,174,54,2,0          ; vbroadcastss  0x236ae(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -14646,16 +14507,16 @@
   DB  196,193,124,92,192                  ; vsubps        %ymm8,%ymm0,%ymm0
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,188,95,192                      ; vmaxps        %ymm0,%ymm8,%ymm0
-  DB  196,98,125,24,5,210,57,2,0          ; vbroadcastss  0x239d2(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,136,54,2,0          ; vbroadcastss  0x23688(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
 
 PUBLIC _sk_mirror_x_1_avx
 _sk_mirror_x_1_avx LABEL PROC
-  DB  196,98,125,24,5,216,57,2,0          ; vbroadcastss  0x239d8(%rip),%ymm8        # 334e4 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
+  DB  196,98,125,24,5,142,54,2,0          ; vbroadcastss  0x2368e(%rip),%ymm8        # 32eb8 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
   DB  196,193,124,88,192                  ; vaddps        %ymm8,%ymm0,%ymm0
-  DB  196,98,125,24,13,174,57,2,0         ; vbroadcastss  0x239ae(%rip),%ymm9        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,13,100,54,2,0         ; vbroadcastss  0x23664(%rip),%ymm9        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,65,124,89,201                   ; vmulps        %ymm9,%ymm0,%ymm9
   DB  196,67,125,8,201,1                  ; vroundps      $0x1,%ymm9,%ymm9
   DB  196,65,52,88,201                    ; vaddps        %ymm9,%ymm9,%ymm9
@@ -14665,19 +14526,19 @@
   DB  197,60,92,200                       ; vsubps        %ymm0,%ymm8,%ymm9
   DB  197,180,84,192                      ; vandps        %ymm0,%ymm9,%ymm0
   DB  197,188,95,192                      ; vmaxps        %ymm0,%ymm8,%ymm0
-  DB  196,98,125,24,5,126,57,2,0          ; vbroadcastss  0x2397e(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,52,54,2,0           ; vbroadcastss  0x23634(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
 
 PUBLIC _sk_luminance_to_alpha_avx
 _sk_luminance_to_alpha_avx LABEL PROC
-  DB  196,226,125,24,29,140,58,2,0        ; vbroadcastss  0x23a8c(%rip),%ymm3        # 335ec <_sk_srcover_bgra_8888_sse2_lowp+0x3d0>
+  DB  196,226,125,24,29,66,55,2,0         ; vbroadcastss  0x23742(%rip),%ymm3        # 32fc0 <_sk_srcover_bgra_8888_sse2_lowp+0x3d0>
   DB  197,252,89,195                      ; vmulps        %ymm3,%ymm0,%ymm0
-  DB  196,226,125,24,29,131,58,2,0        ; vbroadcastss  0x23a83(%rip),%ymm3        # 335f0 <_sk_srcover_bgra_8888_sse2_lowp+0x3d4>
+  DB  196,226,125,24,29,57,55,2,0         ; vbroadcastss  0x23739(%rip),%ymm3        # 32fc4 <_sk_srcover_bgra_8888_sse2_lowp+0x3d4>
   DB  197,244,89,203                      ; vmulps        %ymm3,%ymm1,%ymm1
   DB  197,252,88,193                      ; vaddps        %ymm1,%ymm0,%ymm0
-  DB  196,226,125,24,13,118,58,2,0        ; vbroadcastss  0x23a76(%rip),%ymm1        # 335f4 <_sk_srcover_bgra_8888_sse2_lowp+0x3d8>
+  DB  196,226,125,24,13,44,55,2,0         ; vbroadcastss  0x2372c(%rip),%ymm1        # 32fc8 <_sk_srcover_bgra_8888_sse2_lowp+0x3d8>
   DB  197,236,89,201                      ; vmulps        %ymm1,%ymm2,%ymm1
   DB  197,252,88,217                      ; vaddps        %ymm1,%ymm0,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -14910,9 +14771,9 @@
   DB  72,139,24                           ; mov           (%rax),%rbx
   DB  72,139,104,8                        ; mov           0x8(%rax),%rbp
   DB  72,255,203                          ; dec           %rbx
-  DB  120,7                               ; js            ff25 <_sk_evenly_spaced_gradient_avx+0x28>
+  DB  120,7                               ; js            fc43 <_sk_evenly_spaced_gradient_avx+0x28>
   DB  196,225,242,42,203                  ; vcvtsi2ss     %rbx,%xmm1,%xmm1
-  DB  235,21                              ; jmp           ff3a <_sk_evenly_spaced_gradient_avx+0x3d>
+  DB  235,21                              ; jmp           fc58 <_sk_evenly_spaced_gradient_avx+0x3d>
   DB  73,137,216                          ; mov           %rbx,%r8
   DB  73,209,232                          ; shr           %r8
   DB  131,227,1                           ; and           $0x1,%ebx
@@ -15080,12 +14941,12 @@
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  73,131,248,2                        ; cmp           $0x2,%r8
-  DB  114,81                              ; jb            102da <_sk_gradient_avx+0x72>
+  DB  114,81                              ; jb            fff8 <_sk_gradient_avx+0x72>
   DB  72,139,88,72                        ; mov           0x48(%rax),%rbx
   DB  73,255,200                          ; dec           %r8
   DB  72,131,195,4                        ; add           $0x4,%rbx
   DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
-  DB  196,98,125,24,21,46,50,2,0          ; vbroadcastss  0x2322e(%rip),%ymm10        # 334d0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b4>
+  DB  196,98,125,24,21,228,46,2,0         ; vbroadcastss  0x22ee4(%rip),%ymm10        # 32ea4 <_sk_srcover_bgra_8888_sse2_lowp+0x2b4>
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  196,98,125,24,3                     ; vbroadcastss  (%rbx),%ymm8
   DB  197,60,194,192,2                    ; vcmpleps      %ymm0,%ymm8,%ymm8
@@ -15097,7 +14958,7 @@
   DB  196,227,117,24,202,1                ; vinsertf128   $0x1,%xmm2,%ymm1,%ymm1
   DB  72,131,195,4                        ; add           $0x4,%rbx
   DB  73,255,200                          ; dec           %r8
-  DB  117,204                             ; jne           102a6 <_sk_gradient_avx+0x3e>
+  DB  117,204                             ; jne           ffc4 <_sk_gradient_avx+0x3e>
   DB  196,195,249,22,200,1                ; vpextrq       $0x1,%xmm1,%r8
   DB  69,137,193                          ; mov           %r8d,%r9d
   DB  73,193,232,32                       ; shr           $0x20,%r8
@@ -15276,27 +15137,27 @@
   DB  196,65,52,95,226                    ; vmaxps        %ymm10,%ymm9,%ymm12
   DB  196,65,36,94,220                    ; vdivps        %ymm12,%ymm11,%ymm11
   DB  196,65,36,89,227                    ; vmulps        %ymm11,%ymm11,%ymm12
-  DB  196,98,125,24,45,69,47,2,0          ; vbroadcastss  0x22f45(%rip),%ymm13        # 335f8 <_sk_srcover_bgra_8888_sse2_lowp+0x3dc>
+  DB  196,98,125,24,45,251,43,2,0         ; vbroadcastss  0x22bfb(%rip),%ymm13        # 32fcc <_sk_srcover_bgra_8888_sse2_lowp+0x3dc>
   DB  196,65,28,89,237                    ; vmulps        %ymm13,%ymm12,%ymm13
-  DB  196,98,125,24,53,59,47,2,0          ; vbroadcastss  0x22f3b(%rip),%ymm14        # 335fc <_sk_srcover_bgra_8888_sse2_lowp+0x3e0>
+  DB  196,98,125,24,53,241,43,2,0         ; vbroadcastss  0x22bf1(%rip),%ymm14        # 32fd0 <_sk_srcover_bgra_8888_sse2_lowp+0x3e0>
   DB  196,65,20,88,238                    ; vaddps        %ymm14,%ymm13,%ymm13
   DB  196,65,28,89,237                    ; vmulps        %ymm13,%ymm12,%ymm13
-  DB  196,98,125,24,53,44,47,2,0          ; vbroadcastss  0x22f2c(%rip),%ymm14        # 33600 <_sk_srcover_bgra_8888_sse2_lowp+0x3e4>
+  DB  196,98,125,24,53,226,43,2,0         ; vbroadcastss  0x22be2(%rip),%ymm14        # 32fd4 <_sk_srcover_bgra_8888_sse2_lowp+0x3e4>
   DB  196,65,20,88,238                    ; vaddps        %ymm14,%ymm13,%ymm13
   DB  196,65,28,89,229                    ; vmulps        %ymm13,%ymm12,%ymm12
-  DB  196,98,125,24,45,29,47,2,0          ; vbroadcastss  0x22f1d(%rip),%ymm13        # 33604 <_sk_srcover_bgra_8888_sse2_lowp+0x3e8>
+  DB  196,98,125,24,45,211,43,2,0         ; vbroadcastss  0x22bd3(%rip),%ymm13        # 32fd8 <_sk_srcover_bgra_8888_sse2_lowp+0x3e8>
   DB  196,65,28,88,229                    ; vaddps        %ymm13,%ymm12,%ymm12
   DB  196,65,36,89,220                    ; vmulps        %ymm12,%ymm11,%ymm11
   DB  196,65,52,194,202,1                 ; vcmpltps      %ymm10,%ymm9,%ymm9
-  DB  196,98,125,24,21,8,47,2,0           ; vbroadcastss  0x22f08(%rip),%ymm10        # 33608 <_sk_srcover_bgra_8888_sse2_lowp+0x3ec>
+  DB  196,98,125,24,21,190,43,2,0         ; vbroadcastss  0x22bbe(%rip),%ymm10        # 32fdc <_sk_srcover_bgra_8888_sse2_lowp+0x3ec>
   DB  196,65,44,92,211                    ; vsubps        %ymm11,%ymm10,%ymm10
   DB  196,67,37,74,202,144                ; vblendvps     %ymm9,%ymm10,%ymm11,%ymm9
   DB  196,193,124,194,192,1               ; vcmpltps      %ymm8,%ymm0,%ymm0
-  DB  196,98,125,24,21,174,45,2,0         ; vbroadcastss  0x22dae(%rip),%ymm10        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,21,100,42,2,0         ; vbroadcastss  0x22a64(%rip),%ymm10        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,65,44,92,209                    ; vsubps        %ymm9,%ymm10,%ymm10
   DB  196,195,53,74,194,0                 ; vblendvps     %ymm0,%ymm10,%ymm9,%ymm0
   DB  196,65,116,194,200,1                ; vcmpltps      %ymm8,%ymm1,%ymm9
-  DB  196,98,125,24,21,152,45,2,0         ; vbroadcastss  0x22d98(%rip),%ymm10        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,21,78,42,2,0          ; vbroadcastss  0x22a4e(%rip),%ymm10        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,44,92,208                       ; vsubps        %ymm0,%ymm10,%ymm10
   DB  196,195,125,74,194,144              ; vblendvps     %ymm9,%ymm10,%ymm0,%ymm0
   DB  196,65,124,194,200,3                ; vcmpunordps   %ymm8,%ymm0,%ymm9
@@ -15315,7 +15176,7 @@
 
 PUBLIC _sk_negate_x_avx
 _sk_negate_x_avx LABEL PROC
-  DB  196,98,125,24,5,160,46,2,0          ; vbroadcastss  0x22ea0(%rip),%ymm8        # 3360c <_sk_srcover_bgra_8888_sse2_lowp+0x3f0>
+  DB  196,98,125,24,5,86,43,2,0           ; vbroadcastss  0x22b56(%rip),%ymm8        # 32fe0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f0>
   DB  196,193,124,87,192                  ; vxorps        %ymm8,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -15372,7 +15233,7 @@
   DB  197,116,89,201                      ; vmulps        %ymm1,%ymm1,%ymm9
   DB  196,65,60,92,193                    ; vsubps        %ymm9,%ymm8,%ymm8
   DB  196,65,124,81,192                   ; vsqrtps       %ymm8,%ymm8
-  DB  196,98,125,24,13,0,46,2,0           ; vbroadcastss  0x22e00(%rip),%ymm9        # 3360c <_sk_srcover_bgra_8888_sse2_lowp+0x3f0>
+  DB  196,98,125,24,13,182,42,2,0         ; vbroadcastss  0x22ab6(%rip),%ymm9        # 32fe0 <_sk_srcover_bgra_8888_sse2_lowp+0x3f0>
   DB  196,65,60,87,193                    ; vxorps        %ymm9,%ymm8,%ymm8
   DB  196,98,125,24,72,64                 ; vbroadcastss  0x40(%rax),%ymm9
   DB  197,180,89,192                      ; vmulps        %ymm0,%ymm9,%ymm0
@@ -15390,7 +15251,7 @@
 
 PUBLIC _sk_alter_2pt_conical_unswap_avx
 _sk_alter_2pt_conical_unswap_avx LABEL PROC
-  DB  196,98,125,24,5,144,44,2,0          ; vbroadcastss  0x22c90(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,70,41,2,0           ; vbroadcastss  0x22946(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,188,92,192                      ; vsubps        %ymm0,%ymm8,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -15433,7 +15294,7 @@
 PUBLIC _sk_save_xy_avx
 _sk_save_xy_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,98,125,24,5,18,44,2,0           ; vbroadcastss  0x22c12(%rip),%ymm8        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,5,200,40,2,0          ; vbroadcastss  0x228c8(%rip),%ymm8        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,65,124,88,200                   ; vaddps        %ymm8,%ymm0,%ymm9
   DB  196,67,125,8,209,1                  ; vroundps      $0x1,%ymm9,%ymm10
   DB  196,65,52,92,202                    ; vsubps        %ymm10,%ymm9,%ymm9
@@ -15466,9 +15327,9 @@
 PUBLIC _sk_bilinear_nx_avx
 _sk_bilinear_nx_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,220,44,2,0         ; vbroadcastss  0x22cdc(%rip),%ymm0        # 33610 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  DB  196,226,125,24,5,146,41,2,0         ; vbroadcastss  0x22992(%rip),%ymm0        # 32fe4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   DB  197,252,88,0                        ; vaddps        (%rax),%ymm0,%ymm0
-  DB  196,98,125,24,5,139,43,2,0          ; vbroadcastss  0x22b8b(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,65,40,2,0           ; vbroadcastss  0x22841(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,128,128,0,0,0             ; vsubps        0x80(%rax),%ymm8,%ymm8
   DB  197,124,17,128,0,1,0,0              ; vmovups       %ymm8,0x100(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -15477,7 +15338,7 @@
 PUBLIC _sk_bilinear_px_avx
 _sk_bilinear_px_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,104,43,2,0         ; vbroadcastss  0x22b68(%rip),%ymm0        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,226,125,24,5,30,40,2,0          ; vbroadcastss  0x2281e(%rip),%ymm0        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  197,252,88,0                        ; vaddps        (%rax),%ymm0,%ymm0
   DB  197,124,16,128,128,0,0,0            ; vmovups       0x80(%rax),%ymm8
   DB  197,124,17,128,0,1,0,0              ; vmovups       %ymm8,0x100(%rax)
@@ -15487,9 +15348,9 @@
 PUBLIC _sk_bilinear_ny_avx
 _sk_bilinear_ny_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,13,141,44,2,0        ; vbroadcastss  0x22c8d(%rip),%ymm1        # 33610 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  DB  196,226,125,24,13,67,41,2,0         ; vbroadcastss  0x22943(%rip),%ymm1        # 32fe4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   DB  197,244,88,72,64                    ; vaddps        0x40(%rax),%ymm1,%ymm1
-  DB  196,98,125,24,5,59,43,2,0           ; vbroadcastss  0x22b3b(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,241,39,2,0          ; vbroadcastss  0x227f1(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,128,192,0,0,0             ; vsubps        0xc0(%rax),%ymm8,%ymm8
   DB  197,124,17,128,64,1,0,0             ; vmovups       %ymm8,0x140(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -15498,7 +15359,7 @@
 PUBLIC _sk_bilinear_py_avx
 _sk_bilinear_py_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,13,24,43,2,0         ; vbroadcastss  0x22b18(%rip),%ymm1        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,226,125,24,13,206,39,2,0        ; vbroadcastss  0x227ce(%rip),%ymm1        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  197,244,88,72,64                    ; vaddps        0x40(%rax),%ymm1,%ymm1
   DB  197,124,16,128,192,0,0,0            ; vmovups       0xc0(%rax),%ymm8
   DB  197,124,17,128,64,1,0,0             ; vmovups       %ymm8,0x140(%rax)
@@ -15508,14 +15369,14 @@
 PUBLIC _sk_bicubic_n3x_avx
 _sk_bicubic_n3x_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,64,44,2,0          ; vbroadcastss  0x22c40(%rip),%ymm0        # 33614 <_sk_srcover_bgra_8888_sse2_lowp+0x3f8>
+  DB  196,226,125,24,5,246,40,2,0         ; vbroadcastss  0x228f6(%rip),%ymm0        # 32fe8 <_sk_srcover_bgra_8888_sse2_lowp+0x3f8>
   DB  197,252,88,0                        ; vaddps        (%rax),%ymm0,%ymm0
-  DB  196,98,125,24,5,235,42,2,0          ; vbroadcastss  0x22aeb(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,161,39,2,0          ; vbroadcastss  0x227a1(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,128,128,0,0,0             ; vsubps        0x80(%rax),%ymm8,%ymm8
   DB  196,65,60,89,200                    ; vmulps        %ymm8,%ymm8,%ymm9
-  DB  196,98,125,24,21,33,44,2,0          ; vbroadcastss  0x22c21(%rip),%ymm10        # 33618 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
+  DB  196,98,125,24,21,215,40,2,0         ; vbroadcastss  0x228d7(%rip),%ymm10        # 32fec <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
   DB  196,65,60,89,194                    ; vmulps        %ymm10,%ymm8,%ymm8
-  DB  196,98,125,24,21,59,43,2,0          ; vbroadcastss  0x22b3b(%rip),%ymm10        # 33540 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  DB  196,98,125,24,21,241,39,2,0         ; vbroadcastss  0x227f1(%rip),%ymm10        # 32f14 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
   DB  196,65,60,88,194                    ; vaddps        %ymm10,%ymm8,%ymm8
   DB  196,65,52,89,192                    ; vmulps        %ymm8,%ymm9,%ymm8
   DB  197,124,17,128,0,1,0,0              ; vmovups       %ymm8,0x100(%rax)
@@ -15525,19 +15386,19 @@
 PUBLIC _sk_bicubic_n1x_avx
 _sk_bicubic_n1x_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,234,43,2,0         ; vbroadcastss  0x22bea(%rip),%ymm0        # 33610 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  DB  196,226,125,24,5,160,40,2,0         ; vbroadcastss  0x228a0(%rip),%ymm0        # 32fe4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   DB  197,252,88,0                        ; vaddps        (%rax),%ymm0,%ymm0
-  DB  196,98,125,24,5,153,42,2,0          ; vbroadcastss  0x22a99(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,79,39,2,0           ; vbroadcastss  0x2274f(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,128,128,0,0,0             ; vsubps        0x80(%rax),%ymm8,%ymm8
-  DB  196,98,125,24,13,220,43,2,0         ; vbroadcastss  0x22bdc(%rip),%ymm9        # 33620 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  DB  196,98,125,24,13,146,40,2,0         ; vbroadcastss  0x22892(%rip),%ymm9        # 32ff4 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
   DB  196,65,60,89,201                    ; vmulps        %ymm9,%ymm8,%ymm9
-  DB  196,98,125,24,21,202,43,2,0         ; vbroadcastss  0x22bca(%rip),%ymm10        # 3361c <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  DB  196,98,125,24,21,128,40,2,0         ; vbroadcastss  0x22880(%rip),%ymm10        # 32ff0 <_sk_srcover_bgra_8888_sse2_lowp+0x400>
   DB  196,65,52,88,202                    ; vaddps        %ymm10,%ymm9,%ymm9
   DB  196,65,60,89,201                    ; vmulps        %ymm9,%ymm8,%ymm9
-  DB  196,98,125,24,21,99,42,2,0          ; vbroadcastss  0x22a63(%rip),%ymm10        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,21,25,39,2,0          ; vbroadcastss  0x22719(%rip),%ymm10        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,65,52,88,202                    ; vaddps        %ymm10,%ymm9,%ymm9
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
-  DB  196,98,125,24,13,172,43,2,0         ; vbroadcastss  0x22bac(%rip),%ymm9        # 33624 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
+  DB  196,98,125,24,13,98,40,2,0          ; vbroadcastss  0x22862(%rip),%ymm9        # 32ff8 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
   DB  196,65,60,88,193                    ; vaddps        %ymm9,%ymm8,%ymm8
   DB  197,124,17,128,0,1,0,0              ; vmovups       %ymm8,0x100(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -15546,17 +15407,17 @@
 PUBLIC _sk_bicubic_p1x_avx
 _sk_bicubic_p1x_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,98,125,24,5,52,42,2,0           ; vbroadcastss  0x22a34(%rip),%ymm8        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,5,234,38,2,0          ; vbroadcastss  0x226ea(%rip),%ymm8        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  197,188,88,0                        ; vaddps        (%rax),%ymm8,%ymm0
   DB  197,124,16,136,128,0,0,0            ; vmovups       0x80(%rax),%ymm9
-  DB  196,98,125,24,21,119,43,2,0         ; vbroadcastss  0x22b77(%rip),%ymm10        # 33620 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  DB  196,98,125,24,21,45,40,2,0          ; vbroadcastss  0x2282d(%rip),%ymm10        # 32ff4 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
   DB  196,65,52,89,210                    ; vmulps        %ymm10,%ymm9,%ymm10
-  DB  196,98,125,24,29,101,43,2,0         ; vbroadcastss  0x22b65(%rip),%ymm11        # 3361c <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  DB  196,98,125,24,29,27,40,2,0          ; vbroadcastss  0x2281b(%rip),%ymm11        # 32ff0 <_sk_srcover_bgra_8888_sse2_lowp+0x400>
   DB  196,65,44,88,211                    ; vaddps        %ymm11,%ymm10,%ymm10
   DB  196,65,52,89,210                    ; vmulps        %ymm10,%ymm9,%ymm10
   DB  196,65,44,88,192                    ; vaddps        %ymm8,%ymm10,%ymm8
   DB  196,65,52,89,192                    ; vmulps        %ymm8,%ymm9,%ymm8
-  DB  196,98,125,24,13,80,43,2,0          ; vbroadcastss  0x22b50(%rip),%ymm9        # 33624 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
+  DB  196,98,125,24,13,6,40,2,0           ; vbroadcastss  0x22806(%rip),%ymm9        # 32ff8 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
   DB  196,65,60,88,193                    ; vaddps        %ymm9,%ymm8,%ymm8
   DB  197,124,17,128,0,1,0,0              ; vmovups       %ymm8,0x100(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -15565,13 +15426,13 @@
 PUBLIC _sk_bicubic_p3x_avx
 _sk_bicubic_p3x_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,44,43,2,0          ; vbroadcastss  0x22b2c(%rip),%ymm0        # 3361c <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  DB  196,226,125,24,5,226,39,2,0         ; vbroadcastss  0x227e2(%rip),%ymm0        # 32ff0 <_sk_srcover_bgra_8888_sse2_lowp+0x400>
   DB  197,252,88,0                        ; vaddps        (%rax),%ymm0,%ymm0
   DB  197,124,16,128,128,0,0,0            ; vmovups       0x80(%rax),%ymm8
   DB  196,65,60,89,200                    ; vmulps        %ymm8,%ymm8,%ymm9
-  DB  196,98,125,24,21,14,43,2,0          ; vbroadcastss  0x22b0e(%rip),%ymm10        # 33618 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
+  DB  196,98,125,24,21,196,39,2,0         ; vbroadcastss  0x227c4(%rip),%ymm10        # 32fec <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
   DB  196,65,60,89,194                    ; vmulps        %ymm10,%ymm8,%ymm8
-  DB  196,98,125,24,21,40,42,2,0          ; vbroadcastss  0x22a28(%rip),%ymm10        # 33540 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  DB  196,98,125,24,21,222,38,2,0         ; vbroadcastss  0x226de(%rip),%ymm10        # 32f14 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
   DB  196,65,60,88,194                    ; vaddps        %ymm10,%ymm8,%ymm8
   DB  196,65,52,89,192                    ; vmulps        %ymm8,%ymm9,%ymm8
   DB  197,124,17,128,0,1,0,0              ; vmovups       %ymm8,0x100(%rax)
@@ -15581,14 +15442,14 @@
 PUBLIC _sk_bicubic_n3y_avx
 _sk_bicubic_n3y_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,13,219,42,2,0        ; vbroadcastss  0x22adb(%rip),%ymm1        # 33614 <_sk_srcover_bgra_8888_sse2_lowp+0x3f8>
+  DB  196,226,125,24,13,145,39,2,0        ; vbroadcastss  0x22791(%rip),%ymm1        # 32fe8 <_sk_srcover_bgra_8888_sse2_lowp+0x3f8>
   DB  197,244,88,72,64                    ; vaddps        0x40(%rax),%ymm1,%ymm1
-  DB  196,98,125,24,5,133,41,2,0          ; vbroadcastss  0x22985(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,59,38,2,0           ; vbroadcastss  0x2263b(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,128,192,0,0,0             ; vsubps        0xc0(%rax),%ymm8,%ymm8
   DB  196,65,60,89,200                    ; vmulps        %ymm8,%ymm8,%ymm9
-  DB  196,98,125,24,21,187,42,2,0         ; vbroadcastss  0x22abb(%rip),%ymm10        # 33618 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
+  DB  196,98,125,24,21,113,39,2,0         ; vbroadcastss  0x22771(%rip),%ymm10        # 32fec <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
   DB  196,65,60,89,194                    ; vmulps        %ymm10,%ymm8,%ymm8
-  DB  196,98,125,24,21,213,41,2,0         ; vbroadcastss  0x229d5(%rip),%ymm10        # 33540 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  DB  196,98,125,24,21,139,38,2,0         ; vbroadcastss  0x2268b(%rip),%ymm10        # 32f14 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
   DB  196,65,60,88,194                    ; vaddps        %ymm10,%ymm8,%ymm8
   DB  196,65,52,89,192                    ; vmulps        %ymm8,%ymm9,%ymm8
   DB  197,124,17,128,64,1,0,0             ; vmovups       %ymm8,0x140(%rax)
@@ -15598,19 +15459,19 @@
 PUBLIC _sk_bicubic_n1y_avx
 _sk_bicubic_n1y_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,13,132,42,2,0        ; vbroadcastss  0x22a84(%rip),%ymm1        # 33610 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  DB  196,226,125,24,13,58,39,2,0         ; vbroadcastss  0x2273a(%rip),%ymm1        # 32fe4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   DB  197,244,88,72,64                    ; vaddps        0x40(%rax),%ymm1,%ymm1
-  DB  196,98,125,24,5,50,41,2,0           ; vbroadcastss  0x22932(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,232,37,2,0          ; vbroadcastss  0x225e8(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,128,192,0,0,0             ; vsubps        0xc0(%rax),%ymm8,%ymm8
-  DB  196,98,125,24,13,117,42,2,0         ; vbroadcastss  0x22a75(%rip),%ymm9        # 33620 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  DB  196,98,125,24,13,43,39,2,0          ; vbroadcastss  0x2272b(%rip),%ymm9        # 32ff4 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
   DB  196,65,60,89,201                    ; vmulps        %ymm9,%ymm8,%ymm9
-  DB  196,98,125,24,21,99,42,2,0          ; vbroadcastss  0x22a63(%rip),%ymm10        # 3361c <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  DB  196,98,125,24,21,25,39,2,0          ; vbroadcastss  0x22719(%rip),%ymm10        # 32ff0 <_sk_srcover_bgra_8888_sse2_lowp+0x400>
   DB  196,65,52,88,202                    ; vaddps        %ymm10,%ymm9,%ymm9
   DB  196,65,60,89,201                    ; vmulps        %ymm9,%ymm8,%ymm9
-  DB  196,98,125,24,21,252,40,2,0         ; vbroadcastss  0x228fc(%rip),%ymm10        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,21,178,37,2,0         ; vbroadcastss  0x225b2(%rip),%ymm10        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,65,52,88,202                    ; vaddps        %ymm10,%ymm9,%ymm9
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
-  DB  196,98,125,24,13,69,42,2,0          ; vbroadcastss  0x22a45(%rip),%ymm9        # 33624 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
+  DB  196,98,125,24,13,251,38,2,0         ; vbroadcastss  0x226fb(%rip),%ymm9        # 32ff8 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
   DB  196,65,60,88,193                    ; vaddps        %ymm9,%ymm8,%ymm8
   DB  197,124,17,128,64,1,0,0             ; vmovups       %ymm8,0x140(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -15619,17 +15480,17 @@
 PUBLIC _sk_bicubic_p1y_avx
 _sk_bicubic_p1y_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,98,125,24,5,205,40,2,0          ; vbroadcastss  0x228cd(%rip),%ymm8        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,5,131,37,2,0          ; vbroadcastss  0x22583(%rip),%ymm8        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  197,188,88,72,64                    ; vaddps        0x40(%rax),%ymm8,%ymm1
   DB  197,124,16,136,192,0,0,0            ; vmovups       0xc0(%rax),%ymm9
-  DB  196,98,125,24,21,15,42,2,0          ; vbroadcastss  0x22a0f(%rip),%ymm10        # 33620 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
+  DB  196,98,125,24,21,197,38,2,0         ; vbroadcastss  0x226c5(%rip),%ymm10        # 32ff4 <_sk_srcover_bgra_8888_sse2_lowp+0x404>
   DB  196,65,52,89,210                    ; vmulps        %ymm10,%ymm9,%ymm10
-  DB  196,98,125,24,29,253,41,2,0         ; vbroadcastss  0x229fd(%rip),%ymm11        # 3361c <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  DB  196,98,125,24,29,179,38,2,0         ; vbroadcastss  0x226b3(%rip),%ymm11        # 32ff0 <_sk_srcover_bgra_8888_sse2_lowp+0x400>
   DB  196,65,44,88,211                    ; vaddps        %ymm11,%ymm10,%ymm10
   DB  196,65,52,89,210                    ; vmulps        %ymm10,%ymm9,%ymm10
   DB  196,65,44,88,192                    ; vaddps        %ymm8,%ymm10,%ymm8
   DB  196,65,52,89,192                    ; vmulps        %ymm8,%ymm9,%ymm8
-  DB  196,98,125,24,13,232,41,2,0         ; vbroadcastss  0x229e8(%rip),%ymm9        # 33624 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
+  DB  196,98,125,24,13,158,38,2,0         ; vbroadcastss  0x2269e(%rip),%ymm9        # 32ff8 <_sk_srcover_bgra_8888_sse2_lowp+0x408>
   DB  196,65,60,88,193                    ; vaddps        %ymm9,%ymm8,%ymm8
   DB  197,124,17,128,64,1,0,0             ; vmovups       %ymm8,0x140(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -15638,13 +15499,13 @@
 PUBLIC _sk_bicubic_p3y_avx
 _sk_bicubic_p3y_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,13,196,41,2,0        ; vbroadcastss  0x229c4(%rip),%ymm1        # 3361c <_sk_srcover_bgra_8888_sse2_lowp+0x400>
+  DB  196,226,125,24,13,122,38,2,0        ; vbroadcastss  0x2267a(%rip),%ymm1        # 32ff0 <_sk_srcover_bgra_8888_sse2_lowp+0x400>
   DB  197,244,88,72,64                    ; vaddps        0x40(%rax),%ymm1,%ymm1
   DB  197,124,16,128,192,0,0,0            ; vmovups       0xc0(%rax),%ymm8
   DB  196,65,60,89,200                    ; vmulps        %ymm8,%ymm8,%ymm9
-  DB  196,98,125,24,21,165,41,2,0         ; vbroadcastss  0x229a5(%rip),%ymm10        # 33618 <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
+  DB  196,98,125,24,21,91,38,2,0          ; vbroadcastss  0x2265b(%rip),%ymm10        # 32fec <_sk_srcover_bgra_8888_sse2_lowp+0x3fc>
   DB  196,65,60,89,194                    ; vmulps        %ymm10,%ymm8,%ymm8
-  DB  196,98,125,24,21,191,40,2,0         ; vbroadcastss  0x228bf(%rip),%ymm10        # 33540 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
+  DB  196,98,125,24,21,117,37,2,0         ; vbroadcastss  0x22575(%rip),%ymm10        # 32f14 <_sk_srcover_bgra_8888_sse2_lowp+0x324>
   DB  196,65,60,88,194                    ; vaddps        %ymm10,%ymm8,%ymm8
   DB  196,65,52,89,192                    ; vmulps        %ymm8,%ymm9,%ymm8
   DB  197,124,17,128,64,1,0,0             ; vmovups       %ymm8,0x140(%rax)
@@ -15780,7 +15641,7 @@
   DB  72,139,0                            ; mov           (%rax),%rax
   DB  197,217,254,207                     ; vpaddd        %xmm7,%xmm4,%xmm1
   DB  197,249,254,193                     ; vpaddd        %xmm1,%xmm0,%xmm0
-  DB  196,226,121,24,37,71,39,2,0         ; vbroadcastss  0x22747(%rip),%xmm4        # 3362c <_sk_srcover_bgra_8888_sse2_lowp+0x410>
+  DB  196,226,121,24,37,253,35,2,0        ; vbroadcastss  0x223fd(%rip),%xmm4        # 33000 <_sk_srcover_bgra_8888_sse2_lowp+0x410>
   DB  196,98,121,64,228                   ; vpmulld       %xmm4,%xmm0,%xmm12
   DB  196,226,49,64,198                   ; vpmulld       %xmm6,%xmm9,%xmm0
   DB  197,249,127,132,36,0,1,0,0          ; vmovdqa       %xmm0,0x100(%rsp)
@@ -15834,7 +15695,7 @@
   DB  196,161,122,16,60,128               ; vmovss        (%rax,%r8,4),%xmm7
   DB  196,227,73,33,247,48                ; vinsertps     $0x30,%xmm7,%xmm6,%xmm6
   DB  196,227,77,24,237,1                 ; vinsertf128   $0x1,%xmm5,%ymm6,%ymm5
-  DB  196,98,121,24,21,200,36,2,0         ; vbroadcastss  0x224c8(%rip),%xmm10        # 334d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
+  DB  196,98,121,24,21,126,33,2,0         ; vbroadcastss  0x2217e(%rip),%xmm10        # 32eac <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
   DB  196,193,105,254,210                 ; vpaddd        %xmm10,%xmm2,%xmm2
   DB  196,195,249,22,208,1                ; vpextrq       $0x1,%xmm2,%r8
   DB  196,193,249,126,209                 ; vmovq         %xmm2,%r9
@@ -15862,7 +15723,7 @@
   DB  196,161,122,16,60,128               ; vmovss        (%rax,%r8,4),%xmm7
   DB  196,227,73,33,247,48                ; vinsertps     $0x30,%xmm7,%xmm6,%xmm6
   DB  196,227,77,24,210,1                 ; vinsertf128   $0x1,%xmm2,%ymm6,%ymm2
-  DB  196,226,125,24,61,132,37,2,0        ; vbroadcastss  0x22584(%rip),%ymm7        # 33628 <_sk_srcover_bgra_8888_sse2_lowp+0x40c>
+  DB  196,226,125,24,61,58,34,2,0         ; vbroadcastss  0x2223a(%rip),%ymm7        # 32ffc <_sk_srcover_bgra_8888_sse2_lowp+0x40c>
   DB  197,148,88,247                      ; vaddps        %ymm7,%ymm13,%ymm6
   DB  197,124,40,231                      ; vmovaps       %ymm7,%ymm12
   DB  197,124,17,164,36,128,0,0,0         ; vmovups       %ymm12,0x80(%rsp)
@@ -16603,7 +16464,7 @@
   DB  197,249,127,132,36,160,0,0,0        ; vmovdqa       %xmm0,0xa0(%rsp)
   DB  197,225,254,216                     ; vpaddd        %xmm0,%xmm3,%xmm3
   DB  197,233,254,195                     ; vpaddd        %xmm3,%xmm2,%xmm0
-  DB  196,98,121,24,13,21,22,2,0          ; vbroadcastss  0x21615(%rip),%xmm9        # 3362c <_sk_srcover_bgra_8888_sse2_lowp+0x410>
+  DB  196,98,121,24,13,203,18,2,0         ; vbroadcastss  0x212cb(%rip),%xmm9        # 33000 <_sk_srcover_bgra_8888_sse2_lowp+0x410>
   DB  196,194,121,64,209                  ; vpmulld       %xmm9,%xmm0,%xmm2
   DB  196,226,81,64,199                   ; vpmulld       %xmm7,%xmm5,%xmm0
   DB  197,249,127,132,36,224,1,0,0        ; vmovdqa       %xmm0,0x1e0(%rsp)
@@ -16660,7 +16521,7 @@
   DB  196,161,122,16,60,128               ; vmovss        (%rax,%r8,4),%xmm7
   DB  196,227,73,33,247,48                ; vinsertps     $0x30,%xmm7,%xmm6,%xmm6
   DB  196,227,77,24,237,1                 ; vinsertf128   $0x1,%xmm5,%ymm6,%ymm5
-  DB  196,98,121,24,21,134,19,2,0         ; vbroadcastss  0x21386(%rip),%xmm10        # 334d8 <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
+  DB  196,98,121,24,21,60,16,2,0          ; vbroadcastss  0x2103c(%rip),%xmm10        # 32eac <_sk_srcover_bgra_8888_sse2_lowp+0x2bc>
   DB  196,193,121,254,194                 ; vpaddd        %xmm10,%xmm0,%xmm0
   DB  196,195,249,22,192,1                ; vpextrq       $0x1,%xmm0,%r8
   DB  196,193,249,126,193                 ; vmovq         %xmm0,%r9
@@ -16688,7 +16549,7 @@
   DB  196,161,122,16,52,128               ; vmovss        (%rax,%r8,4),%xmm6
   DB  196,227,105,33,214,48               ; vinsertps     $0x30,%xmm6,%xmm2,%xmm2
   DB  196,227,109,24,208,1                ; vinsertf128   $0x1,%xmm0,%ymm2,%ymm2
-  DB  196,98,125,24,37,66,20,2,0          ; vbroadcastss  0x21442(%rip),%ymm12        # 33628 <_sk_srcover_bgra_8888_sse2_lowp+0x40c>
+  DB  196,98,125,24,37,248,16,2,0         ; vbroadcastss  0x210f8(%rip),%ymm12        # 32ffc <_sk_srcover_bgra_8888_sse2_lowp+0x40c>
   DB  196,193,4,88,196                    ; vaddps        %ymm12,%ymm15,%ymm0
   DB  197,124,17,164,36,128,0,0,0         ; vmovups       %ymm12,0x80(%rsp)
   DB  197,254,91,192                      ; vcvttps2dq    %ymm0,%ymm0
@@ -18086,7 +17947,7 @@
   DB  197,228,89,210                      ; vmulps        %ymm2,%ymm3,%ymm2
   DB  197,220,88,210                      ; vaddps        %ymm2,%ymm4,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,96,245,1,0        ; vbroadcastss  0x1f560(%rip),%ymm3        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,29,22,242,1,0        ; vbroadcastss  0x1f216(%rip),%ymm3        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,252,16,164,36,192,2,0,0         ; vmovups       0x2c0(%rsp),%ymm4
   DB  197,252,16,172,36,224,2,0,0         ; vmovups       0x2e0(%rsp),%ymm5
   DB  197,252,16,180,36,0,3,0,0           ; vmovups       0x300(%rsp),%ymm6
@@ -18100,18 +17961,18 @@
 
 PUBLIC _sk_gauss_a_to_rgba_avx
 _sk_gauss_a_to_rgba_avx LABEL PROC
-  DB  196,226,125,24,5,139,246,1,0        ; vbroadcastss  0x1f68b(%rip),%ymm0        # 33634 <_sk_srcover_bgra_8888_sse2_lowp+0x418>
+  DB  196,226,125,24,5,65,243,1,0         ; vbroadcastss  0x1f341(%rip),%ymm0        # 33008 <_sk_srcover_bgra_8888_sse2_lowp+0x418>
   DB  197,228,89,192                      ; vmulps        %ymm0,%ymm3,%ymm0
-  DB  196,226,125,24,13,122,246,1,0       ; vbroadcastss  0x1f67a(%rip),%ymm1        # 33630 <_sk_srcover_bgra_8888_sse2_lowp+0x414>
+  DB  196,226,125,24,13,48,243,1,0        ; vbroadcastss  0x1f330(%rip),%ymm1        # 33004 <_sk_srcover_bgra_8888_sse2_lowp+0x414>
   DB  197,252,88,193                      ; vaddps        %ymm1,%ymm0,%ymm0
   DB  197,252,89,195                      ; vmulps        %ymm3,%ymm0,%ymm0
-  DB  196,226,125,24,13,113,246,1,0       ; vbroadcastss  0x1f671(%rip),%ymm1        # 33638 <_sk_srcover_bgra_8888_sse2_lowp+0x41c>
+  DB  196,226,125,24,13,39,243,1,0        ; vbroadcastss  0x1f327(%rip),%ymm1        # 3300c <_sk_srcover_bgra_8888_sse2_lowp+0x41c>
   DB  197,252,88,193                      ; vaddps        %ymm1,%ymm0,%ymm0
   DB  197,252,89,195                      ; vmulps        %ymm3,%ymm0,%ymm0
-  DB  196,226,125,24,13,100,246,1,0       ; vbroadcastss  0x1f664(%rip),%ymm1        # 3363c <_sk_srcover_bgra_8888_sse2_lowp+0x420>
+  DB  196,226,125,24,13,26,243,1,0        ; vbroadcastss  0x1f31a(%rip),%ymm1        # 33010 <_sk_srcover_bgra_8888_sse2_lowp+0x420>
   DB  197,252,88,193                      ; vaddps        %ymm1,%ymm0,%ymm0
   DB  197,252,89,195                      ; vmulps        %ymm3,%ymm0,%ymm0
-  DB  196,226,125,24,13,87,246,1,0        ; vbroadcastss  0x1f657(%rip),%ymm1        # 33640 <_sk_srcover_bgra_8888_sse2_lowp+0x424>
+  DB  196,226,125,24,13,13,243,1,0        ; vbroadcastss  0x1f30d(%rip),%ymm1        # 33014 <_sk_srcover_bgra_8888_sse2_lowp+0x424>
   DB  197,252,88,193                      ; vaddps        %ymm1,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,252,40,200                      ; vmovaps       %ymm0,%ymm1
@@ -18131,7 +17992,7 @@
   DB  197,252,17,108,36,96                ; vmovups       %ymm5,0x60(%rsp)
   DB  197,252,17,100,36,64                ; vmovups       %ymm4,0x40(%rsp)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,148,244,1,0       ; vbroadcastss  0x1f494(%rip),%ymm3        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,226,125,24,29,74,241,1,0        ; vbroadcastss  0x1f14a(%rip),%ymm3        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  197,252,17,132,36,192,1,0,0         ; vmovups       %ymm0,0x1c0(%rsp)
   DB  197,252,88,195                      ; vaddps        %ymm3,%ymm0,%ymm0
   DB  196,227,125,8,208,1                 ; vroundps      $0x1,%ymm0,%ymm2
@@ -18140,7 +18001,7 @@
   DB  197,244,88,203                      ; vaddps        %ymm3,%ymm1,%ymm1
   DB  196,227,125,8,209,1                 ; vroundps      $0x1,%ymm1,%ymm2
   DB  197,244,92,210                      ; vsubps        %ymm2,%ymm1,%ymm2
-  DB  196,226,125,24,13,97,244,1,0        ; vbroadcastss  0x1f461(%rip),%ymm1        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,226,125,24,13,23,241,1,0        ; vbroadcastss  0x1f117(%rip),%ymm1        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,252,17,132,36,160,1,0,0         ; vmovups       %ymm0,0x1a0(%rsp)
   DB  197,244,92,192                      ; vsubps        %ymm0,%ymm1,%ymm0
   DB  197,252,17,132,36,96,1,0,0          ; vmovups       %ymm0,0x160(%rsp)
@@ -18163,9 +18024,9 @@
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  196,226,125,24,64,8                 ; vbroadcastss  0x8(%rax),%ymm0
   DB  197,252,17,132,36,224,0,0,0         ; vmovups       %ymm0,0xe0(%rsp)
-  DB  197,250,16,5,21,245,1,0             ; vmovss        0x1f515(%rip),%xmm0        # 33610 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
-  DB  197,124,40,53,125,250,1,0           ; vmovaps       0x1fa7d(%rip),%ymm14        # 33b80 <_sk_srcover_bgra_8888_sse2_lowp+0x964>
-  DB  196,98,125,24,45,56,244,1,0         ; vbroadcastss  0x1f438(%rip),%ymm13        # 33544 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
+  DB  197,250,16,5,203,241,1,0            ; vmovss        0x1f1cb(%rip),%xmm0        # 32fe4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  DB  197,124,40,53,63,247,1,0            ; vmovaps       0x1f73f(%rip),%ymm14        # 33560 <_sk_srcover_bgra_8888_sse2_lowp+0x970>
+  DB  196,98,125,24,45,238,240,1,0        ; vbroadcastss  0x1f0ee(%rip),%ymm13        # 32f18 <_sk_srcover_bgra_8888_sse2_lowp+0x328>
   DB  197,228,87,219                      ; vxorps        %ymm3,%ymm3,%ymm3
   DB  197,236,87,210                      ; vxorps        %ymm2,%ymm2,%ymm2
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
@@ -18177,10 +18038,10 @@
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
   DB  197,252,95,201                      ; vmaxps        %ymm1,%ymm0,%ymm1
   DB  197,248,41,100,36,16                ; vmovaps       %xmm4,0x10(%rsp)
-  DB  197,248,46,37,247,244,1,0           ; vucomiss      0x1f4f7(%rip),%xmm4        # 33644 <_sk_srcover_bgra_8888_sse2_lowp+0x428>
+  DB  197,248,46,37,173,241,1,0           ; vucomiss      0x1f1ad(%rip),%xmm4        # 33018 <_sk_srcover_bgra_8888_sse2_lowp+0x428>
   DB  197,252,16,132,36,32,1,0,0          ; vmovups       0x120(%rsp),%ymm0
   DB  197,252,17,68,36,32                 ; vmovups       %ymm0,0x20(%rsp)
-  DB  119,15                              ; ja            1416d <_sk_bilerp_clamp_8888_avx+0x170>
+  DB  119,15                              ; ja            13e8b <_sk_bilerp_clamp_8888_avx+0x170>
   DB  197,252,16,132,36,192,0,0,0         ; vmovups       0xc0(%rsp),%ymm0
   DB  197,252,17,68,36,32                 ; vmovups       %ymm0,0x20(%rsp)
   DB  197,244,93,140,36,0,1,0,0           ; vminps        0x100(%rsp),%ymm1,%ymm1
@@ -18191,7 +18052,7 @@
   DB  196,226,73,64,237                   ; vpmulld       %xmm5,%xmm6,%xmm5
   DB  196,226,121,64,201                  ; vpmulld       %xmm1,%xmm0,%xmm1
   DB  196,99,117,24,253,1                 ; vinsertf128   $0x1,%xmm5,%ymm1,%ymm15
-  DB  197,122,16,37,105,244,1,0           ; vmovss        0x1f469(%rip),%xmm12        # 33610 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  DB  197,122,16,37,31,241,1,0            ; vmovss        0x1f11f(%rip),%xmm12        # 32fe4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   DB  196,195,121,4,204,0                 ; vpermilps     $0x0,%xmm12,%xmm1
   DB  196,227,117,24,201,1                ; vinsertf128   $0x1,%xmm1,%ymm1,%ymm1
   DB  197,244,88,140,36,192,1,0,0         ; vaddps        0x1c0(%rsp),%ymm1,%ymm1
@@ -18244,9 +18105,9 @@
   DB  196,227,117,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
   DB  196,193,124,89,205                  ; vmulps        %ymm13,%ymm0,%ymm1
-  DB  197,120,46,37,134,243,1,0           ; vucomiss      0x1f386(%rip),%xmm12        # 33644 <_sk_srcover_bgra_8888_sse2_lowp+0x428>
+  DB  197,120,46,37,60,240,1,0            ; vucomiss      0x1f03c(%rip),%xmm12        # 33018 <_sk_srcover_bgra_8888_sse2_lowp+0x428>
   DB  197,124,16,148,36,160,1,0,0         ; vmovups       0x1a0(%rsp),%ymm10
-  DB  119,9                               ; ja            142d2 <_sk_bilerp_clamp_8888_avx+0x2d5>
+  DB  119,9                               ; ja            13ff0 <_sk_bilerp_clamp_8888_avx+0x2d5>
   DB  197,124,16,148,36,96,1,0,0          ; vmovups       0x160(%rsp),%ymm10
   DB  197,172,89,68,36,32                 ; vmulps        0x20(%rsp),%ymm10,%ymm0
   DB  197,252,89,230                      ; vmulps        %ymm6,%ymm0,%ymm4
@@ -18257,15 +18118,15 @@
   DB  197,236,88,212                      ; vaddps        %ymm4,%ymm2,%ymm2
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
   DB  197,228,88,216                      ; vaddps        %ymm0,%ymm3,%ymm3
-  DB  197,26,88,37,203,241,1,0            ; vaddss        0x1f1cb(%rip),%xmm12,%xmm12        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
-  DB  197,250,16,5,191,241,1,0            ; vmovss        0x1f1bf(%rip),%xmm0        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  197,26,88,37,129,238,1,0            ; vaddss        0x1ee81(%rip),%xmm12,%xmm12        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  197,250,16,5,117,238,1,0            ; vmovss        0x1ee75(%rip),%xmm0        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,193,120,46,196                  ; vucomiss      %xmm12,%xmm0
-  DB  15,131,147,254,255,255              ; jae           141a7 <_sk_bilerp_clamp_8888_avx+0x1aa>
+  DB  15,131,147,254,255,255              ; jae           13ec5 <_sk_bilerp_clamp_8888_avx+0x1aa>
   DB  197,248,40,100,36,16                ; vmovaps       0x10(%rsp),%xmm4
-  DB  197,218,88,37,170,241,1,0           ; vaddss        0x1f1aa(%rip),%xmm4,%xmm4        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
-  DB  197,250,16,5,158,241,1,0            ; vmovss        0x1f19e(%rip),%xmm0        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  197,218,88,37,96,238,1,0            ; vaddss        0x1ee60(%rip),%xmm4,%xmm4        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  197,250,16,5,84,238,1,0             ; vmovss        0x1ee54(%rip),%xmm0        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  197,248,46,196                      ; vucomiss      %xmm4,%xmm0
-  DB  15,131,238,253,255,255              ; jae           14122 <_sk_bilerp_clamp_8888_avx+0x125>
+  DB  15,131,238,253,255,255              ; jae           13e40 <_sk_bilerp_clamp_8888_avx+0x125>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,124,41,200                      ; vmovaps       %ymm9,%ymm0
   DB  197,124,41,193                      ; vmovaps       %ymm8,%ymm1
@@ -18311,13 +18172,13 @@
   DB  73,137,246                          ; mov           %rsi,%r14
   DB  76,137,141,8,255,255,255            ; mov           %r9,-0xf8(%rbp)
   DB  76,57,203                           ; cmp           %r9,%rbx
-  DB  15,131,153,0,0,0                    ; jae           14486 <_sk_start_pipeline_sse41+0x11a>
+  DB  15,131,153,0,0,0                    ; jae           141a4 <_sk_start_pipeline_sse41+0x11a>
   DB  72,139,133,24,255,255,255           ; mov           -0xe8(%rbp),%rax
   DB  72,141,64,4                         ; lea           0x4(%rax),%rax
   DB  72,137,133,16,255,255,255           ; mov           %rax,-0xf0(%rbp)
   DB  76,57,189,16,255,255,255            ; cmp           %r15,-0xf0(%rbp)
   DB  72,139,149,24,255,255,255           ; mov           -0xe8(%rbp),%rdx
-  DB  119,62                              ; ja            1444d <_sk_start_pipeline_sse41+0xe1>
+  DB  119,62                              ; ja            1416b <_sk_start_pipeline_sse41+0xe1>
   DB  76,139,165,24,255,255,255           ; mov           -0xe8(%rbp),%r12
   DB  49,255                              ; xor           %edi,%edi
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
@@ -18336,10 +18197,10 @@
   DB  73,131,196,8                        ; add           $0x8,%r12
   DB  77,57,252                           ; cmp           %r15,%r12
   DB  73,137,212                          ; mov           %rdx,%r12
-  DB  118,201                             ; jbe           14416 <_sk_start_pipeline_sse41+0xaa>
+  DB  118,201                             ; jbe           14134 <_sk_start_pipeline_sse41+0xaa>
   DB  76,137,255                          ; mov           %r15,%rdi
   DB  72,41,215                           ; sub           %rdx,%rdi
-  DB  116,33                              ; je            14476 <_sk_start_pipeline_sse41+0x10a>
+  DB  116,33                              ; je            14194 <_sk_start_pipeline_sse41+0x10a>
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  15,87,201                           ; xorps         %xmm1,%xmm1
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
@@ -18353,7 +18214,7 @@
   DB  65,255,213                          ; callq         *%r13
   DB  72,255,195                          ; inc           %rbx
   DB  72,59,157,8,255,255,255             ; cmp           -0xf8(%rbp),%rbx
-  DB  15,133,121,255,255,255              ; jne           143ff <_sk_start_pipeline_sse41+0x93>
+  DB  15,133,121,255,255,255              ; jne           1411d <_sk_start_pipeline_sse41+0x93>
   DB  15,40,181,32,255,255,255            ; movaps        -0xe0(%rbp),%xmm6
   DB  15,40,189,48,255,255,255            ; movaps        -0xd0(%rbp),%xmm7
   DB  68,15,40,133,64,255,255,255         ; movaps        -0xc0(%rbp),%xmm8
@@ -18390,9 +18251,9 @@
   DB  102,15,110,201                      ; movd          %ecx,%xmm1
   DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
-  DB  15,88,13,124,249,1,0                ; addps         0x1f97c(%rip),%xmm1        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  15,88,13,62,246,1,0                 ; addps         0x1f63e(%rip),%xmm1        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,21,131,249,1,0                ; movaps        0x1f983(%rip),%xmm2        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,21,69,246,1,0                 ; movaps        0x1f645(%rip),%xmm2        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
   DB  15,87,228                           ; xorps         %xmm4,%xmm4
   DB  15,87,237                           ; xorps         %xmm5,%xmm5
@@ -18405,18 +18266,18 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  102,68,15,110,194                   ; movd          %edx,%xmm8
   DB  102,69,15,112,192,0                 ; pshufd        $0x0,%xmm8,%xmm8
-  DB  102,68,15,254,5,44,249,1,0          ; paddd         0x1f92c(%rip),%xmm8        # 33e60 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  DB  102,68,15,254,5,238,245,1,0         ; paddd         0x1f5ee(%rip),%xmm8        # 33840 <_sk_srcover_bgra_8888_sse2_lowp+0xc50>
   DB  102,68,15,110,201                   ; movd          %ecx,%xmm9
   DB  102,69,15,112,201,0                 ; pshufd        $0x0,%xmm9,%xmm9
   DB  102,69,15,239,200                   ; pxor          %xmm8,%xmm9
-  DB  102,68,15,111,21,83,249,1,0         ; movdqa        0x1f953(%rip),%xmm10        # 33ea0 <_sk_srcover_bgra_8888_sse2_lowp+0xc84>
+  DB  102,68,15,111,21,21,246,1,0         ; movdqa        0x1f615(%rip),%xmm10        # 33880 <_sk_srcover_bgra_8888_sse2_lowp+0xc90>
   DB  102,69,15,111,217                   ; movdqa        %xmm9,%xmm11
   DB  102,69,15,219,218                   ; pand          %xmm10,%xmm11
   DB  102,65,15,114,243,5                 ; pslld         $0x5,%xmm11
   DB  102,69,15,219,208                   ; pand          %xmm8,%xmm10
   DB  102,65,15,114,242,4                 ; pslld         $0x4,%xmm10
-  DB  102,68,15,111,37,63,249,1,0         ; movdqa        0x1f93f(%rip),%xmm12        # 33eb0 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
-  DB  102,68,15,111,45,70,249,1,0         ; movdqa        0x1f946(%rip),%xmm13        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,68,15,111,37,1,246,1,0          ; movdqa        0x1f601(%rip),%xmm12        # 33890 <_sk_srcover_bgra_8888_sse2_lowp+0xca0>
+  DB  102,68,15,111,45,8,246,1,0          ; movdqa        0x1f608(%rip),%xmm13        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,69,15,111,241                   ; movdqa        %xmm9,%xmm14
   DB  102,69,15,219,245                   ; pand          %xmm13,%xmm14
   DB  102,65,15,114,246,2                 ; pslld         $0x2,%xmm14
@@ -18432,8 +18293,8 @@
   DB  102,69,15,235,198                   ; por           %xmm14,%xmm8
   DB  102,69,15,235,193                   ; por           %xmm9,%xmm8
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
-  DB  68,15,89,5,1,249,1,0                ; mulps         0x1f901(%rip),%xmm8        # 33ed0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
-  DB  68,15,88,5,9,249,1,0                ; addps         0x1f909(%rip),%xmm8        # 33ee0 <_sk_srcover_bgra_8888_sse2_lowp+0xcc4>
+  DB  68,15,89,5,195,245,1,0              ; mulps         0x1f5c3(%rip),%xmm8        # 338b0 <_sk_srcover_bgra_8888_sse2_lowp+0xcc0>
+  DB  68,15,88,5,203,245,1,0              ; addps         0x1f5cb(%rip),%xmm8        # 338c0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd0>
   DB  243,68,15,16,16                     ; movss         (%rax),%xmm10
   DB  69,15,198,210,0                     ; shufps        $0x0,%xmm10,%xmm10
   DB  69,15,89,208                        ; mulps         %xmm8,%xmm10
@@ -18471,7 +18332,7 @@
 PUBLIC _sk_black_color_sse41
 _sk_black_color_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,63,248,1,0                 ; movaps        0x1f83f(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,29,1,245,1,0                  ; movaps        0x1f501(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  15,87,201                           ; xorps         %xmm1,%xmm1
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
@@ -18480,7 +18341,7 @@
 PUBLIC _sk_white_color_sse41
 _sk_white_color_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,5,43,248,1,0                  ; movaps        0x1f82b(%rip),%xmm0        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,5,237,244,1,0                 ; movaps        0x1f4ed(%rip),%xmm0        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  15,40,216                           ; movaps        %xmm0,%xmm3
@@ -18518,7 +18379,7 @@
 PUBLIC _sk_srcatop_sse41
 _sk_srcatop_sse41 LABEL PROC
   DB  15,89,199                           ; mulps         %xmm7,%xmm0
-  DB  68,15,40,5,219,247,1,0              ; movaps        0x1f7db(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,157,244,1,0              ; movaps        0x1f49d(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,92,195                        ; subps         %xmm3,%xmm8
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  68,15,89,204                        ; mulps         %xmm4,%xmm9
@@ -18541,7 +18402,7 @@
 _sk_dstatop_sse41 LABEL PROC
   DB  68,15,40,195                        ; movaps        %xmm3,%xmm8
   DB  68,15,89,196                        ; mulps         %xmm4,%xmm8
-  DB  68,15,40,13,142,247,1,0             ; movaps        0x1f78e(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,13,80,244,1,0              ; movaps        0x1f450(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,92,207                        ; subps         %xmm7,%xmm9
   DB  65,15,89,193                        ; mulps         %xmm9,%xmm0
   DB  65,15,88,192                        ; addps         %xmm8,%xmm0
@@ -18582,7 +18443,7 @@
 
 PUBLIC _sk_srcout_sse41
 _sk_srcout_sse41 LABEL PROC
-  DB  68,15,40,5,34,247,1,0               ; movaps        0x1f722(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,228,243,1,0              ; movaps        0x1f3e4(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,92,199                        ; subps         %xmm7,%xmm8
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  65,15,89,200                        ; mulps         %xmm8,%xmm1
@@ -18593,7 +18454,7 @@
 
 PUBLIC _sk_dstout_sse41
 _sk_dstout_sse41 LABEL PROC
-  DB  68,15,40,5,2,247,1,0                ; movaps        0x1f702(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,196,243,1,0              ; movaps        0x1f3c4(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,92,195                        ; subps         %xmm3,%xmm8
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  15,89,196                           ; mulps         %xmm4,%xmm0
@@ -18608,7 +18469,7 @@
 
 PUBLIC _sk_srcover_sse41
 _sk_srcover_sse41 LABEL PROC
-  DB  68,15,40,5,213,246,1,0              ; movaps        0x1f6d5(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,151,243,1,0              ; movaps        0x1f397(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,92,195                        ; subps         %xmm3,%xmm8
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  68,15,89,204                        ; mulps         %xmm4,%xmm9
@@ -18626,7 +18487,7 @@
 
 PUBLIC _sk_dstover_sse41
 _sk_dstover_sse41 LABEL PROC
-  DB  68,15,40,5,153,246,1,0              ; movaps        0x1f699(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,91,243,1,0               ; movaps        0x1f35b(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,92,199                        ; subps         %xmm7,%xmm8
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  15,88,196                           ; addps         %xmm4,%xmm0
@@ -18650,7 +18511,7 @@
 
 PUBLIC _sk_multiply_sse41
 _sk_multiply_sse41 LABEL PROC
-  DB  68,15,40,5,93,246,1,0               ; movaps        0x1f65d(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,31,243,1,0               ; movaps        0x1f31f(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  68,15,92,207                        ; subps         %xmm7,%xmm9
   DB  69,15,40,209                        ; movaps        %xmm9,%xmm10
@@ -18686,7 +18547,7 @@
 PUBLIC _sk_plus__sse41
 _sk_plus__sse41 LABEL PROC
   DB  15,88,196                           ; addps         %xmm4,%xmm0
-  DB  68,15,40,5,222,245,1,0              ; movaps        0x1f5de(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,160,242,1,0              ; movaps        0x1f2a0(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  65,15,93,192                        ; minps         %xmm8,%xmm0
   DB  15,88,205                           ; addps         %xmm5,%xmm1
   DB  65,15,93,200                        ; minps         %xmm8,%xmm1
@@ -18724,7 +18585,7 @@
 PUBLIC _sk_xor__sse41
 _sk_xor__sse41 LABEL PROC
   DB  68,15,40,195                        ; movaps        %xmm3,%xmm8
-  DB  15,40,29,106,245,1,0                ; movaps        0x1f56a(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,29,44,242,1,0                 ; movaps        0x1f22c(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,40,203                        ; movaps        %xmm3,%xmm9
   DB  68,15,92,207                        ; subps         %xmm7,%xmm9
   DB  65,15,89,193                        ; mulps         %xmm9,%xmm0
@@ -18770,7 +18631,7 @@
   DB  68,15,89,206                        ; mulps         %xmm6,%xmm9
   DB  65,15,95,209                        ; maxps         %xmm9,%xmm2
   DB  68,15,92,194                        ; subps         %xmm2,%xmm8
-  DB  15,40,21,197,244,1,0                ; movaps        0x1f4c5(%rip),%xmm2        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,21,135,241,1,0                ; movaps        0x1f187(%rip),%xmm2        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,92,211                           ; subps         %xmm3,%xmm2
   DB  15,89,215                           ; mulps         %xmm7,%xmm2
   DB  15,88,218                           ; addps         %xmm2,%xmm3
@@ -18802,7 +18663,7 @@
   DB  68,15,89,206                        ; mulps         %xmm6,%xmm9
   DB  65,15,93,209                        ; minps         %xmm9,%xmm2
   DB  68,15,92,194                        ; subps         %xmm2,%xmm8
-  DB  15,40,21,90,244,1,0                 ; movaps        0x1f45a(%rip),%xmm2        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,21,28,241,1,0                 ; movaps        0x1f11c(%rip),%xmm2        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,92,211                           ; subps         %xmm3,%xmm2
   DB  15,89,215                           ; mulps         %xmm7,%xmm2
   DB  15,88,218                           ; addps         %xmm2,%xmm3
@@ -18837,7 +18698,7 @@
   DB  65,15,93,209                        ; minps         %xmm9,%xmm2
   DB  15,88,210                           ; addps         %xmm2,%xmm2
   DB  68,15,92,194                        ; subps         %xmm2,%xmm8
-  DB  15,40,21,228,243,1,0                ; movaps        0x1f3e4(%rip),%xmm2        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,21,166,240,1,0                ; movaps        0x1f0a6(%rip),%xmm2        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,92,211                           ; subps         %xmm3,%xmm2
   DB  15,89,215                           ; mulps         %xmm7,%xmm2
   DB  15,88,218                           ; addps         %xmm2,%xmm3
@@ -18863,7 +18724,7 @@
   DB  15,89,214                           ; mulps         %xmm6,%xmm2
   DB  15,88,210                           ; addps         %xmm2,%xmm2
   DB  68,15,92,194                        ; subps         %xmm2,%xmm8
-  DB  15,40,21,148,243,1,0                ; movaps        0x1f394(%rip),%xmm2        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,21,86,240,1,0                 ; movaps        0x1f056(%rip),%xmm2        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,92,211                           ; subps         %xmm3,%xmm2
   DB  15,89,215                           ; mulps         %xmm7,%xmm2
   DB  15,88,218                           ; addps         %xmm2,%xmm3
@@ -18873,7 +18734,7 @@
 
 PUBLIC _sk_colorburn_sse41
 _sk_colorburn_sse41 LABEL PROC
-  DB  68,15,40,29,123,243,1,0             ; movaps        0x1f37b(%rip),%xmm11        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,29,61,240,1,0              ; movaps        0x1f03d(%rip),%xmm11        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,40,227                        ; movaps        %xmm11,%xmm12
   DB  68,15,92,231                        ; subps         %xmm7,%xmm12
   DB  69,15,40,204                        ; movaps        %xmm12,%xmm9
@@ -18955,7 +18816,7 @@
 PUBLIC _sk_colordodge_sse41
 _sk_colordodge_sse41 LABEL PROC
   DB  68,15,40,192                        ; movaps        %xmm0,%xmm8
-  DB  68,15,40,21,69,242,1,0              ; movaps        0x1f245(%rip),%xmm10        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,21,7,239,1,0               ; movaps        0x1ef07(%rip),%xmm10        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,40,218                        ; movaps        %xmm10,%xmm11
   DB  68,15,92,223                        ; subps         %xmm7,%xmm11
   DB  69,15,40,227                        ; movaps        %xmm11,%xmm12
@@ -19036,7 +18897,7 @@
   DB  15,40,244                           ; movaps        %xmm4,%xmm6
   DB  15,40,227                           ; movaps        %xmm3,%xmm4
   DB  68,15,40,200                        ; movaps        %xmm0,%xmm9
-  DB  68,15,40,21,13,241,1,0              ; movaps        0x1f10d(%rip),%xmm10        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,21,207,237,1,0             ; movaps        0x1edcf(%rip),%xmm10        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  65,15,40,234                        ; movaps        %xmm10,%xmm5
   DB  15,92,239                           ; subps         %xmm7,%xmm5
   DB  15,40,197                           ; movaps        %xmm5,%xmm0
@@ -19118,7 +18979,7 @@
 _sk_overlay_sse41 LABEL PROC
   DB  68,15,40,201                        ; movaps        %xmm1,%xmm9
   DB  68,15,40,240                        ; movaps        %xmm0,%xmm14
-  DB  68,15,40,21,223,239,1,0             ; movaps        0x1efdf(%rip),%xmm10        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,21,161,236,1,0             ; movaps        0x1eca1(%rip),%xmm10        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,40,218                        ; movaps        %xmm10,%xmm11
   DB  68,15,92,223                        ; subps         %xmm7,%xmm11
   DB  65,15,40,195                        ; movaps        %xmm11,%xmm0
@@ -19202,7 +19063,7 @@
   DB  15,40,198                           ; movaps        %xmm6,%xmm0
   DB  15,94,199                           ; divps         %xmm7,%xmm0
   DB  65,15,84,193                        ; andps         %xmm9,%xmm0
-  DB  15,40,13,162,238,1,0                ; movaps        0x1eea2(%rip),%xmm1        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,13,100,235,1,0                ; movaps        0x1eb64(%rip),%xmm1        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,40,209                        ; movaps        %xmm1,%xmm10
   DB  68,15,92,208                        ; subps         %xmm0,%xmm10
   DB  68,15,40,240                        ; movaps        %xmm0,%xmm14
@@ -19215,10 +19076,10 @@
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  15,89,210                           ; mulps         %xmm2,%xmm2
   DB  15,88,208                           ; addps         %xmm0,%xmm2
-  DB  68,15,40,45,208,238,1,0             ; movaps        0x1eed0(%rip),%xmm13        # 33ef0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  DB  68,15,40,45,146,235,1,0             ; movaps        0x1eb92(%rip),%xmm13        # 338d0 <_sk_srcover_bgra_8888_sse2_lowp+0xce0>
   DB  69,15,88,245                        ; addps         %xmm13,%xmm14
   DB  68,15,89,242                        ; mulps         %xmm2,%xmm14
-  DB  68,15,40,37,208,238,1,0             ; movaps        0x1eed0(%rip),%xmm12        # 33f00 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
+  DB  68,15,40,37,146,235,1,0             ; movaps        0x1eb92(%rip),%xmm12        # 338e0 <_sk_srcover_bgra_8888_sse2_lowp+0xcf0>
   DB  69,15,89,252                        ; mulps         %xmm12,%xmm15
   DB  69,15,88,254                        ; addps         %xmm14,%xmm15
   DB  15,40,198                           ; movaps        %xmm6,%xmm0
@@ -19404,12 +19265,12 @@
   DB  68,15,84,208                        ; andps         %xmm0,%xmm10
   DB  15,84,200                           ; andps         %xmm0,%xmm1
   DB  68,15,84,232                        ; andps         %xmm0,%xmm13
-  DB  15,40,5,54,236,1,0                  ; movaps        0x1ec36(%rip),%xmm0        # 33f10 <_sk_srcover_bgra_8888_sse2_lowp+0xcf4>
+  DB  15,40,5,248,232,1,0                 ; movaps        0x1e8f8(%rip),%xmm0        # 338f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd00>
   DB  68,15,89,224                        ; mulps         %xmm0,%xmm12
-  DB  15,40,21,59,236,1,0                 ; movaps        0x1ec3b(%rip),%xmm2        # 33f20 <_sk_srcover_bgra_8888_sse2_lowp+0xd04>
+  DB  15,40,21,253,232,1,0                ; movaps        0x1e8fd(%rip),%xmm2        # 33900 <_sk_srcover_bgra_8888_sse2_lowp+0xd10>
   DB  15,89,250                           ; mulps         %xmm2,%xmm7
   DB  65,15,88,252                        ; addps         %xmm12,%xmm7
-  DB  68,15,40,53,60,236,1,0              ; movaps        0x1ec3c(%rip),%xmm14        # 33f30 <_sk_srcover_bgra_8888_sse2_lowp+0xd14>
+  DB  68,15,40,53,254,232,1,0             ; movaps        0x1e8fe(%rip),%xmm14        # 33910 <_sk_srcover_bgra_8888_sse2_lowp+0xd20>
   DB  68,15,40,252                        ; movaps        %xmm4,%xmm15
   DB  69,15,89,254                        ; mulps         %xmm14,%xmm15
   DB  68,15,88,255                        ; addps         %xmm7,%xmm15
@@ -19492,7 +19353,7 @@
   DB  65,15,88,214                        ; addps         %xmm14,%xmm2
   DB  15,40,196                           ; movaps        %xmm4,%xmm0
   DB  102,15,56,20,202                    ; blendvps      %xmm0,%xmm2,%xmm1
-  DB  68,15,40,13,81,234,1,0              ; movaps        0x1ea51(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,13,19,231,1,0              ; movaps        0x1e713(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  65,15,40,225                        ; movaps        %xmm9,%xmm4
   DB  15,92,229                           ; subps         %xmm5,%xmm4
   DB  15,40,68,36,48                      ; movaps        0x30(%rsp),%xmm0
@@ -19586,14 +19447,14 @@
   DB  68,15,84,215                        ; andps         %xmm7,%xmm10
   DB  68,15,84,223                        ; andps         %xmm7,%xmm11
   DB  68,15,84,199                        ; andps         %xmm7,%xmm8
-  DB  15,40,21,116,233,1,0                ; movaps        0x1e974(%rip),%xmm2        # 33f10 <_sk_srcover_bgra_8888_sse2_lowp+0xcf4>
+  DB  15,40,21,54,230,1,0                 ; movaps        0x1e636(%rip),%xmm2        # 338f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd00>
   DB  15,40,221                           ; movaps        %xmm5,%xmm3
   DB  15,89,218                           ; mulps         %xmm2,%xmm3
-  DB  15,40,13,119,233,1,0                ; movaps        0x1e977(%rip),%xmm1        # 33f20 <_sk_srcover_bgra_8888_sse2_lowp+0xd04>
+  DB  15,40,13,57,230,1,0                 ; movaps        0x1e639(%rip),%xmm1        # 33900 <_sk_srcover_bgra_8888_sse2_lowp+0xd10>
   DB  15,40,254                           ; movaps        %xmm6,%xmm7
   DB  15,89,249                           ; mulps         %xmm1,%xmm7
   DB  15,88,251                           ; addps         %xmm3,%xmm7
-  DB  68,15,40,45,118,233,1,0             ; movaps        0x1e976(%rip),%xmm13        # 33f30 <_sk_srcover_bgra_8888_sse2_lowp+0xd14>
+  DB  68,15,40,45,56,230,1,0              ; movaps        0x1e638(%rip),%xmm13        # 33910 <_sk_srcover_bgra_8888_sse2_lowp+0xd20>
   DB  69,15,89,245                        ; mulps         %xmm13,%xmm14
   DB  68,15,88,247                        ; addps         %xmm7,%xmm14
   DB  65,15,40,218                        ; movaps        %xmm10,%xmm3
@@ -19674,7 +19535,7 @@
   DB  65,15,88,253                        ; addps         %xmm13,%xmm7
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  102,68,15,56,20,223                 ; blendvps      %xmm0,%xmm7,%xmm11
-  DB  68,15,40,13,140,231,1,0             ; movaps        0x1e78c(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,13,78,228,1,0              ; movaps        0x1e44e(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,40,193                        ; movaps        %xmm9,%xmm8
   DB  68,15,92,204                        ; subps         %xmm4,%xmm9
   DB  15,40,60,36                         ; movaps        (%rsp),%xmm7
@@ -19729,14 +19590,14 @@
   DB  15,40,231                           ; movaps        %xmm7,%xmm4
   DB  68,15,89,244                        ; mulps         %xmm4,%xmm14
   DB  15,89,204                           ; mulps         %xmm4,%xmm1
-  DB  68,15,40,13,65,231,1,0              ; movaps        0x1e741(%rip),%xmm9        # 33f10 <_sk_srcover_bgra_8888_sse2_lowp+0xcf4>
+  DB  68,15,40,13,3,228,1,0               ; movaps        0x1e403(%rip),%xmm9        # 338f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd00>
   DB  65,15,40,250                        ; movaps        %xmm10,%xmm7
   DB  65,15,89,249                        ; mulps         %xmm9,%xmm7
-  DB  68,15,40,21,65,231,1,0              ; movaps        0x1e741(%rip),%xmm10        # 33f20 <_sk_srcover_bgra_8888_sse2_lowp+0xd04>
+  DB  68,15,40,21,3,228,1,0               ; movaps        0x1e403(%rip),%xmm10        # 33900 <_sk_srcover_bgra_8888_sse2_lowp+0xd10>
   DB  65,15,40,219                        ; movaps        %xmm11,%xmm3
   DB  65,15,89,218                        ; mulps         %xmm10,%xmm3
   DB  15,88,223                           ; addps         %xmm7,%xmm3
-  DB  68,15,40,29,62,231,1,0              ; movaps        0x1e73e(%rip),%xmm11        # 33f30 <_sk_srcover_bgra_8888_sse2_lowp+0xd14>
+  DB  68,15,40,29,0,228,1,0               ; movaps        0x1e400(%rip),%xmm11        # 33910 <_sk_srcover_bgra_8888_sse2_lowp+0xd20>
   DB  69,15,40,236                        ; movaps        %xmm12,%xmm13
   DB  69,15,89,235                        ; mulps         %xmm11,%xmm13
   DB  68,15,88,235                        ; addps         %xmm3,%xmm13
@@ -19821,7 +19682,7 @@
   DB  65,15,88,251                        ; addps         %xmm11,%xmm7
   DB  65,15,40,194                        ; movaps        %xmm10,%xmm0
   DB  102,15,56,20,207                    ; blendvps      %xmm0,%xmm7,%xmm1
-  DB  68,15,40,13,74,229,1,0              ; movaps        0x1e54a(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,13,12,226,1,0              ; movaps        0x1e20c(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
   DB  15,92,196                           ; subps         %xmm4,%xmm0
   DB  68,15,89,192                        ; mulps         %xmm0,%xmm8
@@ -19873,13 +19734,13 @@
   DB  69,15,89,216                        ; mulps         %xmm8,%xmm11
   DB  68,15,40,203                        ; movaps        %xmm3,%xmm9
   DB  68,15,89,205                        ; mulps         %xmm5,%xmm9
-  DB  68,15,40,5,12,229,1,0               ; movaps        0x1e50c(%rip),%xmm8        # 33f10 <_sk_srcover_bgra_8888_sse2_lowp+0xcf4>
+  DB  68,15,40,5,206,225,1,0              ; movaps        0x1e1ce(%rip),%xmm8        # 338f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd00>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
-  DB  68,15,40,21,16,229,1,0              ; movaps        0x1e510(%rip),%xmm10        # 33f20 <_sk_srcover_bgra_8888_sse2_lowp+0xd04>
+  DB  68,15,40,21,210,225,1,0             ; movaps        0x1e1d2(%rip),%xmm10        # 33900 <_sk_srcover_bgra_8888_sse2_lowp+0xd10>
   DB  15,40,233                           ; movaps        %xmm1,%xmm5
   DB  65,15,89,234                        ; mulps         %xmm10,%xmm5
   DB  15,88,232                           ; addps         %xmm0,%xmm5
-  DB  68,15,40,37,14,229,1,0              ; movaps        0x1e50e(%rip),%xmm12        # 33f30 <_sk_srcover_bgra_8888_sse2_lowp+0xd14>
+  DB  68,15,40,37,208,225,1,0             ; movaps        0x1e1d0(%rip),%xmm12        # 33910 <_sk_srcover_bgra_8888_sse2_lowp+0xd20>
   DB  68,15,40,242                        ; movaps        %xmm2,%xmm14
   DB  69,15,89,244                        ; mulps         %xmm12,%xmm14
   DB  68,15,88,245                        ; addps         %xmm5,%xmm14
@@ -19964,7 +19825,7 @@
   DB  65,15,88,244                        ; addps         %xmm12,%xmm6
   DB  65,15,40,195                        ; movaps        %xmm11,%xmm0
   DB  102,68,15,56,20,206                 ; blendvps      %xmm0,%xmm6,%xmm9
-  DB  15,40,5,20,227,1,0                  ; movaps        0x1e314(%rip),%xmm0        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,5,214,223,1,0                 ; movaps        0x1dfd6(%rip),%xmm0        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  15,92,215                           ; subps         %xmm7,%xmm2
   DB  15,89,226                           ; mulps         %xmm2,%xmm4
@@ -20002,31 +19863,29 @@
 _sk_srcover_rgba_8888_sse41 LABEL PROC
   DB  102,68,15,111,200                   ; movdqa        %xmm0,%xmm9
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,0,1,0,0                      ; jne           15d11 <_sk_srcover_rgba_8888_sse41+0x125>
-  DB  243,65,15,111,4,128                 ; movdqu        (%r8,%rax,4),%xmm0
+  DB  15,133,0,1,0,0                      ; jne           15a29 <_sk_srcover_rgba_8888_sse41+0x11f>
+  DB  243,65,15,111,4,144                 ; movdqu        (%r8,%rdx,4),%xmm0
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  102,15,111,37,30,227,1,0            ; movdqa        0x1e31e(%rip),%xmm4        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  102,15,111,37,230,223,1,0           ; movdqa        0x1dfe6(%rip),%xmm4        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  102,15,219,224                      ; pand          %xmm0,%xmm4
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
   DB  102,15,111,232                      ; movdqa        %xmm0,%xmm5
-  DB  102,15,56,0,45,26,227,1,0           ; pshufb        0x1e31a(%rip),%xmm5        # 33f50 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
+  DB  102,15,56,0,45,226,223,1,0          ; pshufb        0x1dfe2(%rip),%xmm5        # 33930 <_sk_srcover_bgra_8888_sse2_lowp+0xd40>
   DB  15,91,237                           ; cvtdq2ps      %xmm5,%xmm5
   DB  102,15,111,240                      ; movdqa        %xmm0,%xmm6
-  DB  102,15,56,0,53,26,227,1,0           ; pshufb        0x1e31a(%rip),%xmm6        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
+  DB  102,15,56,0,53,226,223,1,0          ; pshufb        0x1dfe2(%rip),%xmm6        # 33940 <_sk_srcover_bgra_8888_sse2_lowp+0xd50>
   DB  69,15,87,219                        ; xorps         %xmm11,%xmm11
   DB  15,91,246                           ; cvtdq2ps      %xmm6,%xmm6
   DB  102,15,114,208,24                   ; psrld         $0x18,%xmm0
   DB  15,91,248                           ; cvtdq2ps      %xmm0,%xmm7
-  DB  68,15,40,5,51,226,1,0               ; movaps        0x1e233(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,251,222,1,0              ; movaps        0x1defb(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,92,195                        ; subps         %xmm3,%xmm8
-  DB  68,15,40,37,7,227,1,0               ; movaps        0x1e307(%rip),%xmm12        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  DB  68,15,40,37,207,223,1,0             ; movaps        0x1dfcf(%rip),%xmm12        # 33950 <_sk_srcover_bgra_8888_sse2_lowp+0xd60>
   DB  69,15,89,204                        ; mulps         %xmm12,%xmm9
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  15,89,196                           ; mulps         %xmm4,%xmm0
@@ -20063,72 +19922,70 @@
   DB  102,15,114,241,24                   ; pslld         $0x18,%xmm1
   DB  102,15,235,203                      ; por           %xmm3,%xmm1
   DB  102,15,235,202                      ; por           %xmm2,%xmm1
-  DB  117,84                              ; jne           15d4f <_sk_srcover_rgba_8888_sse41+0x163>
-  DB  243,65,15,127,12,128                ; movdqu        %xmm1,(%r8,%rax,4)
+  DB  117,75                              ; jne           15a5e <_sk_srcover_rgba_8888_sse41+0x154>
+  DB  243,65,15,127,12,144                ; movdqu        %xmm1,(%r8,%rdx,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,201                        ; movaps        %xmm9,%xmm1
   DB  65,15,40,210                        ; movaps        %xmm10,%xmm2
   DB  65,15,40,216                        ; movaps        %xmm8,%xmm3
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,91                              ; je            15d79 <_sk_srcover_rgba_8888_sse41+0x18d>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,78                              ; je            15a7f <_sk_srcover_rgba_8888_sse41+0x175>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,22                              ; je            15d3e <_sk_srcover_rgba_8888_sse41+0x152>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  15,133,229,254,255,255              ; jne           15c17 <_sk_srcover_rgba_8888_sse41+0x2b>
-  DB  102,65,15,110,68,128,8              ; movd          0x8(%r8,%rax,4),%xmm0
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,20                              ; je            15a4d <_sk_srcover_rgba_8888_sse41+0x143>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  15,133,238,254,255,255              ; jne           1592f <_sk_srcover_rgba_8888_sse41+0x25>
+  DB  102,65,15,110,68,144,8              ; movd          0x8(%r8,%rdx,4),%xmm0
   DB  102,15,112,192,69                   ; pshufd        $0x45,%xmm0,%xmm0
-  DB  243,65,15,126,36,128                ; movq          (%r8,%rax,4),%xmm4
+  DB  243,65,15,126,36,144                ; movq          (%r8,%rdx,4),%xmm4
   DB  102,15,58,14,196,15                 ; pblendw       $0xf,%xmm4,%xmm0
-  DB  233,200,254,255,255                 ; jmpq          15c17 <_sk_srcover_rgba_8888_sse41+0x2b>
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,40                              ; je            15d84 <_sk_srcover_rgba_8888_sse41+0x198>
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,15                              ; je            15d71 <_sk_srcover_rgba_8888_sse41+0x185>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,153                             ; jne           15d01 <_sk_srcover_rgba_8888_sse41+0x115>
-  DB  102,65,15,58,22,76,128,8,2          ; pextrd        $0x2,%xmm1,0x8(%r8,%rax,4)
-  DB  102,65,15,214,12,128                ; movq          %xmm1,(%r8,%rax,4)
-  DB  235,136                             ; jmp           15d01 <_sk_srcover_rgba_8888_sse41+0x115>
-  DB  102,65,15,110,4,128                 ; movd          (%r8,%rax,4),%xmm0
-  DB  233,147,254,255,255                 ; jmpq          15c17 <_sk_srcover_rgba_8888_sse41+0x2b>
-  DB  102,65,15,126,12,128                ; movd          %xmm1,(%r8,%rax,4)
-  DB  233,114,255,255,255                 ; jmpq          15d01 <_sk_srcover_rgba_8888_sse41+0x115>
+  DB  233,209,254,255,255                 ; jmpq          1592f <_sk_srcover_rgba_8888_sse41+0x25>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,36                              ; je            15a8a <_sk_srcover_rgba_8888_sse41+0x180>
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,13                              ; je            15a77 <_sk_srcover_rgba_8888_sse41+0x16d>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,171                             ; jne           15a19 <_sk_srcover_rgba_8888_sse41+0x10f>
+  DB  102,65,15,58,22,76,144,8,2          ; pextrd        $0x2,%xmm1,0x8(%r8,%rdx,4)
+  DB  102,65,15,214,12,144                ; movq          %xmm1,(%r8,%rdx,4)
+  DB  235,154                             ; jmp           15a19 <_sk_srcover_rgba_8888_sse41+0x10f>
+  DB  102,65,15,110,4,144                 ; movd          (%r8,%rdx,4),%xmm0
+  DB  233,165,254,255,255                 ; jmpq          1592f <_sk_srcover_rgba_8888_sse41+0x25>
+  DB  102,65,15,126,12,144                ; movd          %xmm1,(%r8,%rdx,4)
+  DB  235,135                             ; jmp           15a19 <_sk_srcover_rgba_8888_sse41+0x10f>
 
 PUBLIC _sk_srcover_bgra_8888_sse41
 _sk_srcover_bgra_8888_sse41 LABEL PROC
   DB  102,68,15,111,200                   ; movdqa        %xmm0,%xmm9
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,0,1,0,0                      ; jne           15eb4 <_sk_srcover_bgra_8888_sse41+0x125>
-  DB  243,65,15,111,4,128                 ; movdqu        (%r8,%rax,4),%xmm0
+  DB  15,133,0,1,0,0                      ; jne           15bb1 <_sk_srcover_bgra_8888_sse41+0x11f>
+  DB  243,65,15,111,4,144                 ; movdqu        (%r8,%rdx,4),%xmm0
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  102,15,111,37,123,225,1,0           ; movdqa        0x1e17b(%rip),%xmm4        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  102,15,111,37,94,222,1,0            ; movdqa        0x1de5e(%rip),%xmm4        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  102,15,219,224                      ; pand          %xmm0,%xmm4
   DB  15,91,244                           ; cvtdq2ps      %xmm4,%xmm6
   DB  102,15,111,224                      ; movdqa        %xmm0,%xmm4
-  DB  102,15,56,0,37,119,225,1,0          ; pshufb        0x1e177(%rip),%xmm4        # 33f50 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
+  DB  102,15,56,0,37,90,222,1,0           ; pshufb        0x1de5a(%rip),%xmm4        # 33930 <_sk_srcover_bgra_8888_sse2_lowp+0xd40>
   DB  15,91,236                           ; cvtdq2ps      %xmm4,%xmm5
   DB  102,15,111,224                      ; movdqa        %xmm0,%xmm4
-  DB  102,15,56,0,37,119,225,1,0          ; pshufb        0x1e177(%rip),%xmm4        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
+  DB  102,15,56,0,37,90,222,1,0           ; pshufb        0x1de5a(%rip),%xmm4        # 33940 <_sk_srcover_bgra_8888_sse2_lowp+0xd50>
   DB  69,15,87,219                        ; xorps         %xmm11,%xmm11
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
   DB  102,15,114,208,24                   ; psrld         $0x18,%xmm0
   DB  15,91,248                           ; cvtdq2ps      %xmm0,%xmm7
-  DB  68,15,40,5,144,224,1,0              ; movaps        0x1e090(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,115,221,1,0              ; movaps        0x1dd73(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,92,195                        ; subps         %xmm3,%xmm8
-  DB  68,15,40,37,100,225,1,0             ; movaps        0x1e164(%rip),%xmm12        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  DB  68,15,40,37,71,222,1,0              ; movaps        0x1de47(%rip),%xmm12        # 33950 <_sk_srcover_bgra_8888_sse2_lowp+0xd60>
   DB  69,15,89,204                        ; mulps         %xmm12,%xmm9
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  15,89,196                           ; mulps         %xmm4,%xmm0
@@ -20165,42 +20022,42 @@
   DB  102,15,114,241,24                   ; pslld         $0x18,%xmm1
   DB  102,15,235,203                      ; por           %xmm3,%xmm1
   DB  102,15,235,202                      ; por           %xmm2,%xmm1
-  DB  117,84                              ; jne           15ef2 <_sk_srcover_bgra_8888_sse41+0x163>
-  DB  243,65,15,127,12,128                ; movdqu        %xmm1,(%r8,%rax,4)
+  DB  117,75                              ; jne           15be6 <_sk_srcover_bgra_8888_sse41+0x154>
+  DB  243,65,15,127,12,144                ; movdqu        %xmm1,(%r8,%rdx,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,201                        ; movaps        %xmm9,%xmm1
   DB  65,15,40,210                        ; movaps        %xmm10,%xmm2
   DB  65,15,40,216                        ; movaps        %xmm8,%xmm3
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,91                              ; je            15f1c <_sk_srcover_bgra_8888_sse41+0x18d>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,78                              ; je            15c07 <_sk_srcover_bgra_8888_sse41+0x175>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,22                              ; je            15ee1 <_sk_srcover_bgra_8888_sse41+0x152>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  15,133,229,254,255,255              ; jne           15dba <_sk_srcover_bgra_8888_sse41+0x2b>
-  DB  102,65,15,110,68,128,8              ; movd          0x8(%r8,%rax,4),%xmm0
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,20                              ; je            15bd5 <_sk_srcover_bgra_8888_sse41+0x143>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  15,133,238,254,255,255              ; jne           15ab7 <_sk_srcover_bgra_8888_sse41+0x25>
+  DB  102,65,15,110,68,144,8              ; movd          0x8(%r8,%rdx,4),%xmm0
   DB  102,15,112,192,69                   ; pshufd        $0x45,%xmm0,%xmm0
-  DB  243,65,15,126,36,128                ; movq          (%r8,%rax,4),%xmm4
+  DB  243,65,15,126,36,144                ; movq          (%r8,%rdx,4),%xmm4
   DB  102,15,58,14,196,15                 ; pblendw       $0xf,%xmm4,%xmm0
-  DB  233,200,254,255,255                 ; jmpq          15dba <_sk_srcover_bgra_8888_sse41+0x2b>
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,40                              ; je            15f27 <_sk_srcover_bgra_8888_sse41+0x198>
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,15                              ; je            15f14 <_sk_srcover_bgra_8888_sse41+0x185>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,153                             ; jne           15ea4 <_sk_srcover_bgra_8888_sse41+0x115>
-  DB  102,65,15,58,22,76,128,8,2          ; pextrd        $0x2,%xmm1,0x8(%r8,%rax,4)
-  DB  102,65,15,214,12,128                ; movq          %xmm1,(%r8,%rax,4)
-  DB  235,136                             ; jmp           15ea4 <_sk_srcover_bgra_8888_sse41+0x115>
-  DB  102,65,15,110,4,128                 ; movd          (%r8,%rax,4),%xmm0
-  DB  233,147,254,255,255                 ; jmpq          15dba <_sk_srcover_bgra_8888_sse41+0x2b>
-  DB  102,65,15,126,12,128                ; movd          %xmm1,(%r8,%rax,4)
-  DB  233,114,255,255,255                 ; jmpq          15ea4 <_sk_srcover_bgra_8888_sse41+0x115>
+  DB  233,209,254,255,255                 ; jmpq          15ab7 <_sk_srcover_bgra_8888_sse41+0x25>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,36                              ; je            15c12 <_sk_srcover_bgra_8888_sse41+0x180>
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,13                              ; je            15bff <_sk_srcover_bgra_8888_sse41+0x16d>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,171                             ; jne           15ba1 <_sk_srcover_bgra_8888_sse41+0x10f>
+  DB  102,65,15,58,22,76,144,8,2          ; pextrd        $0x2,%xmm1,0x8(%r8,%rdx,4)
+  DB  102,65,15,214,12,144                ; movq          %xmm1,(%r8,%rdx,4)
+  DB  235,154                             ; jmp           15ba1 <_sk_srcover_bgra_8888_sse41+0x10f>
+  DB  102,65,15,110,4,144                 ; movd          (%r8,%rdx,4),%xmm0
+  DB  233,165,254,255,255                 ; jmpq          15ab7 <_sk_srcover_bgra_8888_sse41+0x25>
+  DB  102,65,15,126,12,144                ; movd          %xmm1,(%r8,%rdx,4)
+  DB  235,135                             ; jmp           15ba1 <_sk_srcover_bgra_8888_sse41+0x10f>
 
 PUBLIC _sk_clamp_0_sse41
 _sk_clamp_0_sse41 LABEL PROC
@@ -20214,7 +20071,7 @@
 
 PUBLIC _sk_clamp_1_sse41
 _sk_clamp_1_sse41 LABEL PROC
-  DB  68,15,40,5,62,223,1,0               ; movaps        0x1df3e(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,54,220,1,0               ; movaps        0x1dc36(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  65,15,93,192                        ; minps         %xmm8,%xmm0
   DB  65,15,93,200                        ; minps         %xmm8,%xmm1
   DB  65,15,93,208                        ; minps         %xmm8,%xmm2
@@ -20224,7 +20081,7 @@
 
 PUBLIC _sk_clamp_a_sse41
 _sk_clamp_a_sse41 LABEL PROC
-  DB  15,93,29,35,223,1,0                 ; minps         0x1df23(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,93,29,27,220,1,0                 ; minps         0x1dc1b(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,93,195                           ; minps         %xmm3,%xmm0
   DB  15,93,203                           ; minps         %xmm3,%xmm1
   DB  15,93,211                           ; minps         %xmm3,%xmm2
@@ -20233,7 +20090,7 @@
 
 PUBLIC _sk_clamp_a_dst_sse41
 _sk_clamp_a_dst_sse41 LABEL PROC
-  DB  15,93,61,15,223,1,0                 ; minps         0x1df0f(%rip),%xmm7        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,93,61,7,220,1,0                  ; minps         0x1dc07(%rip),%xmm7        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,93,231                           ; minps         %xmm7,%xmm4
   DB  15,93,239                           ; minps         %xmm7,%xmm5
   DB  15,93,247                           ; minps         %xmm7,%xmm6
@@ -20262,7 +20119,7 @@
 
 PUBLIC _sk_invert_sse41
 _sk_invert_sse41 LABEL PROC
-  DB  68,15,40,5,203,222,1,0              ; movaps        0x1decb(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,195,219,1,0              ; movaps        0x1dbc3(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  68,15,92,200                        ; subps         %xmm0,%xmm9
   DB  69,15,40,208                        ; movaps        %xmm8,%xmm10
@@ -20313,10 +20170,10 @@
 
 PUBLIC _sk_unpremul_sse41
 _sk_unpremul_sse41 LABEL PROC
-  DB  68,15,40,5,89,222,1,0               ; movaps        0x1de59(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,81,219,1,0               ; movaps        0x1db51(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,94,195                        ; divps         %xmm3,%xmm8
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
-  DB  68,15,194,13,56,223,1,0,1           ; cmpltps       0x1df38(%rip),%xmm9        # 33f80 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
+  DB  68,15,194,13,48,220,1,0,1           ; cmpltps       0x1dc30(%rip),%xmm9        # 33960 <_sk_srcover_bgra_8888_sse2_lowp+0xd70>
   DB  69,15,84,200                        ; andps         %xmm8,%xmm9
   DB  65,15,89,193                        ; mulps         %xmm9,%xmm0
   DB  65,15,89,201                        ; mulps         %xmm9,%xmm1
@@ -20326,20 +20183,20 @@
 
 PUBLIC _sk_from_srgb_sse41
 _sk_from_srgb_sse41 LABEL PROC
-  DB  68,15,40,29,44,223,1,0              ; movaps        0x1df2c(%rip),%xmm11        # 33f90 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
+  DB  68,15,40,29,36,220,1,0              ; movaps        0x1dc24(%rip),%xmm11        # 33970 <_sk_srcover_bgra_8888_sse2_lowp+0xd80>
   DB  68,15,40,200                        ; movaps        %xmm0,%xmm9
   DB  69,15,89,203                        ; mulps         %xmm11,%xmm9
   DB  68,15,40,208                        ; movaps        %xmm0,%xmm10
   DB  69,15,89,210                        ; mulps         %xmm10,%xmm10
-  DB  68,15,40,37,148,222,1,0             ; movaps        0x1de94(%rip),%xmm12        # 33f10 <_sk_srcover_bgra_8888_sse2_lowp+0xcf4>
+  DB  68,15,40,37,140,219,1,0             ; movaps        0x1db8c(%rip),%xmm12        # 338f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd00>
   DB  68,15,40,192                        ; movaps        %xmm0,%xmm8
   DB  69,15,89,196                        ; mulps         %xmm12,%xmm8
-  DB  68,15,40,45,20,223,1,0              ; movaps        0x1df14(%rip),%xmm13        # 33fa0 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  DB  68,15,40,45,12,220,1,0              ; movaps        0x1dc0c(%rip),%xmm13        # 33980 <_sk_srcover_bgra_8888_sse2_lowp+0xd90>
   DB  69,15,88,197                        ; addps         %xmm13,%xmm8
   DB  69,15,89,194                        ; mulps         %xmm10,%xmm8
-  DB  68,15,40,53,20,223,1,0              ; movaps        0x1df14(%rip),%xmm14        # 33fb0 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
+  DB  68,15,40,53,12,220,1,0              ; movaps        0x1dc0c(%rip),%xmm14        # 33990 <_sk_srcover_bgra_8888_sse2_lowp+0xda0>
   DB  69,15,88,198                        ; addps         %xmm14,%xmm8
-  DB  68,15,40,61,24,223,1,0              ; movaps        0x1df18(%rip),%xmm15        # 33fc0 <_sk_srcover_bgra_8888_sse2_lowp+0xda4>
+  DB  68,15,40,61,16,220,1,0              ; movaps        0x1dc10(%rip),%xmm15        # 339a0 <_sk_srcover_bgra_8888_sse2_lowp+0xdb0>
   DB  65,15,194,199,1                     ; cmpltps       %xmm15,%xmm0
   DB  102,69,15,56,20,193                 ; blendvps      %xmm0,%xmm9,%xmm8
   DB  68,15,40,209                        ; movaps        %xmm1,%xmm10
@@ -20374,19 +20231,19 @@
 _sk_from_srgb_dst_sse41 LABEL PROC
   DB  68,15,40,204                        ; movaps        %xmm4,%xmm9
   DB  68,15,40,192                        ; movaps        %xmm0,%xmm8
-  DB  68,15,40,29,99,222,1,0              ; movaps        0x1de63(%rip),%xmm11        # 33f90 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
+  DB  68,15,40,29,91,219,1,0              ; movaps        0x1db5b(%rip),%xmm11        # 33970 <_sk_srcover_bgra_8888_sse2_lowp+0xd80>
   DB  69,15,40,209                        ; movaps        %xmm9,%xmm10
   DB  69,15,89,211                        ; mulps         %xmm11,%xmm10
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
   DB  15,89,192                           ; mulps         %xmm0,%xmm0
-  DB  68,15,40,37,204,221,1,0             ; movaps        0x1ddcc(%rip),%xmm12        # 33f10 <_sk_srcover_bgra_8888_sse2_lowp+0xcf4>
+  DB  68,15,40,37,196,218,1,0             ; movaps        0x1dac4(%rip),%xmm12        # 338f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd00>
   DB  65,15,89,228                        ; mulps         %xmm12,%xmm4
-  DB  68,15,40,45,80,222,1,0              ; movaps        0x1de50(%rip),%xmm13        # 33fa0 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  DB  68,15,40,45,72,219,1,0              ; movaps        0x1db48(%rip),%xmm13        # 33980 <_sk_srcover_bgra_8888_sse2_lowp+0xd90>
   DB  65,15,88,229                        ; addps         %xmm13,%xmm4
   DB  15,89,224                           ; mulps         %xmm0,%xmm4
-  DB  68,15,40,53,81,222,1,0              ; movaps        0x1de51(%rip),%xmm14        # 33fb0 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
+  DB  68,15,40,53,73,219,1,0              ; movaps        0x1db49(%rip),%xmm14        # 33990 <_sk_srcover_bgra_8888_sse2_lowp+0xda0>
   DB  65,15,88,230                        ; addps         %xmm14,%xmm4
-  DB  68,15,40,61,85,222,1,0              ; movaps        0x1de55(%rip),%xmm15        # 33fc0 <_sk_srcover_bgra_8888_sse2_lowp+0xda4>
+  DB  68,15,40,61,77,219,1,0              ; movaps        0x1db4d(%rip),%xmm15        # 339a0 <_sk_srcover_bgra_8888_sse2_lowp+0xdb0>
   DB  69,15,194,207,1                     ; cmpltps       %xmm15,%xmm9
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
   DB  102,65,15,56,20,226                 ; blendvps      %xmm0,%xmm10,%xmm4
@@ -20429,22 +20286,22 @@
   DB  15,40,218                           ; movaps        %xmm2,%xmm3
   DB  15,40,209                           ; movaps        %xmm1,%xmm2
   DB  68,15,82,192                        ; rsqrtps       %xmm0,%xmm8
-  DB  68,15,40,29,198,221,1,0             ; movaps        0x1ddc6(%rip),%xmm11        # 33fd0 <_sk_srcover_bgra_8888_sse2_lowp+0xdb4>
+  DB  68,15,40,29,190,218,1,0             ; movaps        0x1dabe(%rip),%xmm11        # 339b0 <_sk_srcover_bgra_8888_sse2_lowp+0xdc0>
   DB  68,15,40,200                        ; movaps        %xmm0,%xmm9
   DB  69,15,89,203                        ; mulps         %xmm11,%xmm9
-  DB  68,15,40,37,198,221,1,0             ; movaps        0x1ddc6(%rip),%xmm12        # 33fe0 <_sk_srcover_bgra_8888_sse2_lowp+0xdc4>
+  DB  68,15,40,37,190,218,1,0             ; movaps        0x1dabe(%rip),%xmm12        # 339c0 <_sk_srcover_bgra_8888_sse2_lowp+0xdd0>
   DB  69,15,40,248                        ; movaps        %xmm8,%xmm15
   DB  69,15,89,252                        ; mulps         %xmm12,%xmm15
-  DB  68,15,40,21,198,221,1,0             ; movaps        0x1ddc6(%rip),%xmm10        # 33ff0 <_sk_srcover_bgra_8888_sse2_lowp+0xdd4>
+  DB  68,15,40,21,190,218,1,0             ; movaps        0x1dabe(%rip),%xmm10        # 339d0 <_sk_srcover_bgra_8888_sse2_lowp+0xde0>
   DB  69,15,88,250                        ; addps         %xmm10,%xmm15
   DB  69,15,89,248                        ; mulps         %xmm8,%xmm15
-  DB  68,15,40,45,198,221,1,0             ; movaps        0x1ddc6(%rip),%xmm13        # 34000 <_sk_srcover_bgra_8888_sse2_lowp+0xde4>
+  DB  68,15,40,45,190,218,1,0             ; movaps        0x1dabe(%rip),%xmm13        # 339e0 <_sk_srcover_bgra_8888_sse2_lowp+0xdf0>
   DB  69,15,88,253                        ; addps         %xmm13,%xmm15
-  DB  68,15,40,53,202,221,1,0             ; movaps        0x1ddca(%rip),%xmm14        # 34010 <_sk_srcover_bgra_8888_sse2_lowp+0xdf4>
+  DB  68,15,40,53,194,218,1,0             ; movaps        0x1dac2(%rip),%xmm14        # 339f0 <_sk_srcover_bgra_8888_sse2_lowp+0xe00>
   DB  69,15,88,198                        ; addps         %xmm14,%xmm8
   DB  69,15,83,192                        ; rcpps         %xmm8,%xmm8
   DB  69,15,89,199                        ; mulps         %xmm15,%xmm8
-  DB  68,15,40,61,198,221,1,0             ; movaps        0x1ddc6(%rip),%xmm15        # 34020 <_sk_srcover_bgra_8888_sse2_lowp+0xe04>
+  DB  68,15,40,61,190,218,1,0             ; movaps        0x1dabe(%rip),%xmm15        # 33a00 <_sk_srcover_bgra_8888_sse2_lowp+0xe10>
   DB  65,15,194,199,1                     ; cmpltps       %xmm15,%xmm0
   DB  102,69,15,56,20,193                 ; blendvps      %xmm0,%xmm9,%xmm8
   DB  68,15,82,202                        ; rsqrtps       %xmm2,%xmm9
@@ -20498,7 +20355,7 @@
   DB  68,15,93,224                        ; minps         %xmm0,%xmm12
   DB  65,15,40,203                        ; movaps        %xmm11,%xmm1
   DB  65,15,92,204                        ; subps         %xmm12,%xmm1
-  DB  68,15,40,53,106,219,1,0             ; movaps        0x1db6a(%rip),%xmm14        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,53,98,216,1,0              ; movaps        0x1d862(%rip),%xmm14        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,94,241                        ; divps         %xmm1,%xmm14
   DB  69,15,40,211                        ; movaps        %xmm11,%xmm10
   DB  69,15,194,208,0                     ; cmpeqps       %xmm8,%xmm10
@@ -20507,27 +20364,27 @@
   DB  65,15,89,198                        ; mulps         %xmm14,%xmm0
   DB  69,15,40,249                        ; movaps        %xmm9,%xmm15
   DB  68,15,194,250,1                     ; cmpltps       %xmm2,%xmm15
-  DB  68,15,84,61,225,220,1,0             ; andps         0x1dce1(%rip),%xmm15        # 34030 <_sk_srcover_bgra_8888_sse2_lowp+0xe14>
+  DB  68,15,84,61,217,217,1,0             ; andps         0x1d9d9(%rip),%xmm15        # 33a10 <_sk_srcover_bgra_8888_sse2_lowp+0xe20>
   DB  68,15,88,248                        ; addps         %xmm0,%xmm15
   DB  65,15,40,195                        ; movaps        %xmm11,%xmm0
   DB  65,15,194,193,0                     ; cmpeqps       %xmm9,%xmm0
   DB  65,15,92,208                        ; subps         %xmm8,%xmm2
   DB  65,15,89,214                        ; mulps         %xmm14,%xmm2
-  DB  68,15,40,45,212,220,1,0             ; movaps        0x1dcd4(%rip),%xmm13        # 34040 <_sk_srcover_bgra_8888_sse2_lowp+0xe24>
+  DB  68,15,40,45,204,217,1,0             ; movaps        0x1d9cc(%rip),%xmm13        # 33a20 <_sk_srcover_bgra_8888_sse2_lowp+0xe30>
   DB  65,15,88,213                        ; addps         %xmm13,%xmm2
   DB  69,15,92,193                        ; subps         %xmm9,%xmm8
   DB  69,15,89,198                        ; mulps         %xmm14,%xmm8
-  DB  68,15,88,5,208,220,1,0              ; addps         0x1dcd0(%rip),%xmm8        # 34050 <_sk_srcover_bgra_8888_sse2_lowp+0xe34>
+  DB  68,15,88,5,200,217,1,0              ; addps         0x1d9c8(%rip),%xmm8        # 33a30 <_sk_srcover_bgra_8888_sse2_lowp+0xe40>
   DB  102,68,15,56,20,194                 ; blendvps      %xmm0,%xmm2,%xmm8
   DB  65,15,40,194                        ; movaps        %xmm10,%xmm0
   DB  102,69,15,56,20,199                 ; blendvps      %xmm0,%xmm15,%xmm8
-  DB  68,15,89,5,200,220,1,0              ; mulps         0x1dcc8(%rip),%xmm8        # 34060 <_sk_srcover_bgra_8888_sse2_lowp+0xe44>
+  DB  68,15,89,5,192,217,1,0              ; mulps         0x1d9c0(%rip),%xmm8        # 33a40 <_sk_srcover_bgra_8888_sse2_lowp+0xe50>
   DB  69,15,40,203                        ; movaps        %xmm11,%xmm9
   DB  69,15,194,204,4                     ; cmpneqps      %xmm12,%xmm9
   DB  69,15,84,193                        ; andps         %xmm9,%xmm8
   DB  69,15,92,235                        ; subps         %xmm11,%xmm13
   DB  69,15,88,220                        ; addps         %xmm12,%xmm11
-  DB  15,40,5,204,218,1,0                 ; movaps        0x1dacc(%rip),%xmm0        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  15,40,5,196,215,1,0                 ; movaps        0x1d7c4(%rip),%xmm0        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  65,15,40,211                        ; movaps        %xmm11,%xmm2
   DB  15,89,208                           ; mulps         %xmm0,%xmm2
   DB  15,194,194,1                        ; cmpltps       %xmm2,%xmm0
@@ -20548,7 +20405,7 @@
   DB  15,41,100,36,32                     ; movaps        %xmm4,0x20(%rsp)
   DB  15,41,92,36,16                      ; movaps        %xmm3,0x10(%rsp)
   DB  68,15,40,208                        ; movaps        %xmm0,%xmm10
-  DB  68,15,40,13,126,218,1,0             ; movaps        0x1da7e(%rip),%xmm9        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  68,15,40,13,118,215,1,0             ; movaps        0x1d776(%rip),%xmm9        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
   DB  15,194,194,2                        ; cmpleps       %xmm2,%xmm0
   DB  15,40,217                           ; movaps        %xmm1,%xmm3
@@ -20561,19 +20418,19 @@
   DB  15,41,20,36                         ; movaps        %xmm2,(%rsp)
   DB  69,15,88,192                        ; addps         %xmm8,%xmm8
   DB  68,15,92,197                        ; subps         %xmm5,%xmm8
-  DB  68,15,40,53,58,220,1,0              ; movaps        0x1dc3a(%rip),%xmm14        # 34070 <_sk_srcover_bgra_8888_sse2_lowp+0xe54>
+  DB  68,15,40,53,50,217,1,0              ; movaps        0x1d932(%rip),%xmm14        # 33a50 <_sk_srcover_bgra_8888_sse2_lowp+0xe60>
   DB  69,15,88,242                        ; addps         %xmm10,%xmm14
   DB  102,65,15,58,8,198,1                ; roundps       $0x1,%xmm14,%xmm0
   DB  68,15,92,240                        ; subps         %xmm0,%xmm14
-  DB  68,15,40,29,51,220,1,0              ; movaps        0x1dc33(%rip),%xmm11        # 34080 <_sk_srcover_bgra_8888_sse2_lowp+0xe64>
+  DB  68,15,40,29,43,217,1,0              ; movaps        0x1d92b(%rip),%xmm11        # 33a60 <_sk_srcover_bgra_8888_sse2_lowp+0xe70>
   DB  65,15,40,195                        ; movaps        %xmm11,%xmm0
   DB  65,15,194,198,2                     ; cmpleps       %xmm14,%xmm0
   DB  15,40,245                           ; movaps        %xmm5,%xmm6
   DB  65,15,92,240                        ; subps         %xmm8,%xmm6
-  DB  15,40,61,204,219,1,0                ; movaps        0x1dbcc(%rip),%xmm7        # 34030 <_sk_srcover_bgra_8888_sse2_lowp+0xe14>
+  DB  15,40,61,196,216,1,0                ; movaps        0x1d8c4(%rip),%xmm7        # 33a10 <_sk_srcover_bgra_8888_sse2_lowp+0xe20>
   DB  69,15,40,238                        ; movaps        %xmm14,%xmm13
   DB  68,15,89,239                        ; mulps         %xmm7,%xmm13
-  DB  15,40,29,221,219,1,0                ; movaps        0x1dbdd(%rip),%xmm3        # 34050 <_sk_srcover_bgra_8888_sse2_lowp+0xe34>
+  DB  15,40,29,213,216,1,0                ; movaps        0x1d8d5(%rip),%xmm3        # 33a30 <_sk_srcover_bgra_8888_sse2_lowp+0xe40>
   DB  68,15,40,227                        ; movaps        %xmm3,%xmm12
   DB  69,15,92,229                        ; subps         %xmm13,%xmm12
   DB  68,15,89,230                        ; mulps         %xmm6,%xmm12
@@ -20583,7 +20440,7 @@
   DB  65,15,194,198,2                     ; cmpleps       %xmm14,%xmm0
   DB  68,15,40,253                        ; movaps        %xmm5,%xmm15
   DB  102,69,15,56,20,252                 ; blendvps      %xmm0,%xmm12,%xmm15
-  DB  68,15,40,37,188,219,1,0             ; movaps        0x1dbbc(%rip),%xmm12        # 34060 <_sk_srcover_bgra_8888_sse2_lowp+0xe44>
+  DB  68,15,40,37,180,216,1,0             ; movaps        0x1d8b4(%rip),%xmm12        # 33a40 <_sk_srcover_bgra_8888_sse2_lowp+0xe50>
   DB  65,15,40,196                        ; movaps        %xmm12,%xmm0
   DB  65,15,194,198,2                     ; cmpleps       %xmm14,%xmm0
   DB  68,15,89,238                        ; mulps         %xmm6,%xmm13
@@ -20617,7 +20474,7 @@
   DB  65,15,40,198                        ; movaps        %xmm14,%xmm0
   DB  15,40,20,36                         ; movaps        (%rsp),%xmm2
   DB  102,15,56,20,202                    ; blendvps      %xmm0,%xmm2,%xmm1
-  DB  68,15,88,21,85,219,1,0              ; addps         0x1db55(%rip),%xmm10        # 34090 <_sk_srcover_bgra_8888_sse2_lowp+0xe74>
+  DB  68,15,88,21,77,216,1,0              ; addps         0x1d84d(%rip),%xmm10        # 33a70 <_sk_srcover_bgra_8888_sse2_lowp+0xe80>
   DB  102,65,15,58,8,194,1                ; roundps       $0x1,%xmm10,%xmm0
   DB  68,15,92,208                        ; subps         %xmm0,%xmm10
   DB  69,15,194,218,2                     ; cmpleps       %xmm10,%xmm11
@@ -20663,17 +20520,15 @@
 PUBLIC _sk_scale_u8_sse41
 _sk_scale_u8_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,52                              ; jne           16626 <_sk_scale_u8_sse41+0x4c>
-  DB  102,71,15,56,49,4,16                ; pmovzxbd      (%r8,%r10,1),%xmm8
-  DB  102,68,15,219,5,62,217,1,0          ; pand          0x1d93e(%rip),%xmm8        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  117,52                              ; jne           16308 <_sk_scale_u8_sse41+0x46>
+  DB  102,69,15,56,49,4,16                ; pmovzxbd      (%r8,%rdx,1),%xmm8
+  DB  102,68,15,219,5,60,214,1,0          ; pand          0x1d63c(%rip),%xmm8        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
-  DB  68,15,89,5,146,218,1,0              ; mulps         0x1da92(%rip),%xmm8        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  68,15,89,5,144,215,1,0              ; mulps         0x1d790(%rip),%xmm8        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  65,15,89,200                        ; mulps         %xmm8,%xmm1
   DB  65,15,89,208                        ; mulps         %xmm8,%xmm2
@@ -20681,51 +20536,49 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,216                        ; movaps        %xmm8,%xmm3
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,59                              ; je            1666e <_sk_scale_u8_sse41+0x94>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,55                              ; je            16347 <_sk_scale_u8_sse41+0x85>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,23                              ; je            16655 <_sk_scale_u8_sse41+0x7b>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,181                             ; jne           165f9 <_sk_scale_u8_sse41+0x1f>
-  DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,21                              ; je            1632e <_sk_scale_u8_sse41+0x6c>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,190                             ; jne           162db <_sk_scale_u8_sse41+0x19>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  102,69,15,112,192,69                ; pshufd        $0x45,%xmm8,%xmm8
-  DB  67,15,183,4,16                      ; movzwl        (%r8,%r10,1),%eax
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  102,68,15,110,200                   ; movd          %eax,%xmm9
   DB  102,69,15,56,49,201                 ; pmovzxbd      %xmm9,%xmm9
   DB  102,69,15,58,14,193,15              ; pblendw       $0xf,%xmm9,%xmm8
-  DB  235,139                             ; jmp           165f9 <_sk_scale_u8_sse41+0x1f>
-  DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
+  DB  235,148                             ; jmp           162db <_sk_scale_u8_sse41+0x19>
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
-  DB  233,124,255,255,255                 ; jmpq          165f9 <_sk_scale_u8_sse41+0x1f>
+  DB  235,136                             ; jmp           162db <_sk_scale_u8_sse41+0x19>
 
 PUBLIC _sk_scale_565_sse41
 _sk_scale_565_sse41 LABEL PROC
   DB  102,68,15,111,192                   ; movdqa        %xmm0,%xmm8
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,159,0,0,0                    ; jne           16740 <_sk_scale_565_sse41+0xc3>
-  DB  102,71,15,56,51,28,80               ; pmovzxwd      (%r8,%r10,2),%xmm11
-  DB  102,15,111,5,0,218,1,0              ; movdqa        0x1da00(%rip),%xmm0        # 340b0 <_sk_srcover_bgra_8888_sse2_lowp+0xe94>
+  DB  15,133,159,0,0,0                    ; jne           16410 <_sk_scale_565_sse41+0xbd>
+  DB  102,69,15,56,51,28,80               ; pmovzxwd      (%r8,%rdx,2),%xmm11
+  DB  102,15,111,5,16,215,1,0             ; movdqa        0x1d710(%rip),%xmm0        # 33a90 <_sk_srcover_bgra_8888_sse2_lowp+0xea0>
   DB  102,65,15,219,195                   ; pand          %xmm11,%xmm0
   DB  68,15,91,200                        ; cvtdq2ps      %xmm0,%xmm9
-  DB  68,15,89,13,255,217,1,0             ; mulps         0x1d9ff(%rip),%xmm9        # 340c0 <_sk_srcover_bgra_8888_sse2_lowp+0xea4>
-  DB  102,15,111,5,7,218,1,0              ; movdqa        0x1da07(%rip),%xmm0        # 340d0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  DB  68,15,89,13,15,215,1,0              ; mulps         0x1d70f(%rip),%xmm9        # 33aa0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb0>
+  DB  102,15,111,5,23,215,1,0             ; movdqa        0x1d717(%rip),%xmm0        # 33ab0 <_sk_srcover_bgra_8888_sse2_lowp+0xec0>
   DB  102,65,15,219,195                   ; pand          %xmm11,%xmm0
   DB  68,15,91,208                        ; cvtdq2ps      %xmm0,%xmm10
-  DB  68,15,89,21,6,218,1,0               ; mulps         0x1da06(%rip),%xmm10        # 340e0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
-  DB  102,68,15,219,29,13,218,1,0         ; pand          0x1da0d(%rip),%xmm11        # 340f0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
+  DB  68,15,89,21,22,215,1,0              ; mulps         0x1d716(%rip),%xmm10        # 33ac0 <_sk_srcover_bgra_8888_sse2_lowp+0xed0>
+  DB  102,68,15,219,29,29,215,1,0         ; pand          0x1d71d(%rip),%xmm11        # 33ad0 <_sk_srcover_bgra_8888_sse2_lowp+0xee0>
   DB  69,15,91,219                        ; cvtdq2ps      %xmm11,%xmm11
-  DB  68,15,89,29,17,218,1,0              ; mulps         0x1da11(%rip),%xmm11        # 34100 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  DB  68,15,89,29,33,215,1,0              ; mulps         0x1d721(%rip),%xmm11        # 33ae0 <_sk_srcover_bgra_8888_sse2_lowp+0xef0>
   DB  15,40,195                           ; movaps        %xmm3,%xmm0
   DB  15,194,199,1                        ; cmpltps       %xmm7,%xmm0
   DB  69,15,40,226                        ; movaps        %xmm10,%xmm12
@@ -20747,25 +20600,25 @@
   DB  65,15,40,211                        ; movaps        %xmm11,%xmm2
   DB  65,15,40,220                        ; movaps        %xmm12,%xmm3
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,60                              ; je            16789 <_sk_scale_565_sse41+0x10c>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,56                              ; je            16450 <_sk_scale_565_sse41+0xfd>
   DB  102,69,15,239,219                   ; pxor          %xmm11,%xmm11
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,26                              ; je            16772 <_sk_scale_565_sse41+0xf5>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  15,133,70,255,255,255               ; jne           166a8 <_sk_scale_565_sse41+0x2b>
-  DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,24                              ; je            16439 <_sk_scale_565_sse41+0xe6>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  15,133,79,255,255,255               ; jne           16378 <_sk_scale_565_sse41+0x25>
+  DB  65,15,183,68,80,4                   ; movzwl        0x4(%r8,%rdx,2),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,68,15,112,216,69                ; pshufd        $0x45,%xmm0,%xmm11
-  DB  102,67,15,110,4,80                  ; movd          (%r8,%r10,2),%xmm0
+  DB  102,65,15,110,4,80                  ; movd          (%r8,%rdx,2),%xmm0
   DB  102,15,56,51,192                    ; pmovzxwd      %xmm0,%xmm0
   DB  102,68,15,58,14,216,15              ; pblendw       $0xf,%xmm0,%xmm11
-  DB  233,31,255,255,255                  ; jmpq          166a8 <_sk_scale_565_sse41+0x2b>
-  DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
+  DB  233,40,255,255,255                  ; jmpq          16378 <_sk_scale_565_sse41+0x25>
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,68,15,110,216                   ; movd          %eax,%xmm11
-  DB  233,16,255,255,255                  ; jmpq          166a8 <_sk_scale_565_sse41+0x2b>
+  DB  233,25,255,255,255                  ; jmpq          16378 <_sk_scale_565_sse41+0x25>
 
 PUBLIC _sk_lerp_1_float_sse41
 _sk_lerp_1_float_sse41 LABEL PROC
@@ -20790,17 +20643,15 @@
 PUBLIC _sk_lerp_u8_sse41
 _sk_lerp_u8_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,72                              ; jne           16830 <_sk_lerp_u8_sse41+0x60>
-  DB  102,71,15,56,49,4,16                ; pmovzxbd      (%r8,%r10,1),%xmm8
-  DB  102,68,15,219,5,72,215,1,0          ; pand          0x1d748(%rip),%xmm8        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  117,72                              ; jne           164f1 <_sk_lerp_u8_sse41+0x5a>
+  DB  102,69,15,56,49,4,16                ; pmovzxbd      (%r8,%rdx,1),%xmm8
+  DB  102,68,15,219,5,103,212,1,0         ; pand          0x1d467(%rip),%xmm8        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
-  DB  68,15,89,5,156,216,1,0              ; mulps         0x1d89c(%rip),%xmm8        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  68,15,89,5,187,213,1,0              ; mulps         0x1d5bb(%rip),%xmm8        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  15,92,196                           ; subps         %xmm4,%xmm0
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  15,88,196                           ; addps         %xmm4,%xmm0
@@ -20815,51 +20666,49 @@
   DB  15,88,223                           ; addps         %xmm7,%xmm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,62                              ; je            1687b <_sk_lerp_u8_sse41+0xab>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,55                              ; je            16530 <_sk_lerp_u8_sse41+0x99>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,23                              ; je            1685f <_sk_lerp_u8_sse41+0x8f>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,161                             ; jne           167ef <_sk_lerp_u8_sse41+0x1f>
-  DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,21                              ; je            16517 <_sk_lerp_u8_sse41+0x80>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,170                             ; jne           164b0 <_sk_lerp_u8_sse41+0x19>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  102,69,15,112,192,69                ; pshufd        $0x45,%xmm8,%xmm8
-  DB  67,15,183,4,16                      ; movzwl        (%r8,%r10,1),%eax
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  102,68,15,110,200                   ; movd          %eax,%xmm9
   DB  102,69,15,56,49,201                 ; pmovzxbd      %xmm9,%xmm9
   DB  102,69,15,58,14,193,15              ; pblendw       $0xf,%xmm9,%xmm8
-  DB  233,116,255,255,255                 ; jmpq          167ef <_sk_lerp_u8_sse41+0x1f>
-  DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
+  DB  235,128                             ; jmp           164b0 <_sk_lerp_u8_sse41+0x19>
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
-  DB  233,101,255,255,255                 ; jmpq          167ef <_sk_lerp_u8_sse41+0x1f>
+  DB  233,113,255,255,255                 ; jmpq          164b0 <_sk_lerp_u8_sse41+0x19>
 
 PUBLIC _sk_lerp_565_sse41
 _sk_lerp_565_sse41 LABEL PROC
   DB  102,68,15,111,192                   ; movdqa        %xmm0,%xmm8
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,165,0,0,0                    ; jne           16953 <_sk_lerp_565_sse41+0xc9>
-  DB  102,71,15,56,51,20,80               ; pmovzxwd      (%r8,%r10,2),%xmm10
-  DB  102,15,111,5,243,215,1,0            ; movdqa        0x1d7f3(%rip),%xmm0        # 340b0 <_sk_srcover_bgra_8888_sse2_lowp+0xe94>
+  DB  15,133,165,0,0,0                    ; jne           16602 <_sk_lerp_565_sse41+0xc3>
+  DB  102,69,15,56,51,20,80               ; pmovzxwd      (%r8,%rdx,2),%xmm10
+  DB  102,15,111,5,36,213,1,0             ; movdqa        0x1d524(%rip),%xmm0        # 33a90 <_sk_srcover_bgra_8888_sse2_lowp+0xea0>
   DB  102,65,15,219,194                   ; pand          %xmm10,%xmm0
   DB  68,15,91,200                        ; cvtdq2ps      %xmm0,%xmm9
-  DB  68,15,89,13,242,215,1,0             ; mulps         0x1d7f2(%rip),%xmm9        # 340c0 <_sk_srcover_bgra_8888_sse2_lowp+0xea4>
-  DB  102,15,111,5,250,215,1,0            ; movdqa        0x1d7fa(%rip),%xmm0        # 340d0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  DB  68,15,89,13,35,213,1,0              ; mulps         0x1d523(%rip),%xmm9        # 33aa0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb0>
+  DB  102,15,111,5,43,213,1,0             ; movdqa        0x1d52b(%rip),%xmm0        # 33ab0 <_sk_srcover_bgra_8888_sse2_lowp+0xec0>
   DB  102,65,15,219,194                   ; pand          %xmm10,%xmm0
   DB  68,15,91,216                        ; cvtdq2ps      %xmm0,%xmm11
-  DB  68,15,89,29,249,215,1,0             ; mulps         0x1d7f9(%rip),%xmm11        # 340e0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
-  DB  102,68,15,219,21,0,216,1,0          ; pand          0x1d800(%rip),%xmm10        # 340f0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
+  DB  68,15,89,29,42,213,1,0              ; mulps         0x1d52a(%rip),%xmm11        # 33ac0 <_sk_srcover_bgra_8888_sse2_lowp+0xed0>
+  DB  102,68,15,219,21,49,213,1,0         ; pand          0x1d531(%rip),%xmm10        # 33ad0 <_sk_srcover_bgra_8888_sse2_lowp+0xee0>
   DB  69,15,91,210                        ; cvtdq2ps      %xmm10,%xmm10
-  DB  68,15,89,21,4,216,1,0               ; mulps         0x1d804(%rip),%xmm10        # 34100 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  DB  68,15,89,21,53,213,1,0              ; mulps         0x1d535(%rip),%xmm10        # 33ae0 <_sk_srcover_bgra_8888_sse2_lowp+0xef0>
   DB  15,40,195                           ; movaps        %xmm3,%xmm0
   DB  15,194,199,1                        ; cmpltps       %xmm7,%xmm0
   DB  69,15,40,227                        ; movaps        %xmm11,%xmm12
@@ -20884,25 +20733,25 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,60                              ; je            1699c <_sk_lerp_565_sse41+0x112>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,56                              ; je            16642 <_sk_lerp_565_sse41+0x103>
   DB  102,69,15,239,210                   ; pxor          %xmm10,%xmm10
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,26                              ; je            16985 <_sk_lerp_565_sse41+0xfb>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  15,133,64,255,255,255               ; jne           168b5 <_sk_lerp_565_sse41+0x2b>
-  DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,24                              ; je            1662b <_sk_lerp_565_sse41+0xec>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  15,133,73,255,255,255               ; jne           16564 <_sk_lerp_565_sse41+0x25>
+  DB  65,15,183,68,80,4                   ; movzwl        0x4(%r8,%rdx,2),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,68,15,112,208,69                ; pshufd        $0x45,%xmm0,%xmm10
-  DB  102,67,15,110,4,80                  ; movd          (%r8,%r10,2),%xmm0
+  DB  102,65,15,110,4,80                  ; movd          (%r8,%rdx,2),%xmm0
   DB  102,15,56,51,192                    ; pmovzxwd      %xmm0,%xmm0
   DB  102,68,15,58,14,208,15              ; pblendw       $0xf,%xmm0,%xmm10
-  DB  233,25,255,255,255                  ; jmpq          168b5 <_sk_lerp_565_sse41+0x2b>
-  DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
+  DB  233,34,255,255,255                  ; jmpq          16564 <_sk_lerp_565_sse41+0x25>
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,68,15,110,208                   ; movd          %eax,%xmm10
-  DB  233,10,255,255,255                  ; jmpq          168b5 <_sk_lerp_565_sse41+0x2b>
+  DB  233,19,255,255,255                  ; jmpq          16564 <_sk_lerp_565_sse41+0x25>
 
 PUBLIC _sk_load_tables_sse41
 _sk_load_tables_sse41 LABEL PROC
@@ -20911,9 +20760,9 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,17,1,0,0                     ; jne           16acd <_sk_load_tables_sse41+0x122>
+  DB  15,133,17,1,0,0                     ; jne           16773 <_sk_load_tables_sse41+0x122>
   DB  243,69,15,111,4,144                 ; movdqu        (%r8,%rdx,4),%xmm8
-  DB  102,15,111,5,118,213,1,0            ; movdqa        0x1d576(%rip),%xmm0        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  102,15,111,5,176,210,1,0            ; movdqa        0x1d2b0(%rip),%xmm0        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  102,65,15,219,192                   ; pand          %xmm8,%xmm0
   DB  102,73,15,58,22,192,1               ; pextrq        $0x1,%xmm0,%r8
   DB  102,73,15,126,193                   ; movq          %xmm0,%r9
@@ -20928,7 +20777,7 @@
   DB  102,66,15,58,33,4,155,32            ; insertps      $0x20,(%rbx,%r11,4),%xmm0
   DB  102,66,15,58,33,4,3,48              ; insertps      $0x30,(%rbx,%r8,1),%xmm0
   DB  102,65,15,111,200                   ; movdqa        %xmm8,%xmm1
-  DB  102,15,56,0,13,49,213,1,0           ; pshufb        0x1d531(%rip),%xmm1        # 33f50 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
+  DB  102,15,56,0,13,107,210,1,0          ; pshufb        0x1d26b(%rip),%xmm1        # 33930 <_sk_srcover_bgra_8888_sse2_lowp+0xd40>
   DB  102,73,15,58,22,200,1               ; pextrq        $0x1,%xmm1,%r8
   DB  102,72,15,126,203                   ; movq          %xmm1,%rbx
   DB  68,15,182,203                       ; movzbl        %bl,%r9d
@@ -20943,7 +20792,7 @@
   DB  102,15,58,33,202,48                 ; insertps      $0x30,%xmm2,%xmm1
   DB  76,139,64,24                        ; mov           0x18(%rax),%r8
   DB  102,65,15,111,208                   ; movdqa        %xmm8,%xmm2
-  DB  102,15,56,0,21,237,212,1,0          ; pshufb        0x1d4ed(%rip),%xmm2        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
+  DB  102,15,56,0,21,39,210,1,0           ; pshufb        0x1d227(%rip),%xmm2        # 33940 <_sk_srcover_bgra_8888_sse2_lowp+0xd50>
   DB  102,72,15,58,22,211,1               ; pextrq        $0x1,%xmm2,%rbx
   DB  102,72,15,126,208                   ; movq          %xmm2,%rax
   DB  68,15,182,200                       ; movzbl        %al,%r9d
@@ -20958,7 +20807,7 @@
   DB  102,15,58,33,211,48                 ; insertps      $0x30,%xmm3,%xmm2
   DB  102,65,15,114,208,24                ; psrld         $0x18,%xmm8
   DB  65,15,91,216                        ; cvtdq2ps      %xmm8,%xmm3
-  DB  15,89,29,218,213,1,0                ; mulps         0x1d5da(%rip),%xmm3        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  15,89,29,20,211,1,0                 ; mulps         0x1d314(%rip),%xmm3        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  91                                  ; pop           %rbx
   DB  65,94                               ; pop           %r14
@@ -20966,19 +20815,19 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,52                              ; je            16b0e <_sk_load_tables_sse41+0x163>
+  DB  116,52                              ; je            167b4 <_sk_load_tables_sse41+0x163>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,23                              ; je            16afc <_sk_load_tables_sse41+0x151>
+  DB  116,23                              ; je            167a2 <_sk_load_tables_sse41+0x151>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  15,133,211,254,255,255              ; jne           169c2 <_sk_load_tables_sse41+0x17>
+  DB  15,133,211,254,255,255              ; jne           16668 <_sk_load_tables_sse41+0x17>
   DB  102,65,15,110,68,144,8              ; movd          0x8(%r8,%rdx,4),%xmm0
   DB  102,68,15,112,192,69                ; pshufd        $0x45,%xmm0,%xmm8
   DB  243,65,15,126,4,144                 ; movq          (%r8,%rdx,4),%xmm0
   DB  102,68,15,58,14,192,15              ; pblendw       $0xf,%xmm0,%xmm8
-  DB  233,180,254,255,255                 ; jmpq          169c2 <_sk_load_tables_sse41+0x17>
+  DB  233,180,254,255,255                 ; jmpq          16668 <_sk_load_tables_sse41+0x17>
   DB  102,69,15,110,4,144                 ; movd          (%r8,%rdx,4),%xmm8
-  DB  233,169,254,255,255                 ; jmpq          169c2 <_sk_load_tables_sse41+0x17>
+  DB  233,169,254,255,255                 ; jmpq          16668 <_sk_load_tables_sse41+0x17>
 
 PUBLIC _sk_load_tables_u16_be_sse41
 _sk_load_tables_u16_be_sse41 LABEL PROC
@@ -20988,7 +20837,7 @@
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  76,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,92,1,0,0                     ; jne           16c8e <_sk_load_tables_u16_be_sse41+0x175>
+  DB  15,133,92,1,0,0                     ; jne           16934 <_sk_load_tables_u16_be_sse41+0x175>
   DB  102,67,15,16,4,72                   ; movupd        (%r8,%r9,2),%xmm0
   DB  243,67,15,111,76,72,16              ; movdqu        0x10(%r8,%r9,2),%xmm1
   DB  102,68,15,40,200                    ; movapd        %xmm0,%xmm9
@@ -20997,7 +20846,7 @@
   DB  102,65,15,111,201                   ; movdqa        %xmm9,%xmm1
   DB  102,15,97,200                       ; punpcklwd     %xmm0,%xmm1
   DB  102,68,15,105,200                   ; punpckhwd     %xmm0,%xmm9
-  DB  102,68,15,111,5,172,213,1,0         ; movdqa        0x1d5ac(%rip),%xmm8        # 34110 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
+  DB  102,68,15,111,5,230,210,1,0         ; movdqa        0x1d2e6(%rip),%xmm8        # 33af0 <_sk_srcover_bgra_8888_sse2_lowp+0xf00>
   DB  102,15,111,193                      ; movdqa        %xmm1,%xmm0
   DB  102,65,15,219,192                   ; pand          %xmm8,%xmm0
   DB  102,15,56,51,192                    ; pmovzxwd      %xmm0,%xmm0
@@ -21015,7 +20864,7 @@
   DB  102,15,58,33,194,32                 ; insertps      $0x20,%xmm2,%xmm0
   DB  243,66,15,16,20,3                   ; movss         (%rbx,%r8,1),%xmm2
   DB  102,15,58,33,194,48                 ; insertps      $0x30,%xmm2,%xmm0
-  DB  102,15,56,0,13,91,213,1,0           ; pshufb        0x1d55b(%rip),%xmm1        # 34120 <_sk_srcover_bgra_8888_sse2_lowp+0xf04>
+  DB  102,15,56,0,13,149,210,1,0          ; pshufb        0x1d295(%rip),%xmm1        # 33b00 <_sk_srcover_bgra_8888_sse2_lowp+0xf10>
   DB  102,15,56,51,201                    ; pmovzxwd      %xmm1,%xmm1
   DB  102,73,15,58,22,200,1               ; pextrq        $0x1,%xmm1,%r8
   DB  102,72,15,126,203                   ; movq          %xmm1,%rbx
@@ -21051,23 +20900,23 @@
   DB  102,65,15,235,216                   ; por           %xmm8,%xmm3
   DB  102,15,56,51,219                    ; pmovzxwd      %xmm3,%xmm3
   DB  15,91,219                           ; cvtdq2ps      %xmm3,%xmm3
-  DB  15,89,29,169,212,1,0                ; mulps         0x1d4a9(%rip),%xmm3        # 34130 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
+  DB  15,89,29,227,209,1,0                ; mulps         0x1d1e3(%rip),%xmm3        # 33b10 <_sk_srcover_bgra_8888_sse2_lowp+0xf20>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  91                                  ; pop           %rbx
   DB  65,94                               ; pop           %r14
   DB  255,224                             ; jmpq          *%rax
   DB  242,67,15,16,4,72                   ; movsd         (%r8,%r9,2),%xmm0
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,13                              ; jne           16ca7 <_sk_load_tables_u16_be_sse41+0x18e>
+  DB  117,13                              ; jne           1694d <_sk_load_tables_u16_be_sse41+0x18e>
   DB  243,15,126,192                      ; movq          %xmm0,%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  233,152,254,255,255                 ; jmpq          16b3f <_sk_load_tables_u16_be_sse41+0x26>
+  DB  233,152,254,255,255                 ; jmpq          167e5 <_sk_load_tables_u16_be_sse41+0x26>
   DB  102,67,15,22,68,72,8                ; movhpd        0x8(%r8,%r9,2),%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  15,130,131,254,255,255              ; jb            16b3f <_sk_load_tables_u16_be_sse41+0x26>
+  DB  15,130,131,254,255,255              ; jb            167e5 <_sk_load_tables_u16_be_sse41+0x26>
   DB  243,67,15,126,76,72,16              ; movq          0x10(%r8,%r9,2),%xmm1
-  DB  233,119,254,255,255                 ; jmpq          16b3f <_sk_load_tables_u16_be_sse41+0x26>
+  DB  233,119,254,255,255                 ; jmpq          167e5 <_sk_load_tables_u16_be_sse41+0x26>
 
 PUBLIC _sk_load_tables_rgb_u16_be_sse41
 _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
@@ -21077,7 +20926,7 @@
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  76,141,12,82                        ; lea           (%rdx,%rdx,2),%r9
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,76,1,0,0                     ; jne           16e29 <_sk_load_tables_rgb_u16_be_sse41+0x161>
+  DB  15,133,76,1,0,0                     ; jne           16acf <_sk_load_tables_rgb_u16_be_sse41+0x161>
   DB  243,67,15,111,20,72                 ; movdqu        (%r8,%r9,2),%xmm2
   DB  243,67,15,111,76,72,8               ; movdqu        0x8(%r8,%r9,2),%xmm1
   DB  102,15,115,217,4                    ; psrldq        $0x4,%xmm1
@@ -21089,7 +20938,7 @@
   DB  102,15,97,209                       ; punpcklwd     %xmm1,%xmm2
   DB  102,15,111,202                      ; movdqa        %xmm2,%xmm1
   DB  102,65,15,97,201                    ; punpcklwd     %xmm9,%xmm1
-  DB  102,68,15,111,5,242,211,1,0         ; movdqa        0x1d3f2(%rip),%xmm8        # 34110 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
+  DB  102,68,15,111,5,44,209,1,0          ; movdqa        0x1d12c(%rip),%xmm8        # 33af0 <_sk_srcover_bgra_8888_sse2_lowp+0xf00>
   DB  102,15,111,193                      ; movdqa        %xmm1,%xmm0
   DB  102,65,15,219,192                   ; pand          %xmm8,%xmm0
   DB  102,15,56,51,192                    ; pmovzxwd      %xmm0,%xmm0
@@ -21107,7 +20956,7 @@
   DB  102,15,58,33,195,32                 ; insertps      $0x20,%xmm3,%xmm0
   DB  243,66,15,16,28,3                   ; movss         (%rbx,%r8,1),%xmm3
   DB  102,15,58,33,195,48                 ; insertps      $0x30,%xmm3,%xmm0
-  DB  102,15,56,0,13,161,211,1,0          ; pshufb        0x1d3a1(%rip),%xmm1        # 34120 <_sk_srcover_bgra_8888_sse2_lowp+0xf04>
+  DB  102,15,56,0,13,219,208,1,0          ; pshufb        0x1d0db(%rip),%xmm1        # 33b00 <_sk_srcover_bgra_8888_sse2_lowp+0xf10>
   DB  102,15,56,51,201                    ; pmovzxwd      %xmm1,%xmm1
   DB  102,73,15,58,22,200,1               ; pextrq        $0x1,%xmm1,%r8
   DB  102,72,15,126,203                   ; movq          %xmm1,%rbx
@@ -21138,7 +20987,7 @@
   DB  243,65,15,16,28,24                  ; movss         (%r8,%rbx,1),%xmm3
   DB  102,15,58,33,211,48                 ; insertps      $0x30,%xmm3,%xmm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,108,208,1,0                ; movaps        0x1d06c(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,29,166,205,1,0                ; movaps        0x1cda6(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  91                                  ; pop           %rbx
   DB  65,94                               ; pop           %r14
   DB  255,224                             ; jmpq          *%rax
@@ -21146,21 +20995,21 @@
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,67,15,196,84,72,4,2             ; pinsrw        $0x2,0x4(%r8,%r9,2),%xmm2
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,14                              ; jne           16e4f <_sk_load_tables_rgb_u16_be_sse41+0x187>
+  DB  117,14                              ; jne           16af5 <_sk_load_tables_rgb_u16_be_sse41+0x187>
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
-  DB  233,180,254,255,255                 ; jmpq          16d03 <_sk_load_tables_rgb_u16_be_sse41+0x3b>
+  DB  233,180,254,255,255                 ; jmpq          169a9 <_sk_load_tables_rgb_u16_be_sse41+0x3b>
   DB  102,71,15,110,76,72,6               ; movd          0x6(%r8,%r9,2),%xmm9
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,71,15,196,76,72,10,2            ; pinsrw        $0x2,0xa(%r8,%r9,2),%xmm9
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,24                              ; jb            16e80 <_sk_load_tables_rgb_u16_be_sse41+0x1b8>
+  DB  114,24                              ; jb            16b26 <_sk_load_tables_rgb_u16_be_sse41+0x1b8>
   DB  102,67,15,110,76,72,12              ; movd          0xc(%r8,%r9,2),%xmm1
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,67,15,196,76,72,16,2            ; pinsrw        $0x2,0x10(%r8,%r9,2),%xmm1
-  DB  233,131,254,255,255                 ; jmpq          16d03 <_sk_load_tables_rgb_u16_be_sse41+0x3b>
+  DB  233,131,254,255,255                 ; jmpq          169a9 <_sk_load_tables_rgb_u16_be_sse41+0x3b>
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  233,122,254,255,255                 ; jmpq          16d03 <_sk_load_tables_rgb_u16_be_sse41+0x3b>
+  DB  233,122,254,255,255                 ; jmpq          169a9 <_sk_load_tables_rgb_u16_be_sse41+0x3b>
 
 PUBLIC _sk_byte_tables_sse41
 _sk_byte_tables_sse41 LABEL PROC
@@ -21171,9 +21020,9 @@
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  69,15,87,219                        ; xorps         %xmm11,%xmm11
   DB  68,15,95,216                        ; maxps         %xmm0,%xmm11
-  DB  68,15,40,13,237,207,1,0             ; movaps        0x1cfed(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,13,39,205,1,0              ; movaps        0x1cd27(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,93,217                        ; minps         %xmm9,%xmm11
-  DB  68,15,40,21,193,208,1,0             ; movaps        0x1d0c1(%rip),%xmm10        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  DB  68,15,40,21,251,205,1,0             ; movaps        0x1cdfb(%rip),%xmm10        # 33950 <_sk_srcover_bgra_8888_sse2_lowp+0xd60>
   DB  69,15,89,218                        ; mulps         %xmm10,%xmm11
   DB  102,65,15,91,195                    ; cvtps2dq      %xmm11,%xmm0
   DB  102,73,15,58,22,192,1               ; pextrq        $0x1,%xmm0,%r8
@@ -21196,7 +21045,7 @@
   DB  102,15,58,32,197,3                  ; pinsrb        $0x3,%ebp,%xmm0
   DB  102,15,56,49,192                    ; pmovzxbd      %xmm0,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  68,15,40,29,134,209,1,0             ; movaps        0x1d186(%rip),%xmm11        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  68,15,40,29,192,206,1,0             ; movaps        0x1cec0(%rip),%xmm11        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  65,15,89,195                        ; mulps         %xmm11,%xmm0
   DB  69,15,87,228                        ; xorps         %xmm12,%xmm12
   DB  68,15,95,225                        ; maxps         %xmm1,%xmm12
@@ -21285,7 +21134,7 @@
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  69,15,87,219                        ; xorps         %xmm11,%xmm11
   DB  68,15,95,216                        ; maxps         %xmm0,%xmm11
-  DB  68,15,40,21,5,206,1,0               ; movaps        0x1ce05(%rip),%xmm10        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,21,63,203,1,0              ; movaps        0x1cb3f(%rip),%xmm10        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,93,218                        ; minps         %xmm10,%xmm11
   DB  69,15,89,216                        ; mulps         %xmm8,%xmm11
   DB  102,65,15,91,195                    ; cvtps2dq      %xmm11,%xmm0
@@ -21309,7 +21158,7 @@
   DB  102,15,58,32,197,3                  ; pinsrb        $0x3,%ebp,%xmm0
   DB  102,15,56,49,192                    ; pmovzxbd      %xmm0,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  68,15,40,29,166,207,1,0             ; movaps        0x1cfa6(%rip),%xmm11        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  68,15,40,29,224,204,1,0             ; movaps        0x1cce0(%rip),%xmm11        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  65,15,89,195                        ; mulps         %xmm11,%xmm0
   DB  69,15,87,228                        ; xorps         %xmm12,%xmm12
   DB  68,15,95,225                        ; maxps         %xmm1,%xmm12
@@ -21372,7 +21221,7 @@
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  68,15,95,200                        ; maxps         %xmm0,%xmm9
-  DB  68,15,93,13,150,204,1,0             ; minps         0x1cc96(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,93,13,208,201,1,0             ; minps         0x1c9d0(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  102,65,15,91,193                    ; cvtps2dq      %xmm9,%xmm0
   DB  102,72,15,58,22,192,1               ; pextrq        $0x1,%xmm0,%rax
@@ -21401,7 +21250,7 @@
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  68,15,95,201                        ; maxps         %xmm1,%xmm9
-  DB  68,15,93,13,30,204,1,0              ; minps         0x1cc1e(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,93,13,88,201,1,0              ; minps         0x1c958(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  102,65,15,91,201                    ; cvtps2dq      %xmm9,%xmm1
   DB  102,72,15,58,22,200,1               ; pextrq        $0x1,%xmm1,%rax
@@ -21430,7 +21279,7 @@
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  68,15,95,202                        ; maxps         %xmm2,%xmm9
-  DB  68,15,93,13,166,203,1,0             ; minps         0x1cba6(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,93,13,224,200,1,0             ; minps         0x1c8e0(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  102,65,15,91,209                    ; cvtps2dq      %xmm9,%xmm2
   DB  102,72,15,58,22,208,1               ; pextrq        $0x1,%xmm2,%rax
@@ -21459,7 +21308,7 @@
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  68,15,95,203                        ; maxps         %xmm3,%xmm9
-  DB  68,15,93,13,46,203,1,0              ; minps         0x1cb2e(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,93,13,104,200,1,0             ; minps         0x1c868(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  102,65,15,91,217                    ; cvtps2dq      %xmm9,%xmm3
   DB  102,72,15,58,22,216,1               ; pextrq        $0x1,%xmm3,%rax
@@ -21499,32 +21348,32 @@
   DB  69,15,198,228,0                     ; shufps        $0x0,%xmm12,%xmm12
   DB  69,15,87,219                        ; xorps         %xmm11,%xmm11
   DB  69,15,91,194                        ; cvtdq2ps      %xmm10,%xmm8
-  DB  68,15,89,5,39,205,1,0               ; mulps         0x1cd27(%rip),%xmm8        # 34140 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
-  DB  68,15,40,45,47,205,1,0              ; movaps        0x1cd2f(%rip),%xmm13        # 34150 <_sk_srcover_bgra_8888_sse2_lowp+0xf34>
+  DB  68,15,89,5,97,202,1,0               ; mulps         0x1ca61(%rip),%xmm8        # 33b20 <_sk_srcover_bgra_8888_sse2_lowp+0xf30>
+  DB  68,15,40,45,105,202,1,0             ; movaps        0x1ca69(%rip),%xmm13        # 33b30 <_sk_srcover_bgra_8888_sse2_lowp+0xf40>
   DB  69,15,84,234                        ; andps         %xmm10,%xmm13
-  DB  68,15,86,45,83,202,1,0              ; orps          0x1ca53(%rip),%xmm13        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
-  DB  68,15,88,5,43,205,1,0               ; addps         0x1cd2b(%rip),%xmm8        # 34160 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
-  DB  68,15,40,53,51,205,1,0              ; movaps        0x1cd33(%rip),%xmm14        # 34170 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
+  DB  68,15,86,45,141,199,1,0             ; orps          0x1c78d(%rip),%xmm13        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
+  DB  68,15,88,5,101,202,1,0              ; addps         0x1ca65(%rip),%xmm8        # 33b40 <_sk_srcover_bgra_8888_sse2_lowp+0xf50>
+  DB  68,15,40,53,109,202,1,0             ; movaps        0x1ca6d(%rip),%xmm14        # 33b50 <_sk_srcover_bgra_8888_sse2_lowp+0xf60>
   DB  69,15,89,245                        ; mulps         %xmm13,%xmm14
   DB  69,15,92,198                        ; subps         %xmm14,%xmm8
-  DB  68,15,88,45,51,205,1,0              ; addps         0x1cd33(%rip),%xmm13        # 34180 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
-  DB  68,15,40,53,59,205,1,0              ; movaps        0x1cd3b(%rip),%xmm14        # 34190 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
+  DB  68,15,88,45,109,202,1,0             ; addps         0x1ca6d(%rip),%xmm13        # 33b60 <_sk_srcover_bgra_8888_sse2_lowp+0xf70>
+  DB  68,15,40,53,117,202,1,0             ; movaps        0x1ca75(%rip),%xmm14        # 33b70 <_sk_srcover_bgra_8888_sse2_lowp+0xf80>
   DB  69,15,94,245                        ; divps         %xmm13,%xmm14
   DB  69,15,92,198                        ; subps         %xmm14,%xmm8
   DB  69,15,89,196                        ; mulps         %xmm12,%xmm8
   DB  102,69,15,58,8,224,1                ; roundps       $0x1,%xmm8,%xmm12
   DB  69,15,40,232                        ; movaps        %xmm8,%xmm13
   DB  69,15,92,236                        ; subps         %xmm12,%xmm13
-  DB  68,15,88,5,40,205,1,0               ; addps         0x1cd28(%rip),%xmm8        # 341a0 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
-  DB  68,15,40,37,48,205,1,0              ; movaps        0x1cd30(%rip),%xmm12        # 341b0 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
+  DB  68,15,88,5,98,202,1,0               ; addps         0x1ca62(%rip),%xmm8        # 33b80 <_sk_srcover_bgra_8888_sse2_lowp+0xf90>
+  DB  68,15,40,37,106,202,1,0             ; movaps        0x1ca6a(%rip),%xmm12        # 33b90 <_sk_srcover_bgra_8888_sse2_lowp+0xfa0>
   DB  69,15,89,229                        ; mulps         %xmm13,%xmm12
   DB  69,15,92,196                        ; subps         %xmm12,%xmm8
-  DB  68,15,40,37,48,205,1,0              ; movaps        0x1cd30(%rip),%xmm12        # 341c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  DB  68,15,40,37,106,202,1,0             ; movaps        0x1ca6a(%rip),%xmm12        # 33ba0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb0>
   DB  69,15,92,229                        ; subps         %xmm13,%xmm12
-  DB  68,15,40,45,52,205,1,0              ; movaps        0x1cd34(%rip),%xmm13        # 341d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
+  DB  68,15,40,45,110,202,1,0             ; movaps        0x1ca6e(%rip),%xmm13        # 33bb0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc0>
   DB  69,15,94,236                        ; divps         %xmm12,%xmm13
   DB  69,15,88,232                        ; addps         %xmm8,%xmm13
-  DB  68,15,89,45,52,205,1,0              ; mulps         0x1cd34(%rip),%xmm13        # 341e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  DB  68,15,89,45,110,202,1,0             ; mulps         0x1ca6e(%rip),%xmm13        # 33bc0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd0>
   DB  102,69,15,91,197                    ; cvtps2dq      %xmm13,%xmm8
   DB  69,15,194,211,4                     ; cmpneqps      %xmm11,%xmm10
   DB  69,15,84,208                        ; andps         %xmm8,%xmm10
@@ -21533,7 +21382,7 @@
   DB  69,15,88,194                        ; addps         %xmm10,%xmm8
   DB  102,69,15,56,20,193                 ; blendvps      %xmm0,%xmm9,%xmm8
   DB  69,15,95,195                        ; maxps         %xmm11,%xmm8
-  DB  68,15,93,5,181,201,1,0              ; minps         0x1c9b5(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,93,5,239,198,1,0              ; minps         0x1c6ef(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  255,224                             ; jmpq          *%rax
@@ -21562,32 +21411,32 @@
   DB  69,15,198,228,0                     ; shufps        $0x0,%xmm12,%xmm12
   DB  69,15,87,219                        ; xorps         %xmm11,%xmm11
   DB  69,15,91,242                        ; cvtdq2ps      %xmm10,%xmm14
-  DB  68,15,89,53,242,203,1,0             ; mulps         0x1cbf2(%rip),%xmm14        # 34140 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
-  DB  68,15,40,45,250,203,1,0             ; movaps        0x1cbfa(%rip),%xmm13        # 34150 <_sk_srcover_bgra_8888_sse2_lowp+0xf34>
+  DB  68,15,89,53,44,201,1,0              ; mulps         0x1c92c(%rip),%xmm14        # 33b20 <_sk_srcover_bgra_8888_sse2_lowp+0xf30>
+  DB  68,15,40,45,52,201,1,0              ; movaps        0x1c934(%rip),%xmm13        # 33b30 <_sk_srcover_bgra_8888_sse2_lowp+0xf40>
   DB  69,15,84,234                        ; andps         %xmm10,%xmm13
-  DB  68,15,86,45,30,201,1,0              ; orps          0x1c91e(%rip),%xmm13        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
-  DB  68,15,88,53,246,203,1,0             ; addps         0x1cbf6(%rip),%xmm14        # 34160 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
-  DB  15,40,13,255,203,1,0                ; movaps        0x1cbff(%rip),%xmm1        # 34170 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
+  DB  68,15,86,45,88,198,1,0              ; orps          0x1c658(%rip),%xmm13        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
+  DB  68,15,88,53,48,201,1,0              ; addps         0x1c930(%rip),%xmm14        # 33b40 <_sk_srcover_bgra_8888_sse2_lowp+0xf50>
+  DB  15,40,13,57,201,1,0                 ; movaps        0x1c939(%rip),%xmm1        # 33b50 <_sk_srcover_bgra_8888_sse2_lowp+0xf60>
   DB  65,15,89,205                        ; mulps         %xmm13,%xmm1
   DB  68,15,92,241                        ; subps         %xmm1,%xmm14
-  DB  68,15,88,45,255,203,1,0             ; addps         0x1cbff(%rip),%xmm13        # 34180 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
-  DB  15,40,13,8,204,1,0                  ; movaps        0x1cc08(%rip),%xmm1        # 34190 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
+  DB  68,15,88,45,57,201,1,0              ; addps         0x1c939(%rip),%xmm13        # 33b60 <_sk_srcover_bgra_8888_sse2_lowp+0xf70>
+  DB  15,40,13,66,201,1,0                 ; movaps        0x1c942(%rip),%xmm1        # 33b70 <_sk_srcover_bgra_8888_sse2_lowp+0xf80>
   DB  65,15,94,205                        ; divps         %xmm13,%xmm1
   DB  68,15,92,241                        ; subps         %xmm1,%xmm14
   DB  69,15,89,244                        ; mulps         %xmm12,%xmm14
   DB  102,69,15,58,8,230,1                ; roundps       $0x1,%xmm14,%xmm12
   DB  69,15,40,238                        ; movaps        %xmm14,%xmm13
   DB  69,15,92,236                        ; subps         %xmm12,%xmm13
-  DB  68,15,88,53,245,203,1,0             ; addps         0x1cbf5(%rip),%xmm14        # 341a0 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
-  DB  15,40,13,254,203,1,0                ; movaps        0x1cbfe(%rip),%xmm1        # 341b0 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
+  DB  68,15,88,53,47,201,1,0              ; addps         0x1c92f(%rip),%xmm14        # 33b80 <_sk_srcover_bgra_8888_sse2_lowp+0xf90>
+  DB  15,40,13,56,201,1,0                 ; movaps        0x1c938(%rip),%xmm1        # 33b90 <_sk_srcover_bgra_8888_sse2_lowp+0xfa0>
   DB  65,15,89,205                        ; mulps         %xmm13,%xmm1
   DB  68,15,92,241                        ; subps         %xmm1,%xmm14
-  DB  68,15,40,37,254,203,1,0             ; movaps        0x1cbfe(%rip),%xmm12        # 341c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  DB  68,15,40,37,56,201,1,0              ; movaps        0x1c938(%rip),%xmm12        # 33ba0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb0>
   DB  69,15,92,229                        ; subps         %xmm13,%xmm12
-  DB  15,40,13,3,204,1,0                  ; movaps        0x1cc03(%rip),%xmm1        # 341d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
+  DB  15,40,13,61,201,1,0                 ; movaps        0x1c93d(%rip),%xmm1        # 33bb0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc0>
   DB  65,15,94,204                        ; divps         %xmm12,%xmm1
   DB  65,15,88,206                        ; addps         %xmm14,%xmm1
-  DB  15,89,13,4,204,1,0                  ; mulps         0x1cc04(%rip),%xmm1        # 341e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  DB  15,89,13,62,201,1,0                 ; mulps         0x1c93e(%rip),%xmm1        # 33bc0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd0>
   DB  102,15,91,201                       ; cvtps2dq      %xmm1,%xmm1
   DB  69,15,194,211,4                     ; cmpneqps      %xmm11,%xmm10
   DB  68,15,84,209                        ; andps         %xmm1,%xmm10
@@ -21596,7 +21445,7 @@
   DB  65,15,88,202                        ; addps         %xmm10,%xmm1
   DB  102,65,15,56,20,201                 ; blendvps      %xmm0,%xmm9,%xmm1
   DB  65,15,95,203                        ; maxps         %xmm11,%xmm1
-  DB  15,93,13,137,200,1,0                ; minps         0x1c889(%rip),%xmm1        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,93,13,195,197,1,0                ; minps         0x1c5c3(%rip),%xmm1        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  255,224                             ; jmpq          *%rax
@@ -21625,32 +21474,32 @@
   DB  69,15,198,228,0                     ; shufps        $0x0,%xmm12,%xmm12
   DB  69,15,87,219                        ; xorps         %xmm11,%xmm11
   DB  69,15,91,242                        ; cvtdq2ps      %xmm10,%xmm14
-  DB  68,15,89,53,198,202,1,0             ; mulps         0x1cac6(%rip),%xmm14        # 34140 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
-  DB  68,15,40,45,206,202,1,0             ; movaps        0x1cace(%rip),%xmm13        # 34150 <_sk_srcover_bgra_8888_sse2_lowp+0xf34>
+  DB  68,15,89,53,0,200,1,0               ; mulps         0x1c800(%rip),%xmm14        # 33b20 <_sk_srcover_bgra_8888_sse2_lowp+0xf30>
+  DB  68,15,40,45,8,200,1,0               ; movaps        0x1c808(%rip),%xmm13        # 33b30 <_sk_srcover_bgra_8888_sse2_lowp+0xf40>
   DB  69,15,84,234                        ; andps         %xmm10,%xmm13
-  DB  68,15,86,45,242,199,1,0             ; orps          0x1c7f2(%rip),%xmm13        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
-  DB  68,15,88,53,202,202,1,0             ; addps         0x1caca(%rip),%xmm14        # 34160 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
-  DB  15,40,21,211,202,1,0                ; movaps        0x1cad3(%rip),%xmm2        # 34170 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
+  DB  68,15,86,45,44,197,1,0              ; orps          0x1c52c(%rip),%xmm13        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
+  DB  68,15,88,53,4,200,1,0               ; addps         0x1c804(%rip),%xmm14        # 33b40 <_sk_srcover_bgra_8888_sse2_lowp+0xf50>
+  DB  15,40,21,13,200,1,0                 ; movaps        0x1c80d(%rip),%xmm2        # 33b50 <_sk_srcover_bgra_8888_sse2_lowp+0xf60>
   DB  65,15,89,213                        ; mulps         %xmm13,%xmm2
   DB  68,15,92,242                        ; subps         %xmm2,%xmm14
-  DB  68,15,88,45,211,202,1,0             ; addps         0x1cad3(%rip),%xmm13        # 34180 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
-  DB  15,40,21,220,202,1,0                ; movaps        0x1cadc(%rip),%xmm2        # 34190 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
+  DB  68,15,88,45,13,200,1,0              ; addps         0x1c80d(%rip),%xmm13        # 33b60 <_sk_srcover_bgra_8888_sse2_lowp+0xf70>
+  DB  15,40,21,22,200,1,0                 ; movaps        0x1c816(%rip),%xmm2        # 33b70 <_sk_srcover_bgra_8888_sse2_lowp+0xf80>
   DB  65,15,94,213                        ; divps         %xmm13,%xmm2
   DB  68,15,92,242                        ; subps         %xmm2,%xmm14
   DB  69,15,89,244                        ; mulps         %xmm12,%xmm14
   DB  102,69,15,58,8,230,1                ; roundps       $0x1,%xmm14,%xmm12
   DB  69,15,40,238                        ; movaps        %xmm14,%xmm13
   DB  69,15,92,236                        ; subps         %xmm12,%xmm13
-  DB  68,15,88,53,201,202,1,0             ; addps         0x1cac9(%rip),%xmm14        # 341a0 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
-  DB  15,40,21,210,202,1,0                ; movaps        0x1cad2(%rip),%xmm2        # 341b0 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
+  DB  68,15,88,53,3,200,1,0               ; addps         0x1c803(%rip),%xmm14        # 33b80 <_sk_srcover_bgra_8888_sse2_lowp+0xf90>
+  DB  15,40,21,12,200,1,0                 ; movaps        0x1c80c(%rip),%xmm2        # 33b90 <_sk_srcover_bgra_8888_sse2_lowp+0xfa0>
   DB  65,15,89,213                        ; mulps         %xmm13,%xmm2
   DB  68,15,92,242                        ; subps         %xmm2,%xmm14
-  DB  68,15,40,37,210,202,1,0             ; movaps        0x1cad2(%rip),%xmm12        # 341c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  DB  68,15,40,37,12,200,1,0              ; movaps        0x1c80c(%rip),%xmm12        # 33ba0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb0>
   DB  69,15,92,229                        ; subps         %xmm13,%xmm12
-  DB  15,40,21,215,202,1,0                ; movaps        0x1cad7(%rip),%xmm2        # 341d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
+  DB  15,40,21,17,200,1,0                 ; movaps        0x1c811(%rip),%xmm2        # 33bb0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc0>
   DB  65,15,94,212                        ; divps         %xmm12,%xmm2
   DB  65,15,88,214                        ; addps         %xmm14,%xmm2
-  DB  15,89,21,216,202,1,0                ; mulps         0x1cad8(%rip),%xmm2        # 341e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  DB  15,89,21,18,200,1,0                 ; mulps         0x1c812(%rip),%xmm2        # 33bc0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd0>
   DB  102,15,91,210                       ; cvtps2dq      %xmm2,%xmm2
   DB  69,15,194,211,4                     ; cmpneqps      %xmm11,%xmm10
   DB  68,15,84,210                        ; andps         %xmm2,%xmm10
@@ -21659,7 +21508,7 @@
   DB  65,15,88,210                        ; addps         %xmm10,%xmm2
   DB  102,65,15,56,20,209                 ; blendvps      %xmm0,%xmm9,%xmm2
   DB  65,15,95,211                        ; maxps         %xmm11,%xmm2
-  DB  15,93,21,93,199,1,0                 ; minps         0x1c75d(%rip),%xmm2        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,93,21,151,196,1,0                ; minps         0x1c497(%rip),%xmm2        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  255,224                             ; jmpq          *%rax
@@ -21688,32 +21537,32 @@
   DB  69,15,198,228,0                     ; shufps        $0x0,%xmm12,%xmm12
   DB  69,15,87,219                        ; xorps         %xmm11,%xmm11
   DB  69,15,91,242                        ; cvtdq2ps      %xmm10,%xmm14
-  DB  68,15,89,53,154,201,1,0             ; mulps         0x1c99a(%rip),%xmm14        # 34140 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
-  DB  68,15,40,45,162,201,1,0             ; movaps        0x1c9a2(%rip),%xmm13        # 34150 <_sk_srcover_bgra_8888_sse2_lowp+0xf34>
+  DB  68,15,89,53,212,198,1,0             ; mulps         0x1c6d4(%rip),%xmm14        # 33b20 <_sk_srcover_bgra_8888_sse2_lowp+0xf30>
+  DB  68,15,40,45,220,198,1,0             ; movaps        0x1c6dc(%rip),%xmm13        # 33b30 <_sk_srcover_bgra_8888_sse2_lowp+0xf40>
   DB  69,15,84,234                        ; andps         %xmm10,%xmm13
-  DB  68,15,86,45,198,198,1,0             ; orps          0x1c6c6(%rip),%xmm13        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
-  DB  68,15,88,53,158,201,1,0             ; addps         0x1c99e(%rip),%xmm14        # 34160 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
-  DB  15,40,29,167,201,1,0                ; movaps        0x1c9a7(%rip),%xmm3        # 34170 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
+  DB  68,15,86,45,0,196,1,0               ; orps          0x1c400(%rip),%xmm13        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
+  DB  68,15,88,53,216,198,1,0             ; addps         0x1c6d8(%rip),%xmm14        # 33b40 <_sk_srcover_bgra_8888_sse2_lowp+0xf50>
+  DB  15,40,29,225,198,1,0                ; movaps        0x1c6e1(%rip),%xmm3        # 33b50 <_sk_srcover_bgra_8888_sse2_lowp+0xf60>
   DB  65,15,89,221                        ; mulps         %xmm13,%xmm3
   DB  68,15,92,243                        ; subps         %xmm3,%xmm14
-  DB  68,15,88,45,167,201,1,0             ; addps         0x1c9a7(%rip),%xmm13        # 34180 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
-  DB  15,40,29,176,201,1,0                ; movaps        0x1c9b0(%rip),%xmm3        # 34190 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
+  DB  68,15,88,45,225,198,1,0             ; addps         0x1c6e1(%rip),%xmm13        # 33b60 <_sk_srcover_bgra_8888_sse2_lowp+0xf70>
+  DB  15,40,29,234,198,1,0                ; movaps        0x1c6ea(%rip),%xmm3        # 33b70 <_sk_srcover_bgra_8888_sse2_lowp+0xf80>
   DB  65,15,94,221                        ; divps         %xmm13,%xmm3
   DB  68,15,92,243                        ; subps         %xmm3,%xmm14
   DB  69,15,89,244                        ; mulps         %xmm12,%xmm14
   DB  102,69,15,58,8,230,1                ; roundps       $0x1,%xmm14,%xmm12
   DB  69,15,40,238                        ; movaps        %xmm14,%xmm13
   DB  69,15,92,236                        ; subps         %xmm12,%xmm13
-  DB  68,15,88,53,157,201,1,0             ; addps         0x1c99d(%rip),%xmm14        # 341a0 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
-  DB  15,40,29,166,201,1,0                ; movaps        0x1c9a6(%rip),%xmm3        # 341b0 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
+  DB  68,15,88,53,215,198,1,0             ; addps         0x1c6d7(%rip),%xmm14        # 33b80 <_sk_srcover_bgra_8888_sse2_lowp+0xf90>
+  DB  15,40,29,224,198,1,0                ; movaps        0x1c6e0(%rip),%xmm3        # 33b90 <_sk_srcover_bgra_8888_sse2_lowp+0xfa0>
   DB  65,15,89,221                        ; mulps         %xmm13,%xmm3
   DB  68,15,92,243                        ; subps         %xmm3,%xmm14
-  DB  68,15,40,37,166,201,1,0             ; movaps        0x1c9a6(%rip),%xmm12        # 341c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  DB  68,15,40,37,224,198,1,0             ; movaps        0x1c6e0(%rip),%xmm12        # 33ba0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb0>
   DB  69,15,92,229                        ; subps         %xmm13,%xmm12
-  DB  15,40,29,171,201,1,0                ; movaps        0x1c9ab(%rip),%xmm3        # 341d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
+  DB  15,40,29,229,198,1,0                ; movaps        0x1c6e5(%rip),%xmm3        # 33bb0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc0>
   DB  65,15,94,220                        ; divps         %xmm12,%xmm3
   DB  65,15,88,222                        ; addps         %xmm14,%xmm3
-  DB  15,89,29,172,201,1,0                ; mulps         0x1c9ac(%rip),%xmm3        # 341e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  DB  15,89,29,230,198,1,0                ; mulps         0x1c6e6(%rip),%xmm3        # 33bc0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd0>
   DB  102,15,91,219                       ; cvtps2dq      %xmm3,%xmm3
   DB  69,15,194,211,4                     ; cmpneqps      %xmm11,%xmm10
   DB  68,15,84,211                        ; andps         %xmm3,%xmm10
@@ -21722,7 +21571,7 @@
   DB  65,15,88,218                        ; addps         %xmm10,%xmm3
   DB  102,65,15,56,20,217                 ; blendvps      %xmm0,%xmm9,%xmm3
   DB  65,15,95,219                        ; maxps         %xmm11,%xmm3
-  DB  15,93,29,49,198,1,0                 ; minps         0x1c631(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,93,29,107,195,1,0                ; minps         0x1c36b(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  255,224                             ; jmpq          *%rax
@@ -21739,21 +21588,21 @@
   DB  68,15,40,209                        ; movaps        %xmm1,%xmm10
   DB  15,40,224                           ; movaps        %xmm0,%xmm4
   DB  15,91,244                           ; cvtdq2ps      %xmm4,%xmm6
-  DB  15,40,5,168,200,1,0                 ; movaps        0x1c8a8(%rip),%xmm0        # 34140 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
+  DB  15,40,5,226,197,1,0                 ; movaps        0x1c5e2(%rip),%xmm0        # 33b20 <_sk_srcover_bgra_8888_sse2_lowp+0xf30>
   DB  15,89,240                           ; mulps         %xmm0,%xmm6
   DB  15,40,232                           ; movaps        %xmm0,%xmm5
-  DB  68,15,40,5,170,200,1,0              ; movaps        0x1c8aa(%rip),%xmm8        # 34150 <_sk_srcover_bgra_8888_sse2_lowp+0xf34>
+  DB  68,15,40,5,228,197,1,0              ; movaps        0x1c5e4(%rip),%xmm8        # 33b30 <_sk_srcover_bgra_8888_sse2_lowp+0xf40>
   DB  15,40,196                           ; movaps        %xmm4,%xmm0
   DB  65,15,84,192                        ; andps         %xmm8,%xmm0
-  DB  15,86,5,204,197,1,0                 ; orps          0x1c5cc(%rip),%xmm0        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
-  DB  15,88,53,165,200,1,0                ; addps         0x1c8a5(%rip),%xmm6        # 34160 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
-  DB  68,15,40,29,173,200,1,0             ; movaps        0x1c8ad(%rip),%xmm11        # 34170 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
+  DB  15,86,5,6,195,1,0                   ; orps          0x1c306(%rip),%xmm0        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
+  DB  15,88,53,223,197,1,0                ; addps         0x1c5df(%rip),%xmm6        # 33b40 <_sk_srcover_bgra_8888_sse2_lowp+0xf50>
+  DB  68,15,40,29,231,197,1,0             ; movaps        0x1c5e7(%rip),%xmm11        # 33b50 <_sk_srcover_bgra_8888_sse2_lowp+0xf60>
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  65,15,89,203                        ; mulps         %xmm11,%xmm1
   DB  15,92,241                           ; subps         %xmm1,%xmm6
-  DB  68,15,40,61,171,200,1,0             ; movaps        0x1c8ab(%rip),%xmm15        # 34180 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  DB  68,15,40,61,229,197,1,0             ; movaps        0x1c5e5(%rip),%xmm15        # 33b60 <_sk_srcover_bgra_8888_sse2_lowp+0xf70>
   DB  65,15,88,199                        ; addps         %xmm15,%xmm0
-  DB  68,15,40,53,175,200,1,0             ; movaps        0x1c8af(%rip),%xmm14        # 34190 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
+  DB  68,15,40,53,233,197,1,0             ; movaps        0x1c5e9(%rip),%xmm14        # 33b70 <_sk_srcover_bgra_8888_sse2_lowp+0xf80>
   DB  65,15,40,206                        ; movaps        %xmm14,%xmm1
   DB  15,94,200                           ; divps         %xmm0,%xmm1
   DB  15,92,241                           ; subps         %xmm1,%xmm6
@@ -21764,19 +21613,19 @@
   DB  102,15,58,8,198,1                   ; roundps       $0x1,%xmm6,%xmm0
   DB  15,40,206                           ; movaps        %xmm6,%xmm1
   DB  15,92,200                           ; subps         %xmm0,%xmm1
-  DB  15,88,53,149,200,1,0                ; addps         0x1c895(%rip),%xmm6        # 341a0 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
-  DB  15,40,29,174,200,1,0                ; movaps        0x1c8ae(%rip),%xmm3        # 341c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  DB  15,88,53,207,197,1,0                ; addps         0x1c5cf(%rip),%xmm6        # 33b80 <_sk_srcover_bgra_8888_sse2_lowp+0xf90>
+  DB  15,40,29,232,197,1,0                ; movaps        0x1c5e8(%rip),%xmm3        # 33ba0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb0>
   DB  68,15,40,203                        ; movaps        %xmm3,%xmm9
   DB  68,15,92,201                        ; subps         %xmm1,%xmm9
   DB  15,40,193                           ; movaps        %xmm1,%xmm0
-  DB  15,40,13,140,200,1,0                ; movaps        0x1c88c(%rip),%xmm1        # 341b0 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
+  DB  15,40,13,198,197,1,0                ; movaps        0x1c5c6(%rip),%xmm1        # 33b90 <_sk_srcover_bgra_8888_sse2_lowp+0xfa0>
   DB  15,89,193                           ; mulps         %xmm1,%xmm0
   DB  15,92,240                           ; subps         %xmm0,%xmm6
-  DB  68,15,40,45,158,200,1,0             ; movaps        0x1c89e(%rip),%xmm13        # 341d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
+  DB  68,15,40,45,216,197,1,0             ; movaps        0x1c5d8(%rip),%xmm13        # 33bb0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc0>
   DB  65,15,40,197                        ; movaps        %xmm13,%xmm0
   DB  65,15,94,193                        ; divps         %xmm9,%xmm0
   DB  15,88,198                           ; addps         %xmm6,%xmm0
-  DB  68,15,40,13,155,200,1,0             ; movaps        0x1c89b(%rip),%xmm9        # 341e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  DB  68,15,40,13,213,197,1,0             ; movaps        0x1c5d5(%rip),%xmm9        # 33bc0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd0>
   DB  65,15,89,193                        ; mulps         %xmm9,%xmm0
   DB  102,15,91,192                       ; cvtps2dq      %xmm0,%xmm0
   DB  15,87,246                           ; xorps         %xmm6,%xmm6
@@ -21786,9 +21635,9 @@
   DB  15,89,197                           ; mulps         %xmm5,%xmm0
   DB  65,15,40,250                        ; movaps        %xmm10,%xmm7
   DB  65,15,84,248                        ; andps         %xmm8,%xmm7
-  DB  15,40,53,19,197,1,0                 ; movaps        0x1c513(%rip),%xmm6        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  15,40,53,77,194,1,0                 ; movaps        0x1c24d(%rip),%xmm6        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  15,86,254                           ; orps          %xmm6,%xmm7
-  DB  15,88,5,233,199,1,0                 ; addps         0x1c7e9(%rip),%xmm0        # 34160 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
+  DB  15,88,5,35,197,1,0                  ; addps         0x1c523(%rip),%xmm0        # 33b40 <_sk_srcover_bgra_8888_sse2_lowp+0xf50>
   DB  15,40,239                           ; movaps        %xmm7,%xmm5
   DB  65,15,89,235                        ; mulps         %xmm11,%xmm5
   DB  15,92,197                           ; subps         %xmm5,%xmm0
@@ -21800,7 +21649,7 @@
   DB  102,15,58,8,232,1                   ; roundps       $0x1,%xmm0,%xmm5
   DB  15,40,248                           ; movaps        %xmm0,%xmm7
   DB  15,92,253                           ; subps         %xmm5,%xmm7
-  DB  68,15,40,61,250,199,1,0             ; movaps        0x1c7fa(%rip),%xmm15        # 341a0 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  DB  68,15,40,61,52,197,1,0              ; movaps        0x1c534(%rip),%xmm15        # 33b80 <_sk_srcover_bgra_8888_sse2_lowp+0xf90>
   DB  65,15,88,199                        ; addps         %xmm15,%xmm0
   DB  15,40,235                           ; movaps        %xmm3,%xmm5
   DB  15,92,239                           ; subps         %xmm7,%xmm5
@@ -21815,13 +21664,13 @@
   DB  68,15,194,215,4                     ; cmpneqps      %xmm7,%xmm10
   DB  68,15,84,208                        ; andps         %xmm0,%xmm10
   DB  65,15,91,196                        ; cvtdq2ps      %xmm12,%xmm0
-  DB  15,89,5,97,199,1,0                  ; mulps         0x1c761(%rip),%xmm0        # 34140 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
+  DB  15,89,5,155,196,1,0                 ; mulps         0x1c49b(%rip),%xmm0        # 33b20 <_sk_srcover_bgra_8888_sse2_lowp+0xf30>
   DB  69,15,84,196                        ; andps         %xmm12,%xmm8
   DB  68,15,86,198                        ; orps          %xmm6,%xmm8
-  DB  15,88,5,114,199,1,0                 ; addps         0x1c772(%rip),%xmm0        # 34160 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
+  DB  15,88,5,172,196,1,0                 ; addps         0x1c4ac(%rip),%xmm0        # 33b40 <_sk_srcover_bgra_8888_sse2_lowp+0xf50>
   DB  69,15,89,216                        ; mulps         %xmm8,%xmm11
   DB  65,15,92,195                        ; subps         %xmm11,%xmm0
-  DB  68,15,88,5,130,199,1,0              ; addps         0x1c782(%rip),%xmm8        # 34180 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  DB  68,15,88,5,188,196,1,0              ; addps         0x1c4bc(%rip),%xmm8        # 33b60 <_sk_srcover_bgra_8888_sse2_lowp+0xf70>
   DB  69,15,94,240                        ; divps         %xmm8,%xmm14
   DB  65,15,92,198                        ; subps         %xmm14,%xmm0
   DB  15,89,194                           ; mulps         %xmm2,%xmm0
@@ -21862,21 +21711,21 @@
   DB  15,41,76,36,16                      ; movaps        %xmm1,0x10(%rsp)
   DB  15,41,4,36                          ; movaps        %xmm0,(%rsp)
   DB  15,91,221                           ; cvtdq2ps      %xmm5,%xmm3
-  DB  15,40,5,168,198,1,0                 ; movaps        0x1c6a8(%rip),%xmm0        # 34140 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
+  DB  15,40,5,226,195,1,0                 ; movaps        0x1c3e2(%rip),%xmm0        # 33b20 <_sk_srcover_bgra_8888_sse2_lowp+0xf30>
   DB  15,89,216                           ; mulps         %xmm0,%xmm3
   DB  15,40,240                           ; movaps        %xmm0,%xmm6
-  DB  68,15,40,5,170,198,1,0              ; movaps        0x1c6aa(%rip),%xmm8        # 34150 <_sk_srcover_bgra_8888_sse2_lowp+0xf34>
+  DB  68,15,40,5,228,195,1,0              ; movaps        0x1c3e4(%rip),%xmm8        # 33b30 <_sk_srcover_bgra_8888_sse2_lowp+0xf40>
   DB  15,40,197                           ; movaps        %xmm5,%xmm0
   DB  65,15,84,192                        ; andps         %xmm8,%xmm0
-  DB  15,86,5,204,195,1,0                 ; orps          0x1c3cc(%rip),%xmm0        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
-  DB  15,88,29,165,198,1,0                ; addps         0x1c6a5(%rip),%xmm3        # 34160 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
-  DB  68,15,40,29,173,198,1,0             ; movaps        0x1c6ad(%rip),%xmm11        # 34170 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
+  DB  15,86,5,6,193,1,0                   ; orps          0x1c106(%rip),%xmm0        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
+  DB  15,88,29,223,195,1,0                ; addps         0x1c3df(%rip),%xmm3        # 33b40 <_sk_srcover_bgra_8888_sse2_lowp+0xf50>
+  DB  68,15,40,29,231,195,1,0             ; movaps        0x1c3e7(%rip),%xmm11        # 33b50 <_sk_srcover_bgra_8888_sse2_lowp+0xf60>
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  65,15,89,203                        ; mulps         %xmm11,%xmm1
   DB  15,92,217                           ; subps         %xmm1,%xmm3
-  DB  68,15,40,61,171,198,1,0             ; movaps        0x1c6ab(%rip),%xmm15        # 34180 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  DB  68,15,40,61,229,195,1,0             ; movaps        0x1c3e5(%rip),%xmm15        # 33b60 <_sk_srcover_bgra_8888_sse2_lowp+0xf70>
   DB  65,15,88,199                        ; addps         %xmm15,%xmm0
-  DB  68,15,40,53,175,198,1,0             ; movaps        0x1c6af(%rip),%xmm14        # 34190 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
+  DB  68,15,40,53,233,195,1,0             ; movaps        0x1c3e9(%rip),%xmm14        # 33b70 <_sk_srcover_bgra_8888_sse2_lowp+0xf80>
   DB  65,15,40,206                        ; movaps        %xmm14,%xmm1
   DB  15,94,200                           ; divps         %xmm0,%xmm1
   DB  15,92,217                           ; subps         %xmm1,%xmm3
@@ -21887,19 +21736,19 @@
   DB  102,15,58,8,195,1                   ; roundps       $0x1,%xmm3,%xmm0
   DB  15,40,203                           ; movaps        %xmm3,%xmm1
   DB  15,92,200                           ; subps         %xmm0,%xmm1
-  DB  15,88,29,149,198,1,0                ; addps         0x1c695(%rip),%xmm3        # 341a0 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
-  DB  15,40,37,174,198,1,0                ; movaps        0x1c6ae(%rip),%xmm4        # 341c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  DB  15,88,29,207,195,1,0                ; addps         0x1c3cf(%rip),%xmm3        # 33b80 <_sk_srcover_bgra_8888_sse2_lowp+0xf90>
+  DB  15,40,37,232,195,1,0                ; movaps        0x1c3e8(%rip),%xmm4        # 33ba0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb0>
   DB  68,15,40,204                        ; movaps        %xmm4,%xmm9
   DB  68,15,92,201                        ; subps         %xmm1,%xmm9
   DB  15,40,193                           ; movaps        %xmm1,%xmm0
-  DB  15,40,13,140,198,1,0                ; movaps        0x1c68c(%rip),%xmm1        # 341b0 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
+  DB  15,40,13,198,195,1,0                ; movaps        0x1c3c6(%rip),%xmm1        # 33b90 <_sk_srcover_bgra_8888_sse2_lowp+0xfa0>
   DB  15,89,193                           ; mulps         %xmm1,%xmm0
   DB  15,92,216                           ; subps         %xmm0,%xmm3
-  DB  68,15,40,45,158,198,1,0             ; movaps        0x1c69e(%rip),%xmm13        # 341d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
+  DB  68,15,40,45,216,195,1,0             ; movaps        0x1c3d8(%rip),%xmm13        # 33bb0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc0>
   DB  65,15,40,197                        ; movaps        %xmm13,%xmm0
   DB  65,15,94,193                        ; divps         %xmm9,%xmm0
   DB  15,88,195                           ; addps         %xmm3,%xmm0
-  DB  68,15,40,13,155,198,1,0             ; movaps        0x1c69b(%rip),%xmm9        # 341e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  DB  68,15,40,13,213,195,1,0             ; movaps        0x1c3d5(%rip),%xmm9        # 33bc0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd0>
   DB  65,15,89,193                        ; mulps         %xmm9,%xmm0
   DB  102,15,91,192                       ; cvtps2dq      %xmm0,%xmm0
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
@@ -21909,9 +21758,9 @@
   DB  15,89,198                           ; mulps         %xmm6,%xmm0
   DB  65,15,40,250                        ; movaps        %xmm10,%xmm7
   DB  65,15,84,248                        ; andps         %xmm8,%xmm7
-  DB  15,40,29,19,195,1,0                 ; movaps        0x1c313(%rip),%xmm3        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  15,40,29,77,192,1,0                 ; movaps        0x1c04d(%rip),%xmm3        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  15,86,251                           ; orps          %xmm3,%xmm7
-  DB  15,88,5,233,197,1,0                 ; addps         0x1c5e9(%rip),%xmm0        # 34160 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
+  DB  15,88,5,35,195,1,0                  ; addps         0x1c323(%rip),%xmm0        # 33b40 <_sk_srcover_bgra_8888_sse2_lowp+0xf50>
   DB  15,40,247                           ; movaps        %xmm7,%xmm6
   DB  65,15,89,243                        ; mulps         %xmm11,%xmm6
   DB  15,92,198                           ; subps         %xmm6,%xmm0
@@ -21923,7 +21772,7 @@
   DB  102,15,58,8,240,1                   ; roundps       $0x1,%xmm0,%xmm6
   DB  15,40,248                           ; movaps        %xmm0,%xmm7
   DB  15,92,254                           ; subps         %xmm6,%xmm7
-  DB  68,15,40,61,250,197,1,0             ; movaps        0x1c5fa(%rip),%xmm15        # 341a0 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  DB  68,15,40,61,52,195,1,0              ; movaps        0x1c334(%rip),%xmm15        # 33b80 <_sk_srcover_bgra_8888_sse2_lowp+0xf90>
   DB  65,15,88,199                        ; addps         %xmm15,%xmm0
   DB  15,40,244                           ; movaps        %xmm4,%xmm6
   DB  15,92,247                           ; subps         %xmm7,%xmm6
@@ -21938,13 +21787,13 @@
   DB  68,15,194,215,4                     ; cmpneqps      %xmm7,%xmm10
   DB  68,15,84,208                        ; andps         %xmm0,%xmm10
   DB  65,15,91,196                        ; cvtdq2ps      %xmm12,%xmm0
-  DB  15,89,5,97,197,1,0                  ; mulps         0x1c561(%rip),%xmm0        # 34140 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
+  DB  15,89,5,155,194,1,0                 ; mulps         0x1c29b(%rip),%xmm0        # 33b20 <_sk_srcover_bgra_8888_sse2_lowp+0xf30>
   DB  69,15,84,196                        ; andps         %xmm12,%xmm8
   DB  68,15,86,195                        ; orps          %xmm3,%xmm8
-  DB  15,88,5,114,197,1,0                 ; addps         0x1c572(%rip),%xmm0        # 34160 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
+  DB  15,88,5,172,194,1,0                 ; addps         0x1c2ac(%rip),%xmm0        # 33b40 <_sk_srcover_bgra_8888_sse2_lowp+0xf50>
   DB  69,15,89,216                        ; mulps         %xmm8,%xmm11
   DB  65,15,92,195                        ; subps         %xmm11,%xmm0
-  DB  68,15,88,5,130,197,1,0              ; addps         0x1c582(%rip),%xmm8        # 34180 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  DB  68,15,88,5,188,194,1,0              ; addps         0x1c2bc(%rip),%xmm8        # 33b60 <_sk_srcover_bgra_8888_sse2_lowp+0xf70>
   DB  69,15,94,240                        ; divps         %xmm8,%xmm14
   DB  65,15,92,198                        ; subps         %xmm14,%xmm0
   DB  15,89,194                           ; mulps         %xmm2,%xmm0
@@ -21976,29 +21825,29 @@
 PUBLIC _sk_lab_to_xyz_sse41
 _sk_lab_to_xyz_sse41 LABEL PROC
   DB  68,15,40,192                        ; movaps        %xmm0,%xmm8
-  DB  68,15,89,5,125,197,1,0              ; mulps         0x1c57d(%rip),%xmm8        # 341f0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
-  DB  68,15,40,13,245,194,1,0             ; movaps        0x1c2f5(%rip),%xmm9        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  DB  68,15,89,5,183,194,1,0              ; mulps         0x1c2b7(%rip),%xmm8        # 33bd0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe0>
+  DB  68,15,40,13,47,192,1,0              ; movaps        0x1c02f(%rip),%xmm9        # 33950 <_sk_srcover_bgra_8888_sse2_lowp+0xd60>
   DB  65,15,89,201                        ; mulps         %xmm9,%xmm1
-  DB  15,40,5,122,197,1,0                 ; movaps        0x1c57a(%rip),%xmm0        # 34200 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
+  DB  15,40,5,180,194,1,0                 ; movaps        0x1c2b4(%rip),%xmm0        # 33be0 <_sk_srcover_bgra_8888_sse2_lowp+0xff0>
   DB  15,88,200                           ; addps         %xmm0,%xmm1
   DB  65,15,89,209                        ; mulps         %xmm9,%xmm2
   DB  15,88,208                           ; addps         %xmm0,%xmm2
-  DB  68,15,88,5,120,197,1,0              ; addps         0x1c578(%rip),%xmm8        # 34210 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
-  DB  68,15,89,5,128,197,1,0              ; mulps         0x1c580(%rip),%xmm8        # 34220 <_sk_srcover_bgra_8888_sse2_lowp+0x1004>
-  DB  15,89,13,137,197,1,0                ; mulps         0x1c589(%rip),%xmm1        # 34230 <_sk_srcover_bgra_8888_sse2_lowp+0x1014>
+  DB  68,15,88,5,178,194,1,0              ; addps         0x1c2b2(%rip),%xmm8        # 33bf0 <_sk_srcover_bgra_8888_sse2_lowp+0x1000>
+  DB  68,15,89,5,186,194,1,0              ; mulps         0x1c2ba(%rip),%xmm8        # 33c00 <_sk_srcover_bgra_8888_sse2_lowp+0x1010>
+  DB  15,89,13,195,194,1,0                ; mulps         0x1c2c3(%rip),%xmm1        # 33c10 <_sk_srcover_bgra_8888_sse2_lowp+0x1020>
   DB  65,15,88,200                        ; addps         %xmm8,%xmm1
-  DB  15,89,21,142,197,1,0                ; mulps         0x1c58e(%rip),%xmm2        # 34240 <_sk_srcover_bgra_8888_sse2_lowp+0x1024>
+  DB  15,89,21,200,194,1,0                ; mulps         0x1c2c8(%rip),%xmm2        # 33c20 <_sk_srcover_bgra_8888_sse2_lowp+0x1030>
   DB  69,15,40,208                        ; movaps        %xmm8,%xmm10
   DB  68,15,92,210                        ; subps         %xmm2,%xmm10
   DB  68,15,40,217                        ; movaps        %xmm1,%xmm11
   DB  69,15,89,219                        ; mulps         %xmm11,%xmm11
   DB  68,15,89,217                        ; mulps         %xmm1,%xmm11
-  DB  68,15,40,13,130,197,1,0             ; movaps        0x1c582(%rip),%xmm9        # 34250 <_sk_srcover_bgra_8888_sse2_lowp+0x1034>
+  DB  68,15,40,13,188,194,1,0             ; movaps        0x1c2bc(%rip),%xmm9        # 33c30 <_sk_srcover_bgra_8888_sse2_lowp+0x1040>
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
   DB  65,15,194,195,1                     ; cmpltps       %xmm11,%xmm0
-  DB  15,40,21,130,197,1,0                ; movaps        0x1c582(%rip),%xmm2        # 34260 <_sk_srcover_bgra_8888_sse2_lowp+0x1044>
+  DB  15,40,21,188,194,1,0                ; movaps        0x1c2bc(%rip),%xmm2        # 33c40 <_sk_srcover_bgra_8888_sse2_lowp+0x1050>
   DB  15,88,202                           ; addps         %xmm2,%xmm1
-  DB  68,15,40,37,135,197,1,0             ; movaps        0x1c587(%rip),%xmm12        # 34270 <_sk_srcover_bgra_8888_sse2_lowp+0x1054>
+  DB  68,15,40,37,193,194,1,0             ; movaps        0x1c2c1(%rip),%xmm12        # 33c50 <_sk_srcover_bgra_8888_sse2_lowp+0x1060>
   DB  65,15,89,204                        ; mulps         %xmm12,%xmm1
   DB  102,65,15,56,20,203                 ; blendvps      %xmm0,%xmm11,%xmm1
   DB  69,15,40,216                        ; movaps        %xmm8,%xmm11
@@ -22017,8 +21866,8 @@
   DB  65,15,89,212                        ; mulps         %xmm12,%xmm2
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
   DB  102,65,15,56,20,211                 ; blendvps      %xmm0,%xmm11,%xmm2
-  DB  15,89,13,64,197,1,0                 ; mulps         0x1c540(%rip),%xmm1        # 34280 <_sk_srcover_bgra_8888_sse2_lowp+0x1064>
-  DB  15,89,21,73,197,1,0                 ; mulps         0x1c549(%rip),%xmm2        # 34290 <_sk_srcover_bgra_8888_sse2_lowp+0x1074>
+  DB  15,89,13,122,194,1,0                ; mulps         0x1c27a(%rip),%xmm1        # 33c60 <_sk_srcover_bgra_8888_sse2_lowp+0x1070>
+  DB  15,89,21,131,194,1,0                ; mulps         0x1c283(%rip),%xmm2        # 33c70 <_sk_srcover_bgra_8888_sse2_lowp+0x1080>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,40,193                           ; movaps        %xmm1,%xmm0
   DB  65,15,40,200                        ; movaps        %xmm8,%xmm1
@@ -22027,82 +21876,78 @@
 PUBLIC _sk_load_a8_sse41
 _sk_load_a8_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,39                              ; jne           17d91 <_sk_load_a8_sse41+0x3f>
-  DB  102,67,15,56,49,4,16                ; pmovzxbd      (%r8,%r10,1),%xmm0
-  DB  102,15,219,5,199,193,1,0            ; pand          0x1c1c7(%rip),%xmm0        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  117,39                              ; jne           17a31 <_sk_load_a8_sse41+0x39>
+  DB  102,65,15,56,49,4,16                ; pmovzxbd      (%r8,%rdx,1),%xmm0
+  DB  102,15,219,5,7,191,1,0              ; pand          0x1bf07(%rip),%xmm0        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  15,91,216                           ; cvtdq2ps      %xmm0,%xmm3
-  DB  15,89,29,29,195,1,0                 ; mulps         0x1c31d(%rip),%xmm3        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  15,89,29,93,192,1,0                 ; mulps         0x1c05d(%rip),%xmm3        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,53                              ; je            17dd3 <_sk_load_a8_sse41+0x81>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,49                              ; je            17a6a <_sk_load_a8_sse41+0x72>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            17dbd <_sk_load_a8_sse41+0x6b>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,195                             ; jne           17d71 <_sk_load_a8_sse41+0x1f>
-  DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,19                              ; je            17a54 <_sk_load_a8_sse41+0x5c>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,204                             ; jne           17a11 <_sk_load_a8_sse41+0x19>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,15,112,192,69                   ; pshufd        $0x45,%xmm0,%xmm0
-  DB  67,15,183,4,16                      ; movzwl        (%r8,%r10,1),%eax
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  102,15,110,200                      ; movd          %eax,%xmm1
   DB  102,15,56,49,201                    ; pmovzxbd      %xmm1,%xmm1
   DB  102,15,58,14,193,15                 ; pblendw       $0xf,%xmm1,%xmm0
-  DB  235,158                             ; jmp           17d71 <_sk_load_a8_sse41+0x1f>
-  DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
+  DB  235,167                             ; jmp           17a11 <_sk_load_a8_sse41+0x19>
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
-  DB  235,147                             ; jmp           17d71 <_sk_load_a8_sse41+0x1f>
+  DB  235,156                             ; jmp           17a11 <_sk_load_a8_sse41+0x19>
 
 PUBLIC _sk_load_a8_dst_sse41
 _sk_load_a8_dst_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,39                              ; jne           17e1d <_sk_load_a8_dst_sse41+0x3f>
-  DB  102,67,15,56,49,36,16               ; pmovzxbd      (%r8,%r10,1),%xmm4
-  DB  102,15,219,37,59,193,1,0            ; pand          0x1c13b(%rip),%xmm4        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  117,39                              ; jne           17aae <_sk_load_a8_dst_sse41+0x39>
+  DB  102,65,15,56,49,36,16               ; pmovzxbd      (%r8,%rdx,1),%xmm4
+  DB  102,15,219,37,138,190,1,0           ; pand          0x1be8a(%rip),%xmm4        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  15,91,252                           ; cvtdq2ps      %xmm4,%xmm7
-  DB  15,89,61,145,194,1,0                ; mulps         0x1c291(%rip),%xmm7        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  15,89,61,224,191,1,0                ; mulps         0x1bfe0(%rip),%xmm7        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,87,228                           ; xorps         %xmm4,%xmm4
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  15,87,246                           ; xorps         %xmm6,%xmm6
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,53                              ; je            17e5f <_sk_load_a8_dst_sse41+0x81>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,49                              ; je            17ae7 <_sk_load_a8_dst_sse41+0x72>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            17e49 <_sk_load_a8_dst_sse41+0x6b>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,195                             ; jne           17dfd <_sk_load_a8_dst_sse41+0x1f>
-  DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,19                              ; je            17ad1 <_sk_load_a8_dst_sse41+0x5c>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,204                             ; jne           17a8e <_sk_load_a8_dst_sse41+0x19>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
   DB  102,15,112,228,69                   ; pshufd        $0x45,%xmm4,%xmm4
-  DB  67,15,183,4,16                      ; movzwl        (%r8,%r10,1),%eax
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  102,15,110,232                      ; movd          %eax,%xmm5
   DB  102,15,56,49,237                    ; pmovzxbd      %xmm5,%xmm5
   DB  102,15,58,14,229,15                 ; pblendw       $0xf,%xmm5,%xmm4
-  DB  235,158                             ; jmp           17dfd <_sk_load_a8_dst_sse41+0x1f>
-  DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
+  DB  235,167                             ; jmp           17a8e <_sk_load_a8_dst_sse41+0x19>
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
-  DB  235,147                             ; jmp           17dfd <_sk_load_a8_dst_sse41+0x1f>
+  DB  235,156                             ; jmp           17a8e <_sk_load_a8_dst_sse41+0x19>
 
 PUBLIC _sk_gather_a8_sse41
 _sk_gather_a8_sse41 LABEL PROC
@@ -22143,7 +21988,7 @@
   DB  102,15,58,32,192,3                  ; pinsrb        $0x3,%eax,%xmm0
   DB  102,15,56,49,192                    ; pmovzxbd      %xmm0,%xmm0
   DB  15,91,216                           ; cvtdq2ps      %xmm0,%xmm3
-  DB  15,89,29,137,193,1,0                ; mulps         0x1c189(%rip),%xmm3        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  15,89,29,225,190,1,0                ; mulps         0x1bee1(%rip),%xmm3        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
@@ -22154,120 +21999,114 @@
 _sk_store_a8_sse41 LABEL PROC
   DB  72,131,236,4                        ; sub           $0x4,%rsp
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  68,15,95,195                        ; maxps         %xmm3,%xmm8
-  DB  68,15,93,5,68,191,1,0               ; minps         0x1bf44(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
-  DB  68,15,89,5,28,192,1,0               ; mulps         0x1c01c(%rip),%xmm8        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  DB  68,15,93,5,162,188,1,0              ; minps         0x1bca2(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
+  DB  68,15,89,5,122,189,1,0              ; mulps         0x1bd7a(%rip),%xmm8        # 33950 <_sk_srcover_bgra_8888_sse2_lowp+0xd60>
   DB  102,69,15,91,192                    ; cvtps2dq      %xmm8,%xmm8
   DB  102,68,15,56,43,192                 ; packusdw      %xmm0,%xmm8
   DB  102,68,15,103,192                   ; packuswb      %xmm0,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,17                              ; jne           17f7a <_sk_store_a8_sse41+0x55>
+  DB  117,17                              ; jne           17bfc <_sk_store_a8_sse41+0x4f>
   DB  102,68,15,126,192                   ; movd          %xmm8,%eax
-  DB  67,137,4,16                         ; mov           %eax,(%r8,%r10,1)
+  DB  65,137,4,16                         ; mov           %eax,(%r8,%rdx,1)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  72,131,196,4                        ; add           $0x4,%rsp
   DB  255,224                             ; jmpq          *%rax
   DB  102,69,15,56,49,192                 ; pmovzxbd      %xmm8,%xmm8
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,41                              ; je            17fb6 <_sk_store_a8_sse41+0x91>
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,15                              ; je            17fa2 <_sk_store_a8_sse41+0x7d>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,217                             ; jne           17f72 <_sk_store_a8_sse41+0x4d>
-  DB  102,71,15,58,20,68,16,2,8           ; pextrb        $0x8,%xmm8,0x2(%r8,%r10,1)
-  DB  102,68,15,56,0,5,244,194,1,0        ; pshufb        0x1c2f4(%rip),%xmm8        # 342a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1084>
-  DB  102,71,15,58,21,4,16,0              ; pextrw        $0x0,%xmm8,(%r8,%r10,1)
-  DB  235,188                             ; jmp           17f72 <_sk_store_a8_sse41+0x4d>
-  DB  102,71,15,58,20,4,16,0              ; pextrb        $0x0,%xmm8,(%r8,%r10,1)
-  DB  235,178                             ; jmp           17f72 <_sk_store_a8_sse41+0x4d>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,37                              ; je            17c2f <_sk_store_a8_sse41+0x82>
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,13                              ; je            17c1b <_sk_store_a8_sse41+0x6e>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,226                             ; jne           17bf4 <_sk_store_a8_sse41+0x47>
+  DB  102,69,15,58,20,68,16,2,8           ; pextrb        $0x8,%xmm8,0x2(%r8,%rdx,1)
+  DB  102,68,15,56,0,5,91,192,1,0         ; pshufb        0x1c05b(%rip),%xmm8        # 33c80 <_sk_srcover_bgra_8888_sse2_lowp+0x1090>
+  DB  102,69,15,58,21,4,16,0              ; pextrw        $0x0,%xmm8,(%r8,%rdx,1)
+  DB  235,197                             ; jmp           17bf4 <_sk_store_a8_sse41+0x47>
+  DB  102,69,15,58,20,4,16,0              ; pextrb        $0x0,%xmm8,(%r8,%rdx,1)
+  DB  235,187                             ; jmp           17bf4 <_sk_store_a8_sse41+0x47>
 
 PUBLIC _sk_load_g8_sse41
 _sk_load_g8_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,42                              ; jne           18002 <_sk_load_g8_sse41+0x42>
-  DB  102,67,15,56,49,4,16                ; pmovzxbd      (%r8,%r10,1),%xmm0
-  DB  102,15,219,5,89,191,1,0             ; pand          0x1bf59(%rip),%xmm0        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  117,42                              ; jne           17c75 <_sk_load_g8_sse41+0x3c>
+  DB  102,65,15,56,49,4,16                ; pmovzxbd      (%r8,%rdx,1),%xmm0
+  DB  102,15,219,5,198,188,1,0            ; pand          0x1bcc6(%rip),%xmm0        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,175,192,1,0                 ; mulps         0x1c0af(%rip),%xmm0        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  15,89,5,28,190,1,0                  ; mulps         0x1be1c(%rip),%xmm0        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,150,190,1,0                ; movaps        0x1be96(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,29,3,188,1,0                  ; movaps        0x1bc03(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,53                              ; je            18044 <_sk_load_g8_sse41+0x84>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,49                              ; je            17cae <_sk_load_g8_sse41+0x75>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            1802e <_sk_load_g8_sse41+0x6e>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,192                             ; jne           17fdf <_sk_load_g8_sse41+0x1f>
-  DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,19                              ; je            17c98 <_sk_load_g8_sse41+0x5f>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,201                             ; jne           17c52 <_sk_load_g8_sse41+0x19>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,15,112,192,69                   ; pshufd        $0x45,%xmm0,%xmm0
-  DB  67,15,183,4,16                      ; movzwl        (%r8,%r10,1),%eax
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  102,15,110,200                      ; movd          %eax,%xmm1
   DB  102,15,56,49,201                    ; pmovzxbd      %xmm1,%xmm1
   DB  102,15,58,14,193,15                 ; pblendw       $0xf,%xmm1,%xmm0
-  DB  235,155                             ; jmp           17fdf <_sk_load_g8_sse41+0x1f>
-  DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
+  DB  235,164                             ; jmp           17c52 <_sk_load_g8_sse41+0x19>
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
-  DB  235,144                             ; jmp           17fdf <_sk_load_g8_sse41+0x1f>
+  DB  235,153                             ; jmp           17c52 <_sk_load_g8_sse41+0x19>
 
 PUBLIC _sk_load_g8_dst_sse41
 _sk_load_g8_dst_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,42                              ; jne           18091 <_sk_load_g8_dst_sse41+0x42>
-  DB  102,67,15,56,49,36,16               ; pmovzxbd      (%r8,%r10,1),%xmm4
-  DB  102,15,219,37,202,190,1,0           ; pand          0x1beca(%rip),%xmm4        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  117,42                              ; jne           17cf5 <_sk_load_g8_dst_sse41+0x3c>
+  DB  102,65,15,56,49,36,16               ; pmovzxbd      (%r8,%rdx,1),%xmm4
+  DB  102,15,219,37,70,188,1,0            ; pand          0x1bc46(%rip),%xmm4        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
-  DB  15,89,37,32,192,1,0                 ; mulps         0x1c020(%rip),%xmm4        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  15,89,37,156,189,1,0                ; mulps         0x1bd9c(%rip),%xmm4        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,61,7,190,1,0                  ; movaps        0x1be07(%rip),%xmm7        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,61,131,187,1,0                ; movaps        0x1bb83(%rip),%xmm7        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,40,236                           ; movaps        %xmm4,%xmm5
   DB  15,40,244                           ; movaps        %xmm4,%xmm6
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,53                              ; je            180d3 <_sk_load_g8_dst_sse41+0x84>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,49                              ; je            17d2e <_sk_load_g8_dst_sse41+0x75>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            180bd <_sk_load_g8_dst_sse41+0x6e>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,192                             ; jne           1806e <_sk_load_g8_dst_sse41+0x1f>
-  DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,19                              ; je            17d18 <_sk_load_g8_dst_sse41+0x5f>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,201                             ; jne           17cd2 <_sk_load_g8_dst_sse41+0x19>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
   DB  102,15,112,228,69                   ; pshufd        $0x45,%xmm4,%xmm4
-  DB  67,15,183,4,16                      ; movzwl        (%r8,%r10,1),%eax
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  102,15,110,232                      ; movd          %eax,%xmm5
   DB  102,15,56,49,237                    ; pmovzxbd      %xmm5,%xmm5
   DB  102,15,58,14,229,15                 ; pblendw       $0xf,%xmm5,%xmm4
-  DB  235,155                             ; jmp           1806e <_sk_load_g8_dst_sse41+0x1f>
-  DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
+  DB  235,164                             ; jmp           17cd2 <_sk_load_g8_dst_sse41+0x19>
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
-  DB  235,144                             ; jmp           1806e <_sk_load_g8_dst_sse41+0x1f>
+  DB  235,153                             ; jmp           17cd2 <_sk_load_g8_dst_sse41+0x19>
 
 PUBLIC _sk_gather_g8_sse41
 _sk_gather_g8_sse41 LABEL PROC
@@ -22308,9 +22147,9 @@
   DB  102,15,58,32,192,3                  ; pinsrb        $0x3,%eax,%xmm0
   DB  102,15,56,49,192                    ; pmovzxbd      %xmm0,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,21,191,1,0                  ; mulps         0x1bf15(%rip),%xmm0        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  15,89,5,154,188,1,0                 ; mulps         0x1bc9a(%rip),%xmm0        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,252,188,1,0                ; movaps        0x1bcfc(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,29,129,186,1,0                ; movaps        0x1ba81(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  255,224                             ; jmpq          *%rax
@@ -22318,94 +22157,90 @@
 PUBLIC _sk_load_565_sse41
 _sk_load_565_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,80                              ; jne           18207 <_sk_load_565_sse41+0x6b>
-  DB  102,67,15,56,51,20,80               ; pmovzxwd      (%r8,%r10,2),%xmm2
-  DB  102,15,111,5,234,190,1,0            ; movdqa        0x1beea(%rip),%xmm0        # 340b0 <_sk_srcover_bgra_8888_sse2_lowp+0xe94>
+  DB  117,80                              ; jne           17e5c <_sk_load_565_sse41+0x65>
+  DB  102,65,15,56,51,20,80               ; pmovzxwd      (%r8,%rdx,2),%xmm2
+  DB  102,15,111,5,117,188,1,0            ; movdqa        0x1bc75(%rip),%xmm0        # 33a90 <_sk_srcover_bgra_8888_sse2_lowp+0xea0>
   DB  102,15,219,194                      ; pand          %xmm2,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,236,190,1,0                 ; mulps         0x1beec(%rip),%xmm0        # 340c0 <_sk_srcover_bgra_8888_sse2_lowp+0xea4>
-  DB  102,15,111,13,244,190,1,0           ; movdqa        0x1bef4(%rip),%xmm1        # 340d0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  DB  15,89,5,119,188,1,0                 ; mulps         0x1bc77(%rip),%xmm0        # 33aa0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb0>
+  DB  102,15,111,13,127,188,1,0           ; movdqa        0x1bc7f(%rip),%xmm1        # 33ab0 <_sk_srcover_bgra_8888_sse2_lowp+0xec0>
   DB  102,15,219,202                      ; pand          %xmm2,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
-  DB  15,89,13,246,190,1,0                ; mulps         0x1bef6(%rip),%xmm1        # 340e0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
-  DB  102,15,219,21,254,190,1,0           ; pand          0x1befe(%rip),%xmm2        # 340f0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
+  DB  15,89,13,129,188,1,0                ; mulps         0x1bc81(%rip),%xmm1        # 33ac0 <_sk_srcover_bgra_8888_sse2_lowp+0xed0>
+  DB  102,15,219,21,137,188,1,0           ; pand          0x1bc89(%rip),%xmm2        # 33ad0 <_sk_srcover_bgra_8888_sse2_lowp+0xee0>
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
-  DB  15,89,21,4,191,1,0                  ; mulps         0x1bf04(%rip),%xmm2        # 34100 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  DB  15,89,21,143,188,1,0                ; mulps         0x1bc8f(%rip),%xmm2        # 33ae0 <_sk_srcover_bgra_8888_sse2_lowp+0xef0>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,139,188,1,0                ; movaps        0x1bc8b(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,29,22,186,1,0                 ; movaps        0x1ba16(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,53                              ; je            18249 <_sk_load_565_sse41+0xad>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,46                              ; je            17e92 <_sk_load_565_sse41+0x9b>
   DB  102,15,239,210                      ; pxor          %xmm2,%xmm2
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            18233 <_sk_load_565_sse41+0x97>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,154                             ; jne           181be <_sk_load_565_sse41+0x22>
-  DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,19                              ; je            17e7f <_sk_load_565_sse41+0x88>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,163                             ; jne           17e13 <_sk_load_565_sse41+0x1c>
+  DB  65,15,183,68,80,4                   ; movzwl        0x4(%r8,%rdx,2),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,15,112,208,69                   ; pshufd        $0x45,%xmm0,%xmm2
-  DB  102,67,15,110,4,80                  ; movd          (%r8,%r10,2),%xmm0
+  DB  102,65,15,110,4,80                  ; movd          (%r8,%rdx,2),%xmm0
   DB  102,15,56,51,192                    ; pmovzxwd      %xmm0,%xmm0
   DB  102,15,58,14,208,15                 ; pblendw       $0xf,%xmm0,%xmm2
-  DB  233,117,255,255,255                 ; jmpq          181be <_sk_load_565_sse41+0x22>
-  DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
+  DB  235,129                             ; jmp           17e13 <_sk_load_565_sse41+0x1c>
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,15,110,208                      ; movd          %eax,%xmm2
-  DB  233,103,255,255,255                 ; jmpq          181be <_sk_load_565_sse41+0x22>
+  DB  233,115,255,255,255                 ; jmpq          17e13 <_sk_load_565_sse41+0x1c>
 
 PUBLIC _sk_load_565_dst_sse41
 _sk_load_565_dst_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,80                              ; jne           182c2 <_sk_load_565_dst_sse41+0x6b>
-  DB  102,67,15,56,51,52,80               ; pmovzxwd      (%r8,%r10,2),%xmm6
-  DB  102,15,111,37,47,190,1,0            ; movdqa        0x1be2f(%rip),%xmm4        # 340b0 <_sk_srcover_bgra_8888_sse2_lowp+0xe94>
+  DB  117,80                              ; jne           17f05 <_sk_load_565_dst_sse41+0x65>
+  DB  102,65,15,56,51,52,80               ; pmovzxwd      (%r8,%rdx,2),%xmm6
+  DB  102,15,111,37,204,187,1,0           ; movdqa        0x1bbcc(%rip),%xmm4        # 33a90 <_sk_srcover_bgra_8888_sse2_lowp+0xea0>
   DB  102,15,219,230                      ; pand          %xmm6,%xmm4
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
-  DB  15,89,37,49,190,1,0                 ; mulps         0x1be31(%rip),%xmm4        # 340c0 <_sk_srcover_bgra_8888_sse2_lowp+0xea4>
-  DB  102,15,111,45,57,190,1,0            ; movdqa        0x1be39(%rip),%xmm5        # 340d0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  DB  15,89,37,206,187,1,0                ; mulps         0x1bbce(%rip),%xmm4        # 33aa0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb0>
+  DB  102,15,111,45,214,187,1,0           ; movdqa        0x1bbd6(%rip),%xmm5        # 33ab0 <_sk_srcover_bgra_8888_sse2_lowp+0xec0>
   DB  102,15,219,238                      ; pand          %xmm6,%xmm5
   DB  15,91,237                           ; cvtdq2ps      %xmm5,%xmm5
-  DB  15,89,45,59,190,1,0                 ; mulps         0x1be3b(%rip),%xmm5        # 340e0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
-  DB  102,15,219,53,67,190,1,0            ; pand          0x1be43(%rip),%xmm6        # 340f0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
+  DB  15,89,45,216,187,1,0                ; mulps         0x1bbd8(%rip),%xmm5        # 33ac0 <_sk_srcover_bgra_8888_sse2_lowp+0xed0>
+  DB  102,15,219,53,224,187,1,0           ; pand          0x1bbe0(%rip),%xmm6        # 33ad0 <_sk_srcover_bgra_8888_sse2_lowp+0xee0>
   DB  15,91,246                           ; cvtdq2ps      %xmm6,%xmm6
-  DB  15,89,53,73,190,1,0                 ; mulps         0x1be49(%rip),%xmm6        # 34100 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  DB  15,89,53,230,187,1,0                ; mulps         0x1bbe6(%rip),%xmm6        # 33ae0 <_sk_srcover_bgra_8888_sse2_lowp+0xef0>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,61,208,187,1,0                ; movaps        0x1bbd0(%rip),%xmm7        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,61,109,185,1,0                ; movaps        0x1b96d(%rip),%xmm7        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,53                              ; je            18304 <_sk_load_565_dst_sse41+0xad>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,46                              ; je            17f3b <_sk_load_565_dst_sse41+0x9b>
   DB  102,15,239,246                      ; pxor          %xmm6,%xmm6
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            182ee <_sk_load_565_dst_sse41+0x97>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,154                             ; jne           18279 <_sk_load_565_dst_sse41+0x22>
-  DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,19                              ; je            17f28 <_sk_load_565_dst_sse41+0x88>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,163                             ; jne           17ebc <_sk_load_565_dst_sse41+0x1c>
+  DB  65,15,183,68,80,4                   ; movzwl        0x4(%r8,%rdx,2),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
   DB  102,15,112,244,69                   ; pshufd        $0x45,%xmm4,%xmm6
-  DB  102,67,15,110,36,80                 ; movd          (%r8,%r10,2),%xmm4
+  DB  102,65,15,110,36,80                 ; movd          (%r8,%rdx,2),%xmm4
   DB  102,15,56,51,228                    ; pmovzxwd      %xmm4,%xmm4
   DB  102,15,58,14,244,15                 ; pblendw       $0xf,%xmm4,%xmm6
-  DB  233,117,255,255,255                 ; jmpq          18279 <_sk_load_565_dst_sse41+0x22>
-  DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
+  DB  235,129                             ; jmp           17ebc <_sk_load_565_dst_sse41+0x1c>
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,15,110,240                      ; movd          %eax,%xmm6
-  DB  233,103,255,255,255                 ; jmpq          18279 <_sk_load_565_dst_sse41+0x22>
+  DB  233,115,255,255,255                 ; jmpq          17ebc <_sk_load_565_dst_sse41+0x1c>
 
 PUBLIC _sk_gather_565_sse41
 _sk_gather_565_sse41 LABEL PROC
@@ -22445,43 +22280,41 @@
   DB  65,15,183,4,64                      ; movzwl        (%r8,%rax,2),%eax
   DB  102,15,196,192,3                    ; pinsrw        $0x3,%eax,%xmm0
   DB  102,15,56,51,208                    ; pmovzxwd      %xmm0,%xmm2
-  DB  102,15,111,5,246,188,1,0            ; movdqa        0x1bcf6(%rip),%xmm0        # 340b0 <_sk_srcover_bgra_8888_sse2_lowp+0xe94>
+  DB  102,15,111,5,159,186,1,0            ; movdqa        0x1ba9f(%rip),%xmm0        # 33a90 <_sk_srcover_bgra_8888_sse2_lowp+0xea0>
   DB  102,15,219,194                      ; pand          %xmm2,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,248,188,1,0                 ; mulps         0x1bcf8(%rip),%xmm0        # 340c0 <_sk_srcover_bgra_8888_sse2_lowp+0xea4>
-  DB  102,15,111,13,0,189,1,0             ; movdqa        0x1bd00(%rip),%xmm1        # 340d0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  DB  15,89,5,161,186,1,0                 ; mulps         0x1baa1(%rip),%xmm0        # 33aa0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb0>
+  DB  102,15,111,13,169,186,1,0           ; movdqa        0x1baa9(%rip),%xmm1        # 33ab0 <_sk_srcover_bgra_8888_sse2_lowp+0xec0>
   DB  102,15,219,202                      ; pand          %xmm2,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
-  DB  15,89,13,2,189,1,0                  ; mulps         0x1bd02(%rip),%xmm1        # 340e0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
-  DB  102,15,219,21,10,189,1,0            ; pand          0x1bd0a(%rip),%xmm2        # 340f0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
+  DB  15,89,13,171,186,1,0                ; mulps         0x1baab(%rip),%xmm1        # 33ac0 <_sk_srcover_bgra_8888_sse2_lowp+0xed0>
+  DB  102,15,219,21,179,186,1,0           ; pand          0x1bab3(%rip),%xmm2        # 33ad0 <_sk_srcover_bgra_8888_sse2_lowp+0xee0>
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
-  DB  15,89,21,16,189,1,0                 ; mulps         0x1bd10(%rip),%xmm2        # 34100 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  DB  15,89,21,185,186,1,0                ; mulps         0x1bab9(%rip),%xmm2        # 33ae0 <_sk_srcover_bgra_8888_sse2_lowp+0xef0>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,151,186,1,0                ; movaps        0x1ba97(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,29,64,184,1,0                 ; movaps        0x1b840(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  255,224                             ; jmpq          *%rax
 
 PUBLIC _sk_store_565_sse41
 _sk_store_565_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  68,15,95,200                        ; maxps         %xmm0,%xmm9
-  DB  68,15,40,21,107,186,1,0             ; movaps        0x1ba6b(%rip),%xmm10        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,21,26,184,1,0              ; movaps        0x1b81a(%rip),%xmm10        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,93,202                        ; minps         %xmm10,%xmm9
-  DB  68,15,40,29,127,190,1,0             ; movaps        0x1be7f(%rip),%xmm11        # 342b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1094>
+  DB  68,15,40,29,46,188,1,0              ; movaps        0x1bc2e(%rip),%xmm11        # 33c90 <_sk_srcover_bgra_8888_sse2_lowp+0x10a0>
   DB  69,15,89,203                        ; mulps         %xmm11,%xmm9
   DB  102,69,15,91,201                    ; cvtps2dq      %xmm9,%xmm9
   DB  102,65,15,114,241,11                ; pslld         $0xb,%xmm9
   DB  69,15,87,228                        ; xorps         %xmm12,%xmm12
   DB  68,15,95,225                        ; maxps         %xmm1,%xmm12
   DB  69,15,93,226                        ; minps         %xmm10,%xmm12
-  DB  68,15,89,37,108,190,1,0             ; mulps         0x1be6c(%rip),%xmm12        # 342c0 <_sk_srcover_bgra_8888_sse2_lowp+0x10a4>
+  DB  68,15,89,37,27,188,1,0              ; mulps         0x1bc1b(%rip),%xmm12        # 33ca0 <_sk_srcover_bgra_8888_sse2_lowp+0x10b0>
   DB  102,69,15,91,228                    ; cvtps2dq      %xmm12,%xmm12
   DB  102,65,15,114,244,5                 ; pslld         $0x5,%xmm12
   DB  68,15,95,194                        ; maxps         %xmm2,%xmm8
@@ -22492,123 +22325,119 @@
   DB  102,69,15,86,196                    ; orpd          %xmm12,%xmm8
   DB  102,68,15,56,43,192                 ; packusdw      %xmm0,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           1848f <_sk_store_565_sse41+0x94>
-  DB  102,69,15,214,4,64                  ; movq          %xmm8,(%r8,%rax,2)
+  DB  117,10                              ; jne           180c0 <_sk_store_565_sse41+0x8e>
+  DB  102,69,15,214,4,80                  ; movq          %xmm8,(%r8,%rdx,2)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,69,15,56,51,192                 ; pmovzxwd      %xmm8,%xmm8
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,35                              ; je            184c5 <_sk_store_565_sse41+0xca>
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,15                              ; je            184b7 <_sk_store_565_sse41+0xbc>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,221                             ; jne           1848b <_sk_store_565_sse41+0x90>
-  DB  102,69,15,58,21,68,64,4,4           ; pextrw        $0x4,%xmm8,0x4(%r8,%rax,2)
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,31                              ; je            180ed <_sk_store_565_sse41+0xbb>
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,13                              ; je            180df <_sk_store_565_sse41+0xad>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,230                             ; jne           180bc <_sk_store_565_sse41+0x8a>
+  DB  102,69,15,58,21,68,80,4,4           ; pextrw        $0x4,%xmm8,0x4(%r8,%rdx,2)
   DB  242,69,15,112,192,232               ; pshuflw       $0xe8,%xmm8,%xmm8
-  DB  102,69,15,126,4,64                  ; movd          %xmm8,(%r8,%rax,2)
-  DB  235,198                             ; jmp           1848b <_sk_store_565_sse41+0x90>
-  DB  102,69,15,58,21,4,64,0              ; pextrw        $0x0,%xmm8,(%r8,%rax,2)
-  DB  235,188                             ; jmp           1848b <_sk_store_565_sse41+0x90>
+  DB  102,69,15,126,4,80                  ; movd          %xmm8,(%r8,%rdx,2)
+  DB  235,207                             ; jmp           180bc <_sk_store_565_sse41+0x8a>
+  DB  102,69,15,58,21,4,80,0              ; pextrw        $0x0,%xmm8,(%r8,%rdx,2)
+  DB  235,197                             ; jmp           180bc <_sk_store_565_sse41+0x8a>
 
 PUBLIC _sk_load_4444_sse41
 _sk_load_4444_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,95                              ; jne           18549 <_sk_load_4444_sse41+0x7a>
-  DB  102,67,15,56,51,28,80               ; pmovzxwd      (%r8,%r10,2),%xmm3
-  DB  102,15,111,5,215,189,1,0            ; movdqa        0x1bdd7(%rip),%xmm0        # 342d0 <_sk_srcover_bgra_8888_sse2_lowp+0x10b4>
+  DB  117,95                              ; jne           1816b <_sk_load_4444_sse41+0x74>
+  DB  102,65,15,56,51,28,80               ; pmovzxwd      (%r8,%rdx,2),%xmm3
+  DB  102,15,111,5,149,187,1,0            ; movdqa        0x1bb95(%rip),%xmm0        # 33cb0 <_sk_srcover_bgra_8888_sse2_lowp+0x10c0>
   DB  102,15,219,195                      ; pand          %xmm3,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,217,189,1,0                 ; mulps         0x1bdd9(%rip),%xmm0        # 342e0 <_sk_srcover_bgra_8888_sse2_lowp+0x10c4>
-  DB  102,15,111,13,225,189,1,0           ; movdqa        0x1bde1(%rip),%xmm1        # 342f0 <_sk_srcover_bgra_8888_sse2_lowp+0x10d4>
+  DB  15,89,5,151,187,1,0                 ; mulps         0x1bb97(%rip),%xmm0        # 33cc0 <_sk_srcover_bgra_8888_sse2_lowp+0x10d0>
+  DB  102,15,111,13,159,187,1,0           ; movdqa        0x1bb9f(%rip),%xmm1        # 33cd0 <_sk_srcover_bgra_8888_sse2_lowp+0x10e0>
   DB  102,15,219,203                      ; pand          %xmm3,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
-  DB  15,89,13,227,189,1,0                ; mulps         0x1bde3(%rip),%xmm1        # 34300 <_sk_srcover_bgra_8888_sse2_lowp+0x10e4>
-  DB  102,15,111,21,235,189,1,0           ; movdqa        0x1bdeb(%rip),%xmm2        # 34310 <_sk_srcover_bgra_8888_sse2_lowp+0x10f4>
+  DB  15,89,13,161,187,1,0                ; mulps         0x1bba1(%rip),%xmm1        # 33ce0 <_sk_srcover_bgra_8888_sse2_lowp+0x10f0>
+  DB  102,15,111,21,169,187,1,0           ; movdqa        0x1bba9(%rip),%xmm2        # 33cf0 <_sk_srcover_bgra_8888_sse2_lowp+0x1100>
   DB  102,15,219,211                      ; pand          %xmm3,%xmm2
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
-  DB  15,89,21,237,189,1,0                ; mulps         0x1bded(%rip),%xmm2        # 34320 <_sk_srcover_bgra_8888_sse2_lowp+0x1104>
-  DB  102,15,219,29,245,189,1,0           ; pand          0x1bdf5(%rip),%xmm3        # 34330 <_sk_srcover_bgra_8888_sse2_lowp+0x1114>
+  DB  15,89,21,171,187,1,0                ; mulps         0x1bbab(%rip),%xmm2        # 33d00 <_sk_srcover_bgra_8888_sse2_lowp+0x1110>
+  DB  102,15,219,29,179,187,1,0           ; pand          0x1bbb3(%rip),%xmm3        # 33d10 <_sk_srcover_bgra_8888_sse2_lowp+0x1120>
   DB  15,91,219                           ; cvtdq2ps      %xmm3,%xmm3
-  DB  15,89,29,251,189,1,0                ; mulps         0x1bdfb(%rip),%xmm3        # 34340 <_sk_srcover_bgra_8888_sse2_lowp+0x1124>
+  DB  15,89,29,185,187,1,0                ; mulps         0x1bbb9(%rip),%xmm3        # 33d20 <_sk_srcover_bgra_8888_sse2_lowp+0x1130>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,53                              ; je            1858b <_sk_load_4444_sse41+0xbc>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,49                              ; je            181a4 <_sk_load_4444_sse41+0xad>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            18575 <_sk_load_4444_sse41+0xa6>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,139                             ; jne           184f1 <_sk_load_4444_sse41+0x22>
-  DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,19                              ; je            1818e <_sk_load_4444_sse41+0x97>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,148                             ; jne           18113 <_sk_load_4444_sse41+0x1c>
+  DB  65,15,183,68,80,4                   ; movzwl        0x4(%r8,%rdx,2),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,15,112,216,69                   ; pshufd        $0x45,%xmm0,%xmm3
-  DB  102,67,15,110,4,80                  ; movd          (%r8,%r10,2),%xmm0
+  DB  102,65,15,110,4,80                  ; movd          (%r8,%rdx,2),%xmm0
   DB  102,15,56,51,192                    ; pmovzxwd      %xmm0,%xmm0
   DB  102,15,58,14,216,15                 ; pblendw       $0xf,%xmm0,%xmm3
-  DB  233,102,255,255,255                 ; jmpq          184f1 <_sk_load_4444_sse41+0x22>
-  DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
+  DB  233,111,255,255,255                 ; jmpq          18113 <_sk_load_4444_sse41+0x1c>
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,15,110,216                      ; movd          %eax,%xmm3
-  DB  233,88,255,255,255                  ; jmpq          184f1 <_sk_load_4444_sse41+0x22>
+  DB  233,97,255,255,255                  ; jmpq          18113 <_sk_load_4444_sse41+0x1c>
 
 PUBLIC _sk_load_4444_dst_sse41
 _sk_load_4444_dst_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,95                              ; jne           18613 <_sk_load_4444_dst_sse41+0x7a>
-  DB  102,67,15,56,51,60,80               ; pmovzxwd      (%r8,%r10,2),%xmm7
-  DB  102,15,111,37,13,189,1,0            ; movdqa        0x1bd0d(%rip),%xmm4        # 342d0 <_sk_srcover_bgra_8888_sse2_lowp+0x10b4>
+  DB  117,95                              ; jne           18226 <_sk_load_4444_dst_sse41+0x74>
+  DB  102,65,15,56,51,60,80               ; pmovzxwd      (%r8,%rdx,2),%xmm7
+  DB  102,15,111,37,218,186,1,0           ; movdqa        0x1bada(%rip),%xmm4        # 33cb0 <_sk_srcover_bgra_8888_sse2_lowp+0x10c0>
   DB  102,15,219,231                      ; pand          %xmm7,%xmm4
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
-  DB  15,89,37,15,189,1,0                 ; mulps         0x1bd0f(%rip),%xmm4        # 342e0 <_sk_srcover_bgra_8888_sse2_lowp+0x10c4>
-  DB  102,15,111,45,23,189,1,0            ; movdqa        0x1bd17(%rip),%xmm5        # 342f0 <_sk_srcover_bgra_8888_sse2_lowp+0x10d4>
+  DB  15,89,37,220,186,1,0                ; mulps         0x1badc(%rip),%xmm4        # 33cc0 <_sk_srcover_bgra_8888_sse2_lowp+0x10d0>
+  DB  102,15,111,45,228,186,1,0           ; movdqa        0x1bae4(%rip),%xmm5        # 33cd0 <_sk_srcover_bgra_8888_sse2_lowp+0x10e0>
   DB  102,15,219,239                      ; pand          %xmm7,%xmm5
   DB  15,91,237                           ; cvtdq2ps      %xmm5,%xmm5
-  DB  15,89,45,25,189,1,0                 ; mulps         0x1bd19(%rip),%xmm5        # 34300 <_sk_srcover_bgra_8888_sse2_lowp+0x10e4>
-  DB  102,15,111,53,33,189,1,0            ; movdqa        0x1bd21(%rip),%xmm6        # 34310 <_sk_srcover_bgra_8888_sse2_lowp+0x10f4>
+  DB  15,89,45,230,186,1,0                ; mulps         0x1bae6(%rip),%xmm5        # 33ce0 <_sk_srcover_bgra_8888_sse2_lowp+0x10f0>
+  DB  102,15,111,53,238,186,1,0           ; movdqa        0x1baee(%rip),%xmm6        # 33cf0 <_sk_srcover_bgra_8888_sse2_lowp+0x1100>
   DB  102,15,219,247                      ; pand          %xmm7,%xmm6
   DB  15,91,246                           ; cvtdq2ps      %xmm6,%xmm6
-  DB  15,89,53,35,189,1,0                 ; mulps         0x1bd23(%rip),%xmm6        # 34320 <_sk_srcover_bgra_8888_sse2_lowp+0x1104>
-  DB  102,15,219,61,43,189,1,0            ; pand          0x1bd2b(%rip),%xmm7        # 34330 <_sk_srcover_bgra_8888_sse2_lowp+0x1114>
+  DB  15,89,53,240,186,1,0                ; mulps         0x1baf0(%rip),%xmm6        # 33d00 <_sk_srcover_bgra_8888_sse2_lowp+0x1110>
+  DB  102,15,219,61,248,186,1,0           ; pand          0x1baf8(%rip),%xmm7        # 33d10 <_sk_srcover_bgra_8888_sse2_lowp+0x1120>
   DB  15,91,255                           ; cvtdq2ps      %xmm7,%xmm7
-  DB  15,89,61,49,189,1,0                 ; mulps         0x1bd31(%rip),%xmm7        # 34340 <_sk_srcover_bgra_8888_sse2_lowp+0x1124>
+  DB  15,89,61,254,186,1,0                ; mulps         0x1bafe(%rip),%xmm7        # 33d20 <_sk_srcover_bgra_8888_sse2_lowp+0x1130>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,53                              ; je            18655 <_sk_load_4444_dst_sse41+0xbc>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,49                              ; je            1825f <_sk_load_4444_dst_sse41+0xad>
   DB  102,15,239,255                      ; pxor          %xmm7,%xmm7
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            1863f <_sk_load_4444_dst_sse41+0xa6>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,139                             ; jne           185bb <_sk_load_4444_dst_sse41+0x22>
-  DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,19                              ; je            18249 <_sk_load_4444_dst_sse41+0x97>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,148                             ; jne           181ce <_sk_load_4444_dst_sse41+0x1c>
+  DB  65,15,183,68,80,4                   ; movzwl        0x4(%r8,%rdx,2),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
   DB  102,15,112,252,69                   ; pshufd        $0x45,%xmm4,%xmm7
-  DB  102,67,15,110,36,80                 ; movd          (%r8,%r10,2),%xmm4
+  DB  102,65,15,110,36,80                 ; movd          (%r8,%rdx,2),%xmm4
   DB  102,15,56,51,228                    ; pmovzxwd      %xmm4,%xmm4
   DB  102,15,58,14,252,15                 ; pblendw       $0xf,%xmm4,%xmm7
-  DB  233,102,255,255,255                 ; jmpq          185bb <_sk_load_4444_dst_sse41+0x22>
-  DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
+  DB  233,111,255,255,255                 ; jmpq          181ce <_sk_load_4444_dst_sse41+0x1c>
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,15,110,248                      ; movd          %eax,%xmm7
-  DB  233,88,255,255,255                  ; jmpq          185bb <_sk_load_4444_dst_sse41+0x22>
+  DB  233,97,255,255,255                  ; jmpq          181ce <_sk_load_4444_dst_sse41+0x1c>
 
 PUBLIC _sk_gather_4444_sse41
 _sk_gather_4444_sse41 LABEL PROC
@@ -22648,39 +22477,37 @@
   DB  65,15,183,4,64                      ; movzwl        (%r8,%rax,2),%eax
   DB  102,15,196,192,3                    ; pinsrw        $0x3,%eax,%xmm0
   DB  102,15,56,51,216                    ; pmovzxwd      %xmm0,%xmm3
-  DB  102,15,111,5,197,187,1,0            ; movdqa        0x1bbc5(%rip),%xmm0        # 342d0 <_sk_srcover_bgra_8888_sse2_lowp+0x10b4>
+  DB  102,15,111,5,155,185,1,0            ; movdqa        0x1b99b(%rip),%xmm0        # 33cb0 <_sk_srcover_bgra_8888_sse2_lowp+0x10c0>
   DB  102,15,219,195                      ; pand          %xmm3,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,199,187,1,0                 ; mulps         0x1bbc7(%rip),%xmm0        # 342e0 <_sk_srcover_bgra_8888_sse2_lowp+0x10c4>
-  DB  102,15,111,13,207,187,1,0           ; movdqa        0x1bbcf(%rip),%xmm1        # 342f0 <_sk_srcover_bgra_8888_sse2_lowp+0x10d4>
+  DB  15,89,5,157,185,1,0                 ; mulps         0x1b99d(%rip),%xmm0        # 33cc0 <_sk_srcover_bgra_8888_sse2_lowp+0x10d0>
+  DB  102,15,111,13,165,185,1,0           ; movdqa        0x1b9a5(%rip),%xmm1        # 33cd0 <_sk_srcover_bgra_8888_sse2_lowp+0x10e0>
   DB  102,15,219,203                      ; pand          %xmm3,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
-  DB  15,89,13,209,187,1,0                ; mulps         0x1bbd1(%rip),%xmm1        # 34300 <_sk_srcover_bgra_8888_sse2_lowp+0x10e4>
-  DB  102,15,111,21,217,187,1,0           ; movdqa        0x1bbd9(%rip),%xmm2        # 34310 <_sk_srcover_bgra_8888_sse2_lowp+0x10f4>
+  DB  15,89,13,167,185,1,0                ; mulps         0x1b9a7(%rip),%xmm1        # 33ce0 <_sk_srcover_bgra_8888_sse2_lowp+0x10f0>
+  DB  102,15,111,21,175,185,1,0           ; movdqa        0x1b9af(%rip),%xmm2        # 33cf0 <_sk_srcover_bgra_8888_sse2_lowp+0x1100>
   DB  102,15,219,211                      ; pand          %xmm3,%xmm2
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
-  DB  15,89,21,219,187,1,0                ; mulps         0x1bbdb(%rip),%xmm2        # 34320 <_sk_srcover_bgra_8888_sse2_lowp+0x1104>
-  DB  102,15,219,29,227,187,1,0           ; pand          0x1bbe3(%rip),%xmm3        # 34330 <_sk_srcover_bgra_8888_sse2_lowp+0x1114>
+  DB  15,89,21,177,185,1,0                ; mulps         0x1b9b1(%rip),%xmm2        # 33d00 <_sk_srcover_bgra_8888_sse2_lowp+0x1110>
+  DB  102,15,219,29,185,185,1,0           ; pand          0x1b9b9(%rip),%xmm3        # 33d10 <_sk_srcover_bgra_8888_sse2_lowp+0x1120>
   DB  15,91,219                           ; cvtdq2ps      %xmm3,%xmm3
-  DB  15,89,29,233,187,1,0                ; mulps         0x1bbe9(%rip),%xmm3        # 34340 <_sk_srcover_bgra_8888_sse2_lowp+0x1124>
+  DB  15,89,29,191,185,1,0                ; mulps         0x1b9bf(%rip),%xmm3        # 33d20 <_sk_srcover_bgra_8888_sse2_lowp+0x1130>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
 
 PUBLIC _sk_store_4444_sse41
 _sk_store_4444_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  68,15,95,200                        ; maxps         %xmm0,%xmm9
-  DB  68,15,40,21,11,183,1,0              ; movaps        0x1b70b(%rip),%xmm10        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,21,231,180,1,0             ; movaps        0x1b4e7(%rip),%xmm10        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,93,202                        ; minps         %xmm10,%xmm9
-  DB  68,15,40,29,191,187,1,0             ; movaps        0x1bbbf(%rip),%xmm11        # 34350 <_sk_srcover_bgra_8888_sse2_lowp+0x1134>
+  DB  68,15,40,29,155,185,1,0             ; movaps        0x1b99b(%rip),%xmm11        # 33d30 <_sk_srcover_bgra_8888_sse2_lowp+0x1140>
   DB  69,15,89,203                        ; mulps         %xmm11,%xmm9
   DB  102,69,15,91,201                    ; cvtps2dq      %xmm9,%xmm9
   DB  102,65,15,114,241,12                ; pslld         $0xc,%xmm9
@@ -22705,49 +22532,47 @@
   DB  102,69,15,86,196                    ; orpd          %xmm12,%xmm8
   DB  102,68,15,56,43,192                 ; packusdw      %xmm0,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           1880c <_sk_store_4444_sse41+0xb1>
-  DB  102,69,15,214,4,64                  ; movq          %xmm8,(%r8,%rax,2)
+  DB  117,10                              ; jne           18410 <_sk_store_4444_sse41+0xab>
+  DB  102,69,15,214,4,80                  ; movq          %xmm8,(%r8,%rdx,2)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,69,15,56,51,192                 ; pmovzxwd      %xmm8,%xmm8
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,35                              ; je            18842 <_sk_store_4444_sse41+0xe7>
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,15                              ; je            18834 <_sk_store_4444_sse41+0xd9>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,221                             ; jne           18808 <_sk_store_4444_sse41+0xad>
-  DB  102,69,15,58,21,68,64,4,4           ; pextrw        $0x4,%xmm8,0x4(%r8,%rax,2)
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,31                              ; je            1843d <_sk_store_4444_sse41+0xd8>
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,13                              ; je            1842f <_sk_store_4444_sse41+0xca>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,230                             ; jne           1840c <_sk_store_4444_sse41+0xa7>
+  DB  102,69,15,58,21,68,80,4,4           ; pextrw        $0x4,%xmm8,0x4(%r8,%rdx,2)
   DB  242,69,15,112,192,232               ; pshuflw       $0xe8,%xmm8,%xmm8
-  DB  102,69,15,126,4,64                  ; movd          %xmm8,(%r8,%rax,2)
-  DB  235,198                             ; jmp           18808 <_sk_store_4444_sse41+0xad>
-  DB  102,69,15,58,21,4,64,0              ; pextrw        $0x0,%xmm8,(%r8,%rax,2)
-  DB  235,188                             ; jmp           18808 <_sk_store_4444_sse41+0xad>
+  DB  102,69,15,126,4,80                  ; movd          %xmm8,(%r8,%rdx,2)
+  DB  235,207                             ; jmp           1840c <_sk_store_4444_sse41+0xa7>
+  DB  102,69,15,58,21,4,80,0              ; pextrw        $0x0,%xmm8,(%r8,%rdx,2)
+  DB  235,197                             ; jmp           1840c <_sk_store_4444_sse41+0xa7>
 
 PUBLIC _sk_load_8888_sse41
 _sk_load_8888_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,89                              ; jne           188c1 <_sk_load_8888_sse41+0x75>
-  DB  243,65,15,111,28,128                ; movdqu        (%r8,%rax,4),%xmm3
-  DB  102,15,111,5,202,182,1,0            ; movdqa        0x1b6ca(%rip),%xmm0        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  117,89                              ; jne           184b6 <_sk_load_8888_sse41+0x6f>
+  DB  243,65,15,111,28,144                ; movdqu        (%r8,%rdx,4),%xmm3
+  DB  102,15,111,5,181,180,1,0            ; movdqa        0x1b4b5(%rip),%xmm0        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  102,15,219,195                      ; pand          %xmm3,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  68,15,40,5,27,184,1,0               ; movaps        0x1b81b(%rip),%xmm8        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  68,15,40,5,6,182,1,0                ; movaps        0x1b606(%rip),%xmm8        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  102,15,111,203                      ; movdqa        %xmm3,%xmm1
-  DB  102,15,56,0,13,186,182,1,0          ; pshufb        0x1b6ba(%rip),%xmm1        # 33f50 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
+  DB  102,15,56,0,13,165,180,1,0          ; pshufb        0x1b4a5(%rip),%xmm1        # 33930 <_sk_srcover_bgra_8888_sse2_lowp+0xd40>
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
   DB  65,15,89,200                        ; mulps         %xmm8,%xmm1
   DB  102,15,111,211                      ; movdqa        %xmm3,%xmm2
-  DB  102,15,56,0,21,182,182,1,0          ; pshufb        0x1b6b6(%rip),%xmm2        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
+  DB  102,15,56,0,21,161,180,1,0          ; pshufb        0x1b4a1(%rip),%xmm2        # 33940 <_sk_srcover_bgra_8888_sse2_lowp+0xd50>
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
   DB  65,15,89,208                        ; mulps         %xmm8,%xmm2
   DB  102,15,114,211,24                   ; psrld         $0x18,%xmm3
@@ -22755,46 +22580,44 @@
   DB  65,15,89,216                        ; mulps         %xmm8,%xmm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,45                              ; je            188fb <_sk_load_8888_sse41+0xaf>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,41                              ; je            184e7 <_sk_load_8888_sse41+0xa0>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,18                              ; je            188ea <_sk_load_8888_sse41+0x9e>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,144                             ; jne           1886e <_sk_load_8888_sse41+0x22>
-  DB  102,65,15,110,68,128,8              ; movd          0x8(%r8,%rax,4),%xmm0
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,16                              ; je            184d6 <_sk_load_8888_sse41+0x8f>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,153                             ; jne           18463 <_sk_load_8888_sse41+0x1c>
+  DB  102,65,15,110,68,144,8              ; movd          0x8(%r8,%rdx,4),%xmm0
   DB  102,15,112,216,69                   ; pshufd        $0x45,%xmm0,%xmm3
-  DB  243,65,15,126,4,128                 ; movq          (%r8,%rax,4),%xmm0
+  DB  243,65,15,126,4,144                 ; movq          (%r8,%rdx,4),%xmm0
   DB  102,15,58,14,216,15                 ; pblendw       $0xf,%xmm0,%xmm3
-  DB  233,115,255,255,255                 ; jmpq          1886e <_sk_load_8888_sse41+0x22>
-  DB  102,65,15,110,28,128                ; movd          (%r8,%rax,4),%xmm3
-  DB  233,104,255,255,255                 ; jmpq          1886e <_sk_load_8888_sse41+0x22>
+  DB  233,124,255,255,255                 ; jmpq          18463 <_sk_load_8888_sse41+0x1c>
+  DB  102,65,15,110,28,144                ; movd          (%r8,%rdx,4),%xmm3
+  DB  233,113,255,255,255                 ; jmpq          18463 <_sk_load_8888_sse41+0x1c>
 
 PUBLIC _sk_load_8888_dst_sse41
 _sk_load_8888_dst_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,89                              ; jne           1897b <_sk_load_8888_dst_sse41+0x75>
-  DB  243,65,15,111,60,128                ; movdqu        (%r8,%rax,4),%xmm7
-  DB  102,15,111,37,16,182,1,0            ; movdqa        0x1b610(%rip),%xmm4        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  117,89                              ; jne           18561 <_sk_load_8888_dst_sse41+0x6f>
+  DB  243,65,15,111,60,144                ; movdqu        (%r8,%rdx,4),%xmm7
+  DB  102,15,111,37,10,180,1,0            ; movdqa        0x1b40a(%rip),%xmm4        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  102,15,219,231                      ; pand          %xmm7,%xmm4
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
-  DB  68,15,40,5,97,183,1,0               ; movaps        0x1b761(%rip),%xmm8        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  68,15,40,5,91,181,1,0               ; movaps        0x1b55b(%rip),%xmm8        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  65,15,89,224                        ; mulps         %xmm8,%xmm4
   DB  102,15,111,239                      ; movdqa        %xmm7,%xmm5
-  DB  102,15,56,0,45,0,182,1,0            ; pshufb        0x1b600(%rip),%xmm5        # 33f50 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
+  DB  102,15,56,0,45,250,179,1,0          ; pshufb        0x1b3fa(%rip),%xmm5        # 33930 <_sk_srcover_bgra_8888_sse2_lowp+0xd40>
   DB  15,91,237                           ; cvtdq2ps      %xmm5,%xmm5
   DB  65,15,89,232                        ; mulps         %xmm8,%xmm5
   DB  102,15,111,247                      ; movdqa        %xmm7,%xmm6
-  DB  102,15,56,0,53,252,181,1,0          ; pshufb        0x1b5fc(%rip),%xmm6        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
+  DB  102,15,56,0,53,246,179,1,0          ; pshufb        0x1b3f6(%rip),%xmm6        # 33940 <_sk_srcover_bgra_8888_sse2_lowp+0xd50>
   DB  15,91,246                           ; cvtdq2ps      %xmm6,%xmm6
   DB  65,15,89,240                        ; mulps         %xmm8,%xmm6
   DB  102,15,114,215,24                   ; psrld         $0x18,%xmm7
@@ -22802,22 +22625,22 @@
   DB  65,15,89,248                        ; mulps         %xmm8,%xmm7
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,45                              ; je            189b5 <_sk_load_8888_dst_sse41+0xaf>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,41                              ; je            18592 <_sk_load_8888_dst_sse41+0xa0>
   DB  102,15,239,255                      ; pxor          %xmm7,%xmm7
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,18                              ; je            189a4 <_sk_load_8888_dst_sse41+0x9e>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,144                             ; jne           18928 <_sk_load_8888_dst_sse41+0x22>
-  DB  102,65,15,110,100,128,8             ; movd          0x8(%r8,%rax,4),%xmm4
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,16                              ; je            18581 <_sk_load_8888_dst_sse41+0x8f>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,153                             ; jne           1850e <_sk_load_8888_dst_sse41+0x1c>
+  DB  102,65,15,110,100,144,8             ; movd          0x8(%r8,%rdx,4),%xmm4
   DB  102,15,112,252,69                   ; pshufd        $0x45,%xmm4,%xmm7
-  DB  243,65,15,126,36,128                ; movq          (%r8,%rax,4),%xmm4
+  DB  243,65,15,126,36,144                ; movq          (%r8,%rdx,4),%xmm4
   DB  102,15,58,14,252,15                 ; pblendw       $0xf,%xmm4,%xmm7
-  DB  233,115,255,255,255                 ; jmpq          18928 <_sk_load_8888_dst_sse41+0x22>
-  DB  102,65,15,110,60,128                ; movd          (%r8,%rax,4),%xmm7
-  DB  233,104,255,255,255                 ; jmpq          18928 <_sk_load_8888_dst_sse41+0x22>
+  DB  233,124,255,255,255                 ; jmpq          1850e <_sk_load_8888_dst_sse41+0x1c>
+  DB  102,65,15,110,60,144                ; movd          (%r8,%rdx,4),%xmm7
+  DB  233,113,255,255,255                 ; jmpq          1850e <_sk_load_8888_dst_sse41+0x1c>
 
 PUBLIC _sk_gather_8888_sse41
 _sk_gather_8888_sse41 LABEL PROC
@@ -22852,17 +22675,17 @@
   DB  102,65,15,58,34,28,128,1            ; pinsrd        $0x1,(%r8,%rax,4),%xmm3
   DB  102,67,15,58,34,28,152,2            ; pinsrd        $0x2,(%r8,%r11,4),%xmm3
   DB  102,67,15,58,34,28,144,3            ; pinsrd        $0x3,(%r8,%r10,4),%xmm3
-  DB  102,15,111,5,233,180,1,0            ; movdqa        0x1b4e9(%rip),%xmm0        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  102,15,111,5,236,178,1,0            ; movdqa        0x1b2ec(%rip),%xmm0        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  102,15,219,195                      ; pand          %xmm3,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  68,15,40,5,58,182,1,0               ; movaps        0x1b63a(%rip),%xmm8        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  68,15,40,5,61,180,1,0               ; movaps        0x1b43d(%rip),%xmm8        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  102,15,111,203                      ; movdqa        %xmm3,%xmm1
-  DB  102,15,56,0,13,217,180,1,0          ; pshufb        0x1b4d9(%rip),%xmm1        # 33f50 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
+  DB  102,15,56,0,13,220,178,1,0          ; pshufb        0x1b2dc(%rip),%xmm1        # 33930 <_sk_srcover_bgra_8888_sse2_lowp+0xd40>
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
   DB  65,15,89,200                        ; mulps         %xmm8,%xmm1
   DB  102,15,111,211                      ; movdqa        %xmm3,%xmm2
-  DB  102,15,56,0,21,213,180,1,0          ; pshufb        0x1b4d5(%rip),%xmm2        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
+  DB  102,15,56,0,21,216,178,1,0          ; pshufb        0x1b2d8(%rip),%xmm2        # 33940 <_sk_srcover_bgra_8888_sse2_lowp+0xd50>
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
   DB  65,15,89,208                        ; mulps         %xmm8,%xmm2
   DB  102,15,114,211,24                   ; psrld         $0x18,%xmm3
@@ -22874,18 +22697,16 @@
 PUBLIC _sk_store_8888_sse41
 _sk_store_8888_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  68,15,95,200                        ; maxps         %xmm0,%xmm9
-  DB  68,15,40,21,195,179,1,0             ; movaps        0x1b3c3(%rip),%xmm10        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,21,204,177,1,0             ; movaps        0x1b1cc(%rip),%xmm10        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,93,202                        ; minps         %xmm10,%xmm9
-  DB  68,15,40,29,151,180,1,0             ; movaps        0x1b497(%rip),%xmm11        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  DB  68,15,40,29,160,178,1,0             ; movaps        0x1b2a0(%rip),%xmm11        # 33950 <_sk_srcover_bgra_8888_sse2_lowp+0xd60>
   DB  69,15,89,203                        ; mulps         %xmm11,%xmm9
   DB  102,69,15,91,201                    ; cvtps2dq      %xmm9,%xmm9
   DB  69,15,87,228                        ; xorps         %xmm12,%xmm12
@@ -22909,47 +22730,45 @@
   DB  102,69,15,235,193                   ; por           %xmm9,%xmm8
   DB  102,69,15,235,196                   ; por           %xmm12,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           18b4e <_sk_store_8888_sse41+0xac>
-  DB  243,69,15,127,4,128                 ; movdqu        %xmm8,(%r8,%rax,4)
+  DB  117,10                              ; jne           18725 <_sk_store_8888_sse41+0xa6>
+  DB  243,69,15,127,4,144                 ; movdqu        %xmm8,(%r8,%rdx,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,29                              ; je            18b78 <_sk_store_8888_sse41+0xd6>
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,15                              ; je            18b70 <_sk_store_8888_sse41+0xce>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,227                             ; jne           18b4a <_sk_store_8888_sse41+0xa8>
-  DB  102,69,15,58,22,68,128,8,2          ; pextrd        $0x2,%xmm8,0x8(%r8,%rax,4)
-  DB  102,69,15,214,4,128                 ; movq          %xmm8,(%r8,%rax,4)
-  DB  235,210                             ; jmp           18b4a <_sk_store_8888_sse41+0xa8>
-  DB  102,69,15,126,4,128                 ; movd          %xmm8,(%r8,%rax,4)
-  DB  235,202                             ; jmp           18b4a <_sk_store_8888_sse41+0xa8>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,25                              ; je            18746 <_sk_store_8888_sse41+0xc7>
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,13                              ; je            1873e <_sk_store_8888_sse41+0xbf>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,236                             ; jne           18721 <_sk_store_8888_sse41+0xa2>
+  DB  102,69,15,58,22,68,144,8,2          ; pextrd        $0x2,%xmm8,0x8(%r8,%rdx,4)
+  DB  102,69,15,214,4,144                 ; movq          %xmm8,(%r8,%rdx,4)
+  DB  235,219                             ; jmp           18721 <_sk_store_8888_sse41+0xa2>
+  DB  102,69,15,126,4,144                 ; movd          %xmm8,(%r8,%rdx,4)
+  DB  235,211                             ; jmp           18721 <_sk_store_8888_sse41+0xa2>
 
 PUBLIC _sk_load_bgra_sse41
 _sk_load_bgra_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,89                              ; jne           18bf5 <_sk_load_bgra_sse41+0x75>
-  DB  243,65,15,111,28,128                ; movdqu        (%r8,%rax,4),%xmm3
-  DB  102,15,111,5,150,179,1,0            ; movdqa        0x1b396(%rip),%xmm0        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  117,89                              ; jne           187bd <_sk_load_bgra_sse41+0x6f>
+  DB  243,65,15,111,28,144                ; movdqu        (%r8,%rdx,4),%xmm3
+  DB  102,15,111,5,174,177,1,0            ; movdqa        0x1b1ae(%rip),%xmm0        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  102,15,219,195                      ; pand          %xmm3,%xmm0
   DB  15,91,208                           ; cvtdq2ps      %xmm0,%xmm2
-  DB  68,15,40,5,231,180,1,0              ; movaps        0x1b4e7(%rip),%xmm8        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  68,15,40,5,255,178,1,0              ; movaps        0x1b2ff(%rip),%xmm8        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  65,15,89,208                        ; mulps         %xmm8,%xmm2
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
-  DB  102,15,56,0,5,134,179,1,0           ; pshufb        0x1b386(%rip),%xmm0        # 33f50 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
+  DB  102,15,56,0,5,158,177,1,0           ; pshufb        0x1b19e(%rip),%xmm0        # 33930 <_sk_srcover_bgra_8888_sse2_lowp+0xd40>
   DB  15,91,200                           ; cvtdq2ps      %xmm0,%xmm1
   DB  65,15,89,200                        ; mulps         %xmm8,%xmm1
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
-  DB  102,15,56,0,5,130,179,1,0           ; pshufb        0x1b382(%rip),%xmm0        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
+  DB  102,15,56,0,5,154,177,1,0           ; pshufb        0x1b19a(%rip),%xmm0        # 33940 <_sk_srcover_bgra_8888_sse2_lowp+0xd50>
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  102,15,114,211,24                   ; psrld         $0x18,%xmm3
@@ -22957,46 +22776,44 @@
   DB  65,15,89,216                        ; mulps         %xmm8,%xmm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,45                              ; je            18c2f <_sk_load_bgra_sse41+0xaf>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,41                              ; je            187ee <_sk_load_bgra_sse41+0xa0>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,18                              ; je            18c1e <_sk_load_bgra_sse41+0x9e>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,144                             ; jne           18ba2 <_sk_load_bgra_sse41+0x22>
-  DB  102,65,15,110,68,128,8              ; movd          0x8(%r8,%rax,4),%xmm0
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,16                              ; je            187dd <_sk_load_bgra_sse41+0x8f>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,153                             ; jne           1876a <_sk_load_bgra_sse41+0x1c>
+  DB  102,65,15,110,68,144,8              ; movd          0x8(%r8,%rdx,4),%xmm0
   DB  102,15,112,216,69                   ; pshufd        $0x45,%xmm0,%xmm3
-  DB  243,65,15,126,4,128                 ; movq          (%r8,%rax,4),%xmm0
+  DB  243,65,15,126,4,144                 ; movq          (%r8,%rdx,4),%xmm0
   DB  102,15,58,14,216,15                 ; pblendw       $0xf,%xmm0,%xmm3
-  DB  233,115,255,255,255                 ; jmpq          18ba2 <_sk_load_bgra_sse41+0x22>
-  DB  102,65,15,110,28,128                ; movd          (%r8,%rax,4),%xmm3
-  DB  233,104,255,255,255                 ; jmpq          18ba2 <_sk_load_bgra_sse41+0x22>
+  DB  233,124,255,255,255                 ; jmpq          1876a <_sk_load_bgra_sse41+0x1c>
+  DB  102,65,15,110,28,144                ; movd          (%r8,%rdx,4),%xmm3
+  DB  233,113,255,255,255                 ; jmpq          1876a <_sk_load_bgra_sse41+0x1c>
 
 PUBLIC _sk_load_bgra_dst_sse41
 _sk_load_bgra_dst_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,89                              ; jne           18caf <_sk_load_bgra_dst_sse41+0x75>
-  DB  243,65,15,111,60,128                ; movdqu        (%r8,%rax,4),%xmm7
-  DB  102,15,111,37,220,178,1,0           ; movdqa        0x1b2dc(%rip),%xmm4        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  117,89                              ; jne           18868 <_sk_load_bgra_dst_sse41+0x6f>
+  DB  243,65,15,111,60,144                ; movdqu        (%r8,%rdx,4),%xmm7
+  DB  102,15,111,37,3,177,1,0             ; movdqa        0x1b103(%rip),%xmm4        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  102,15,219,231                      ; pand          %xmm7,%xmm4
   DB  15,91,244                           ; cvtdq2ps      %xmm4,%xmm6
-  DB  68,15,40,5,45,180,1,0               ; movaps        0x1b42d(%rip),%xmm8        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  68,15,40,5,84,178,1,0               ; movaps        0x1b254(%rip),%xmm8        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  65,15,89,240                        ; mulps         %xmm8,%xmm6
   DB  102,15,111,231                      ; movdqa        %xmm7,%xmm4
-  DB  102,15,56,0,37,204,178,1,0          ; pshufb        0x1b2cc(%rip),%xmm4        # 33f50 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
+  DB  102,15,56,0,37,243,176,1,0          ; pshufb        0x1b0f3(%rip),%xmm4        # 33930 <_sk_srcover_bgra_8888_sse2_lowp+0xd40>
   DB  15,91,236                           ; cvtdq2ps      %xmm4,%xmm5
   DB  65,15,89,232                        ; mulps         %xmm8,%xmm5
   DB  102,15,111,231                      ; movdqa        %xmm7,%xmm4
-  DB  102,15,56,0,37,200,178,1,0          ; pshufb        0x1b2c8(%rip),%xmm4        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
+  DB  102,15,56,0,37,239,176,1,0          ; pshufb        0x1b0ef(%rip),%xmm4        # 33940 <_sk_srcover_bgra_8888_sse2_lowp+0xd50>
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
   DB  65,15,89,224                        ; mulps         %xmm8,%xmm4
   DB  102,15,114,215,24                   ; psrld         $0x18,%xmm7
@@ -23004,22 +22821,22 @@
   DB  65,15,89,248                        ; mulps         %xmm8,%xmm7
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,45                              ; je            18ce9 <_sk_load_bgra_dst_sse41+0xaf>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,41                              ; je            18899 <_sk_load_bgra_dst_sse41+0xa0>
   DB  102,15,239,255                      ; pxor          %xmm7,%xmm7
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,18                              ; je            18cd8 <_sk_load_bgra_dst_sse41+0x9e>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,144                             ; jne           18c5c <_sk_load_bgra_dst_sse41+0x22>
-  DB  102,65,15,110,100,128,8             ; movd          0x8(%r8,%rax,4),%xmm4
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,16                              ; je            18888 <_sk_load_bgra_dst_sse41+0x8f>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,153                             ; jne           18815 <_sk_load_bgra_dst_sse41+0x1c>
+  DB  102,65,15,110,100,144,8             ; movd          0x8(%r8,%rdx,4),%xmm4
   DB  102,15,112,252,69                   ; pshufd        $0x45,%xmm4,%xmm7
-  DB  243,65,15,126,36,128                ; movq          (%r8,%rax,4),%xmm4
+  DB  243,65,15,126,36,144                ; movq          (%r8,%rdx,4),%xmm4
   DB  102,15,58,14,252,15                 ; pblendw       $0xf,%xmm4,%xmm7
-  DB  233,115,255,255,255                 ; jmpq          18c5c <_sk_load_bgra_dst_sse41+0x22>
-  DB  102,65,15,110,60,128                ; movd          (%r8,%rax,4),%xmm7
-  DB  233,104,255,255,255                 ; jmpq          18c5c <_sk_load_bgra_dst_sse41+0x22>
+  DB  233,124,255,255,255                 ; jmpq          18815 <_sk_load_bgra_dst_sse41+0x1c>
+  DB  102,65,15,110,60,144                ; movd          (%r8,%rdx,4),%xmm7
+  DB  233,113,255,255,255                 ; jmpq          18815 <_sk_load_bgra_dst_sse41+0x1c>
 
 PUBLIC _sk_gather_bgra_sse41
 _sk_gather_bgra_sse41 LABEL PROC
@@ -23054,17 +22871,17 @@
   DB  102,65,15,58,34,28,128,1            ; pinsrd        $0x1,(%r8,%rax,4),%xmm3
   DB  102,67,15,58,34,28,152,2            ; pinsrd        $0x2,(%r8,%r11,4),%xmm3
   DB  102,67,15,58,34,28,144,3            ; pinsrd        $0x3,(%r8,%r10,4),%xmm3
-  DB  102,15,111,5,181,177,1,0            ; movdqa        0x1b1b5(%rip),%xmm0        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  102,15,111,5,229,175,1,0            ; movdqa        0x1afe5(%rip),%xmm0        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  102,15,219,195                      ; pand          %xmm3,%xmm0
   DB  15,91,208                           ; cvtdq2ps      %xmm0,%xmm2
-  DB  68,15,40,5,6,179,1,0                ; movaps        0x1b306(%rip),%xmm8        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  68,15,40,5,54,177,1,0               ; movaps        0x1b136(%rip),%xmm8        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  65,15,89,208                        ; mulps         %xmm8,%xmm2
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
-  DB  102,15,56,0,5,165,177,1,0           ; pshufb        0x1b1a5(%rip),%xmm0        # 33f50 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
+  DB  102,15,56,0,5,213,175,1,0           ; pshufb        0x1afd5(%rip),%xmm0        # 33930 <_sk_srcover_bgra_8888_sse2_lowp+0xd40>
   DB  15,91,200                           ; cvtdq2ps      %xmm0,%xmm1
   DB  65,15,89,200                        ; mulps         %xmm8,%xmm1
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
-  DB  102,15,56,0,5,161,177,1,0           ; pshufb        0x1b1a1(%rip),%xmm0        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
+  DB  102,15,56,0,5,209,175,1,0           ; pshufb        0x1afd1(%rip),%xmm0        # 33940 <_sk_srcover_bgra_8888_sse2_lowp+0xd50>
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  102,15,114,211,24                   ; psrld         $0x18,%xmm3
@@ -23076,18 +22893,16 @@
 PUBLIC _sk_store_bgra_sse41
 _sk_store_bgra_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  68,15,95,202                        ; maxps         %xmm2,%xmm9
-  DB  68,15,40,21,143,176,1,0             ; movaps        0x1b08f(%rip),%xmm10        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,21,197,174,1,0             ; movaps        0x1aec5(%rip),%xmm10        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,93,202                        ; minps         %xmm10,%xmm9
-  DB  68,15,40,29,99,177,1,0              ; movaps        0x1b163(%rip),%xmm11        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  DB  68,15,40,29,153,175,1,0             ; movaps        0x1af99(%rip),%xmm11        # 33950 <_sk_srcover_bgra_8888_sse2_lowp+0xd60>
   DB  69,15,89,203                        ; mulps         %xmm11,%xmm9
   DB  102,69,15,91,201                    ; cvtps2dq      %xmm9,%xmm9
   DB  69,15,87,228                        ; xorps         %xmm12,%xmm12
@@ -23111,37 +22926,35 @@
   DB  102,69,15,235,193                   ; por           %xmm9,%xmm8
   DB  102,69,15,235,196                   ; por           %xmm12,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           18e82 <_sk_store_bgra_sse41+0xac>
-  DB  243,69,15,127,4,128                 ; movdqu        %xmm8,(%r8,%rax,4)
+  DB  117,10                              ; jne           18a2c <_sk_store_bgra_sse41+0xa6>
+  DB  243,69,15,127,4,144                 ; movdqu        %xmm8,(%r8,%rdx,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,29                              ; je            18eac <_sk_store_bgra_sse41+0xd6>
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,15                              ; je            18ea4 <_sk_store_bgra_sse41+0xce>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,227                             ; jne           18e7e <_sk_store_bgra_sse41+0xa8>
-  DB  102,69,15,58,22,68,128,8,2          ; pextrd        $0x2,%xmm8,0x8(%r8,%rax,4)
-  DB  102,69,15,214,4,128                 ; movq          %xmm8,(%r8,%rax,4)
-  DB  235,210                             ; jmp           18e7e <_sk_store_bgra_sse41+0xa8>
-  DB  102,69,15,126,4,128                 ; movd          %xmm8,(%r8,%rax,4)
-  DB  235,202                             ; jmp           18e7e <_sk_store_bgra_sse41+0xa8>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,25                              ; je            18a4d <_sk_store_bgra_sse41+0xc7>
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,13                              ; je            18a45 <_sk_store_bgra_sse41+0xbf>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,236                             ; jne           18a28 <_sk_store_bgra_sse41+0xa2>
+  DB  102,69,15,58,22,68,144,8,2          ; pextrd        $0x2,%xmm8,0x8(%r8,%rdx,4)
+  DB  102,69,15,214,4,144                 ; movq          %xmm8,(%r8,%rdx,4)
+  DB  235,219                             ; jmp           18a28 <_sk_store_bgra_sse41+0xa2>
+  DB  102,69,15,126,4,144                 ; movd          %xmm8,(%r8,%rdx,4)
+  DB  235,211                             ; jmp           18a28 <_sk_store_bgra_sse41+0xa2>
 
 PUBLIC _sk_load_f16_sse41
 _sk_load_f16_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,3                        ; shl           $0x3,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,68,1,0,0                     ; jne           19018 <_sk_load_f16_sse41+0x164>
-  DB  102,65,15,16,4,192                  ; movupd        (%r8,%rax,8),%xmm0
-  DB  243,65,15,111,76,192,16             ; movdqu        0x10(%r8,%rax,8),%xmm1
+  DB  15,133,68,1,0,0                     ; jne           18bb3 <_sk_load_f16_sse41+0x15e>
+  DB  102,65,15,16,4,208                  ; movupd        (%r8,%rdx,8),%xmm0
+  DB  243,65,15,111,76,208,16             ; movdqu        0x10(%r8,%rdx,8),%xmm1
   DB  102,68,15,40,200                    ; movapd        %xmm0,%xmm9
   DB  102,68,15,97,201                    ; punpcklwd     %xmm1,%xmm9
   DB  102,15,105,193                      ; punpckhwd     %xmm1,%xmm0
@@ -23149,19 +22962,19 @@
   DB  102,68,15,97,224                    ; punpcklwd     %xmm0,%xmm12
   DB  102,68,15,105,200                   ; punpckhwd     %xmm0,%xmm9
   DB  102,65,15,56,51,212                 ; pmovzxwd      %xmm12,%xmm2
-  DB  102,68,15,111,5,83,180,1,0          ; movdqa        0x1b453(%rip),%xmm8        # 34360 <_sk_srcover_bgra_8888_sse2_lowp+0x1144>
+  DB  102,68,15,111,5,152,178,1,0         ; movdqa        0x1b298(%rip),%xmm8        # 33d40 <_sk_srcover_bgra_8888_sse2_lowp+0x1150>
   DB  102,15,111,202                      ; movdqa        %xmm2,%xmm1
   DB  102,65,15,219,200                   ; pand          %xmm8,%xmm1
-  DB  102,68,15,111,21,81,180,1,0         ; movdqa        0x1b451(%rip),%xmm10        # 34370 <_sk_srcover_bgra_8888_sse2_lowp+0x1154>
+  DB  102,68,15,111,21,150,178,1,0        ; movdqa        0x1b296(%rip),%xmm10        # 33d50 <_sk_srcover_bgra_8888_sse2_lowp+0x1160>
   DB  102,65,15,219,210                   ; pand          %xmm10,%xmm2
-  DB  102,15,111,29,84,180,1,0            ; movdqa        0x1b454(%rip),%xmm3        # 34380 <_sk_srcover_bgra_8888_sse2_lowp+0x1164>
+  DB  102,15,111,29,153,178,1,0           ; movdqa        0x1b299(%rip),%xmm3        # 33d60 <_sk_srcover_bgra_8888_sse2_lowp+0x1170>
   DB  102,15,114,241,16                   ; pslld         $0x10,%xmm1
   DB  102,15,111,194                      ; movdqa        %xmm2,%xmm0
   DB  102,15,56,63,195                    ; pmaxud        %xmm3,%xmm0
   DB  102,15,118,194                      ; pcmpeqd       %xmm2,%xmm0
   DB  102,15,114,242,13                   ; pslld         $0xd,%xmm2
   DB  102,15,235,209                      ; por           %xmm1,%xmm2
-  DB  102,68,15,111,29,64,180,1,0         ; movdqa        0x1b440(%rip),%xmm11        # 34390 <_sk_srcover_bgra_8888_sse2_lowp+0x1174>
+  DB  102,68,15,111,29,133,178,1,0        ; movdqa        0x1b285(%rip),%xmm11        # 33d70 <_sk_srcover_bgra_8888_sse2_lowp+0x1180>
   DB  102,65,15,254,211                   ; paddd         %xmm11,%xmm2
   DB  102,15,219,194                      ; pand          %xmm2,%xmm0
   DB  102,65,15,112,204,238               ; pshufd        $0xee,%xmm12,%xmm1
@@ -23202,32 +23015,30 @@
   DB  102,65,15,219,217                   ; pand          %xmm9,%xmm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  242,65,15,16,4,192                  ; movsd         (%r8,%rax,8),%xmm0
+  DB  242,65,15,16,4,208                  ; movsd         (%r8,%rdx,8),%xmm0
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,13                              ; jne           19031 <_sk_load_f16_sse41+0x17d>
+  DB  117,13                              ; jne           18bcc <_sk_load_f16_sse41+0x177>
   DB  243,15,126,192                      ; movq          %xmm0,%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  233,176,254,255,255                 ; jmpq          18ee1 <_sk_load_f16_sse41+0x2d>
-  DB  102,65,15,22,68,192,8               ; movhpd        0x8(%r8,%rax,8),%xmm0
+  DB  233,176,254,255,255                 ; jmpq          18a7c <_sk_load_f16_sse41+0x27>
+  DB  102,65,15,22,68,208,8               ; movhpd        0x8(%r8,%rdx,8),%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  15,130,155,254,255,255              ; jb            18ee1 <_sk_load_f16_sse41+0x2d>
-  DB  243,65,15,126,76,192,16             ; movq          0x10(%r8,%rax,8),%xmm1
-  DB  233,143,254,255,255                 ; jmpq          18ee1 <_sk_load_f16_sse41+0x2d>
+  DB  15,130,155,254,255,255              ; jb            18a7c <_sk_load_f16_sse41+0x27>
+  DB  243,65,15,126,76,208,16             ; movq          0x10(%r8,%rdx,8),%xmm1
+  DB  233,143,254,255,255                 ; jmpq          18a7c <_sk_load_f16_sse41+0x27>
 
 PUBLIC _sk_load_f16_dst_sse41
 _sk_load_f16_dst_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,3                        ; shl           $0x3,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,68,1,0,0                     ; jne           191b6 <_sk_load_f16_dst_sse41+0x164>
-  DB  102,65,15,16,36,192                 ; movupd        (%r8,%rax,8),%xmm4
-  DB  243,65,15,111,108,192,16            ; movdqu        0x10(%r8,%rax,8),%xmm5
+  DB  15,133,68,1,0,0                     ; jne           18d4b <_sk_load_f16_dst_sse41+0x15e>
+  DB  102,65,15,16,36,208                 ; movupd        (%r8,%rdx,8),%xmm4
+  DB  243,65,15,111,108,208,16            ; movdqu        0x10(%r8,%rdx,8),%xmm5
   DB  102,68,15,40,204                    ; movapd        %xmm4,%xmm9
   DB  102,68,15,97,205                    ; punpcklwd     %xmm5,%xmm9
   DB  102,15,105,229                      ; punpckhwd     %xmm5,%xmm4
@@ -23235,19 +23046,19 @@
   DB  102,68,15,97,228                    ; punpcklwd     %xmm4,%xmm12
   DB  102,68,15,105,204                   ; punpckhwd     %xmm4,%xmm9
   DB  102,65,15,56,51,244                 ; pmovzxwd      %xmm12,%xmm6
-  DB  102,68,15,111,5,181,178,1,0         ; movdqa        0x1b2b5(%rip),%xmm8        # 34360 <_sk_srcover_bgra_8888_sse2_lowp+0x1144>
+  DB  102,68,15,111,5,0,177,1,0           ; movdqa        0x1b100(%rip),%xmm8        # 33d40 <_sk_srcover_bgra_8888_sse2_lowp+0x1150>
   DB  102,15,111,238                      ; movdqa        %xmm6,%xmm5
   DB  102,65,15,219,232                   ; pand          %xmm8,%xmm5
-  DB  102,68,15,111,21,179,178,1,0        ; movdqa        0x1b2b3(%rip),%xmm10        # 34370 <_sk_srcover_bgra_8888_sse2_lowp+0x1154>
+  DB  102,68,15,111,21,254,176,1,0        ; movdqa        0x1b0fe(%rip),%xmm10        # 33d50 <_sk_srcover_bgra_8888_sse2_lowp+0x1160>
   DB  102,65,15,219,242                   ; pand          %xmm10,%xmm6
-  DB  102,15,111,61,182,178,1,0           ; movdqa        0x1b2b6(%rip),%xmm7        # 34380 <_sk_srcover_bgra_8888_sse2_lowp+0x1164>
+  DB  102,15,111,61,1,177,1,0             ; movdqa        0x1b101(%rip),%xmm7        # 33d60 <_sk_srcover_bgra_8888_sse2_lowp+0x1170>
   DB  102,15,114,245,16                   ; pslld         $0x10,%xmm5
   DB  102,15,111,230                      ; movdqa        %xmm6,%xmm4
   DB  102,15,56,63,231                    ; pmaxud        %xmm7,%xmm4
   DB  102,15,118,230                      ; pcmpeqd       %xmm6,%xmm4
   DB  102,15,114,246,13                   ; pslld         $0xd,%xmm6
   DB  102,15,235,245                      ; por           %xmm5,%xmm6
-  DB  102,68,15,111,29,162,178,1,0        ; movdqa        0x1b2a2(%rip),%xmm11        # 34390 <_sk_srcover_bgra_8888_sse2_lowp+0x1174>
+  DB  102,68,15,111,29,237,176,1,0        ; movdqa        0x1b0ed(%rip),%xmm11        # 33d70 <_sk_srcover_bgra_8888_sse2_lowp+0x1180>
   DB  102,65,15,254,243                   ; paddd         %xmm11,%xmm6
   DB  102,15,219,230                      ; pand          %xmm6,%xmm4
   DB  102,65,15,112,236,238               ; pshufd        $0xee,%xmm12,%xmm5
@@ -23288,18 +23099,18 @@
   DB  102,65,15,219,249                   ; pand          %xmm9,%xmm7
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  242,65,15,16,36,192                 ; movsd         (%r8,%rax,8),%xmm4
+  DB  242,65,15,16,36,208                 ; movsd         (%r8,%rdx,8),%xmm4
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,13                              ; jne           191cf <_sk_load_f16_dst_sse41+0x17d>
+  DB  117,13                              ; jne           18d64 <_sk_load_f16_dst_sse41+0x177>
   DB  243,15,126,228                      ; movq          %xmm4,%xmm4
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
-  DB  233,176,254,255,255                 ; jmpq          1907f <_sk_load_f16_dst_sse41+0x2d>
-  DB  102,65,15,22,100,192,8              ; movhpd        0x8(%r8,%rax,8),%xmm4
+  DB  233,176,254,255,255                 ; jmpq          18c14 <_sk_load_f16_dst_sse41+0x27>
+  DB  102,65,15,22,100,208,8              ; movhpd        0x8(%r8,%rdx,8),%xmm4
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  15,130,155,254,255,255              ; jb            1907f <_sk_load_f16_dst_sse41+0x2d>
-  DB  243,65,15,126,108,192,16            ; movq          0x10(%r8,%rax,8),%xmm5
-  DB  233,143,254,255,255                 ; jmpq          1907f <_sk_load_f16_dst_sse41+0x2d>
+  DB  15,130,155,254,255,255              ; jb            18c14 <_sk_load_f16_dst_sse41+0x27>
+  DB  243,65,15,126,108,208,16            ; movq          0x10(%r8,%rdx,8),%xmm5
+  DB  233,143,254,255,255                 ; jmpq          18c14 <_sk_load_f16_dst_sse41+0x27>
 
 PUBLIC _sk_gather_f16_sse41
 _sk_gather_f16_sse41 LABEL PROC
@@ -23343,19 +23154,19 @@
   DB  102,68,15,97,226                    ; punpcklwd     %xmm2,%xmm12
   DB  102,68,15,105,202                   ; punpckhwd     %xmm2,%xmm9
   DB  102,65,15,56,51,212                 ; pmovzxwd      %xmm12,%xmm2
-  DB  102,68,15,111,5,179,176,1,0         ; movdqa        0x1b0b3(%rip),%xmm8        # 34360 <_sk_srcover_bgra_8888_sse2_lowp+0x1144>
+  DB  102,68,15,111,5,254,174,1,0         ; movdqa        0x1aefe(%rip),%xmm8        # 33d40 <_sk_srcover_bgra_8888_sse2_lowp+0x1150>
   DB  102,15,111,202                      ; movdqa        %xmm2,%xmm1
   DB  102,65,15,219,200                   ; pand          %xmm8,%xmm1
-  DB  102,68,15,111,21,177,176,1,0        ; movdqa        0x1b0b1(%rip),%xmm10        # 34370 <_sk_srcover_bgra_8888_sse2_lowp+0x1154>
+  DB  102,68,15,111,21,252,174,1,0        ; movdqa        0x1aefc(%rip),%xmm10        # 33d50 <_sk_srcover_bgra_8888_sse2_lowp+0x1160>
   DB  102,65,15,219,210                   ; pand          %xmm10,%xmm2
-  DB  102,15,111,29,180,176,1,0           ; movdqa        0x1b0b4(%rip),%xmm3        # 34380 <_sk_srcover_bgra_8888_sse2_lowp+0x1164>
+  DB  102,15,111,29,255,174,1,0           ; movdqa        0x1aeff(%rip),%xmm3        # 33d60 <_sk_srcover_bgra_8888_sse2_lowp+0x1170>
   DB  102,15,114,241,16                   ; pslld         $0x10,%xmm1
   DB  102,15,111,194                      ; movdqa        %xmm2,%xmm0
   DB  102,15,56,63,195                    ; pmaxud        %xmm3,%xmm0
   DB  102,15,118,194                      ; pcmpeqd       %xmm2,%xmm0
   DB  102,15,114,242,13                   ; pslld         $0xd,%xmm2
   DB  102,15,235,209                      ; por           %xmm1,%xmm2
-  DB  102,68,15,111,29,160,176,1,0        ; movdqa        0x1b0a0(%rip),%xmm11        # 34390 <_sk_srcover_bgra_8888_sse2_lowp+0x1174>
+  DB  102,68,15,111,29,235,174,1,0        ; movdqa        0x1aeeb(%rip),%xmm11        # 33d70 <_sk_srcover_bgra_8888_sse2_lowp+0x1180>
   DB  102,65,15,254,211                   ; paddd         %xmm11,%xmm2
   DB  102,15,219,194                      ; pand          %xmm2,%xmm0
   DB  102,65,15,112,204,238               ; pshufd        $0xee,%xmm12,%xmm1
@@ -23400,26 +23211,24 @@
 PUBLIC _sk_store_f16_sse41
 _sk_store_f16_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,3                        ; shl           $0x3,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
-  DB  102,68,15,111,13,200,175,1,0        ; movdqa        0x1afc8(%rip),%xmm9        # 343a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1184>
+  DB  102,68,15,111,13,25,174,1,0         ; movdqa        0x1ae19(%rip),%xmm9        # 33d80 <_sk_srcover_bgra_8888_sse2_lowp+0x1190>
   DB  102,68,15,111,224                   ; movdqa        %xmm0,%xmm12
   DB  102,69,15,219,225                   ; pand          %xmm9,%xmm12
-  DB  102,68,15,111,29,197,175,1,0        ; movdqa        0x1afc5(%rip),%xmm11        # 343b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1194>
+  DB  102,68,15,111,29,22,174,1,0         ; movdqa        0x1ae16(%rip),%xmm11        # 33d90 <_sk_srcover_bgra_8888_sse2_lowp+0x11a0>
   DB  102,68,15,111,232                   ; movdqa        %xmm0,%xmm13
   DB  102,69,15,219,235                   ; pand          %xmm11,%xmm13
-  DB  102,68,15,111,21,194,175,1,0        ; movdqa        0x1afc2(%rip),%xmm10        # 343c0 <_sk_srcover_bgra_8888_sse2_lowp+0x11a4>
+  DB  102,68,15,111,21,19,174,1,0         ; movdqa        0x1ae13(%rip),%xmm10        # 33da0 <_sk_srcover_bgra_8888_sse2_lowp+0x11b0>
   DB  102,65,15,114,212,16                ; psrld         $0x10,%xmm12
   DB  102,69,15,111,197                   ; movdqa        %xmm13,%xmm8
   DB  102,69,15,56,63,194                 ; pmaxud        %xmm10,%xmm8
   DB  102,69,15,118,197                   ; pcmpeqd       %xmm13,%xmm8
   DB  102,65,15,114,213,13                ; psrld         $0xd,%xmm13
   DB  102,69,15,254,236                   ; paddd         %xmm12,%xmm13
-  DB  102,68,15,111,37,168,175,1,0        ; movdqa        0x1afa8(%rip),%xmm12        # 343d0 <_sk_srcover_bgra_8888_sse2_lowp+0x11b4>
+  DB  102,68,15,111,37,249,173,1,0        ; movdqa        0x1adf9(%rip),%xmm12        # 33db0 <_sk_srcover_bgra_8888_sse2_lowp+0x11c0>
   DB  102,69,15,254,236                   ; paddd         %xmm12,%xmm13
   DB  102,69,15,219,197                   ; pand          %xmm13,%xmm8
   DB  102,68,15,56,43,192                 ; packusdw      %xmm0,%xmm8
@@ -23464,36 +23273,34 @@
   DB  102,69,15,111,200                   ; movdqa        %xmm8,%xmm9
   DB  102,69,15,98,205                    ; punpckldq     %xmm13,%xmm9
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,21                              ; jne           19526 <_sk_store_f16_sse41+0x16e>
-  DB  69,15,17,12,192                     ; movups        %xmm9,(%r8,%rax,8)
+  DB  117,21                              ; jne           190b5 <_sk_store_f16_sse41+0x168>
+  DB  69,15,17,12,208                     ; movups        %xmm9,(%r8,%rdx,8)
   DB  102,69,15,106,197                   ; punpckhdq     %xmm13,%xmm8
-  DB  243,69,15,127,68,192,16             ; movdqu        %xmm8,0x10(%r8,%rax,8)
+  DB  243,69,15,127,68,208,16             ; movdqu        %xmm8,0x10(%r8,%rdx,8)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  102,69,15,214,12,192                ; movq          %xmm9,(%r8,%rax,8)
+  DB  102,69,15,214,12,208                ; movq          %xmm9,(%r8,%rdx,8)
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,240                             ; je            19522 <_sk_store_f16_sse41+0x16a>
-  DB  102,69,15,23,76,192,8               ; movhpd        %xmm9,0x8(%r8,%rax,8)
+  DB  116,240                             ; je            190b1 <_sk_store_f16_sse41+0x164>
+  DB  102,69,15,23,76,208,8               ; movhpd        %xmm9,0x8(%r8,%rdx,8)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,227                             ; jb            19522 <_sk_store_f16_sse41+0x16a>
+  DB  114,227                             ; jb            190b1 <_sk_store_f16_sse41+0x164>
   DB  102,69,15,106,197                   ; punpckhdq     %xmm13,%xmm8
-  DB  102,69,15,214,68,192,16             ; movq          %xmm8,0x10(%r8,%rax,8)
-  DB  235,213                             ; jmp           19522 <_sk_store_f16_sse41+0x16a>
+  DB  102,69,15,214,68,208,16             ; movq          %xmm8,0x10(%r8,%rdx,8)
+  DB  235,213                             ; jmp           190b1 <_sk_store_f16_sse41+0x164>
 
 PUBLIC _sk_load_u16_be_sse41
 _sk_load_u16_be_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9d
-  DB  76,99,80,8                          ; movslq        0x8(%rax),%r10
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,194                       ; imul          %r10,%r8
-  DB  77,1,192                            ; add           %r8,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  73,99,193                           ; movslq        %r9d,%rax
+  DB  76,141,4,149,0,0,0,0                ; lea           0x0(,%rdx,4),%r8
+  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  77,1,201                            ; add           %r9,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,185,0,0,0                    ; jne           1962d <_sk_load_u16_be_sse41+0xe0>
-  DB  102,65,15,16,4,64                   ; movupd        (%r8,%rax,2),%xmm0
-  DB  243,65,15,111,76,64,16              ; movdqu        0x10(%r8,%rax,2),%xmm1
+  DB  15,133,185,0,0,0                    ; jne           191b6 <_sk_load_u16_be_sse41+0xda>
+  DB  102,67,15,16,4,65                   ; movupd        (%r9,%r8,2),%xmm0
+  DB  243,67,15,111,76,65,16              ; movdqu        0x10(%r9,%r8,2),%xmm1
   DB  102,15,40,208                       ; movapd        %xmm0,%xmm2
   DB  102,15,97,209                       ; punpcklwd     %xmm1,%xmm2
   DB  102,15,105,193                      ; punpckhwd     %xmm1,%xmm0
@@ -23507,7 +23314,7 @@
   DB  102,15,235,200                      ; por           %xmm0,%xmm1
   DB  102,15,56,51,193                    ; pmovzxwd      %xmm1,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  68,15,40,5,112,171,1,0              ; movaps        0x1ab70(%rip),%xmm8        # 34130 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
+  DB  68,15,40,5,199,169,1,0              ; movaps        0x1a9c7(%rip),%xmm8        # 33b10 <_sk_srcover_bgra_8888_sse2_lowp+0xf20>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  102,15,111,203                      ; movdqa        %xmm3,%xmm1
   DB  102,15,113,241,8                    ; psllw         $0x8,%xmm1
@@ -23533,35 +23340,31 @@
   DB  65,15,89,216                        ; mulps         %xmm8,%xmm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  242,65,15,16,4,64                   ; movsd         (%r8,%rax,2),%xmm0
+  DB  242,67,15,16,4,65                   ; movsd         (%r9,%r8,2),%xmm0
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,13                              ; jne           19646 <_sk_load_u16_be_sse41+0xf9>
+  DB  117,13                              ; jne           191cf <_sk_load_u16_be_sse41+0xf3>
   DB  243,15,126,192                      ; movq          %xmm0,%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  233,59,255,255,255                  ; jmpq          19581 <_sk_load_u16_be_sse41+0x34>
-  DB  102,65,15,22,68,64,8                ; movhpd        0x8(%r8,%rax,2),%xmm0
+  DB  233,59,255,255,255                  ; jmpq          1910a <_sk_load_u16_be_sse41+0x2e>
+  DB  102,67,15,22,68,65,8                ; movhpd        0x8(%r9,%r8,2),%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  15,130,38,255,255,255               ; jb            19581 <_sk_load_u16_be_sse41+0x34>
-  DB  243,65,15,126,76,64,16              ; movq          0x10(%r8,%rax,2),%xmm1
-  DB  233,26,255,255,255                  ; jmpq          19581 <_sk_load_u16_be_sse41+0x34>
+  DB  15,130,38,255,255,255               ; jb            1910a <_sk_load_u16_be_sse41+0x2e>
+  DB  243,67,15,126,76,65,16              ; movq          0x10(%r9,%r8,2),%xmm1
+  DB  233,26,255,255,255                  ; jmpq          1910a <_sk_load_u16_be_sse41+0x2e>
 
 PUBLIC _sk_load_rgb_u16_be_sse41
 _sk_load_rgb_u16_be_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  76,141,4,82                         ; lea           (%rdx,%rdx,2),%r8
   DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
-  DB  77,1,192                            ; add           %r8,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,137,208                          ; mov           %rdx,%rax
-  DB  72,193,224,32                       ; shl           $0x20,%rax
-  DB  72,141,4,64                         ; lea           (%rax,%rax,2),%rax
-  DB  72,193,248,32                       ; sar           $0x20,%rax
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  77,1,201                            ; add           %r9,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,170,0,0,0                    ; jne           1973c <_sk_load_rgb_u16_be_sse41+0xd5>
-  DB  243,65,15,111,20,64                 ; movdqu        (%r8,%rax,2),%xmm2
-  DB  243,65,15,111,92,64,8               ; movdqu        0x8(%r8,%rax,2),%xmm3
+  DB  15,133,170,0,0,0                    ; jne           192b7 <_sk_load_rgb_u16_be_sse41+0xc7>
+  DB  243,67,15,111,20,65                 ; movdqu        (%r9,%r8,2),%xmm2
+  DB  243,67,15,111,92,65,8               ; movdqu        0x8(%r9,%r8,2),%xmm3
   DB  102,15,115,219,4                    ; psrldq        $0x4,%xmm3
   DB  102,15,111,194                      ; movdqa        %xmm2,%xmm0
   DB  102,15,115,216,6                    ; psrldq        $0x6,%xmm0
@@ -23579,7 +23382,7 @@
   DB  102,15,235,200                      ; por           %xmm0,%xmm1
   DB  102,15,56,51,193                    ; pmovzxwd      %xmm1,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  68,15,40,5,63,170,1,0               ; movaps        0x1aa3f(%rip),%xmm8        # 34130 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
+  DB  68,15,40,5,164,168,1,0              ; movaps        0x1a8a4(%rip),%xmm8        # 33b10 <_sk_srcover_bgra_8888_sse2_lowp+0xf20>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  102,15,111,203                      ; movdqa        %xmm3,%xmm1
   DB  102,15,113,241,8                    ; psllw         $0x8,%xmm1
@@ -23596,44 +23399,42 @@
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
   DB  65,15,89,208                        ; mulps         %xmm8,%xmm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,86,167,1,0                 ; movaps        0x1a756(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,29,187,165,1,0                ; movaps        0x1a5bb(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  255,224                             ; jmpq          *%rax
-  DB  102,65,15,110,20,64                 ; movd          (%r8,%rax,2),%xmm2
+  DB  102,67,15,110,20,65                 ; movd          (%r9,%r8,2),%xmm2
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  102,65,15,196,84,64,4,2             ; pinsrw        $0x2,0x4(%r8,%rax,2),%xmm2
+  DB  102,67,15,196,84,65,4,2             ; pinsrw        $0x2,0x4(%r9,%r8,2),%xmm2
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,13                              ; jne           19761 <_sk_load_rgb_u16_be_sse41+0xfa>
+  DB  117,13                              ; jne           192dc <_sk_load_rgb_u16_be_sse41+0xec>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
-  DB  233,85,255,255,255                  ; jmpq          196b6 <_sk_load_rgb_u16_be_sse41+0x4f>
-  DB  102,65,15,110,68,64,6               ; movd          0x6(%r8,%rax,2),%xmm0
+  DB  233,85,255,255,255                  ; jmpq          19231 <_sk_load_rgb_u16_be_sse41+0x41>
+  DB  102,67,15,110,68,65,6               ; movd          0x6(%r9,%r8,2),%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  102,65,15,196,68,64,10,2            ; pinsrw        $0x2,0xa(%r8,%rax,2),%xmm0
+  DB  102,67,15,196,68,65,10,2            ; pinsrw        $0x2,0xa(%r9,%r8,2),%xmm0
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,24                              ; jb            19792 <_sk_load_rgb_u16_be_sse41+0x12b>
-  DB  102,65,15,110,92,64,12              ; movd          0xc(%r8,%rax,2),%xmm3
+  DB  114,24                              ; jb            1930d <_sk_load_rgb_u16_be_sse41+0x11d>
+  DB  102,67,15,110,92,65,12              ; movd          0xc(%r9,%r8,2),%xmm3
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  102,65,15,196,92,64,16,2            ; pinsrw        $0x2,0x10(%r8,%rax,2),%xmm3
-  DB  233,36,255,255,255                  ; jmpq          196b6 <_sk_load_rgb_u16_be_sse41+0x4f>
+  DB  102,67,15,196,92,65,16,2            ; pinsrw        $0x2,0x10(%r9,%r8,2),%xmm3
+  DB  233,36,255,255,255                  ; jmpq          19231 <_sk_load_rgb_u16_be_sse41+0x41>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
-  DB  233,27,255,255,255                  ; jmpq          196b6 <_sk_load_rgb_u16_be_sse41+0x4f>
+  DB  233,27,255,255,255                  ; jmpq          19231 <_sk_load_rgb_u16_be_sse41+0x41>
 
 PUBLIC _sk_store_u16_be_sse41
 _sk_store_u16_be_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9d
-  DB  76,99,80,8                          ; movslq        0x8(%rax),%r10
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,194                       ; imul          %r10,%r8
-  DB  77,1,192                            ; add           %r8,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  73,99,193                           ; movslq        %r9d,%rax
+  DB  76,141,4,149,0,0,0,0                ; lea           0x0(,%rdx,4),%r8
+  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  77,1,201                            ; add           %r9,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  68,15,95,192                        ; maxps         %xmm0,%xmm8
-  DB  68,15,40,21,195,166,1,0             ; movaps        0x1a6c3(%rip),%xmm10        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,21,46,165,1,0              ; movaps        0x1a52e(%rip),%xmm10        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,93,194                        ; minps         %xmm10,%xmm8
-  DB  68,15,40,29,7,172,1,0               ; movaps        0x1ac07(%rip),%xmm11        # 343e0 <_sk_srcover_bgra_8888_sse2_lowp+0x11c4>
+  DB  68,15,40,29,114,170,1,0             ; movaps        0x1aa72(%rip),%xmm11        # 33dc0 <_sk_srcover_bgra_8888_sse2_lowp+0x11d0>
   DB  69,15,89,195                        ; mulps         %xmm11,%xmm8
   DB  102,69,15,91,192                    ; cvtps2dq      %xmm8,%xmm8
   DB  102,68,15,56,43,192                 ; packusdw      %xmm0,%xmm8
@@ -23675,38 +23476,38 @@
   DB  102,69,15,111,200                   ; movdqa        %xmm8,%xmm9
   DB  102,69,15,98,204                    ; punpckldq     %xmm12,%xmm9
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,21                              ; jne           198bd <_sk_store_u16_be_sse41+0x122>
-  DB  69,15,17,12,64                      ; movups        %xmm9,(%r8,%rax,2)
+  DB  117,21                              ; jne           19432 <_sk_store_u16_be_sse41+0x11c>
+  DB  71,15,17,12,65                      ; movups        %xmm9,(%r9,%r8,2)
   DB  102,69,15,106,196                   ; punpckhdq     %xmm12,%xmm8
-  DB  243,69,15,127,68,64,16              ; movdqu        %xmm8,0x10(%r8,%rax,2)
+  DB  243,71,15,127,68,65,16              ; movdqu        %xmm8,0x10(%r9,%r8,2)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  102,69,15,214,12,64                 ; movq          %xmm9,(%r8,%rax,2)
+  DB  102,71,15,214,12,65                 ; movq          %xmm9,(%r9,%r8,2)
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,240                             ; je            198b9 <_sk_store_u16_be_sse41+0x11e>
-  DB  102,69,15,23,76,64,8                ; movhpd        %xmm9,0x8(%r8,%rax,2)
+  DB  116,240                             ; je            1942e <_sk_store_u16_be_sse41+0x118>
+  DB  102,71,15,23,76,65,8                ; movhpd        %xmm9,0x8(%r9,%r8,2)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,227                             ; jb            198b9 <_sk_store_u16_be_sse41+0x11e>
+  DB  114,227                             ; jb            1942e <_sk_store_u16_be_sse41+0x118>
   DB  102,69,15,106,196                   ; punpckhdq     %xmm12,%xmm8
-  DB  102,69,15,214,68,64,16              ; movq          %xmm8,0x10(%r8,%rax,2)
-  DB  235,213                             ; jmp           198b9 <_sk_store_u16_be_sse41+0x11e>
+  DB  102,71,15,214,68,65,16              ; movq          %xmm8,0x10(%r9,%r8,2)
+  DB  235,213                             ; jmp           1942e <_sk_store_u16_be_sse41+0x118>
 
 PUBLIC _sk_load_f32_sse41
 _sk_load_f32_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9d
-  DB  76,99,80,8                          ; movslq        0x8(%rax),%r10
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,194                       ; imul          %r10,%r8
-  DB  73,193,224,2                        ; shl           $0x2,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  73,99,193                           ; movslq        %r9d,%rax
-  DB  69,15,16,4,128                      ; movups        (%r8,%rax,4),%xmm8
+  DB  76,141,4,149,0,0,0,0                ; lea           0x0(,%rdx,4),%r8
+  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  73,193,225,2                        ; shl           $0x2,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
+  DB  72,137,208                          ; mov           %rdx,%rax
+  DB  72,193,224,4                        ; shl           $0x4,%rax
+  DB  70,15,16,4,8                        ; movups        (%rax,%r9,1),%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,66                              ; jne           1994f <_sk_load_f32_sse41+0x6b>
-  DB  65,15,16,68,128,16                  ; movups        0x10(%r8,%rax,4),%xmm0
-  DB  65,15,16,92,128,32                  ; movups        0x20(%r8,%rax,4),%xmm3
-  DB  69,15,16,76,128,48                  ; movups        0x30(%r8,%rax,4),%xmm9
+  DB  117,66                              ; jne           194c5 <_sk_load_f32_sse41+0x6c>
+  DB  67,15,16,68,129,16                  ; movups        0x10(%r9,%r8,4),%xmm0
+  DB  67,15,16,92,129,32                  ; movups        0x20(%r9,%r8,4),%xmm3
+  DB  71,15,16,76,129,48                  ; movups        0x30(%r9,%r8,4),%xmm9
   DB  65,15,40,208                        ; movaps        %xmm8,%xmm2
   DB  15,20,208                           ; unpcklps      %xmm0,%xmm2
   DB  15,40,203                           ; movaps        %xmm3,%xmm1
@@ -23723,34 +23524,34 @@
   DB  255,224                             ; jmpq          *%rax
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,8                               ; jne           19961 <_sk_load_f32_sse41+0x7d>
+  DB  117,8                               ; jne           194d7 <_sk_load_f32_sse41+0x7e>
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
-  DB  235,190                             ; jmp           1991f <_sk_load_f32_sse41+0x3b>
-  DB  65,15,16,68,128,16                  ; movups        0x10(%r8,%rax,4),%xmm0
+  DB  235,190                             ; jmp           19495 <_sk_load_f32_sse41+0x3c>
+  DB  67,15,16,68,129,16                  ; movups        0x10(%r9,%r8,4),%xmm0
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,8                               ; jb            19975 <_sk_load_f32_sse41+0x91>
-  DB  65,15,16,92,128,32                  ; movups        0x20(%r8,%rax,4),%xmm3
-  DB  235,170                             ; jmp           1991f <_sk_load_f32_sse41+0x3b>
+  DB  114,8                               ; jb            194eb <_sk_load_f32_sse41+0x92>
+  DB  67,15,16,92,129,32                  ; movups        0x20(%r9,%r8,4),%xmm3
+  DB  235,170                             ; jmp           19495 <_sk_load_f32_sse41+0x3c>
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
-  DB  235,165                             ; jmp           1991f <_sk_load_f32_sse41+0x3b>
+  DB  235,165                             ; jmp           19495 <_sk_load_f32_sse41+0x3c>
 
 PUBLIC _sk_load_f32_dst_sse41
 _sk_load_f32_dst_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9d
-  DB  76,99,80,8                          ; movslq        0x8(%rax),%r10
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,194                       ; imul          %r10,%r8
-  DB  73,193,224,2                        ; shl           $0x2,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  73,99,193                           ; movslq        %r9d,%rax
-  DB  69,15,16,4,128                      ; movups        (%r8,%rax,4),%xmm8
+  DB  76,141,4,149,0,0,0,0                ; lea           0x0(,%rdx,4),%r8
+  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  73,193,225,2                        ; shl           $0x2,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
+  DB  72,137,208                          ; mov           %rdx,%rax
+  DB  72,193,224,4                        ; shl           $0x4,%rax
+  DB  70,15,16,4,8                        ; movups        (%rax,%r9,1),%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,66                              ; jne           199e5 <_sk_load_f32_dst_sse41+0x6b>
-  DB  65,15,16,100,128,16                 ; movups        0x10(%r8,%rax,4),%xmm4
-  DB  65,15,16,124,128,32                 ; movups        0x20(%r8,%rax,4),%xmm7
-  DB  69,15,16,76,128,48                  ; movups        0x30(%r8,%rax,4),%xmm9
+  DB  117,66                              ; jne           1955c <_sk_load_f32_dst_sse41+0x6c>
+  DB  67,15,16,100,129,16                 ; movups        0x10(%r9,%r8,4),%xmm4
+  DB  67,15,16,124,129,32                 ; movups        0x20(%r9,%r8,4),%xmm7
+  DB  71,15,16,76,129,48                  ; movups        0x30(%r9,%r8,4),%xmm9
   DB  65,15,40,240                        ; movaps        %xmm8,%xmm6
   DB  15,20,244                           ; unpcklps      %xmm4,%xmm6
   DB  15,40,239                           ; movaps        %xmm7,%xmm5
@@ -23767,28 +23568,28 @@
   DB  255,224                             ; jmpq          *%rax
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,8                               ; jne           199f7 <_sk_load_f32_dst_sse41+0x7d>
+  DB  117,8                               ; jne           1956e <_sk_load_f32_dst_sse41+0x7e>
   DB  15,87,255                           ; xorps         %xmm7,%xmm7
   DB  15,87,228                           ; xorps         %xmm4,%xmm4
-  DB  235,190                             ; jmp           199b5 <_sk_load_f32_dst_sse41+0x3b>
-  DB  65,15,16,100,128,16                 ; movups        0x10(%r8,%rax,4),%xmm4
+  DB  235,190                             ; jmp           1952c <_sk_load_f32_dst_sse41+0x3c>
+  DB  67,15,16,100,129,16                 ; movups        0x10(%r9,%r8,4),%xmm4
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,8                               ; jb            19a0b <_sk_load_f32_dst_sse41+0x91>
-  DB  65,15,16,124,128,32                 ; movups        0x20(%r8,%rax,4),%xmm7
-  DB  235,170                             ; jmp           199b5 <_sk_load_f32_dst_sse41+0x3b>
+  DB  114,8                               ; jb            19582 <_sk_load_f32_dst_sse41+0x92>
+  DB  67,15,16,124,129,32                 ; movups        0x20(%r9,%r8,4),%xmm7
+  DB  235,170                             ; jmp           1952c <_sk_load_f32_dst_sse41+0x3c>
   DB  15,87,255                           ; xorps         %xmm7,%xmm7
-  DB  235,165                             ; jmp           199b5 <_sk_load_f32_dst_sse41+0x3b>
+  DB  235,165                             ; jmp           1952c <_sk_load_f32_dst_sse41+0x3c>
 
 PUBLIC _sk_store_f32_sse41
 _sk_store_f32_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9d
-  DB  76,99,80,8                          ; movslq        0x8(%rax),%r10
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,194                       ; imul          %r10,%r8
-  DB  73,193,224,2                        ; shl           $0x2,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  73,99,193                           ; movslq        %r9d,%rax
+  DB  76,141,4,149,0,0,0,0                ; lea           0x0(,%rdx,4),%r8
+  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  73,193,225,2                        ; shl           $0x2,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
+  DB  72,137,208                          ; mov           %rdx,%rax
+  DB  72,193,224,4                        ; shl           $0x4,%rax
   DB  68,15,40,200                        ; movaps        %xmm0,%xmm9
   DB  68,15,20,201                        ; unpcklps      %xmm1,%xmm9
   DB  68,15,40,194                        ; movaps        %xmm2,%xmm8
@@ -23802,22 +23603,22 @@
   DB  69,15,18,193                        ; movhlps       %xmm9,%xmm8
   DB  69,15,40,202                        ; movaps        %xmm10,%xmm9
   DB  102,69,15,20,203                    ; unpcklpd      %xmm11,%xmm9
-  DB  102,69,15,17,36,128                 ; movupd        %xmm12,(%r8,%rax,4)
+  DB  102,70,15,17,36,8                   ; movupd        %xmm12,(%rax,%r9,1)
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,29                              ; jne           19a8d <_sk_store_f32_sse41+0x7d>
+  DB  117,29                              ; jne           19605 <_sk_store_f32_sse41+0x7e>
   DB  102,69,15,21,211                    ; unpckhpd      %xmm11,%xmm10
-  DB  69,15,17,68,128,16                  ; movups        %xmm8,0x10(%r8,%rax,4)
-  DB  102,69,15,17,76,128,32              ; movupd        %xmm9,0x20(%r8,%rax,4)
-  DB  102,69,15,17,84,128,48              ; movupd        %xmm10,0x30(%r8,%rax,4)
+  DB  71,15,17,68,129,16                  ; movups        %xmm8,0x10(%r9,%r8,4)
+  DB  102,71,15,17,76,129,32              ; movupd        %xmm9,0x20(%r9,%r8,4)
+  DB  102,71,15,17,84,129,48              ; movupd        %xmm10,0x30(%r9,%r8,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,246                             ; je            19a89 <_sk_store_f32_sse41+0x79>
-  DB  69,15,17,68,128,16                  ; movups        %xmm8,0x10(%r8,%rax,4)
+  DB  116,246                             ; je            19601 <_sk_store_f32_sse41+0x7a>
+  DB  71,15,17,68,129,16                  ; movups        %xmm8,0x10(%r9,%r8,4)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,234                             ; jb            19a89 <_sk_store_f32_sse41+0x79>
-  DB  102,69,15,17,76,128,32              ; movupd        %xmm9,0x20(%r8,%rax,4)
-  DB  235,225                             ; jmp           19a89 <_sk_store_f32_sse41+0x79>
+  DB  114,234                             ; jb            19601 <_sk_store_f32_sse41+0x7a>
+  DB  102,71,15,17,76,129,32              ; movupd        %xmm9,0x20(%r9,%r8,4)
+  DB  235,225                             ; jmp           19601 <_sk_store_f32_sse41+0x7a>
 
 PUBLIC _sk_repeat_x_sse41
 _sk_repeat_x_sse41 LABEL PROC
@@ -23857,7 +23658,7 @@
   DB  65,15,92,194                        ; subps         %xmm10,%xmm0
   DB  243,69,15,88,192                    ; addss         %xmm8,%xmm8
   DB  69,15,198,192,0                     ; shufps        $0x0,%xmm8,%xmm8
-  DB  243,68,15,89,13,151,153,1,0         ; mulss         0x19997(%rip),%xmm9        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  243,68,15,89,13,243,151,1,0         ; mulss         0x197f3(%rip),%xmm9        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
   DB  68,15,89,200                        ; mulps         %xmm0,%xmm9
   DB  102,69,15,58,8,201,1                ; roundps       $0x1,%xmm9,%xmm9
@@ -23880,7 +23681,7 @@
   DB  65,15,92,202                        ; subps         %xmm10,%xmm1
   DB  243,69,15,88,192                    ; addss         %xmm8,%xmm8
   DB  69,15,198,192,0                     ; shufps        $0x0,%xmm8,%xmm8
-  DB  243,68,15,89,13,62,153,1,0          ; mulss         0x1993e(%rip),%xmm9        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  243,68,15,89,13,154,151,1,0         ; mulss         0x1979a(%rip),%xmm9        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
   DB  68,15,89,201                        ; mulps         %xmm1,%xmm9
   DB  102,69,15,58,8,201,1                ; roundps       $0x1,%xmm9,%xmm9
@@ -23897,7 +23698,7 @@
 _sk_clamp_x_1_sse41 LABEL PROC
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  68,15,95,192                        ; maxps         %xmm0,%xmm8
-  DB  68,15,93,5,202,162,1,0              ; minps         0x1a2ca(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,93,5,50,161,1,0               ; minps         0x1a132(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  255,224                             ; jmpq          *%rax
@@ -23908,16 +23709,16 @@
   DB  65,15,92,192                        ; subps         %xmm8,%xmm0
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  68,15,95,192                        ; maxps         %xmm0,%xmm8
-  DB  68,15,93,5,167,162,1,0              ; minps         0x1a2a7(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,93,5,15,161,1,0               ; minps         0x1a10f(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  255,224                             ; jmpq          *%rax
 
 PUBLIC _sk_mirror_x_1_sse41
 _sk_mirror_x_1_sse41 LABEL PROC
-  DB  68,15,40,5,247,162,1,0              ; movaps        0x1a2f7(%rip),%xmm8        # 33ef0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  DB  68,15,40,5,95,161,1,0               ; movaps        0x1a15f(%rip),%xmm8        # 338d0 <_sk_srcover_bgra_8888_sse2_lowp+0xce0>
   DB  65,15,88,192                        ; addps         %xmm8,%xmm0
-  DB  68,15,40,13,123,162,1,0             ; movaps        0x1a27b(%rip),%xmm9        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  68,15,40,13,227,160,1,0             ; movaps        0x1a0e3(%rip),%xmm9        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  68,15,89,200                        ; mulps         %xmm0,%xmm9
   DB  102,69,15,58,8,201,1                ; roundps       $0x1,%xmm9,%xmm9
   DB  69,15,88,201                        ; addps         %xmm9,%xmm9
@@ -23928,7 +23729,7 @@
   DB  68,15,92,200                        ; subps         %xmm0,%xmm9
   DB  68,15,84,200                        ; andps         %xmm0,%xmm9
   DB  69,15,95,193                        ; maxps         %xmm9,%xmm8
-  DB  68,15,93,5,88,162,1,0               ; minps         0x1a258(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,93,5,192,160,1,0              ; minps         0x1a0c0(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  255,224                             ; jmpq          *%rax
@@ -23936,10 +23737,10 @@
 PUBLIC _sk_luminance_to_alpha_sse41
 _sk_luminance_to_alpha_sse41 LABEL PROC
   DB  15,40,218                           ; movaps        %xmm2,%xmm3
-  DB  15,89,5,166,167,1,0                 ; mulps         0x1a7a6(%rip),%xmm0        # 343f0 <_sk_srcover_bgra_8888_sse2_lowp+0x11d4>
-  DB  15,89,13,175,167,1,0                ; mulps         0x1a7af(%rip),%xmm1        # 34400 <_sk_srcover_bgra_8888_sse2_lowp+0x11e4>
+  DB  15,89,5,14,166,1,0                  ; mulps         0x1a60e(%rip),%xmm0        # 33dd0 <_sk_srcover_bgra_8888_sse2_lowp+0x11e0>
+  DB  15,89,13,23,166,1,0                 ; mulps         0x1a617(%rip),%xmm1        # 33de0 <_sk_srcover_bgra_8888_sse2_lowp+0x11f0>
   DB  15,88,200                           ; addps         %xmm0,%xmm1
-  DB  15,89,29,181,167,1,0                ; mulps         0x1a7b5(%rip),%xmm3        # 34410 <_sk_srcover_bgra_8888_sse2_lowp+0x11f4>
+  DB  15,89,29,29,166,1,0                 ; mulps         0x1a61d(%rip),%xmm3        # 33df0 <_sk_srcover_bgra_8888_sse2_lowp+0x1200>
   DB  15,88,217                           ; addps         %xmm1,%xmm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
@@ -24235,9 +24036,9 @@
   DB  72,139,24                           ; mov           (%rax),%rbx
   DB  76,139,112,8                        ; mov           0x8(%rax),%r14
   DB  72,255,203                          ; dec           %rbx
-  DB  120,7                               ; js            1a0fb <_sk_evenly_spaced_gradient_sse41+0x18>
+  DB  120,7                               ; js            19c73 <_sk_evenly_spaced_gradient_sse41+0x18>
   DB  243,72,15,42,203                    ; cvtsi2ss      %rbx,%xmm1
-  DB  235,21                              ; jmp           1a110 <_sk_evenly_spaced_gradient_sse41+0x2d>
+  DB  235,21                              ; jmp           19c88 <_sk_evenly_spaced_gradient_sse41+0x2d>
   DB  73,137,216                          ; mov           %rbx,%r8
   DB  73,209,232                          ; shr           %r8
   DB  131,227,1                           ; and           $0x1,%ebx
@@ -24330,7 +24131,7 @@
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  73,131,248,2                        ; cmp           $0x2,%r8
-  DB  114,41                              ; jb            1a2f0 <_sk_gradient_sse41+0x3b>
+  DB  114,41                              ; jb            19e68 <_sk_gradient_sse41+0x3b>
   DB  76,139,72,72                        ; mov           0x48(%rax),%r9
   DB  73,255,200                          ; dec           %r8
   DB  73,131,193,4                        ; add           $0x4,%r9
@@ -24341,7 +24142,7 @@
   DB  102,15,250,202                      ; psubd         %xmm2,%xmm1
   DB  73,131,193,4                        ; add           $0x4,%r9
   DB  73,255,200                          ; dec           %r8
-  DB  117,230                             ; jne           1a2d6 <_sk_gradient_sse41+0x21>
+  DB  117,230                             ; jne           19e4e <_sk_gradient_sse41+0x21>
   DB  102,73,15,58,22,200,1               ; pextrq        $0x1,%xmm1,%r8
   DB  69,137,193                          ; mov           %r8d,%r9d
   DB  73,193,232,32                       ; shr           $0x20,%r8
@@ -24466,26 +24267,26 @@
   DB  69,15,94,226                        ; divps         %xmm10,%xmm12
   DB  69,15,40,236                        ; movaps        %xmm12,%xmm13
   DB  69,15,89,237                        ; mulps         %xmm13,%xmm13
-  DB  68,15,40,21,223,158,1,0             ; movaps        0x19edf(%rip),%xmm10        # 34420 <_sk_srcover_bgra_8888_sse2_lowp+0x1204>
+  DB  68,15,40,21,71,157,1,0              ; movaps        0x19d47(%rip),%xmm10        # 33e00 <_sk_srcover_bgra_8888_sse2_lowp+0x1210>
   DB  69,15,89,213                        ; mulps         %xmm13,%xmm10
-  DB  68,15,88,21,227,158,1,0             ; addps         0x19ee3(%rip),%xmm10        # 34430 <_sk_srcover_bgra_8888_sse2_lowp+0x1214>
+  DB  68,15,88,21,75,157,1,0              ; addps         0x19d4b(%rip),%xmm10        # 33e10 <_sk_srcover_bgra_8888_sse2_lowp+0x1220>
   DB  69,15,89,213                        ; mulps         %xmm13,%xmm10
-  DB  68,15,88,21,231,158,1,0             ; addps         0x19ee7(%rip),%xmm10        # 34440 <_sk_srcover_bgra_8888_sse2_lowp+0x1224>
+  DB  68,15,88,21,79,157,1,0              ; addps         0x19d4f(%rip),%xmm10        # 33e20 <_sk_srcover_bgra_8888_sse2_lowp+0x1230>
   DB  69,15,89,213                        ; mulps         %xmm13,%xmm10
-  DB  68,15,88,21,235,158,1,0             ; addps         0x19eeb(%rip),%xmm10        # 34450 <_sk_srcover_bgra_8888_sse2_lowp+0x1234>
+  DB  68,15,88,21,83,157,1,0              ; addps         0x19d53(%rip),%xmm10        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0x1240>
   DB  69,15,89,212                        ; mulps         %xmm12,%xmm10
   DB  65,15,194,195,1                     ; cmpltps       %xmm11,%xmm0
-  DB  68,15,40,29,234,158,1,0             ; movaps        0x19eea(%rip),%xmm11        # 34460 <_sk_srcover_bgra_8888_sse2_lowp+0x1244>
+  DB  68,15,40,29,82,157,1,0              ; movaps        0x19d52(%rip),%xmm11        # 33e40 <_sk_srcover_bgra_8888_sse2_lowp+0x1250>
   DB  69,15,92,218                        ; subps         %xmm10,%xmm11
   DB  102,69,15,56,20,211                 ; blendvps      %xmm0,%xmm11,%xmm10
   DB  69,15,194,200,1                     ; cmpltps       %xmm8,%xmm9
-  DB  68,15,40,29,243,152,1,0             ; movaps        0x198f3(%rip),%xmm11        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  68,15,40,29,91,151,1,0              ; movaps        0x1975b(%rip),%xmm11        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  69,15,92,218                        ; subps         %xmm10,%xmm11
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
   DB  102,69,15,56,20,211                 ; blendvps      %xmm0,%xmm11,%xmm10
   DB  15,40,193                           ; movaps        %xmm1,%xmm0
   DB  65,15,194,192,1                     ; cmpltps       %xmm8,%xmm0
-  DB  68,15,40,13,229,152,1,0             ; movaps        0x198e5(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,13,77,151,1,0              ; movaps        0x1974d(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,92,202                        ; subps         %xmm10,%xmm9
   DB  102,69,15,56,20,209                 ; blendvps      %xmm0,%xmm9,%xmm10
   DB  69,15,194,194,7                     ; cmpordps      %xmm10,%xmm8
@@ -24506,7 +24307,7 @@
 
 PUBLIC _sk_negate_x_sse41
 _sk_negate_x_sse41 LABEL PROC
-  DB  15,87,5,188,157,1,0                 ; xorps         0x19dbc(%rip),%xmm0        # 343a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1184>
+  DB  15,87,5,36,156,1,0                  ; xorps         0x19c24(%rip),%xmm0        # 33d80 <_sk_srcover_bgra_8888_sse2_lowp+0x1190>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
 
@@ -24573,7 +24374,7 @@
   DB  69,15,89,201                        ; mulps         %xmm9,%xmm9
   DB  65,15,92,193                        ; subps         %xmm9,%xmm0
   DB  15,81,192                           ; sqrtps        %xmm0,%xmm0
-  DB  15,87,5,254,156,1,0                 ; xorps         0x19cfe(%rip),%xmm0        # 343a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1184>
+  DB  15,87,5,102,155,1,0                 ; xorps         0x19b66(%rip),%xmm0        # 33d80 <_sk_srcover_bgra_8888_sse2_lowp+0x1190>
   DB  65,15,92,192                        ; subps         %xmm8,%xmm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -24589,7 +24390,7 @@
 
 PUBLIC _sk_alter_2pt_conical_unswap_sse41
 _sk_alter_2pt_conical_unswap_sse41 LABEL PROC
-  DB  68,15,40,5,201,151,1,0              ; movaps        0x197c9(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,49,150,1,0               ; movaps        0x19631(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,92,192                        ; subps         %xmm0,%xmm8
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
@@ -24630,7 +24431,7 @@
 PUBLIC _sk_save_xy_sse41
 _sk_save_xy_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,15,40,5,87,151,1,0               ; movaps        0x19757(%rip),%xmm8        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  68,15,40,5,191,149,1,0              ; movaps        0x195bf(%rip),%xmm8        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  15,17,0                             ; movups        %xmm0,(%rax)
   DB  68,15,40,200                        ; movaps        %xmm0,%xmm9
   DB  69,15,88,200                        ; addps         %xmm8,%xmm9
@@ -24670,8 +24471,8 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,128,128,0,0,0              ; movups        0x80(%rax),%xmm8
-  DB  15,88,5,176,156,1,0                 ; addps         0x19cb0(%rip),%xmm0        # 34470 <_sk_srcover_bgra_8888_sse2_lowp+0x1254>
-  DB  68,15,40,13,200,150,1,0             ; movaps        0x196c8(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,88,5,24,155,1,0                  ; addps         0x19b18(%rip),%xmm0        # 33e50 <_sk_srcover_bgra_8888_sse2_lowp+0x1260>
+  DB  68,15,40,13,48,149,1,0              ; movaps        0x19530(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
   DB  68,15,17,136,0,1,0,0                ; movups        %xmm9,0x100(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -24682,7 +24483,7 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,128,128,0,0,0              ; movups        0x80(%rax),%xmm8
-  DB  15,88,5,148,150,1,0                 ; addps         0x19694(%rip),%xmm0        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  15,88,5,252,148,1,0                 ; addps         0x194fc(%rip),%xmm0        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  68,15,17,128,0,1,0,0                ; movups        %xmm8,0x100(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -24692,8 +24493,8 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,72,64                         ; movups        0x40(%rax),%xmm1
   DB  68,15,16,128,192,0,0,0              ; movups        0xc0(%rax),%xmm8
-  DB  15,88,13,99,156,1,0                 ; addps         0x19c63(%rip),%xmm1        # 34470 <_sk_srcover_bgra_8888_sse2_lowp+0x1254>
-  DB  68,15,40,13,123,150,1,0             ; movaps        0x1967b(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,88,13,203,154,1,0                ; addps         0x19acb(%rip),%xmm1        # 33e50 <_sk_srcover_bgra_8888_sse2_lowp+0x1260>
+  DB  68,15,40,13,227,148,1,0             ; movaps        0x194e3(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
   DB  68,15,17,136,64,1,0,0               ; movups        %xmm9,0x140(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -24704,7 +24505,7 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,72,64                         ; movups        0x40(%rax),%xmm1
   DB  68,15,16,128,192,0,0,0              ; movups        0xc0(%rax),%xmm8
-  DB  15,88,13,70,150,1,0                 ; addps         0x19646(%rip),%xmm1        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  15,88,13,174,148,1,0                ; addps         0x194ae(%rip),%xmm1        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  68,15,17,128,64,1,0,0               ; movups        %xmm8,0x140(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -24714,13 +24515,13 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,128,128,0,0,0              ; movups        0x80(%rax),%xmm8
-  DB  15,88,5,38,156,1,0                  ; addps         0x19c26(%rip),%xmm0        # 34480 <_sk_srcover_bgra_8888_sse2_lowp+0x1264>
-  DB  68,15,40,13,46,150,1,0              ; movaps        0x1962e(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,88,5,142,154,1,0                 ; addps         0x19a8e(%rip),%xmm0        # 33e60 <_sk_srcover_bgra_8888_sse2_lowp+0x1270>
+  DB  68,15,40,13,150,148,1,0             ; movaps        0x19496(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
   DB  69,15,40,193                        ; movaps        %xmm9,%xmm8
   DB  69,15,89,192                        ; mulps         %xmm8,%xmm8
-  DB  68,15,89,13,26,156,1,0              ; mulps         0x19c1a(%rip),%xmm9        # 34490 <_sk_srcover_bgra_8888_sse2_lowp+0x1274>
-  DB  68,15,88,13,18,152,1,0              ; addps         0x19812(%rip),%xmm9        # 34090 <_sk_srcover_bgra_8888_sse2_lowp+0xe74>
+  DB  68,15,89,13,130,154,1,0             ; mulps         0x19a82(%rip),%xmm9        # 33e70 <_sk_srcover_bgra_8888_sse2_lowp+0x1280>
+  DB  68,15,88,13,122,150,1,0             ; addps         0x1967a(%rip),%xmm9        # 33a70 <_sk_srcover_bgra_8888_sse2_lowp+0xe80>
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  68,15,17,136,0,1,0,0                ; movups        %xmm9,0x100(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -24731,16 +24532,16 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,128,128,0,0,0              ; movups        0x80(%rax),%xmm8
-  DB  15,88,5,206,155,1,0                 ; addps         0x19bce(%rip),%xmm0        # 34470 <_sk_srcover_bgra_8888_sse2_lowp+0x1254>
-  DB  68,15,40,13,230,149,1,0             ; movaps        0x195e6(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,88,5,54,154,1,0                  ; addps         0x19a36(%rip),%xmm0        # 33e50 <_sk_srcover_bgra_8888_sse2_lowp+0x1260>
+  DB  68,15,40,13,78,148,1,0              ; movaps        0x1944e(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
-  DB  68,15,40,5,234,155,1,0              ; movaps        0x19bea(%rip),%xmm8        # 344a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1284>
+  DB  68,15,40,5,82,154,1,0               ; movaps        0x19a52(%rip),%xmm8        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0x1290>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,238,155,1,0              ; addps         0x19bee(%rip),%xmm8        # 344b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
+  DB  68,15,88,5,86,154,1,0               ; addps         0x19a56(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0x12a0>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,178,149,1,0              ; addps         0x195b2(%rip),%xmm8        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  68,15,88,5,26,148,1,0               ; addps         0x1941a(%rip),%xmm8        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,230,155,1,0              ; addps         0x19be6(%rip),%xmm8        # 344c0 <_sk_srcover_bgra_8888_sse2_lowp+0x12a4>
+  DB  68,15,88,5,78,154,1,0               ; addps         0x19a4e(%rip),%xmm8        # 33ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x12b0>
   DB  68,15,17,128,0,1,0,0                ; movups        %xmm8,0x100(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -24748,17 +24549,17 @@
 PUBLIC _sk_bicubic_p1x_sse41
 _sk_bicubic_p1x_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,15,40,5,144,149,1,0              ; movaps        0x19590(%rip),%xmm8        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  68,15,40,5,248,147,1,0              ; movaps        0x193f8(%rip),%xmm8        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,136,128,0,0,0              ; movups        0x80(%rax),%xmm9
   DB  65,15,88,192                        ; addps         %xmm8,%xmm0
-  DB  68,15,40,21,153,155,1,0             ; movaps        0x19b99(%rip),%xmm10        # 344a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1284>
+  DB  68,15,40,21,1,154,1,0               ; movaps        0x19a01(%rip),%xmm10        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0x1290>
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
-  DB  68,15,88,21,157,155,1,0             ; addps         0x19b9d(%rip),%xmm10        # 344b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
+  DB  68,15,88,21,5,154,1,0               ; addps         0x19a05(%rip),%xmm10        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0x12a0>
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
   DB  69,15,88,208                        ; addps         %xmm8,%xmm10
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
-  DB  68,15,88,21,153,155,1,0             ; addps         0x19b99(%rip),%xmm10        # 344c0 <_sk_srcover_bgra_8888_sse2_lowp+0x12a4>
+  DB  68,15,88,21,1,154,1,0               ; addps         0x19a01(%rip),%xmm10        # 33ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x12b0>
   DB  68,15,17,144,0,1,0,0                ; movups        %xmm10,0x100(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -24768,11 +24569,11 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,128,128,0,0,0              ; movups        0x80(%rax),%xmm8
-  DB  15,88,5,105,155,1,0                 ; addps         0x19b69(%rip),%xmm0        # 344b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
+  DB  15,88,5,209,153,1,0                 ; addps         0x199d1(%rip),%xmm0        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0x12a0>
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  69,15,89,201                        ; mulps         %xmm9,%xmm9
-  DB  68,15,89,5,57,155,1,0               ; mulps         0x19b39(%rip),%xmm8        # 34490 <_sk_srcover_bgra_8888_sse2_lowp+0x1274>
-  DB  68,15,88,5,49,151,1,0               ; addps         0x19731(%rip),%xmm8        # 34090 <_sk_srcover_bgra_8888_sse2_lowp+0xe74>
+  DB  68,15,89,5,161,153,1,0              ; mulps         0x199a1(%rip),%xmm8        # 33e70 <_sk_srcover_bgra_8888_sse2_lowp+0x1280>
+  DB  68,15,88,5,153,149,1,0              ; addps         0x19599(%rip),%xmm8        # 33a70 <_sk_srcover_bgra_8888_sse2_lowp+0xe80>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
   DB  68,15,17,128,0,1,0,0                ; movups        %xmm8,0x100(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -24783,13 +24584,13 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,72,64                         ; movups        0x40(%rax),%xmm1
   DB  68,15,16,128,192,0,0,0              ; movups        0xc0(%rax),%xmm8
-  DB  15,88,13,252,154,1,0                ; addps         0x19afc(%rip),%xmm1        # 34480 <_sk_srcover_bgra_8888_sse2_lowp+0x1264>
-  DB  68,15,40,13,4,149,1,0               ; movaps        0x19504(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,88,13,100,153,1,0                ; addps         0x19964(%rip),%xmm1        # 33e60 <_sk_srcover_bgra_8888_sse2_lowp+0x1270>
+  DB  68,15,40,13,108,147,1,0             ; movaps        0x1936c(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
   DB  69,15,40,193                        ; movaps        %xmm9,%xmm8
   DB  69,15,89,192                        ; mulps         %xmm8,%xmm8
-  DB  68,15,89,13,240,154,1,0             ; mulps         0x19af0(%rip),%xmm9        # 34490 <_sk_srcover_bgra_8888_sse2_lowp+0x1274>
-  DB  68,15,88,13,232,150,1,0             ; addps         0x196e8(%rip),%xmm9        # 34090 <_sk_srcover_bgra_8888_sse2_lowp+0xe74>
+  DB  68,15,89,13,88,153,1,0              ; mulps         0x19958(%rip),%xmm9        # 33e70 <_sk_srcover_bgra_8888_sse2_lowp+0x1280>
+  DB  68,15,88,13,80,149,1,0              ; addps         0x19550(%rip),%xmm9        # 33a70 <_sk_srcover_bgra_8888_sse2_lowp+0xe80>
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  68,15,17,136,64,1,0,0               ; movups        %xmm9,0x140(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -24800,16 +24601,16 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,72,64                         ; movups        0x40(%rax),%xmm1
   DB  68,15,16,128,192,0,0,0              ; movups        0xc0(%rax),%xmm8
-  DB  15,88,13,163,154,1,0                ; addps         0x19aa3(%rip),%xmm1        # 34470 <_sk_srcover_bgra_8888_sse2_lowp+0x1254>
-  DB  68,15,40,13,187,148,1,0             ; movaps        0x194bb(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,88,13,11,153,1,0                 ; addps         0x1990b(%rip),%xmm1        # 33e50 <_sk_srcover_bgra_8888_sse2_lowp+0x1260>
+  DB  68,15,40,13,35,147,1,0              ; movaps        0x19323(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
-  DB  68,15,40,5,191,154,1,0              ; movaps        0x19abf(%rip),%xmm8        # 344a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1284>
+  DB  68,15,40,5,39,153,1,0               ; movaps        0x19927(%rip),%xmm8        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0x1290>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,195,154,1,0              ; addps         0x19ac3(%rip),%xmm8        # 344b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
+  DB  68,15,88,5,43,153,1,0               ; addps         0x1992b(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0x12a0>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,135,148,1,0              ; addps         0x19487(%rip),%xmm8        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  68,15,88,5,239,146,1,0              ; addps         0x192ef(%rip),%xmm8        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,187,154,1,0              ; addps         0x19abb(%rip),%xmm8        # 344c0 <_sk_srcover_bgra_8888_sse2_lowp+0x12a4>
+  DB  68,15,88,5,35,153,1,0               ; addps         0x19923(%rip),%xmm8        # 33ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x12b0>
   DB  68,15,17,128,64,1,0,0               ; movups        %xmm8,0x140(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -24817,17 +24618,17 @@
 PUBLIC _sk_bicubic_p1y_sse41
 _sk_bicubic_p1y_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,15,40,5,101,148,1,0              ; movaps        0x19465(%rip),%xmm8        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  68,15,40,5,205,146,1,0              ; movaps        0x192cd(%rip),%xmm8        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  15,16,72,64                         ; movups        0x40(%rax),%xmm1
   DB  68,15,16,136,192,0,0,0              ; movups        0xc0(%rax),%xmm9
   DB  65,15,88,200                        ; addps         %xmm8,%xmm1
-  DB  68,15,40,21,109,154,1,0             ; movaps        0x19a6d(%rip),%xmm10        # 344a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1284>
+  DB  68,15,40,21,213,152,1,0             ; movaps        0x198d5(%rip),%xmm10        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0x1290>
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
-  DB  68,15,88,21,113,154,1,0             ; addps         0x19a71(%rip),%xmm10        # 344b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
+  DB  68,15,88,21,217,152,1,0             ; addps         0x198d9(%rip),%xmm10        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0x12a0>
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
   DB  69,15,88,208                        ; addps         %xmm8,%xmm10
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
-  DB  68,15,88,21,109,154,1,0             ; addps         0x19a6d(%rip),%xmm10        # 344c0 <_sk_srcover_bgra_8888_sse2_lowp+0x12a4>
+  DB  68,15,88,21,213,152,1,0             ; addps         0x198d5(%rip),%xmm10        # 33ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x12b0>
   DB  68,15,17,144,64,1,0,0               ; movups        %xmm10,0x140(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -24837,11 +24638,11 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,72,64                         ; movups        0x40(%rax),%xmm1
   DB  68,15,16,128,192,0,0,0              ; movups        0xc0(%rax),%xmm8
-  DB  15,88,13,60,154,1,0                 ; addps         0x19a3c(%rip),%xmm1        # 344b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
+  DB  15,88,13,164,152,1,0                ; addps         0x198a4(%rip),%xmm1        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0x12a0>
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  69,15,89,201                        ; mulps         %xmm9,%xmm9
-  DB  68,15,89,5,12,154,1,0               ; mulps         0x19a0c(%rip),%xmm8        # 34490 <_sk_srcover_bgra_8888_sse2_lowp+0x1274>
-  DB  68,15,88,5,4,150,1,0                ; addps         0x19604(%rip),%xmm8        # 34090 <_sk_srcover_bgra_8888_sse2_lowp+0xe74>
+  DB  68,15,89,5,116,152,1,0              ; mulps         0x19874(%rip),%xmm8        # 33e70 <_sk_srcover_bgra_8888_sse2_lowp+0x1280>
+  DB  68,15,88,5,108,148,1,0              ; addps         0x1946c(%rip),%xmm8        # 33a70 <_sk_srcover_bgra_8888_sse2_lowp+0xe80>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
   DB  68,15,17,128,64,1,0,0               ; movups        %xmm8,0x140(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -24936,7 +24737,7 @@
   DB  15,89,194                           ; mulps         %xmm2,%xmm0
   DB  15,41,68,36,80                      ; movaps        %xmm0,0x50(%rsp)
   DB  243,15,91,240                       ; cvttps2dq     %xmm0,%xmm6
-  DB  15,40,37,15,153,1,0                 ; movaps        0x1990f(%rip),%xmm4        # 344d0 <_sk_srcover_bgra_8888_sse2_lowp+0x12b4>
+  DB  15,40,37,119,151,1,0                ; movaps        0x19777(%rip),%xmm4        # 33eb0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c0>
   DB  15,88,196                           ; addps         %xmm4,%xmm0
   DB  15,41,68,36,48                      ; movaps        %xmm0,0x30(%rsp)
   DB  102,65,15,110,208                   ; movd          %r8d,%xmm2
@@ -24975,7 +24776,7 @@
   DB  102,68,15,56,64,192                 ; pmulld        %xmm0,%xmm8
   DB  102,65,15,111,216                   ; movdqa        %xmm8,%xmm3
   DB  102,15,254,218                      ; paddd         %xmm2,%xmm3
-  DB  102,68,15,111,37,102,152,1,0        ; movdqa        0x19866(%rip),%xmm12        # 344e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  DB  102,68,15,111,37,206,150,1,0        ; movdqa        0x196ce(%rip),%xmm12        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d0>
   DB  102,65,15,56,64,220                 ; pmulld        %xmm12,%xmm3
   DB  102,15,118,228                      ; pcmpeqd       %xmm4,%xmm4
   DB  102,15,111,203                      ; movdqa        %xmm3,%xmm1
@@ -24998,7 +24799,7 @@
   DB  102,65,15,58,22,217,1               ; pextrd        $0x1,%xmm3,%r9d
   DB  102,65,15,58,22,218,2               ; pextrd        $0x2,%xmm3,%r10d
   DB  102,65,15,58,22,219,3               ; pextrd        $0x3,%xmm3,%r11d
-  DB  102,15,111,37,202,145,1,0           ; movdqa        0x191ca(%rip),%xmm4        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,15,111,37,50,144,1,0            ; movdqa        0x19032(%rip),%xmm4        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,15,254,220                      ; paddd         %xmm4,%xmm3
   DB  102,15,111,252                      ; movdqa        %xmm4,%xmm7
   DB  102,73,15,58,22,222,1               ; pextrq        $0x1,%xmm3,%r14
@@ -25171,7 +24972,7 @@
   DB  102,68,15,254,202                   ; paddd         %xmm2,%xmm9
   DB  102,65,15,111,192                   ; movdqa        %xmm8,%xmm0
   DB  102,65,15,254,193                   ; paddd         %xmm9,%xmm0
-  DB  102,15,111,45,117,148,1,0           ; movdqa        0x19475(%rip),%xmm5        # 344e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  DB  102,15,111,45,221,146,1,0           ; movdqa        0x192dd(%rip),%xmm5        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d0>
   DB  102,15,56,64,197                    ; pmulld        %xmm5,%xmm0
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
   DB  102,15,118,246                      ; pcmpeqd       %xmm6,%xmm6
@@ -25192,7 +24993,7 @@
   DB  102,65,15,58,22,193,1               ; pextrd        $0x1,%xmm0,%r9d
   DB  102,65,15,58,22,194,2               ; pextrd        $0x2,%xmm0,%r10d
   DB  102,65,15,58,22,195,3               ; pextrd        $0x3,%xmm0,%r11d
-  DB  102,15,111,61,230,141,1,0           ; movdqa        0x18de6(%rip),%xmm7        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,15,111,61,78,140,1,0            ; movdqa        0x18c4e(%rip),%xmm7        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,15,254,199                      ; paddd         %xmm7,%xmm0
   DB  102,72,15,58,22,193,1               ; pextrq        $0x1,%xmm0,%rcx
   DB  102,72,15,126,195                   ; movq          %xmm0,%rbx
@@ -25258,7 +25059,7 @@
   DB  15,88,248                           ; addps         %xmm0,%xmm7
   DB  102,68,15,254,210                   ; paddd         %xmm2,%xmm10
   DB  102,69,15,254,194                   ; paddd         %xmm10,%xmm8
-  DB  102,15,111,13,177,146,1,0           ; movdqa        0x192b1(%rip),%xmm1        # 344e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  DB  102,15,111,13,25,145,1,0            ; movdqa        0x19119(%rip),%xmm1        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d0>
   DB  102,68,15,56,64,193                 ; pmulld        %xmm1,%xmm8
   DB  102,65,15,111,192                   ; movdqa        %xmm8,%xmm0
   DB  102,15,118,237                      ; pcmpeqd       %xmm5,%xmm5
@@ -25279,7 +25080,7 @@
   DB  102,69,15,58,22,193,1               ; pextrd        $0x1,%xmm8,%r9d
   DB  102,69,15,58,22,194,2               ; pextrd        $0x2,%xmm8,%r10d
   DB  102,69,15,58,22,195,3               ; pextrd        $0x3,%xmm8,%r11d
-  DB  102,15,111,21,28,140,1,0            ; movdqa        0x18c1c(%rip),%xmm2        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,15,111,21,132,138,1,0           ; movdqa        0x18a84(%rip),%xmm2        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,68,15,254,194                   ; paddd         %xmm2,%xmm8
   DB  102,76,15,58,22,193,1               ; pextrq        $0x1,%xmm8,%rcx
   DB  102,76,15,126,195                   ; movq          %xmm8,%rbx
@@ -25404,7 +25205,7 @@
   DB  15,89,203                           ; mulps         %xmm3,%xmm1
   DB  15,41,140,36,176,0,0,0              ; movaps        %xmm1,0xb0(%rsp)
   DB  243,15,91,249                       ; cvttps2dq     %xmm1,%xmm7
-  DB  15,40,29,243,143,1,0                ; movaps        0x18ff3(%rip),%xmm3        # 344d0 <_sk_srcover_bgra_8888_sse2_lowp+0x12b4>
+  DB  15,40,29,91,142,1,0                 ; movaps        0x18e5b(%rip),%xmm3        # 33eb0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c0>
   DB  15,88,203                           ; addps         %xmm3,%xmm1
   DB  15,41,76,36,32                      ; movaps        %xmm1,0x20(%rsp)
   DB  102,65,15,110,232                   ; movd          %r8d,%xmm5
@@ -25461,7 +25262,7 @@
   DB  102,68,15,56,64,253                 ; pmulld        %xmm5,%xmm15
   DB  102,65,15,111,223                   ; movdqa        %xmm15,%xmm3
   DB  102,15,254,217                      ; paddd         %xmm1,%xmm3
-  DB  102,68,15,111,29,237,142,1,0        ; movdqa        0x18eed(%rip),%xmm11        # 344e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  DB  102,68,15,111,29,85,141,1,0         ; movdqa        0x18d55(%rip),%xmm11        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d0>
   DB  102,65,15,56,64,219                 ; pmulld        %xmm11,%xmm3
   DB  102,15,118,192                      ; pcmpeqd       %xmm0,%xmm0
   DB  102,15,111,243                      ; movdqa        %xmm3,%xmm6
@@ -25483,7 +25284,7 @@
   DB  102,65,15,58,22,217,1               ; pextrd        $0x1,%xmm3,%r9d
   DB  102,65,15,58,22,218,2               ; pextrd        $0x2,%xmm3,%r10d
   DB  102,65,15,58,22,219,3               ; pextrd        $0x3,%xmm3,%r11d
-  DB  102,68,15,111,21,85,136,1,0         ; movdqa        0x18855(%rip),%xmm10        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,68,15,111,21,189,134,1,0        ; movdqa        0x186bd(%rip),%xmm10        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,65,15,254,218                   ; paddd         %xmm10,%xmm3
   DB  102,73,15,58,22,222,1               ; pextrq        $0x1,%xmm3,%r14
   DB  102,72,15,126,219                   ; movq          %xmm3,%rbx
@@ -25501,7 +25302,7 @@
   DB  102,65,15,254,201                   ; paddd         %xmm9,%xmm1
   DB  102,65,15,56,64,203                 ; pmulld        %xmm11,%xmm1
   DB  102,15,111,217                      ; movdqa        %xmm1,%xmm3
-  DB  102,15,250,29,35,142,1,0            ; psubd         0x18e23(%rip),%xmm3        # 344f0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
+  DB  102,15,250,29,139,140,1,0           ; psubd         0x18c8b(%rip),%xmm3        # 33ed0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e0>
   DB  102,73,15,58,22,222,1               ; pextrq        $0x1,%xmm3,%r14
   DB  102,72,15,126,219                   ; movq          %xmm3,%rbx
   DB  65,137,223                          ; mov           %ebx,%r15d
@@ -25556,7 +25357,7 @@
   DB  102,65,15,254,199                   ; paddd         %xmm15,%xmm0
   DB  102,65,15,56,64,195                 ; pmulld        %xmm11,%xmm0
   DB  102,15,111,232                      ; movdqa        %xmm0,%xmm5
-  DB  102,15,250,45,3,141,1,0             ; psubd         0x18d03(%rip),%xmm5        # 344f0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
+  DB  102,15,250,45,107,139,1,0           ; psubd         0x18b6b(%rip),%xmm5        # 33ed0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e0>
   DB  102,69,15,118,192                   ; pcmpeqd       %xmm8,%xmm8
   DB  102,72,15,58,22,233,1               ; pextrq        $0x1,%xmm5,%rcx
   DB  102,72,15,126,237                   ; movq          %xmm5,%rbp
@@ -25681,7 +25482,7 @@
   DB  72,193,233,32                       ; shr           $0x20,%rcx
   DB  243,15,16,36,136                    ; movss         (%rax,%rcx,4),%xmm4
   DB  102,68,15,58,33,220,48              ; insertps      $0x30,%xmm4,%xmm11
-  DB  102,15,111,61,70,132,1,0            ; movdqa        0x18446(%rip),%xmm7        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,15,111,61,174,130,1,0           ; movdqa        0x182ae(%rip),%xmm7        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,15,254,223                      ; paddd         %xmm7,%xmm3
   DB  102,72,15,58,22,217,1               ; pextrq        $0x1,%xmm3,%rcx
   DB  102,72,15,126,221                   ; movq          %xmm3,%rbp
@@ -25767,7 +25568,7 @@
   DB  102,65,15,58,22,201,1               ; pextrd        $0x1,%xmm1,%r9d
   DB  102,65,15,58,22,202,2               ; pextrd        $0x2,%xmm1,%r10d
   DB  102,65,15,58,22,203,3               ; pextrd        $0x3,%xmm1,%r11d
-  DB  102,68,15,111,21,134,130,1,0        ; movdqa        0x18286(%rip),%xmm10        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,68,15,111,21,238,128,1,0        ; movdqa        0x180ee(%rip),%xmm10        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,65,15,254,202                   ; paddd         %xmm10,%xmm1
   DB  102,72,15,58,22,201,1               ; pextrq        $0x1,%xmm1,%rcx
   DB  102,72,15,126,203                   ; movq          %xmm1,%rbx
@@ -25863,7 +25664,7 @@
   DB  102,15,111,124,36,64                ; movdqa        0x40(%rsp),%xmm7
   DB  102,15,111,199                      ; movdqa        %xmm7,%xmm0
   DB  102,15,254,195                      ; paddd         %xmm3,%xmm0
-  DB  102,15,111,21,186,134,1,0           ; movdqa        0x186ba(%rip),%xmm2        # 344e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  DB  102,15,111,21,34,133,1,0            ; movdqa        0x18522(%rip),%xmm2        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d0>
   DB  102,15,56,64,194                    ; pmulld        %xmm2,%xmm0
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
   DB  102,69,15,118,192                   ; pcmpeqd       %xmm8,%xmm8
@@ -25884,7 +25685,7 @@
   DB  102,65,15,58,22,193,1               ; pextrd        $0x1,%xmm0,%r9d
   DB  102,65,15,58,22,194,2               ; pextrd        $0x2,%xmm0,%r10d
   DB  102,65,15,58,22,195,3               ; pextrd        $0x3,%xmm0,%r11d
-  DB  102,15,111,37,41,128,1,0            ; movdqa        0x18029(%rip),%xmm4        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,15,111,37,145,126,1,0           ; movdqa        0x17e91(%rip),%xmm4        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,15,254,196                      ; paddd         %xmm4,%xmm0
   DB  102,72,15,58,22,193,1               ; pextrq        $0x1,%xmm0,%rcx
   DB  102,72,15,126,195                   ; movq          %xmm0,%rbx
@@ -25956,7 +25757,7 @@
   DB  102,68,15,111,226                   ; movdqa        %xmm2,%xmm12
   DB  102,65,15,56,64,204                 ; pmulld        %xmm12,%xmm1
   DB  102,15,111,209                      ; movdqa        %xmm1,%xmm2
-  DB  102,15,250,21,229,132,1,0           ; psubd         0x184e5(%rip),%xmm2        # 344f0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
+  DB  102,15,250,21,77,131,1,0            ; psubd         0x1834d(%rip),%xmm2        # 33ed0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e0>
   DB  102,72,15,58,22,209,1               ; pextrq        $0x1,%xmm2,%rcx
   DB  102,72,15,126,213                   ; movq          %xmm2,%rbp
   DB  137,235                             ; mov           %ebp,%ebx
@@ -25990,7 +25791,7 @@
   DB  102,65,15,111,249                   ; movdqa        %xmm9,%xmm7
   DB  102,69,15,56,64,236                 ; pmulld        %xmm12,%xmm13
   DB  102,65,15,111,205                   ; movdqa        %xmm13,%xmm1
-  DB  102,15,250,13,49,132,1,0            ; psubd         0x18431(%rip),%xmm1        # 344f0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
+  DB  102,15,250,13,153,130,1,0           ; psubd         0x18299(%rip),%xmm1        # 33ed0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e0>
   DB  102,72,15,58,22,201,1               ; pextrq        $0x1,%xmm1,%rcx
   DB  102,72,15,126,203                   ; movq          %xmm1,%rbx
   DB  137,221                             ; mov           %ebx,%ebp
@@ -26055,7 +25856,7 @@
   DB  102,65,15,111,206                   ; movdqa        %xmm14,%xmm1
   DB  102,15,111,108,36,64                ; movdqa        0x40(%rsp),%xmm5
   DB  102,15,254,205                      ; paddd         %xmm5,%xmm1
-  DB  102,15,111,37,197,130,1,0           ; movdqa        0x182c5(%rip),%xmm4        # 344e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  DB  102,15,111,37,45,129,1,0            ; movdqa        0x1812d(%rip),%xmm4        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d0>
   DB  102,15,56,64,204                    ; pmulld        %xmm4,%xmm1
   DB  102,15,111,193                      ; movdqa        %xmm1,%xmm0
   DB  102,15,118,246                      ; pcmpeqd       %xmm6,%xmm6
@@ -26076,7 +25877,7 @@
   DB  102,65,15,58,22,201,1               ; pextrd        $0x1,%xmm1,%r9d
   DB  102,65,15,58,22,202,2               ; pextrd        $0x2,%xmm1,%r10d
   DB  102,65,15,58,22,203,3               ; pextrd        $0x3,%xmm1,%r11d
-  DB  102,15,111,29,54,124,1,0            ; movdqa        0x17c36(%rip),%xmm3        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,15,111,29,158,122,1,0           ; movdqa        0x17a9e(%rip),%xmm3        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,15,254,203                      ; paddd         %xmm3,%xmm1
   DB  102,72,15,58,22,201,1               ; pextrq        $0x1,%xmm1,%rcx
   DB  102,72,15,126,203                   ; movq          %xmm1,%rbx
@@ -26148,7 +25949,7 @@
   DB  102,15,56,64,239                    ; pmulld        %xmm7,%xmm5
   DB  102,15,111,205                      ; movdqa        %xmm5,%xmm1
   DB  102,15,111,193                      ; movdqa        %xmm1,%xmm0
-  DB  102,15,250,5,246,128,1,0            ; psubd         0x180f6(%rip),%xmm0        # 344f0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
+  DB  102,15,250,5,94,127,1,0             ; psubd         0x17f5e(%rip),%xmm0        # 33ed0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e0>
   DB  102,72,15,58,22,193,1               ; pextrq        $0x1,%xmm0,%rcx
   DB  102,72,15,126,197                   ; movq          %xmm0,%rbp
   DB  137,235                             ; mov           %ebp,%ebx
@@ -26166,7 +25967,7 @@
   DB  102,65,15,58,22,193,1               ; pextrd        $0x1,%xmm0,%r9d
   DB  102,65,15,58,22,194,2               ; pextrd        $0x2,%xmm0,%r10d
   DB  102,65,15,58,22,195,3               ; pextrd        $0x3,%xmm0,%r11d
-  DB  102,15,254,5,100,122,1,0            ; paddd         0x17a64(%rip),%xmm0        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,15,254,5,204,120,1,0            ; paddd         0x178cc(%rip),%xmm0        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,72,15,58,22,193,1               ; pextrq        $0x1,%xmm0,%rcx
   DB  102,72,15,126,195                   ; movq          %xmm0,%rbx
   DB  137,221                             ; mov           %ebx,%ebp
@@ -26182,7 +25983,7 @@
   DB  102,15,254,84,36,48                 ; paddd         0x30(%rsp),%xmm2
   DB  102,15,56,64,215                    ; pmulld        %xmm7,%xmm2
   DB  102,15,111,194                      ; movdqa        %xmm2,%xmm0
-  DB  102,15,250,5,61,128,1,0             ; psubd         0x1803d(%rip),%xmm0        # 344f0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
+  DB  102,15,250,5,165,126,1,0            ; psubd         0x17ea5(%rip),%xmm0        # 33ed0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e0>
   DB  102,72,15,58,22,193,1               ; pextrq        $0x1,%xmm0,%rcx
   DB  102,72,15,126,195                   ; movq          %xmm0,%rbx
   DB  137,221                             ; mov           %ebx,%ebp
@@ -26200,7 +26001,7 @@
   DB  102,65,15,58,22,199,1               ; pextrd        $0x1,%xmm0,%r15d
   DB  102,65,15,58,22,196,2               ; pextrd        $0x2,%xmm0,%r12d
   DB  102,65,15,58,22,198,3               ; pextrd        $0x3,%xmm0,%r14d
-  DB  102,15,254,5,171,121,1,0            ; paddd         0x179ab(%rip),%xmm0        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,15,254,5,19,120,1,0             ; paddd         0x17813(%rip),%xmm0        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,72,15,58,22,195,1               ; pextrq        $0x1,%xmm0,%rbx
   DB  102,72,15,126,197                   ; movq          %xmm0,%rbp
   DB  137,233                             ; mov           %ebp,%ecx
@@ -26263,7 +26064,7 @@
   DB  15,89,212                           ; mulps         %xmm4,%xmm2
   DB  65,15,88,211                        ; addps         %xmm11,%xmm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,99,120,1,0                 ; movaps        0x17863(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,29,203,118,1,0                ; movaps        0x176cb(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  72,139,76,36,120                    ; mov           0x78(%rsp),%rcx
   DB  15,40,164,36,192,0,0,0              ; movaps        0xc0(%rsp),%xmm4
   DB  15,40,172,36,208,0,0,0              ; movaps        0xd0(%rsp),%xmm5
@@ -26280,15 +26081,15 @@
 
 PUBLIC _sk_gauss_a_to_rgba_sse41
 _sk_gauss_a_to_rgba_sse41 LABEL PROC
-  DB  15,40,5,148,126,1,0                 ; movaps        0x17e94(%rip),%xmm0        # 34500 <_sk_srcover_bgra_8888_sse2_lowp+0x12e4>
+  DB  15,40,5,252,124,1,0                 ; movaps        0x17cfc(%rip),%xmm0        # 33ee0 <_sk_srcover_bgra_8888_sse2_lowp+0x12f0>
   DB  15,89,195                           ; mulps         %xmm3,%xmm0
-  DB  15,88,5,154,126,1,0                 ; addps         0x17e9a(%rip),%xmm0        # 34510 <_sk_srcover_bgra_8888_sse2_lowp+0x12f4>
+  DB  15,88,5,2,125,1,0                   ; addps         0x17d02(%rip),%xmm0        # 33ef0 <_sk_srcover_bgra_8888_sse2_lowp+0x1300>
   DB  15,89,195                           ; mulps         %xmm3,%xmm0
-  DB  15,88,5,160,126,1,0                 ; addps         0x17ea0(%rip),%xmm0        # 34520 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
+  DB  15,88,5,8,125,1,0                   ; addps         0x17d08(%rip),%xmm0        # 33f00 <_sk_srcover_bgra_8888_sse2_lowp+0x1310>
   DB  15,89,195                           ; mulps         %xmm3,%xmm0
-  DB  15,88,5,166,126,1,0                 ; addps         0x17ea6(%rip),%xmm0        # 34530 <_sk_srcover_bgra_8888_sse2_lowp+0x1314>
+  DB  15,88,5,14,125,1,0                  ; addps         0x17d0e(%rip),%xmm0        # 33f10 <_sk_srcover_bgra_8888_sse2_lowp+0x1320>
   DB  15,89,195                           ; mulps         %xmm3,%xmm0
-  DB  15,88,5,172,126,1,0                 ; addps         0x17eac(%rip),%xmm0        # 34540 <_sk_srcover_bgra_8888_sse2_lowp+0x1324>
+  DB  15,88,5,20,125,1,0                  ; addps         0x17d14(%rip),%xmm0        # 33f20 <_sk_srcover_bgra_8888_sse2_lowp+0x1330>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
@@ -26303,7 +26104,7 @@
   DB  15,41,108,36,16                     ; movaps        %xmm5,0x10(%rsp)
   DB  15,41,36,36                         ; movaps        %xmm4,(%rsp)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,188,119,1,0                ; movaps        0x177bc(%rip),%xmm3        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  15,40,29,36,118,1,0                 ; movaps        0x17624(%rip),%xmm3        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  68,15,40,208                        ; movaps        %xmm0,%xmm10
   DB  68,15,88,211                        ; addps         %xmm3,%xmm10
   DB  102,65,15,58,8,210,1                ; roundps       $0x1,%xmm10,%xmm2
@@ -26312,7 +26113,7 @@
   DB  15,88,217                           ; addps         %xmm1,%xmm3
   DB  102,15,58,8,203,1                   ; roundps       $0x1,%xmm3,%xmm1
   DB  15,92,217                           ; subps         %xmm1,%xmm3
-  DB  15,40,13,158,119,1,0                ; movaps        0x1779e(%rip),%xmm1        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,13,6,118,1,0                  ; movaps        0x17606(%rip),%xmm1        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,40,209                           ; movaps        %xmm1,%xmm2
   DB  65,15,92,210                        ; subps         %xmm10,%xmm2
   DB  15,41,148,36,160,0,0,0              ; movaps        %xmm2,0xa0(%rsp)
@@ -26331,9 +26132,9 @@
   DB  102,15,110,72,8                     ; movd          0x8(%rax),%xmm1
   DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
   DB  102,15,127,76,36,80                 ; movdqa        %xmm1,0x50(%rsp)
-  DB  243,15,16,13,192,110,1,0            ; movss         0x16ec0(%rip),%xmm1        # 33610 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  DB  243,15,16,13,28,109,1,0             ; movss         0x16d1c(%rip),%xmm1        # 32fe4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
-  DB  15,40,37,70,121,1,0                 ; movaps        0x17946(%rip),%xmm4        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  15,40,37,174,119,1,0                ; movaps        0x177ae(%rip),%xmm4        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  102,15,239,210                      ; pxor          %xmm2,%xmm2
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
@@ -26344,14 +26145,14 @@
   DB  15,87,201                           ; xorps         %xmm1,%xmm1
   DB  15,95,205                           ; maxps         %xmm5,%xmm1
   DB  15,41,180,36,144,0,0,0              ; movaps        %xmm6,0x90(%rsp)
-  DB  15,46,53,183,110,1,0                ; ucomiss       0x16eb7(%rip),%xmm6        # 33644 <_sk_srcover_bgra_8888_sse2_lowp+0x428>
+  DB  15,46,53,19,109,1,0                 ; ucomiss       0x16d13(%rip),%xmm6        # 33018 <_sk_srcover_bgra_8888_sse2_lowp+0x428>
   DB  68,15,40,124,36,112                 ; movaps        0x70(%rsp),%xmm15
-  DB  119,6                               ; ja            1c79b <_sk_bilerp_clamp_8888_sse41+0xfa>
+  DB  119,6                               ; ja            1c313 <_sk_bilerp_clamp_8888_sse41+0xfa>
   DB  68,15,40,124,36,64                  ; movaps        0x40(%rsp),%xmm15
   DB  15,93,76,36,96                      ; minps         0x60(%rsp),%xmm1
   DB  243,68,15,91,233                    ; cvttps2dq     %xmm1,%xmm13
   DB  102,68,15,56,64,108,36,80           ; pmulld        0x50(%rsp),%xmm13
-  DB  243,15,16,45,91,110,1,0             ; movss         0x16e5b(%rip),%xmm5        # 33610 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  DB  243,15,16,45,183,108,1,0            ; movss         0x16cb7(%rip),%xmm5        # 32fe4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   DB  15,40,205                           ; movaps        %xmm5,%xmm1
   DB  15,198,201,0                        ; shufps        $0x0,%xmm1,%xmm1
   DB  15,88,200                           ; addps         %xmm0,%xmm1
@@ -26371,23 +26172,23 @@
   DB  102,67,15,58,34,12,136,2            ; pinsrd        $0x2,(%r8,%r9,4),%xmm1
   DB  102,65,15,58,34,12,128,3            ; pinsrd        $0x3,(%r8,%rax,4),%xmm1
   DB  102,15,111,241                      ; movdqa        %xmm1,%xmm6
-  DB  102,15,219,53,42,119,1,0            ; pand          0x1772a(%rip),%xmm6        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  102,15,219,53,146,117,1,0           ; pand          0x17592(%rip),%xmm6        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  15,91,254                           ; cvtdq2ps      %xmm6,%xmm7
   DB  15,89,252                           ; mulps         %xmm4,%xmm7
   DB  102,15,111,241                      ; movdqa        %xmm1,%xmm6
-  DB  102,15,56,0,53,39,119,1,0           ; pshufb        0x17727(%rip),%xmm6        # 33f50 <_sk_srcover_bgra_8888_sse2_lowp+0xd34>
+  DB  102,15,56,0,53,143,117,1,0          ; pshufb        0x1758f(%rip),%xmm6        # 33930 <_sk_srcover_bgra_8888_sse2_lowp+0xd40>
   DB  68,15,91,230                        ; cvtdq2ps      %xmm6,%xmm12
   DB  68,15,89,228                        ; mulps         %xmm4,%xmm12
   DB  102,15,111,241                      ; movdqa        %xmm1,%xmm6
-  DB  102,15,56,0,53,34,119,1,0           ; pshufb        0x17722(%rip),%xmm6        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0xd44>
+  DB  102,15,56,0,53,138,117,1,0          ; pshufb        0x1758a(%rip),%xmm6        # 33940 <_sk_srcover_bgra_8888_sse2_lowp+0xd50>
   DB  15,91,246                           ; cvtdq2ps      %xmm6,%xmm6
   DB  15,89,244                           ; mulps         %xmm4,%xmm6
   DB  102,15,114,209,24                   ; psrld         $0x18,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
   DB  15,89,204                           ; mulps         %xmm4,%xmm1
-  DB  15,46,45,238,109,1,0                ; ucomiss       0x16dee(%rip),%xmm5        # 33644 <_sk_srcover_bgra_8888_sse2_lowp+0x428>
+  DB  15,46,45,74,108,1,0                 ; ucomiss       0x16c4a(%rip),%xmm5        # 33018 <_sk_srcover_bgra_8888_sse2_lowp+0x428>
   DB  69,15,40,218                        ; movaps        %xmm10,%xmm11
-  DB  119,9                               ; ja            1c865 <_sk_bilerp_clamp_8888_sse41+0x1c4>
+  DB  119,9                               ; ja            1c3dd <_sk_bilerp_clamp_8888_sse41+0x1c4>
   DB  68,15,40,156,36,160,0,0,0           ; movaps        0xa0(%rsp),%xmm11
   DB  69,15,89,223                        ; mulps         %xmm15,%xmm11
   DB  65,15,89,251                        ; mulps         %xmm11,%xmm7
@@ -26398,15 +26199,15 @@
   DB  15,88,214                           ; addps         %xmm6,%xmm2
   DB  68,15,89,217                        ; mulps         %xmm1,%xmm11
   DB  65,15,88,219                        ; addps         %xmm11,%xmm3
-  DB  243,15,88,45,60,108,1,0             ; addss         0x16c3c(%rip),%xmm5        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
-  DB  243,15,16,13,48,108,1,0             ; movss         0x16c30(%rip),%xmm1        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  243,15,88,45,152,106,1,0            ; addss         0x16a98(%rip),%xmm5        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  243,15,16,13,140,106,1,0            ; movss         0x16a8c(%rip),%xmm1        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  15,46,205                           ; ucomiss       %xmm5,%xmm1
-  DB  15,131,20,255,255,255               ; jae           1c7b5 <_sk_bilerp_clamp_8888_sse41+0x114>
+  DB  15,131,20,255,255,255               ; jae           1c32d <_sk_bilerp_clamp_8888_sse41+0x114>
   DB  15,40,180,36,144,0,0,0              ; movaps        0x90(%rsp),%xmm6
-  DB  243,15,88,53,27,108,1,0             ; addss         0x16c1b(%rip),%xmm6        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
-  DB  243,15,16,13,15,108,1,0             ; movss         0x16c0f(%rip),%xmm1        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  243,15,88,53,119,106,1,0            ; addss         0x16a77(%rip),%xmm6        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  243,15,16,13,107,106,1,0            ; movss         0x16a6b(%rip),%xmm1        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  15,46,206                           ; ucomiss       %xmm6,%xmm1
-  DB  15,131,167,254,255,255              ; jae           1c769 <_sk_bilerp_clamp_8888_sse41+0xc8>
+  DB  15,131,167,254,255,255              ; jae           1c2e1 <_sk_bilerp_clamp_8888_sse41+0xc8>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
   DB  65,15,40,200                        ; movaps        %xmm8,%xmm1
@@ -26448,13 +26249,13 @@
   DB  73,137,246                          ; mov           %rsi,%r14
   DB  76,137,141,8,255,255,255            ; mov           %r9,-0xf8(%rbp)
   DB  76,57,203                           ; cmp           %r9,%rbx
-  DB  15,131,153,0,0,0                    ; jae           1ca02 <_sk_start_pipeline_sse2+0x11a>
+  DB  15,131,153,0,0,0                    ; jae           1c57a <_sk_start_pipeline_sse2+0x11a>
   DB  72,139,133,24,255,255,255           ; mov           -0xe8(%rbp),%rax
   DB  72,141,64,4                         ; lea           0x4(%rax),%rax
   DB  72,137,133,16,255,255,255           ; mov           %rax,-0xf0(%rbp)
   DB  76,57,189,16,255,255,255            ; cmp           %r15,-0xf0(%rbp)
   DB  72,139,149,24,255,255,255           ; mov           -0xe8(%rbp),%rdx
-  DB  119,62                              ; ja            1c9c9 <_sk_start_pipeline_sse2+0xe1>
+  DB  119,62                              ; ja            1c541 <_sk_start_pipeline_sse2+0xe1>
   DB  76,139,165,24,255,255,255           ; mov           -0xe8(%rbp),%r12
   DB  49,255                              ; xor           %edi,%edi
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
@@ -26473,10 +26274,10 @@
   DB  73,131,196,8                        ; add           $0x8,%r12
   DB  77,57,252                           ; cmp           %r15,%r12
   DB  73,137,212                          ; mov           %rdx,%r12
-  DB  118,201                             ; jbe           1c992 <_sk_start_pipeline_sse2+0xaa>
+  DB  118,201                             ; jbe           1c50a <_sk_start_pipeline_sse2+0xaa>
   DB  76,137,255                          ; mov           %r15,%rdi
   DB  72,41,215                           ; sub           %rdx,%rdi
-  DB  116,33                              ; je            1c9f2 <_sk_start_pipeline_sse2+0x10a>
+  DB  116,33                              ; je            1c56a <_sk_start_pipeline_sse2+0x10a>
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  15,87,201                           ; xorps         %xmm1,%xmm1
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
@@ -26490,7 +26291,7 @@
   DB  65,255,213                          ; callq         *%r13
   DB  72,255,195                          ; inc           %rbx
   DB  72,59,157,8,255,255,255             ; cmp           -0xf8(%rbp),%rbx
-  DB  15,133,121,255,255,255              ; jne           1c97b <_sk_start_pipeline_sse2+0x93>
+  DB  15,133,121,255,255,255              ; jne           1c4f3 <_sk_start_pipeline_sse2+0x93>
   DB  15,40,181,32,255,255,255            ; movaps        -0xe0(%rbp),%xmm6
   DB  15,40,189,48,255,255,255            ; movaps        -0xd0(%rbp),%xmm7
   DB  68,15,40,133,64,255,255,255         ; movaps        -0xc0(%rbp),%xmm8
@@ -26527,9 +26328,9 @@
   DB  102,15,110,201                      ; movd          %ecx,%xmm1
   DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
-  DB  15,88,13,0,116,1,0                  ; addps         0x17400(%rip),%xmm1        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  15,88,13,104,114,1,0                ; addps         0x17268(%rip),%xmm1        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,21,7,116,1,0                  ; movaps        0x17407(%rip),%xmm2        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,21,111,114,1,0                ; movaps        0x1726f(%rip),%xmm2        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
   DB  15,87,228                           ; xorps         %xmm4,%xmm4
   DB  15,87,237                           ; xorps         %xmm5,%xmm5
@@ -26542,18 +26343,18 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  102,68,15,110,194                   ; movd          %edx,%xmm8
   DB  102,69,15,112,192,0                 ; pshufd        $0x0,%xmm8,%xmm8
-  DB  102,68,15,254,5,176,115,1,0         ; paddd         0x173b0(%rip),%xmm8        # 33e60 <_sk_srcover_bgra_8888_sse2_lowp+0xc44>
+  DB  102,68,15,254,5,24,114,1,0          ; paddd         0x17218(%rip),%xmm8        # 33840 <_sk_srcover_bgra_8888_sse2_lowp+0xc50>
   DB  102,68,15,110,201                   ; movd          %ecx,%xmm9
   DB  102,69,15,112,201,0                 ; pshufd        $0x0,%xmm9,%xmm9
   DB  102,69,15,239,200                   ; pxor          %xmm8,%xmm9
-  DB  102,68,15,111,21,215,115,1,0        ; movdqa        0x173d7(%rip),%xmm10        # 33ea0 <_sk_srcover_bgra_8888_sse2_lowp+0xc84>
+  DB  102,68,15,111,21,63,114,1,0         ; movdqa        0x1723f(%rip),%xmm10        # 33880 <_sk_srcover_bgra_8888_sse2_lowp+0xc90>
   DB  102,69,15,111,217                   ; movdqa        %xmm9,%xmm11
   DB  102,69,15,219,218                   ; pand          %xmm10,%xmm11
   DB  102,65,15,114,243,5                 ; pslld         $0x5,%xmm11
   DB  102,69,15,219,208                   ; pand          %xmm8,%xmm10
   DB  102,65,15,114,242,4                 ; pslld         $0x4,%xmm10
-  DB  102,68,15,111,37,195,115,1,0        ; movdqa        0x173c3(%rip),%xmm12        # 33eb0 <_sk_srcover_bgra_8888_sse2_lowp+0xc94>
-  DB  102,68,15,111,45,202,115,1,0        ; movdqa        0x173ca(%rip),%xmm13        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,68,15,111,37,43,114,1,0         ; movdqa        0x1722b(%rip),%xmm12        # 33890 <_sk_srcover_bgra_8888_sse2_lowp+0xca0>
+  DB  102,68,15,111,45,50,114,1,0         ; movdqa        0x17232(%rip),%xmm13        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,69,15,111,241                   ; movdqa        %xmm9,%xmm14
   DB  102,69,15,219,245                   ; pand          %xmm13,%xmm14
   DB  102,65,15,114,246,2                 ; pslld         $0x2,%xmm14
@@ -26569,8 +26370,8 @@
   DB  102,69,15,235,198                   ; por           %xmm14,%xmm8
   DB  102,69,15,235,193                   ; por           %xmm9,%xmm8
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
-  DB  68,15,89,5,133,115,1,0              ; mulps         0x17385(%rip),%xmm8        # 33ed0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb4>
-  DB  68,15,88,5,141,115,1,0              ; addps         0x1738d(%rip),%xmm8        # 33ee0 <_sk_srcover_bgra_8888_sse2_lowp+0xcc4>
+  DB  68,15,89,5,237,113,1,0              ; mulps         0x171ed(%rip),%xmm8        # 338b0 <_sk_srcover_bgra_8888_sse2_lowp+0xcc0>
+  DB  68,15,88,5,245,113,1,0              ; addps         0x171f5(%rip),%xmm8        # 338c0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd0>
   DB  243,68,15,16,16                     ; movss         (%rax),%xmm10
   DB  69,15,198,210,0                     ; shufps        $0x0,%xmm10,%xmm10
   DB  69,15,89,208                        ; mulps         %xmm8,%xmm10
@@ -26608,7 +26409,7 @@
 PUBLIC _sk_black_color_sse2
 _sk_black_color_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,195,114,1,0                ; movaps        0x172c3(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,29,43,113,1,0                 ; movaps        0x1712b(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  15,87,201                           ; xorps         %xmm1,%xmm1
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
@@ -26617,7 +26418,7 @@
 PUBLIC _sk_white_color_sse2
 _sk_white_color_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,5,175,114,1,0                 ; movaps        0x172af(%rip),%xmm0        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,5,23,113,1,0                  ; movaps        0x17117(%rip),%xmm0        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  15,40,216                           ; movaps        %xmm0,%xmm3
@@ -26655,7 +26456,7 @@
 PUBLIC _sk_srcatop_sse2
 _sk_srcatop_sse2 LABEL PROC
   DB  15,89,199                           ; mulps         %xmm7,%xmm0
-  DB  68,15,40,5,95,114,1,0               ; movaps        0x1725f(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,199,112,1,0              ; movaps        0x170c7(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,92,195                        ; subps         %xmm3,%xmm8
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  68,15,89,204                        ; mulps         %xmm4,%xmm9
@@ -26678,7 +26479,7 @@
 _sk_dstatop_sse2 LABEL PROC
   DB  68,15,40,195                        ; movaps        %xmm3,%xmm8
   DB  68,15,89,196                        ; mulps         %xmm4,%xmm8
-  DB  68,15,40,13,18,114,1,0              ; movaps        0x17212(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,13,122,112,1,0             ; movaps        0x1707a(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,92,207                        ; subps         %xmm7,%xmm9
   DB  65,15,89,193                        ; mulps         %xmm9,%xmm0
   DB  65,15,88,192                        ; addps         %xmm8,%xmm0
@@ -26719,7 +26520,7 @@
 
 PUBLIC _sk_srcout_sse2
 _sk_srcout_sse2 LABEL PROC
-  DB  68,15,40,5,166,113,1,0              ; movaps        0x171a6(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,14,112,1,0               ; movaps        0x1700e(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,92,199                        ; subps         %xmm7,%xmm8
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  65,15,89,200                        ; mulps         %xmm8,%xmm1
@@ -26730,7 +26531,7 @@
 
 PUBLIC _sk_dstout_sse2
 _sk_dstout_sse2 LABEL PROC
-  DB  68,15,40,5,134,113,1,0              ; movaps        0x17186(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,238,111,1,0              ; movaps        0x16fee(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,92,195                        ; subps         %xmm3,%xmm8
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  15,89,196                           ; mulps         %xmm4,%xmm0
@@ -26745,7 +26546,7 @@
 
 PUBLIC _sk_srcover_sse2
 _sk_srcover_sse2 LABEL PROC
-  DB  68,15,40,5,89,113,1,0               ; movaps        0x17159(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,193,111,1,0              ; movaps        0x16fc1(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,92,195                        ; subps         %xmm3,%xmm8
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  68,15,89,204                        ; mulps         %xmm4,%xmm9
@@ -26763,7 +26564,7 @@
 
 PUBLIC _sk_dstover_sse2
 _sk_dstover_sse2 LABEL PROC
-  DB  68,15,40,5,29,113,1,0               ; movaps        0x1711d(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,133,111,1,0              ; movaps        0x16f85(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,92,199                        ; subps         %xmm7,%xmm8
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  15,88,196                           ; addps         %xmm4,%xmm0
@@ -26787,7 +26588,7 @@
 
 PUBLIC _sk_multiply_sse2
 _sk_multiply_sse2 LABEL PROC
-  DB  68,15,40,5,225,112,1,0              ; movaps        0x170e1(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,73,111,1,0               ; movaps        0x16f49(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  68,15,92,207                        ; subps         %xmm7,%xmm9
   DB  69,15,40,209                        ; movaps        %xmm9,%xmm10
@@ -26823,7 +26624,7 @@
 PUBLIC _sk_plus__sse2
 _sk_plus__sse2 LABEL PROC
   DB  15,88,196                           ; addps         %xmm4,%xmm0
-  DB  68,15,40,5,98,112,1,0               ; movaps        0x17062(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,202,110,1,0              ; movaps        0x16eca(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  65,15,93,192                        ; minps         %xmm8,%xmm0
   DB  15,88,205                           ; addps         %xmm5,%xmm1
   DB  65,15,93,200                        ; minps         %xmm8,%xmm1
@@ -26861,7 +26662,7 @@
 PUBLIC _sk_xor__sse2
 _sk_xor__sse2 LABEL PROC
   DB  68,15,40,195                        ; movaps        %xmm3,%xmm8
-  DB  15,40,29,238,111,1,0                ; movaps        0x16fee(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,29,86,110,1,0                 ; movaps        0x16e56(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,40,203                        ; movaps        %xmm3,%xmm9
   DB  68,15,92,207                        ; subps         %xmm7,%xmm9
   DB  65,15,89,193                        ; mulps         %xmm9,%xmm0
@@ -26907,7 +26708,7 @@
   DB  68,15,89,206                        ; mulps         %xmm6,%xmm9
   DB  65,15,95,209                        ; maxps         %xmm9,%xmm2
   DB  68,15,92,194                        ; subps         %xmm2,%xmm8
-  DB  15,40,21,73,111,1,0                 ; movaps        0x16f49(%rip),%xmm2        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,21,177,109,1,0                ; movaps        0x16db1(%rip),%xmm2        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,92,211                           ; subps         %xmm3,%xmm2
   DB  15,89,215                           ; mulps         %xmm7,%xmm2
   DB  15,88,218                           ; addps         %xmm2,%xmm3
@@ -26939,7 +26740,7 @@
   DB  68,15,89,206                        ; mulps         %xmm6,%xmm9
   DB  65,15,93,209                        ; minps         %xmm9,%xmm2
   DB  68,15,92,194                        ; subps         %xmm2,%xmm8
-  DB  15,40,21,222,110,1,0                ; movaps        0x16ede(%rip),%xmm2        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,21,70,109,1,0                 ; movaps        0x16d46(%rip),%xmm2        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,92,211                           ; subps         %xmm3,%xmm2
   DB  15,89,215                           ; mulps         %xmm7,%xmm2
   DB  15,88,218                           ; addps         %xmm2,%xmm3
@@ -26974,7 +26775,7 @@
   DB  65,15,93,209                        ; minps         %xmm9,%xmm2
   DB  15,88,210                           ; addps         %xmm2,%xmm2
   DB  68,15,92,194                        ; subps         %xmm2,%xmm8
-  DB  15,40,21,104,110,1,0                ; movaps        0x16e68(%rip),%xmm2        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,21,208,108,1,0                ; movaps        0x16cd0(%rip),%xmm2        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,92,211                           ; subps         %xmm3,%xmm2
   DB  15,89,215                           ; mulps         %xmm7,%xmm2
   DB  15,88,218                           ; addps         %xmm2,%xmm3
@@ -27000,7 +26801,7 @@
   DB  15,89,214                           ; mulps         %xmm6,%xmm2
   DB  15,88,210                           ; addps         %xmm2,%xmm2
   DB  68,15,92,194                        ; subps         %xmm2,%xmm8
-  DB  15,40,21,24,110,1,0                 ; movaps        0x16e18(%rip),%xmm2        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,21,128,108,1,0                ; movaps        0x16c80(%rip),%xmm2        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,92,211                           ; subps         %xmm3,%xmm2
   DB  15,89,215                           ; mulps         %xmm7,%xmm2
   DB  15,88,218                           ; addps         %xmm2,%xmm3
@@ -27011,7 +26812,7 @@
 PUBLIC _sk_colorburn_sse2
 _sk_colorburn_sse2 LABEL PROC
   DB  68,15,40,192                        ; movaps        %xmm0,%xmm8
-  DB  68,15,40,13,251,109,1,0             ; movaps        0x16dfb(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,13,99,108,1,0              ; movaps        0x16c63(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,40,209                        ; movaps        %xmm9,%xmm10
   DB  68,15,92,215                        ; subps         %xmm7,%xmm10
   DB  69,15,40,218                        ; movaps        %xmm10,%xmm11
@@ -27104,7 +26905,7 @@
 PUBLIC _sk_colordodge_sse2
 _sk_colordodge_sse2 LABEL PROC
   DB  68,15,40,200                        ; movaps        %xmm0,%xmm9
-  DB  68,15,40,21,163,108,1,0             ; movaps        0x16ca3(%rip),%xmm10        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,21,11,107,1,0              ; movaps        0x16b0b(%rip),%xmm10        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,40,218                        ; movaps        %xmm10,%xmm11
   DB  68,15,92,223                        ; subps         %xmm7,%xmm11
   DB  65,15,40,195                        ; movaps        %xmm11,%xmm0
@@ -27195,7 +26996,7 @@
   DB  15,41,52,36                         ; movaps        %xmm6,(%rsp)
   DB  15,40,245                           ; movaps        %xmm5,%xmm6
   DB  15,40,236                           ; movaps        %xmm4,%xmm5
-  DB  68,15,40,29,73,107,1,0              ; movaps        0x16b49(%rip),%xmm11        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,29,177,105,1,0             ; movaps        0x169b1(%rip),%xmm11        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,40,211                        ; movaps        %xmm11,%xmm10
   DB  68,15,92,215                        ; subps         %xmm7,%xmm10
   DB  69,15,40,194                        ; movaps        %xmm10,%xmm8
@@ -27282,7 +27083,7 @@
 _sk_overlay_sse2 LABEL PROC
   DB  68,15,40,193                        ; movaps        %xmm1,%xmm8
   DB  68,15,40,232                        ; movaps        %xmm0,%xmm13
-  DB  68,15,40,13,4,106,1,0               ; movaps        0x16a04(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,13,108,104,1,0             ; movaps        0x1686c(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,40,209                        ; movaps        %xmm9,%xmm10
   DB  68,15,92,215                        ; subps         %xmm7,%xmm10
   DB  69,15,40,218                        ; movaps        %xmm10,%xmm11
@@ -27372,7 +27173,7 @@
   DB  68,15,40,213                        ; movaps        %xmm5,%xmm10
   DB  68,15,94,215                        ; divps         %xmm7,%xmm10
   DB  69,15,84,212                        ; andps         %xmm12,%xmm10
-  DB  68,15,40,13,174,104,1,0             ; movaps        0x168ae(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,13,22,103,1,0              ; movaps        0x16716(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,40,249                        ; movaps        %xmm9,%xmm15
   DB  69,15,92,250                        ; subps         %xmm10,%xmm15
   DB  69,15,40,218                        ; movaps        %xmm10,%xmm11
@@ -27385,10 +27186,10 @@
   DB  65,15,40,194                        ; movaps        %xmm10,%xmm0
   DB  15,89,192                           ; mulps         %xmm0,%xmm0
   DB  65,15,88,194                        ; addps         %xmm10,%xmm0
-  DB  68,15,40,53,216,104,1,0             ; movaps        0x168d8(%rip),%xmm14        # 33ef0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  DB  68,15,40,53,64,103,1,0              ; movaps        0x16740(%rip),%xmm14        # 338d0 <_sk_srcover_bgra_8888_sse2_lowp+0xce0>
   DB  69,15,88,222                        ; addps         %xmm14,%xmm11
   DB  68,15,89,216                        ; mulps         %xmm0,%xmm11
-  DB  68,15,40,21,216,104,1,0             ; movaps        0x168d8(%rip),%xmm10        # 33f00 <_sk_srcover_bgra_8888_sse2_lowp+0xce4>
+  DB  68,15,40,21,64,103,1,0              ; movaps        0x16740(%rip),%xmm10        # 338e0 <_sk_srcover_bgra_8888_sse2_lowp+0xcf0>
   DB  69,15,89,234                        ; mulps         %xmm10,%xmm13
   DB  69,15,88,235                        ; addps         %xmm11,%xmm13
   DB  15,88,228                           ; addps         %xmm4,%xmm4
@@ -27533,7 +27334,7 @@
   DB  68,15,40,209                        ; movaps        %xmm1,%xmm10
   DB  68,15,40,225                        ; movaps        %xmm1,%xmm12
   DB  68,15,89,211                        ; mulps         %xmm3,%xmm10
-  DB  68,15,40,5,100,102,1,0              ; movaps        0x16664(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,204,100,1,0              ; movaps        0x164cc(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,40,216                        ; movaps        %xmm8,%xmm11
   DB  15,40,207                           ; movaps        %xmm7,%xmm1
   DB  68,15,92,217                        ; subps         %xmm1,%xmm11
@@ -27581,12 +27382,12 @@
   DB  69,15,84,206                        ; andps         %xmm14,%xmm9
   DB  69,15,84,214                        ; andps         %xmm14,%xmm10
   DB  65,15,84,214                        ; andps         %xmm14,%xmm2
-  DB  68,15,40,61,33,102,1,0              ; movaps        0x16621(%rip),%xmm15        # 33f10 <_sk_srcover_bgra_8888_sse2_lowp+0xcf4>
+  DB  68,15,40,61,137,100,1,0             ; movaps        0x16489(%rip),%xmm15        # 338f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd00>
   DB  65,15,89,231                        ; mulps         %xmm15,%xmm4
-  DB  15,40,5,38,102,1,0                  ; movaps        0x16626(%rip),%xmm0        # 33f20 <_sk_srcover_bgra_8888_sse2_lowp+0xd04>
+  DB  15,40,5,142,100,1,0                 ; movaps        0x1648e(%rip),%xmm0        # 33900 <_sk_srcover_bgra_8888_sse2_lowp+0xd10>
   DB  15,89,240                           ; mulps         %xmm0,%xmm6
   DB  15,88,244                           ; addps         %xmm4,%xmm6
-  DB  68,15,40,53,40,102,1,0              ; movaps        0x16628(%rip),%xmm14        # 33f30 <_sk_srcover_bgra_8888_sse2_lowp+0xd14>
+  DB  68,15,40,53,144,100,1,0             ; movaps        0x16490(%rip),%xmm14        # 33910 <_sk_srcover_bgra_8888_sse2_lowp+0xd20>
   DB  68,15,40,239                        ; movaps        %xmm7,%xmm13
   DB  69,15,89,238                        ; mulps         %xmm14,%xmm13
   DB  68,15,88,238                        ; addps         %xmm6,%xmm13
@@ -27764,14 +27565,14 @@
   DB  68,15,84,211                        ; andps         %xmm3,%xmm10
   DB  68,15,84,203                        ; andps         %xmm3,%xmm9
   DB  15,84,195                           ; andps         %xmm3,%xmm0
-  DB  68,15,40,5,117,99,1,0               ; movaps        0x16375(%rip),%xmm8        # 33f10 <_sk_srcover_bgra_8888_sse2_lowp+0xcf4>
+  DB  68,15,40,5,221,97,1,0               ; movaps        0x161dd(%rip),%xmm8        # 338f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd00>
   DB  15,40,214                           ; movaps        %xmm6,%xmm2
   DB  65,15,89,208                        ; mulps         %xmm8,%xmm2
-  DB  15,40,13,119,99,1,0                 ; movaps        0x16377(%rip),%xmm1        # 33f20 <_sk_srcover_bgra_8888_sse2_lowp+0xd04>
+  DB  15,40,13,223,97,1,0                 ; movaps        0x161df(%rip),%xmm1        # 33900 <_sk_srcover_bgra_8888_sse2_lowp+0xd10>
   DB  15,40,221                           ; movaps        %xmm5,%xmm3
   DB  15,89,217                           ; mulps         %xmm1,%xmm3
   DB  15,88,218                           ; addps         %xmm2,%xmm3
-  DB  68,15,40,37,118,99,1,0              ; movaps        0x16376(%rip),%xmm12        # 33f30 <_sk_srcover_bgra_8888_sse2_lowp+0xd14>
+  DB  68,15,40,37,222,97,1,0              ; movaps        0x161de(%rip),%xmm12        # 33910 <_sk_srcover_bgra_8888_sse2_lowp+0xd20>
   DB  69,15,89,236                        ; mulps         %xmm12,%xmm13
   DB  68,15,88,235                        ; addps         %xmm3,%xmm13
   DB  65,15,40,210                        ; movaps        %xmm10,%xmm2
@@ -27816,7 +27617,7 @@
   DB  15,40,223                           ; movaps        %xmm7,%xmm3
   DB  15,40,236                           ; movaps        %xmm4,%xmm5
   DB  15,89,221                           ; mulps         %xmm5,%xmm3
-  DB  68,15,40,5,43,98,1,0                ; movaps        0x1622b(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,147,96,1,0               ; movaps        0x16093(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  65,15,40,224                        ; movaps        %xmm8,%xmm4
   DB  68,15,92,199                        ; subps         %xmm7,%xmm8
   DB  15,88,253                           ; addps         %xmm5,%xmm7
@@ -27917,14 +27718,14 @@
   DB  68,15,40,213                        ; movaps        %xmm5,%xmm10
   DB  69,15,89,208                        ; mulps         %xmm8,%xmm10
   DB  65,15,40,208                        ; movaps        %xmm8,%xmm2
-  DB  68,15,40,45,51,97,1,0               ; movaps        0x16133(%rip),%xmm13        # 33f10 <_sk_srcover_bgra_8888_sse2_lowp+0xcf4>
+  DB  68,15,40,45,155,95,1,0              ; movaps        0x15f9b(%rip),%xmm13        # 338f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd00>
   DB  68,15,40,198                        ; movaps        %xmm6,%xmm8
   DB  69,15,89,197                        ; mulps         %xmm13,%xmm8
-  DB  68,15,40,53,51,97,1,0               ; movaps        0x16133(%rip),%xmm14        # 33f20 <_sk_srcover_bgra_8888_sse2_lowp+0xd04>
+  DB  68,15,40,53,155,95,1,0              ; movaps        0x15f9b(%rip),%xmm14        # 33900 <_sk_srcover_bgra_8888_sse2_lowp+0xd10>
   DB  65,15,40,195                        ; movaps        %xmm11,%xmm0
   DB  65,15,89,198                        ; mulps         %xmm14,%xmm0
   DB  65,15,88,192                        ; addps         %xmm8,%xmm0
-  DB  68,15,40,29,47,97,1,0               ; movaps        0x1612f(%rip),%xmm11        # 33f30 <_sk_srcover_bgra_8888_sse2_lowp+0xd14>
+  DB  68,15,40,29,151,95,1,0              ; movaps        0x15f97(%rip),%xmm11        # 33910 <_sk_srcover_bgra_8888_sse2_lowp+0xd20>
   DB  69,15,89,227                        ; mulps         %xmm11,%xmm12
   DB  68,15,88,224                        ; addps         %xmm0,%xmm12
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
@@ -27932,7 +27733,7 @@
   DB  69,15,40,250                        ; movaps        %xmm10,%xmm15
   DB  69,15,89,254                        ; mulps         %xmm14,%xmm15
   DB  68,15,88,248                        ; addps         %xmm0,%xmm15
-  DB  68,15,40,5,107,96,1,0               ; movaps        0x1606b(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,211,94,1,0               ; movaps        0x15ed3(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  65,15,40,224                        ; movaps        %xmm8,%xmm4
   DB  15,92,226                           ; subps         %xmm2,%xmm4
   DB  15,89,252                           ; mulps         %xmm4,%xmm7
@@ -28068,15 +27869,15 @@
   DB  68,15,40,205                        ; movaps        %xmm5,%xmm9
   DB  68,15,89,204                        ; mulps         %xmm4,%xmm9
   DB  15,89,222                           ; mulps         %xmm6,%xmm3
-  DB  68,15,40,37,237,94,1,0              ; movaps        0x15eed(%rip),%xmm12        # 33f10 <_sk_srcover_bgra_8888_sse2_lowp+0xcf4>
+  DB  68,15,40,37,85,93,1,0               ; movaps        0x15d55(%rip),%xmm12        # 338f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd00>
   DB  68,15,40,199                        ; movaps        %xmm7,%xmm8
   DB  69,15,89,196                        ; mulps         %xmm12,%xmm8
-  DB  68,15,40,45,237,94,1,0              ; movaps        0x15eed(%rip),%xmm13        # 33f20 <_sk_srcover_bgra_8888_sse2_lowp+0xd04>
+  DB  68,15,40,45,85,93,1,0               ; movaps        0x15d55(%rip),%xmm13        # 33900 <_sk_srcover_bgra_8888_sse2_lowp+0xd10>
   DB  68,15,40,241                        ; movaps        %xmm1,%xmm14
   DB  69,15,89,245                        ; mulps         %xmm13,%xmm14
   DB  69,15,88,240                        ; addps         %xmm8,%xmm14
-  DB  68,15,40,29,233,94,1,0              ; movaps        0x15ee9(%rip),%xmm11        # 33f30 <_sk_srcover_bgra_8888_sse2_lowp+0xd14>
-  DB  68,15,40,5,65,94,1,0                ; movaps        0x15e41(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,29,81,93,1,0               ; movaps        0x15d51(%rip),%xmm11        # 33910 <_sk_srcover_bgra_8888_sse2_lowp+0xd20>
+  DB  68,15,40,5,169,92,1,0               ; movaps        0x15ca9(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,40,248                        ; movaps        %xmm8,%xmm15
   DB  65,15,40,194                        ; movaps        %xmm10,%xmm0
   DB  68,15,92,248                        ; subps         %xmm0,%xmm15
@@ -28210,17 +28011,15 @@
 _sk_srcover_rgba_8888_sse2 LABEL PROC
   DB  102,68,15,111,200                   ; movdqa        %xmm0,%xmm9
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,4,1,0,0                      ; jne           1e361 <_sk_srcover_rgba_8888_sse2+0x129>
-  DB  243,65,15,111,4,128                 ; movdqu        (%r8,%rax,4),%xmm0
+  DB  15,133,4,1,0,0                      ; jne           1ded3 <_sk_srcover_rgba_8888_sse2+0x123>
+  DB  243,65,15,111,4,144                 ; movdqu        (%r8,%rdx,4),%xmm0
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  102,15,111,53,210,92,1,0            ; movdqa        0x15cd2(%rip),%xmm6        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  102,15,111,53,64,91,1,0             ; movdqa        0x15b40(%rip),%xmm6        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  102,15,111,224                      ; movdqa        %xmm0,%xmm4
   DB  102,15,219,230                      ; pand          %xmm6,%xmm4
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
@@ -28235,9 +28034,9 @@
   DB  15,91,247                           ; cvtdq2ps      %xmm7,%xmm6
   DB  102,15,114,208,24                   ; psrld         $0x18,%xmm0
   DB  15,91,248                           ; cvtdq2ps      %xmm0,%xmm7
-  DB  68,15,40,5,227,91,1,0               ; movaps        0x15be3(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,81,90,1,0                ; movaps        0x15a51(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,92,195                        ; subps         %xmm3,%xmm8
-  DB  68,15,40,37,183,92,1,0              ; movaps        0x15cb7(%rip),%xmm12        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  DB  68,15,40,37,37,91,1,0               ; movaps        0x15b25(%rip),%xmm12        # 33950 <_sk_srcover_bgra_8888_sse2_lowp+0xd60>
   DB  69,15,89,204                        ; mulps         %xmm12,%xmm9
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  15,89,196                           ; mulps         %xmm4,%xmm0
@@ -28274,58 +28073,56 @@
   DB  102,15,114,241,24                   ; pslld         $0x18,%xmm1
   DB  102,15,235,203                      ; por           %xmm3,%xmm1
   DB  102,15,235,202                      ; por           %xmm2,%xmm1
-  DB  117,78                              ; jne           1e399 <_sk_srcover_rgba_8888_sse2+0x161>
-  DB  243,65,15,127,12,128                ; movdqu        %xmm1,(%r8,%rax,4)
+  DB  117,69                              ; jne           1df02 <_sk_srcover_rgba_8888_sse2+0x152>
+  DB  243,65,15,127,12,144                ; movdqu        %xmm1,(%r8,%rdx,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,201                        ; movaps        %xmm9,%xmm1
   DB  65,15,40,210                        ; movaps        %xmm10,%xmm2
   DB  65,15,40,216                        ; movaps        %xmm8,%xmm3
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,88                              ; je            1e3c6 <_sk_srcover_rgba_8888_sse2+0x18e>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,75                              ; je            1df26 <_sk_srcover_rgba_8888_sse2+0x176>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,22                              ; je            1e38e <_sk_srcover_rgba_8888_sse2+0x156>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  15,133,225,254,255,255              ; jne           1e263 <_sk_srcover_rgba_8888_sse2+0x2b>
-  DB  102,65,15,110,68,128,8              ; movd          0x8(%r8,%rax,4),%xmm0
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,20                              ; je            1def7 <_sk_srcover_rgba_8888_sse2+0x147>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  15,133,234,254,255,255              ; jne           1ddd5 <_sk_srcover_rgba_8888_sse2+0x25>
+  DB  102,65,15,110,68,144,8              ; movd          0x8(%r8,%rdx,4),%xmm0
   DB  102,15,112,192,69                   ; pshufd        $0x45,%xmm0,%xmm0
-  DB  102,65,15,18,4,128                  ; movlpd        (%r8,%rax,4),%xmm0
-  DB  233,202,254,255,255                 ; jmpq          1e263 <_sk_srcover_rgba_8888_sse2+0x2b>
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,43                              ; je            1e3d1 <_sk_srcover_rgba_8888_sse2+0x199>
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,18                              ; je            1e3be <_sk_srcover_rgba_8888_sse2+0x186>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,159                             ; jne           1e351 <_sk_srcover_rgba_8888_sse2+0x119>
+  DB  102,65,15,18,4,144                  ; movlpd        (%r8,%rdx,4),%xmm0
+  DB  233,211,254,255,255                 ; jmpq          1ddd5 <_sk_srcover_rgba_8888_sse2+0x25>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,39                              ; je            1df31 <_sk_srcover_rgba_8888_sse2+0x181>
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,16                              ; je            1df1e <_sk_srcover_rgba_8888_sse2+0x16e>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,177                             ; jne           1dec3 <_sk_srcover_rgba_8888_sse2+0x113>
   DB  102,15,112,209,78                   ; pshufd        $0x4e,%xmm1,%xmm2
-  DB  102,65,15,126,84,128,8              ; movd          %xmm2,0x8(%r8,%rax,4)
-  DB  102,65,15,214,12,128                ; movq          %xmm1,(%r8,%rax,4)
-  DB  235,139                             ; jmp           1e351 <_sk_srcover_rgba_8888_sse2+0x119>
-  DB  102,65,15,110,4,128                 ; movd          (%r8,%rax,4),%xmm0
-  DB  233,146,254,255,255                 ; jmpq          1e263 <_sk_srcover_rgba_8888_sse2+0x2b>
-  DB  102,65,15,126,12,128                ; movd          %xmm1,(%r8,%rax,4)
-  DB  233,117,255,255,255                 ; jmpq          1e351 <_sk_srcover_rgba_8888_sse2+0x119>
+  DB  102,65,15,126,84,144,8              ; movd          %xmm2,0x8(%r8,%rdx,4)
+  DB  102,65,15,214,12,144                ; movq          %xmm1,(%r8,%rdx,4)
+  DB  235,157                             ; jmp           1dec3 <_sk_srcover_rgba_8888_sse2+0x113>
+  DB  102,65,15,110,4,144                 ; movd          (%r8,%rdx,4),%xmm0
+  DB  233,164,254,255,255                 ; jmpq          1ddd5 <_sk_srcover_rgba_8888_sse2+0x25>
+  DB  102,65,15,126,12,144                ; movd          %xmm1,(%r8,%rdx,4)
+  DB  235,138                             ; jmp           1dec3 <_sk_srcover_rgba_8888_sse2+0x113>
 
 PUBLIC _sk_srcover_bgra_8888_sse2
 _sk_srcover_bgra_8888_sse2 LABEL PROC
   DB  102,68,15,111,200                   ; movdqa        %xmm0,%xmm9
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,4,1,0,0                      ; jne           1e505 <_sk_srcover_bgra_8888_sse2+0x129>
-  DB  243,65,15,111,4,128                 ; movdqu        (%r8,%rax,4),%xmm0
+  DB  15,133,4,1,0,0                      ; jne           1e05c <_sk_srcover_bgra_8888_sse2+0x123>
+  DB  243,65,15,111,4,144                 ; movdqu        (%r8,%rdx,4),%xmm0
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  102,15,111,37,46,91,1,0             ; movdqa        0x15b2e(%rip),%xmm4        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  102,15,111,37,183,89,1,0            ; movdqa        0x159b7(%rip),%xmm4        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  102,15,111,232                      ; movdqa        %xmm0,%xmm5
   DB  102,15,219,236                      ; pand          %xmm4,%xmm5
   DB  15,91,245                           ; cvtdq2ps      %xmm5,%xmm6
@@ -28340,9 +28137,9 @@
   DB  15,91,231                           ; cvtdq2ps      %xmm7,%xmm4
   DB  102,15,114,208,24                   ; psrld         $0x18,%xmm0
   DB  15,91,248                           ; cvtdq2ps      %xmm0,%xmm7
-  DB  68,15,40,5,63,90,1,0                ; movaps        0x15a3f(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,200,88,1,0               ; movaps        0x158c8(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,92,195                        ; subps         %xmm3,%xmm8
-  DB  68,15,40,37,19,91,1,0               ; movaps        0x15b13(%rip),%xmm12        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  DB  68,15,40,37,156,89,1,0              ; movaps        0x1599c(%rip),%xmm12        # 33950 <_sk_srcover_bgra_8888_sse2_lowp+0xd60>
   DB  69,15,89,204                        ; mulps         %xmm12,%xmm9
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  15,89,196                           ; mulps         %xmm4,%xmm0
@@ -28379,42 +28176,42 @@
   DB  102,15,114,241,24                   ; pslld         $0x18,%xmm1
   DB  102,15,235,203                      ; por           %xmm3,%xmm1
   DB  102,15,235,202                      ; por           %xmm2,%xmm1
-  DB  117,78                              ; jne           1e53d <_sk_srcover_bgra_8888_sse2+0x161>
-  DB  243,65,15,127,12,128                ; movdqu        %xmm1,(%r8,%rax,4)
+  DB  117,69                              ; jne           1e08b <_sk_srcover_bgra_8888_sse2+0x152>
+  DB  243,65,15,127,12,144                ; movdqu        %xmm1,(%r8,%rdx,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,201                        ; movaps        %xmm9,%xmm1
   DB  65,15,40,210                        ; movaps        %xmm10,%xmm2
   DB  65,15,40,216                        ; movaps        %xmm8,%xmm3
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,88                              ; je            1e56a <_sk_srcover_bgra_8888_sse2+0x18e>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,75                              ; je            1e0af <_sk_srcover_bgra_8888_sse2+0x176>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,22                              ; je            1e532 <_sk_srcover_bgra_8888_sse2+0x156>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  15,133,225,254,255,255              ; jne           1e407 <_sk_srcover_bgra_8888_sse2+0x2b>
-  DB  102,65,15,110,68,128,8              ; movd          0x8(%r8,%rax,4),%xmm0
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,20                              ; je            1e080 <_sk_srcover_bgra_8888_sse2+0x147>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  15,133,234,254,255,255              ; jne           1df5e <_sk_srcover_bgra_8888_sse2+0x25>
+  DB  102,65,15,110,68,144,8              ; movd          0x8(%r8,%rdx,4),%xmm0
   DB  102,15,112,192,69                   ; pshufd        $0x45,%xmm0,%xmm0
-  DB  102,65,15,18,4,128                  ; movlpd        (%r8,%rax,4),%xmm0
-  DB  233,202,254,255,255                 ; jmpq          1e407 <_sk_srcover_bgra_8888_sse2+0x2b>
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,43                              ; je            1e575 <_sk_srcover_bgra_8888_sse2+0x199>
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,18                              ; je            1e562 <_sk_srcover_bgra_8888_sse2+0x186>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,159                             ; jne           1e4f5 <_sk_srcover_bgra_8888_sse2+0x119>
+  DB  102,65,15,18,4,144                  ; movlpd        (%r8,%rdx,4),%xmm0
+  DB  233,211,254,255,255                 ; jmpq          1df5e <_sk_srcover_bgra_8888_sse2+0x25>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,39                              ; je            1e0ba <_sk_srcover_bgra_8888_sse2+0x181>
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,16                              ; je            1e0a7 <_sk_srcover_bgra_8888_sse2+0x16e>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,177                             ; jne           1e04c <_sk_srcover_bgra_8888_sse2+0x113>
   DB  102,15,112,209,78                   ; pshufd        $0x4e,%xmm1,%xmm2
-  DB  102,65,15,126,84,128,8              ; movd          %xmm2,0x8(%r8,%rax,4)
-  DB  102,65,15,214,12,128                ; movq          %xmm1,(%r8,%rax,4)
-  DB  235,139                             ; jmp           1e4f5 <_sk_srcover_bgra_8888_sse2+0x119>
-  DB  102,65,15,110,4,128                 ; movd          (%r8,%rax,4),%xmm0
-  DB  233,146,254,255,255                 ; jmpq          1e407 <_sk_srcover_bgra_8888_sse2+0x2b>
-  DB  102,65,15,126,12,128                ; movd          %xmm1,(%r8,%rax,4)
-  DB  233,117,255,255,255                 ; jmpq          1e4f5 <_sk_srcover_bgra_8888_sse2+0x119>
+  DB  102,65,15,126,84,144,8              ; movd          %xmm2,0x8(%r8,%rdx,4)
+  DB  102,65,15,214,12,144                ; movq          %xmm1,(%r8,%rdx,4)
+  DB  235,157                             ; jmp           1e04c <_sk_srcover_bgra_8888_sse2+0x113>
+  DB  102,65,15,110,4,144                 ; movd          (%r8,%rdx,4),%xmm0
+  DB  233,164,254,255,255                 ; jmpq          1df5e <_sk_srcover_bgra_8888_sse2+0x25>
+  DB  102,65,15,126,12,144                ; movd          %xmm1,(%r8,%rdx,4)
+  DB  235,138                             ; jmp           1e04c <_sk_srcover_bgra_8888_sse2+0x113>
 
 PUBLIC _sk_clamp_0_sse2
 _sk_clamp_0_sse2 LABEL PROC
@@ -28428,7 +28225,7 @@
 
 PUBLIC _sk_clamp_1_sse2
 _sk_clamp_1_sse2 LABEL PROC
-  DB  68,15,40,5,240,88,1,0               ; movaps        0x158f0(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,142,87,1,0               ; movaps        0x1578e(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  65,15,93,192                        ; minps         %xmm8,%xmm0
   DB  65,15,93,200                        ; minps         %xmm8,%xmm1
   DB  65,15,93,208                        ; minps         %xmm8,%xmm2
@@ -28438,7 +28235,7 @@
 
 PUBLIC _sk_clamp_a_sse2
 _sk_clamp_a_sse2 LABEL PROC
-  DB  15,93,29,213,88,1,0                 ; minps         0x158d5(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,93,29,115,87,1,0                 ; minps         0x15773(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,93,195                           ; minps         %xmm3,%xmm0
   DB  15,93,203                           ; minps         %xmm3,%xmm1
   DB  15,93,211                           ; minps         %xmm3,%xmm2
@@ -28447,7 +28244,7 @@
 
 PUBLIC _sk_clamp_a_dst_sse2
 _sk_clamp_a_dst_sse2 LABEL PROC
-  DB  15,93,61,193,88,1,0                 ; minps         0x158c1(%rip),%xmm7        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,93,61,95,87,1,0                  ; minps         0x1575f(%rip),%xmm7        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,93,231                           ; minps         %xmm7,%xmm4
   DB  15,93,239                           ; minps         %xmm7,%xmm5
   DB  15,93,247                           ; minps         %xmm7,%xmm6
@@ -28476,7 +28273,7 @@
 
 PUBLIC _sk_invert_sse2
 _sk_invert_sse2 LABEL PROC
-  DB  68,15,40,5,125,88,1,0               ; movaps        0x1587d(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,27,87,1,0                ; movaps        0x1571b(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  68,15,92,200                        ; subps         %xmm0,%xmm9
   DB  69,15,40,208                        ; movaps        %xmm8,%xmm10
@@ -28527,10 +28324,10 @@
 
 PUBLIC _sk_unpremul_sse2
 _sk_unpremul_sse2 LABEL PROC
-  DB  68,15,40,5,11,88,1,0                ; movaps        0x1580b(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,169,86,1,0               ; movaps        0x156a9(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,94,195                        ; divps         %xmm3,%xmm8
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
-  DB  68,15,194,13,234,88,1,0,1           ; cmpltps       0x158ea(%rip),%xmm9        # 33f80 <_sk_srcover_bgra_8888_sse2_lowp+0xd64>
+  DB  68,15,194,13,136,87,1,0,1           ; cmpltps       0x15788(%rip),%xmm9        # 33960 <_sk_srcover_bgra_8888_sse2_lowp+0xd70>
   DB  69,15,84,200                        ; andps         %xmm8,%xmm9
   DB  65,15,89,193                        ; mulps         %xmm9,%xmm0
   DB  65,15,89,201                        ; mulps         %xmm9,%xmm1
@@ -28540,20 +28337,20 @@
 
 PUBLIC _sk_from_srgb_sse2
 _sk_from_srgb_sse2 LABEL PROC
-  DB  68,15,40,5,222,88,1,0               ; movaps        0x158de(%rip),%xmm8        # 33f90 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
+  DB  68,15,40,5,124,87,1,0               ; movaps        0x1577c(%rip),%xmm8        # 33970 <_sk_srcover_bgra_8888_sse2_lowp+0xd80>
   DB  68,15,40,232                        ; movaps        %xmm0,%xmm13
   DB  69,15,89,232                        ; mulps         %xmm8,%xmm13
   DB  68,15,40,216                        ; movaps        %xmm0,%xmm11
   DB  69,15,89,219                        ; mulps         %xmm11,%xmm11
-  DB  68,15,40,13,70,88,1,0               ; movaps        0x15846(%rip),%xmm9        # 33f10 <_sk_srcover_bgra_8888_sse2_lowp+0xcf4>
+  DB  68,15,40,13,228,86,1,0              ; movaps        0x156e4(%rip),%xmm9        # 338f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd00>
   DB  68,15,40,240                        ; movaps        %xmm0,%xmm14
   DB  69,15,89,241                        ; mulps         %xmm9,%xmm14
-  DB  68,15,40,21,198,88,1,0              ; movaps        0x158c6(%rip),%xmm10        # 33fa0 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  DB  68,15,40,21,100,87,1,0              ; movaps        0x15764(%rip),%xmm10        # 33980 <_sk_srcover_bgra_8888_sse2_lowp+0xd90>
   DB  69,15,88,242                        ; addps         %xmm10,%xmm14
   DB  69,15,89,243                        ; mulps         %xmm11,%xmm14
-  DB  68,15,40,29,198,88,1,0              ; movaps        0x158c6(%rip),%xmm11        # 33fb0 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
+  DB  68,15,40,29,100,87,1,0              ; movaps        0x15764(%rip),%xmm11        # 33990 <_sk_srcover_bgra_8888_sse2_lowp+0xda0>
   DB  69,15,88,243                        ; addps         %xmm11,%xmm14
-  DB  68,15,40,37,202,88,1,0              ; movaps        0x158ca(%rip),%xmm12        # 33fc0 <_sk_srcover_bgra_8888_sse2_lowp+0xda4>
+  DB  68,15,40,37,104,87,1,0              ; movaps        0x15768(%rip),%xmm12        # 339a0 <_sk_srcover_bgra_8888_sse2_lowp+0xdb0>
   DB  65,15,194,196,1                     ; cmpltps       %xmm12,%xmm0
   DB  68,15,84,232                        ; andps         %xmm0,%xmm13
   DB  65,15,85,198                        ; andnps        %xmm14,%xmm0
@@ -28587,20 +28384,20 @@
 
 PUBLIC _sk_from_srgb_dst_sse2
 _sk_from_srgb_dst_sse2 LABEL PROC
-  DB  68,15,40,5,27,88,1,0                ; movaps        0x1581b(%rip),%xmm8        # 33f90 <_sk_srcover_bgra_8888_sse2_lowp+0xd74>
+  DB  68,15,40,5,185,86,1,0               ; movaps        0x156b9(%rip),%xmm8        # 33970 <_sk_srcover_bgra_8888_sse2_lowp+0xd80>
   DB  68,15,40,236                        ; movaps        %xmm4,%xmm13
   DB  69,15,89,232                        ; mulps         %xmm8,%xmm13
   DB  68,15,40,220                        ; movaps        %xmm4,%xmm11
   DB  69,15,89,219                        ; mulps         %xmm11,%xmm11
-  DB  68,15,40,13,131,87,1,0              ; movaps        0x15783(%rip),%xmm9        # 33f10 <_sk_srcover_bgra_8888_sse2_lowp+0xcf4>
+  DB  68,15,40,13,33,86,1,0               ; movaps        0x15621(%rip),%xmm9        # 338f0 <_sk_srcover_bgra_8888_sse2_lowp+0xd00>
   DB  68,15,40,244                        ; movaps        %xmm4,%xmm14
   DB  69,15,89,241                        ; mulps         %xmm9,%xmm14
-  DB  68,15,40,21,3,88,1,0                ; movaps        0x15803(%rip),%xmm10        # 33fa0 <_sk_srcover_bgra_8888_sse2_lowp+0xd84>
+  DB  68,15,40,21,161,86,1,0              ; movaps        0x156a1(%rip),%xmm10        # 33980 <_sk_srcover_bgra_8888_sse2_lowp+0xd90>
   DB  69,15,88,242                        ; addps         %xmm10,%xmm14
   DB  69,15,89,243                        ; mulps         %xmm11,%xmm14
-  DB  68,15,40,29,3,88,1,0                ; movaps        0x15803(%rip),%xmm11        # 33fb0 <_sk_srcover_bgra_8888_sse2_lowp+0xd94>
+  DB  68,15,40,29,161,86,1,0              ; movaps        0x156a1(%rip),%xmm11        # 33990 <_sk_srcover_bgra_8888_sse2_lowp+0xda0>
   DB  69,15,88,243                        ; addps         %xmm11,%xmm14
-  DB  68,15,40,37,7,88,1,0                ; movaps        0x15807(%rip),%xmm12        # 33fc0 <_sk_srcover_bgra_8888_sse2_lowp+0xda4>
+  DB  68,15,40,37,165,86,1,0              ; movaps        0x156a5(%rip),%xmm12        # 339a0 <_sk_srcover_bgra_8888_sse2_lowp+0xdb0>
   DB  65,15,194,228,1                     ; cmpltps       %xmm12,%xmm4
   DB  68,15,84,236                        ; andps         %xmm4,%xmm13
   DB  65,15,85,230                        ; andnps        %xmm14,%xmm4
@@ -28635,22 +28432,22 @@
 PUBLIC _sk_to_srgb_sse2
 _sk_to_srgb_sse2 LABEL PROC
   DB  68,15,82,232                        ; rsqrtps       %xmm0,%xmm13
-  DB  68,15,40,5,148,87,1,0               ; movaps        0x15794(%rip),%xmm8        # 33fd0 <_sk_srcover_bgra_8888_sse2_lowp+0xdb4>
+  DB  68,15,40,5,50,86,1,0                ; movaps        0x15632(%rip),%xmm8        # 339b0 <_sk_srcover_bgra_8888_sse2_lowp+0xdc0>
   DB  68,15,40,240                        ; movaps        %xmm0,%xmm14
   DB  69,15,89,240                        ; mulps         %xmm8,%xmm14
-  DB  68,15,40,13,148,87,1,0              ; movaps        0x15794(%rip),%xmm9        # 33fe0 <_sk_srcover_bgra_8888_sse2_lowp+0xdc4>
+  DB  68,15,40,13,50,86,1,0               ; movaps        0x15632(%rip),%xmm9        # 339c0 <_sk_srcover_bgra_8888_sse2_lowp+0xdd0>
   DB  69,15,40,253                        ; movaps        %xmm13,%xmm15
   DB  69,15,89,249                        ; mulps         %xmm9,%xmm15
-  DB  68,15,40,21,148,87,1,0              ; movaps        0x15794(%rip),%xmm10        # 33ff0 <_sk_srcover_bgra_8888_sse2_lowp+0xdd4>
+  DB  68,15,40,21,50,86,1,0               ; movaps        0x15632(%rip),%xmm10        # 339d0 <_sk_srcover_bgra_8888_sse2_lowp+0xde0>
   DB  69,15,88,250                        ; addps         %xmm10,%xmm15
   DB  69,15,89,253                        ; mulps         %xmm13,%xmm15
-  DB  68,15,40,29,148,87,1,0              ; movaps        0x15794(%rip),%xmm11        # 34000 <_sk_srcover_bgra_8888_sse2_lowp+0xde4>
+  DB  68,15,40,29,50,86,1,0               ; movaps        0x15632(%rip),%xmm11        # 339e0 <_sk_srcover_bgra_8888_sse2_lowp+0xdf0>
   DB  69,15,88,251                        ; addps         %xmm11,%xmm15
-  DB  68,15,40,37,152,87,1,0              ; movaps        0x15798(%rip),%xmm12        # 34010 <_sk_srcover_bgra_8888_sse2_lowp+0xdf4>
+  DB  68,15,40,37,54,86,1,0               ; movaps        0x15636(%rip),%xmm12        # 339f0 <_sk_srcover_bgra_8888_sse2_lowp+0xe00>
   DB  69,15,88,236                        ; addps         %xmm12,%xmm13
   DB  69,15,83,237                        ; rcpps         %xmm13,%xmm13
   DB  69,15,89,239                        ; mulps         %xmm15,%xmm13
-  DB  68,15,40,61,148,87,1,0              ; movaps        0x15794(%rip),%xmm15        # 34020 <_sk_srcover_bgra_8888_sse2_lowp+0xe04>
+  DB  68,15,40,61,50,86,1,0               ; movaps        0x15632(%rip),%xmm15        # 33a00 <_sk_srcover_bgra_8888_sse2_lowp+0xe10>
   DB  65,15,194,199,1                     ; cmpltps       %xmm15,%xmm0
   DB  68,15,84,240                        ; andps         %xmm0,%xmm14
   DB  65,15,85,197                        ; andnps        %xmm13,%xmm0
@@ -28700,7 +28497,7 @@
   DB  68,15,93,216                        ; minps         %xmm0,%xmm11
   DB  65,15,40,202                        ; movaps        %xmm10,%xmm1
   DB  65,15,92,203                        ; subps         %xmm11,%xmm1
-  DB  68,15,40,45,71,85,1,0               ; movaps        0x15547(%rip),%xmm13        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,45,229,83,1,0              ; movaps        0x153e5(%rip),%xmm13        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,94,233                        ; divps         %xmm1,%xmm13
   DB  65,15,40,194                        ; movaps        %xmm10,%xmm0
   DB  65,15,194,192,0                     ; cmpeqps       %xmm8,%xmm0
@@ -28709,30 +28506,30 @@
   DB  69,15,89,229                        ; mulps         %xmm13,%xmm12
   DB  69,15,40,241                        ; movaps        %xmm9,%xmm14
   DB  68,15,194,242,1                     ; cmpltps       %xmm2,%xmm14
-  DB  68,15,84,53,189,86,1,0              ; andps         0x156bd(%rip),%xmm14        # 34030 <_sk_srcover_bgra_8888_sse2_lowp+0xe14>
+  DB  68,15,84,53,91,85,1,0               ; andps         0x1555b(%rip),%xmm14        # 33a10 <_sk_srcover_bgra_8888_sse2_lowp+0xe20>
   DB  69,15,88,244                        ; addps         %xmm12,%xmm14
   DB  69,15,40,250                        ; movaps        %xmm10,%xmm15
   DB  69,15,194,249,0                     ; cmpeqps       %xmm9,%xmm15
   DB  65,15,92,208                        ; subps         %xmm8,%xmm2
   DB  65,15,89,213                        ; mulps         %xmm13,%xmm2
-  DB  68,15,40,37,176,86,1,0              ; movaps        0x156b0(%rip),%xmm12        # 34040 <_sk_srcover_bgra_8888_sse2_lowp+0xe24>
+  DB  68,15,40,37,78,85,1,0               ; movaps        0x1554e(%rip),%xmm12        # 33a20 <_sk_srcover_bgra_8888_sse2_lowp+0xe30>
   DB  65,15,88,212                        ; addps         %xmm12,%xmm2
   DB  69,15,92,193                        ; subps         %xmm9,%xmm8
   DB  69,15,89,197                        ; mulps         %xmm13,%xmm8
-  DB  68,15,88,5,172,86,1,0               ; addps         0x156ac(%rip),%xmm8        # 34050 <_sk_srcover_bgra_8888_sse2_lowp+0xe34>
+  DB  68,15,88,5,74,85,1,0                ; addps         0x1554a(%rip),%xmm8        # 33a30 <_sk_srcover_bgra_8888_sse2_lowp+0xe40>
   DB  65,15,84,215                        ; andps         %xmm15,%xmm2
   DB  69,15,85,248                        ; andnps        %xmm8,%xmm15
   DB  68,15,86,250                        ; orps          %xmm2,%xmm15
   DB  68,15,84,240                        ; andps         %xmm0,%xmm14
   DB  65,15,85,199                        ; andnps        %xmm15,%xmm0
   DB  65,15,86,198                        ; orps          %xmm14,%xmm0
-  DB  15,89,5,157,86,1,0                  ; mulps         0x1569d(%rip),%xmm0        # 34060 <_sk_srcover_bgra_8888_sse2_lowp+0xe44>
+  DB  15,89,5,59,85,1,0                   ; mulps         0x1553b(%rip),%xmm0        # 33a40 <_sk_srcover_bgra_8888_sse2_lowp+0xe50>
   DB  69,15,40,194                        ; movaps        %xmm10,%xmm8
   DB  69,15,194,195,4                     ; cmpneqps      %xmm11,%xmm8
   DB  65,15,84,192                        ; andps         %xmm8,%xmm0
   DB  69,15,92,226                        ; subps         %xmm10,%xmm12
   DB  69,15,88,211                        ; addps         %xmm11,%xmm10
-  DB  68,15,40,13,160,84,1,0              ; movaps        0x154a0(%rip),%xmm9        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  68,15,40,13,62,83,1,0               ; movaps        0x1533e(%rip),%xmm9        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  65,15,40,210                        ; movaps        %xmm10,%xmm2
   DB  65,15,89,209                        ; mulps         %xmm9,%xmm2
   DB  68,15,194,202,1                     ; cmpltps       %xmm2,%xmm9
@@ -28755,7 +28552,7 @@
   DB  15,41,92,36,32                      ; movaps        %xmm3,0x20(%rsp)
   DB  68,15,40,218                        ; movaps        %xmm2,%xmm11
   DB  15,40,240                           ; movaps        %xmm0,%xmm6
-  DB  68,15,40,13,75,84,1,0               ; movaps        0x1544b(%rip),%xmm9        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  68,15,40,13,233,82,1,0              ; movaps        0x152e9(%rip),%xmm9        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  69,15,40,209                        ; movaps        %xmm9,%xmm10
   DB  69,15,194,211,2                     ; cmpleps       %xmm11,%xmm10
   DB  15,40,193                           ; movaps        %xmm1,%xmm0
@@ -28772,28 +28569,28 @@
   DB  69,15,88,211                        ; addps         %xmm11,%xmm10
   DB  69,15,88,219                        ; addps         %xmm11,%xmm11
   DB  69,15,92,218                        ; subps         %xmm10,%xmm11
-  DB  15,40,5,245,85,1,0                  ; movaps        0x155f5(%rip),%xmm0        # 34070 <_sk_srcover_bgra_8888_sse2_lowp+0xe54>
+  DB  15,40,5,147,84,1,0                  ; movaps        0x15493(%rip),%xmm0        # 33a50 <_sk_srcover_bgra_8888_sse2_lowp+0xe60>
   DB  15,88,198                           ; addps         %xmm6,%xmm0
   DB  243,15,91,200                       ; cvttps2dq     %xmm0,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
   DB  15,40,216                           ; movaps        %xmm0,%xmm3
   DB  15,194,217,1                        ; cmpltps       %xmm1,%xmm3
-  DB  15,84,29,253,83,1,0                 ; andps         0x153fd(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,84,29,155,82,1,0                 ; andps         0x1529b(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,92,203                           ; subps         %xmm3,%xmm1
   DB  15,92,193                           ; subps         %xmm1,%xmm0
-  DB  68,15,40,45,223,85,1,0              ; movaps        0x155df(%rip),%xmm13        # 34080 <_sk_srcover_bgra_8888_sse2_lowp+0xe64>
+  DB  68,15,40,45,125,84,1,0              ; movaps        0x1547d(%rip),%xmm13        # 33a60 <_sk_srcover_bgra_8888_sse2_lowp+0xe70>
   DB  69,15,40,197                        ; movaps        %xmm13,%xmm8
   DB  68,15,194,192,2                     ; cmpleps       %xmm0,%xmm8
   DB  69,15,40,242                        ; movaps        %xmm10,%xmm14
   DB  69,15,92,243                        ; subps         %xmm11,%xmm14
   DB  65,15,40,217                        ; movaps        %xmm9,%xmm3
   DB  15,194,216,2                        ; cmpleps       %xmm0,%xmm3
-  DB  15,40,21,159,85,1,0                 ; movaps        0x1559f(%rip),%xmm2        # 34060 <_sk_srcover_bgra_8888_sse2_lowp+0xe44>
+  DB  15,40,21,61,84,1,0                  ; movaps        0x1543d(%rip),%xmm2        # 33a40 <_sk_srcover_bgra_8888_sse2_lowp+0xe50>
   DB  68,15,40,250                        ; movaps        %xmm2,%xmm15
   DB  68,15,194,248,2                     ; cmpleps       %xmm0,%xmm15
-  DB  15,40,13,95,85,1,0                  ; movaps        0x1555f(%rip),%xmm1        # 34030 <_sk_srcover_bgra_8888_sse2_lowp+0xe14>
+  DB  15,40,13,253,83,1,0                 ; movaps        0x153fd(%rip),%xmm1        # 33a10 <_sk_srcover_bgra_8888_sse2_lowp+0xe20>
   DB  15,89,193                           ; mulps         %xmm1,%xmm0
-  DB  15,40,45,117,85,1,0                 ; movaps        0x15575(%rip),%xmm5        # 34050 <_sk_srcover_bgra_8888_sse2_lowp+0xe34>
+  DB  15,40,45,19,84,1,0                  ; movaps        0x15413(%rip),%xmm5        # 33a30 <_sk_srcover_bgra_8888_sse2_lowp+0xe40>
   DB  15,40,229                           ; movaps        %xmm5,%xmm4
   DB  15,92,224                           ; subps         %xmm0,%xmm4
   DB  65,15,89,230                        ; mulps         %xmm14,%xmm4
@@ -28816,7 +28613,7 @@
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
   DB  15,40,222                           ; movaps        %xmm6,%xmm3
   DB  15,194,216,1                        ; cmpltps       %xmm0,%xmm3
-  DB  15,84,29,90,83,1,0                  ; andps         0x1535a(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,84,29,248,81,1,0                 ; andps         0x151f8(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,92,195                           ; subps         %xmm3,%xmm0
   DB  68,15,40,230                        ; movaps        %xmm6,%xmm12
   DB  68,15,92,224                        ; subps         %xmm0,%xmm12
@@ -28846,12 +28643,12 @@
   DB  15,40,60,36                         ; movaps        (%rsp),%xmm7
   DB  15,40,231                           ; movaps        %xmm7,%xmm4
   DB  15,85,227                           ; andnps        %xmm3,%xmm4
-  DB  15,88,53,227,84,1,0                 ; addps         0x154e3(%rip),%xmm6        # 34090 <_sk_srcover_bgra_8888_sse2_lowp+0xe74>
+  DB  15,88,53,129,83,1,0                 ; addps         0x15381(%rip),%xmm6        # 33a70 <_sk_srcover_bgra_8888_sse2_lowp+0xe80>
   DB  243,15,91,198                       ; cvttps2dq     %xmm6,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
   DB  15,40,222                           ; movaps        %xmm6,%xmm3
   DB  15,194,216,1                        ; cmpltps       %xmm0,%xmm3
-  DB  15,84,29,206,82,1,0                 ; andps         0x152ce(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,84,29,108,81,1,0                 ; andps         0x1516c(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,92,195                           ; subps         %xmm3,%xmm0
   DB  15,92,240                           ; subps         %xmm0,%xmm6
   DB  15,89,206                           ; mulps         %xmm6,%xmm1
@@ -28906,19 +28703,17 @@
 PUBLIC _sk_scale_u8_sse2
 _sk_scale_u8_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,61                              ; jne           1ecc7 <_sk_scale_u8_sse2+0x55>
-  DB  102,71,15,110,4,16                  ; movd          (%r8,%r10,1),%xmm8
+  DB  117,61                              ; jne           1e803 <_sk_scale_u8_sse2+0x4f>
+  DB  102,69,15,110,4,16                  ; movd          (%r8,%rdx,1),%xmm8
   DB  102,68,15,96,192                    ; punpcklbw     %xmm0,%xmm8
   DB  102,68,15,97,192                    ; punpcklwd     %xmm0,%xmm8
-  DB  102,68,15,219,5,157,82,1,0          ; pand          0x1529d(%rip),%xmm8        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  102,68,15,219,5,65,81,1,0           ; pand          0x15141(%rip),%xmm8        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
-  DB  68,15,89,5,241,83,1,0               ; mulps         0x153f1(%rip),%xmm8        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  68,15,89,5,149,82,1,0               ; mulps         0x15295(%rip),%xmm8        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  65,15,89,200                        ; mulps         %xmm8,%xmm1
   DB  65,15,89,208                        ; mulps         %xmm8,%xmm2
@@ -28926,52 +28721,50 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,216                        ; movaps        %xmm8,%xmm3
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,61                              ; je            1ed11 <_sk_scale_u8_sse2+0x9f>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,57                              ; je            1e844 <_sk_scale_u8_sse2+0x90>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,23                              ; je            1ecf6 <_sk_scale_u8_sse2+0x84>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,181                             ; jne           1ec9a <_sk_scale_u8_sse2+0x28>
-  DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,21                              ; je            1e829 <_sk_scale_u8_sse2+0x75>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,190                             ; jne           1e7d6 <_sk_scale_u8_sse2+0x22>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  102,69,15,112,192,69                ; pshufd        $0x45,%xmm8,%xmm8
-  DB  67,15,183,4,16                      ; movzwl        (%r8,%r10,1),%eax
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  102,68,15,110,200                   ; movd          %eax,%xmm9
   DB  102,68,15,96,200                    ; punpcklbw     %xmm0,%xmm9
   DB  102,68,15,97,200                    ; punpcklwd     %xmm0,%xmm9
   DB  242,69,15,16,193                    ; movsd         %xmm9,%xmm8
-  DB  235,137                             ; jmp           1ec9a <_sk_scale_u8_sse2+0x28>
-  DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
+  DB  235,146                             ; jmp           1e7d6 <_sk_scale_u8_sse2+0x22>
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
-  DB  233,122,255,255,255                 ; jmpq          1ec9a <_sk_scale_u8_sse2+0x28>
+  DB  235,134                             ; jmp           1e7d6 <_sk_scale_u8_sse2+0x22>
 
 PUBLIC _sk_scale_565_sse2
 _sk_scale_565_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,173,0,0,0                    ; jne           1edec <_sk_scale_565_sse2+0xcc>
-  DB  243,71,15,126,20,80                 ; movq          (%r8,%r10,2),%xmm10
+  DB  15,133,173,0,0,0                    ; jne           1e916 <_sk_scale_565_sse2+0xc6>
+  DB  243,69,15,126,20,80                 ; movq          (%r8,%rdx,2),%xmm10
   DB  102,68,15,97,208                    ; punpcklwd     %xmm0,%xmm10
-  DB  102,68,15,111,5,93,83,1,0           ; movdqa        0x1535d(%rip),%xmm8        # 340b0 <_sk_srcover_bgra_8888_sse2_lowp+0xe94>
+  DB  102,68,15,111,5,19,82,1,0           ; movdqa        0x15213(%rip),%xmm8        # 33a90 <_sk_srcover_bgra_8888_sse2_lowp+0xea0>
   DB  102,69,15,219,194                   ; pand          %xmm10,%xmm8
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
-  DB  68,15,89,5,92,83,1,0                ; mulps         0x1535c(%rip),%xmm8        # 340c0 <_sk_srcover_bgra_8888_sse2_lowp+0xea4>
-  DB  102,68,15,111,13,99,83,1,0          ; movdqa        0x15363(%rip),%xmm9        # 340d0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  DB  68,15,89,5,18,82,1,0                ; mulps         0x15212(%rip),%xmm8        # 33aa0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb0>
+  DB  102,68,15,111,13,25,82,1,0          ; movdqa        0x15219(%rip),%xmm9        # 33ab0 <_sk_srcover_bgra_8888_sse2_lowp+0xec0>
   DB  102,69,15,219,202                   ; pand          %xmm10,%xmm9
   DB  69,15,91,201                        ; cvtdq2ps      %xmm9,%xmm9
-  DB  68,15,89,13,98,83,1,0               ; mulps         0x15362(%rip),%xmm9        # 340e0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
-  DB  102,68,15,219,21,105,83,1,0         ; pand          0x15369(%rip),%xmm10        # 340f0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
+  DB  68,15,89,13,24,82,1,0               ; mulps         0x15218(%rip),%xmm9        # 33ac0 <_sk_srcover_bgra_8888_sse2_lowp+0xed0>
+  DB  102,68,15,219,21,31,82,1,0          ; pand          0x1521f(%rip),%xmm10        # 33ad0 <_sk_srcover_bgra_8888_sse2_lowp+0xee0>
   DB  69,15,91,210                        ; cvtdq2ps      %xmm10,%xmm10
-  DB  68,15,89,21,109,83,1,0              ; mulps         0x1536d(%rip),%xmm10        # 34100 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  DB  68,15,89,21,35,82,1,0               ; mulps         0x15223(%rip),%xmm10        # 33ae0 <_sk_srcover_bgra_8888_sse2_lowp+0xef0>
   DB  68,15,40,219                        ; movaps        %xmm3,%xmm11
   DB  68,15,194,223,1                     ; cmpltps       %xmm7,%xmm11
   DB  69,15,40,225                        ; movaps        %xmm9,%xmm12
@@ -28995,25 +28788,25 @@
   DB  65,15,40,210                        ; movaps        %xmm10,%xmm2
   DB  65,15,40,219                        ; movaps        %xmm11,%xmm3
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,60                              ; je            1ee35 <_sk_scale_565_sse2+0x115>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,56                              ; je            1e956 <_sk_scale_565_sse2+0x106>
   DB  102,69,15,239,210                   ; pxor          %xmm10,%xmm10
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,27                              ; je            1ee1f <_sk_scale_565_sse2+0xff>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  15,133,60,255,255,255               ; jne           1ed4a <_sk_scale_565_sse2+0x2a>
-  DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,25                              ; je            1e940 <_sk_scale_565_sse2+0xf0>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  15,133,69,255,255,255               ; jne           1e874 <_sk_scale_565_sse2+0x24>
+  DB  65,15,183,68,80,4                   ; movzwl        0x4(%r8,%rdx,2),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  102,69,15,112,208,69                ; pshufd        $0x45,%xmm8,%xmm10
-  DB  102,71,15,110,4,80                  ; movd          (%r8,%r10,2),%xmm8
+  DB  102,69,15,110,4,80                  ; movd          (%r8,%rdx,2),%xmm8
   DB  242,69,15,112,192,212               ; pshuflw       $0xd4,%xmm8,%xmm8
   DB  242,69,15,16,208                    ; movsd         %xmm8,%xmm10
-  DB  233,21,255,255,255                  ; jmpq          1ed4a <_sk_scale_565_sse2+0x2a>
-  DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
+  DB  233,30,255,255,255                  ; jmpq          1e874 <_sk_scale_565_sse2+0x24>
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,68,15,110,208                   ; movd          %eax,%xmm10
-  DB  233,6,255,255,255                   ; jmpq          1ed4a <_sk_scale_565_sse2+0x2a>
+  DB  233,15,255,255,255                  ; jmpq          1e874 <_sk_scale_565_sse2+0x24>
 
 PUBLIC _sk_lerp_1_float_sse2
 _sk_lerp_1_float_sse2 LABEL PROC
@@ -29038,19 +28831,17 @@
 PUBLIC _sk_lerp_u8_sse2
 _sk_lerp_u8_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,81                              ; jne           1eee5 <_sk_lerp_u8_sse2+0x69>
-  DB  102,71,15,110,4,16                  ; movd          (%r8,%r10,1),%xmm8
+  DB  117,81                              ; jne           1ea00 <_sk_lerp_u8_sse2+0x63>
+  DB  102,69,15,110,4,16                  ; movd          (%r8,%rdx,1),%xmm8
   DB  102,68,15,96,192                    ; punpcklbw     %xmm0,%xmm8
   DB  102,68,15,97,192                    ; punpcklwd     %xmm0,%xmm8
-  DB  102,68,15,219,5,147,80,1,0          ; pand          0x15093(%rip),%xmm8        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  102,68,15,219,5,88,79,1,0           ; pand          0x14f58(%rip),%xmm8        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
-  DB  68,15,89,5,231,81,1,0               ; mulps         0x151e7(%rip),%xmm8        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  68,15,89,5,172,80,1,0               ; mulps         0x150ac(%rip),%xmm8        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  15,92,196                           ; subps         %xmm4,%xmm0
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  15,88,196                           ; addps         %xmm4,%xmm0
@@ -29065,52 +28856,50 @@
   DB  15,88,223                           ; addps         %xmm7,%xmm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,64                              ; je            1ef32 <_sk_lerp_u8_sse2+0xb6>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,60                              ; je            1ea44 <_sk_lerp_u8_sse2+0xa7>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,23                              ; je            1ef14 <_sk_lerp_u8_sse2+0x98>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,161                             ; jne           1eea4 <_sk_lerp_u8_sse2+0x28>
-  DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,21                              ; je            1ea26 <_sk_lerp_u8_sse2+0x89>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,170                             ; jne           1e9bf <_sk_lerp_u8_sse2+0x22>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  102,69,15,112,192,69                ; pshufd        $0x45,%xmm8,%xmm8
-  DB  67,15,183,4,16                      ; movzwl        (%r8,%r10,1),%eax
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  102,68,15,110,200                   ; movd          %eax,%xmm9
   DB  102,68,15,96,200                    ; punpcklbw     %xmm0,%xmm9
   DB  102,68,15,97,200                    ; punpcklwd     %xmm0,%xmm9
   DB  242,69,15,16,193                    ; movsd         %xmm9,%xmm8
-  DB  233,114,255,255,255                 ; jmpq          1eea4 <_sk_lerp_u8_sse2+0x28>
-  DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
+  DB  233,123,255,255,255                 ; jmpq          1e9bf <_sk_lerp_u8_sse2+0x22>
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
-  DB  233,99,255,255,255                  ; jmpq          1eea4 <_sk_lerp_u8_sse2+0x28>
+  DB  233,108,255,255,255                 ; jmpq          1e9bf <_sk_lerp_u8_sse2+0x22>
 
 PUBLIC _sk_lerp_565_sse2
 _sk_lerp_565_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,173,0,0,0                    ; jne           1f00d <_sk_lerp_565_sse2+0xcc>
-  DB  243,71,15,126,4,80                  ; movq          (%r8,%r10,2),%xmm8
+  DB  15,133,173,0,0,0                    ; jne           1eb19 <_sk_lerp_565_sse2+0xc6>
+  DB  243,69,15,126,4,80                  ; movq          (%r8,%rdx,2),%xmm8
   DB  102,68,15,97,192                    ; punpcklwd     %xmm0,%xmm8
-  DB  102,68,15,111,13,60,81,1,0          ; movdqa        0x1513c(%rip),%xmm9        # 340b0 <_sk_srcover_bgra_8888_sse2_lowp+0xe94>
+  DB  102,68,15,111,13,16,80,1,0          ; movdqa        0x15010(%rip),%xmm9        # 33a90 <_sk_srcover_bgra_8888_sse2_lowp+0xea0>
   DB  102,69,15,219,200                   ; pand          %xmm8,%xmm9
   DB  69,15,91,201                        ; cvtdq2ps      %xmm9,%xmm9
-  DB  68,15,89,13,59,81,1,0               ; mulps         0x1513b(%rip),%xmm9        # 340c0 <_sk_srcover_bgra_8888_sse2_lowp+0xea4>
-  DB  102,68,15,111,21,66,81,1,0          ; movdqa        0x15142(%rip),%xmm10        # 340d0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  DB  68,15,89,13,15,80,1,0               ; mulps         0x1500f(%rip),%xmm9        # 33aa0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb0>
+  DB  102,68,15,111,21,22,80,1,0          ; movdqa        0x15016(%rip),%xmm10        # 33ab0 <_sk_srcover_bgra_8888_sse2_lowp+0xec0>
   DB  102,69,15,219,208                   ; pand          %xmm8,%xmm10
   DB  69,15,91,218                        ; cvtdq2ps      %xmm10,%xmm11
-  DB  68,15,89,29,65,81,1,0               ; mulps         0x15141(%rip),%xmm11        # 340e0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
-  DB  102,68,15,219,5,72,81,1,0           ; pand          0x15148(%rip),%xmm8        # 340f0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
+  DB  68,15,89,29,21,80,1,0               ; mulps         0x15015(%rip),%xmm11        # 33ac0 <_sk_srcover_bgra_8888_sse2_lowp+0xed0>
+  DB  102,68,15,219,5,28,80,1,0           ; pand          0x1501c(%rip),%xmm8        # 33ad0 <_sk_srcover_bgra_8888_sse2_lowp+0xee0>
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
-  DB  68,15,89,5,76,81,1,0                ; mulps         0x1514c(%rip),%xmm8        # 34100 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  DB  68,15,89,5,32,80,1,0                ; mulps         0x15020(%rip),%xmm8        # 33ae0 <_sk_srcover_bgra_8888_sse2_lowp+0xef0>
   DB  68,15,40,211                        ; movaps        %xmm3,%xmm10
   DB  68,15,194,215,1                     ; cmpltps       %xmm7,%xmm10
   DB  69,15,40,227                        ; movaps        %xmm11,%xmm12
@@ -29136,25 +28925,25 @@
   DB  15,88,223                           ; addps         %xmm7,%xmm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,60                              ; je            1f056 <_sk_lerp_565_sse2+0x115>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,56                              ; je            1eb59 <_sk_lerp_565_sse2+0x106>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,27                              ; je            1f040 <_sk_lerp_565_sse2+0xff>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  15,133,60,255,255,255               ; jne           1ef6b <_sk_lerp_565_sse2+0x2a>
-  DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,25                              ; je            1eb43 <_sk_lerp_565_sse2+0xf0>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  15,133,69,255,255,255               ; jne           1ea77 <_sk_lerp_565_sse2+0x24>
+  DB  65,15,183,68,80,4                   ; movzwl        0x4(%r8,%rdx,2),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  102,69,15,112,192,69                ; pshufd        $0x45,%xmm8,%xmm8
-  DB  102,71,15,110,12,80                 ; movd          (%r8,%r10,2),%xmm9
+  DB  102,69,15,110,12,80                 ; movd          (%r8,%rdx,2),%xmm9
   DB  242,69,15,112,201,212               ; pshuflw       $0xd4,%xmm9,%xmm9
   DB  242,69,15,16,193                    ; movsd         %xmm9,%xmm8
-  DB  233,21,255,255,255                  ; jmpq          1ef6b <_sk_lerp_565_sse2+0x2a>
-  DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
+  DB  233,30,255,255,255                  ; jmpq          1ea77 <_sk_lerp_565_sse2+0x24>
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
-  DB  233,6,255,255,255                   ; jmpq          1ef6b <_sk_lerp_565_sse2+0x2a>
+  DB  233,15,255,255,255                  ; jmpq          1ea77 <_sk_lerp_565_sse2+0x24>
 
 PUBLIC _sk_load_tables_sse2
 _sk_load_tables_sse2 LABEL PROC
@@ -29163,9 +28952,9 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,31,1,0,0                     ; jne           1f195 <_sk_load_tables_sse2+0x130>
+  DB  15,133,31,1,0,0                     ; jne           1ec98 <_sk_load_tables_sse2+0x130>
   DB  243,69,15,111,12,144                ; movdqu        (%r8,%rdx,4),%xmm9
-  DB  102,68,15,111,5,187,78,1,0          ; movdqa        0x14ebb(%rip),%xmm8        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  102,68,15,111,5,152,77,1,0          ; movdqa        0x14d98(%rip),%xmm8        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  102,65,15,111,193                   ; movdqa        %xmm9,%xmm0
   DB  102,65,15,219,192                   ; pand          %xmm8,%xmm0
   DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
@@ -29221,7 +29010,7 @@
   DB  102,15,20,211                       ; unpcklpd      %xmm3,%xmm2
   DB  102,65,15,114,209,24                ; psrld         $0x18,%xmm9
   DB  65,15,91,217                        ; cvtdq2ps      %xmm9,%xmm3
-  DB  15,89,29,18,79,1,0                  ; mulps         0x14f12(%rip),%xmm3        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  15,89,29,239,77,1,0                 ; mulps         0x14def(%rip),%xmm3        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  91                                  ; pop           %rbx
   DB  65,94                               ; pop           %r14
@@ -29229,18 +29018,18 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,45                              ; je            1f1cf <_sk_load_tables_sse2+0x16a>
+  DB  116,45                              ; je            1ecd2 <_sk_load_tables_sse2+0x16a>
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,23                              ; je            1f1c4 <_sk_load_tables_sse2+0x15f>
+  DB  116,23                              ; je            1ecc7 <_sk_load_tables_sse2+0x15f>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  15,133,197,254,255,255              ; jne           1f07c <_sk_load_tables_sse2+0x17>
+  DB  15,133,197,254,255,255              ; jne           1eb7f <_sk_load_tables_sse2+0x17>
   DB  102,65,15,110,68,144,8              ; movd          0x8(%r8,%rdx,4),%xmm0
   DB  102,68,15,112,200,69                ; pshufd        $0x45,%xmm0,%xmm9
   DB  102,69,15,18,12,144                 ; movlpd        (%r8,%rdx,4),%xmm9
-  DB  233,173,254,255,255                 ; jmpq          1f07c <_sk_load_tables_sse2+0x17>
+  DB  233,173,254,255,255                 ; jmpq          1eb7f <_sk_load_tables_sse2+0x17>
   DB  102,69,15,110,12,144                ; movd          (%r8,%rdx,4),%xmm9
-  DB  233,162,254,255,255                 ; jmpq          1f07c <_sk_load_tables_sse2+0x17>
+  DB  233,162,254,255,255                 ; jmpq          1eb7f <_sk_load_tables_sse2+0x17>
 
 PUBLIC _sk_load_tables_u16_be_sse2
 _sk_load_tables_u16_be_sse2 LABEL PROC
@@ -29250,7 +29039,7 @@
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  76,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,90,1,0,0                     ; jne           1f34d <_sk_load_tables_u16_be_sse2+0x173>
+  DB  15,133,90,1,0,0                     ; jne           1ee50 <_sk_load_tables_u16_be_sse2+0x173>
   DB  102,67,15,16,4,72                   ; movupd        (%r8,%r9,2),%xmm0
   DB  243,67,15,111,76,72,16              ; movdqu        0x10(%r8,%r9,2),%xmm1
   DB  102,68,15,40,200                    ; movapd        %xmm0,%xmm9
@@ -29259,7 +29048,7 @@
   DB  102,65,15,111,201                   ; movdqa        %xmm9,%xmm1
   DB  102,15,97,200                       ; punpcklwd     %xmm0,%xmm1
   DB  102,68,15,105,200                   ; punpckhwd     %xmm0,%xmm9
-  DB  102,15,111,21,236,78,1,0            ; movdqa        0x14eec(%rip),%xmm2        # 34110 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
+  DB  102,15,111,21,201,77,1,0            ; movdqa        0x14dc9(%rip),%xmm2        # 33af0 <_sk_srcover_bgra_8888_sse2_lowp+0xf00>
   DB  102,15,112,217,238                  ; pshufd        $0xee,%xmm1,%xmm3
   DB  102,15,219,202                      ; pand          %xmm2,%xmm1
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
@@ -29320,23 +29109,23 @@
   DB  102,65,15,235,217                   ; por           %xmm9,%xmm3
   DB  102,65,15,97,216                    ; punpcklwd     %xmm8,%xmm3
   DB  15,91,219                           ; cvtdq2ps      %xmm3,%xmm3
-  DB  15,89,29,234,77,1,0                 ; mulps         0x14dea(%rip),%xmm3        # 34130 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
+  DB  15,89,29,199,76,1,0                 ; mulps         0x14cc7(%rip),%xmm3        # 33b10 <_sk_srcover_bgra_8888_sse2_lowp+0xf20>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  91                                  ; pop           %rbx
   DB  65,94                               ; pop           %r14
   DB  255,224                             ; jmpq          *%rax
   DB  242,67,15,16,4,72                   ; movsd         (%r8,%r9,2),%xmm0
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,13                              ; jne           1f366 <_sk_load_tables_u16_be_sse2+0x18c>
+  DB  117,13                              ; jne           1ee69 <_sk_load_tables_u16_be_sse2+0x18c>
   DB  243,15,126,192                      ; movq          %xmm0,%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  233,154,254,255,255                 ; jmpq          1f200 <_sk_load_tables_u16_be_sse2+0x26>
+  DB  233,154,254,255,255                 ; jmpq          1ed03 <_sk_load_tables_u16_be_sse2+0x26>
   DB  102,67,15,22,68,72,8                ; movhpd        0x8(%r8,%r9,2),%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  15,130,133,254,255,255              ; jb            1f200 <_sk_load_tables_u16_be_sse2+0x26>
+  DB  15,130,133,254,255,255              ; jb            1ed03 <_sk_load_tables_u16_be_sse2+0x26>
   DB  243,67,15,126,76,72,16              ; movq          0x10(%r8,%r9,2),%xmm1
-  DB  233,121,254,255,255                 ; jmpq          1f200 <_sk_load_tables_u16_be_sse2+0x26>
+  DB  233,121,254,255,255                 ; jmpq          1ed03 <_sk_load_tables_u16_be_sse2+0x26>
 
 PUBLIC _sk_load_tables_rgb_u16_be_sse2
 _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
@@ -29346,7 +29135,7 @@
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  76,141,12,82                        ; lea           (%rdx,%rdx,2),%r9
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,78,1,0,0                     ; jne           1f4ea <_sk_load_tables_rgb_u16_be_sse2+0x163>
+  DB  15,133,78,1,0,0                     ; jne           1efed <_sk_load_tables_rgb_u16_be_sse2+0x163>
   DB  243,67,15,111,20,72                 ; movdqu        (%r8,%r9,2),%xmm2
   DB  243,67,15,111,76,72,8               ; movdqu        0x8(%r8,%r9,2),%xmm1
   DB  102,15,115,217,4                    ; psrldq        $0x4,%xmm1
@@ -29359,7 +29148,7 @@
   DB  102,15,111,194                      ; movdqa        %xmm2,%xmm0
   DB  102,65,15,97,194                    ; punpcklwd     %xmm10,%xmm0
   DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
-  DB  102,68,15,111,5,46,77,1,0           ; movdqa        0x14d2e(%rip),%xmm8        # 34110 <_sk_srcover_bgra_8888_sse2_lowp+0xef4>
+  DB  102,68,15,111,5,11,76,1,0           ; movdqa        0x14c0b(%rip),%xmm8        # 33af0 <_sk_srcover_bgra_8888_sse2_lowp+0xf00>
   DB  102,65,15,219,192                   ; pand          %xmm8,%xmm0
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
   DB  102,65,15,97,193                    ; punpcklwd     %xmm9,%xmm0
@@ -29414,7 +29203,7 @@
   DB  65,15,20,216                        ; unpcklps      %xmm8,%xmm3
   DB  102,15,20,211                       ; unpcklpd      %xmm3,%xmm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,171,73,1,0                 ; movaps        0x149ab(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,29,136,72,1,0                 ; movaps        0x14888(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  91                                  ; pop           %rbx
   DB  65,94                               ; pop           %r14
   DB  255,224                             ; jmpq          *%rax
@@ -29422,21 +29211,21 @@
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,67,15,196,84,72,4,2             ; pinsrw        $0x2,0x4(%r8,%r9,2),%xmm2
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,14                              ; jne           1f510 <_sk_load_tables_rgb_u16_be_sse2+0x189>
+  DB  117,14                              ; jne           1f013 <_sk_load_tables_rgb_u16_be_sse2+0x189>
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  102,69,15,239,210                   ; pxor          %xmm10,%xmm10
-  DB  233,178,254,255,255                 ; jmpq          1f3c2 <_sk_load_tables_rgb_u16_be_sse2+0x3b>
+  DB  233,178,254,255,255                 ; jmpq          1eec5 <_sk_load_tables_rgb_u16_be_sse2+0x3b>
   DB  102,71,15,110,84,72,6               ; movd          0x6(%r8,%r9,2),%xmm10
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,71,15,196,84,72,10,2            ; pinsrw        $0x2,0xa(%r8,%r9,2),%xmm10
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,24                              ; jb            1f541 <_sk_load_tables_rgb_u16_be_sse2+0x1ba>
+  DB  114,24                              ; jb            1f044 <_sk_load_tables_rgb_u16_be_sse2+0x1ba>
   DB  102,67,15,110,76,72,12              ; movd          0xc(%r8,%r9,2),%xmm1
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,67,15,196,76,72,16,2            ; pinsrw        $0x2,0x10(%r8,%r9,2),%xmm1
-  DB  233,129,254,255,255                 ; jmpq          1f3c2 <_sk_load_tables_rgb_u16_be_sse2+0x3b>
+  DB  233,129,254,255,255                 ; jmpq          1eec5 <_sk_load_tables_rgb_u16_be_sse2+0x3b>
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  233,120,254,255,255                 ; jmpq          1f3c2 <_sk_load_tables_rgb_u16_be_sse2+0x3b>
+  DB  233,120,254,255,255                 ; jmpq          1eec5 <_sk_load_tables_rgb_u16_be_sse2+0x3b>
 
 PUBLIC _sk_byte_tables_sse2
 _sk_byte_tables_sse2 LABEL PROC
@@ -29447,9 +29236,9 @@
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  69,15,87,219                        ; xorps         %xmm11,%xmm11
   DB  68,15,95,216                        ; maxps         %xmm0,%xmm11
-  DB  68,15,40,13,43,73,1,0               ; movaps        0x1492b(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,13,8,72,1,0                ; movaps        0x14808(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,93,217                        ; minps         %xmm9,%xmm11
-  DB  68,15,40,21,255,73,1,0              ; movaps        0x149ff(%rip),%xmm10        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  DB  68,15,40,21,220,72,1,0              ; movaps        0x148dc(%rip),%xmm10        # 33950 <_sk_srcover_bgra_8888_sse2_lowp+0xd60>
   DB  69,15,89,218                        ; mulps         %xmm10,%xmm11
   DB  102,65,15,91,195                    ; cvtps2dq      %xmm11,%xmm0
   DB  102,73,15,126,192                   ; movq          %xmm0,%r8
@@ -29476,7 +29265,7 @@
   DB  102,65,15,96,192                    ; punpcklbw     %xmm8,%xmm0
   DB  102,65,15,97,192                    ; punpcklwd     %xmm8,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  68,15,40,29,190,74,1,0              ; movaps        0x14abe(%rip),%xmm11        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  68,15,40,29,155,73,1,0              ; movaps        0x1499b(%rip),%xmm11        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  65,15,89,195                        ; mulps         %xmm11,%xmm0
   DB  69,15,87,228                        ; xorps         %xmm12,%xmm12
   DB  68,15,95,225                        ; maxps         %xmm1,%xmm12
@@ -29578,7 +29367,7 @@
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  69,15,87,219                        ; xorps         %xmm11,%xmm11
   DB  68,15,95,216                        ; maxps         %xmm0,%xmm11
-  DB  68,15,40,21,39,71,1,0               ; movaps        0x14727(%rip),%xmm10        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,21,4,70,1,0                ; movaps        0x14604(%rip),%xmm10        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,93,218                        ; minps         %xmm10,%xmm11
   DB  69,15,89,217                        ; mulps         %xmm9,%xmm11
   DB  102,65,15,91,195                    ; cvtps2dq      %xmm11,%xmm0
@@ -29606,7 +29395,7 @@
   DB  102,65,15,96,192                    ; punpcklbw     %xmm8,%xmm0
   DB  102,65,15,97,192                    ; punpcklwd     %xmm8,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  68,15,40,29,194,72,1,0              ; movaps        0x148c2(%rip),%xmm11        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  68,15,40,29,159,71,1,0              ; movaps        0x1479f(%rip),%xmm11        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  65,15,89,195                        ; mulps         %xmm11,%xmm0
   DB  69,15,87,228                        ; xorps         %xmm12,%xmm12
   DB  68,15,95,225                        ; maxps         %xmm1,%xmm12
@@ -29678,7 +29467,7 @@
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  68,15,95,200                        ; maxps         %xmm0,%xmm9
-  DB  68,15,93,13,163,69,1,0              ; minps         0x145a3(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,93,13,128,68,1,0              ; minps         0x14480(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  102,69,15,91,193                    ; cvtps2dq      %xmm9,%xmm8
   DB  102,65,15,112,192,78                ; pshufd        $0x4e,%xmm8,%xmm0
@@ -29709,7 +29498,7 @@
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  68,15,95,201                        ; maxps         %xmm1,%xmm9
-  DB  68,15,93,13,42,69,1,0               ; minps         0x1452a(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,93,13,7,68,1,0                ; minps         0x14407(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  102,69,15,91,193                    ; cvtps2dq      %xmm9,%xmm8
   DB  102,65,15,112,200,78                ; pshufd        $0x4e,%xmm8,%xmm1
@@ -29740,7 +29529,7 @@
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  68,15,95,202                        ; maxps         %xmm2,%xmm9
-  DB  68,15,93,13,177,68,1,0              ; minps         0x144b1(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,93,13,142,67,1,0              ; minps         0x1438e(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  102,69,15,91,193                    ; cvtps2dq      %xmm9,%xmm8
   DB  102,65,15,112,208,78                ; pshufd        $0x4e,%xmm8,%xmm2
@@ -29771,7 +29560,7 @@
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  68,15,95,203                        ; maxps         %xmm3,%xmm9
-  DB  68,15,93,13,56,68,1,0               ; minps         0x14438(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,93,13,21,67,1,0               ; minps         0x14315(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  102,69,15,91,193                    ; cvtps2dq      %xmm9,%xmm8
   DB  102,65,15,112,216,78                ; pshufd        $0x4e,%xmm8,%xmm3
@@ -29813,16 +29602,16 @@
   DB  69,15,198,228,0                     ; shufps        $0x0,%xmm12,%xmm12
   DB  69,15,87,210                        ; xorps         %xmm10,%xmm10
   DB  69,15,91,217                        ; cvtdq2ps      %xmm9,%xmm11
-  DB  68,15,89,29,48,70,1,0               ; mulps         0x14630(%rip),%xmm11        # 34140 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
-  DB  68,15,40,45,56,70,1,0               ; movaps        0x14638(%rip),%xmm13        # 34150 <_sk_srcover_bgra_8888_sse2_lowp+0xf34>
+  DB  68,15,89,29,13,69,1,0               ; mulps         0x1450d(%rip),%xmm11        # 33b20 <_sk_srcover_bgra_8888_sse2_lowp+0xf30>
+  DB  68,15,40,45,21,69,1,0               ; movaps        0x14515(%rip),%xmm13        # 33b30 <_sk_srcover_bgra_8888_sse2_lowp+0xf40>
   DB  69,15,84,233                        ; andps         %xmm9,%xmm13
-  DB  68,15,86,45,92,67,1,0               ; orps          0x1435c(%rip),%xmm13        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
-  DB  68,15,88,29,52,70,1,0               ; addps         0x14634(%rip),%xmm11        # 34160 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
-  DB  68,15,40,53,60,70,1,0               ; movaps        0x1463c(%rip),%xmm14        # 34170 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
+  DB  68,15,86,45,57,66,1,0               ; orps          0x14239(%rip),%xmm13        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
+  DB  68,15,88,29,17,69,1,0               ; addps         0x14511(%rip),%xmm11        # 33b40 <_sk_srcover_bgra_8888_sse2_lowp+0xf50>
+  DB  68,15,40,53,25,69,1,0               ; movaps        0x14519(%rip),%xmm14        # 33b50 <_sk_srcover_bgra_8888_sse2_lowp+0xf60>
   DB  69,15,89,245                        ; mulps         %xmm13,%xmm14
   DB  69,15,92,222                        ; subps         %xmm14,%xmm11
-  DB  68,15,88,45,60,70,1,0               ; addps         0x1463c(%rip),%xmm13        # 34180 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
-  DB  68,15,40,53,68,70,1,0               ; movaps        0x14644(%rip),%xmm14        # 34190 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
+  DB  68,15,88,45,25,69,1,0               ; addps         0x14519(%rip),%xmm13        # 33b60 <_sk_srcover_bgra_8888_sse2_lowp+0xf70>
+  DB  68,15,40,53,33,69,1,0               ; movaps        0x14521(%rip),%xmm14        # 33b70 <_sk_srcover_bgra_8888_sse2_lowp+0xf80>
   DB  69,15,94,245                        ; divps         %xmm13,%xmm14
   DB  69,15,92,222                        ; subps         %xmm14,%xmm11
   DB  69,15,89,220                        ; mulps         %xmm12,%xmm11
@@ -29830,21 +29619,21 @@
   DB  69,15,91,236                        ; cvtdq2ps      %xmm12,%xmm13
   DB  69,15,40,243                        ; movaps        %xmm11,%xmm14
   DB  69,15,194,245,1                     ; cmpltps       %xmm13,%xmm14
-  DB  68,15,40,37,30,67,1,0               ; movaps        0x1431e(%rip),%xmm12        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,37,251,65,1,0              ; movaps        0x141fb(%rip),%xmm12        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,84,244                        ; andps         %xmm12,%xmm14
   DB  69,15,92,238                        ; subps         %xmm14,%xmm13
   DB  69,15,40,243                        ; movaps        %xmm11,%xmm14
   DB  69,15,92,245                        ; subps         %xmm13,%xmm14
-  DB  68,15,88,29,22,70,1,0               ; addps         0x14616(%rip),%xmm11        # 341a0 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
-  DB  68,15,40,45,30,70,1,0               ; movaps        0x1461e(%rip),%xmm13        # 341b0 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
+  DB  68,15,88,29,243,68,1,0              ; addps         0x144f3(%rip),%xmm11        # 33b80 <_sk_srcover_bgra_8888_sse2_lowp+0xf90>
+  DB  68,15,40,45,251,68,1,0              ; movaps        0x144fb(%rip),%xmm13        # 33b90 <_sk_srcover_bgra_8888_sse2_lowp+0xfa0>
   DB  69,15,89,238                        ; mulps         %xmm14,%xmm13
   DB  69,15,92,221                        ; subps         %xmm13,%xmm11
-  DB  68,15,40,45,30,70,1,0               ; movaps        0x1461e(%rip),%xmm13        # 341c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  DB  68,15,40,45,251,68,1,0              ; movaps        0x144fb(%rip),%xmm13        # 33ba0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb0>
   DB  69,15,92,238                        ; subps         %xmm14,%xmm13
-  DB  68,15,40,53,34,70,1,0               ; movaps        0x14622(%rip),%xmm14        # 341d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
+  DB  68,15,40,53,255,68,1,0              ; movaps        0x144ff(%rip),%xmm14        # 33bb0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc0>
   DB  69,15,94,245                        ; divps         %xmm13,%xmm14
   DB  69,15,88,243                        ; addps         %xmm11,%xmm14
-  DB  68,15,89,53,34,70,1,0               ; mulps         0x14622(%rip),%xmm14        # 341e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  DB  68,15,89,53,255,68,1,0              ; mulps         0x144ff(%rip),%xmm14        # 33bc0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd0>
   DB  102,69,15,91,222                    ; cvtps2dq      %xmm14,%xmm11
   DB  69,15,194,202,4                     ; cmpneqps      %xmm10,%xmm9
   DB  69,15,84,203                        ; andps         %xmm11,%xmm9
@@ -29881,16 +29670,16 @@
   DB  69,15,198,228,0                     ; shufps        $0x0,%xmm12,%xmm12
   DB  69,15,87,210                        ; xorps         %xmm10,%xmm10
   DB  69,15,91,217                        ; cvtdq2ps      %xmm9,%xmm11
-  DB  68,15,89,29,229,68,1,0              ; mulps         0x144e5(%rip),%xmm11        # 34140 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
-  DB  68,15,40,45,237,68,1,0              ; movaps        0x144ed(%rip),%xmm13        # 34150 <_sk_srcover_bgra_8888_sse2_lowp+0xf34>
+  DB  68,15,89,29,194,67,1,0              ; mulps         0x143c2(%rip),%xmm11        # 33b20 <_sk_srcover_bgra_8888_sse2_lowp+0xf30>
+  DB  68,15,40,45,202,67,1,0              ; movaps        0x143ca(%rip),%xmm13        # 33b30 <_sk_srcover_bgra_8888_sse2_lowp+0xf40>
   DB  69,15,84,233                        ; andps         %xmm9,%xmm13
-  DB  68,15,86,45,17,66,1,0               ; orps          0x14211(%rip),%xmm13        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
-  DB  68,15,88,29,233,68,1,0              ; addps         0x144e9(%rip),%xmm11        # 34160 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
-  DB  68,15,40,53,241,68,1,0              ; movaps        0x144f1(%rip),%xmm14        # 34170 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
+  DB  68,15,86,45,238,64,1,0              ; orps          0x140ee(%rip),%xmm13        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
+  DB  68,15,88,29,198,67,1,0              ; addps         0x143c6(%rip),%xmm11        # 33b40 <_sk_srcover_bgra_8888_sse2_lowp+0xf50>
+  DB  68,15,40,53,206,67,1,0              ; movaps        0x143ce(%rip),%xmm14        # 33b50 <_sk_srcover_bgra_8888_sse2_lowp+0xf60>
   DB  69,15,89,245                        ; mulps         %xmm13,%xmm14
   DB  69,15,92,222                        ; subps         %xmm14,%xmm11
-  DB  68,15,88,45,241,68,1,0              ; addps         0x144f1(%rip),%xmm13        # 34180 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
-  DB  68,15,40,53,249,68,1,0              ; movaps        0x144f9(%rip),%xmm14        # 34190 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
+  DB  68,15,88,45,206,67,1,0              ; addps         0x143ce(%rip),%xmm13        # 33b60 <_sk_srcover_bgra_8888_sse2_lowp+0xf70>
+  DB  68,15,40,53,214,67,1,0              ; movaps        0x143d6(%rip),%xmm14        # 33b70 <_sk_srcover_bgra_8888_sse2_lowp+0xf80>
   DB  69,15,94,245                        ; divps         %xmm13,%xmm14
   DB  69,15,92,222                        ; subps         %xmm14,%xmm11
   DB  69,15,89,220                        ; mulps         %xmm12,%xmm11
@@ -29898,21 +29687,21 @@
   DB  69,15,91,236                        ; cvtdq2ps      %xmm12,%xmm13
   DB  69,15,40,243                        ; movaps        %xmm11,%xmm14
   DB  69,15,194,245,1                     ; cmpltps       %xmm13,%xmm14
-  DB  68,15,40,37,211,65,1,0              ; movaps        0x141d3(%rip),%xmm12        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,37,176,64,1,0              ; movaps        0x140b0(%rip),%xmm12        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,84,244                        ; andps         %xmm12,%xmm14
   DB  69,15,92,238                        ; subps         %xmm14,%xmm13
   DB  69,15,40,243                        ; movaps        %xmm11,%xmm14
   DB  69,15,92,245                        ; subps         %xmm13,%xmm14
-  DB  68,15,88,29,203,68,1,0              ; addps         0x144cb(%rip),%xmm11        # 341a0 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
-  DB  68,15,40,45,211,68,1,0              ; movaps        0x144d3(%rip),%xmm13        # 341b0 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
+  DB  68,15,88,29,168,67,1,0              ; addps         0x143a8(%rip),%xmm11        # 33b80 <_sk_srcover_bgra_8888_sse2_lowp+0xf90>
+  DB  68,15,40,45,176,67,1,0              ; movaps        0x143b0(%rip),%xmm13        # 33b90 <_sk_srcover_bgra_8888_sse2_lowp+0xfa0>
   DB  69,15,89,238                        ; mulps         %xmm14,%xmm13
   DB  69,15,92,221                        ; subps         %xmm13,%xmm11
-  DB  68,15,40,45,211,68,1,0              ; movaps        0x144d3(%rip),%xmm13        # 341c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  DB  68,15,40,45,176,67,1,0              ; movaps        0x143b0(%rip),%xmm13        # 33ba0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb0>
   DB  69,15,92,238                        ; subps         %xmm14,%xmm13
-  DB  68,15,40,53,215,68,1,0              ; movaps        0x144d7(%rip),%xmm14        # 341d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
+  DB  68,15,40,53,180,67,1,0              ; movaps        0x143b4(%rip),%xmm14        # 33bb0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc0>
   DB  69,15,94,245                        ; divps         %xmm13,%xmm14
   DB  69,15,88,243                        ; addps         %xmm11,%xmm14
-  DB  68,15,89,53,215,68,1,0              ; mulps         0x144d7(%rip),%xmm14        # 341e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  DB  68,15,89,53,180,67,1,0              ; mulps         0x143b4(%rip),%xmm14        # 33bc0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd0>
   DB  102,69,15,91,222                    ; cvtps2dq      %xmm14,%xmm11
   DB  69,15,194,202,4                     ; cmpneqps      %xmm10,%xmm9
   DB  69,15,84,203                        ; andps         %xmm11,%xmm9
@@ -29949,16 +29738,16 @@
   DB  69,15,198,228,0                     ; shufps        $0x0,%xmm12,%xmm12
   DB  69,15,87,210                        ; xorps         %xmm10,%xmm10
   DB  69,15,91,217                        ; cvtdq2ps      %xmm9,%xmm11
-  DB  68,15,89,29,154,67,1,0              ; mulps         0x1439a(%rip),%xmm11        # 34140 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
-  DB  68,15,40,45,162,67,1,0              ; movaps        0x143a2(%rip),%xmm13        # 34150 <_sk_srcover_bgra_8888_sse2_lowp+0xf34>
+  DB  68,15,89,29,119,66,1,0              ; mulps         0x14277(%rip),%xmm11        # 33b20 <_sk_srcover_bgra_8888_sse2_lowp+0xf30>
+  DB  68,15,40,45,127,66,1,0              ; movaps        0x1427f(%rip),%xmm13        # 33b30 <_sk_srcover_bgra_8888_sse2_lowp+0xf40>
   DB  69,15,84,233                        ; andps         %xmm9,%xmm13
-  DB  68,15,86,45,198,64,1,0              ; orps          0x140c6(%rip),%xmm13        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
-  DB  68,15,88,29,158,67,1,0              ; addps         0x1439e(%rip),%xmm11        # 34160 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
-  DB  68,15,40,53,166,67,1,0              ; movaps        0x143a6(%rip),%xmm14        # 34170 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
+  DB  68,15,86,45,163,63,1,0              ; orps          0x13fa3(%rip),%xmm13        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
+  DB  68,15,88,29,123,66,1,0              ; addps         0x1427b(%rip),%xmm11        # 33b40 <_sk_srcover_bgra_8888_sse2_lowp+0xf50>
+  DB  68,15,40,53,131,66,1,0              ; movaps        0x14283(%rip),%xmm14        # 33b50 <_sk_srcover_bgra_8888_sse2_lowp+0xf60>
   DB  69,15,89,245                        ; mulps         %xmm13,%xmm14
   DB  69,15,92,222                        ; subps         %xmm14,%xmm11
-  DB  68,15,88,45,166,67,1,0              ; addps         0x143a6(%rip),%xmm13        # 34180 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
-  DB  68,15,40,53,174,67,1,0              ; movaps        0x143ae(%rip),%xmm14        # 34190 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
+  DB  68,15,88,45,131,66,1,0              ; addps         0x14283(%rip),%xmm13        # 33b60 <_sk_srcover_bgra_8888_sse2_lowp+0xf70>
+  DB  68,15,40,53,139,66,1,0              ; movaps        0x1428b(%rip),%xmm14        # 33b70 <_sk_srcover_bgra_8888_sse2_lowp+0xf80>
   DB  69,15,94,245                        ; divps         %xmm13,%xmm14
   DB  69,15,92,222                        ; subps         %xmm14,%xmm11
   DB  69,15,89,220                        ; mulps         %xmm12,%xmm11
@@ -29966,21 +29755,21 @@
   DB  69,15,91,236                        ; cvtdq2ps      %xmm12,%xmm13
   DB  69,15,40,243                        ; movaps        %xmm11,%xmm14
   DB  69,15,194,245,1                     ; cmpltps       %xmm13,%xmm14
-  DB  68,15,40,37,136,64,1,0              ; movaps        0x14088(%rip),%xmm12        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,37,101,63,1,0              ; movaps        0x13f65(%rip),%xmm12        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,84,244                        ; andps         %xmm12,%xmm14
   DB  69,15,92,238                        ; subps         %xmm14,%xmm13
   DB  69,15,40,243                        ; movaps        %xmm11,%xmm14
   DB  69,15,92,245                        ; subps         %xmm13,%xmm14
-  DB  68,15,88,29,128,67,1,0              ; addps         0x14380(%rip),%xmm11        # 341a0 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
-  DB  68,15,40,45,136,67,1,0              ; movaps        0x14388(%rip),%xmm13        # 341b0 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
+  DB  68,15,88,29,93,66,1,0               ; addps         0x1425d(%rip),%xmm11        # 33b80 <_sk_srcover_bgra_8888_sse2_lowp+0xf90>
+  DB  68,15,40,45,101,66,1,0              ; movaps        0x14265(%rip),%xmm13        # 33b90 <_sk_srcover_bgra_8888_sse2_lowp+0xfa0>
   DB  69,15,89,238                        ; mulps         %xmm14,%xmm13
   DB  69,15,92,221                        ; subps         %xmm13,%xmm11
-  DB  68,15,40,45,136,67,1,0              ; movaps        0x14388(%rip),%xmm13        # 341c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  DB  68,15,40,45,101,66,1,0              ; movaps        0x14265(%rip),%xmm13        # 33ba0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb0>
   DB  69,15,92,238                        ; subps         %xmm14,%xmm13
-  DB  68,15,40,53,140,67,1,0              ; movaps        0x1438c(%rip),%xmm14        # 341d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
+  DB  68,15,40,53,105,66,1,0              ; movaps        0x14269(%rip),%xmm14        # 33bb0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc0>
   DB  69,15,94,245                        ; divps         %xmm13,%xmm14
   DB  69,15,88,243                        ; addps         %xmm11,%xmm14
-  DB  68,15,89,53,140,67,1,0              ; mulps         0x1438c(%rip),%xmm14        # 341e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  DB  68,15,89,53,105,66,1,0              ; mulps         0x14269(%rip),%xmm14        # 33bc0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd0>
   DB  102,69,15,91,222                    ; cvtps2dq      %xmm14,%xmm11
   DB  69,15,194,202,4                     ; cmpneqps      %xmm10,%xmm9
   DB  69,15,84,203                        ; andps         %xmm11,%xmm9
@@ -30017,16 +29806,16 @@
   DB  69,15,198,228,0                     ; shufps        $0x0,%xmm12,%xmm12
   DB  69,15,87,210                        ; xorps         %xmm10,%xmm10
   DB  69,15,91,217                        ; cvtdq2ps      %xmm9,%xmm11
-  DB  68,15,89,29,79,66,1,0               ; mulps         0x1424f(%rip),%xmm11        # 34140 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
-  DB  68,15,40,45,87,66,1,0               ; movaps        0x14257(%rip),%xmm13        # 34150 <_sk_srcover_bgra_8888_sse2_lowp+0xf34>
+  DB  68,15,89,29,44,65,1,0               ; mulps         0x1412c(%rip),%xmm11        # 33b20 <_sk_srcover_bgra_8888_sse2_lowp+0xf30>
+  DB  68,15,40,45,52,65,1,0               ; movaps        0x14134(%rip),%xmm13        # 33b30 <_sk_srcover_bgra_8888_sse2_lowp+0xf40>
   DB  69,15,84,233                        ; andps         %xmm9,%xmm13
-  DB  68,15,86,45,123,63,1,0              ; orps          0x13f7b(%rip),%xmm13        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
-  DB  68,15,88,29,83,66,1,0               ; addps         0x14253(%rip),%xmm11        # 34160 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
-  DB  68,15,40,53,91,66,1,0               ; movaps        0x1425b(%rip),%xmm14        # 34170 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
+  DB  68,15,86,45,88,62,1,0               ; orps          0x13e58(%rip),%xmm13        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
+  DB  68,15,88,29,48,65,1,0               ; addps         0x14130(%rip),%xmm11        # 33b40 <_sk_srcover_bgra_8888_sse2_lowp+0xf50>
+  DB  68,15,40,53,56,65,1,0               ; movaps        0x14138(%rip),%xmm14        # 33b50 <_sk_srcover_bgra_8888_sse2_lowp+0xf60>
   DB  69,15,89,245                        ; mulps         %xmm13,%xmm14
   DB  69,15,92,222                        ; subps         %xmm14,%xmm11
-  DB  68,15,88,45,91,66,1,0               ; addps         0x1425b(%rip),%xmm13        # 34180 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
-  DB  68,15,40,53,99,66,1,0               ; movaps        0x14263(%rip),%xmm14        # 34190 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
+  DB  68,15,88,45,56,65,1,0               ; addps         0x14138(%rip),%xmm13        # 33b60 <_sk_srcover_bgra_8888_sse2_lowp+0xf70>
+  DB  68,15,40,53,64,65,1,0               ; movaps        0x14140(%rip),%xmm14        # 33b70 <_sk_srcover_bgra_8888_sse2_lowp+0xf80>
   DB  69,15,94,245                        ; divps         %xmm13,%xmm14
   DB  69,15,92,222                        ; subps         %xmm14,%xmm11
   DB  69,15,89,220                        ; mulps         %xmm12,%xmm11
@@ -30034,21 +29823,21 @@
   DB  69,15,91,236                        ; cvtdq2ps      %xmm12,%xmm13
   DB  69,15,40,243                        ; movaps        %xmm11,%xmm14
   DB  69,15,194,245,1                     ; cmpltps       %xmm13,%xmm14
-  DB  68,15,40,37,61,63,1,0               ; movaps        0x13f3d(%rip),%xmm12        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,37,26,62,1,0               ; movaps        0x13e1a(%rip),%xmm12        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,84,244                        ; andps         %xmm12,%xmm14
   DB  69,15,92,238                        ; subps         %xmm14,%xmm13
   DB  69,15,40,243                        ; movaps        %xmm11,%xmm14
   DB  69,15,92,245                        ; subps         %xmm13,%xmm14
-  DB  68,15,88,29,53,66,1,0               ; addps         0x14235(%rip),%xmm11        # 341a0 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
-  DB  68,15,40,45,61,66,1,0               ; movaps        0x1423d(%rip),%xmm13        # 341b0 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
+  DB  68,15,88,29,18,65,1,0               ; addps         0x14112(%rip),%xmm11        # 33b80 <_sk_srcover_bgra_8888_sse2_lowp+0xf90>
+  DB  68,15,40,45,26,65,1,0               ; movaps        0x1411a(%rip),%xmm13        # 33b90 <_sk_srcover_bgra_8888_sse2_lowp+0xfa0>
   DB  69,15,89,238                        ; mulps         %xmm14,%xmm13
   DB  69,15,92,221                        ; subps         %xmm13,%xmm11
-  DB  68,15,40,45,61,66,1,0               ; movaps        0x1423d(%rip),%xmm13        # 341c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  DB  68,15,40,45,26,65,1,0               ; movaps        0x1411a(%rip),%xmm13        # 33ba0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb0>
   DB  69,15,92,238                        ; subps         %xmm14,%xmm13
-  DB  68,15,40,53,65,66,1,0               ; movaps        0x14241(%rip),%xmm14        # 341d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
+  DB  68,15,40,53,30,65,1,0               ; movaps        0x1411e(%rip),%xmm14        # 33bb0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc0>
   DB  69,15,94,245                        ; divps         %xmm13,%xmm14
   DB  69,15,88,243                        ; addps         %xmm11,%xmm14
-  DB  68,15,89,53,65,66,1,0               ; mulps         0x14241(%rip),%xmm14        # 341e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  DB  68,15,89,53,30,65,1,0               ; mulps         0x1411e(%rip),%xmm14        # 33bc0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd0>
   DB  102,69,15,91,222                    ; cvtps2dq      %xmm14,%xmm11
   DB  69,15,194,202,4                     ; cmpneqps      %xmm10,%xmm9
   DB  69,15,84,203                        ; andps         %xmm11,%xmm9
@@ -30075,21 +29864,21 @@
   DB  68,15,40,209                        ; movaps        %xmm1,%xmm10
   DB  15,40,224                           ; movaps        %xmm0,%xmm4
   DB  15,91,244                           ; cvtdq2ps      %xmm4,%xmm6
-  DB  15,40,5,59,65,1,0                   ; movaps        0x1413b(%rip),%xmm0        # 34140 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
+  DB  15,40,5,24,64,1,0                   ; movaps        0x14018(%rip),%xmm0        # 33b20 <_sk_srcover_bgra_8888_sse2_lowp+0xf30>
   DB  15,89,240                           ; mulps         %xmm0,%xmm6
   DB  15,40,232                           ; movaps        %xmm0,%xmm5
-  DB  68,15,40,5,61,65,1,0                ; movaps        0x1413d(%rip),%xmm8        # 34150 <_sk_srcover_bgra_8888_sse2_lowp+0xf34>
+  DB  68,15,40,5,26,64,1,0                ; movaps        0x1401a(%rip),%xmm8        # 33b30 <_sk_srcover_bgra_8888_sse2_lowp+0xf40>
   DB  15,40,196                           ; movaps        %xmm4,%xmm0
   DB  65,15,84,192                        ; andps         %xmm8,%xmm0
-  DB  15,86,5,95,62,1,0                   ; orps          0x13e5f(%rip),%xmm0        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
-  DB  15,88,53,56,65,1,0                  ; addps         0x14138(%rip),%xmm6        # 34160 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
-  DB  68,15,40,29,64,65,1,0               ; movaps        0x14140(%rip),%xmm11        # 34170 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
+  DB  15,86,5,60,61,1,0                   ; orps          0x13d3c(%rip),%xmm0        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
+  DB  15,88,53,21,64,1,0                  ; addps         0x14015(%rip),%xmm6        # 33b40 <_sk_srcover_bgra_8888_sse2_lowp+0xf50>
+  DB  68,15,40,29,29,64,1,0               ; movaps        0x1401d(%rip),%xmm11        # 33b50 <_sk_srcover_bgra_8888_sse2_lowp+0xf60>
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  65,15,89,203                        ; mulps         %xmm11,%xmm1
   DB  15,92,241                           ; subps         %xmm1,%xmm6
-  DB  68,15,40,61,62,65,1,0               ; movaps        0x1413e(%rip),%xmm15        # 34180 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  DB  68,15,40,61,27,64,1,0               ; movaps        0x1401b(%rip),%xmm15        # 33b60 <_sk_srcover_bgra_8888_sse2_lowp+0xf70>
   DB  65,15,88,199                        ; addps         %xmm15,%xmm0
-  DB  68,15,40,45,66,65,1,0               ; movaps        0x14142(%rip),%xmm13        # 34190 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
+  DB  68,15,40,45,31,64,1,0               ; movaps        0x1401f(%rip),%xmm13        # 33b70 <_sk_srcover_bgra_8888_sse2_lowp+0xf80>
   DB  65,15,40,205                        ; movaps        %xmm13,%xmm1
   DB  15,94,200                           ; divps         %xmm0,%xmm1
   DB  15,92,241                           ; subps         %xmm1,%xmm6
@@ -30101,23 +29890,23 @@
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
   DB  15,40,206                           ; movaps        %xmm6,%xmm1
   DB  15,194,200,1                        ; cmpltps       %xmm0,%xmm1
-  DB  15,84,13,22,62,1,0                  ; andps         0x13e16(%rip),%xmm1        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,84,13,243,60,1,0                 ; andps         0x13cf3(%rip),%xmm1        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,92,193                           ; subps         %xmm1,%xmm0
   DB  15,40,206                           ; movaps        %xmm6,%xmm1
   DB  15,92,200                           ; subps         %xmm0,%xmm1
-  DB  15,88,53,22,65,1,0                  ; addps         0x14116(%rip),%xmm6        # 341a0 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
-  DB  15,40,21,47,65,1,0                  ; movaps        0x1412f(%rip),%xmm2        # 341c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  DB  15,88,53,243,63,1,0                 ; addps         0x13ff3(%rip),%xmm6        # 33b80 <_sk_srcover_bgra_8888_sse2_lowp+0xf90>
+  DB  15,40,21,12,64,1,0                  ; movaps        0x1400c(%rip),%xmm2        # 33ba0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb0>
   DB  68,15,40,202                        ; movaps        %xmm2,%xmm9
   DB  68,15,92,201                        ; subps         %xmm1,%xmm9
   DB  15,40,193                           ; movaps        %xmm1,%xmm0
-  DB  15,40,13,13,65,1,0                  ; movaps        0x1410d(%rip),%xmm1        # 341b0 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
+  DB  15,40,13,234,63,1,0                 ; movaps        0x13fea(%rip),%xmm1        # 33b90 <_sk_srcover_bgra_8888_sse2_lowp+0xfa0>
   DB  15,89,193                           ; mulps         %xmm1,%xmm0
   DB  15,92,240                           ; subps         %xmm0,%xmm6
-  DB  68,15,40,53,31,65,1,0               ; movaps        0x1411f(%rip),%xmm14        # 341d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
+  DB  68,15,40,53,252,63,1,0              ; movaps        0x13ffc(%rip),%xmm14        # 33bb0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc0>
   DB  65,15,40,198                        ; movaps        %xmm14,%xmm0
   DB  65,15,94,193                        ; divps         %xmm9,%xmm0
   DB  15,88,198                           ; addps         %xmm6,%xmm0
-  DB  68,15,40,13,28,65,1,0               ; movaps        0x1411c(%rip),%xmm9        # 341e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  DB  68,15,40,13,249,63,1,0              ; movaps        0x13ff9(%rip),%xmm9        # 33bc0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd0>
   DB  65,15,89,193                        ; mulps         %xmm9,%xmm0
   DB  102,15,91,192                       ; cvtps2dq      %xmm0,%xmm0
   DB  15,87,246                           ; xorps         %xmm6,%xmm6
@@ -30127,9 +29916,9 @@
   DB  15,89,197                           ; mulps         %xmm5,%xmm0
   DB  65,15,40,250                        ; movaps        %xmm10,%xmm7
   DB  65,15,84,248                        ; andps         %xmm8,%xmm7
-  DB  15,40,53,148,61,1,0                 ; movaps        0x13d94(%rip),%xmm6        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  15,40,53,113,60,1,0                 ; movaps        0x13c71(%rip),%xmm6        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  15,86,254                           ; orps          %xmm6,%xmm7
-  DB  15,88,5,106,64,1,0                  ; addps         0x1406a(%rip),%xmm0        # 34160 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
+  DB  15,88,5,71,63,1,0                   ; addps         0x13f47(%rip),%xmm0        # 33b40 <_sk_srcover_bgra_8888_sse2_lowp+0xf50>
   DB  15,40,239                           ; movaps        %xmm7,%xmm5
   DB  65,15,89,235                        ; mulps         %xmm11,%xmm5
   DB  15,92,197                           ; subps         %xmm5,%xmm0
@@ -30142,12 +29931,12 @@
   DB  15,91,237                           ; cvtdq2ps      %xmm5,%xmm5
   DB  15,40,248                           ; movaps        %xmm0,%xmm7
   DB  15,194,253,1                        ; cmpltps       %xmm5,%xmm7
-  DB  68,15,40,61,105,61,1,0              ; movaps        0x13d69(%rip),%xmm15        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,61,70,60,1,0               ; movaps        0x13c46(%rip),%xmm15        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  65,15,84,255                        ; andps         %xmm15,%xmm7
   DB  15,92,239                           ; subps         %xmm7,%xmm5
   DB  15,40,248                           ; movaps        %xmm0,%xmm7
   DB  15,92,253                           ; subps         %xmm5,%xmm7
-  DB  15,88,5,101,64,1,0                  ; addps         0x14065(%rip),%xmm0        # 341a0 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  DB  15,88,5,66,63,1,0                   ; addps         0x13f42(%rip),%xmm0        # 33b80 <_sk_srcover_bgra_8888_sse2_lowp+0xf90>
   DB  15,40,234                           ; movaps        %xmm2,%xmm5
   DB  15,92,239                           ; subps         %xmm7,%xmm5
   DB  15,89,249                           ; mulps         %xmm1,%xmm7
@@ -30161,13 +29950,13 @@
   DB  68,15,194,215,4                     ; cmpneqps      %xmm7,%xmm10
   DB  68,15,84,208                        ; andps         %xmm0,%xmm10
   DB  65,15,91,196                        ; cvtdq2ps      %xmm12,%xmm0
-  DB  15,89,5,208,63,1,0                  ; mulps         0x13fd0(%rip),%xmm0        # 34140 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
+  DB  15,89,5,173,62,1,0                  ; mulps         0x13ead(%rip),%xmm0        # 33b20 <_sk_srcover_bgra_8888_sse2_lowp+0xf30>
   DB  69,15,84,196                        ; andps         %xmm12,%xmm8
   DB  68,15,86,198                        ; orps          %xmm6,%xmm8
-  DB  15,88,5,225,63,1,0                  ; addps         0x13fe1(%rip),%xmm0        # 34160 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
+  DB  15,88,5,190,62,1,0                  ; addps         0x13ebe(%rip),%xmm0        # 33b40 <_sk_srcover_bgra_8888_sse2_lowp+0xf50>
   DB  69,15,89,216                        ; mulps         %xmm8,%xmm11
   DB  65,15,92,195                        ; subps         %xmm11,%xmm0
-  DB  68,15,88,5,241,63,1,0               ; addps         0x13ff1(%rip),%xmm8        # 34180 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  DB  68,15,88,5,206,62,1,0               ; addps         0x13ece(%rip),%xmm8        # 33b60 <_sk_srcover_bgra_8888_sse2_lowp+0xf70>
   DB  69,15,94,232                        ; divps         %xmm8,%xmm13
   DB  65,15,92,197                        ; subps         %xmm13,%xmm0
   DB  15,89,195                           ; mulps         %xmm3,%xmm0
@@ -30179,7 +29968,7 @@
   DB  15,92,221                           ; subps         %xmm5,%xmm3
   DB  15,40,232                           ; movaps        %xmm0,%xmm5
   DB  15,92,235                           ; subps         %xmm3,%xmm5
-  DB  15,88,5,228,63,1,0                  ; addps         0x13fe4(%rip),%xmm0        # 341a0 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  DB  15,88,5,193,62,1,0                  ; addps         0x13ec1(%rip),%xmm0        # 33b80 <_sk_srcover_bgra_8888_sse2_lowp+0xf90>
   DB  15,89,205                           ; mulps         %xmm5,%xmm1
   DB  15,92,193                           ; subps         %xmm1,%xmm0
   DB  15,92,213                           ; subps         %xmm5,%xmm2
@@ -30213,21 +30002,21 @@
   DB  15,41,76,36,16                      ; movaps        %xmm1,0x10(%rsp)
   DB  15,41,4,36                          ; movaps        %xmm0,(%rsp)
   DB  15,91,221                           ; cvtdq2ps      %xmm5,%xmm3
-  DB  15,40,5,5,63,1,0                    ; movaps        0x13f05(%rip),%xmm0        # 34140 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
+  DB  15,40,5,226,61,1,0                  ; movaps        0x13de2(%rip),%xmm0        # 33b20 <_sk_srcover_bgra_8888_sse2_lowp+0xf30>
   DB  15,89,216                           ; mulps         %xmm0,%xmm3
   DB  15,40,240                           ; movaps        %xmm0,%xmm6
-  DB  68,15,40,5,7,63,1,0                 ; movaps        0x13f07(%rip),%xmm8        # 34150 <_sk_srcover_bgra_8888_sse2_lowp+0xf34>
+  DB  68,15,40,5,228,61,1,0               ; movaps        0x13de4(%rip),%xmm8        # 33b30 <_sk_srcover_bgra_8888_sse2_lowp+0xf40>
   DB  15,40,197                           ; movaps        %xmm5,%xmm0
   DB  65,15,84,192                        ; andps         %xmm8,%xmm0
-  DB  15,86,5,41,60,1,0                   ; orps          0x13c29(%rip),%xmm0        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
-  DB  15,88,29,2,63,1,0                   ; addps         0x13f02(%rip),%xmm3        # 34160 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
-  DB  68,15,40,29,10,63,1,0               ; movaps        0x13f0a(%rip),%xmm11        # 34170 <_sk_srcover_bgra_8888_sse2_lowp+0xf54>
+  DB  15,86,5,6,59,1,0                    ; orps          0x13b06(%rip),%xmm0        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
+  DB  15,88,29,223,61,1,0                 ; addps         0x13ddf(%rip),%xmm3        # 33b40 <_sk_srcover_bgra_8888_sse2_lowp+0xf50>
+  DB  68,15,40,29,231,61,1,0              ; movaps        0x13de7(%rip),%xmm11        # 33b50 <_sk_srcover_bgra_8888_sse2_lowp+0xf60>
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  65,15,89,203                        ; mulps         %xmm11,%xmm1
   DB  15,92,217                           ; subps         %xmm1,%xmm3
-  DB  68,15,40,61,8,63,1,0                ; movaps        0x13f08(%rip),%xmm15        # 34180 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  DB  68,15,40,61,229,61,1,0              ; movaps        0x13de5(%rip),%xmm15        # 33b60 <_sk_srcover_bgra_8888_sse2_lowp+0xf70>
   DB  65,15,88,199                        ; addps         %xmm15,%xmm0
-  DB  68,15,40,45,12,63,1,0               ; movaps        0x13f0c(%rip),%xmm13        # 34190 <_sk_srcover_bgra_8888_sse2_lowp+0xf74>
+  DB  68,15,40,45,233,61,1,0              ; movaps        0x13de9(%rip),%xmm13        # 33b70 <_sk_srcover_bgra_8888_sse2_lowp+0xf80>
   DB  65,15,40,205                        ; movaps        %xmm13,%xmm1
   DB  15,94,200                           ; divps         %xmm0,%xmm1
   DB  15,92,217                           ; subps         %xmm1,%xmm3
@@ -30239,23 +30028,23 @@
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
   DB  15,40,203                           ; movaps        %xmm3,%xmm1
   DB  15,194,200,1                        ; cmpltps       %xmm0,%xmm1
-  DB  15,84,13,224,59,1,0                 ; andps         0x13be0(%rip),%xmm1        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,84,13,189,58,1,0                 ; andps         0x13abd(%rip),%xmm1        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,92,193                           ; subps         %xmm1,%xmm0
   DB  15,40,203                           ; movaps        %xmm3,%xmm1
   DB  15,92,200                           ; subps         %xmm0,%xmm1
-  DB  15,88,29,224,62,1,0                 ; addps         0x13ee0(%rip),%xmm3        # 341a0 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
-  DB  15,40,21,249,62,1,0                 ; movaps        0x13ef9(%rip),%xmm2        # 341c0 <_sk_srcover_bgra_8888_sse2_lowp+0xfa4>
+  DB  15,88,29,189,61,1,0                 ; addps         0x13dbd(%rip),%xmm3        # 33b80 <_sk_srcover_bgra_8888_sse2_lowp+0xf90>
+  DB  15,40,21,214,61,1,0                 ; movaps        0x13dd6(%rip),%xmm2        # 33ba0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb0>
   DB  68,15,40,202                        ; movaps        %xmm2,%xmm9
   DB  68,15,92,201                        ; subps         %xmm1,%xmm9
   DB  15,40,193                           ; movaps        %xmm1,%xmm0
-  DB  15,40,13,215,62,1,0                 ; movaps        0x13ed7(%rip),%xmm1        # 341b0 <_sk_srcover_bgra_8888_sse2_lowp+0xf94>
+  DB  15,40,13,180,61,1,0                 ; movaps        0x13db4(%rip),%xmm1        # 33b90 <_sk_srcover_bgra_8888_sse2_lowp+0xfa0>
   DB  15,89,193                           ; mulps         %xmm1,%xmm0
   DB  15,92,216                           ; subps         %xmm0,%xmm3
-  DB  68,15,40,53,233,62,1,0              ; movaps        0x13ee9(%rip),%xmm14        # 341d0 <_sk_srcover_bgra_8888_sse2_lowp+0xfb4>
+  DB  68,15,40,53,198,61,1,0              ; movaps        0x13dc6(%rip),%xmm14        # 33bb0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc0>
   DB  65,15,40,198                        ; movaps        %xmm14,%xmm0
   DB  65,15,94,193                        ; divps         %xmm9,%xmm0
   DB  15,88,195                           ; addps         %xmm3,%xmm0
-  DB  68,15,40,13,230,62,1,0              ; movaps        0x13ee6(%rip),%xmm9        # 341e0 <_sk_srcover_bgra_8888_sse2_lowp+0xfc4>
+  DB  68,15,40,13,195,61,1,0              ; movaps        0x13dc3(%rip),%xmm9        # 33bc0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd0>
   DB  65,15,89,193                        ; mulps         %xmm9,%xmm0
   DB  102,15,91,192                       ; cvtps2dq      %xmm0,%xmm0
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
@@ -30265,9 +30054,9 @@
   DB  15,89,198                           ; mulps         %xmm6,%xmm0
   DB  65,15,40,250                        ; movaps        %xmm10,%xmm7
   DB  65,15,84,248                        ; andps         %xmm8,%xmm7
-  DB  15,40,29,94,59,1,0                  ; movaps        0x13b5e(%rip),%xmm3        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  15,40,29,59,58,1,0                  ; movaps        0x13a3b(%rip),%xmm3        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  15,86,251                           ; orps          %xmm3,%xmm7
-  DB  15,88,5,52,62,1,0                   ; addps         0x13e34(%rip),%xmm0        # 34160 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
+  DB  15,88,5,17,61,1,0                   ; addps         0x13d11(%rip),%xmm0        # 33b40 <_sk_srcover_bgra_8888_sse2_lowp+0xf50>
   DB  15,40,247                           ; movaps        %xmm7,%xmm6
   DB  65,15,89,243                        ; mulps         %xmm11,%xmm6
   DB  15,92,198                           ; subps         %xmm6,%xmm0
@@ -30280,12 +30069,12 @@
   DB  15,91,246                           ; cvtdq2ps      %xmm6,%xmm6
   DB  15,40,248                           ; movaps        %xmm0,%xmm7
   DB  15,194,254,1                        ; cmpltps       %xmm6,%xmm7
-  DB  68,15,40,61,51,59,1,0               ; movaps        0x13b33(%rip),%xmm15        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,61,16,58,1,0               ; movaps        0x13a10(%rip),%xmm15        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  65,15,84,255                        ; andps         %xmm15,%xmm7
   DB  15,92,247                           ; subps         %xmm7,%xmm6
   DB  15,40,248                           ; movaps        %xmm0,%xmm7
   DB  15,92,254                           ; subps         %xmm6,%xmm7
-  DB  15,88,5,47,62,1,0                   ; addps         0x13e2f(%rip),%xmm0        # 341a0 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  DB  15,88,5,12,61,1,0                   ; addps         0x13d0c(%rip),%xmm0        # 33b80 <_sk_srcover_bgra_8888_sse2_lowp+0xf90>
   DB  15,40,242                           ; movaps        %xmm2,%xmm6
   DB  15,92,247                           ; subps         %xmm7,%xmm6
   DB  15,89,249                           ; mulps         %xmm1,%xmm7
@@ -30299,13 +30088,13 @@
   DB  68,15,194,215,4                     ; cmpneqps      %xmm7,%xmm10
   DB  68,15,84,208                        ; andps         %xmm0,%xmm10
   DB  65,15,91,196                        ; cvtdq2ps      %xmm12,%xmm0
-  DB  15,89,5,154,61,1,0                  ; mulps         0x13d9a(%rip),%xmm0        # 34140 <_sk_srcover_bgra_8888_sse2_lowp+0xf24>
+  DB  15,89,5,119,60,1,0                  ; mulps         0x13c77(%rip),%xmm0        # 33b20 <_sk_srcover_bgra_8888_sse2_lowp+0xf30>
   DB  69,15,84,196                        ; andps         %xmm12,%xmm8
   DB  68,15,86,195                        ; orps          %xmm3,%xmm8
-  DB  15,88,5,171,61,1,0                  ; addps         0x13dab(%rip),%xmm0        # 34160 <_sk_srcover_bgra_8888_sse2_lowp+0xf44>
+  DB  15,88,5,136,60,1,0                  ; addps         0x13c88(%rip),%xmm0        # 33b40 <_sk_srcover_bgra_8888_sse2_lowp+0xf50>
   DB  69,15,89,216                        ; mulps         %xmm8,%xmm11
   DB  65,15,92,195                        ; subps         %xmm11,%xmm0
-  DB  68,15,88,5,187,61,1,0               ; addps         0x13dbb(%rip),%xmm8        # 34180 <_sk_srcover_bgra_8888_sse2_lowp+0xf64>
+  DB  68,15,88,5,152,60,1,0               ; addps         0x13c98(%rip),%xmm8        # 33b60 <_sk_srcover_bgra_8888_sse2_lowp+0xf70>
   DB  69,15,94,232                        ; divps         %xmm8,%xmm13
   DB  65,15,92,197                        ; subps         %xmm13,%xmm0
   DB  15,89,196                           ; mulps         %xmm4,%xmm0
@@ -30317,7 +30106,7 @@
   DB  15,92,230                           ; subps         %xmm6,%xmm4
   DB  15,40,240                           ; movaps        %xmm0,%xmm6
   DB  15,92,244                           ; subps         %xmm4,%xmm6
-  DB  15,88,5,174,61,1,0                  ; addps         0x13dae(%rip),%xmm0        # 341a0 <_sk_srcover_bgra_8888_sse2_lowp+0xf84>
+  DB  15,88,5,139,60,1,0                  ; addps         0x13c8b(%rip),%xmm0        # 33b80 <_sk_srcover_bgra_8888_sse2_lowp+0xf90>
   DB  15,89,206                           ; mulps         %xmm6,%xmm1
   DB  15,92,193                           ; subps         %xmm1,%xmm0
   DB  15,92,214                           ; subps         %xmm6,%xmm2
@@ -30341,29 +30130,29 @@
 
 PUBLIC _sk_lab_to_xyz_sse2
 _sk_lab_to_xyz_sse2 LABEL PROC
-  DB  15,89,5,169,61,1,0                  ; mulps         0x13da9(%rip),%xmm0        # 341f0 <_sk_srcover_bgra_8888_sse2_lowp+0xfd4>
-  DB  68,15,40,5,33,59,1,0                ; movaps        0x13b21(%rip),%xmm8        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  DB  15,89,5,134,60,1,0                  ; mulps         0x13c86(%rip),%xmm0        # 33bd0 <_sk_srcover_bgra_8888_sse2_lowp+0xfe0>
+  DB  68,15,40,5,254,57,1,0               ; movaps        0x139fe(%rip),%xmm8        # 33950 <_sk_srcover_bgra_8888_sse2_lowp+0xd60>
   DB  65,15,89,200                        ; mulps         %xmm8,%xmm1
-  DB  68,15,40,13,165,61,1,0              ; movaps        0x13da5(%rip),%xmm9        # 34200 <_sk_srcover_bgra_8888_sse2_lowp+0xfe4>
+  DB  68,15,40,13,130,60,1,0              ; movaps        0x13c82(%rip),%xmm9        # 33be0 <_sk_srcover_bgra_8888_sse2_lowp+0xff0>
   DB  65,15,88,201                        ; addps         %xmm9,%xmm1
   DB  65,15,89,208                        ; mulps         %xmm8,%xmm2
   DB  65,15,88,209                        ; addps         %xmm9,%xmm2
-  DB  15,88,5,162,61,1,0                  ; addps         0x13da2(%rip),%xmm0        # 34210 <_sk_srcover_bgra_8888_sse2_lowp+0xff4>
-  DB  15,89,5,171,61,1,0                  ; mulps         0x13dab(%rip),%xmm0        # 34220 <_sk_srcover_bgra_8888_sse2_lowp+0x1004>
-  DB  15,89,13,180,61,1,0                 ; mulps         0x13db4(%rip),%xmm1        # 34230 <_sk_srcover_bgra_8888_sse2_lowp+0x1014>
+  DB  15,88,5,127,60,1,0                  ; addps         0x13c7f(%rip),%xmm0        # 33bf0 <_sk_srcover_bgra_8888_sse2_lowp+0x1000>
+  DB  15,89,5,136,60,1,0                  ; mulps         0x13c88(%rip),%xmm0        # 33c00 <_sk_srcover_bgra_8888_sse2_lowp+0x1010>
+  DB  15,89,13,145,60,1,0                 ; mulps         0x13c91(%rip),%xmm1        # 33c10 <_sk_srcover_bgra_8888_sse2_lowp+0x1020>
   DB  15,88,200                           ; addps         %xmm0,%xmm1
-  DB  15,89,21,186,61,1,0                 ; mulps         0x13dba(%rip),%xmm2        # 34240 <_sk_srcover_bgra_8888_sse2_lowp+0x1024>
+  DB  15,89,21,151,60,1,0                 ; mulps         0x13c97(%rip),%xmm2        # 33c20 <_sk_srcover_bgra_8888_sse2_lowp+0x1030>
   DB  68,15,40,200                        ; movaps        %xmm0,%xmm9
   DB  68,15,92,202                        ; subps         %xmm2,%xmm9
   DB  68,15,40,225                        ; movaps        %xmm1,%xmm12
   DB  69,15,89,228                        ; mulps         %xmm12,%xmm12
   DB  68,15,89,225                        ; mulps         %xmm1,%xmm12
-  DB  15,40,21,175,61,1,0                 ; movaps        0x13daf(%rip),%xmm2        # 34250 <_sk_srcover_bgra_8888_sse2_lowp+0x1034>
+  DB  15,40,21,140,60,1,0                 ; movaps        0x13c8c(%rip),%xmm2        # 33c30 <_sk_srcover_bgra_8888_sse2_lowp+0x1040>
   DB  68,15,40,194                        ; movaps        %xmm2,%xmm8
   DB  69,15,194,196,1                     ; cmpltps       %xmm12,%xmm8
-  DB  68,15,40,21,174,61,1,0              ; movaps        0x13dae(%rip),%xmm10        # 34260 <_sk_srcover_bgra_8888_sse2_lowp+0x1044>
+  DB  68,15,40,21,139,60,1,0              ; movaps        0x13c8b(%rip),%xmm10        # 33c40 <_sk_srcover_bgra_8888_sse2_lowp+0x1050>
   DB  65,15,88,202                        ; addps         %xmm10,%xmm1
-  DB  68,15,40,29,178,61,1,0              ; movaps        0x13db2(%rip),%xmm11        # 34270 <_sk_srcover_bgra_8888_sse2_lowp+0x1054>
+  DB  68,15,40,29,143,60,1,0              ; movaps        0x13c8f(%rip),%xmm11        # 33c50 <_sk_srcover_bgra_8888_sse2_lowp+0x1060>
   DB  65,15,89,203                        ; mulps         %xmm11,%xmm1
   DB  69,15,84,224                        ; andps         %xmm8,%xmm12
   DB  68,15,85,193                        ; andnps        %xmm1,%xmm8
@@ -30387,8 +30176,8 @@
   DB  15,84,194                           ; andps         %xmm2,%xmm0
   DB  65,15,85,209                        ; andnps        %xmm9,%xmm2
   DB  15,86,208                           ; orps          %xmm0,%xmm2
-  DB  68,15,89,5,98,61,1,0                ; mulps         0x13d62(%rip),%xmm8        # 34280 <_sk_srcover_bgra_8888_sse2_lowp+0x1064>
-  DB  15,89,21,107,61,1,0                 ; mulps         0x13d6b(%rip),%xmm2        # 34290 <_sk_srcover_bgra_8888_sse2_lowp+0x1074>
+  DB  68,15,89,5,63,60,1,0                ; mulps         0x13c3f(%rip),%xmm8        # 33c60 <_sk_srcover_bgra_8888_sse2_lowp+0x1070>
+  DB  15,89,21,72,60,1,0                  ; mulps         0x13c48(%rip),%xmm2        # 33c70 <_sk_srcover_bgra_8888_sse2_lowp+0x1080>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  255,224                             ; jmpq          *%rax
@@ -30396,88 +30185,84 @@
 PUBLIC _sk_load_a8_sse2
 _sk_load_a8_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,46                              ; jne           20573 <_sk_load_a8_sse2+0x46>
-  DB  102,67,15,110,4,16                  ; movd          (%r8,%r10,1),%xmm0
+  DB  117,46                              ; jne           20070 <_sk_load_a8_sse2+0x40>
+  DB  102,65,15,110,4,16                  ; movd          (%r8,%rdx,1),%xmm0
   DB  102,15,96,192                       ; punpcklbw     %xmm0,%xmm0
   DB  102,15,97,192                       ; punpcklwd     %xmm0,%xmm0
-  DB  102,15,219,5,229,57,1,0             ; pand          0x139e5(%rip),%xmm0        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  102,15,219,5,200,56,1,0             ; pand          0x138c8(%rip),%xmm0        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  15,91,216                           ; cvtdq2ps      %xmm0,%xmm3
-  DB  15,89,29,59,59,1,0                  ; mulps         0x13b3b(%rip),%xmm3        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  15,89,29,30,58,1,0                  ; mulps         0x13a1e(%rip),%xmm3        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  102,15,87,201                       ; xorpd         %xmm1,%xmm1
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,54                              ; je            205b6 <_sk_load_a8_sse2+0x89>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,50                              ; je            200aa <_sk_load_a8_sse2+0x7a>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            2059f <_sk_load_a8_sse2+0x72>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,195                             ; jne           20553 <_sk_load_a8_sse2+0x26>
-  DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,19                              ; je            20093 <_sk_load_a8_sse2+0x63>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,204                             ; jne           20050 <_sk_load_a8_sse2+0x20>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,15,112,192,69                   ; pshufd        $0x45,%xmm0,%xmm0
-  DB  67,15,183,4,16                      ; movzwl        (%r8,%r10,1),%eax
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  102,15,110,200                      ; movd          %eax,%xmm1
   DB  102,15,96,200                       ; punpcklbw     %xmm0,%xmm1
   DB  102,15,97,200                       ; punpcklwd     %xmm0,%xmm1
   DB  242,15,16,193                       ; movsd         %xmm1,%xmm0
-  DB  235,157                             ; jmp           20553 <_sk_load_a8_sse2+0x26>
-  DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
+  DB  235,166                             ; jmp           20050 <_sk_load_a8_sse2+0x20>
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
-  DB  235,146                             ; jmp           20553 <_sk_load_a8_sse2+0x26>
+  DB  235,155                             ; jmp           20050 <_sk_load_a8_sse2+0x20>
 
 PUBLIC _sk_load_a8_dst_sse2
 _sk_load_a8_dst_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,46                              ; jne           20607 <_sk_load_a8_dst_sse2+0x46>
-  DB  102,67,15,110,36,16                 ; movd          (%r8,%r10,1),%xmm4
+  DB  117,46                              ; jne           200f5 <_sk_load_a8_dst_sse2+0x40>
+  DB  102,65,15,110,36,16                 ; movd          (%r8,%rdx,1),%xmm4
   DB  102,15,96,224                       ; punpcklbw     %xmm0,%xmm4
   DB  102,15,97,224                       ; punpcklwd     %xmm0,%xmm4
-  DB  102,15,219,37,81,57,1,0             ; pand          0x13951(%rip),%xmm4        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  102,15,219,37,67,56,1,0             ; pand          0x13843(%rip),%xmm4        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  15,91,252                           ; cvtdq2ps      %xmm4,%xmm7
-  DB  15,89,61,167,58,1,0                 ; mulps         0x13aa7(%rip),%xmm7        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  15,89,61,153,57,1,0                 ; mulps         0x13999(%rip),%xmm7        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,87,228                           ; xorps         %xmm4,%xmm4
   DB  102,15,87,237                       ; xorpd         %xmm5,%xmm5
   DB  15,87,246                           ; xorps         %xmm6,%xmm6
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,54                              ; je            2064a <_sk_load_a8_dst_sse2+0x89>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,50                              ; je            2012f <_sk_load_a8_dst_sse2+0x7a>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            20633 <_sk_load_a8_dst_sse2+0x72>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,195                             ; jne           205e7 <_sk_load_a8_dst_sse2+0x26>
-  DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,19                              ; je            20118 <_sk_load_a8_dst_sse2+0x63>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,204                             ; jne           200d5 <_sk_load_a8_dst_sse2+0x20>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
   DB  102,15,112,228,69                   ; pshufd        $0x45,%xmm4,%xmm4
-  DB  67,15,183,4,16                      ; movzwl        (%r8,%r10,1),%eax
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  102,15,110,232                      ; movd          %eax,%xmm5
   DB  102,15,96,232                       ; punpcklbw     %xmm0,%xmm5
   DB  102,15,97,232                       ; punpcklwd     %xmm0,%xmm5
   DB  242,15,16,229                       ; movsd         %xmm5,%xmm4
-  DB  235,157                             ; jmp           205e7 <_sk_load_a8_dst_sse2+0x26>
-  DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
+  DB  235,166                             ; jmp           200d5 <_sk_load_a8_dst_sse2+0x20>
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
-  DB  235,146                             ; jmp           205e7 <_sk_load_a8_dst_sse2+0x26>
+  DB  235,155                             ; jmp           200d5 <_sk_load_a8_dst_sse2+0x20>
 
 PUBLIC _sk_gather_a8_sse2
 _sk_gather_a8_sse2 LABEL PROC
@@ -30528,7 +30313,7 @@
   DB  102,65,15,96,192                    ; punpcklbw     %xmm8,%xmm0
   DB  102,65,15,97,192                    ; punpcklwd     %xmm8,%xmm0
   DB  15,91,216                           ; cvtdq2ps      %xmm0,%xmm3
-  DB  15,89,29,129,57,1,0                 ; mulps         0x13981(%rip),%xmm3        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  15,89,29,124,56,1,0                 ; mulps         0x1387c(%rip),%xmm3        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
@@ -30539,134 +30324,128 @@
 _sk_store_a8_sse2 LABEL PROC
   DB  72,131,236,4                        ; sub           $0x4,%rsp
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  68,15,95,195                        ; maxps         %xmm3,%xmm8
-  DB  68,15,93,5,60,55,1,0                ; minps         0x1373c(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
-  DB  68,15,89,5,20,56,1,0                ; mulps         0x13814(%rip),%xmm8        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  DB  68,15,93,5,61,54,1,0                ; minps         0x1363d(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
+  DB  68,15,89,5,21,55,1,0                ; mulps         0x13715(%rip),%xmm8        # 33950 <_sk_srcover_bgra_8888_sse2_lowp+0xd60>
   DB  102,69,15,91,192                    ; cvtps2dq      %xmm8,%xmm8
   DB  102,65,15,114,240,16                ; pslld         $0x10,%xmm8
   DB  102,65,15,114,224,16                ; psrad         $0x10,%xmm8
   DB  102,68,15,107,192                   ; packssdw      %xmm0,%xmm8
   DB  102,68,15,103,192                   ; packuswb      %xmm0,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,17                              ; jne           2078d <_sk_store_a8_sse2+0x60>
+  DB  117,17                              ; jne           2026c <_sk_store_a8_sse2+0x5a>
   DB  102,68,15,126,192                   ; movd          %xmm8,%eax
-  DB  67,137,4,16                         ; mov           %eax,(%r8,%r10,1)
+  DB  65,137,4,16                         ; mov           %eax,(%r8,%rdx,1)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  72,131,196,4                        ; add           $0x4,%rsp
   DB  255,224                             ; jmpq          *%rax
   DB  102,68,15,96,192                    ; punpcklbw     %xmm0,%xmm8
   DB  102,68,15,97,192                    ; punpcklwd     %xmm0,%xmm8
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,54                              ; je            207da <_sk_store_a8_sse2+0xad>
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,17                              ; je            207bb <_sk_store_a8_sse2+0x8e>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,213                             ; jne           20785 <_sk_store_a8_sse2+0x58>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,50                              ; je            202b0 <_sk_store_a8_sse2+0x9e>
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,15                              ; je            20291 <_sk_store_a8_sse2+0x7f>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,222                             ; jne           20264 <_sk_store_a8_sse2+0x52>
   DB  102,65,15,197,192,4                 ; pextrw        $0x4,%xmm8,%eax
-  DB  67,136,68,16,2                      ; mov           %al,0x2(%r8,%r10,1)
-  DB  102,68,15,219,5,124,55,1,0          ; pand          0x1377c(%rip),%xmm8        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  65,136,68,16,2                      ; mov           %al,0x2(%r8,%rdx,1)
+  DB  102,68,15,219,5,134,54,1,0          ; pand          0x13686(%rip),%xmm8        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  102,69,15,103,192                   ; packuswb      %xmm8,%xmm8
   DB  102,69,15,103,192                   ; packuswb      %xmm8,%xmm8
   DB  102,68,15,126,192                   ; movd          %xmm8,%eax
-  DB  102,67,137,4,16                     ; mov           %ax,(%r8,%r10,1)
-  DB  235,171                             ; jmp           20785 <_sk_store_a8_sse2+0x58>
+  DB  102,65,137,4,16                     ; mov           %ax,(%r8,%rdx,1)
+  DB  235,180                             ; jmp           20264 <_sk_store_a8_sse2+0x52>
   DB  102,68,15,126,192                   ; movd          %xmm8,%eax
-  DB  67,136,4,16                         ; mov           %al,(%r8,%r10,1)
-  DB  235,160                             ; jmp           20785 <_sk_store_a8_sse2+0x58>
+  DB  65,136,4,16                         ; mov           %al,(%r8,%rdx,1)
+  DB  235,169                             ; jmp           20264 <_sk_store_a8_sse2+0x52>
 
 PUBLIC _sk_load_g8_sse2
 _sk_load_g8_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,49                              ; jne           2082e <_sk_load_g8_sse2+0x49>
-  DB  102,67,15,110,4,16                  ; movd          (%r8,%r10,1),%xmm0
+  DB  117,49                              ; jne           202fe <_sk_load_g8_sse2+0x43>
+  DB  102,65,15,110,4,16                  ; movd          (%r8,%rdx,1),%xmm0
   DB  102,15,96,192                       ; punpcklbw     %xmm0,%xmm0
   DB  102,15,97,192                       ; punpcklwd     %xmm0,%xmm0
-  DB  102,15,219,5,45,55,1,0              ; pand          0x1372d(%rip),%xmm0        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  102,15,219,5,61,54,1,0              ; pand          0x1363d(%rip),%xmm0        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,131,56,1,0                  ; mulps         0x13883(%rip),%xmm0        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  15,89,5,147,55,1,0                  ; mulps         0x13793(%rip),%xmm0        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,106,54,1,0                 ; movaps        0x1366a(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,29,122,53,1,0                 ; movaps        0x1357a(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,54                              ; je            20871 <_sk_load_g8_sse2+0x8c>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,50                              ; je            20338 <_sk_load_g8_sse2+0x7d>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            2085a <_sk_load_g8_sse2+0x75>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,192                             ; jne           2080b <_sk_load_g8_sse2+0x26>
-  DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,19                              ; je            20321 <_sk_load_g8_sse2+0x66>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,201                             ; jne           202db <_sk_load_g8_sse2+0x20>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,15,112,192,69                   ; pshufd        $0x45,%xmm0,%xmm0
-  DB  67,15,183,4,16                      ; movzwl        (%r8,%r10,1),%eax
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  102,15,110,200                      ; movd          %eax,%xmm1
   DB  102,15,96,200                       ; punpcklbw     %xmm0,%xmm1
   DB  102,15,97,200                       ; punpcklwd     %xmm0,%xmm1
   DB  242,15,16,193                       ; movsd         %xmm1,%xmm0
-  DB  235,154                             ; jmp           2080b <_sk_load_g8_sse2+0x26>
-  DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
+  DB  235,163                             ; jmp           202db <_sk_load_g8_sse2+0x20>
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
-  DB  235,143                             ; jmp           2080b <_sk_load_g8_sse2+0x26>
+  DB  235,152                             ; jmp           202db <_sk_load_g8_sse2+0x20>
 
 PUBLIC _sk_load_g8_dst_sse2
 _sk_load_g8_dst_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,49                              ; jne           208c5 <_sk_load_g8_dst_sse2+0x49>
-  DB  102,67,15,110,36,16                 ; movd          (%r8,%r10,1),%xmm4
+  DB  117,49                              ; jne           20386 <_sk_load_g8_dst_sse2+0x43>
+  DB  102,65,15,110,36,16                 ; movd          (%r8,%rdx,1),%xmm4
   DB  102,15,96,224                       ; punpcklbw     %xmm0,%xmm4
   DB  102,15,97,224                       ; punpcklwd     %xmm0,%xmm4
-  DB  102,15,219,37,150,54,1,0            ; pand          0x13696(%rip),%xmm4        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  102,15,219,37,181,53,1,0            ; pand          0x135b5(%rip),%xmm4        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
-  DB  15,89,37,236,55,1,0                 ; mulps         0x137ec(%rip),%xmm4        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  15,89,37,11,55,1,0                  ; mulps         0x1370b(%rip),%xmm4        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,61,211,53,1,0                 ; movaps        0x135d3(%rip),%xmm7        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,61,242,52,1,0                 ; movaps        0x134f2(%rip),%xmm7        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,40,236                           ; movaps        %xmm4,%xmm5
   DB  15,40,244                           ; movaps        %xmm4,%xmm6
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,54                              ; je            20908 <_sk_load_g8_dst_sse2+0x8c>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,50                              ; je            203c0 <_sk_load_g8_dst_sse2+0x7d>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            208f1 <_sk_load_g8_dst_sse2+0x75>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,192                             ; jne           208a2 <_sk_load_g8_dst_sse2+0x26>
-  DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,19                              ; je            203a9 <_sk_load_g8_dst_sse2+0x66>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,201                             ; jne           20363 <_sk_load_g8_dst_sse2+0x20>
+  DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
   DB  102,15,112,228,69                   ; pshufd        $0x45,%xmm4,%xmm4
-  DB  67,15,183,4,16                      ; movzwl        (%r8,%r10,1),%eax
+  DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  102,15,110,232                      ; movd          %eax,%xmm5
   DB  102,15,96,232                       ; punpcklbw     %xmm0,%xmm5
   DB  102,15,97,232                       ; punpcklwd     %xmm0,%xmm5
   DB  242,15,16,229                       ; movsd         %xmm5,%xmm4
-  DB  235,154                             ; jmp           208a2 <_sk_load_g8_dst_sse2+0x26>
-  DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
+  DB  235,163                             ; jmp           20363 <_sk_load_g8_dst_sse2+0x20>
+  DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
-  DB  235,143                             ; jmp           208a2 <_sk_load_g8_dst_sse2+0x26>
+  DB  235,152                             ; jmp           20363 <_sk_load_g8_dst_sse2+0x20>
 
 PUBLIC _sk_gather_g8_sse2
 _sk_gather_g8_sse2 LABEL PROC
@@ -30717,9 +30496,9 @@
   DB  102,65,15,96,192                    ; punpcklbw     %xmm8,%xmm0
   DB  102,65,15,97,192                    ; punpcklwd     %xmm8,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,195,54,1,0                  ; mulps         0x136c3(%rip),%xmm0        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  15,89,5,235,53,1,0                  ; mulps         0x135eb(%rip),%xmm0        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,170,52,1,0                 ; movaps        0x134aa(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,29,210,51,1,0                 ; movaps        0x133d2(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  255,224                             ; jmpq          *%rax
@@ -30727,96 +30506,92 @@
 PUBLIC _sk_load_565_sse2
 _sk_load_565_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,83                              ; jne           20a5c <_sk_load_565_sse2+0x6e>
-  DB  243,67,15,126,20,80                 ; movq          (%r8,%r10,2),%xmm2
+  DB  117,83                              ; jne           2050e <_sk_load_565_sse2+0x68>
+  DB  243,65,15,126,20,80                 ; movq          (%r8,%rdx,2),%xmm2
   DB  102,15,97,208                       ; punpcklwd     %xmm0,%xmm2
-  DB  102,15,111,5,149,54,1,0             ; movdqa        0x13695(%rip),%xmm0        # 340b0 <_sk_srcover_bgra_8888_sse2_lowp+0xe94>
+  DB  102,15,111,5,195,53,1,0             ; movdqa        0x135c3(%rip),%xmm0        # 33a90 <_sk_srcover_bgra_8888_sse2_lowp+0xea0>
   DB  102,15,219,194                      ; pand          %xmm2,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,151,54,1,0                  ; mulps         0x13697(%rip),%xmm0        # 340c0 <_sk_srcover_bgra_8888_sse2_lowp+0xea4>
-  DB  102,15,111,13,159,54,1,0            ; movdqa        0x1369f(%rip),%xmm1        # 340d0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  DB  15,89,5,197,53,1,0                  ; mulps         0x135c5(%rip),%xmm0        # 33aa0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb0>
+  DB  102,15,111,13,205,53,1,0            ; movdqa        0x135cd(%rip),%xmm1        # 33ab0 <_sk_srcover_bgra_8888_sse2_lowp+0xec0>
   DB  102,15,219,202                      ; pand          %xmm2,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
-  DB  15,89,13,161,54,1,0                 ; mulps         0x136a1(%rip),%xmm1        # 340e0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
-  DB  102,15,219,21,169,54,1,0            ; pand          0x136a9(%rip),%xmm2        # 340f0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
+  DB  15,89,13,207,53,1,0                 ; mulps         0x135cf(%rip),%xmm1        # 33ac0 <_sk_srcover_bgra_8888_sse2_lowp+0xed0>
+  DB  102,15,219,21,215,53,1,0            ; pand          0x135d7(%rip),%xmm2        # 33ad0 <_sk_srcover_bgra_8888_sse2_lowp+0xee0>
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
-  DB  15,89,21,175,54,1,0                 ; mulps         0x136af(%rip),%xmm2        # 34100 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  DB  15,89,21,221,53,1,0                 ; mulps         0x135dd(%rip),%xmm2        # 33ae0 <_sk_srcover_bgra_8888_sse2_lowp+0xef0>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,54,52,1,0                  ; movaps        0x13436(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,29,100,51,1,0                 ; movaps        0x13364(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,51                              ; je            20a9c <_sk_load_565_sse2+0xae>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,44                              ; je            20542 <_sk_load_565_sse2+0x9c>
   DB  102,15,239,210                      ; pxor          %xmm2,%xmm2
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            20a88 <_sk_load_565_sse2+0x9a>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,154                             ; jne           20a13 <_sk_load_565_sse2+0x25>
-  DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,19                              ; je            20531 <_sk_load_565_sse2+0x8b>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,163                             ; jne           204c5 <_sk_load_565_sse2+0x1f>
+  DB  65,15,183,68,80,4                   ; movzwl        0x4(%r8,%rdx,2),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,15,112,208,69                   ; pshufd        $0x45,%xmm0,%xmm2
-  DB  102,67,15,110,4,80                  ; movd          (%r8,%r10,2),%xmm0
+  DB  102,65,15,110,4,80                  ; movd          (%r8,%rdx,2),%xmm0
   DB  242,15,112,192,212                  ; pshuflw       $0xd4,%xmm0,%xmm0
   DB  242,15,16,208                       ; movsd         %xmm0,%xmm2
-  DB  233,119,255,255,255                 ; jmpq          20a13 <_sk_load_565_sse2+0x25>
-  DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
+  DB  235,131                             ; jmp           204c5 <_sk_load_565_sse2+0x1f>
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,15,110,208                      ; movd          %eax,%xmm2
-  DB  233,105,255,255,255                 ; jmpq          20a13 <_sk_load_565_sse2+0x25>
+  DB  233,117,255,255,255                 ; jmpq          204c5 <_sk_load_565_sse2+0x1f>
 
 PUBLIC _sk_load_565_dst_sse2
 _sk_load_565_dst_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,83                              ; jne           20b18 <_sk_load_565_dst_sse2+0x6e>
-  DB  243,67,15,126,52,80                 ; movq          (%r8,%r10,2),%xmm6
+  DB  117,83                              ; jne           205b8 <_sk_load_565_dst_sse2+0x68>
+  DB  243,65,15,126,52,80                 ; movq          (%r8,%rdx,2),%xmm6
   DB  102,15,97,240                       ; punpcklwd     %xmm0,%xmm6
-  DB  102,15,111,37,217,53,1,0            ; movdqa        0x135d9(%rip),%xmm4        # 340b0 <_sk_srcover_bgra_8888_sse2_lowp+0xe94>
+  DB  102,15,111,37,25,53,1,0             ; movdqa        0x13519(%rip),%xmm4        # 33a90 <_sk_srcover_bgra_8888_sse2_lowp+0xea0>
   DB  102,15,219,230                      ; pand          %xmm6,%xmm4
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
-  DB  15,89,37,219,53,1,0                 ; mulps         0x135db(%rip),%xmm4        # 340c0 <_sk_srcover_bgra_8888_sse2_lowp+0xea4>
-  DB  102,15,111,45,227,53,1,0            ; movdqa        0x135e3(%rip),%xmm5        # 340d0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  DB  15,89,37,27,53,1,0                  ; mulps         0x1351b(%rip),%xmm4        # 33aa0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb0>
+  DB  102,15,111,45,35,53,1,0             ; movdqa        0x13523(%rip),%xmm5        # 33ab0 <_sk_srcover_bgra_8888_sse2_lowp+0xec0>
   DB  102,15,219,238                      ; pand          %xmm6,%xmm5
   DB  15,91,237                           ; cvtdq2ps      %xmm5,%xmm5
-  DB  15,89,45,229,53,1,0                 ; mulps         0x135e5(%rip),%xmm5        # 340e0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
-  DB  102,15,219,53,237,53,1,0            ; pand          0x135ed(%rip),%xmm6        # 340f0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
+  DB  15,89,45,37,53,1,0                  ; mulps         0x13525(%rip),%xmm5        # 33ac0 <_sk_srcover_bgra_8888_sse2_lowp+0xed0>
+  DB  102,15,219,53,45,53,1,0             ; pand          0x1352d(%rip),%xmm6        # 33ad0 <_sk_srcover_bgra_8888_sse2_lowp+0xee0>
   DB  15,91,246                           ; cvtdq2ps      %xmm6,%xmm6
-  DB  15,89,53,243,53,1,0                 ; mulps         0x135f3(%rip),%xmm6        # 34100 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  DB  15,89,53,51,53,1,0                  ; mulps         0x13533(%rip),%xmm6        # 33ae0 <_sk_srcover_bgra_8888_sse2_lowp+0xef0>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,61,122,51,1,0                 ; movaps        0x1337a(%rip),%xmm7        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,61,186,50,1,0                 ; movaps        0x132ba(%rip),%xmm7        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,51                              ; je            20b58 <_sk_load_565_dst_sse2+0xae>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,44                              ; je            205ec <_sk_load_565_dst_sse2+0x9c>
   DB  102,15,239,246                      ; pxor          %xmm6,%xmm6
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            20b44 <_sk_load_565_dst_sse2+0x9a>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,154                             ; jne           20acf <_sk_load_565_dst_sse2+0x25>
-  DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,19                              ; je            205db <_sk_load_565_dst_sse2+0x8b>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,163                             ; jne           2056f <_sk_load_565_dst_sse2+0x1f>
+  DB  65,15,183,68,80,4                   ; movzwl        0x4(%r8,%rdx,2),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
   DB  102,15,112,244,69                   ; pshufd        $0x45,%xmm4,%xmm6
-  DB  102,67,15,110,36,80                 ; movd          (%r8,%r10,2),%xmm4
+  DB  102,65,15,110,36,80                 ; movd          (%r8,%rdx,2),%xmm4
   DB  242,15,112,228,212                  ; pshuflw       $0xd4,%xmm4,%xmm4
   DB  242,15,16,244                       ; movsd         %xmm4,%xmm6
-  DB  233,119,255,255,255                 ; jmpq          20acf <_sk_load_565_dst_sse2+0x25>
-  DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
+  DB  235,131                             ; jmp           2056f <_sk_load_565_dst_sse2+0x1f>
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,15,110,240                      ; movd          %eax,%xmm6
-  DB  233,105,255,255,255                 ; jmpq          20acf <_sk_load_565_dst_sse2+0x25>
+  DB  233,117,255,255,255                 ; jmpq          2056f <_sk_load_565_dst_sse2+0x1f>
 
 PUBLIC _sk_gather_565_sse2
 _sk_gather_565_sse2 LABEL PROC
@@ -30863,43 +30638,41 @@
   DB  65,15,183,4,64                      ; movzwl        (%r8,%rax,2),%eax
   DB  102,15,196,208,3                    ; pinsrw        $0x3,%eax,%xmm2
   DB  102,65,15,97,208                    ; punpcklwd     %xmm8,%xmm2
-  DB  102,15,111,5,136,52,1,0             ; movdqa        0x13488(%rip),%xmm0        # 340b0 <_sk_srcover_bgra_8888_sse2_lowp+0xe94>
+  DB  102,15,111,5,212,51,1,0             ; movdqa        0x133d4(%rip),%xmm0        # 33a90 <_sk_srcover_bgra_8888_sse2_lowp+0xea0>
   DB  102,15,219,194                      ; pand          %xmm2,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,138,52,1,0                  ; mulps         0x1348a(%rip),%xmm0        # 340c0 <_sk_srcover_bgra_8888_sse2_lowp+0xea4>
-  DB  102,15,111,13,146,52,1,0            ; movdqa        0x13492(%rip),%xmm1        # 340d0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb4>
+  DB  15,89,5,214,51,1,0                  ; mulps         0x133d6(%rip),%xmm0        # 33aa0 <_sk_srcover_bgra_8888_sse2_lowp+0xeb0>
+  DB  102,15,111,13,222,51,1,0            ; movdqa        0x133de(%rip),%xmm1        # 33ab0 <_sk_srcover_bgra_8888_sse2_lowp+0xec0>
   DB  102,15,219,202                      ; pand          %xmm2,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
-  DB  15,89,13,148,52,1,0                 ; mulps         0x13494(%rip),%xmm1        # 340e0 <_sk_srcover_bgra_8888_sse2_lowp+0xec4>
-  DB  102,15,219,21,156,52,1,0            ; pand          0x1349c(%rip),%xmm2        # 340f0 <_sk_srcover_bgra_8888_sse2_lowp+0xed4>
+  DB  15,89,13,224,51,1,0                 ; mulps         0x133e0(%rip),%xmm1        # 33ac0 <_sk_srcover_bgra_8888_sse2_lowp+0xed0>
+  DB  102,15,219,21,232,51,1,0            ; pand          0x133e8(%rip),%xmm2        # 33ad0 <_sk_srcover_bgra_8888_sse2_lowp+0xee0>
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
-  DB  15,89,21,162,52,1,0                 ; mulps         0x134a2(%rip),%xmm2        # 34100 <_sk_srcover_bgra_8888_sse2_lowp+0xee4>
+  DB  15,89,21,238,51,1,0                 ; mulps         0x133ee(%rip),%xmm2        # 33ae0 <_sk_srcover_bgra_8888_sse2_lowp+0xef0>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,41,50,1,0                  ; movaps        0x13229(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,29,117,49,1,0                 ; movaps        0x13175(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  255,224                             ; jmpq          *%rax
 
 PUBLIC _sk_store_565_sse2
 _sk_store_565_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  68,15,95,200                        ; maxps         %xmm0,%xmm9
-  DB  68,15,40,21,253,49,1,0              ; movaps        0x131fd(%rip),%xmm10        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,21,79,49,1,0               ; movaps        0x1314f(%rip),%xmm10        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,93,202                        ; minps         %xmm10,%xmm9
-  DB  68,15,40,29,17,54,1,0               ; movaps        0x13611(%rip),%xmm11        # 342b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1094>
+  DB  68,15,40,29,99,53,1,0               ; movaps        0x13563(%rip),%xmm11        # 33c90 <_sk_srcover_bgra_8888_sse2_lowp+0x10a0>
   DB  69,15,89,203                        ; mulps         %xmm11,%xmm9
   DB  102,69,15,91,201                    ; cvtps2dq      %xmm9,%xmm9
   DB  102,65,15,114,241,11                ; pslld         $0xb,%xmm9
   DB  69,15,87,228                        ; xorps         %xmm12,%xmm12
   DB  68,15,95,225                        ; maxps         %xmm1,%xmm12
   DB  69,15,93,226                        ; minps         %xmm10,%xmm12
-  DB  68,15,89,37,254,53,1,0              ; mulps         0x135fe(%rip),%xmm12        # 342c0 <_sk_srcover_bgra_8888_sse2_lowp+0x10a4>
+  DB  68,15,89,37,80,53,1,0               ; mulps         0x13550(%rip),%xmm12        # 33ca0 <_sk_srcover_bgra_8888_sse2_lowp+0x10b0>
   DB  102,69,15,91,228                    ; cvtps2dq      %xmm12,%xmm12
   DB  102,65,15,114,244,5                 ; pslld         $0x5,%xmm12
   DB  68,15,95,194                        ; maxps         %xmm2,%xmm8
@@ -30912,127 +30685,123 @@
   DB  102,65,15,114,224,16                ; psrad         $0x10,%xmm8
   DB  102,68,15,107,192                   ; packssdw      %xmm0,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           20d08 <_sk_store_565_sse2+0x9f>
-  DB  102,71,15,214,4,80                  ; movq          %xmm8,(%r8,%r10,2)
+  DB  117,10                              ; jne           20796 <_sk_store_565_sse2+0x99>
+  DB  102,69,15,214,4,80                  ; movq          %xmm8,(%r8,%rdx,2)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,68,15,97,192                    ; punpcklwd     %xmm0,%xmm8
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,38                              ; je            20d40 <_sk_store_565_sse2+0xd7>
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,18                              ; je            20d32 <_sk_store_565_sse2+0xc9>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,222                             ; jne           20d04 <_sk_store_565_sse2+0x9b>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,34                              ; je            207c5 <_sk_store_565_sse2+0xc8>
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,16                              ; je            207b7 <_sk_store_565_sse2+0xba>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,231                             ; jne           20792 <_sk_store_565_sse2+0x95>
   DB  102,65,15,197,192,4                 ; pextrw        $0x4,%xmm8,%eax
-  DB  102,67,137,68,80,4                  ; mov           %ax,0x4(%r8,%r10,2)
+  DB  102,65,137,68,80,4                  ; mov           %ax,0x4(%r8,%rdx,2)
   DB  242,69,15,112,192,232               ; pshuflw       $0xe8,%xmm8,%xmm8
-  DB  102,71,15,126,4,80                  ; movd          %xmm8,(%r8,%r10,2)
-  DB  235,196                             ; jmp           20d04 <_sk_store_565_sse2+0x9b>
+  DB  102,69,15,126,4,80                  ; movd          %xmm8,(%r8,%rdx,2)
+  DB  235,205                             ; jmp           20792 <_sk_store_565_sse2+0x95>
   DB  102,68,15,126,192                   ; movd          %xmm8,%eax
-  DB  102,67,137,4,80                     ; mov           %ax,(%r8,%r10,2)
-  DB  235,184                             ; jmp           20d04 <_sk_store_565_sse2+0x9b>
+  DB  102,65,137,4,80                     ; mov           %ax,(%r8,%rdx,2)
+  DB  235,193                             ; jmp           20792 <_sk_store_565_sse2+0x95>
 
 PUBLIC _sk_load_4444_sse2
 _sk_load_4444_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,98                              ; jne           20dc9 <_sk_load_4444_sse2+0x7d>
-  DB  243,67,15,126,28,80                 ; movq          (%r8,%r10,2),%xmm3
+  DB  117,98                              ; jne           20848 <_sk_load_4444_sse2+0x77>
+  DB  243,65,15,126,28,80                 ; movq          (%r8,%rdx,2),%xmm3
   DB  102,15,97,216                       ; punpcklwd     %xmm0,%xmm3
-  DB  102,15,111,5,87,53,1,0              ; movdqa        0x13557(%rip),%xmm0        # 342d0 <_sk_srcover_bgra_8888_sse2_lowp+0x10b4>
+  DB  102,15,111,5,184,52,1,0             ; movdqa        0x134b8(%rip),%xmm0        # 33cb0 <_sk_srcover_bgra_8888_sse2_lowp+0x10c0>
   DB  102,15,219,195                      ; pand          %xmm3,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,89,53,1,0                   ; mulps         0x13559(%rip),%xmm0        # 342e0 <_sk_srcover_bgra_8888_sse2_lowp+0x10c4>
-  DB  102,15,111,13,97,53,1,0             ; movdqa        0x13561(%rip),%xmm1        # 342f0 <_sk_srcover_bgra_8888_sse2_lowp+0x10d4>
+  DB  15,89,5,186,52,1,0                  ; mulps         0x134ba(%rip),%xmm0        # 33cc0 <_sk_srcover_bgra_8888_sse2_lowp+0x10d0>
+  DB  102,15,111,13,194,52,1,0            ; movdqa        0x134c2(%rip),%xmm1        # 33cd0 <_sk_srcover_bgra_8888_sse2_lowp+0x10e0>
   DB  102,15,219,203                      ; pand          %xmm3,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
-  DB  15,89,13,99,53,1,0                  ; mulps         0x13563(%rip),%xmm1        # 34300 <_sk_srcover_bgra_8888_sse2_lowp+0x10e4>
-  DB  102,15,111,21,107,53,1,0            ; movdqa        0x1356b(%rip),%xmm2        # 34310 <_sk_srcover_bgra_8888_sse2_lowp+0x10f4>
+  DB  15,89,13,196,52,1,0                 ; mulps         0x134c4(%rip),%xmm1        # 33ce0 <_sk_srcover_bgra_8888_sse2_lowp+0x10f0>
+  DB  102,15,111,21,204,52,1,0            ; movdqa        0x134cc(%rip),%xmm2        # 33cf0 <_sk_srcover_bgra_8888_sse2_lowp+0x1100>
   DB  102,15,219,211                      ; pand          %xmm3,%xmm2
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
-  DB  15,89,21,109,53,1,0                 ; mulps         0x1356d(%rip),%xmm2        # 34320 <_sk_srcover_bgra_8888_sse2_lowp+0x1104>
-  DB  102,15,219,29,117,53,1,0            ; pand          0x13575(%rip),%xmm3        # 34330 <_sk_srcover_bgra_8888_sse2_lowp+0x1114>
+  DB  15,89,21,206,52,1,0                 ; mulps         0x134ce(%rip),%xmm2        # 33d00 <_sk_srcover_bgra_8888_sse2_lowp+0x1110>
+  DB  102,15,219,29,214,52,1,0            ; pand          0x134d6(%rip),%xmm3        # 33d10 <_sk_srcover_bgra_8888_sse2_lowp+0x1120>
   DB  15,91,219                           ; cvtdq2ps      %xmm3,%xmm3
-  DB  15,89,29,123,53,1,0                 ; mulps         0x1357b(%rip),%xmm3        # 34340 <_sk_srcover_bgra_8888_sse2_lowp+0x1124>
+  DB  15,89,29,220,52,1,0                 ; mulps         0x134dc(%rip),%xmm3        # 33d20 <_sk_srcover_bgra_8888_sse2_lowp+0x1130>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,51                              ; je            20e09 <_sk_load_4444_sse2+0xbd>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,47                              ; je            2087f <_sk_load_4444_sse2+0xae>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            20df5 <_sk_load_4444_sse2+0xa9>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,139                             ; jne           20d71 <_sk_load_4444_sse2+0x25>
-  DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,19                              ; je            2086b <_sk_load_4444_sse2+0x9a>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,148                             ; jne           207f0 <_sk_load_4444_sse2+0x1f>
+  DB  65,15,183,68,80,4                   ; movzwl        0x4(%r8,%rdx,2),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,15,112,216,69                   ; pshufd        $0x45,%xmm0,%xmm3
-  DB  102,67,15,110,4,80                  ; movd          (%r8,%r10,2),%xmm0
+  DB  102,65,15,110,4,80                  ; movd          (%r8,%rdx,2),%xmm0
   DB  242,15,112,192,212                  ; pshuflw       $0xd4,%xmm0,%xmm0
   DB  242,15,16,216                       ; movsd         %xmm0,%xmm3
-  DB  233,104,255,255,255                 ; jmpq          20d71 <_sk_load_4444_sse2+0x25>
-  DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
+  DB  233,113,255,255,255                 ; jmpq          207f0 <_sk_load_4444_sse2+0x1f>
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,15,110,216                      ; movd          %eax,%xmm3
-  DB  233,90,255,255,255                  ; jmpq          20d71 <_sk_load_4444_sse2+0x25>
+  DB  233,99,255,255,255                  ; jmpq          207f0 <_sk_load_4444_sse2+0x1f>
 
 PUBLIC _sk_load_4444_dst_sse2
 _sk_load_4444_dst_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,98                              ; jne           20e94 <_sk_load_4444_dst_sse2+0x7d>
-  DB  243,67,15,126,60,80                 ; movq          (%r8,%r10,2),%xmm7
+  DB  117,98                              ; jne           20904 <_sk_load_4444_dst_sse2+0x77>
+  DB  243,65,15,126,60,80                 ; movq          (%r8,%rdx,2),%xmm7
   DB  102,15,97,248                       ; punpcklwd     %xmm0,%xmm7
-  DB  102,15,111,37,140,52,1,0            ; movdqa        0x1348c(%rip),%xmm4        # 342d0 <_sk_srcover_bgra_8888_sse2_lowp+0x10b4>
+  DB  102,15,111,37,252,51,1,0            ; movdqa        0x133fc(%rip),%xmm4        # 33cb0 <_sk_srcover_bgra_8888_sse2_lowp+0x10c0>
   DB  102,15,219,231                      ; pand          %xmm7,%xmm4
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
-  DB  15,89,37,142,52,1,0                 ; mulps         0x1348e(%rip),%xmm4        # 342e0 <_sk_srcover_bgra_8888_sse2_lowp+0x10c4>
-  DB  102,15,111,45,150,52,1,0            ; movdqa        0x13496(%rip),%xmm5        # 342f0 <_sk_srcover_bgra_8888_sse2_lowp+0x10d4>
+  DB  15,89,37,254,51,1,0                 ; mulps         0x133fe(%rip),%xmm4        # 33cc0 <_sk_srcover_bgra_8888_sse2_lowp+0x10d0>
+  DB  102,15,111,45,6,52,1,0              ; movdqa        0x13406(%rip),%xmm5        # 33cd0 <_sk_srcover_bgra_8888_sse2_lowp+0x10e0>
   DB  102,15,219,239                      ; pand          %xmm7,%xmm5
   DB  15,91,237                           ; cvtdq2ps      %xmm5,%xmm5
-  DB  15,89,45,152,52,1,0                 ; mulps         0x13498(%rip),%xmm5        # 34300 <_sk_srcover_bgra_8888_sse2_lowp+0x10e4>
-  DB  102,15,111,53,160,52,1,0            ; movdqa        0x134a0(%rip),%xmm6        # 34310 <_sk_srcover_bgra_8888_sse2_lowp+0x10f4>
+  DB  15,89,45,8,52,1,0                   ; mulps         0x13408(%rip),%xmm5        # 33ce0 <_sk_srcover_bgra_8888_sse2_lowp+0x10f0>
+  DB  102,15,111,53,16,52,1,0             ; movdqa        0x13410(%rip),%xmm6        # 33cf0 <_sk_srcover_bgra_8888_sse2_lowp+0x1100>
   DB  102,15,219,247                      ; pand          %xmm7,%xmm6
   DB  15,91,246                           ; cvtdq2ps      %xmm6,%xmm6
-  DB  15,89,53,162,52,1,0                 ; mulps         0x134a2(%rip),%xmm6        # 34320 <_sk_srcover_bgra_8888_sse2_lowp+0x1104>
-  DB  102,15,219,61,170,52,1,0            ; pand          0x134aa(%rip),%xmm7        # 34330 <_sk_srcover_bgra_8888_sse2_lowp+0x1114>
+  DB  15,89,53,18,52,1,0                  ; mulps         0x13412(%rip),%xmm6        # 33d00 <_sk_srcover_bgra_8888_sse2_lowp+0x1110>
+  DB  102,15,219,61,26,52,1,0             ; pand          0x1341a(%rip),%xmm7        # 33d10 <_sk_srcover_bgra_8888_sse2_lowp+0x1120>
   DB  15,91,255                           ; cvtdq2ps      %xmm7,%xmm7
-  DB  15,89,61,176,52,1,0                 ; mulps         0x134b0(%rip),%xmm7        # 34340 <_sk_srcover_bgra_8888_sse2_lowp+0x1124>
+  DB  15,89,61,32,52,1,0                  ; mulps         0x13420(%rip),%xmm7        # 33d20 <_sk_srcover_bgra_8888_sse2_lowp+0x1130>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,51                              ; je            20ed4 <_sk_load_4444_dst_sse2+0xbd>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,47                              ; je            2093b <_sk_load_4444_dst_sse2+0xae>
   DB  102,15,239,255                      ; pxor          %xmm7,%xmm7
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            20ec0 <_sk_load_4444_dst_sse2+0xa9>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,139                             ; jne           20e3c <_sk_load_4444_dst_sse2+0x25>
-  DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,19                              ; je            20927 <_sk_load_4444_dst_sse2+0x9a>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,148                             ; jne           208ac <_sk_load_4444_dst_sse2+0x1f>
+  DB  65,15,183,68,80,4                   ; movzwl        0x4(%r8,%rdx,2),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
   DB  102,15,112,252,69                   ; pshufd        $0x45,%xmm4,%xmm7
-  DB  102,67,15,110,36,80                 ; movd          (%r8,%r10,2),%xmm4
+  DB  102,65,15,110,36,80                 ; movd          (%r8,%rdx,2),%xmm4
   DB  242,15,112,228,212                  ; pshuflw       $0xd4,%xmm4,%xmm4
   DB  242,15,16,252                       ; movsd         %xmm4,%xmm7
-  DB  233,104,255,255,255                 ; jmpq          20e3c <_sk_load_4444_dst_sse2+0x25>
-  DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
+  DB  233,113,255,255,255                 ; jmpq          208ac <_sk_load_4444_dst_sse2+0x1f>
+  DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,15,110,248                      ; movd          %eax,%xmm7
-  DB  233,90,255,255,255                  ; jmpq          20e3c <_sk_load_4444_dst_sse2+0x25>
+  DB  233,99,255,255,255                  ; jmpq          208ac <_sk_load_4444_dst_sse2+0x1f>
 
 PUBLIC _sk_gather_4444_sse2
 _sk_gather_4444_sse2 LABEL PROC
@@ -31079,39 +30848,37 @@
   DB  65,15,183,4,64                      ; movzwl        (%r8,%rax,2),%eax
   DB  102,15,196,216,3                    ; pinsrw        $0x3,%eax,%xmm3
   DB  102,65,15,97,216                    ; punpcklwd     %xmm8,%xmm3
-  DB  102,15,111,5,44,51,1,0              ; movdqa        0x1332c(%rip),%xmm0        # 342d0 <_sk_srcover_bgra_8888_sse2_lowp+0x10b4>
+  DB  102,15,111,5,165,50,1,0             ; movdqa        0x132a5(%rip),%xmm0        # 33cb0 <_sk_srcover_bgra_8888_sse2_lowp+0x10c0>
   DB  102,15,219,195                      ; pand          %xmm3,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,46,51,1,0                   ; mulps         0x1332e(%rip),%xmm0        # 342e0 <_sk_srcover_bgra_8888_sse2_lowp+0x10c4>
-  DB  102,15,111,13,54,51,1,0             ; movdqa        0x13336(%rip),%xmm1        # 342f0 <_sk_srcover_bgra_8888_sse2_lowp+0x10d4>
+  DB  15,89,5,167,50,1,0                  ; mulps         0x132a7(%rip),%xmm0        # 33cc0 <_sk_srcover_bgra_8888_sse2_lowp+0x10d0>
+  DB  102,15,111,13,175,50,1,0            ; movdqa        0x132af(%rip),%xmm1        # 33cd0 <_sk_srcover_bgra_8888_sse2_lowp+0x10e0>
   DB  102,15,219,203                      ; pand          %xmm3,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
-  DB  15,89,13,56,51,1,0                  ; mulps         0x13338(%rip),%xmm1        # 34300 <_sk_srcover_bgra_8888_sse2_lowp+0x10e4>
-  DB  102,15,111,21,64,51,1,0             ; movdqa        0x13340(%rip),%xmm2        # 34310 <_sk_srcover_bgra_8888_sse2_lowp+0x10f4>
+  DB  15,89,13,177,50,1,0                 ; mulps         0x132b1(%rip),%xmm1        # 33ce0 <_sk_srcover_bgra_8888_sse2_lowp+0x10f0>
+  DB  102,15,111,21,185,50,1,0            ; movdqa        0x132b9(%rip),%xmm2        # 33cf0 <_sk_srcover_bgra_8888_sse2_lowp+0x1100>
   DB  102,15,219,211                      ; pand          %xmm3,%xmm2
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
-  DB  15,89,21,66,51,1,0                  ; mulps         0x13342(%rip),%xmm2        # 34320 <_sk_srcover_bgra_8888_sse2_lowp+0x1104>
-  DB  102,15,219,29,74,51,1,0             ; pand          0x1334a(%rip),%xmm3        # 34330 <_sk_srcover_bgra_8888_sse2_lowp+0x1114>
+  DB  15,89,21,187,50,1,0                 ; mulps         0x132bb(%rip),%xmm2        # 33d00 <_sk_srcover_bgra_8888_sse2_lowp+0x1110>
+  DB  102,15,219,29,195,50,1,0            ; pand          0x132c3(%rip),%xmm3        # 33d10 <_sk_srcover_bgra_8888_sse2_lowp+0x1120>
   DB  15,91,219                           ; cvtdq2ps      %xmm3,%xmm3
-  DB  15,89,29,80,51,1,0                  ; mulps         0x13350(%rip),%xmm3        # 34340 <_sk_srcover_bgra_8888_sse2_lowp+0x1124>
+  DB  15,89,29,201,50,1,0                 ; mulps         0x132c9(%rip),%xmm3        # 33d20 <_sk_srcover_bgra_8888_sse2_lowp+0x1130>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
 
 PUBLIC _sk_store_4444_sse2
 _sk_store_4444_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  76,99,210                           ; movslq        %edx,%r10
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  68,15,95,200                        ; maxps         %xmm0,%xmm9
-  DB  68,15,40,21,114,46,1,0              ; movaps        0x12e72(%rip),%xmm10        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,21,241,45,1,0              ; movaps        0x12df1(%rip),%xmm10        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,93,202                        ; minps         %xmm10,%xmm9
-  DB  68,15,40,29,38,51,1,0               ; movaps        0x13326(%rip),%xmm11        # 34350 <_sk_srcover_bgra_8888_sse2_lowp+0x1134>
+  DB  68,15,40,29,165,50,1,0              ; movaps        0x132a5(%rip),%xmm11        # 33d30 <_sk_srcover_bgra_8888_sse2_lowp+0x1140>
   DB  69,15,89,203                        ; mulps         %xmm11,%xmm9
   DB  102,69,15,91,201                    ; cvtps2dq      %xmm9,%xmm9
   DB  102,65,15,114,241,12                ; pslld         $0xc,%xmm9
@@ -31138,45 +30905,43 @@
   DB  102,65,15,114,224,16                ; psrad         $0x10,%xmm8
   DB  102,68,15,107,192                   ; packssdw      %xmm0,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           210b0 <_sk_store_4444_sse2+0xbc>
-  DB  102,71,15,214,4,80                  ; movq          %xmm8,(%r8,%r10,2)
+  DB  117,10                              ; jne           20b11 <_sk_store_4444_sse2+0xb6>
+  DB  102,69,15,214,4,80                  ; movq          %xmm8,(%r8,%rdx,2)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,68,15,97,192                    ; punpcklwd     %xmm0,%xmm8
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,38                              ; je            210e8 <_sk_store_4444_sse2+0xf4>
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,18                              ; je            210da <_sk_store_4444_sse2+0xe6>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,222                             ; jne           210ac <_sk_store_4444_sse2+0xb8>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,34                              ; je            20b40 <_sk_store_4444_sse2+0xe5>
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,16                              ; je            20b32 <_sk_store_4444_sse2+0xd7>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,231                             ; jne           20b0d <_sk_store_4444_sse2+0xb2>
   DB  102,65,15,197,192,4                 ; pextrw        $0x4,%xmm8,%eax
-  DB  102,67,137,68,80,4                  ; mov           %ax,0x4(%r8,%r10,2)
+  DB  102,65,137,68,80,4                  ; mov           %ax,0x4(%r8,%rdx,2)
   DB  242,69,15,112,192,232               ; pshuflw       $0xe8,%xmm8,%xmm8
-  DB  102,71,15,126,4,80                  ; movd          %xmm8,(%r8,%r10,2)
-  DB  235,196                             ; jmp           210ac <_sk_store_4444_sse2+0xb8>
+  DB  102,69,15,126,4,80                  ; movd          %xmm8,(%r8,%rdx,2)
+  DB  235,205                             ; jmp           20b0d <_sk_store_4444_sse2+0xb2>
   DB  102,68,15,126,192                   ; movd          %xmm8,%eax
-  DB  102,67,137,4,80                     ; mov           %ax,(%r8,%r10,2)
-  DB  235,184                             ; jmp           210ac <_sk_store_4444_sse2+0xb8>
+  DB  102,65,137,4,80                     ; mov           %ax,(%r8,%rdx,2)
+  DB  235,193                             ; jmp           20b0d <_sk_store_4444_sse2+0xb2>
 
 PUBLIC _sk_load_8888_sse2
 _sk_load_8888_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,98                              ; jne           21172 <_sk_load_8888_sse2+0x7e>
-  DB  243,69,15,111,12,128                ; movdqu        (%r8,%rax,4),%xmm9
-  DB  102,15,111,21,34,46,1,0             ; movdqa        0x12e22(%rip),%xmm2        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  117,98                              ; jne           20bc4 <_sk_load_8888_sse2+0x78>
+  DB  243,69,15,111,12,144                ; movdqu        (%r8,%rdx,4),%xmm9
+  DB  102,15,111,21,176,45,1,0            ; movdqa        0x12db0(%rip),%xmm2        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  102,65,15,111,193                   ; movdqa        %xmm9,%xmm0
   DB  102,15,219,194                      ; pand          %xmm2,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  68,15,40,5,110,47,1,0               ; movaps        0x12f6e(%rip),%xmm8        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  68,15,40,5,252,46,1,0               ; movaps        0x12efc(%rip),%xmm8        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  102,65,15,111,201                   ; movdqa        %xmm9,%xmm1
   DB  102,15,114,209,8                    ; psrld         $0x8,%xmm1
@@ -31193,39 +30958,37 @@
   DB  65,15,89,216                        ; mulps         %xmm8,%xmm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,41                              ; je            211a8 <_sk_load_8888_sse2+0xb4>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,37                              ; je            20bf1 <_sk_load_8888_sse2+0xa5>
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,19                              ; je            2119d <_sk_load_8888_sse2+0xa9>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,134                             ; jne           21116 <_sk_load_8888_sse2+0x22>
-  DB  102,65,15,110,68,128,8              ; movd          0x8(%r8,%rax,4),%xmm0
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,17                              ; je            20be6 <_sk_load_8888_sse2+0x9a>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,143                             ; jne           20b68 <_sk_load_8888_sse2+0x1c>
+  DB  102,65,15,110,68,144,8              ; movd          0x8(%r8,%rdx,4),%xmm0
   DB  102,68,15,112,200,69                ; pshufd        $0x45,%xmm0,%xmm9
-  DB  102,69,15,18,12,128                 ; movlpd        (%r8,%rax,4),%xmm9
-  DB  233,110,255,255,255                 ; jmpq          21116 <_sk_load_8888_sse2+0x22>
-  DB  102,69,15,110,12,128                ; movd          (%r8,%rax,4),%xmm9
-  DB  233,99,255,255,255                  ; jmpq          21116 <_sk_load_8888_sse2+0x22>
+  DB  102,69,15,18,12,144                 ; movlpd        (%r8,%rdx,4),%xmm9
+  DB  233,119,255,255,255                 ; jmpq          20b68 <_sk_load_8888_sse2+0x1c>
+  DB  102,69,15,110,12,144                ; movd          (%r8,%rdx,4),%xmm9
+  DB  233,108,255,255,255                 ; jmpq          20b68 <_sk_load_8888_sse2+0x1c>
 
 PUBLIC _sk_load_8888_dst_sse2
 _sk_load_8888_dst_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,98                              ; jne           21231 <_sk_load_8888_dst_sse2+0x7e>
-  DB  243,69,15,111,12,128                ; movdqu        (%r8,%rax,4),%xmm9
-  DB  102,15,111,53,99,45,1,0             ; movdqa        0x12d63(%rip),%xmm6        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  117,98                              ; jne           20c74 <_sk_load_8888_dst_sse2+0x78>
+  DB  243,69,15,111,12,144                ; movdqu        (%r8,%rdx,4),%xmm9
+  DB  102,15,111,53,0,45,1,0              ; movdqa        0x12d00(%rip),%xmm6        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  102,65,15,111,225                   ; movdqa        %xmm9,%xmm4
   DB  102,15,219,230                      ; pand          %xmm6,%xmm4
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
-  DB  68,15,40,5,175,46,1,0               ; movaps        0x12eaf(%rip),%xmm8        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  68,15,40,5,76,46,1,0                ; movaps        0x12e4c(%rip),%xmm8        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  65,15,89,224                        ; mulps         %xmm8,%xmm4
   DB  102,65,15,111,233                   ; movdqa        %xmm9,%xmm5
   DB  102,15,114,213,8                    ; psrld         $0x8,%xmm5
@@ -31242,21 +31005,21 @@
   DB  65,15,89,248                        ; mulps         %xmm8,%xmm7
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,41                              ; je            21267 <_sk_load_8888_dst_sse2+0xb4>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,37                              ; je            20ca1 <_sk_load_8888_dst_sse2+0xa5>
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,19                              ; je            2125c <_sk_load_8888_dst_sse2+0xa9>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,134                             ; jne           211d5 <_sk_load_8888_dst_sse2+0x22>
-  DB  102,65,15,110,100,128,8             ; movd          0x8(%r8,%rax,4),%xmm4
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,17                              ; je            20c96 <_sk_load_8888_dst_sse2+0x9a>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,143                             ; jne           20c18 <_sk_load_8888_dst_sse2+0x1c>
+  DB  102,65,15,110,100,144,8             ; movd          0x8(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,204,69                ; pshufd        $0x45,%xmm4,%xmm9
-  DB  102,69,15,18,12,128                 ; movlpd        (%r8,%rax,4),%xmm9
-  DB  233,110,255,255,255                 ; jmpq          211d5 <_sk_load_8888_dst_sse2+0x22>
-  DB  102,69,15,110,12,128                ; movd          (%r8,%rax,4),%xmm9
-  DB  233,99,255,255,255                  ; jmpq          211d5 <_sk_load_8888_dst_sse2+0x22>
+  DB  102,69,15,18,12,144                 ; movlpd        (%r8,%rdx,4),%xmm9
+  DB  233,119,255,255,255                 ; jmpq          20c18 <_sk_load_8888_dst_sse2+0x1c>
+  DB  102,69,15,110,12,144                ; movd          (%r8,%rdx,4),%xmm9
+  DB  233,108,255,255,255                 ; jmpq          20c18 <_sk_load_8888_dst_sse2+0x1c>
 
 PUBLIC _sk_gather_8888_sse2
 _sk_gather_8888_sse2 LABEL PROC
@@ -31300,11 +31063,11 @@
   DB  102,67,15,110,12,136                ; movd          (%r8,%r9,4),%xmm1
   DB  102,15,98,200                       ; punpckldq     %xmm0,%xmm1
   DB  102,68,15,108,201                   ; punpcklqdq    %xmm1,%xmm9
-  DB  102,15,111,21,22,44,1,0             ; movdqa        0x12c16(%rip),%xmm2        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  102,15,111,21,188,43,1,0            ; movdqa        0x12bbc(%rip),%xmm2        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  102,65,15,111,193                   ; movdqa        %xmm9,%xmm0
   DB  102,15,219,194                      ; pand          %xmm2,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  68,15,40,5,98,45,1,0                ; movaps        0x12d62(%rip),%xmm8        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  68,15,40,5,8,45,1,0                 ; movaps        0x12d08(%rip),%xmm8        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  102,65,15,111,201                   ; movdqa        %xmm9,%xmm1
   DB  102,15,114,209,8                    ; psrld         $0x8,%xmm1
@@ -31325,18 +31088,16 @@
 PUBLIC _sk_store_8888_sse2
 _sk_store_8888_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  68,15,95,200                        ; maxps         %xmm0,%xmm9
-  DB  68,15,40,21,231,42,1,0              ; movaps        0x12ae7(%rip),%xmm10        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,21,147,42,1,0              ; movaps        0x12a93(%rip),%xmm10        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,93,202                        ; minps         %xmm10,%xmm9
-  DB  68,15,40,29,187,43,1,0              ; movaps        0x12bbb(%rip),%xmm11        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  DB  68,15,40,29,103,43,1,0              ; movaps        0x12b67(%rip),%xmm11        # 33950 <_sk_srcover_bgra_8888_sse2_lowp+0xd60>
   DB  69,15,89,203                        ; mulps         %xmm11,%xmm9
   DB  102,69,15,91,201                    ; cvtps2dq      %xmm9,%xmm9
   DB  69,15,87,228                        ; xorps         %xmm12,%xmm12
@@ -31360,42 +31121,40 @@
   DB  102,69,15,235,193                   ; por           %xmm9,%xmm8
   DB  102,69,15,235,196                   ; por           %xmm12,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           2142a <_sk_store_8888_sse2+0xac>
-  DB  243,69,15,127,4,128                 ; movdqu        %xmm8,(%r8,%rax,4)
+  DB  117,10                              ; jne           20e5e <_sk_store_8888_sse2+0xa6>
+  DB  243,69,15,127,4,144                 ; movdqu        %xmm8,(%r8,%rdx,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,33                              ; je            21458 <_sk_store_8888_sse2+0xda>
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,19                              ; je            21450 <_sk_store_8888_sse2+0xd2>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,227                             ; jne           21426 <_sk_store_8888_sse2+0xa8>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,29                              ; je            20e83 <_sk_store_8888_sse2+0xcb>
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,17                              ; je            20e7b <_sk_store_8888_sse2+0xc3>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,236                             ; jne           20e5a <_sk_store_8888_sse2+0xa2>
   DB  102,69,15,112,200,78                ; pshufd        $0x4e,%xmm8,%xmm9
-  DB  102,69,15,126,76,128,8              ; movd          %xmm9,0x8(%r8,%rax,4)
-  DB  102,69,15,214,4,128                 ; movq          %xmm8,(%r8,%rax,4)
-  DB  235,206                             ; jmp           21426 <_sk_store_8888_sse2+0xa8>
-  DB  102,69,15,126,4,128                 ; movd          %xmm8,(%r8,%rax,4)
-  DB  235,198                             ; jmp           21426 <_sk_store_8888_sse2+0xa8>
+  DB  102,69,15,126,76,144,8              ; movd          %xmm9,0x8(%r8,%rdx,4)
+  DB  102,69,15,214,4,144                 ; movq          %xmm8,(%r8,%rdx,4)
+  DB  235,215                             ; jmp           20e5a <_sk_store_8888_sse2+0xa2>
+  DB  102,69,15,126,4,144                 ; movd          %xmm8,(%r8,%rdx,4)
+  DB  235,207                             ; jmp           20e5a <_sk_store_8888_sse2+0xa2>
 
 PUBLIC _sk_load_bgra_sse2
 _sk_load_bgra_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,98                              ; jne           214de <_sk_load_bgra_sse2+0x7e>
-  DB  243,69,15,111,12,128                ; movdqu        (%r8,%rax,4),%xmm9
-  DB  102,15,111,5,182,42,1,0             ; movdqa        0x12ab6(%rip),%xmm0        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  117,98                              ; jne           20f03 <_sk_load_bgra_sse2+0x78>
+  DB  243,69,15,111,12,144                ; movdqu        (%r8,%rdx,4),%xmm9
+  DB  102,15,111,5,113,42,1,0             ; movdqa        0x12a71(%rip),%xmm0        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  102,65,15,111,201                   ; movdqa        %xmm9,%xmm1
   DB  102,15,219,200                      ; pand          %xmm0,%xmm1
   DB  15,91,209                           ; cvtdq2ps      %xmm1,%xmm2
-  DB  68,15,40,5,2,44,1,0                 ; movaps        0x12c02(%rip),%xmm8        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  68,15,40,5,189,43,1,0               ; movaps        0x12bbd(%rip),%xmm8        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  65,15,89,208                        ; mulps         %xmm8,%xmm2
   DB  102,65,15,111,201                   ; movdqa        %xmm9,%xmm1
   DB  102,15,114,209,8                    ; psrld         $0x8,%xmm1
@@ -31412,39 +31171,37 @@
   DB  65,15,89,216                        ; mulps         %xmm8,%xmm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,41                              ; je            21514 <_sk_load_bgra_sse2+0xb4>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,37                              ; je            20f30 <_sk_load_bgra_sse2+0xa5>
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,19                              ; je            21509 <_sk_load_bgra_sse2+0xa9>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,134                             ; jne           21482 <_sk_load_bgra_sse2+0x22>
-  DB  102,65,15,110,68,128,8              ; movd          0x8(%r8,%rax,4),%xmm0
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,17                              ; je            20f25 <_sk_load_bgra_sse2+0x9a>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,143                             ; jne           20ea7 <_sk_load_bgra_sse2+0x1c>
+  DB  102,65,15,110,68,144,8              ; movd          0x8(%r8,%rdx,4),%xmm0
   DB  102,68,15,112,200,69                ; pshufd        $0x45,%xmm0,%xmm9
-  DB  102,69,15,18,12,128                 ; movlpd        (%r8,%rax,4),%xmm9
-  DB  233,110,255,255,255                 ; jmpq          21482 <_sk_load_bgra_sse2+0x22>
-  DB  102,69,15,110,12,128                ; movd          (%r8,%rax,4),%xmm9
-  DB  233,99,255,255,255                  ; jmpq          21482 <_sk_load_bgra_sse2+0x22>
+  DB  102,69,15,18,12,144                 ; movlpd        (%r8,%rdx,4),%xmm9
+  DB  233,119,255,255,255                 ; jmpq          20ea7 <_sk_load_bgra_sse2+0x1c>
+  DB  102,69,15,110,12,144                ; movd          (%r8,%rdx,4),%xmm9
+  DB  233,108,255,255,255                 ; jmpq          20ea7 <_sk_load_bgra_sse2+0x1c>
 
 PUBLIC _sk_load_bgra_dst_sse2
 _sk_load_bgra_dst_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,98                              ; jne           2159d <_sk_load_bgra_dst_sse2+0x7e>
-  DB  243,69,15,111,12,128                ; movdqu        (%r8,%rax,4),%xmm9
-  DB  102,15,111,37,247,41,1,0            ; movdqa        0x129f7(%rip),%xmm4        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  117,98                              ; jne           20fb3 <_sk_load_bgra_dst_sse2+0x78>
+  DB  243,69,15,111,12,144                ; movdqu        (%r8,%rdx,4),%xmm9
+  DB  102,15,111,37,193,41,1,0            ; movdqa        0x129c1(%rip),%xmm4        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  102,65,15,111,233                   ; movdqa        %xmm9,%xmm5
   DB  102,15,219,236                      ; pand          %xmm4,%xmm5
   DB  15,91,245                           ; cvtdq2ps      %xmm5,%xmm6
-  DB  68,15,40,5,67,43,1,0                ; movaps        0x12b43(%rip),%xmm8        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  68,15,40,5,13,43,1,0                ; movaps        0x12b0d(%rip),%xmm8        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  65,15,89,240                        ; mulps         %xmm8,%xmm6
   DB  102,65,15,111,233                   ; movdqa        %xmm9,%xmm5
   DB  102,15,114,213,8                    ; psrld         $0x8,%xmm5
@@ -31461,21 +31218,21 @@
   DB  65,15,89,248                        ; mulps         %xmm8,%xmm7
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,41                              ; je            215d3 <_sk_load_bgra_dst_sse2+0xb4>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,37                              ; je            20fe0 <_sk_load_bgra_dst_sse2+0xa5>
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,19                              ; je            215c8 <_sk_load_bgra_dst_sse2+0xa9>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,134                             ; jne           21541 <_sk_load_bgra_dst_sse2+0x22>
-  DB  102,65,15,110,100,128,8             ; movd          0x8(%r8,%rax,4),%xmm4
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,17                              ; je            20fd5 <_sk_load_bgra_dst_sse2+0x9a>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,143                             ; jne           20f57 <_sk_load_bgra_dst_sse2+0x1c>
+  DB  102,65,15,110,100,144,8             ; movd          0x8(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,204,69                ; pshufd        $0x45,%xmm4,%xmm9
-  DB  102,69,15,18,12,128                 ; movlpd        (%r8,%rax,4),%xmm9
-  DB  233,110,255,255,255                 ; jmpq          21541 <_sk_load_bgra_dst_sse2+0x22>
-  DB  102,69,15,110,12,128                ; movd          (%r8,%rax,4),%xmm9
-  DB  233,99,255,255,255                  ; jmpq          21541 <_sk_load_bgra_dst_sse2+0x22>
+  DB  102,69,15,18,12,144                 ; movlpd        (%r8,%rdx,4),%xmm9
+  DB  233,119,255,255,255                 ; jmpq          20f57 <_sk_load_bgra_dst_sse2+0x1c>
+  DB  102,69,15,110,12,144                ; movd          (%r8,%rdx,4),%xmm9
+  DB  233,108,255,255,255                 ; jmpq          20f57 <_sk_load_bgra_dst_sse2+0x1c>
 
 PUBLIC _sk_gather_bgra_sse2
 _sk_gather_bgra_sse2 LABEL PROC
@@ -31519,11 +31276,11 @@
   DB  102,67,15,110,12,136                ; movd          (%r8,%r9,4),%xmm1
   DB  102,15,98,200                       ; punpckldq     %xmm0,%xmm1
   DB  102,68,15,108,201                   ; punpcklqdq    %xmm1,%xmm9
-  DB  102,15,111,5,170,40,1,0             ; movdqa        0x128aa(%rip),%xmm0        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
+  DB  102,15,111,5,125,40,1,0             ; movdqa        0x1287d(%rip),%xmm0        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
   DB  102,65,15,111,201                   ; movdqa        %xmm9,%xmm1
   DB  102,15,219,200                      ; pand          %xmm0,%xmm1
   DB  15,91,209                           ; cvtdq2ps      %xmm1,%xmm2
-  DB  68,15,40,5,246,41,1,0               ; movaps        0x129f6(%rip),%xmm8        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  68,15,40,5,201,41,1,0               ; movaps        0x129c9(%rip),%xmm8        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  65,15,89,208                        ; mulps         %xmm8,%xmm2
   DB  102,65,15,111,201                   ; movdqa        %xmm9,%xmm1
   DB  102,15,114,209,8                    ; psrld         $0x8,%xmm1
@@ -31544,18 +31301,16 @@
 PUBLIC _sk_store_bgra_sse2
 _sk_store_bgra_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  68,15,95,202                        ; maxps         %xmm2,%xmm9
-  DB  68,15,40,21,123,39,1,0              ; movaps        0x1277b(%rip),%xmm10        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,21,84,39,1,0               ; movaps        0x12754(%rip),%xmm10        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,93,202                        ; minps         %xmm10,%xmm9
-  DB  68,15,40,29,79,40,1,0               ; movaps        0x1284f(%rip),%xmm11        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  DB  68,15,40,29,40,40,1,0               ; movaps        0x12828(%rip),%xmm11        # 33950 <_sk_srcover_bgra_8888_sse2_lowp+0xd60>
   DB  69,15,89,203                        ; mulps         %xmm11,%xmm9
   DB  102,69,15,91,201                    ; cvtps2dq      %xmm9,%xmm9
   DB  69,15,87,228                        ; xorps         %xmm12,%xmm12
@@ -31579,38 +31334,36 @@
   DB  102,69,15,235,193                   ; por           %xmm9,%xmm8
   DB  102,69,15,235,196                   ; por           %xmm12,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           21796 <_sk_store_bgra_sse2+0xac>
-  DB  243,69,15,127,4,128                 ; movdqu        %xmm8,(%r8,%rax,4)
+  DB  117,10                              ; jne           2119d <_sk_store_bgra_sse2+0xa6>
+  DB  243,69,15,127,4,144                 ; movdqu        %xmm8,(%r8,%rdx,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  65,137,249                          ; mov           %edi,%r9d
-  DB  65,128,225,3                        ; and           $0x3,%r9b
-  DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,33                              ; je            217c4 <_sk_store_bgra_sse2+0xda>
-  DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,19                              ; je            217bc <_sk_store_bgra_sse2+0xd2>
-  DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,227                             ; jne           21792 <_sk_store_bgra_sse2+0xa8>
+  DB  137,248                             ; mov           %edi,%eax
+  DB  36,3                                ; and           $0x3,%al
+  DB  60,1                                ; cmp           $0x1,%al
+  DB  116,29                              ; je            211c2 <_sk_store_bgra_sse2+0xcb>
+  DB  60,2                                ; cmp           $0x2,%al
+  DB  116,17                              ; je            211ba <_sk_store_bgra_sse2+0xc3>
+  DB  60,3                                ; cmp           $0x3,%al
+  DB  117,236                             ; jne           21199 <_sk_store_bgra_sse2+0xa2>
   DB  102,69,15,112,200,78                ; pshufd        $0x4e,%xmm8,%xmm9
-  DB  102,69,15,126,76,128,8              ; movd          %xmm9,0x8(%r8,%rax,4)
-  DB  102,69,15,214,4,128                 ; movq          %xmm8,(%r8,%rax,4)
-  DB  235,206                             ; jmp           21792 <_sk_store_bgra_sse2+0xa8>
-  DB  102,69,15,126,4,128                 ; movd          %xmm8,(%r8,%rax,4)
-  DB  235,198                             ; jmp           21792 <_sk_store_bgra_sse2+0xa8>
+  DB  102,69,15,126,76,144,8              ; movd          %xmm9,0x8(%r8,%rdx,4)
+  DB  102,69,15,214,4,144                 ; movq          %xmm8,(%r8,%rdx,4)
+  DB  235,215                             ; jmp           21199 <_sk_store_bgra_sse2+0xa2>
+  DB  102,69,15,126,4,144                 ; movd          %xmm8,(%r8,%rdx,4)
+  DB  235,207                             ; jmp           21199 <_sk_store_bgra_sse2+0xa2>
 
 PUBLIC _sk_load_f16_sse2
 _sk_load_f16_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,3                        ; shl           $0x3,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,47,1,0,0                     ; jne           2191b <_sk_load_f16_sse2+0x14f>
-  DB  102,65,15,16,4,192                  ; movupd        (%r8,%rax,8),%xmm0
-  DB  243,65,15,111,76,192,16             ; movdqu        0x10(%r8,%rax,8),%xmm1
+  DB  15,133,47,1,0,0                     ; jne           21313 <_sk_load_f16_sse2+0x149>
+  DB  102,65,15,16,4,208                  ; movupd        (%r8,%rdx,8),%xmm0
+  DB  243,65,15,111,76,208,16             ; movdqu        0x10(%r8,%rdx,8),%xmm1
   DB  102,68,15,40,192                    ; movapd        %xmm0,%xmm8
   DB  102,68,15,97,193                    ; punpcklwd     %xmm1,%xmm8
   DB  102,15,105,193                      ; punpckhwd     %xmm1,%xmm0
@@ -31620,18 +31373,18 @@
   DB  102,69,15,239,210                   ; pxor          %xmm10,%xmm10
   DB  102,15,111,202                      ; movdqa        %xmm2,%xmm1
   DB  102,65,15,97,202                    ; punpcklwd     %xmm10,%xmm1
-  DB  102,68,15,111,13,52,43,1,0          ; movdqa        0x12b34(%rip),%xmm9        # 34360 <_sk_srcover_bgra_8888_sse2_lowp+0x1144>
+  DB  102,68,15,111,13,28,43,1,0          ; movdqa        0x12b1c(%rip),%xmm9        # 33d40 <_sk_srcover_bgra_8888_sse2_lowp+0x1150>
   DB  102,68,15,111,225                   ; movdqa        %xmm1,%xmm12
   DB  102,69,15,219,225                   ; pand          %xmm9,%xmm12
-  DB  102,68,15,111,29,49,43,1,0          ; movdqa        0x12b31(%rip),%xmm11        # 34370 <_sk_srcover_bgra_8888_sse2_lowp+0x1154>
+  DB  102,68,15,111,29,25,43,1,0          ; movdqa        0x12b19(%rip),%xmm11        # 33d50 <_sk_srcover_bgra_8888_sse2_lowp+0x1160>
   DB  102,65,15,219,203                   ; pand          %xmm11,%xmm1
-  DB  102,15,111,29,52,43,1,0             ; movdqa        0x12b34(%rip),%xmm3        # 34380 <_sk_srcover_bgra_8888_sse2_lowp+0x1164>
+  DB  102,15,111,29,28,43,1,0             ; movdqa        0x12b1c(%rip),%xmm3        # 33d60 <_sk_srcover_bgra_8888_sse2_lowp+0x1170>
   DB  102,65,15,114,244,16                ; pslld         $0x10,%xmm12
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
   DB  102,15,102,193                      ; pcmpgtd       %xmm1,%xmm0
   DB  102,15,114,241,13                   ; pslld         $0xd,%xmm1
   DB  102,65,15,235,204                   ; por           %xmm12,%xmm1
-  DB  102,68,15,111,37,35,43,1,0          ; movdqa        0x12b23(%rip),%xmm12        # 34390 <_sk_srcover_bgra_8888_sse2_lowp+0x1174>
+  DB  102,68,15,111,37,11,43,1,0          ; movdqa        0x12b0b(%rip),%xmm12        # 33d70 <_sk_srcover_bgra_8888_sse2_lowp+0x1180>
   DB  102,65,15,254,204                   ; paddd         %xmm12,%xmm1
   DB  102,15,223,193                      ; pandn         %xmm1,%xmm0
   DB  102,65,15,105,210                   ; punpckhwd     %xmm10,%xmm2
@@ -31668,32 +31421,30 @@
   DB  102,65,15,223,216                   ; pandn         %xmm8,%xmm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  242,65,15,16,4,192                  ; movsd         (%r8,%rax,8),%xmm0
+  DB  242,65,15,16,4,208                  ; movsd         (%r8,%rdx,8),%xmm0
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,13                              ; jne           21934 <_sk_load_f16_sse2+0x168>
+  DB  117,13                              ; jne           2132c <_sk_load_f16_sse2+0x162>
   DB  243,15,126,192                      ; movq          %xmm0,%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  233,197,254,255,255                 ; jmpq          217f9 <_sk_load_f16_sse2+0x2d>
-  DB  102,65,15,22,68,192,8               ; movhpd        0x8(%r8,%rax,8),%xmm0
+  DB  233,197,254,255,255                 ; jmpq          211f1 <_sk_load_f16_sse2+0x27>
+  DB  102,65,15,22,68,208,8               ; movhpd        0x8(%r8,%rdx,8),%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  15,130,176,254,255,255              ; jb            217f9 <_sk_load_f16_sse2+0x2d>
-  DB  243,65,15,126,76,192,16             ; movq          0x10(%r8,%rax,8),%xmm1
-  DB  233,164,254,255,255                 ; jmpq          217f9 <_sk_load_f16_sse2+0x2d>
+  DB  15,130,176,254,255,255              ; jb            211f1 <_sk_load_f16_sse2+0x27>
+  DB  243,65,15,126,76,208,16             ; movq          0x10(%r8,%rdx,8),%xmm1
+  DB  233,164,254,255,255                 ; jmpq          211f1 <_sk_load_f16_sse2+0x27>
 
 PUBLIC _sk_load_f16_dst_sse2
 _sk_load_f16_dst_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,3                        ; shl           $0x3,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,47,1,0,0                     ; jne           21aa4 <_sk_load_f16_dst_sse2+0x14f>
-  DB  102,65,15,16,36,192                 ; movupd        (%r8,%rax,8),%xmm4
-  DB  243,65,15,111,108,192,16            ; movdqu        0x10(%r8,%rax,8),%xmm5
+  DB  15,133,47,1,0,0                     ; jne           21496 <_sk_load_f16_dst_sse2+0x149>
+  DB  102,65,15,16,36,208                 ; movupd        (%r8,%rdx,8),%xmm4
+  DB  243,65,15,111,108,208,16            ; movdqu        0x10(%r8,%rdx,8),%xmm5
   DB  102,68,15,40,196                    ; movapd        %xmm4,%xmm8
   DB  102,68,15,97,197                    ; punpcklwd     %xmm5,%xmm8
   DB  102,15,105,229                      ; punpckhwd     %xmm5,%xmm4
@@ -31703,18 +31454,18 @@
   DB  102,69,15,239,210                   ; pxor          %xmm10,%xmm10
   DB  102,15,111,238                      ; movdqa        %xmm6,%xmm5
   DB  102,65,15,97,234                    ; punpcklwd     %xmm10,%xmm5
-  DB  102,68,15,111,13,171,41,1,0         ; movdqa        0x129ab(%rip),%xmm9        # 34360 <_sk_srcover_bgra_8888_sse2_lowp+0x1144>
+  DB  102,68,15,111,13,153,41,1,0         ; movdqa        0x12999(%rip),%xmm9        # 33d40 <_sk_srcover_bgra_8888_sse2_lowp+0x1150>
   DB  102,68,15,111,229                   ; movdqa        %xmm5,%xmm12
   DB  102,69,15,219,225                   ; pand          %xmm9,%xmm12
-  DB  102,68,15,111,29,168,41,1,0         ; movdqa        0x129a8(%rip),%xmm11        # 34370 <_sk_srcover_bgra_8888_sse2_lowp+0x1154>
+  DB  102,68,15,111,29,150,41,1,0         ; movdqa        0x12996(%rip),%xmm11        # 33d50 <_sk_srcover_bgra_8888_sse2_lowp+0x1160>
   DB  102,65,15,219,235                   ; pand          %xmm11,%xmm5
-  DB  102,15,111,61,171,41,1,0            ; movdqa        0x129ab(%rip),%xmm7        # 34380 <_sk_srcover_bgra_8888_sse2_lowp+0x1164>
+  DB  102,15,111,61,153,41,1,0            ; movdqa        0x12999(%rip),%xmm7        # 33d60 <_sk_srcover_bgra_8888_sse2_lowp+0x1170>
   DB  102,65,15,114,244,16                ; pslld         $0x10,%xmm12
   DB  102,15,111,231                      ; movdqa        %xmm7,%xmm4
   DB  102,15,102,229                      ; pcmpgtd       %xmm5,%xmm4
   DB  102,15,114,245,13                   ; pslld         $0xd,%xmm5
   DB  102,65,15,235,236                   ; por           %xmm12,%xmm5
-  DB  102,68,15,111,37,154,41,1,0         ; movdqa        0x1299a(%rip),%xmm12        # 34390 <_sk_srcover_bgra_8888_sse2_lowp+0x1174>
+  DB  102,68,15,111,37,136,41,1,0         ; movdqa        0x12988(%rip),%xmm12        # 33d70 <_sk_srcover_bgra_8888_sse2_lowp+0x1180>
   DB  102,65,15,254,236                   ; paddd         %xmm12,%xmm5
   DB  102,15,223,229                      ; pandn         %xmm5,%xmm4
   DB  102,65,15,105,242                   ; punpckhwd     %xmm10,%xmm6
@@ -31751,18 +31502,18 @@
   DB  102,65,15,223,248                   ; pandn         %xmm8,%xmm7
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  242,65,15,16,36,192                 ; movsd         (%r8,%rax,8),%xmm4
+  DB  242,65,15,16,36,208                 ; movsd         (%r8,%rdx,8),%xmm4
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,13                              ; jne           21abd <_sk_load_f16_dst_sse2+0x168>
+  DB  117,13                              ; jne           214af <_sk_load_f16_dst_sse2+0x162>
   DB  243,15,126,228                      ; movq          %xmm4,%xmm4
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
-  DB  233,197,254,255,255                 ; jmpq          21982 <_sk_load_f16_dst_sse2+0x2d>
-  DB  102,65,15,22,100,192,8              ; movhpd        0x8(%r8,%rax,8),%xmm4
+  DB  233,197,254,255,255                 ; jmpq          21374 <_sk_load_f16_dst_sse2+0x27>
+  DB  102,65,15,22,100,208,8              ; movhpd        0x8(%r8,%rdx,8),%xmm4
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  15,130,176,254,255,255              ; jb            21982 <_sk_load_f16_dst_sse2+0x2d>
-  DB  243,65,15,126,108,192,16            ; movq          0x10(%r8,%rax,8),%xmm5
-  DB  233,164,254,255,255                 ; jmpq          21982 <_sk_load_f16_dst_sse2+0x2d>
+  DB  15,130,176,254,255,255              ; jb            21374 <_sk_load_f16_dst_sse2+0x27>
+  DB  243,65,15,126,108,208,16            ; movq          0x10(%r8,%rdx,8),%xmm5
+  DB  233,164,254,255,255                 ; jmpq          21374 <_sk_load_f16_dst_sse2+0x27>
 
 PUBLIC _sk_gather_f16_sse2
 _sk_gather_f16_sse2 LABEL PROC
@@ -31814,18 +31565,18 @@
   DB  102,68,15,105,201                   ; punpckhwd     %xmm1,%xmm9
   DB  102,15,111,202                      ; movdqa        %xmm2,%xmm1
   DB  102,65,15,97,200                    ; punpcklwd     %xmm8,%xmm1
-  DB  102,68,15,111,21,169,39,1,0         ; movdqa        0x127a9(%rip),%xmm10        # 34360 <_sk_srcover_bgra_8888_sse2_lowp+0x1144>
+  DB  102,68,15,111,21,151,39,1,0         ; movdqa        0x12797(%rip),%xmm10        # 33d40 <_sk_srcover_bgra_8888_sse2_lowp+0x1150>
   DB  102,68,15,111,225                   ; movdqa        %xmm1,%xmm12
   DB  102,69,15,219,226                   ; pand          %xmm10,%xmm12
-  DB  102,68,15,111,29,166,39,1,0         ; movdqa        0x127a6(%rip),%xmm11        # 34370 <_sk_srcover_bgra_8888_sse2_lowp+0x1154>
+  DB  102,68,15,111,29,148,39,1,0         ; movdqa        0x12794(%rip),%xmm11        # 33d50 <_sk_srcover_bgra_8888_sse2_lowp+0x1160>
   DB  102,65,15,219,203                   ; pand          %xmm11,%xmm1
-  DB  102,15,111,29,169,39,1,0            ; movdqa        0x127a9(%rip),%xmm3        # 34380 <_sk_srcover_bgra_8888_sse2_lowp+0x1164>
+  DB  102,15,111,29,151,39,1,0            ; movdqa        0x12797(%rip),%xmm3        # 33d60 <_sk_srcover_bgra_8888_sse2_lowp+0x1170>
   DB  102,65,15,114,244,16                ; pslld         $0x10,%xmm12
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
   DB  102,15,102,193                      ; pcmpgtd       %xmm1,%xmm0
   DB  102,15,114,241,13                   ; pslld         $0xd,%xmm1
   DB  102,65,15,235,204                   ; por           %xmm12,%xmm1
-  DB  102,68,15,111,37,152,39,1,0         ; movdqa        0x12798(%rip),%xmm12        # 34390 <_sk_srcover_bgra_8888_sse2_lowp+0x1174>
+  DB  102,68,15,111,37,134,39,1,0         ; movdqa        0x12786(%rip),%xmm12        # 33d70 <_sk_srcover_bgra_8888_sse2_lowp+0x1180>
   DB  102,65,15,254,204                   ; paddd         %xmm12,%xmm1
   DB  102,15,223,193                      ; pandn         %xmm1,%xmm0
   DB  102,65,15,105,208                   ; punpckhwd     %xmm8,%xmm2
@@ -31867,19 +31618,19 @@
 _sk_store_f16_sse2 LABEL PROC
   DB  72,131,236,24                       ; sub           $0x18,%rsp
   DB  15,41,60,36                         ; movaps        %xmm7,(%rsp)
-  DB  102,68,15,111,29,233,38,1,0         ; movdqa        0x126e9(%rip),%xmm11        # 343a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1184>
+  DB  102,68,15,111,29,215,38,1,0         ; movdqa        0x126d7(%rip),%xmm11        # 33d80 <_sk_srcover_bgra_8888_sse2_lowp+0x1190>
   DB  102,68,15,111,192                   ; movdqa        %xmm0,%xmm8
   DB  102,69,15,219,195                   ; pand          %xmm11,%xmm8
-  DB  102,68,15,111,21,230,38,1,0         ; movdqa        0x126e6(%rip),%xmm10        # 343b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1194>
+  DB  102,68,15,111,21,212,38,1,0         ; movdqa        0x126d4(%rip),%xmm10        # 33d90 <_sk_srcover_bgra_8888_sse2_lowp+0x11a0>
   DB  102,68,15,111,240                   ; movdqa        %xmm0,%xmm14
   DB  102,69,15,219,242                   ; pand          %xmm10,%xmm14
-  DB  102,15,111,61,228,38,1,0            ; movdqa        0x126e4(%rip),%xmm7        # 343c0 <_sk_srcover_bgra_8888_sse2_lowp+0x11a4>
-  DB  102,68,15,111,37,107,40,1,0         ; movdqa        0x1286b(%rip),%xmm12        # 34550 <_sk_srcover_bgra_8888_sse2_lowp+0x1334>
+  DB  102,15,111,61,210,38,1,0            ; movdqa        0x126d2(%rip),%xmm7        # 33da0 <_sk_srcover_bgra_8888_sse2_lowp+0x11b0>
+  DB  102,68,15,111,37,89,40,1,0          ; movdqa        0x12859(%rip),%xmm12        # 33f30 <_sk_srcover_bgra_8888_sse2_lowp+0x1340>
   DB  102,68,15,111,248                   ; movdqa        %xmm0,%xmm15
   DB  102,65,15,114,247,3                 ; pslld         $0x3,%xmm15
   DB  102,69,15,219,252                   ; pand          %xmm12,%xmm15
   DB  102,69,15,254,248                   ; paddd         %xmm8,%xmm15
-  DB  102,68,15,111,45,61,35,1,0          ; movdqa        0x1233d(%rip),%xmm13        # 34040 <_sk_srcover_bgra_8888_sse2_lowp+0xe24>
+  DB  102,68,15,111,45,43,35,1,0          ; movdqa        0x1232b(%rip),%xmm13        # 33a20 <_sk_srcover_bgra_8888_sse2_lowp+0xe30>
   DB  102,69,15,254,253                   ; paddd         %xmm13,%xmm15
   DB  102,65,15,114,231,16                ; psrad         $0x10,%xmm15
   DB  102,68,15,111,199                   ; movdqa        %xmm7,%xmm8
@@ -31928,49 +31679,45 @@
   DB  102,15,107,248                      ; packssdw      %xmm0,%xmm7
   DB  102,68,15,97,247                    ; punpcklwd     %xmm7,%xmm14
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
+  DB  76,99,64,8                          ; movslq        0x8(%rax),%r8
+  DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  73,193,224,3                        ; shl           $0x3,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,40                              ; jne           21e38 <_sk_store_f16_sse2+0x192>
+  DB  117,40                              ; jne           21824 <_sk_store_f16_sse2+0x18c>
   DB  102,65,15,111,248                   ; movdqa        %xmm8,%xmm7
   DB  102,65,15,98,254                    ; punpckldq     %xmm14,%xmm7
-  DB  243,65,15,127,60,192                ; movdqu        %xmm7,(%r8,%rax,8)
+  DB  243,65,15,127,60,208                ; movdqu        %xmm7,(%r8,%rdx,8)
   DB  102,69,15,106,198                   ; punpckhdq     %xmm14,%xmm8
-  DB  243,69,15,127,68,192,16             ; movdqu        %xmm8,0x10(%r8,%rax,8)
+  DB  243,69,15,127,68,208,16             ; movdqu        %xmm8,0x10(%r8,%rdx,8)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,40,60,36                         ; movaps        (%rsp),%xmm7
   DB  72,131,196,24                       ; add           $0x18,%rsp
   DB  255,224                             ; jmpq          *%rax
   DB  102,69,15,111,200                   ; movdqa        %xmm8,%xmm9
   DB  102,69,15,98,206                    ; punpckldq     %xmm14,%xmm9
-  DB  102,69,15,214,12,192                ; movq          %xmm9,(%r8,%rax,8)
+  DB  102,69,15,214,12,208                ; movq          %xmm9,(%r8,%rdx,8)
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,222                             ; je            21e2c <_sk_store_f16_sse2+0x186>
-  DB  102,69,15,23,76,192,8               ; movhpd        %xmm9,0x8(%r8,%rax,8)
+  DB  116,222                             ; je            21818 <_sk_store_f16_sse2+0x180>
+  DB  102,69,15,23,76,208,8               ; movhpd        %xmm9,0x8(%r8,%rdx,8)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,209                             ; jb            21e2c <_sk_store_f16_sse2+0x186>
+  DB  114,209                             ; jb            21818 <_sk_store_f16_sse2+0x180>
   DB  102,69,15,106,198                   ; punpckhdq     %xmm14,%xmm8
-  DB  102,69,15,214,68,192,16             ; movq          %xmm8,0x10(%r8,%rax,8)
-  DB  235,195                             ; jmp           21e2c <_sk_store_f16_sse2+0x186>
+  DB  102,69,15,214,68,208,16             ; movq          %xmm8,0x10(%r8,%rdx,8)
+  DB  235,195                             ; jmp           21818 <_sk_store_f16_sse2+0x180>
 
 PUBLIC _sk_load_u16_be_sse2
 _sk_load_u16_be_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9d
-  DB  76,99,80,8                          ; movslq        0x8(%rax),%r10
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,194                       ; imul          %r10,%r8
-  DB  77,1,192                            ; add           %r8,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  73,99,193                           ; movslq        %r9d,%rax
+  DB  76,141,4,149,0,0,0,0                ; lea           0x0(,%rdx,4),%r8
+  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  77,1,201                            ; add           %r9,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,190,0,0,0                    ; jne           21f4e <_sk_load_u16_be_sse2+0xe5>
-  DB  102,65,15,16,4,64                   ; movupd        (%r8,%rax,2),%xmm0
-  DB  243,65,15,111,76,64,16              ; movdqu        0x10(%r8,%rax,2),%xmm1
+  DB  15,133,190,0,0,0                    ; jne           21934 <_sk_load_u16_be_sse2+0xdf>
+  DB  102,67,15,16,4,65                   ; movupd        (%r9,%r8,2),%xmm0
+  DB  243,67,15,111,76,65,16              ; movdqu        0x10(%r9,%r8,2),%xmm1
   DB  102,15,40,208                       ; movapd        %xmm0,%xmm2
   DB  102,15,97,209                       ; punpcklwd     %xmm1,%xmm2
   DB  102,15,105,193                      ; punpckhwd     %xmm1,%xmm0
@@ -31985,7 +31732,7 @@
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
   DB  102,65,15,97,201                    ; punpcklwd     %xmm9,%xmm1
   DB  15,91,193                           ; cvtdq2ps      %xmm1,%xmm0
-  DB  68,15,40,5,79,34,1,0                ; movaps        0x1224f(%rip),%xmm8        # 34130 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
+  DB  68,15,40,5,73,34,1,0                ; movaps        0x12249(%rip),%xmm8        # 33b10 <_sk_srcover_bgra_8888_sse2_lowp+0xf20>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  102,15,111,203                      ; movdqa        %xmm3,%xmm1
   DB  102,15,113,241,8                    ; psllw         $0x8,%xmm1
@@ -32011,35 +31758,31 @@
   DB  65,15,89,216                        ; mulps         %xmm8,%xmm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  242,65,15,16,4,64                   ; movsd         (%r8,%rax,2),%xmm0
+  DB  242,67,15,16,4,65                   ; movsd         (%r9,%r8,2),%xmm0
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,13                              ; jne           21f67 <_sk_load_u16_be_sse2+0xfe>
+  DB  117,13                              ; jne           2194d <_sk_load_u16_be_sse2+0xf8>
   DB  243,15,126,192                      ; movq          %xmm0,%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  233,54,255,255,255                  ; jmpq          21e9d <_sk_load_u16_be_sse2+0x34>
-  DB  102,65,15,22,68,64,8                ; movhpd        0x8(%r8,%rax,2),%xmm0
+  DB  233,54,255,255,255                  ; jmpq          21883 <_sk_load_u16_be_sse2+0x2e>
+  DB  102,67,15,22,68,65,8                ; movhpd        0x8(%r9,%r8,2),%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  15,130,33,255,255,255               ; jb            21e9d <_sk_load_u16_be_sse2+0x34>
-  DB  243,65,15,126,76,64,16              ; movq          0x10(%r8,%rax,2),%xmm1
-  DB  233,21,255,255,255                  ; jmpq          21e9d <_sk_load_u16_be_sse2+0x34>
+  DB  15,130,33,255,255,255               ; jb            21883 <_sk_load_u16_be_sse2+0x2e>
+  DB  243,67,15,126,76,65,16              ; movq          0x10(%r9,%r8,2),%xmm1
+  DB  233,21,255,255,255                  ; jmpq          21883 <_sk_load_u16_be_sse2+0x2e>
 
 PUBLIC _sk_load_rgb_u16_be_sse2
 _sk_load_rgb_u16_be_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  76,141,4,82                         ; lea           (%rdx,%rdx,2),%r8
   DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,193                       ; imul          %r9,%r8
-  DB  77,1,192                            ; add           %r8,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  72,137,208                          ; mov           %rdx,%rax
-  DB  72,193,224,32                       ; shl           $0x20,%rax
-  DB  72,141,4,64                         ; lea           (%rax,%rax,2),%rax
-  DB  72,193,248,32                       ; sar           $0x20,%rax
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  77,1,201                            ; add           %r9,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,175,0,0,0                    ; jne           22062 <_sk_load_rgb_u16_be_sse2+0xda>
-  DB  243,65,15,111,20,64                 ; movdqu        (%r8,%rax,2),%xmm2
-  DB  243,65,15,111,92,64,8               ; movdqu        0x8(%r8,%rax,2),%xmm3
+  DB  15,133,175,0,0,0                    ; jne           21a3a <_sk_load_rgb_u16_be_sse2+0xcc>
+  DB  243,67,15,111,20,65                 ; movdqu        (%r9,%r8,2),%xmm2
+  DB  243,67,15,111,92,65,8               ; movdqu        0x8(%r9,%r8,2),%xmm3
   DB  102,15,115,219,4                    ; psrldq        $0x4,%xmm3
   DB  102,15,111,194                      ; movdqa        %xmm2,%xmm0
   DB  102,15,115,216,6                    ; psrldq        $0x6,%xmm0
@@ -32058,7 +31801,7 @@
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  102,65,15,97,200                    ; punpcklwd     %xmm8,%xmm1
   DB  15,91,193                           ; cvtdq2ps      %xmm1,%xmm0
-  DB  68,15,40,13,25,33,1,0               ; movaps        0x12119(%rip),%xmm9        # 34130 <_sk_srcover_bgra_8888_sse2_lowp+0xf14>
+  DB  68,15,40,13,33,33,1,0               ; movaps        0x12121(%rip),%xmm9        # 33b10 <_sk_srcover_bgra_8888_sse2_lowp+0xf20>
   DB  65,15,89,193                        ; mulps         %xmm9,%xmm0
   DB  102,15,111,203                      ; movdqa        %xmm3,%xmm1
   DB  102,15,113,241,8                    ; psllw         $0x8,%xmm1
@@ -32075,44 +31818,42 @@
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
   DB  65,15,89,209                        ; mulps         %xmm9,%xmm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,48,30,1,0                  ; movaps        0x11e30(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,29,56,30,1,0                  ; movaps        0x11e38(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  255,224                             ; jmpq          *%rax
-  DB  102,65,15,110,20,64                 ; movd          (%r8,%rax,2),%xmm2
+  DB  102,67,15,110,20,65                 ; movd          (%r9,%r8,2),%xmm2
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  102,65,15,196,84,64,4,2             ; pinsrw        $0x2,0x4(%r8,%rax,2),%xmm2
+  DB  102,67,15,196,84,65,4,2             ; pinsrw        $0x2,0x4(%r9,%r8,2),%xmm2
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,13                              ; jne           22087 <_sk_load_rgb_u16_be_sse2+0xff>
+  DB  117,13                              ; jne           21a5f <_sk_load_rgb_u16_be_sse2+0xf1>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
-  DB  233,80,255,255,255                  ; jmpq          21fd7 <_sk_load_rgb_u16_be_sse2+0x4f>
-  DB  102,65,15,110,68,64,6               ; movd          0x6(%r8,%rax,2),%xmm0
+  DB  233,80,255,255,255                  ; jmpq          219af <_sk_load_rgb_u16_be_sse2+0x41>
+  DB  102,67,15,110,68,65,6               ; movd          0x6(%r9,%r8,2),%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  102,65,15,196,68,64,10,2            ; pinsrw        $0x2,0xa(%r8,%rax,2),%xmm0
+  DB  102,67,15,196,68,65,10,2            ; pinsrw        $0x2,0xa(%r9,%r8,2),%xmm0
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,24                              ; jb            220b8 <_sk_load_rgb_u16_be_sse2+0x130>
-  DB  102,65,15,110,92,64,12              ; movd          0xc(%r8,%rax,2),%xmm3
+  DB  114,24                              ; jb            21a90 <_sk_load_rgb_u16_be_sse2+0x122>
+  DB  102,67,15,110,92,65,12              ; movd          0xc(%r9,%r8,2),%xmm3
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  102,65,15,196,92,64,16,2            ; pinsrw        $0x2,0x10(%r8,%rax,2),%xmm3
-  DB  233,31,255,255,255                  ; jmpq          21fd7 <_sk_load_rgb_u16_be_sse2+0x4f>
+  DB  102,67,15,196,92,65,16,2            ; pinsrw        $0x2,0x10(%r9,%r8,2),%xmm3
+  DB  233,31,255,255,255                  ; jmpq          219af <_sk_load_rgb_u16_be_sse2+0x41>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
-  DB  233,22,255,255,255                  ; jmpq          21fd7 <_sk_load_rgb_u16_be_sse2+0x4f>
+  DB  233,22,255,255,255                  ; jmpq          219af <_sk_load_rgb_u16_be_sse2+0x41>
 
 PUBLIC _sk_store_u16_be_sse2
 _sk_store_u16_be_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9d
-  DB  76,99,80,8                          ; movslq        0x8(%rax),%r10
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,194                       ; imul          %r10,%r8
-  DB  77,1,192                            ; add           %r8,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  73,99,193                           ; movslq        %r9d,%rax
+  DB  76,141,4,149,0,0,0,0                ; lea           0x0(,%rdx,4),%r8
+  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  77,1,201                            ; add           %r9,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  68,15,95,192                        ; maxps         %xmm0,%xmm8
-  DB  68,15,40,21,157,29,1,0              ; movaps        0x11d9d(%rip),%xmm10        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,21,171,29,1,0              ; movaps        0x11dab(%rip),%xmm10        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,93,194                        ; minps         %xmm10,%xmm8
-  DB  68,15,40,29,225,34,1,0              ; movaps        0x122e1(%rip),%xmm11        # 343e0 <_sk_srcover_bgra_8888_sse2_lowp+0x11c4>
+  DB  68,15,40,29,239,34,1,0              ; movaps        0x122ef(%rip),%xmm11        # 33dc0 <_sk_srcover_bgra_8888_sse2_lowp+0x11d0>
   DB  69,15,89,195                        ; mulps         %xmm11,%xmm8
   DB  102,69,15,91,192                    ; cvtps2dq      %xmm8,%xmm8
   DB  102,65,15,114,240,16                ; pslld         $0x10,%xmm8
@@ -32162,38 +31903,38 @@
   DB  102,69,15,111,200                   ; movdqa        %xmm8,%xmm9
   DB  102,69,15,98,204                    ; punpckldq     %xmm12,%xmm9
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,21                              ; jne           2220f <_sk_store_u16_be_sse2+0x14e>
-  DB  69,15,17,12,64                      ; movups        %xmm9,(%r8,%rax,2)
+  DB  117,21                              ; jne           21be1 <_sk_store_u16_be_sse2+0x148>
+  DB  71,15,17,12,65                      ; movups        %xmm9,(%r9,%r8,2)
   DB  102,69,15,106,196                   ; punpckhdq     %xmm12,%xmm8
-  DB  243,69,15,127,68,64,16              ; movdqu        %xmm8,0x10(%r8,%rax,2)
+  DB  243,71,15,127,68,65,16              ; movdqu        %xmm8,0x10(%r9,%r8,2)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
-  DB  102,69,15,214,12,64                 ; movq          %xmm9,(%r8,%rax,2)
+  DB  102,71,15,214,12,65                 ; movq          %xmm9,(%r9,%r8,2)
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,240                             ; je            2220b <_sk_store_u16_be_sse2+0x14a>
-  DB  102,69,15,23,76,64,8                ; movhpd        %xmm9,0x8(%r8,%rax,2)
+  DB  116,240                             ; je            21bdd <_sk_store_u16_be_sse2+0x144>
+  DB  102,71,15,23,76,65,8                ; movhpd        %xmm9,0x8(%r9,%r8,2)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,227                             ; jb            2220b <_sk_store_u16_be_sse2+0x14a>
+  DB  114,227                             ; jb            21bdd <_sk_store_u16_be_sse2+0x144>
   DB  102,69,15,106,196                   ; punpckhdq     %xmm12,%xmm8
-  DB  102,69,15,214,68,64,16              ; movq          %xmm8,0x10(%r8,%rax,2)
-  DB  235,213                             ; jmp           2220b <_sk_store_u16_be_sse2+0x14a>
+  DB  102,71,15,214,68,65,16              ; movq          %xmm8,0x10(%r9,%r8,2)
+  DB  235,213                             ; jmp           21bdd <_sk_store_u16_be_sse2+0x144>
 
 PUBLIC _sk_load_f32_sse2
 _sk_load_f32_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9d
-  DB  76,99,80,8                          ; movslq        0x8(%rax),%r10
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,194                       ; imul          %r10,%r8
-  DB  73,193,224,2                        ; shl           $0x2,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  73,99,193                           ; movslq        %r9d,%rax
-  DB  69,15,16,4,128                      ; movups        (%r8,%rax,4),%xmm8
+  DB  76,141,4,149,0,0,0,0                ; lea           0x0(,%rdx,4),%r8
+  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  73,193,225,2                        ; shl           $0x2,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
+  DB  72,137,208                          ; mov           %rdx,%rax
+  DB  72,193,224,4                        ; shl           $0x4,%rax
+  DB  70,15,16,4,8                        ; movups        (%rax,%r9,1),%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,66                              ; jne           222a1 <_sk_load_f32_sse2+0x6b>
-  DB  65,15,16,68,128,16                  ; movups        0x10(%r8,%rax,4),%xmm0
-  DB  65,15,16,92,128,32                  ; movups        0x20(%r8,%rax,4),%xmm3
-  DB  69,15,16,76,128,48                  ; movups        0x30(%r8,%rax,4),%xmm9
+  DB  117,66                              ; jne           21c74 <_sk_load_f32_sse2+0x6c>
+  DB  67,15,16,68,129,16                  ; movups        0x10(%r9,%r8,4),%xmm0
+  DB  67,15,16,92,129,32                  ; movups        0x20(%r9,%r8,4),%xmm3
+  DB  71,15,16,76,129,48                  ; movups        0x30(%r9,%r8,4),%xmm9
   DB  65,15,40,208                        ; movaps        %xmm8,%xmm2
   DB  15,20,208                           ; unpcklps      %xmm0,%xmm2
   DB  15,40,203                           ; movaps        %xmm3,%xmm1
@@ -32210,34 +31951,34 @@
   DB  255,224                             ; jmpq          *%rax
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,8                               ; jne           222b3 <_sk_load_f32_sse2+0x7d>
+  DB  117,8                               ; jne           21c86 <_sk_load_f32_sse2+0x7e>
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
-  DB  235,190                             ; jmp           22271 <_sk_load_f32_sse2+0x3b>
-  DB  65,15,16,68,128,16                  ; movups        0x10(%r8,%rax,4),%xmm0
+  DB  235,190                             ; jmp           21c44 <_sk_load_f32_sse2+0x3c>
+  DB  67,15,16,68,129,16                  ; movups        0x10(%r9,%r8,4),%xmm0
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,8                               ; jb            222c7 <_sk_load_f32_sse2+0x91>
-  DB  65,15,16,92,128,32                  ; movups        0x20(%r8,%rax,4),%xmm3
-  DB  235,170                             ; jmp           22271 <_sk_load_f32_sse2+0x3b>
+  DB  114,8                               ; jb            21c9a <_sk_load_f32_sse2+0x92>
+  DB  67,15,16,92,129,32                  ; movups        0x20(%r9,%r8,4),%xmm3
+  DB  235,170                             ; jmp           21c44 <_sk_load_f32_sse2+0x3c>
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
-  DB  235,165                             ; jmp           22271 <_sk_load_f32_sse2+0x3b>
+  DB  235,165                             ; jmp           21c44 <_sk_load_f32_sse2+0x3c>
 
 PUBLIC _sk_load_f32_dst_sse2
 _sk_load_f32_dst_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9d
-  DB  76,99,80,8                          ; movslq        0x8(%rax),%r10
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,194                       ; imul          %r10,%r8
-  DB  73,193,224,2                        ; shl           $0x2,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  73,99,193                           ; movslq        %r9d,%rax
-  DB  69,15,16,4,128                      ; movups        (%r8,%rax,4),%xmm8
+  DB  76,141,4,149,0,0,0,0                ; lea           0x0(,%rdx,4),%r8
+  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  73,193,225,2                        ; shl           $0x2,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
+  DB  72,137,208                          ; mov           %rdx,%rax
+  DB  72,193,224,4                        ; shl           $0x4,%rax
+  DB  70,15,16,4,8                        ; movups        (%rax,%r9,1),%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,66                              ; jne           22337 <_sk_load_f32_dst_sse2+0x6b>
-  DB  65,15,16,100,128,16                 ; movups        0x10(%r8,%rax,4),%xmm4
-  DB  65,15,16,124,128,32                 ; movups        0x20(%r8,%rax,4),%xmm7
-  DB  69,15,16,76,128,48                  ; movups        0x30(%r8,%rax,4),%xmm9
+  DB  117,66                              ; jne           21d0b <_sk_load_f32_dst_sse2+0x6c>
+  DB  67,15,16,100,129,16                 ; movups        0x10(%r9,%r8,4),%xmm4
+  DB  67,15,16,124,129,32                 ; movups        0x20(%r9,%r8,4),%xmm7
+  DB  71,15,16,76,129,48                  ; movups        0x30(%r9,%r8,4),%xmm9
   DB  65,15,40,240                        ; movaps        %xmm8,%xmm6
   DB  15,20,244                           ; unpcklps      %xmm4,%xmm6
   DB  15,40,239                           ; movaps        %xmm7,%xmm5
@@ -32254,28 +31995,28 @@
   DB  255,224                             ; jmpq          *%rax
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,8                               ; jne           22349 <_sk_load_f32_dst_sse2+0x7d>
+  DB  117,8                               ; jne           21d1d <_sk_load_f32_dst_sse2+0x7e>
   DB  15,87,255                           ; xorps         %xmm7,%xmm7
   DB  15,87,228                           ; xorps         %xmm4,%xmm4
-  DB  235,190                             ; jmp           22307 <_sk_load_f32_dst_sse2+0x3b>
-  DB  65,15,16,100,128,16                 ; movups        0x10(%r8,%rax,4),%xmm4
+  DB  235,190                             ; jmp           21cdb <_sk_load_f32_dst_sse2+0x3c>
+  DB  67,15,16,100,129,16                 ; movups        0x10(%r9,%r8,4),%xmm4
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,8                               ; jb            2235d <_sk_load_f32_dst_sse2+0x91>
-  DB  65,15,16,124,128,32                 ; movups        0x20(%r8,%rax,4),%xmm7
-  DB  235,170                             ; jmp           22307 <_sk_load_f32_dst_sse2+0x3b>
+  DB  114,8                               ; jb            21d31 <_sk_load_f32_dst_sse2+0x92>
+  DB  67,15,16,124,129,32                 ; movups        0x20(%r9,%r8,4),%xmm7
+  DB  235,170                             ; jmp           21cdb <_sk_load_f32_dst_sse2+0x3c>
   DB  15,87,255                           ; xorps         %xmm7,%xmm7
-  DB  235,165                             ; jmp           22307 <_sk_load_f32_dst_sse2+0x3b>
+  DB  235,165                             ; jmp           21cdb <_sk_load_f32_dst_sse2+0x3c>
 
 PUBLIC _sk_store_f32_sse2
 _sk_store_f32_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9d
-  DB  76,99,80,8                          ; movslq        0x8(%rax),%r10
-  DB  76,99,193                           ; movslq        %ecx,%r8
-  DB  77,15,175,194                       ; imul          %r10,%r8
-  DB  73,193,224,2                        ; shl           $0x2,%r8
-  DB  76,3,0                              ; add           (%rax),%r8
-  DB  73,99,193                           ; movslq        %r9d,%rax
+  DB  76,141,4,149,0,0,0,0                ; lea           0x0(,%rdx,4),%r8
+  DB  76,99,72,8                          ; movslq        0x8(%rax),%r9
+  DB  76,15,175,201                       ; imul          %rcx,%r9
+  DB  73,193,225,2                        ; shl           $0x2,%r9
+  DB  76,3,8                              ; add           (%rax),%r9
+  DB  72,137,208                          ; mov           %rdx,%rax
+  DB  72,193,224,4                        ; shl           $0x4,%rax
   DB  68,15,40,200                        ; movaps        %xmm0,%xmm9
   DB  68,15,20,201                        ; unpcklps      %xmm1,%xmm9
   DB  68,15,40,194                        ; movaps        %xmm2,%xmm8
@@ -32289,22 +32030,22 @@
   DB  69,15,18,193                        ; movhlps       %xmm9,%xmm8
   DB  69,15,40,202                        ; movaps        %xmm10,%xmm9
   DB  102,69,15,20,203                    ; unpcklpd      %xmm11,%xmm9
-  DB  102,69,15,17,36,128                 ; movupd        %xmm12,(%r8,%rax,4)
+  DB  102,70,15,17,36,8                   ; movupd        %xmm12,(%rax,%r9,1)
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,29                              ; jne           223df <_sk_store_f32_sse2+0x7d>
+  DB  117,29                              ; jne           21db4 <_sk_store_f32_sse2+0x7e>
   DB  102,69,15,21,211                    ; unpckhpd      %xmm11,%xmm10
-  DB  69,15,17,68,128,16                  ; movups        %xmm8,0x10(%r8,%rax,4)
-  DB  102,69,15,17,76,128,32              ; movupd        %xmm9,0x20(%r8,%rax,4)
-  DB  102,69,15,17,84,128,48              ; movupd        %xmm10,0x30(%r8,%rax,4)
+  DB  71,15,17,68,129,16                  ; movups        %xmm8,0x10(%r9,%r8,4)
+  DB  102,71,15,17,76,129,32              ; movupd        %xmm9,0x20(%r9,%r8,4)
+  DB  102,71,15,17,84,129,48              ; movupd        %xmm10,0x30(%r9,%r8,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,246                             ; je            223db <_sk_store_f32_sse2+0x79>
-  DB  69,15,17,68,128,16                  ; movups        %xmm8,0x10(%r8,%rax,4)
+  DB  116,246                             ; je            21db0 <_sk_store_f32_sse2+0x7a>
+  DB  71,15,17,68,129,16                  ; movups        %xmm8,0x10(%r9,%r8,4)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,234                             ; jb            223db <_sk_store_f32_sse2+0x79>
-  DB  102,69,15,17,76,128,32              ; movupd        %xmm9,0x20(%r8,%rax,4)
-  DB  235,225                             ; jmp           223db <_sk_store_f32_sse2+0x79>
+  DB  114,234                             ; jb            21db0 <_sk_store_f32_sse2+0x7a>
+  DB  102,71,15,17,76,129,32              ; movupd        %xmm9,0x20(%r9,%r8,4)
+  DB  235,225                             ; jmp           21db0 <_sk_store_f32_sse2+0x7a>
 
 PUBLIC _sk_repeat_x_sse2
 _sk_repeat_x_sse2 LABEL PROC
@@ -32316,7 +32057,7 @@
   DB  243,69,15,91,209                    ; cvttps2dq     %xmm9,%xmm10
   DB  69,15,91,210                        ; cvtdq2ps      %xmm10,%xmm10
   DB  69,15,194,202,1                     ; cmpltps       %xmm10,%xmm9
-  DB  68,15,84,13,106,26,1,0              ; andps         0x11a6a(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,84,13,117,26,1,0              ; andps         0x11a75(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,92,209                        ; subps         %xmm9,%xmm10
   DB  69,15,198,192,0                     ; shufps        $0x0,%xmm8,%xmm8
   DB  69,15,89,194                        ; mulps         %xmm10,%xmm8
@@ -32334,7 +32075,7 @@
   DB  243,69,15,91,209                    ; cvttps2dq     %xmm9,%xmm10
   DB  69,15,91,210                        ; cvtdq2ps      %xmm10,%xmm10
   DB  69,15,194,202,1                     ; cmpltps       %xmm10,%xmm9
-  DB  68,15,84,13,41,26,1,0               ; andps         0x11a29(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,84,13,52,26,1,0               ; andps         0x11a34(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,92,209                        ; subps         %xmm9,%xmm10
   DB  69,15,198,192,0                     ; shufps        $0x0,%xmm8,%xmm8
   DB  69,15,89,194                        ; mulps         %xmm10,%xmm8
@@ -32352,13 +32093,13 @@
   DB  65,15,92,194                        ; subps         %xmm10,%xmm0
   DB  243,69,15,88,192                    ; addss         %xmm8,%xmm8
   DB  69,15,198,192,0                     ; shufps        $0x0,%xmm8,%xmm8
-  DB  243,68,15,89,13,31,16,1,0           ; mulss         0x1101f(%rip),%xmm9        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  243,68,15,89,13,30,16,1,0           ; mulss         0x1101e(%rip),%xmm9        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
   DB  68,15,89,200                        ; mulps         %xmm0,%xmm9
   DB  243,69,15,91,217                    ; cvttps2dq     %xmm9,%xmm11
   DB  69,15,91,219                        ; cvtdq2ps      %xmm11,%xmm11
   DB  69,15,194,203,1                     ; cmpltps       %xmm11,%xmm9
-  DB  68,15,84,13,200,25,1,0              ; andps         0x119c8(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,84,13,211,25,1,0              ; andps         0x119d3(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,87,228                        ; xorps         %xmm12,%xmm12
   DB  69,15,92,217                        ; subps         %xmm9,%xmm11
   DB  69,15,89,216                        ; mulps         %xmm8,%xmm11
@@ -32379,13 +32120,13 @@
   DB  65,15,92,202                        ; subps         %xmm10,%xmm1
   DB  243,69,15,88,192                    ; addss         %xmm8,%xmm8
   DB  69,15,198,192,0                     ; shufps        $0x0,%xmm8,%xmm8
-  DB  243,68,15,89,13,179,15,1,0          ; mulss         0x10fb3(%rip),%xmm9        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  243,68,15,89,13,178,15,1,0          ; mulss         0x10fb2(%rip),%xmm9        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
   DB  68,15,89,201                        ; mulps         %xmm1,%xmm9
   DB  243,69,15,91,217                    ; cvttps2dq     %xmm9,%xmm11
   DB  69,15,91,219                        ; cvtdq2ps      %xmm11,%xmm11
   DB  69,15,194,203,1                     ; cmpltps       %xmm11,%xmm9
-  DB  68,15,84,13,92,25,1,0               ; andps         0x1195c(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,84,13,103,25,1,0              ; andps         0x11967(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,87,228                        ; xorps         %xmm12,%xmm12
   DB  69,15,92,217                        ; subps         %xmm9,%xmm11
   DB  69,15,89,216                        ; mulps         %xmm8,%xmm11
@@ -32400,7 +32141,7 @@
 _sk_clamp_x_1_sse2 LABEL PROC
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  68,15,95,192                        ; maxps         %xmm0,%xmm8
-  DB  68,15,93,5,44,25,1,0                ; minps         0x1192c(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,93,5,55,25,1,0                ; minps         0x11937(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  255,224                             ; jmpq          *%rax
@@ -32411,7 +32152,7 @@
   DB  69,15,91,200                        ; cvtdq2ps      %xmm8,%xmm9
   DB  68,15,40,208                        ; movaps        %xmm0,%xmm10
   DB  69,15,194,209,1                     ; cmpltps       %xmm9,%xmm10
-  DB  68,15,40,29,10,25,1,0               ; movaps        0x1190a(%rip),%xmm11        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,29,21,25,1,0               ; movaps        0x11915(%rip),%xmm11        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,84,211                        ; andps         %xmm11,%xmm10
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  69,15,92,202                        ; subps         %xmm10,%xmm9
@@ -32424,14 +32165,14 @@
 
 PUBLIC _sk_mirror_x_1_sse2
 _sk_mirror_x_1_sse2 LABEL PROC
-  DB  68,15,40,13,66,25,1,0               ; movaps        0x11942(%rip),%xmm9        # 33ef0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  DB  68,15,40,13,77,25,1,0               ; movaps        0x1194d(%rip),%xmm9        # 338d0 <_sk_srcover_bgra_8888_sse2_lowp+0xce0>
   DB  65,15,88,193                        ; addps         %xmm9,%xmm0
-  DB  68,15,40,21,198,24,1,0              ; movaps        0x118c6(%rip),%xmm10        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  68,15,40,21,209,24,1,0              ; movaps        0x118d1(%rip),%xmm10        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  68,15,89,208                        ; mulps         %xmm0,%xmm10
   DB  243,69,15,91,194                    ; cvttps2dq     %xmm10,%xmm8
   DB  69,15,91,216                        ; cvtdq2ps      %xmm8,%xmm11
   DB  69,15,194,211,1                     ; cmpltps       %xmm11,%xmm10
-  DB  68,15,40,37,188,24,1,0              ; movaps        0x118bc(%rip),%xmm12        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,37,199,24,1,0              ; movaps        0x118c7(%rip),%xmm12        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,84,212                        ; andps         %xmm12,%xmm10
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  69,15,92,218                        ; subps         %xmm10,%xmm11
@@ -32450,10 +32191,10 @@
 PUBLIC _sk_luminance_to_alpha_sse2
 _sk_luminance_to_alpha_sse2 LABEL PROC
   DB  15,40,218                           ; movaps        %xmm2,%xmm3
-  DB  15,89,5,222,29,1,0                  ; mulps         0x11dde(%rip),%xmm0        # 343f0 <_sk_srcover_bgra_8888_sse2_lowp+0x11d4>
-  DB  15,89,13,231,29,1,0                 ; mulps         0x11de7(%rip),%xmm1        # 34400 <_sk_srcover_bgra_8888_sse2_lowp+0x11e4>
+  DB  15,89,5,233,29,1,0                  ; mulps         0x11de9(%rip),%xmm0        # 33dd0 <_sk_srcover_bgra_8888_sse2_lowp+0x11e0>
+  DB  15,89,13,242,29,1,0                 ; mulps         0x11df2(%rip),%xmm1        # 33de0 <_sk_srcover_bgra_8888_sse2_lowp+0x11f0>
   DB  15,88,200                           ; addps         %xmm0,%xmm1
-  DB  15,89,29,237,29,1,0                 ; mulps         0x11ded(%rip),%xmm3        # 34410 <_sk_srcover_bgra_8888_sse2_lowp+0x11f4>
+  DB  15,89,29,248,29,1,0                 ; mulps         0x11df8(%rip),%xmm3        # 33df0 <_sk_srcover_bgra_8888_sse2_lowp+0x1200>
   DB  15,88,217                           ; addps         %xmm1,%xmm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
@@ -32749,9 +32490,9 @@
   DB  72,139,24                           ; mov           (%rax),%rbx
   DB  76,139,112,8                        ; mov           0x8(%rax),%r14
   DB  72,255,203                          ; dec           %rbx
-  DB  120,7                               ; js            22ac3 <_sk_evenly_spaced_gradient_sse2+0x18>
+  DB  120,7                               ; js            22498 <_sk_evenly_spaced_gradient_sse2+0x18>
   DB  243,72,15,42,203                    ; cvtsi2ss      %rbx,%xmm1
-  DB  235,21                              ; jmp           22ad8 <_sk_evenly_spaced_gradient_sse2+0x2d>
+  DB  235,21                              ; jmp           224ad <_sk_evenly_spaced_gradient_sse2+0x2d>
   DB  73,137,216                          ; mov           %rbx,%r8
   DB  73,209,232                          ; shr           %r8
   DB  131,227,1                           ; and           $0x1,%ebx
@@ -32853,7 +32594,7 @@
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  73,131,248,2                        ; cmp           $0x2,%r8
-  DB  114,41                              ; jb            22c9f <_sk_gradient_sse2+0x3b>
+  DB  114,41                              ; jb            22674 <_sk_gradient_sse2+0x3b>
   DB  76,139,72,72                        ; mov           0x48(%rax),%r9
   DB  73,255,200                          ; dec           %r8
   DB  73,131,193,4                        ; add           $0x4,%r9
@@ -32864,7 +32605,7 @@
   DB  102,15,250,202                      ; psubd         %xmm2,%xmm1
   DB  73,131,193,4                        ; add           $0x4,%r9
   DB  73,255,200                          ; dec           %r8
-  DB  117,230                             ; jne           22c85 <_sk_gradient_sse2+0x21>
+  DB  117,230                             ; jne           2265a <_sk_gradient_sse2+0x21>
   DB  102,15,112,209,78                   ; pshufd        $0x4e,%xmm1,%xmm2
   DB  102,73,15,126,209                   ; movq          %xmm2,%r9
   DB  69,137,200                          ; mov           %r9d,%r8d
@@ -32998,29 +32739,29 @@
   DB  69,15,94,220                        ; divps         %xmm12,%xmm11
   DB  69,15,40,227                        ; movaps        %xmm11,%xmm12
   DB  69,15,89,228                        ; mulps         %xmm12,%xmm12
-  DB  68,15,40,45,73,21,1,0               ; movaps        0x11549(%rip),%xmm13        # 34420 <_sk_srcover_bgra_8888_sse2_lowp+0x1204>
+  DB  68,15,40,45,84,21,1,0               ; movaps        0x11554(%rip),%xmm13        # 33e00 <_sk_srcover_bgra_8888_sse2_lowp+0x1210>
   DB  69,15,89,236                        ; mulps         %xmm12,%xmm13
-  DB  68,15,88,45,77,21,1,0               ; addps         0x1154d(%rip),%xmm13        # 34430 <_sk_srcover_bgra_8888_sse2_lowp+0x1214>
+  DB  68,15,88,45,88,21,1,0               ; addps         0x11558(%rip),%xmm13        # 33e10 <_sk_srcover_bgra_8888_sse2_lowp+0x1220>
   DB  69,15,89,236                        ; mulps         %xmm12,%xmm13
-  DB  68,15,88,45,81,21,1,0               ; addps         0x11551(%rip),%xmm13        # 34440 <_sk_srcover_bgra_8888_sse2_lowp+0x1224>
+  DB  68,15,88,45,92,21,1,0               ; addps         0x1155c(%rip),%xmm13        # 33e20 <_sk_srcover_bgra_8888_sse2_lowp+0x1230>
   DB  69,15,89,236                        ; mulps         %xmm12,%xmm13
-  DB  68,15,88,45,85,21,1,0               ; addps         0x11555(%rip),%xmm13        # 34450 <_sk_srcover_bgra_8888_sse2_lowp+0x1234>
+  DB  68,15,88,45,96,21,1,0               ; addps         0x11560(%rip),%xmm13        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0x1240>
   DB  69,15,89,235                        ; mulps         %xmm11,%xmm13
   DB  69,15,194,202,1                     ; cmpltps       %xmm10,%xmm9
-  DB  68,15,40,21,84,21,1,0               ; movaps        0x11554(%rip),%xmm10        # 34460 <_sk_srcover_bgra_8888_sse2_lowp+0x1244>
+  DB  68,15,40,21,95,21,1,0               ; movaps        0x1155f(%rip),%xmm10        # 33e40 <_sk_srcover_bgra_8888_sse2_lowp+0x1250>
   DB  69,15,92,213                        ; subps         %xmm13,%xmm10
   DB  69,15,84,209                        ; andps         %xmm9,%xmm10
   DB  69,15,85,205                        ; andnps        %xmm13,%xmm9
   DB  69,15,86,202                        ; orps          %xmm10,%xmm9
   DB  68,15,194,192,1                     ; cmpltps       %xmm0,%xmm8
-  DB  68,15,40,21,87,15,1,0               ; movaps        0x10f57(%rip),%xmm10        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  68,15,40,21,98,15,1,0               ; movaps        0x10f62(%rip),%xmm10        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  69,15,92,209                        ; subps         %xmm9,%xmm10
   DB  69,15,84,208                        ; andps         %xmm8,%xmm10
   DB  69,15,85,193                        ; andnps        %xmm9,%xmm8
   DB  69,15,86,194                        ; orps          %xmm10,%xmm8
   DB  68,15,40,201                        ; movaps        %xmm1,%xmm9
   DB  68,15,194,200,1                     ; cmpltps       %xmm0,%xmm9
-  DB  68,15,40,21,70,15,1,0               ; movaps        0x10f46(%rip),%xmm10        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,21,81,15,1,0               ; movaps        0x10f51(%rip),%xmm10        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,92,208                        ; subps         %xmm8,%xmm10
   DB  69,15,84,209                        ; andps         %xmm9,%xmm10
   DB  69,15,85,200                        ; andnps        %xmm8,%xmm9
@@ -33042,7 +32783,7 @@
 
 PUBLIC _sk_negate_x_sse2
 _sk_negate_x_sse2 LABEL PROC
-  DB  15,87,5,27,20,1,0                   ; xorps         0x1141b(%rip),%xmm0        # 343a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1184>
+  DB  15,87,5,38,20,1,0                   ; xorps         0x11426(%rip),%xmm0        # 33d80 <_sk_srcover_bgra_8888_sse2_lowp+0x1190>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
 
@@ -33109,7 +32850,7 @@
   DB  69,15,89,201                        ; mulps         %xmm9,%xmm9
   DB  65,15,92,193                        ; subps         %xmm9,%xmm0
   DB  15,81,192                           ; sqrtps        %xmm0,%xmm0
-  DB  15,87,5,93,19,1,0                   ; xorps         0x1135d(%rip),%xmm0        # 343a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1184>
+  DB  15,87,5,104,19,1,0                  ; xorps         0x11368(%rip),%xmm0        # 33d80 <_sk_srcover_bgra_8888_sse2_lowp+0x1190>
   DB  65,15,92,192                        ; subps         %xmm8,%xmm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -33125,7 +32866,7 @@
 
 PUBLIC _sk_alter_2pt_conical_unswap_sse2
 _sk_alter_2pt_conical_unswap_sse2 LABEL PROC
-  DB  68,15,40,5,40,14,1,0                ; movaps        0x10e28(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,51,14,1,0                ; movaps        0x10e33(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  68,15,92,192                        ; subps         %xmm0,%xmm8
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
@@ -33166,7 +32907,7 @@
 PUBLIC _sk_save_xy_sse2
 _sk_save_xy_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,15,40,5,182,13,1,0               ; movaps        0x10db6(%rip),%xmm8        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  68,15,40,5,193,13,1,0               ; movaps        0x10dc1(%rip),%xmm8        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  15,17,0                             ; movups        %xmm0,(%rax)
   DB  68,15,40,200                        ; movaps        %xmm0,%xmm9
   DB  69,15,88,200                        ; addps         %xmm8,%xmm9
@@ -33174,7 +32915,7 @@
   DB  69,15,91,210                        ; cvtdq2ps      %xmm10,%xmm10
   DB  69,15,40,217                        ; movaps        %xmm9,%xmm11
   DB  69,15,194,218,1                     ; cmpltps       %xmm10,%xmm11
-  DB  68,15,40,37,161,13,1,0              ; movaps        0x10da1(%rip),%xmm12        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,37,172,13,1,0              ; movaps        0x10dac(%rip),%xmm12        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,84,220                        ; andps         %xmm12,%xmm11
   DB  69,15,92,211                        ; subps         %xmm11,%xmm10
   DB  69,15,92,202                        ; subps         %xmm10,%xmm9
@@ -33217,8 +32958,8 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,128,128,0,0,0              ; movups        0x80(%rax),%xmm8
-  DB  15,88,5,225,18,1,0                  ; addps         0x112e1(%rip),%xmm0        # 34470 <_sk_srcover_bgra_8888_sse2_lowp+0x1254>
-  DB  68,15,40,13,249,12,1,0              ; movaps        0x10cf9(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,88,5,236,18,1,0                  ; addps         0x112ec(%rip),%xmm0        # 33e50 <_sk_srcover_bgra_8888_sse2_lowp+0x1260>
+  DB  68,15,40,13,4,13,1,0                ; movaps        0x10d04(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
   DB  68,15,17,136,0,1,0,0                ; movups        %xmm9,0x100(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -33229,7 +32970,7 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,128,128,0,0,0              ; movups        0x80(%rax),%xmm8
-  DB  15,88,5,197,12,1,0                  ; addps         0x10cc5(%rip),%xmm0        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  15,88,5,208,12,1,0                  ; addps         0x10cd0(%rip),%xmm0        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  68,15,17,128,0,1,0,0                ; movups        %xmm8,0x100(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -33239,8 +32980,8 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,72,64                         ; movups        0x40(%rax),%xmm1
   DB  68,15,16,128,192,0,0,0              ; movups        0xc0(%rax),%xmm8
-  DB  15,88,13,148,18,1,0                 ; addps         0x11294(%rip),%xmm1        # 34470 <_sk_srcover_bgra_8888_sse2_lowp+0x1254>
-  DB  68,15,40,13,172,12,1,0              ; movaps        0x10cac(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,88,13,159,18,1,0                 ; addps         0x1129f(%rip),%xmm1        # 33e50 <_sk_srcover_bgra_8888_sse2_lowp+0x1260>
+  DB  68,15,40,13,183,12,1,0              ; movaps        0x10cb7(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
   DB  68,15,17,136,64,1,0,0               ; movups        %xmm9,0x140(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -33251,7 +32992,7 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,72,64                         ; movups        0x40(%rax),%xmm1
   DB  68,15,16,128,192,0,0,0              ; movups        0xc0(%rax),%xmm8
-  DB  15,88,13,119,12,1,0                 ; addps         0x10c77(%rip),%xmm1        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  15,88,13,130,12,1,0                 ; addps         0x10c82(%rip),%xmm1        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  68,15,17,128,64,1,0,0               ; movups        %xmm8,0x140(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -33261,13 +33002,13 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,128,128,0,0,0              ; movups        0x80(%rax),%xmm8
-  DB  15,88,5,87,18,1,0                   ; addps         0x11257(%rip),%xmm0        # 34480 <_sk_srcover_bgra_8888_sse2_lowp+0x1264>
-  DB  68,15,40,13,95,12,1,0               ; movaps        0x10c5f(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,88,5,98,18,1,0                   ; addps         0x11262(%rip),%xmm0        # 33e60 <_sk_srcover_bgra_8888_sse2_lowp+0x1270>
+  DB  68,15,40,13,106,12,1,0              ; movaps        0x10c6a(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
   DB  69,15,40,193                        ; movaps        %xmm9,%xmm8
   DB  69,15,89,192                        ; mulps         %xmm8,%xmm8
-  DB  68,15,89,13,75,18,1,0               ; mulps         0x1124b(%rip),%xmm9        # 34490 <_sk_srcover_bgra_8888_sse2_lowp+0x1274>
-  DB  68,15,88,13,67,14,1,0               ; addps         0x10e43(%rip),%xmm9        # 34090 <_sk_srcover_bgra_8888_sse2_lowp+0xe74>
+  DB  68,15,89,13,86,18,1,0               ; mulps         0x11256(%rip),%xmm9        # 33e70 <_sk_srcover_bgra_8888_sse2_lowp+0x1280>
+  DB  68,15,88,13,78,14,1,0               ; addps         0x10e4e(%rip),%xmm9        # 33a70 <_sk_srcover_bgra_8888_sse2_lowp+0xe80>
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  68,15,17,136,0,1,0,0                ; movups        %xmm9,0x100(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -33278,16 +33019,16 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,128,128,0,0,0              ; movups        0x80(%rax),%xmm8
-  DB  15,88,5,255,17,1,0                  ; addps         0x111ff(%rip),%xmm0        # 34470 <_sk_srcover_bgra_8888_sse2_lowp+0x1254>
-  DB  68,15,40,13,23,12,1,0               ; movaps        0x10c17(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,88,5,10,18,1,0                   ; addps         0x1120a(%rip),%xmm0        # 33e50 <_sk_srcover_bgra_8888_sse2_lowp+0x1260>
+  DB  68,15,40,13,34,12,1,0               ; movaps        0x10c22(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
-  DB  68,15,40,5,27,18,1,0                ; movaps        0x1121b(%rip),%xmm8        # 344a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1284>
+  DB  68,15,40,5,38,18,1,0                ; movaps        0x11226(%rip),%xmm8        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0x1290>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,31,18,1,0                ; addps         0x1121f(%rip),%xmm8        # 344b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
+  DB  68,15,88,5,42,18,1,0                ; addps         0x1122a(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0x12a0>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,227,11,1,0               ; addps         0x10be3(%rip),%xmm8        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  68,15,88,5,238,11,1,0               ; addps         0x10bee(%rip),%xmm8        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,23,18,1,0                ; addps         0x11217(%rip),%xmm8        # 344c0 <_sk_srcover_bgra_8888_sse2_lowp+0x12a4>
+  DB  68,15,88,5,34,18,1,0                ; addps         0x11222(%rip),%xmm8        # 33ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x12b0>
   DB  68,15,17,128,0,1,0,0                ; movups        %xmm8,0x100(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -33295,17 +33036,17 @@
 PUBLIC _sk_bicubic_p1x_sse2
 _sk_bicubic_p1x_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,15,40,5,193,11,1,0               ; movaps        0x10bc1(%rip),%xmm8        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  68,15,40,5,204,11,1,0               ; movaps        0x10bcc(%rip),%xmm8        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,136,128,0,0,0              ; movups        0x80(%rax),%xmm9
   DB  65,15,88,192                        ; addps         %xmm8,%xmm0
-  DB  68,15,40,21,202,17,1,0              ; movaps        0x111ca(%rip),%xmm10        # 344a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1284>
+  DB  68,15,40,21,213,17,1,0              ; movaps        0x111d5(%rip),%xmm10        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0x1290>
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
-  DB  68,15,88,21,206,17,1,0              ; addps         0x111ce(%rip),%xmm10        # 344b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
+  DB  68,15,88,21,217,17,1,0              ; addps         0x111d9(%rip),%xmm10        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0x12a0>
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
   DB  69,15,88,208                        ; addps         %xmm8,%xmm10
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
-  DB  68,15,88,21,202,17,1,0              ; addps         0x111ca(%rip),%xmm10        # 344c0 <_sk_srcover_bgra_8888_sse2_lowp+0x12a4>
+  DB  68,15,88,21,213,17,1,0              ; addps         0x111d5(%rip),%xmm10        # 33ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x12b0>
   DB  68,15,17,144,0,1,0,0                ; movups        %xmm10,0x100(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -33315,11 +33056,11 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,128,128,0,0,0              ; movups        0x80(%rax),%xmm8
-  DB  15,88,5,154,17,1,0                  ; addps         0x1119a(%rip),%xmm0        # 344b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
+  DB  15,88,5,165,17,1,0                  ; addps         0x111a5(%rip),%xmm0        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0x12a0>
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  69,15,89,201                        ; mulps         %xmm9,%xmm9
-  DB  68,15,89,5,106,17,1,0               ; mulps         0x1116a(%rip),%xmm8        # 34490 <_sk_srcover_bgra_8888_sse2_lowp+0x1274>
-  DB  68,15,88,5,98,13,1,0                ; addps         0x10d62(%rip),%xmm8        # 34090 <_sk_srcover_bgra_8888_sse2_lowp+0xe74>
+  DB  68,15,89,5,117,17,1,0               ; mulps         0x11175(%rip),%xmm8        # 33e70 <_sk_srcover_bgra_8888_sse2_lowp+0x1280>
+  DB  68,15,88,5,109,13,1,0               ; addps         0x10d6d(%rip),%xmm8        # 33a70 <_sk_srcover_bgra_8888_sse2_lowp+0xe80>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
   DB  68,15,17,128,0,1,0,0                ; movups        %xmm8,0x100(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -33330,13 +33071,13 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,72,64                         ; movups        0x40(%rax),%xmm1
   DB  68,15,16,128,192,0,0,0              ; movups        0xc0(%rax),%xmm8
-  DB  15,88,13,45,17,1,0                  ; addps         0x1112d(%rip),%xmm1        # 34480 <_sk_srcover_bgra_8888_sse2_lowp+0x1264>
-  DB  68,15,40,13,53,11,1,0               ; movaps        0x10b35(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,88,13,56,17,1,0                  ; addps         0x11138(%rip),%xmm1        # 33e60 <_sk_srcover_bgra_8888_sse2_lowp+0x1270>
+  DB  68,15,40,13,64,11,1,0               ; movaps        0x10b40(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
   DB  69,15,40,193                        ; movaps        %xmm9,%xmm8
   DB  69,15,89,192                        ; mulps         %xmm8,%xmm8
-  DB  68,15,89,13,33,17,1,0               ; mulps         0x11121(%rip),%xmm9        # 34490 <_sk_srcover_bgra_8888_sse2_lowp+0x1274>
-  DB  68,15,88,13,25,13,1,0               ; addps         0x10d19(%rip),%xmm9        # 34090 <_sk_srcover_bgra_8888_sse2_lowp+0xe74>
+  DB  68,15,89,13,44,17,1,0               ; mulps         0x1112c(%rip),%xmm9        # 33e70 <_sk_srcover_bgra_8888_sse2_lowp+0x1280>
+  DB  68,15,88,13,36,13,1,0               ; addps         0x10d24(%rip),%xmm9        # 33a70 <_sk_srcover_bgra_8888_sse2_lowp+0xe80>
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  68,15,17,136,64,1,0,0               ; movups        %xmm9,0x140(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -33347,16 +33088,16 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,72,64                         ; movups        0x40(%rax),%xmm1
   DB  68,15,16,128,192,0,0,0              ; movups        0xc0(%rax),%xmm8
-  DB  15,88,13,212,16,1,0                 ; addps         0x110d4(%rip),%xmm1        # 34470 <_sk_srcover_bgra_8888_sse2_lowp+0x1254>
-  DB  68,15,40,13,236,10,1,0              ; movaps        0x10aec(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,88,13,223,16,1,0                 ; addps         0x110df(%rip),%xmm1        # 33e50 <_sk_srcover_bgra_8888_sse2_lowp+0x1260>
+  DB  68,15,40,13,247,10,1,0              ; movaps        0x10af7(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
-  DB  68,15,40,5,240,16,1,0               ; movaps        0x110f0(%rip),%xmm8        # 344a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1284>
+  DB  68,15,40,5,251,16,1,0               ; movaps        0x110fb(%rip),%xmm8        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0x1290>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,244,16,1,0               ; addps         0x110f4(%rip),%xmm8        # 344b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
+  DB  68,15,88,5,255,16,1,0               ; addps         0x110ff(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0x12a0>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,184,10,1,0               ; addps         0x10ab8(%rip),%xmm8        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  68,15,88,5,195,10,1,0               ; addps         0x10ac3(%rip),%xmm8        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,236,16,1,0               ; addps         0x110ec(%rip),%xmm8        # 344c0 <_sk_srcover_bgra_8888_sse2_lowp+0x12a4>
+  DB  68,15,88,5,247,16,1,0               ; addps         0x110f7(%rip),%xmm8        # 33ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x12b0>
   DB  68,15,17,128,64,1,0,0               ; movups        %xmm8,0x140(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -33364,17 +33105,17 @@
 PUBLIC _sk_bicubic_p1y_sse2
 _sk_bicubic_p1y_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,15,40,5,150,10,1,0               ; movaps        0x10a96(%rip),%xmm8        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  68,15,40,5,161,10,1,0               ; movaps        0x10aa1(%rip),%xmm8        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  15,16,72,64                         ; movups        0x40(%rax),%xmm1
   DB  68,15,16,136,192,0,0,0              ; movups        0xc0(%rax),%xmm9
   DB  65,15,88,200                        ; addps         %xmm8,%xmm1
-  DB  68,15,40,21,158,16,1,0              ; movaps        0x1109e(%rip),%xmm10        # 344a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1284>
+  DB  68,15,40,21,169,16,1,0              ; movaps        0x110a9(%rip),%xmm10        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0x1290>
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
-  DB  68,15,88,21,162,16,1,0              ; addps         0x110a2(%rip),%xmm10        # 344b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
+  DB  68,15,88,21,173,16,1,0              ; addps         0x110ad(%rip),%xmm10        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0x12a0>
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
   DB  69,15,88,208                        ; addps         %xmm8,%xmm10
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
-  DB  68,15,88,21,158,16,1,0              ; addps         0x1109e(%rip),%xmm10        # 344c0 <_sk_srcover_bgra_8888_sse2_lowp+0x12a4>
+  DB  68,15,88,21,169,16,1,0              ; addps         0x110a9(%rip),%xmm10        # 33ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x12b0>
   DB  68,15,17,144,64,1,0,0               ; movups        %xmm10,0x140(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -33384,11 +33125,11 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,72,64                         ; movups        0x40(%rax),%xmm1
   DB  68,15,16,128,192,0,0,0              ; movups        0xc0(%rax),%xmm8
-  DB  15,88,13,109,16,1,0                 ; addps         0x1106d(%rip),%xmm1        # 344b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1294>
+  DB  15,88,13,120,16,1,0                 ; addps         0x11078(%rip),%xmm1        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0x12a0>
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  69,15,89,201                        ; mulps         %xmm9,%xmm9
-  DB  68,15,89,5,61,16,1,0                ; mulps         0x1103d(%rip),%xmm8        # 34490 <_sk_srcover_bgra_8888_sse2_lowp+0x1274>
-  DB  68,15,88,5,53,12,1,0                ; addps         0x10c35(%rip),%xmm8        # 34090 <_sk_srcover_bgra_8888_sse2_lowp+0xe74>
+  DB  68,15,89,5,72,16,1,0                ; mulps         0x11048(%rip),%xmm8        # 33e70 <_sk_srcover_bgra_8888_sse2_lowp+0x1280>
+  DB  68,15,88,5,64,12,1,0                ; addps         0x10c40(%rip),%xmm8        # 33a70 <_sk_srcover_bgra_8888_sse2_lowp+0xe80>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
   DB  68,15,17,128,64,1,0,0               ; movups        %xmm8,0x140(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -33517,7 +33258,7 @@
   DB  102,65,15,254,205                   ; paddd         %xmm13,%xmm1
   DB  102,68,15,127,108,36,80             ; movdqa        %xmm13,0x50(%rsp)
   DB  102,15,254,217                      ; paddd         %xmm1,%xmm3
-  DB  102,68,15,111,5,154,14,1,0          ; movdqa        0x10e9a(%rip),%xmm8        # 344e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  DB  102,68,15,111,5,165,14,1,0          ; movdqa        0x10ea5(%rip),%xmm8        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d0>
   DB  102,15,112,195,245                  ; pshufd        $0xf5,%xmm3,%xmm0
   DB  102,65,15,244,216                   ; pmuludq       %xmm8,%xmm3
   DB  102,65,15,244,192                   ; pmuludq       %xmm8,%xmm0
@@ -33556,7 +33297,7 @@
   DB  243,66,15,16,44,139                 ; movss         (%rbx,%r9,4),%xmm5
   DB  15,20,236                           ; unpcklps      %xmm4,%xmm5
   DB  102,15,20,221                       ; unpcklpd      %xmm5,%xmm3
-  DB  102,68,15,111,37,193,7,1,0          ; movdqa        0x107c1(%rip),%xmm12        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,68,15,111,37,204,7,1,0          ; movdqa        0x107cc(%rip),%xmm12        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,65,15,254,196                   ; paddd         %xmm12,%xmm0
   DB  102,15,112,224,78                   ; pshufd        $0x4e,%xmm0,%xmm4
   DB  102,73,15,126,224                   ; movq          %xmm4,%r8
@@ -33572,7 +33313,7 @@
   DB  243,66,15,16,36,139                 ; movss         (%rbx,%r9,4),%xmm4
   DB  15,20,224                           ; unpcklps      %xmm0,%xmm4
   DB  102,15,20,236                       ; unpcklpd      %xmm4,%xmm5
-  DB  15,40,37,134,13,1,0                 ; movaps        0x10d86(%rip),%xmm4        # 344d0 <_sk_srcover_bgra_8888_sse2_lowp+0x12b4>
+  DB  15,40,37,145,13,1,0                 ; movaps        0x10d91(%rip),%xmm4        # 33eb0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c0>
   DB  68,15,88,220                        ; addps         %xmm4,%xmm11
   DB  68,15,41,92,36,64                   ; movaps        %xmm11,0x40(%rsp)
   DB  68,15,40,223                        ; movaps        %xmm7,%xmm11
@@ -33608,7 +33349,7 @@
   DB  15,20,249                           ; unpcklps      %xmm1,%xmm7
   DB  102,15,20,252                       ; unpcklpd      %xmm4,%xmm7
   DB  102,15,111,202                      ; movdqa        %xmm2,%xmm1
-  DB  102,15,250,13,251,12,1,0            ; psubd         0x10cfb(%rip),%xmm1        # 344f0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
+  DB  102,15,250,13,6,13,1,0              ; psubd         0x10d06(%rip),%xmm1        # 33ed0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e0>
   DB  102,15,112,225,78                   ; pshufd        $0x4e,%xmm1,%xmm4
   DB  102,73,15,126,224                   ; movq          %xmm4,%r8
   DB  102,72,15,126,200                   ; movq          %xmm1,%rax
@@ -33698,7 +33439,7 @@
   DB  243,15,16,44,131                    ; movss         (%rbx,%rax,4),%xmm5
   DB  15,20,233                           ; unpcklps      %xmm1,%xmm5
   DB  102,15,20,221                       ; unpcklpd      %xmm5,%xmm3
-  DB  102,68,15,111,45,51,5,1,0           ; movdqa        0x10533(%rip),%xmm13        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,68,15,111,45,62,5,1,0           ; movdqa        0x1053e(%rip),%xmm13        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,65,15,254,197                   ; paddd         %xmm13,%xmm0
   DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
   DB  102,73,15,126,200                   ; movq          %xmm1,%r8
@@ -33795,7 +33536,7 @@
   DB  102,15,111,206                      ; movdqa        %xmm6,%xmm1
   DB  102,65,15,254,202                   ; paddd         %xmm10,%xmm1
   DB  102,15,112,209,245                  ; pshufd        $0xf5,%xmm1,%xmm2
-  DB  102,15,111,29,152,9,1,0             ; movdqa        0x10998(%rip),%xmm3        # 344e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  DB  102,15,111,29,163,9,1,0             ; movdqa        0x109a3(%rip),%xmm3        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d0>
   DB  102,15,244,203                      ; pmuludq       %xmm3,%xmm1
   DB  102,15,244,211                      ; pmuludq       %xmm3,%xmm2
   DB  102,15,111,251                      ; movdqa        %xmm3,%xmm7
@@ -33833,7 +33574,7 @@
   DB  243,15,16,44,131                    ; movss         (%rbx,%rax,4),%xmm5
   DB  15,20,236                           ; unpcklps      %xmm4,%xmm5
   DB  102,15,20,213                       ; unpcklpd      %xmm5,%xmm2
-  DB  102,15,111,5,200,2,1,0              ; movdqa        0x102c8(%rip),%xmm0        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,15,111,5,211,2,1,0              ; movdqa        0x102d3(%rip),%xmm0        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,15,254,216                      ; paddd         %xmm0,%xmm3
   DB  102,15,112,227,78                   ; pshufd        $0x4e,%xmm3,%xmm4
   DB  102,73,15,126,224                   ; movq          %xmm4,%r8
@@ -33914,7 +33655,7 @@
   DB  102,15,111,214                      ; movdqa        %xmm6,%xmm2
   DB  102,65,15,254,212                   ; paddd         %xmm12,%xmm2
   DB  102,15,112,194,245                  ; pshufd        $0xf5,%xmm2,%xmm0
-  DB  102,15,111,13,118,7,1,0             ; movdqa        0x10776(%rip),%xmm1        # 344e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  DB  102,15,111,13,129,7,1,0             ; movdqa        0x10781(%rip),%xmm1        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d0>
   DB  102,15,244,209                      ; pmuludq       %xmm1,%xmm2
   DB  102,15,244,193                      ; pmuludq       %xmm1,%xmm0
   DB  102,15,111,241                      ; movdqa        %xmm1,%xmm6
@@ -33936,7 +33677,7 @@
   DB  68,15,20,209                        ; unpcklps      %xmm1,%xmm10
   DB  102,68,15,20,210                    ; unpcklpd      %xmm2,%xmm10
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
-  DB  102,15,250,13,27,7,1,0              ; psubd         0x1071b(%rip),%xmm1        # 344f0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
+  DB  102,15,250,13,38,7,1,0              ; psubd         0x10726(%rip),%xmm1        # 33ed0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e0>
   DB  102,15,112,209,78                   ; pshufd        $0x4e,%xmm1,%xmm2
   DB  102,73,15,126,208                   ; movq          %xmm2,%r8
   DB  102,72,15,126,200                   ; movq          %xmm1,%rax
@@ -33951,7 +33692,7 @@
   DB  243,15,16,20,131                    ; movss         (%rbx,%rax,4),%xmm2
   DB  15,20,209                           ; unpcklps      %xmm1,%xmm2
   DB  102,15,20,226                       ; unpcklpd      %xmm2,%xmm4
-  DB  102,15,254,5,166,0,1,0              ; paddd         0x100a6(%rip),%xmm0        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,15,254,5,177,0,1,0              ; paddd         0x100b1(%rip),%xmm0        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
   DB  102,73,15,126,200                   ; movq          %xmm1,%r8
   DB  102,72,15,126,192                   ; movq          %xmm0,%rax
@@ -33988,7 +33729,7 @@
   DB  15,20,199                           ; unpcklps      %xmm7,%xmm0
   DB  102,15,20,193                       ; unpcklpd      %xmm1,%xmm0
   DB  102,15,111,202                      ; movdqa        %xmm2,%xmm1
-  DB  102,15,250,13,37,6,1,0              ; psubd         0x10625(%rip),%xmm1        # 344f0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
+  DB  102,15,250,13,48,6,1,0              ; psubd         0x10630(%rip),%xmm1        # 33ed0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e0>
   DB  102,15,112,249,78                   ; pshufd        $0x4e,%xmm1,%xmm7
   DB  102,73,15,126,248                   ; movq          %xmm7,%r8
   DB  102,72,15,126,200                   ; movq          %xmm1,%rax
@@ -34003,7 +33744,7 @@
   DB  243,15,16,52,131                    ; movss         (%rbx,%rax,4),%xmm6
   DB  15,20,247                           ; unpcklps      %xmm7,%xmm6
   DB  102,15,20,206                       ; unpcklpd      %xmm6,%xmm1
-  DB  102,15,254,21,176,255,0,0           ; paddd         0xffb0(%rip),%xmm2        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,15,254,21,187,255,0,0           ; paddd         0xffbb(%rip),%xmm2        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,15,112,242,78                   ; pshufd        $0x4e,%xmm2,%xmm6
   DB  102,73,15,126,240                   ; movq          %xmm6,%r8
   DB  102,72,15,126,208                   ; movq          %xmm2,%rax
@@ -34147,7 +33888,7 @@
   DB  102,65,15,254,210                   ; paddd         %xmm10,%xmm2
   DB  102,15,111,220                      ; movdqa        %xmm4,%xmm3
   DB  102,15,254,218                      ; paddd         %xmm2,%xmm3
-  DB  102,15,111,37,73,3,1,0              ; movdqa        0x10349(%rip),%xmm4        # 344e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  DB  102,15,111,37,84,3,1,0              ; movdqa        0x10354(%rip),%xmm4        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d0>
   DB  102,15,112,195,245                  ; pshufd        $0xf5,%xmm3,%xmm0
   DB  102,15,244,220                      ; pmuludq       %xmm4,%xmm3
   DB  102,15,244,196                      ; pmuludq       %xmm4,%xmm0
@@ -34186,7 +33927,7 @@
   DB  243,66,15,16,52,139                 ; movss         (%rbx,%r9,4),%xmm6
   DB  15,20,244                           ; unpcklps      %xmm4,%xmm6
   DB  102,15,20,238                       ; unpcklpd      %xmm6,%xmm5
-  DB  102,15,254,5,115,252,0,0            ; paddd         0xfc73(%rip),%xmm0        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,15,254,5,126,252,0,0            ; paddd         0xfc7e(%rip),%xmm0        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,15,112,224,78                   ; pshufd        $0x4e,%xmm0,%xmm4
   DB  102,73,15,126,224                   ; movq          %xmm4,%r8
   DB  102,73,15,126,193                   ; movq          %xmm0,%r9
@@ -34201,7 +33942,7 @@
   DB  243,66,15,16,52,139                 ; movss         (%rbx,%r9,4),%xmm6
   DB  15,20,244                           ; unpcklps      %xmm4,%xmm6
   DB  102,15,20,222                       ; unpcklpd      %xmm6,%xmm3
-  DB  15,40,53,61,2,1,0                   ; movaps        0x1023d(%rip),%xmm6        # 344d0 <_sk_srcover_bgra_8888_sse2_lowp+0x12b4>
+  DB  15,40,53,72,2,1,0                   ; movaps        0x10248(%rip),%xmm6        # 33eb0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c0>
   DB  68,15,88,198                        ; addps         %xmm6,%xmm8
   DB  68,15,41,68,36,48                   ; movaps        %xmm8,0x30(%rsp)
   DB  68,15,88,254                        ; addps         %xmm6,%xmm15
@@ -34219,7 +33960,7 @@
   DB  102,65,15,254,215                   ; paddd         %xmm15,%xmm2
   DB  102,68,15,127,124,36,96             ; movdqa        %xmm15,0x60(%rsp)
   DB  102,15,112,194,245                  ; pshufd        $0xf5,%xmm2,%xmm0
-  DB  102,15,111,13,240,1,1,0             ; movdqa        0x101f0(%rip),%xmm1        # 344e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  DB  102,15,111,13,251,1,1,0             ; movdqa        0x101fb(%rip),%xmm1        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d0>
   DB  102,15,244,209                      ; pmuludq       %xmm1,%xmm2
   DB  102,15,244,193                      ; pmuludq       %xmm1,%xmm0
   DB  102,15,112,192,232                  ; pshufd        $0xe8,%xmm0,%xmm0
@@ -34240,7 +33981,7 @@
   DB  15,20,240                           ; unpcklps      %xmm0,%xmm6
   DB  102,15,20,242                       ; unpcklpd      %xmm2,%xmm6
   DB  102,15,111,193                      ; movdqa        %xmm1,%xmm0
-  DB  102,15,250,5,155,1,1,0              ; psubd         0x1019b(%rip),%xmm0        # 344f0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
+  DB  102,15,250,5,166,1,1,0              ; psubd         0x101a6(%rip),%xmm0        # 33ed0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e0>
   DB  102,15,112,208,78                   ; pshufd        $0x4e,%xmm0,%xmm2
   DB  102,73,15,126,208                   ; movq          %xmm2,%r8
   DB  102,72,15,126,192                   ; movq          %xmm0,%rax
@@ -34255,7 +33996,7 @@
   DB  243,68,15,16,28,131                 ; movss         (%rbx,%rax,4),%xmm11
   DB  68,15,20,216                        ; unpcklps      %xmm0,%xmm11
   DB  102,65,15,20,211                    ; unpcklpd      %xmm11,%xmm2
-  DB  102,15,254,13,35,251,0,0            ; paddd         0xfb23(%rip),%xmm1        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,15,254,13,46,251,0,0            ; paddd         0xfb2e(%rip),%xmm1        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,15,112,193,78                   ; pshufd        $0x4e,%xmm1,%xmm0
   DB  102,73,15,126,192                   ; movq          %xmm0,%r8
   DB  102,72,15,126,200                   ; movq          %xmm1,%rax
@@ -34293,7 +34034,7 @@
   DB  102,65,15,111,194                   ; movdqa        %xmm10,%xmm0
   DB  102,15,254,68,36,32                 ; paddd         0x20(%rsp),%xmm0
   DB  102,15,112,216,245                  ; pshufd        $0xf5,%xmm0,%xmm3
-  DB  102,15,111,37,151,0,1,0             ; movdqa        0x10097(%rip),%xmm4        # 344e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  DB  102,15,111,37,162,0,1,0             ; movdqa        0x100a2(%rip),%xmm4        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d0>
   DB  102,15,244,196                      ; pmuludq       %xmm4,%xmm0
   DB  102,15,244,220                      ; pmuludq       %xmm4,%xmm3
   DB  102,68,15,111,220                   ; movdqa        %xmm4,%xmm11
@@ -34331,7 +34072,7 @@
   DB  243,15,16,60,131                    ; movss         (%rbx,%rax,4),%xmm7
   DB  15,20,253                           ; unpcklps      %xmm5,%xmm7
   DB  102,15,20,199                       ; unpcklpd      %xmm7,%xmm0
-  DB  102,68,15,111,5,195,249,0,0         ; movdqa        0xf9c3(%rip),%xmm8        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,68,15,111,5,206,249,0,0         ; movdqa        0xf9ce(%rip),%xmm8        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,65,15,254,224                   ; paddd         %xmm8,%xmm4
   DB  102,15,112,236,78                   ; pshufd        $0x4e,%xmm4,%xmm5
   DB  102,73,15,126,232                   ; movq          %xmm5,%r8
@@ -34477,7 +34218,7 @@
   DB  243,15,16,36,131                    ; movss         (%rbx,%rax,4),%xmm4
   DB  15,20,226                           ; unpcklps      %xmm2,%xmm4
   DB  102,15,20,252                       ; unpcklpd      %xmm4,%xmm7
-  DB  102,68,15,111,61,18,247,0,0         ; movdqa        0xf712(%rip),%xmm15        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,68,15,111,61,29,247,0,0         ; movdqa        0xf71d(%rip),%xmm15        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,65,15,254,207                   ; paddd         %xmm15,%xmm1
   DB  102,15,112,209,78                   ; pshufd        $0x4e,%xmm1,%xmm2
   DB  102,73,15,126,208                   ; movq          %xmm2,%r8
@@ -34560,7 +34301,7 @@
   DB  102,65,15,111,217                   ; movdqa        %xmm9,%xmm3
   DB  102,65,15,254,216                   ; paddd         %xmm8,%xmm3
   DB  102,15,112,211,245                  ; pshufd        $0xf5,%xmm3,%xmm2
-  DB  102,15,111,45,187,251,0,0           ; movdqa        0xfbbb(%rip),%xmm5        # 344e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  DB  102,15,111,45,198,251,0,0           ; movdqa        0xfbc6(%rip),%xmm5        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d0>
   DB  102,15,244,221                      ; pmuludq       %xmm5,%xmm3
   DB  102,15,244,213                      ; pmuludq       %xmm5,%xmm2
   DB  102,15,112,234,232                  ; pshufd        $0xe8,%xmm2,%xmm5
@@ -34581,7 +34322,7 @@
   DB  68,15,20,198                        ; unpcklps      %xmm6,%xmm8
   DB  102,68,15,20,197                    ; unpcklpd      %xmm5,%xmm8
   DB  102,15,111,234                      ; movdqa        %xmm2,%xmm5
-  DB  102,15,250,45,100,251,0,0           ; psubd         0xfb64(%rip),%xmm5        # 344f0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
+  DB  102,15,250,45,111,251,0,0           ; psubd         0xfb6f(%rip),%xmm5        # 33ed0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e0>
   DB  102,15,112,245,78                   ; pshufd        $0x4e,%xmm5,%xmm6
   DB  102,73,15,126,240                   ; movq          %xmm6,%r8
   DB  102,72,15,126,232                   ; movq          %xmm5,%rax
@@ -34613,7 +34354,7 @@
   DB  102,15,20,214                       ; unpcklpd      %xmm6,%xmm2
   DB  102,69,15,254,205                   ; paddd         %xmm13,%xmm9
   DB  102,65,15,112,233,245               ; pshufd        $0xf5,%xmm9,%xmm5
-  DB  102,15,111,29,194,250,0,0           ; movdqa        0xfac2(%rip),%xmm3        # 344e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  DB  102,15,111,29,205,250,0,0           ; movdqa        0xfacd(%rip),%xmm3        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d0>
   DB  102,68,15,244,203                   ; pmuludq       %xmm3,%xmm9
   DB  102,15,244,235                      ; pmuludq       %xmm3,%xmm5
   DB  102,15,112,237,232                  ; pshufd        $0xe8,%xmm5,%xmm5
@@ -34634,7 +34375,7 @@
   DB  69,15,20,233                        ; unpcklps      %xmm9,%xmm13
   DB  102,68,15,20,237                    ; unpcklpd      %xmm5,%xmm13
   DB  102,65,15,111,239                   ; movdqa        %xmm15,%xmm5
-  DB  102,15,250,45,98,250,0,0            ; psubd         0xfa62(%rip),%xmm5        # 344f0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
+  DB  102,15,250,45,109,250,0,0           ; psubd         0xfa6d(%rip),%xmm5        # 33ed0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e0>
   DB  102,15,112,221,78                   ; pshufd        $0x4e,%xmm5,%xmm3
   DB  102,73,15,126,216                   ; movq          %xmm3,%r8
   DB  102,72,15,126,232                   ; movq          %xmm5,%rax
@@ -34649,7 +34390,7 @@
   DB  243,15,16,44,131                    ; movss         (%rbx,%rax,4),%xmm5
   DB  15,20,235                           ; unpcklps      %xmm3,%xmm5
   DB  102,15,20,245                       ; unpcklpd      %xmm5,%xmm6
-  DB  102,68,15,111,13,236,243,0,0        ; movdqa        0xf3ec(%rip),%xmm9        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,68,15,111,13,247,243,0,0        ; movdqa        0xf3f7(%rip),%xmm9        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,69,15,254,249                   ; paddd         %xmm9,%xmm15
   DB  102,65,15,112,223,78                ; pshufd        $0x4e,%xmm15,%xmm3
   DB  102,73,15,126,216                   ; movq          %xmm3,%r8
@@ -34711,7 +34452,7 @@
   DB  102,65,15,111,195                   ; movdqa        %xmm11,%xmm0
   DB  102,15,254,195                      ; paddd         %xmm3,%xmm0
   DB  102,15,112,200,245                  ; pshufd        $0xf5,%xmm0,%xmm1
-  DB  102,15,111,21,246,248,0,0           ; movdqa        0xf8f6(%rip),%xmm2        # 344e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  DB  102,15,111,21,1,249,0,0             ; movdqa        0xf901(%rip),%xmm2        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d0>
   DB  102,15,244,194                      ; pmuludq       %xmm2,%xmm0
   DB  102,15,244,202                      ; pmuludq       %xmm2,%xmm1
   DB  102,68,15,111,234                   ; movdqa        %xmm2,%xmm13
@@ -34904,7 +34645,7 @@
   DB  68,15,20,238                        ; unpcklps      %xmm6,%xmm13
   DB  102,68,15,20,234                    ; unpcklpd      %xmm2,%xmm13
   DB  102,15,111,212                      ; movdqa        %xmm4,%xmm2
-  DB  102,15,250,21,143,245,0,0           ; psubd         0xf58f(%rip),%xmm2        # 344f0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
+  DB  102,15,250,21,154,245,0,0           ; psubd         0xf59a(%rip),%xmm2        # 33ed0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e0>
   DB  102,15,112,242,78                   ; pshufd        $0x4e,%xmm2,%xmm6
   DB  102,73,15,126,240                   ; movq          %xmm6,%r8
   DB  102,72,15,126,208                   ; movq          %xmm2,%rax
@@ -34964,7 +34705,7 @@
   DB  102,68,15,111,116,36,32             ; movdqa        0x20(%rsp),%xmm14
   DB  102,65,15,254,198                   ; paddd         %xmm14,%xmm0
   DB  102,15,112,200,245                  ; pshufd        $0xf5,%xmm0,%xmm1
-  DB  102,68,15,111,5,108,244,0,0         ; movdqa        0xf46c(%rip),%xmm8        # 344e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  DB  102,68,15,111,5,119,244,0,0         ; movdqa        0xf477(%rip),%xmm8        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d0>
   DB  102,65,15,244,192                   ; pmuludq       %xmm8,%xmm0
   DB  102,65,15,244,200                   ; pmuludq       %xmm8,%xmm1
   DB  102,65,15,111,240                   ; movdqa        %xmm8,%xmm6
@@ -35002,7 +34743,7 @@
   DB  243,15,16,44,131                    ; movss         (%rbx,%rax,4),%xmm5
   DB  15,20,235                           ; unpcklps      %xmm3,%xmm5
   DB  102,15,20,205                       ; unpcklpd      %xmm5,%xmm1
-  DB  102,68,15,111,5,154,237,0,0         ; movdqa        0xed9a(%rip),%xmm8        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,68,15,111,5,165,237,0,0         ; movdqa        0xeda5(%rip),%xmm8        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,65,15,254,208                   ; paddd         %xmm8,%xmm2
   DB  102,15,112,218,78                   ; pshufd        $0x4e,%xmm2,%xmm3
   DB  102,73,15,126,216                   ; movq          %xmm3,%r8
@@ -35085,7 +34826,7 @@
   DB  102,15,254,208                      ; paddd         %xmm0,%xmm2
   DB  102,15,111,240                      ; movdqa        %xmm0,%xmm6
   DB  102,15,112,194,245                  ; pshufd        $0xf5,%xmm2,%xmm0
-  DB  102,15,111,37,68,242,0,0            ; movdqa        0xf244(%rip),%xmm4        # 344e0 <_sk_srcover_bgra_8888_sse2_lowp+0x12c4>
+  DB  102,15,111,37,79,242,0,0            ; movdqa        0xf24f(%rip),%xmm4        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d0>
   DB  102,15,244,212                      ; pmuludq       %xmm4,%xmm2
   DB  102,15,244,196                      ; pmuludq       %xmm4,%xmm0
   DB  102,15,112,200,232                  ; pshufd        $0xe8,%xmm0,%xmm1
@@ -35106,7 +34847,7 @@
   DB  68,15,20,193                        ; unpcklps      %xmm1,%xmm8
   DB  102,68,15,20,194                    ; unpcklpd      %xmm2,%xmm8
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
-  DB  102,15,250,13,237,241,0,0           ; psubd         0xf1ed(%rip),%xmm1        # 344f0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
+  DB  102,15,250,13,248,241,0,0           ; psubd         0xf1f8(%rip),%xmm1        # 33ed0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e0>
   DB  102,15,112,209,78                   ; pshufd        $0x4e,%xmm1,%xmm2
   DB  102,73,15,126,208                   ; movq          %xmm2,%r8
   DB  102,72,15,126,200                   ; movq          %xmm1,%rax
@@ -35121,7 +34862,7 @@
   DB  243,15,16,20,131                    ; movss         (%rbx,%rax,4),%xmm2
   DB  15,20,209                           ; unpcklps      %xmm1,%xmm2
   DB  102,68,15,20,242                    ; unpcklpd      %xmm2,%xmm14
-  DB  102,15,254,5,118,235,0,0            ; paddd         0xeb76(%rip),%xmm0        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,15,254,5,129,235,0,0            ; paddd         0xeb81(%rip),%xmm0        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
   DB  102,73,15,126,200                   ; movq          %xmm1,%r8
   DB  102,72,15,126,192                   ; movq          %xmm0,%rax
@@ -35159,7 +34900,7 @@
   DB  15,20,198                           ; unpcklps      %xmm6,%xmm0
   DB  102,15,20,193                       ; unpcklpd      %xmm1,%xmm0
   DB  102,15,111,202                      ; movdqa        %xmm2,%xmm1
-  DB  102,15,250,13,245,240,0,0           ; psubd         0xf0f5(%rip),%xmm1        # 344f0 <_sk_srcover_bgra_8888_sse2_lowp+0x12d4>
+  DB  102,15,250,13,0,241,0,0             ; psubd         0xf100(%rip),%xmm1        # 33ed0 <_sk_srcover_bgra_8888_sse2_lowp+0x12e0>
   DB  102,15,112,241,78                   ; pshufd        $0x4e,%xmm1,%xmm6
   DB  102,73,15,126,240                   ; movq          %xmm6,%r8
   DB  102,72,15,126,200                   ; movq          %xmm1,%rax
@@ -35174,7 +34915,7 @@
   DB  243,15,16,36,131                    ; movss         (%rbx,%rax,4),%xmm4
   DB  15,20,230                           ; unpcklps      %xmm6,%xmm4
   DB  102,15,20,204                       ; unpcklpd      %xmm4,%xmm1
-  DB  102,15,254,21,128,234,0,0           ; paddd         0xea80(%rip),%xmm2        # 33ec0 <_sk_srcover_bgra_8888_sse2_lowp+0xca4>
+  DB  102,15,254,21,139,234,0,0           ; paddd         0xea8b(%rip),%xmm2        # 338a0 <_sk_srcover_bgra_8888_sse2_lowp+0xcb0>
   DB  102,15,112,226,78                   ; pshufd        $0x4e,%xmm2,%xmm4
   DB  102,73,15,126,224                   ; movq          %xmm4,%r8
   DB  102,72,15,126,208                   ; movq          %xmm2,%rax
@@ -35233,7 +34974,7 @@
   DB  15,89,212                           ; mulps         %xmm4,%xmm2
   DB  65,15,88,215                        ; addps         %xmm15,%xmm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,102,233,0,0                ; movaps        0xe966(%rip),%xmm3        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,29,113,233,0,0                ; movaps        0xe971(%rip),%xmm3        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,40,164,36,224,0,0,0              ; movaps        0xe0(%rsp),%xmm4
   DB  15,40,172,36,240,0,0,0              ; movaps        0xf0(%rsp),%xmm5
   DB  15,40,180,36,0,1,0,0                ; movaps        0x100(%rsp),%xmm6
@@ -35244,15 +34985,15 @@
 
 PUBLIC _sk_gauss_a_to_rgba_sse2
 _sk_gauss_a_to_rgba_sse2 LABEL PROC
-  DB  15,40,5,165,239,0,0                 ; movaps        0xefa5(%rip),%xmm0        # 34500 <_sk_srcover_bgra_8888_sse2_lowp+0x12e4>
+  DB  15,40,5,176,239,0,0                 ; movaps        0xefb0(%rip),%xmm0        # 33ee0 <_sk_srcover_bgra_8888_sse2_lowp+0x12f0>
   DB  15,89,195                           ; mulps         %xmm3,%xmm0
-  DB  15,88,5,171,239,0,0                 ; addps         0xefab(%rip),%xmm0        # 34510 <_sk_srcover_bgra_8888_sse2_lowp+0x12f4>
+  DB  15,88,5,182,239,0,0                 ; addps         0xefb6(%rip),%xmm0        # 33ef0 <_sk_srcover_bgra_8888_sse2_lowp+0x1300>
   DB  15,89,195                           ; mulps         %xmm3,%xmm0
-  DB  15,88,5,177,239,0,0                 ; addps         0xefb1(%rip),%xmm0        # 34520 <_sk_srcover_bgra_8888_sse2_lowp+0x1304>
+  DB  15,88,5,188,239,0,0                 ; addps         0xefbc(%rip),%xmm0        # 33f00 <_sk_srcover_bgra_8888_sse2_lowp+0x1310>
   DB  15,89,195                           ; mulps         %xmm3,%xmm0
-  DB  15,88,5,183,239,0,0                 ; addps         0xefb7(%rip),%xmm0        # 34530 <_sk_srcover_bgra_8888_sse2_lowp+0x1314>
+  DB  15,88,5,194,239,0,0                 ; addps         0xefc2(%rip),%xmm0        # 33f10 <_sk_srcover_bgra_8888_sse2_lowp+0x1320>
   DB  15,89,195                           ; mulps         %xmm3,%xmm0
-  DB  15,88,5,189,239,0,0                 ; addps         0xefbd(%rip),%xmm0        # 34540 <_sk_srcover_bgra_8888_sse2_lowp+0x1324>
+  DB  15,88,5,200,239,0,0                 ; addps         0xefc8(%rip),%xmm0        # 33f20 <_sk_srcover_bgra_8888_sse2_lowp+0x1330>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
@@ -35267,7 +35008,7 @@
   DB  15,41,108,36,16                     ; movaps        %xmm5,0x10(%rsp)
   DB  15,41,36,36                         ; movaps        %xmm4,(%rsp)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,37,205,232,0,0                ; movaps        0xe8cd(%rip),%xmm4        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  15,40,37,216,232,0,0                ; movaps        0xe8d8(%rip),%xmm4        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  15,41,132,36,192,0,0,0              ; movaps        %xmm0,0xc0(%rsp)
   DB  15,40,232                           ; movaps        %xmm0,%xmm5
   DB  15,88,236                           ; addps         %xmm4,%xmm5
@@ -35275,7 +35016,7 @@
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
   DB  15,40,213                           ; movaps        %xmm5,%xmm2
   DB  15,194,208,1                        ; cmpltps       %xmm0,%xmm2
-  DB  15,40,53,186,232,0,0                ; movaps        0xe8ba(%rip),%xmm6        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,53,197,232,0,0                ; movaps        0xe8c5(%rip),%xmm6        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,84,214                           ; andps         %xmm6,%xmm2
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
   DB  15,92,194                           ; subps         %xmm2,%xmm0
@@ -35308,9 +35049,9 @@
   DB  102,15,110,72,8                     ; movd          0x8(%rax),%xmm1
   DB  102,15,112,193,0                    ; pshufd        $0x0,%xmm1,%xmm0
   DB  102,15,127,68,36,80                 ; movdqa        %xmm0,0x50(%rsp)
-  DB  243,15,16,5,167,223,0,0             ; movss         0xdfa7(%rip),%xmm0        # 33610 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
-  DB  102,15,111,45,207,232,0,0           ; movdqa        0xe8cf(%rip),%xmm5        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0xd24>
-  DB  15,40,37,40,234,0,0                 ; movaps        0xea28(%rip),%xmm4        # 340a0 <_sk_srcover_bgra_8888_sse2_lowp+0xe84>
+  DB  243,15,16,5,166,223,0,0             ; movss         0xdfa6(%rip),%xmm0        # 32fe4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  DB  102,15,111,45,218,232,0,0           ; movdqa        0xe8da(%rip),%xmm5        # 33920 <_sk_srcover_bgra_8888_sse2_lowp+0xd30>
+  DB  15,40,37,51,234,0,0                 ; movaps        0xea33(%rip),%xmm4        # 33a80 <_sk_srcover_bgra_8888_sse2_lowp+0xe90>
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
@@ -35321,9 +35062,9 @@
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  15,95,206                           ; maxps         %xmm6,%xmm1
   DB  15,41,188,36,144,0,0,0              ; movaps        %xmm7,0x90(%rsp)
-  DB  15,46,61,153,223,0,0                ; ucomiss       0xdf99(%rip),%xmm7        # 33644 <_sk_srcover_bgra_8888_sse2_lowp+0x428>
+  DB  15,46,61,152,223,0,0                ; ucomiss       0xdf98(%rip),%xmm7        # 33018 <_sk_srcover_bgra_8888_sse2_lowp+0x428>
   DB  68,15,40,124,36,112                 ; movaps        0x70(%rsp),%xmm15
-  DB  119,6                               ; ja            256b9 <_sk_bilerp_clamp_8888_sse2+0x129>
+  DB  119,6                               ; ja            2508e <_sk_bilerp_clamp_8888_sse2+0x129>
   DB  68,15,40,124,36,64                  ; movaps        0x40(%rsp),%xmm15
   DB  15,93,76,36,96                      ; minps         0x60(%rsp),%xmm1
   DB  243,15,91,201                       ; cvttps2dq     %xmm1,%xmm1
@@ -35336,7 +35077,7 @@
   DB  102,15,244,241                      ; pmuludq       %xmm1,%xmm6
   DB  102,15,112,206,232                  ; pshufd        $0xe8,%xmm6,%xmm1
   DB  102,68,15,98,225                    ; punpckldq     %xmm1,%xmm12
-  DB  243,15,16,13,26,223,0,0             ; movss         0xdf1a(%rip),%xmm1        # 33610 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
+  DB  243,15,16,13,25,223,0,0             ; movss         0xdf19(%rip),%xmm1        # 32fe4 <_sk_srcover_bgra_8888_sse2_lowp+0x3f4>
   DB  15,40,241                           ; movaps        %xmm1,%xmm6
   DB  15,198,246,0                        ; shufps        $0x0,%xmm6,%xmm6
   DB  15,88,180,36,192,0,0,0              ; addps         0xc0(%rsp),%xmm6
@@ -35376,9 +35117,9 @@
   DB  102,15,114,208,24                   ; psrld         $0x18,%xmm0
   DB  68,15,91,208                        ; cvtdq2ps      %xmm0,%xmm10
   DB  68,15,89,212                        ; mulps         %xmm4,%xmm10
-  DB  15,46,13,161,222,0,0                ; ucomiss       0xdea1(%rip),%xmm1        # 33644 <_sk_srcover_bgra_8888_sse2_lowp+0x428>
+  DB  15,46,13,160,222,0,0                ; ucomiss       0xdea0(%rip),%xmm1        # 33018 <_sk_srcover_bgra_8888_sse2_lowp+0x428>
   DB  68,15,40,156,36,176,0,0,0           ; movaps        0xb0(%rsp),%xmm11
-  DB  119,9                               ; ja            257b7 <_sk_bilerp_clamp_8888_sse2+0x227>
+  DB  119,9                               ; ja            2518c <_sk_bilerp_clamp_8888_sse2+0x227>
   DB  68,15,40,156,36,160,0,0,0           ; movaps        0xa0(%rsp),%xmm11
   DB  69,15,89,223                        ; mulps         %xmm15,%xmm11
   DB  69,15,89,235                        ; mulps         %xmm11,%xmm13
@@ -35389,15 +35130,15 @@
   DB  15,88,215                           ; addps         %xmm7,%xmm2
   DB  69,15,89,218                        ; mulps         %xmm10,%xmm11
   DB  65,15,88,219                        ; addps         %xmm11,%xmm3
-  DB  243,15,88,13,234,220,0,0            ; addss         0xdcea(%rip),%xmm1        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
-  DB  243,15,16,5,222,220,0,0             ; movss         0xdcde(%rip),%xmm0        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  243,15,88,13,233,220,0,0            ; addss         0xdce9(%rip),%xmm1        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  243,15,16,5,221,220,0,0             ; movss         0xdcdd(%rip),%xmm0        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  15,46,193                           ; ucomiss       %xmm1,%xmm0
-  DB  15,131,3,255,255,255                ; jae           256f6 <_sk_bilerp_clamp_8888_sse2+0x166>
+  DB  15,131,3,255,255,255                ; jae           250cb <_sk_bilerp_clamp_8888_sse2+0x166>
   DB  15,40,188,36,144,0,0,0              ; movaps        0x90(%rsp),%xmm7
-  DB  243,15,88,61,201,220,0,0            ; addss         0xdcc9(%rip),%xmm7        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
-  DB  243,15,16,5,189,220,0,0             ; movss         0xdcbd(%rip),%xmm0        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  243,15,88,61,200,220,0,0            ; addss         0xdcc8(%rip),%xmm7        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  243,15,16,5,188,220,0,0             ; movss         0xdcbc(%rip),%xmm0        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  15,46,199                           ; ucomiss       %xmm7,%xmm0
-  DB  15,131,114,254,255,255              ; jae           25686 <_sk_bilerp_clamp_8888_sse2+0xf6>
+  DB  15,131,114,254,255,255              ; jae           2505b <_sk_bilerp_clamp_8888_sse2+0xf6>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
   DB  65,15,40,200                        ; movaps        %xmm8,%xmm1
@@ -35408,7 +35149,6 @@
   DB  72,129,196,216,0,0,0                ; add           $0xd8,%rsp
   DB  255,224                             ; jmpq          *%rax
   DB  144                                 ; nop
-  DB  144                                 ; nop
 
 PUBLIC _sk_start_pipeline_hsw_lowp
 _sk_start_pipeline_hsw_lowp LABEL PROC
@@ -35441,13 +35181,13 @@
   DB  73,137,246                          ; mov           %rsi,%r14
   DB  76,137,141,8,255,255,255            ; mov           %r9,-0xf8(%rbp)
   DB  76,57,203                           ; cmp           %r9,%rbx
-  DB  15,131,169,0,0,0                    ; jae           25968 <_sk_start_pipeline_hsw_lowp+0x12c>
+  DB  15,131,169,0,0,0                    ; jae           2533c <_sk_start_pipeline_hsw_lowp+0x12c>
   DB  72,139,133,24,255,255,255           ; mov           -0xe8(%rbp),%rax
   DB  72,141,64,16                        ; lea           0x10(%rax),%rax
   DB  72,137,133,16,255,255,255           ; mov           %rax,-0xf0(%rbp)
   DB  72,139,149,24,255,255,255           ; mov           -0xe8(%rbp),%rdx
   DB  76,57,189,16,255,255,255            ; cmp           %r15,-0xf0(%rbp)
-  DB  119,70                              ; ja            25927 <_sk_start_pipeline_hsw_lowp+0xeb>
+  DB  119,70                              ; ja            252fb <_sk_start_pipeline_hsw_lowp+0xeb>
   DB  76,139,165,24,255,255,255           ; mov           -0xe8(%rbp),%r12
   DB  49,255                              ; xor           %edi,%edi
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
@@ -35466,10 +35206,10 @@
   DB  73,131,196,32                       ; add           $0x20,%r12
   DB  77,57,252                           ; cmp           %r15,%r12
   DB  73,137,212                          ; mov           %rdx,%r12
-  DB  118,193                             ; jbe           258e8 <_sk_start_pipeline_hsw_lowp+0xac>
+  DB  118,193                             ; jbe           252bc <_sk_start_pipeline_hsw_lowp+0xac>
   DB  76,137,255                          ; mov           %r15,%rdi
   DB  72,41,215                           ; sub           %rdx,%rdi
-  DB  116,41                              ; je            25958 <_sk_start_pipeline_hsw_lowp+0x11c>
+  DB  116,41                              ; je            2532c <_sk_start_pipeline_hsw_lowp+0x11c>
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  197,236,87,210                      ; vxorps        %ymm2,%ymm2,%ymm2
@@ -35483,7 +35223,7 @@
   DB  65,255,213                          ; callq         *%r13
   DB  72,255,195                          ; inc           %rbx
   DB  72,59,157,8,255,255,255             ; cmp           -0xf8(%rbp),%rbx
-  DB  15,133,105,255,255,255              ; jne           258d1 <_sk_start_pipeline_hsw_lowp+0x95>
+  DB  15,133,105,255,255,255              ; jne           252a5 <_sk_start_pipeline_hsw_lowp+0x95>
   DB  197,248,40,181,32,255,255,255       ; vmovaps       -0xe0(%rbp),%xmm6
   DB  197,248,40,189,48,255,255,255       ; vmovaps       -0xd0(%rbp),%xmm7
   DB  197,120,40,133,64,255,255,255       ; vmovaps       -0xc0(%rbp),%xmm8
@@ -35521,7 +35261,7 @@
   DB  197,249,110,209                     ; vmovd         %ecx,%xmm2
   DB  196,226,125,88,210                  ; vpbroadcastd  %xmm2,%ymm2
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
-  DB  196,226,125,24,29,214,218,0,0       ; vbroadcastss  0xdad6(%rip),%ymm3        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,226,125,24,29,214,218,0,0       ; vbroadcastss  0xdad6(%rip),%ymm3        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  197,236,88,211                      ; vaddps        %ymm3,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,252,40,218                      ; vmovaps       %ymm2,%ymm3
@@ -35625,7 +35365,7 @@
 PUBLIC _sk_black_color_hsw_lowp
 _sk_black_color_hsw_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,121,29,73,224,0,0       ; vpbroadcastw  0xe049(%rip),%ymm3        # 33bc0 <_sk_srcover_bgra_8888_sse2_lowp+0x9a4>
+  DB  196,226,125,121,29,85,224,0,0       ; vpbroadcastw  0xe055(%rip),%ymm3        # 335a0 <_sk_srcover_bgra_8888_sse2_lowp+0x9b0>
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  197,236,87,210                      ; vxorps        %ymm2,%ymm2,%ymm2
@@ -35634,7 +35374,7 @@
 PUBLIC _sk_white_color_hsw_lowp
 _sk_white_color_hsw_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,121,5,50,224,0,0        ; vpbroadcastw  0xe032(%rip),%ymm0        # 33bc2 <_sk_srcover_bgra_8888_sse2_lowp+0x9a6>
+  DB  196,226,125,121,5,62,224,0,0        ; vpbroadcastw  0xe03e(%rip),%ymm0        # 335a2 <_sk_srcover_bgra_8888_sse2_lowp+0x9b2>
   DB  197,253,111,200                     ; vmovdqa       %ymm0,%ymm1
   DB  197,253,111,208                     ; vmovdqa       %ymm0,%ymm2
   DB  197,253,111,216                     ; vmovdqa       %ymm0,%ymm3
@@ -35643,8 +35383,8 @@
 PUBLIC _sk_set_rgb_hsw_lowp
 _sk_set_rgb_hsw_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  197,122,16,5,32,217,0,0             ; vmovss        0xd920(%rip),%xmm8        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
-  DB  197,250,16,21,72,217,0,0            ; vmovss        0xd948(%rip),%xmm2        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  197,122,16,5,32,217,0,0             ; vmovss        0xd920(%rip),%xmm8        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  197,250,16,21,72,217,0,0            ; vmovss        0xd948(%rip),%xmm2        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   DB  197,250,16,0                        ; vmovss        (%rax),%xmm0
   DB  196,226,57,153,194                  ; vfmadd132ss   %xmm2,%xmm8,%xmm0
   DB  197,122,44,192                      ; vcvttss2si    %xmm0,%r8d
@@ -35681,7 +35421,7 @@
 PUBLIC _sk_premul_hsw_lowp
 _sk_premul_hsw_lowp LABEL PROC
   DB  197,229,213,192                     ; vpmullw       %ymm0,%ymm3,%ymm0
-  DB  196,98,125,121,5,155,223,0,0        ; vpbroadcastw  0xdf9b(%rip),%ymm8        # 33bc4 <_sk_srcover_bgra_8888_sse2_lowp+0x9a8>
+  DB  196,98,125,121,5,167,223,0,0        ; vpbroadcastw  0xdfa7(%rip),%ymm8        # 335a4 <_sk_srcover_bgra_8888_sse2_lowp+0x9b4>
   DB  196,193,125,253,192                 ; vpaddw        %ymm8,%ymm0,%ymm0
   DB  197,253,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm0
   DB  197,229,213,201                     ; vpmullw       %ymm1,%ymm3,%ymm1
@@ -35696,7 +35436,7 @@
 PUBLIC _sk_premul_dst_hsw_lowp
 _sk_premul_dst_hsw_lowp LABEL PROC
   DB  197,197,213,228                     ; vpmullw       %ymm4,%ymm7,%ymm4
-  DB  196,98,125,121,5,102,223,0,0        ; vpbroadcastw  0xdf66(%rip),%ymm8        # 33bc6 <_sk_srcover_bgra_8888_sse2_lowp+0x9aa>
+  DB  196,98,125,121,5,114,223,0,0        ; vpbroadcastw  0xdf72(%rip),%ymm8        # 335a6 <_sk_srcover_bgra_8888_sse2_lowp+0x9b6>
   DB  196,193,93,253,224                  ; vpaddw        %ymm8,%ymm4,%ymm4
   DB  197,221,113,212,8                   ; vpsrlw        $0x8,%ymm4,%ymm4
   DB  197,197,213,237                     ; vpmullw       %ymm5,%ymm7,%ymm5
@@ -35736,7 +35476,7 @@
 
 PUBLIC _sk_invert_hsw_lowp
 _sk_invert_hsw_lowp LABEL PROC
-  DB  196,98,125,121,5,253,222,0,0        ; vpbroadcastw  0xdefd(%rip),%ymm8        # 33bc8 <_sk_srcover_bgra_8888_sse2_lowp+0x9ac>
+  DB  196,98,125,121,5,9,223,0,0          ; vpbroadcastw  0xdf09(%rip),%ymm8        # 335a8 <_sk_srcover_bgra_8888_sse2_lowp+0x9b8>
   DB  197,189,249,192                     ; vpsubw        %ymm0,%ymm8,%ymm0
   DB  197,189,249,201                     ; vpsubw        %ymm1,%ymm8,%ymm1
   DB  197,189,249,210                     ; vpsubw        %ymm2,%ymm8,%ymm2
@@ -35756,7 +35496,7 @@
 PUBLIC _sk_srcatop_hsw_lowp
 _sk_srcatop_hsw_lowp LABEL PROC
   DB  197,197,213,192                     ; vpmullw       %ymm0,%ymm7,%ymm0
-  DB  196,98,125,121,5,202,222,0,0        ; vpbroadcastw  0xdeca(%rip),%ymm8        # 33bca <_sk_srcover_bgra_8888_sse2_lowp+0x9ae>
+  DB  196,98,125,121,5,214,222,0,0        ; vpbroadcastw  0xded6(%rip),%ymm8        # 335aa <_sk_srcover_bgra_8888_sse2_lowp+0x9ba>
   DB  197,189,249,219                     ; vpsubw        %ymm3,%ymm8,%ymm3
   DB  197,101,213,204                     ; vpmullw       %ymm4,%ymm3,%ymm9
   DB  196,193,125,253,192                 ; vpaddw        %ymm8,%ymm0,%ymm0
@@ -35781,7 +35521,7 @@
 PUBLIC _sk_dstatop_hsw_lowp
 _sk_dstatop_hsw_lowp LABEL PROC
   DB  197,93,213,195                      ; vpmullw       %ymm3,%ymm4,%ymm8
-  DB  196,98,125,121,13,106,222,0,0       ; vpbroadcastw  0xde6a(%rip),%ymm9        # 33bcc <_sk_srcover_bgra_8888_sse2_lowp+0x9b0>
+  DB  196,98,125,121,13,118,222,0,0       ; vpbroadcastw  0xde76(%rip),%ymm9        # 335ac <_sk_srcover_bgra_8888_sse2_lowp+0x9bc>
   DB  197,53,249,215                      ; vpsubw        %ymm7,%ymm9,%ymm10
   DB  197,173,213,192                     ; vpmullw       %ymm0,%ymm10,%ymm0
   DB  196,65,61,253,193                   ; vpaddw        %ymm9,%ymm8,%ymm8
@@ -35806,7 +35546,7 @@
 PUBLIC _sk_srcin_hsw_lowp
 _sk_srcin_hsw_lowp LABEL PROC
   DB  197,197,213,192                     ; vpmullw       %ymm0,%ymm7,%ymm0
-  DB  196,98,125,121,5,7,222,0,0          ; vpbroadcastw  0xde07(%rip),%ymm8        # 33bce <_sk_srcover_bgra_8888_sse2_lowp+0x9b2>
+  DB  196,98,125,121,5,19,222,0,0         ; vpbroadcastw  0xde13(%rip),%ymm8        # 335ae <_sk_srcover_bgra_8888_sse2_lowp+0x9be>
   DB  196,193,125,253,192                 ; vpaddw        %ymm8,%ymm0,%ymm0
   DB  197,253,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm0
   DB  197,197,213,201                     ; vpmullw       %ymm1,%ymm7,%ymm1
@@ -35824,7 +35564,7 @@
 PUBLIC _sk_dstin_hsw_lowp
 _sk_dstin_hsw_lowp LABEL PROC
   DB  197,221,213,195                     ; vpmullw       %ymm3,%ymm4,%ymm0
-  DB  196,98,125,121,5,196,221,0,0        ; vpbroadcastw  0xddc4(%rip),%ymm8        # 33bd0 <_sk_srcover_bgra_8888_sse2_lowp+0x9b4>
+  DB  196,98,125,121,5,208,221,0,0        ; vpbroadcastw  0xddd0(%rip),%ymm8        # 335b0 <_sk_srcover_bgra_8888_sse2_lowp+0x9c0>
   DB  196,193,125,253,192                 ; vpaddw        %ymm8,%ymm0,%ymm0
   DB  197,253,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm0
   DB  197,213,213,203                     ; vpmullw       %ymm3,%ymm5,%ymm1
@@ -35841,7 +35581,7 @@
 
 PUBLIC _sk_srcout_hsw_lowp
 _sk_srcout_hsw_lowp LABEL PROC
-  DB  196,98,125,121,5,133,221,0,0        ; vpbroadcastw  0xdd85(%rip),%ymm8        # 33bd2 <_sk_srcover_bgra_8888_sse2_lowp+0x9b6>
+  DB  196,98,125,121,5,145,221,0,0        ; vpbroadcastw  0xdd91(%rip),%ymm8        # 335b2 <_sk_srcover_bgra_8888_sse2_lowp+0x9c2>
   DB  197,61,249,207                      ; vpsubw        %ymm7,%ymm8,%ymm9
   DB  197,181,213,192                     ; vpmullw       %ymm0,%ymm9,%ymm0
   DB  196,193,125,253,192                 ; vpaddw        %ymm8,%ymm0,%ymm0
@@ -35860,7 +35600,7 @@
 
 PUBLIC _sk_dstout_hsw_lowp
 _sk_dstout_hsw_lowp LABEL PROC
-  DB  196,98,125,121,5,62,221,0,0         ; vpbroadcastw  0xdd3e(%rip),%ymm8        # 33bd4 <_sk_srcover_bgra_8888_sse2_lowp+0x9b8>
+  DB  196,98,125,121,5,74,221,0,0         ; vpbroadcastw  0xdd4a(%rip),%ymm8        # 335b4 <_sk_srcover_bgra_8888_sse2_lowp+0x9c4>
   DB  197,189,249,219                     ; vpsubw        %ymm3,%ymm8,%ymm3
   DB  197,229,213,196                     ; vpmullw       %ymm4,%ymm3,%ymm0
   DB  196,193,125,253,192                 ; vpaddw        %ymm8,%ymm0,%ymm0
@@ -35879,7 +35619,7 @@
 
 PUBLIC _sk_srcover_hsw_lowp
 _sk_srcover_hsw_lowp LABEL PROC
-  DB  196,98,125,121,5,247,220,0,0        ; vpbroadcastw  0xdcf7(%rip),%ymm8        # 33bd6 <_sk_srcover_bgra_8888_sse2_lowp+0x9ba>
+  DB  196,98,125,121,5,3,221,0,0          ; vpbroadcastw  0xdd03(%rip),%ymm8        # 335b6 <_sk_srcover_bgra_8888_sse2_lowp+0x9c6>
   DB  197,61,249,203                      ; vpsubw        %ymm3,%ymm8,%ymm9
   DB  197,53,213,212                      ; vpmullw       %ymm4,%ymm9,%ymm10
   DB  196,65,45,253,208                   ; vpaddw        %ymm8,%ymm10,%ymm10
@@ -35902,7 +35642,7 @@
 
 PUBLIC _sk_dstover_hsw_lowp
 _sk_dstover_hsw_lowp LABEL PROC
-  DB  196,98,125,121,5,156,220,0,0        ; vpbroadcastw  0xdc9c(%rip),%ymm8        # 33bd8 <_sk_srcover_bgra_8888_sse2_lowp+0x9bc>
+  DB  196,98,125,121,5,168,220,0,0        ; vpbroadcastw  0xdca8(%rip),%ymm8        # 335b8 <_sk_srcover_bgra_8888_sse2_lowp+0x9c8>
   DB  197,61,249,207                      ; vpsubw        %ymm7,%ymm8,%ymm9
   DB  197,181,213,192                     ; vpmullw       %ymm0,%ymm9,%ymm0
   DB  196,193,125,253,192                 ; vpaddw        %ymm8,%ymm0,%ymm0
@@ -35926,7 +35666,7 @@
 PUBLIC _sk_modulate_hsw_lowp
 _sk_modulate_hsw_lowp LABEL PROC
   DB  197,221,213,192                     ; vpmullw       %ymm0,%ymm4,%ymm0
-  DB  196,98,125,121,5,65,220,0,0         ; vpbroadcastw  0xdc41(%rip),%ymm8        # 33bda <_sk_srcover_bgra_8888_sse2_lowp+0x9be>
+  DB  196,98,125,121,5,77,220,0,0         ; vpbroadcastw  0xdc4d(%rip),%ymm8        # 335ba <_sk_srcover_bgra_8888_sse2_lowp+0x9ca>
   DB  196,193,125,253,192                 ; vpaddw        %ymm8,%ymm0,%ymm0
   DB  197,253,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm0
   DB  197,213,213,201                     ; vpmullw       %ymm1,%ymm5,%ymm1
@@ -35943,7 +35683,7 @@
 
 PUBLIC _sk_multiply_hsw_lowp
 _sk_multiply_hsw_lowp LABEL PROC
-  DB  196,98,125,121,5,2,220,0,0          ; vpbroadcastw  0xdc02(%rip),%ymm8        # 33bdc <_sk_srcover_bgra_8888_sse2_lowp+0x9c0>
+  DB  196,98,125,121,5,14,220,0,0         ; vpbroadcastw  0xdc0e(%rip),%ymm8        # 335bc <_sk_srcover_bgra_8888_sse2_lowp+0x9cc>
   DB  197,61,249,203                      ; vpsubw        %ymm3,%ymm8,%ymm9
   DB  197,53,213,212                      ; vpmullw       %ymm4,%ymm9,%ymm10
   DB  196,65,93,253,216                   ; vpaddw        %ymm8,%ymm4,%ymm11
@@ -35977,7 +35717,7 @@
 PUBLIC _sk_plus__hsw_lowp
 _sk_plus__hsw_lowp LABEL PROC
   DB  197,221,253,192                     ; vpaddw        %ymm0,%ymm4,%ymm0
-  DB  196,98,125,121,5,120,219,0,0        ; vpbroadcastw  0xdb78(%rip),%ymm8        # 33bde <_sk_srcover_bgra_8888_sse2_lowp+0x9c2>
+  DB  196,98,125,121,5,132,219,0,0        ; vpbroadcastw  0xdb84(%rip),%ymm8        # 335be <_sk_srcover_bgra_8888_sse2_lowp+0x9ce>
   DB  196,194,125,58,192                  ; vpminuw       %ymm8,%ymm0,%ymm0
   DB  197,213,253,201                     ; vpaddw        %ymm1,%ymm5,%ymm1
   DB  196,194,117,58,200                  ; vpminuw       %ymm8,%ymm1,%ymm1
@@ -35992,7 +35732,7 @@
 _sk_screen_hsw_lowp LABEL PROC
   DB  197,93,253,192                      ; vpaddw        %ymm0,%ymm4,%ymm8
   DB  197,221,213,192                     ; vpmullw       %ymm0,%ymm4,%ymm0
-  DB  196,98,125,121,13,69,219,0,0        ; vpbroadcastw  0xdb45(%rip),%ymm9        # 33be0 <_sk_srcover_bgra_8888_sse2_lowp+0x9c4>
+  DB  196,98,125,121,13,81,219,0,0        ; vpbroadcastw  0xdb51(%rip),%ymm9        # 335c0 <_sk_srcover_bgra_8888_sse2_lowp+0x9d0>
   DB  196,193,125,253,193                 ; vpaddw        %ymm9,%ymm0,%ymm0
   DB  197,253,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm0
   DB  197,189,249,192                     ; vpsubw        %ymm0,%ymm8,%ymm0
@@ -36016,7 +35756,7 @@
 
 PUBLIC _sk_xor__hsw_lowp
 _sk_xor__hsw_lowp LABEL PROC
-  DB  196,98,125,121,5,234,218,0,0        ; vpbroadcastw  0xdaea(%rip),%ymm8        # 33be2 <_sk_srcover_bgra_8888_sse2_lowp+0x9c6>
+  DB  196,98,125,121,5,246,218,0,0        ; vpbroadcastw  0xdaf6(%rip),%ymm8        # 335c2 <_sk_srcover_bgra_8888_sse2_lowp+0x9d2>
   DB  197,61,249,207                      ; vpsubw        %ymm7,%ymm8,%ymm9
   DB  197,181,213,192                     ; vpmullw       %ymm0,%ymm9,%ymm0
   DB  197,61,249,211                      ; vpsubw        %ymm3,%ymm8,%ymm10
@@ -36048,7 +35788,7 @@
   DB  197,197,213,192                     ; vpmullw       %ymm0,%ymm7,%ymm0
   DB  197,93,213,203                      ; vpmullw       %ymm3,%ymm4,%ymm9
   DB  196,194,125,62,193                  ; vpmaxuw       %ymm9,%ymm0,%ymm0
-  DB  196,98,125,121,13,110,218,0,0       ; vpbroadcastw  0xda6e(%rip),%ymm9        # 33be4 <_sk_srcover_bgra_8888_sse2_lowp+0x9c8>
+  DB  196,98,125,121,13,122,218,0,0       ; vpbroadcastw  0xda7a(%rip),%ymm9        # 335c4 <_sk_srcover_bgra_8888_sse2_lowp+0x9d4>
   DB  196,193,125,253,193                 ; vpaddw        %ymm9,%ymm0,%ymm0
   DB  197,253,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm0
   DB  197,189,249,192                     ; vpsubw        %ymm0,%ymm8,%ymm0
@@ -36080,7 +35820,7 @@
   DB  197,197,213,192                     ; vpmullw       %ymm0,%ymm7,%ymm0
   DB  197,93,213,203                      ; vpmullw       %ymm3,%ymm4,%ymm9
   DB  196,194,125,58,193                  ; vpminuw       %ymm9,%ymm0,%ymm0
-  DB  196,98,125,121,13,239,217,0,0       ; vpbroadcastw  0xd9ef(%rip),%ymm9        # 33be6 <_sk_srcover_bgra_8888_sse2_lowp+0x9ca>
+  DB  196,98,125,121,13,251,217,0,0       ; vpbroadcastw  0xd9fb(%rip),%ymm9        # 335c6 <_sk_srcover_bgra_8888_sse2_lowp+0x9d6>
   DB  196,193,125,253,193                 ; vpaddw        %ymm9,%ymm0,%ymm0
   DB  197,253,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm0
   DB  197,189,249,192                     ; vpsubw        %ymm0,%ymm8,%ymm0
@@ -36112,10 +35852,10 @@
   DB  197,197,213,192                     ; vpmullw       %ymm0,%ymm7,%ymm0
   DB  197,93,213,203                      ; vpmullw       %ymm3,%ymm4,%ymm9
   DB  196,194,125,58,193                  ; vpminuw       %ymm9,%ymm0,%ymm0
-  DB  196,98,125,121,13,112,217,0,0       ; vpbroadcastw  0xd970(%rip),%ymm9        # 33be8 <_sk_srcover_bgra_8888_sse2_lowp+0x9cc>
+  DB  196,98,125,121,13,124,217,0,0       ; vpbroadcastw  0xd97c(%rip),%ymm9        # 335c8 <_sk_srcover_bgra_8888_sse2_lowp+0x9d8>
   DB  196,193,125,253,193                 ; vpaddw        %ymm9,%ymm0,%ymm0
   DB  197,253,113,208,7                   ; vpsrlw        $0x7,%ymm0,%ymm0
-  DB  196,98,125,121,21,95,217,0,0        ; vpbroadcastw  0xd95f(%rip),%ymm10        # 33bea <_sk_srcover_bgra_8888_sse2_lowp+0x9ce>
+  DB  196,98,125,121,21,107,217,0,0       ; vpbroadcastw  0xd96b(%rip),%ymm10        # 335ca <_sk_srcover_bgra_8888_sse2_lowp+0x9da>
   DB  196,193,125,219,194                 ; vpand         %ymm10,%ymm0,%ymm0
   DB  197,189,249,192                     ; vpsubw        %ymm0,%ymm8,%ymm0
   DB  197,85,253,193                      ; vpaddw        %ymm1,%ymm5,%ymm8
@@ -36146,10 +35886,10 @@
 _sk_exclusion_hsw_lowp LABEL PROC
   DB  197,93,253,192                      ; vpaddw        %ymm0,%ymm4,%ymm8
   DB  197,221,213,192                     ; vpmullw       %ymm0,%ymm4,%ymm0
-  DB  196,98,125,121,13,228,216,0,0       ; vpbroadcastw  0xd8e4(%rip),%ymm9        # 33bec <_sk_srcover_bgra_8888_sse2_lowp+0x9d0>
+  DB  196,98,125,121,13,240,216,0,0       ; vpbroadcastw  0xd8f0(%rip),%ymm9        # 335cc <_sk_srcover_bgra_8888_sse2_lowp+0x9dc>
   DB  196,193,125,253,193                 ; vpaddw        %ymm9,%ymm0,%ymm0
   DB  197,253,113,208,7                   ; vpsrlw        $0x7,%ymm0,%ymm0
-  DB  196,98,125,121,21,211,216,0,0       ; vpbroadcastw  0xd8d3(%rip),%ymm10        # 33bee <_sk_srcover_bgra_8888_sse2_lowp+0x9d2>
+  DB  196,98,125,121,21,223,216,0,0       ; vpbroadcastw  0xd8df(%rip),%ymm10        # 335ce <_sk_srcover_bgra_8888_sse2_lowp+0x9de>
   DB  196,193,125,219,194                 ; vpand         %ymm10,%ymm0,%ymm0
   DB  197,189,249,192                     ; vpsubw        %ymm0,%ymm8,%ymm0
   DB  197,85,253,193                      ; vpaddw        %ymm1,%ymm5,%ymm8
@@ -36175,7 +35915,7 @@
 PUBLIC _sk_hardlight_hsw_lowp
 _sk_hardlight_hsw_lowp LABEL PROC
   DB  197,125,253,192                     ; vpaddw        %ymm0,%ymm0,%ymm8
-  DB  196,98,125,121,13,112,216,0,0       ; vpbroadcastw  0xd870(%rip),%ymm9        # 33bf2 <_sk_srcover_bgra_8888_sse2_lowp+0x9d6>
+  DB  196,98,125,121,13,124,216,0,0       ; vpbroadcastw  0xd87c(%rip),%ymm9        # 335d2 <_sk_srcover_bgra_8888_sse2_lowp+0x9e2>
   DB  196,65,101,239,209                  ; vpxor         %ymm9,%ymm3,%ymm10
   DB  196,65,61,239,217                   ; vpxor         %ymm9,%ymm8,%ymm11
   DB  196,65,37,101,218                   ; vpcmpgtw      %ymm10,%ymm11,%ymm11
@@ -36203,7 +35943,7 @@
   DB  197,101,249,210                     ; vpsubw        %ymm2,%ymm3,%ymm10
   DB  197,69,249,246                      ; vpsubw        %ymm6,%ymm7,%ymm14
   DB  196,65,45,213,214                   ; vpmullw       %ymm14,%ymm10,%ymm10
-  DB  196,98,125,121,53,231,215,0,0       ; vpbroadcastw  0xd7e7(%rip),%ymm14        # 33bf0 <_sk_srcover_bgra_8888_sse2_lowp+0x9d4>
+  DB  196,98,125,121,53,243,215,0,0       ; vpbroadcastw  0xd7f3(%rip),%ymm14        # 335d0 <_sk_srcover_bgra_8888_sse2_lowp+0x9e0>
   DB  196,65,45,253,210                   ; vpaddw        %ymm10,%ymm10,%ymm10
   DB  196,65,61,249,194                   ; vpsubw        %ymm10,%ymm8,%ymm8
   DB  197,13,249,215                      ; vpsubw        %ymm7,%ymm14,%ymm10
@@ -36238,7 +35978,7 @@
 PUBLIC _sk_overlay_hsw_lowp
 _sk_overlay_hsw_lowp LABEL PROC
   DB  197,93,253,196                      ; vpaddw        %ymm4,%ymm4,%ymm8
-  DB  196,98,125,121,13,92,215,0,0        ; vpbroadcastw  0xd75c(%rip),%ymm9        # 33bf6 <_sk_srcover_bgra_8888_sse2_lowp+0x9da>
+  DB  196,98,125,121,13,104,215,0,0       ; vpbroadcastw  0xd768(%rip),%ymm9        # 335d6 <_sk_srcover_bgra_8888_sse2_lowp+0x9e6>
   DB  196,65,69,239,209                   ; vpxor         %ymm9,%ymm7,%ymm10
   DB  196,65,61,239,193                   ; vpxor         %ymm9,%ymm8,%ymm8
   DB  196,65,61,101,218                   ; vpcmpgtw      %ymm10,%ymm8,%ymm11
@@ -36262,7 +36002,7 @@
   DB  196,65,21,253,237                   ; vpaddw        %ymm13,%ymm13,%ymm13
   DB  196,65,61,249,237                   ; vpsubw        %ymm13,%ymm8,%ymm13
   DB  196,67,13,76,229,192                ; vpblendvb     %ymm12,%ymm13,%ymm14,%ymm12
-  DB  196,98,125,121,45,228,214,0,0       ; vpbroadcastw  0xd6e4(%rip),%ymm13        # 33bf4 <_sk_srcover_bgra_8888_sse2_lowp+0x9d8>
+  DB  196,98,125,121,45,240,214,0,0       ; vpbroadcastw  0xd6f0(%rip),%ymm13        # 335d4 <_sk_srcover_bgra_8888_sse2_lowp+0x9e4>
   DB  197,77,253,246                      ; vpaddw        %ymm6,%ymm6,%ymm14
   DB  196,65,13,239,201                   ; vpxor         %ymm9,%ymm14,%ymm9
   DB  196,65,53,101,202                   ; vpcmpgtw      %ymm10,%ymm9,%ymm9
@@ -36312,10 +36052,10 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,55                              ; ja            26606 <_sk_load_8888_hsw_lowp+0x52>
+  DB  119,55                              ; ja            25fda <_sk_load_8888_hsw_lowp+0x52>
   DB  197,253,239,192                     ; vpxor         %ymm0,%ymm0,%ymm0
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,163,1,0,0                 ; lea           0x1a3(%rip),%r9        # 26780 <_sk_load_8888_hsw_lowp+0x1cc>
+  DB  76,141,13,163,1,0,0                 ; lea           0x1a3(%rip),%r9        # 26154 <_sk_load_8888_hsw_lowp+0x1cc>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
@@ -36325,10 +36065,10 @@
   DB  255,224                             ; jmpq          *%rax
   DB  196,193,121,110,12,144              ; vmovd         (%r8,%rdx,4),%xmm1
   DB  197,253,239,192                     ; vpxor         %ymm0,%ymm0,%ymm0
-  DB  233,39,1,0,0                        ; jmpq          2672d <_sk_load_8888_hsw_lowp+0x179>
+  DB  233,39,1,0,0                        ; jmpq          26101 <_sk_load_8888_hsw_lowp+0x179>
   DB  196,193,126,111,12,144              ; vmovdqu       (%r8,%rdx,4),%ymm1
   DB  196,193,126,111,68,144,32           ; vmovdqu       0x20(%r8,%rdx,4),%ymm0
-  DB  233,21,1,0,0                        ; jmpq          2672d <_sk_load_8888_hsw_lowp+0x179>
+  DB  233,21,1,0,0                        ; jmpq          26101 <_sk_load_8888_hsw_lowp+0x179>
   DB  196,193,121,110,68,144,8            ; vmovd         0x8(%r8,%rdx,4),%xmm0
   DB  196,226,121,89,192                  ; vpbroadcastq  %xmm0,%xmm0
   DB  197,229,239,219                     ; vpxor         %ymm3,%ymm3,%ymm3
@@ -36337,7 +36077,7 @@
   DB  197,249,112,201,232                 ; vpshufd       $0xe8,%xmm1,%xmm1
   DB  196,227,125,2,201,3                 ; vpblendd      $0x3,%ymm1,%ymm0,%ymm1
   DB  197,253,111,195                     ; vmovdqa       %ymm3,%ymm0
-  DB  233,229,0,0,0                       ; jmpq          2672d <_sk_load_8888_hsw_lowp+0x179>
+  DB  233,229,0,0,0                       ; jmpq          26101 <_sk_load_8888_hsw_lowp+0x179>
   DB  196,193,121,110,68,144,24           ; vmovd         0x18(%r8,%rdx,4),%xmm0
   DB  196,226,125,89,192                  ; vpbroadcastq  %xmm0,%ymm0
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
@@ -36353,7 +36093,7 @@
   DB  196,193,122,111,12,144              ; vmovdqu       (%r8,%rdx,4),%xmm1
   DB  196,227,117,2,200,240               ; vpblendd      $0xf0,%ymm0,%ymm1,%ymm1
   DB  197,125,127,192                     ; vmovdqa       %ymm8,%ymm0
-  DB  233,138,0,0,0                       ; jmpq          2672d <_sk_load_8888_hsw_lowp+0x179>
+  DB  233,138,0,0,0                       ; jmpq          26101 <_sk_load_8888_hsw_lowp+0x179>
   DB  196,193,121,110,68,144,40           ; vmovd         0x28(%r8,%rdx,4),%xmm0
   DB  196,226,121,89,192                  ; vpbroadcastq  %xmm0,%xmm0
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
@@ -36363,7 +36103,7 @@
   DB  196,193,121,110,76,144,32           ; vmovd         0x20(%r8,%rdx,4),%xmm1
   DB  196,227,125,2,193,1                 ; vpblendd      $0x1,%ymm1,%ymm0,%ymm0
   DB  196,193,126,111,12,144              ; vmovdqu       (%r8,%rdx,4),%ymm1
-  DB  235,81                              ; jmp           2672d <_sk_load_8888_hsw_lowp+0x179>
+  DB  235,81                              ; jmp           26101 <_sk_load_8888_hsw_lowp+0x179>
   DB  196,193,121,110,68,144,56           ; vmovd         0x38(%r8,%rdx,4),%xmm0
   DB  196,226,125,89,192                  ; vpbroadcastq  %xmm0,%ymm0
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
@@ -36383,7 +36123,7 @@
   DB  196,227,101,14,200,170              ; vpblendw      $0xaa,%ymm0,%ymm3,%ymm1
   DB  196,227,109,14,192,170              ; vpblendw      $0xaa,%ymm0,%ymm2,%ymm0
   DB  196,226,125,43,201                  ; vpackusdw     %ymm1,%ymm0,%ymm1
-  DB  197,125,111,5,170,212,0,0           ; vmovdqa       0xd4aa(%rip),%ymm8        # 33c00 <_sk_srcover_bgra_8888_sse2_lowp+0x9e4>
+  DB  197,125,111,5,182,212,0,0           ; vmovdqa       0xd4b6(%rip),%ymm8        # 335e0 <_sk_srcover_bgra_8888_sse2_lowp+0x9f0>
   DB  196,193,117,219,192                 ; vpand         %ymm8,%ymm1,%ymm0
   DB  197,245,113,209,8                   ; vpsrlw        $0x8,%ymm1,%ymm1
   DB  197,229,114,211,16                  ; vpsrld        $0x10,%ymm3,%ymm3
@@ -36394,7 +36134,7 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  15,31,0                             ; nopl          (%rax)
-  DB  119,254                             ; ja            26780 <_sk_load_8888_hsw_lowp+0x1cc>
+  DB  119,254                             ; ja            26154 <_sk_load_8888_hsw_lowp+0x1cc>
   DB  255                                 ; (bad)
   DB  255,174,254,255,255,152             ; ljmp          *-0x67000002(%rsi)
   DB  254                                 ; (bad)
@@ -36439,10 +36179,10 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,55                              ; ja            2680e <_sk_load_8888_dst_hsw_lowp+0x52>
+  DB  119,55                              ; ja            261e2 <_sk_load_8888_dst_hsw_lowp+0x52>
   DB  197,221,239,228                     ; vpxor         %ymm4,%ymm4,%ymm4
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,163,1,0,0                 ; lea           0x1a3(%rip),%r9        # 26988 <_sk_load_8888_dst_hsw_lowp+0x1cc>
+  DB  76,141,13,163,1,0,0                 ; lea           0x1a3(%rip),%r9        # 2635c <_sk_load_8888_dst_hsw_lowp+0x1cc>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -36452,10 +36192,10 @@
   DB  255,224                             ; jmpq          *%rax
   DB  196,193,121,110,44,144              ; vmovd         (%r8,%rdx,4),%xmm5
   DB  197,221,239,228                     ; vpxor         %ymm4,%ymm4,%ymm4
-  DB  233,39,1,0,0                        ; jmpq          26935 <_sk_load_8888_dst_hsw_lowp+0x179>
+  DB  233,39,1,0,0                        ; jmpq          26309 <_sk_load_8888_dst_hsw_lowp+0x179>
   DB  196,193,126,111,44,144              ; vmovdqu       (%r8,%rdx,4),%ymm5
   DB  196,193,126,111,100,144,32          ; vmovdqu       0x20(%r8,%rdx,4),%ymm4
-  DB  233,21,1,0,0                        ; jmpq          26935 <_sk_load_8888_dst_hsw_lowp+0x179>
+  DB  233,21,1,0,0                        ; jmpq          26309 <_sk_load_8888_dst_hsw_lowp+0x179>
   DB  196,193,121,110,100,144,8           ; vmovd         0x8(%r8,%rdx,4),%xmm4
   DB  196,226,121,89,228                  ; vpbroadcastq  %xmm4,%xmm4
   DB  197,197,239,255                     ; vpxor         %ymm7,%ymm7,%ymm7
@@ -36464,7 +36204,7 @@
   DB  197,249,112,237,232                 ; vpshufd       $0xe8,%xmm5,%xmm5
   DB  196,227,93,2,237,3                  ; vpblendd      $0x3,%ymm5,%ymm4,%ymm5
   DB  197,253,111,231                     ; vmovdqa       %ymm7,%ymm4
-  DB  233,229,0,0,0                       ; jmpq          26935 <_sk_load_8888_dst_hsw_lowp+0x179>
+  DB  233,229,0,0,0                       ; jmpq          26309 <_sk_load_8888_dst_hsw_lowp+0x179>
   DB  196,193,121,110,100,144,24          ; vmovd         0x18(%r8,%rdx,4),%xmm4
   DB  196,226,125,89,228                  ; vpbroadcastq  %xmm4,%ymm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -36480,7 +36220,7 @@
   DB  196,193,122,111,44,144              ; vmovdqu       (%r8,%rdx,4),%xmm5
   DB  196,227,85,2,236,240                ; vpblendd      $0xf0,%ymm4,%ymm5,%ymm5
   DB  197,125,127,196                     ; vmovdqa       %ymm8,%ymm4
-  DB  233,138,0,0,0                       ; jmpq          26935 <_sk_load_8888_dst_hsw_lowp+0x179>
+  DB  233,138,0,0,0                       ; jmpq          26309 <_sk_load_8888_dst_hsw_lowp+0x179>
   DB  196,193,121,110,100,144,40          ; vmovd         0x28(%r8,%rdx,4),%xmm4
   DB  196,226,121,89,228                  ; vpbroadcastq  %xmm4,%xmm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -36490,7 +36230,7 @@
   DB  196,193,121,110,108,144,32          ; vmovd         0x20(%r8,%rdx,4),%xmm5
   DB  196,227,93,2,229,1                  ; vpblendd      $0x1,%ymm5,%ymm4,%ymm4
   DB  196,193,126,111,44,144              ; vmovdqu       (%r8,%rdx,4),%ymm5
-  DB  235,81                              ; jmp           26935 <_sk_load_8888_dst_hsw_lowp+0x179>
+  DB  235,81                              ; jmp           26309 <_sk_load_8888_dst_hsw_lowp+0x179>
   DB  196,193,121,110,100,144,56          ; vmovd         0x38(%r8,%rdx,4),%xmm4
   DB  196,226,125,89,228                  ; vpbroadcastq  %xmm4,%ymm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -36510,7 +36250,7 @@
   DB  196,227,69,14,236,170               ; vpblendw      $0xaa,%ymm4,%ymm7,%ymm5
   DB  196,227,77,14,228,170               ; vpblendw      $0xaa,%ymm4,%ymm6,%ymm4
   DB  196,226,93,43,237                   ; vpackusdw     %ymm5,%ymm4,%ymm5
-  DB  197,125,111,5,194,210,0,0           ; vmovdqa       0xd2c2(%rip),%ymm8        # 33c20 <_sk_srcover_bgra_8888_sse2_lowp+0xa04>
+  DB  197,125,111,5,206,210,0,0           ; vmovdqa       0xd2ce(%rip),%ymm8        # 33600 <_sk_srcover_bgra_8888_sse2_lowp+0xa10>
   DB  196,193,85,219,224                  ; vpand         %ymm8,%ymm5,%ymm4
   DB  197,213,113,213,8                   ; vpsrlw        $0x8,%ymm5,%ymm5
   DB  197,197,114,215,16                  ; vpsrld        $0x10,%ymm7,%ymm7
@@ -36521,7 +36261,7 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  15,31,0                             ; nopl          (%rax)
-  DB  119,254                             ; ja            26988 <_sk_load_8888_dst_hsw_lowp+0x1cc>
+  DB  119,254                             ; ja            2635c <_sk_load_8888_dst_hsw_lowp+0x1cc>
   DB  255                                 ; (bad)
   DB  255,174,254,255,255,152             ; ljmp          *-0x67000002(%rsi)
   DB  254                                 ; (bad)
@@ -36580,20 +36320,20 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,30                              ; ja            26a45 <_sk_store_8888_hsw_lowp+0x81>
+  DB  119,30                              ; ja            26419 <_sk_store_8888_hsw_lowp+0x81>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,195,0,0,0                 ; lea           0xc3(%rip),%r9        # 26af4 <_sk_store_8888_hsw_lowp+0x130>
+  DB  76,141,13,195,0,0,0                 ; lea           0xc3(%rip),%r9        # 264c8 <_sk_store_8888_hsw_lowp+0x130>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,65,121,126,4,144                ; vmovd         %xmm8,(%r8,%rdx,4)
-  DB  233,171,0,0,0                       ; jmpq          26af0 <_sk_store_8888_hsw_lowp+0x12c>
+  DB  233,171,0,0,0                       ; jmpq          264c4 <_sk_store_8888_hsw_lowp+0x12c>
   DB  196,65,126,127,4,144                ; vmovdqu       %ymm8,(%r8,%rdx,4)
   DB  196,65,126,127,76,144,32            ; vmovdqu       %ymm9,0x20(%r8,%rdx,4)
-  DB  233,153,0,0,0                       ; jmpq          26af0 <_sk_store_8888_hsw_lowp+0x12c>
+  DB  233,153,0,0,0                       ; jmpq          264c4 <_sk_store_8888_hsw_lowp+0x12c>
   DB  196,67,121,22,68,144,8,2            ; vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
   DB  196,65,121,214,4,144                ; vmovq         %xmm8,(%r8,%rdx,4)
-  DB  233,134,0,0,0                       ; jmpq          26af0 <_sk_store_8888_hsw_lowp+0x12c>
+  DB  233,134,0,0,0                       ; jmpq          264c4 <_sk_store_8888_hsw_lowp+0x12c>
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,67,121,22,76,144,24,2           ; vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
@@ -36601,12 +36341,12 @@
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,65,121,126,76,144,16            ; vmovd         %xmm9,0x10(%r8,%rdx,4)
   DB  196,65,122,127,4,144                ; vmovdqu       %xmm8,(%r8,%rdx,4)
-  DB  235,85                              ; jmp           26af0 <_sk_store_8888_hsw_lowp+0x12c>
+  DB  235,85                              ; jmp           264c4 <_sk_store_8888_hsw_lowp+0x12c>
   DB  196,67,121,22,76,144,40,2           ; vpextrd       $0x2,%xmm9,0x28(%r8,%rdx,4)
   DB  196,67,121,22,76,144,36,1           ; vpextrd       $0x1,%xmm9,0x24(%r8,%rdx,4)
   DB  196,65,121,126,76,144,32            ; vmovd         %xmm9,0x20(%r8,%rdx,4)
   DB  196,65,126,127,4,144                ; vmovdqu       %ymm8,(%r8,%rdx,4)
-  DB  235,54                              ; jmp           26af0 <_sk_store_8888_hsw_lowp+0x12c>
+  DB  235,54                              ; jmp           264c4 <_sk_store_8888_hsw_lowp+0x12c>
   DB  196,67,125,57,202,1                 ; vextracti128  $0x1,%ymm9,%xmm10
   DB  196,67,121,22,84,144,56,2           ; vpextrd       $0x2,%xmm10,0x38(%r8,%rdx,4)
   DB  196,67,125,57,202,1                 ; vextracti128  $0x1,%ymm9,%xmm10
@@ -36661,10 +36401,10 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,55                              ; ja            26b82 <_sk_load_bgra_hsw_lowp+0x52>
+  DB  119,55                              ; ja            26556 <_sk_load_bgra_hsw_lowp+0x52>
   DB  197,253,239,192                     ; vpxor         %ymm0,%ymm0,%ymm0
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,163,1,0,0                 ; lea           0x1a3(%rip),%r9        # 26cfc <_sk_load_bgra_hsw_lowp+0x1cc>
+  DB  76,141,13,163,1,0,0                 ; lea           0x1a3(%rip),%r9        # 266d0 <_sk_load_bgra_hsw_lowp+0x1cc>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
@@ -36674,10 +36414,10 @@
   DB  255,224                             ; jmpq          *%rax
   DB  196,193,121,110,12,144              ; vmovd         (%r8,%rdx,4),%xmm1
   DB  197,253,239,192                     ; vpxor         %ymm0,%ymm0,%ymm0
-  DB  233,39,1,0,0                        ; jmpq          26ca9 <_sk_load_bgra_hsw_lowp+0x179>
+  DB  233,39,1,0,0                        ; jmpq          2667d <_sk_load_bgra_hsw_lowp+0x179>
   DB  196,193,126,111,12,144              ; vmovdqu       (%r8,%rdx,4),%ymm1
   DB  196,193,126,111,68,144,32           ; vmovdqu       0x20(%r8,%rdx,4),%ymm0
-  DB  233,21,1,0,0                        ; jmpq          26ca9 <_sk_load_bgra_hsw_lowp+0x179>
+  DB  233,21,1,0,0                        ; jmpq          2667d <_sk_load_bgra_hsw_lowp+0x179>
   DB  196,193,121,110,68,144,8            ; vmovd         0x8(%r8,%rdx,4),%xmm0
   DB  196,226,121,89,192                  ; vpbroadcastq  %xmm0,%xmm0
   DB  197,229,239,219                     ; vpxor         %ymm3,%ymm3,%ymm3
@@ -36686,7 +36426,7 @@
   DB  197,249,112,201,232                 ; vpshufd       $0xe8,%xmm1,%xmm1
   DB  196,227,125,2,201,3                 ; vpblendd      $0x3,%ymm1,%ymm0,%ymm1
   DB  197,253,111,195                     ; vmovdqa       %ymm3,%ymm0
-  DB  233,229,0,0,0                       ; jmpq          26ca9 <_sk_load_bgra_hsw_lowp+0x179>
+  DB  233,229,0,0,0                       ; jmpq          2667d <_sk_load_bgra_hsw_lowp+0x179>
   DB  196,193,121,110,68,144,24           ; vmovd         0x18(%r8,%rdx,4),%xmm0
   DB  196,226,125,89,192                  ; vpbroadcastq  %xmm0,%ymm0
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
@@ -36702,7 +36442,7 @@
   DB  196,193,122,111,12,144              ; vmovdqu       (%r8,%rdx,4),%xmm1
   DB  196,227,117,2,200,240               ; vpblendd      $0xf0,%ymm0,%ymm1,%ymm1
   DB  197,125,127,192                     ; vmovdqa       %ymm8,%ymm0
-  DB  233,138,0,0,0                       ; jmpq          26ca9 <_sk_load_bgra_hsw_lowp+0x179>
+  DB  233,138,0,0,0                       ; jmpq          2667d <_sk_load_bgra_hsw_lowp+0x179>
   DB  196,193,121,110,68,144,40           ; vmovd         0x28(%r8,%rdx,4),%xmm0
   DB  196,226,121,89,192                  ; vpbroadcastq  %xmm0,%xmm0
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
@@ -36712,7 +36452,7 @@
   DB  196,193,121,110,76,144,32           ; vmovd         0x20(%r8,%rdx,4),%xmm1
   DB  196,227,125,2,193,1                 ; vpblendd      $0x1,%ymm1,%ymm0,%ymm0
   DB  196,193,126,111,12,144              ; vmovdqu       (%r8,%rdx,4),%ymm1
-  DB  235,81                              ; jmp           26ca9 <_sk_load_bgra_hsw_lowp+0x179>
+  DB  235,81                              ; jmp           2667d <_sk_load_bgra_hsw_lowp+0x179>
   DB  196,193,121,110,68,144,56           ; vmovd         0x38(%r8,%rdx,4),%xmm0
   DB  196,226,125,89,192                  ; vpbroadcastq  %xmm0,%ymm0
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
@@ -36732,7 +36472,7 @@
   DB  196,227,125,14,209,170              ; vpblendw      $0xaa,%ymm1,%ymm0,%ymm2
   DB  196,227,101,14,201,170              ; vpblendw      $0xaa,%ymm1,%ymm3,%ymm1
   DB  196,226,117,43,202                  ; vpackusdw     %ymm2,%ymm1,%ymm1
-  DB  197,125,111,5,110,207,0,0           ; vmovdqa       0xcf6e(%rip),%ymm8        # 33c40 <_sk_srcover_bgra_8888_sse2_lowp+0xa24>
+  DB  197,125,111,5,122,207,0,0           ; vmovdqa       0xcf7a(%rip),%ymm8        # 33620 <_sk_srcover_bgra_8888_sse2_lowp+0xa30>
   DB  196,193,117,219,208                 ; vpand         %ymm8,%ymm1,%ymm2
   DB  197,245,113,209,8                   ; vpsrlw        $0x8,%ymm1,%ymm1
   DB  197,253,114,208,16                  ; vpsrld        $0x10,%ymm0,%ymm0
@@ -36743,7 +36483,7 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  15,31,0                             ; nopl          (%rax)
-  DB  119,254                             ; ja            26cfc <_sk_load_bgra_hsw_lowp+0x1cc>
+  DB  119,254                             ; ja            266d0 <_sk_load_bgra_hsw_lowp+0x1cc>
   DB  255                                 ; (bad)
   DB  255,174,254,255,255,152             ; ljmp          *-0x67000002(%rsi)
   DB  254                                 ; (bad)
@@ -36788,10 +36528,10 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,55                              ; ja            26d8a <_sk_load_bgra_dst_hsw_lowp+0x52>
+  DB  119,55                              ; ja            2675e <_sk_load_bgra_dst_hsw_lowp+0x52>
   DB  197,221,239,228                     ; vpxor         %ymm4,%ymm4,%ymm4
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,163,1,0,0                 ; lea           0x1a3(%rip),%r9        # 26f04 <_sk_load_bgra_dst_hsw_lowp+0x1cc>
+  DB  76,141,13,163,1,0,0                 ; lea           0x1a3(%rip),%r9        # 268d8 <_sk_load_bgra_dst_hsw_lowp+0x1cc>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -36801,10 +36541,10 @@
   DB  255,224                             ; jmpq          *%rax
   DB  196,193,121,110,44,144              ; vmovd         (%r8,%rdx,4),%xmm5
   DB  197,221,239,228                     ; vpxor         %ymm4,%ymm4,%ymm4
-  DB  233,39,1,0,0                        ; jmpq          26eb1 <_sk_load_bgra_dst_hsw_lowp+0x179>
+  DB  233,39,1,0,0                        ; jmpq          26885 <_sk_load_bgra_dst_hsw_lowp+0x179>
   DB  196,193,126,111,44,144              ; vmovdqu       (%r8,%rdx,4),%ymm5
   DB  196,193,126,111,100,144,32          ; vmovdqu       0x20(%r8,%rdx,4),%ymm4
-  DB  233,21,1,0,0                        ; jmpq          26eb1 <_sk_load_bgra_dst_hsw_lowp+0x179>
+  DB  233,21,1,0,0                        ; jmpq          26885 <_sk_load_bgra_dst_hsw_lowp+0x179>
   DB  196,193,121,110,100,144,8           ; vmovd         0x8(%r8,%rdx,4),%xmm4
   DB  196,226,121,89,228                  ; vpbroadcastq  %xmm4,%xmm4
   DB  197,197,239,255                     ; vpxor         %ymm7,%ymm7,%ymm7
@@ -36813,7 +36553,7 @@
   DB  197,249,112,237,232                 ; vpshufd       $0xe8,%xmm5,%xmm5
   DB  196,227,93,2,237,3                  ; vpblendd      $0x3,%ymm5,%ymm4,%ymm5
   DB  197,253,111,231                     ; vmovdqa       %ymm7,%ymm4
-  DB  233,229,0,0,0                       ; jmpq          26eb1 <_sk_load_bgra_dst_hsw_lowp+0x179>
+  DB  233,229,0,0,0                       ; jmpq          26885 <_sk_load_bgra_dst_hsw_lowp+0x179>
   DB  196,193,121,110,100,144,24          ; vmovd         0x18(%r8,%rdx,4),%xmm4
   DB  196,226,125,89,228                  ; vpbroadcastq  %xmm4,%ymm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -36829,7 +36569,7 @@
   DB  196,193,122,111,44,144              ; vmovdqu       (%r8,%rdx,4),%xmm5
   DB  196,227,85,2,236,240                ; vpblendd      $0xf0,%ymm4,%ymm5,%ymm5
   DB  197,125,127,196                     ; vmovdqa       %ymm8,%ymm4
-  DB  233,138,0,0,0                       ; jmpq          26eb1 <_sk_load_bgra_dst_hsw_lowp+0x179>
+  DB  233,138,0,0,0                       ; jmpq          26885 <_sk_load_bgra_dst_hsw_lowp+0x179>
   DB  196,193,121,110,100,144,40          ; vmovd         0x28(%r8,%rdx,4),%xmm4
   DB  196,226,121,89,228                  ; vpbroadcastq  %xmm4,%xmm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -36839,7 +36579,7 @@
   DB  196,193,121,110,108,144,32          ; vmovd         0x20(%r8,%rdx,4),%xmm5
   DB  196,227,93,2,229,1                  ; vpblendd      $0x1,%ymm5,%ymm4,%ymm4
   DB  196,193,126,111,44,144              ; vmovdqu       (%r8,%rdx,4),%ymm5
-  DB  235,81                              ; jmp           26eb1 <_sk_load_bgra_dst_hsw_lowp+0x179>
+  DB  235,81                              ; jmp           26885 <_sk_load_bgra_dst_hsw_lowp+0x179>
   DB  196,193,121,110,100,144,56          ; vmovd         0x38(%r8,%rdx,4),%xmm4
   DB  196,226,125,89,228                  ; vpbroadcastq  %xmm4,%ymm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -36859,7 +36599,7 @@
   DB  196,227,93,14,245,170               ; vpblendw      $0xaa,%ymm5,%ymm4,%ymm6
   DB  196,227,69,14,237,170               ; vpblendw      $0xaa,%ymm5,%ymm7,%ymm5
   DB  196,226,85,43,238                   ; vpackusdw     %ymm6,%ymm5,%ymm5
-  DB  197,125,111,5,134,205,0,0           ; vmovdqa       0xcd86(%rip),%ymm8        # 33c60 <_sk_srcover_bgra_8888_sse2_lowp+0xa44>
+  DB  197,125,111,5,146,205,0,0           ; vmovdqa       0xcd92(%rip),%ymm8        # 33640 <_sk_srcover_bgra_8888_sse2_lowp+0xa50>
   DB  196,193,85,219,240                  ; vpand         %ymm8,%ymm5,%ymm6
   DB  197,213,113,213,8                   ; vpsrlw        $0x8,%ymm5,%ymm5
   DB  197,221,114,212,16                  ; vpsrld        $0x10,%ymm4,%ymm4
@@ -36870,7 +36610,7 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  15,31,0                             ; nopl          (%rax)
-  DB  119,254                             ; ja            26f04 <_sk_load_bgra_dst_hsw_lowp+0x1cc>
+  DB  119,254                             ; ja            268d8 <_sk_load_bgra_dst_hsw_lowp+0x1cc>
   DB  255                                 ; (bad)
   DB  255,174,254,255,255,152             ; ljmp          *-0x67000002(%rsi)
   DB  254                                 ; (bad)
@@ -36929,20 +36669,20 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,30                              ; ja            26fc1 <_sk_store_bgra_hsw_lowp+0x81>
+  DB  119,30                              ; ja            26995 <_sk_store_bgra_hsw_lowp+0x81>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,195,0,0,0                 ; lea           0xc3(%rip),%r9        # 27070 <_sk_store_bgra_hsw_lowp+0x130>
+  DB  76,141,13,195,0,0,0                 ; lea           0xc3(%rip),%r9        # 26a44 <_sk_store_bgra_hsw_lowp+0x130>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,65,121,126,4,144                ; vmovd         %xmm8,(%r8,%rdx,4)
-  DB  233,171,0,0,0                       ; jmpq          2706c <_sk_store_bgra_hsw_lowp+0x12c>
+  DB  233,171,0,0,0                       ; jmpq          26a40 <_sk_store_bgra_hsw_lowp+0x12c>
   DB  196,65,126,127,4,144                ; vmovdqu       %ymm8,(%r8,%rdx,4)
   DB  196,65,126,127,76,144,32            ; vmovdqu       %ymm9,0x20(%r8,%rdx,4)
-  DB  233,153,0,0,0                       ; jmpq          2706c <_sk_store_bgra_hsw_lowp+0x12c>
+  DB  233,153,0,0,0                       ; jmpq          26a40 <_sk_store_bgra_hsw_lowp+0x12c>
   DB  196,67,121,22,68,144,8,2            ; vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
   DB  196,65,121,214,4,144                ; vmovq         %xmm8,(%r8,%rdx,4)
-  DB  233,134,0,0,0                       ; jmpq          2706c <_sk_store_bgra_hsw_lowp+0x12c>
+  DB  233,134,0,0,0                       ; jmpq          26a40 <_sk_store_bgra_hsw_lowp+0x12c>
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,67,121,22,76,144,24,2           ; vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
@@ -36950,12 +36690,12 @@
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,65,121,126,76,144,16            ; vmovd         %xmm9,0x10(%r8,%rdx,4)
   DB  196,65,122,127,4,144                ; vmovdqu       %xmm8,(%r8,%rdx,4)
-  DB  235,85                              ; jmp           2706c <_sk_store_bgra_hsw_lowp+0x12c>
+  DB  235,85                              ; jmp           26a40 <_sk_store_bgra_hsw_lowp+0x12c>
   DB  196,67,121,22,76,144,40,2           ; vpextrd       $0x2,%xmm9,0x28(%r8,%rdx,4)
   DB  196,67,121,22,76,144,36,1           ; vpextrd       $0x1,%xmm9,0x24(%r8,%rdx,4)
   DB  196,65,121,126,76,144,32            ; vmovd         %xmm9,0x20(%r8,%rdx,4)
   DB  196,65,126,127,4,144                ; vmovdqu       %ymm8,(%r8,%rdx,4)
-  DB  235,54                              ; jmp           2706c <_sk_store_bgra_hsw_lowp+0x12c>
+  DB  235,54                              ; jmp           26a40 <_sk_store_bgra_hsw_lowp+0x12c>
   DB  196,67,125,57,202,1                 ; vextracti128  $0x1,%ymm9,%xmm10
   DB  196,67,121,22,84,144,56,2           ; vpextrd       $0x2,%xmm10,0x38(%r8,%rdx,4)
   DB  196,67,125,57,202,1                 ; vextracti128  $0x1,%ymm9,%xmm10
@@ -37036,7 +36776,7 @@
   DB  196,195,101,14,194,170              ; vpblendw      $0xaa,%ymm10,%ymm3,%ymm0
   DB  196,195,109,14,202,170              ; vpblendw      $0xaa,%ymm10,%ymm2,%ymm1
   DB  196,226,117,43,200                  ; vpackusdw     %ymm0,%ymm1,%ymm1
-  DB  197,125,111,5,34,203,0,0            ; vmovdqa       0xcb22(%rip),%ymm8        # 33c80 <_sk_srcover_bgra_8888_sse2_lowp+0xa64>
+  DB  197,125,111,5,46,203,0,0            ; vmovdqa       0xcb2e(%rip),%ymm8        # 33660 <_sk_srcover_bgra_8888_sse2_lowp+0xa70>
   DB  196,193,117,219,192                 ; vpand         %ymm8,%ymm1,%ymm0
   DB  197,245,113,209,8                   ; vpsrlw        $0x8,%ymm1,%ymm1
   DB  197,229,114,211,16                  ; vpsrld        $0x10,%ymm3,%ymm3
@@ -37084,7 +36824,7 @@
   DB  196,195,125,14,202,170              ; vpblendw      $0xaa,%ymm10,%ymm0,%ymm1
   DB  196,195,61,14,210,170               ; vpblendw      $0xaa,%ymm10,%ymm8,%ymm2
   DB  196,226,109,43,201                  ; vpackusdw     %ymm1,%ymm2,%ymm1
-  DB  197,253,111,29,105,202,0,0          ; vmovdqa       0xca69(%rip),%ymm3        # 33ca0 <_sk_srcover_bgra_8888_sse2_lowp+0xa84>
+  DB  197,253,111,29,117,202,0,0          ; vmovdqa       0xca75(%rip),%ymm3        # 33680 <_sk_srcover_bgra_8888_sse2_lowp+0xa90>
   DB  197,245,219,211                     ; vpand         %ymm3,%ymm1,%ymm2
   DB  197,245,113,209,8                   ; vpsrlw        $0x8,%ymm1,%ymm1
   DB  197,253,114,208,16                  ; vpsrld        $0x10,%ymm0,%ymm0
@@ -37106,24 +36846,24 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,37                              ; ja            2729d <_sk_load_565_hsw_lowp+0x3f>
+  DB  119,37                              ; ja            26c71 <_sk_load_565_hsw_lowp+0x3f>
   DB  197,253,239,192                     ; vpxor         %ymm0,%ymm0,%ymm0
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,130,1,0,0                 ; lea           0x182(%rip),%r9        # 27408 <_sk_load_565_hsw_lowp+0x1aa>
+  DB  76,141,13,130,1,0,0                 ; lea           0x182(%rip),%r9        # 26ddc <_sk_load_565_hsw_lowp+0x1aa>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  197,249,110,192                     ; vmovd         %eax,%xmm0
-  DB  233,8,1,0,0                         ; jmpq          273a5 <_sk_load_565_hsw_lowp+0x147>
+  DB  233,8,1,0,0                         ; jmpq          26d79 <_sk_load_565_hsw_lowp+0x147>
   DB  196,193,126,111,4,80                ; vmovdqu       (%r8,%rdx,2),%ymm0
-  DB  233,253,0,0,0                       ; jmpq          273a5 <_sk_load_565_hsw_lowp+0x147>
+  DB  233,253,0,0,0                       ; jmpq          26d79 <_sk_load_565_hsw_lowp+0x147>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,193,121,196,76,80,4,2           ; vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm0,%xmm1
   DB  196,227,117,56,192,1                ; vinserti128   $0x1,%xmm0,%ymm1,%ymm0
   DB  196,193,121,110,12,80               ; vmovd         (%r8,%rdx,2),%xmm1
   DB  196,227,125,2,193,1                 ; vpblendd      $0x1,%ymm1,%ymm0,%ymm0
-  DB  233,218,0,0,0                       ; jmpq          273a5 <_sk_load_565_hsw_lowp+0x147>
+  DB  233,218,0,0,0                       ; jmpq          26d79 <_sk_load_565_hsw_lowp+0x147>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,193,121,196,76,80,12,6          ; vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm0,%xmm1
   DB  196,227,117,56,192,1                ; vinserti128   $0x1,%xmm0,%ymm1,%ymm0
@@ -37133,7 +36873,7 @@
   DB  196,227,125,2,193,15                ; vpblendd      $0xf,%ymm1,%ymm0,%ymm0
   DB  196,193,122,126,12,80               ; vmovq         (%r8,%rdx,2),%xmm1
   DB  196,227,125,2,193,3                 ; vpblendd      $0x3,%ymm1,%ymm0,%ymm0
-  DB  233,155,0,0,0                       ; jmpq          273a5 <_sk_load_565_hsw_lowp+0x147>
+  DB  233,155,0,0,0                       ; jmpq          26d79 <_sk_load_565_hsw_lowp+0x147>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,193,121,196,76,80,20,2          ; vpinsrw       $0x2,0x14(%r8,%rdx,2),%xmm0,%xmm1
   DB  196,227,125,56,193,1                ; vinserti128   $0x1,%xmm1,%ymm0,%ymm0
@@ -37145,7 +36885,7 @@
   DB  196,227,125,56,193,1                ; vinserti128   $0x1,%xmm1,%ymm0,%ymm0
   DB  196,193,122,111,12,80               ; vmovdqu       (%r8,%rdx,2),%xmm1
   DB  196,227,117,2,192,240               ; vpblendd      $0xf0,%ymm0,%ymm1,%ymm0
-  DB  235,83                              ; jmp           273a5 <_sk_load_565_hsw_lowp+0x147>
+  DB  235,83                              ; jmp           26d79 <_sk_load_565_hsw_lowp+0x147>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,193,121,196,76,80,28,6          ; vpinsrw       $0x6,0x1c(%r8,%rdx,2),%xmm0,%xmm1
   DB  196,227,125,56,193,1                ; vinserti128   $0x1,%xmm1,%ymm0,%ymm0
@@ -37159,13 +36899,13 @@
   DB  196,193,122,111,20,80               ; vmovdqu       (%r8,%rdx,2),%xmm2
   DB  196,227,109,56,201,1                ; vinserti128   $0x1,%xmm1,%ymm2,%ymm1
   DB  196,227,117,2,192,192               ; vpblendd      $0xc0,%ymm0,%ymm1,%ymm0
-  DB  196,226,125,121,13,18,201,0,0       ; vpbroadcastw  0xc912(%rip),%ymm1        # 33cc0 <_sk_srcover_bgra_8888_sse2_lowp+0xaa4>
+  DB  196,226,125,121,13,30,201,0,0       ; vpbroadcastw  0xc91e(%rip),%ymm1        # 336a0 <_sk_srcover_bgra_8888_sse2_lowp+0xab0>
   DB  197,237,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm2
   DB  197,237,219,201                     ; vpand         %ymm1,%ymm2,%ymm1
   DB  197,237,113,208,5                   ; vpsrlw        $0x5,%ymm0,%ymm2
-  DB  196,226,125,121,29,253,200,0,0      ; vpbroadcastw  0xc8fd(%rip),%ymm3        # 33cc2 <_sk_srcover_bgra_8888_sse2_lowp+0xaa6>
+  DB  196,226,125,121,29,9,201,0,0        ; vpbroadcastw  0xc909(%rip),%ymm3        # 336a2 <_sk_srcover_bgra_8888_sse2_lowp+0xab2>
   DB  197,237,219,211                     ; vpand         %ymm3,%ymm2,%ymm2
-  DB  196,226,125,121,29,242,200,0,0      ; vpbroadcastw  0xc8f2(%rip),%ymm3        # 33cc4 <_sk_srcover_bgra_8888_sse2_lowp+0xaa8>
+  DB  196,226,125,121,29,254,200,0,0      ; vpbroadcastw  0xc8fe(%rip),%ymm3        # 336a4 <_sk_srcover_bgra_8888_sse2_lowp+0xab4>
   DB  197,253,219,219                     ; vpand         %ymm3,%ymm0,%ymm3
   DB  197,253,113,208,13                  ; vpsrlw        $0xd,%ymm0,%ymm0
   DB  197,245,235,192                     ; vpor          %ymm0,%ymm1,%ymm0
@@ -37176,7 +36916,7 @@
   DB  197,229,113,211,2                   ; vpsrlw        $0x2,%ymm3,%ymm3
   DB  197,237,235,211                     ; vpor          %ymm3,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,121,29,192,200,0,0      ; vpbroadcastw  0xc8c0(%rip),%ymm3        # 33cc6 <_sk_srcover_bgra_8888_sse2_lowp+0xaaa>
+  DB  196,226,125,121,29,204,200,0,0      ; vpbroadcastw  0xc8cc(%rip),%ymm3        # 336a6 <_sk_srcover_bgra_8888_sse2_lowp+0xab6>
   DB  255,224                             ; jmpq          *%rax
   DB  135,254                             ; xchg          %edi,%esi
   DB  255                                 ; (bad)
@@ -37224,24 +36964,24 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,37                              ; ja            27483 <_sk_load_565_dst_hsw_lowp+0x3f>
+  DB  119,37                              ; ja            26e57 <_sk_load_565_dst_hsw_lowp+0x3f>
   DB  197,221,239,228                     ; vpxor         %ymm4,%ymm4,%ymm4
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,132,1,0,0                 ; lea           0x184(%rip),%r9        # 275f0 <_sk_load_565_dst_hsw_lowp+0x1ac>
+  DB  76,141,13,132,1,0,0                 ; lea           0x184(%rip),%r9        # 26fc4 <_sk_load_565_dst_hsw_lowp+0x1ac>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  197,249,110,224                     ; vmovd         %eax,%xmm4
-  DB  233,8,1,0,0                         ; jmpq          2758b <_sk_load_565_dst_hsw_lowp+0x147>
+  DB  233,8,1,0,0                         ; jmpq          26f5f <_sk_load_565_dst_hsw_lowp+0x147>
   DB  196,193,126,111,36,80               ; vmovdqu       (%r8,%rdx,2),%ymm4
-  DB  233,253,0,0,0                       ; jmpq          2758b <_sk_load_565_dst_hsw_lowp+0x147>
+  DB  233,253,0,0,0                       ; jmpq          26f5f <_sk_load_565_dst_hsw_lowp+0x147>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,193,89,196,108,80,4,2           ; vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm4,%xmm5
   DB  196,227,85,56,228,1                 ; vinserti128   $0x1,%xmm4,%ymm5,%ymm4
   DB  196,193,121,110,44,80               ; vmovd         (%r8,%rdx,2),%xmm5
   DB  196,227,93,2,229,1                  ; vpblendd      $0x1,%ymm5,%ymm4,%ymm4
-  DB  233,218,0,0,0                       ; jmpq          2758b <_sk_load_565_dst_hsw_lowp+0x147>
+  DB  233,218,0,0,0                       ; jmpq          26f5f <_sk_load_565_dst_hsw_lowp+0x147>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,193,89,196,108,80,12,6          ; vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm4,%xmm5
   DB  196,227,85,56,228,1                 ; vinserti128   $0x1,%xmm4,%ymm5,%ymm4
@@ -37251,7 +36991,7 @@
   DB  196,227,93,2,229,15                 ; vpblendd      $0xf,%ymm5,%ymm4,%ymm4
   DB  196,193,122,126,44,80               ; vmovq         (%r8,%rdx,2),%xmm5
   DB  196,227,93,2,229,3                  ; vpblendd      $0x3,%ymm5,%ymm4,%ymm4
-  DB  233,155,0,0,0                       ; jmpq          2758b <_sk_load_565_dst_hsw_lowp+0x147>
+  DB  233,155,0,0,0                       ; jmpq          26f5f <_sk_load_565_dst_hsw_lowp+0x147>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,193,89,196,108,80,20,2          ; vpinsrw       $0x2,0x14(%r8,%rdx,2),%xmm4,%xmm5
   DB  196,227,93,56,229,1                 ; vinserti128   $0x1,%xmm5,%ymm4,%ymm4
@@ -37263,7 +37003,7 @@
   DB  196,227,93,56,229,1                 ; vinserti128   $0x1,%xmm5,%ymm4,%ymm4
   DB  196,193,122,111,44,80               ; vmovdqu       (%r8,%rdx,2),%xmm5
   DB  196,227,85,2,228,240                ; vpblendd      $0xf0,%ymm4,%ymm5,%ymm4
-  DB  235,83                              ; jmp           2758b <_sk_load_565_dst_hsw_lowp+0x147>
+  DB  235,83                              ; jmp           26f5f <_sk_load_565_dst_hsw_lowp+0x147>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,193,89,196,108,80,28,6          ; vpinsrw       $0x6,0x1c(%r8,%rdx,2),%xmm4,%xmm5
   DB  196,227,93,56,229,1                 ; vinserti128   $0x1,%xmm5,%ymm4,%ymm4
@@ -37277,13 +37017,13 @@
   DB  196,193,122,111,52,80               ; vmovdqu       (%r8,%rdx,2),%xmm6
   DB  196,227,77,56,237,1                 ; vinserti128   $0x1,%xmm5,%ymm6,%ymm5
   DB  196,227,85,2,228,192                ; vpblendd      $0xc0,%ymm4,%ymm5,%ymm4
-  DB  196,226,125,121,45,52,199,0,0       ; vpbroadcastw  0xc734(%rip),%ymm5        # 33cc8 <_sk_srcover_bgra_8888_sse2_lowp+0xaac>
+  DB  196,226,125,121,45,64,199,0,0       ; vpbroadcastw  0xc740(%rip),%ymm5        # 336a8 <_sk_srcover_bgra_8888_sse2_lowp+0xab8>
   DB  197,205,113,212,8                   ; vpsrlw        $0x8,%ymm4,%ymm6
   DB  197,205,219,237                     ; vpand         %ymm5,%ymm6,%ymm5
   DB  197,205,113,212,5                   ; vpsrlw        $0x5,%ymm4,%ymm6
-  DB  196,226,125,121,61,31,199,0,0       ; vpbroadcastw  0xc71f(%rip),%ymm7        # 33cca <_sk_srcover_bgra_8888_sse2_lowp+0xaae>
+  DB  196,226,125,121,61,43,199,0,0       ; vpbroadcastw  0xc72b(%rip),%ymm7        # 336aa <_sk_srcover_bgra_8888_sse2_lowp+0xaba>
   DB  197,205,219,247                     ; vpand         %ymm7,%ymm6,%ymm6
-  DB  196,226,125,121,61,20,199,0,0       ; vpbroadcastw  0xc714(%rip),%ymm7        # 33ccc <_sk_srcover_bgra_8888_sse2_lowp+0xab0>
+  DB  196,226,125,121,61,32,199,0,0       ; vpbroadcastw  0xc720(%rip),%ymm7        # 336ac <_sk_srcover_bgra_8888_sse2_lowp+0xabc>
   DB  197,221,219,255                     ; vpand         %ymm7,%ymm4,%ymm7
   DB  197,221,113,212,13                  ; vpsrlw        $0xd,%ymm4,%ymm4
   DB  197,213,235,228                     ; vpor          %ymm4,%ymm5,%ymm4
@@ -37294,7 +37034,7 @@
   DB  197,197,113,215,2                   ; vpsrlw        $0x2,%ymm7,%ymm7
   DB  197,205,235,247                     ; vpor          %ymm7,%ymm6,%ymm6
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,121,61,226,198,0,0      ; vpbroadcastw  0xc6e2(%rip),%ymm7        # 33cce <_sk_srcover_bgra_8888_sse2_lowp+0xab2>
+  DB  196,226,125,121,61,238,198,0,0      ; vpbroadcastw  0xc6ee(%rip),%ymm7        # 336ae <_sk_srcover_bgra_8888_sse2_lowp+0xabe>
   DB  255,224                             ; jmpq          *%rax
   DB  102,144                             ; xchg          %ax,%ax
   DB  133,254                             ; test          %edi,%esi
@@ -37343,10 +37083,10 @@
   DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  196,98,125,121,5,139,198,0,0        ; vpbroadcastw  0xc68b(%rip),%ymm8        # 33cd0 <_sk_srcover_bgra_8888_sse2_lowp+0xab4>
+  DB  196,98,125,121,5,151,198,0,0        ; vpbroadcastw  0xc697(%rip),%ymm8        # 336b0 <_sk_srcover_bgra_8888_sse2_lowp+0xac0>
   DB  197,181,113,240,8                   ; vpsllw        $0x8,%ymm0,%ymm9
   DB  196,65,53,219,192                   ; vpand         %ymm8,%ymm9,%ymm8
-  DB  196,98,125,121,13,122,198,0,0       ; vpbroadcastw  0xc67a(%rip),%ymm9        # 33cd2 <_sk_srcover_bgra_8888_sse2_lowp+0xab6>
+  DB  196,98,125,121,13,134,198,0,0       ; vpbroadcastw  0xc686(%rip),%ymm9        # 336b2 <_sk_srcover_bgra_8888_sse2_lowp+0xac2>
   DB  197,173,113,241,3                   ; vpsllw        $0x3,%ymm1,%ymm10
   DB  196,65,45,219,201                   ; vpand         %ymm9,%ymm10,%ymm9
   DB  196,65,53,235,192                   ; vpor          %ymm8,%ymm9,%ymm8
@@ -37356,31 +37096,31 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,31                              ; ja            2769a <_sk_store_565_hsw_lowp+0x6e>
+  DB  119,31                              ; ja            2706e <_sk_store_565_hsw_lowp+0x6e>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,195,0,0,0                 ; lea           0xc3(%rip),%r9        # 27748 <_sk_store_565_hsw_lowp+0x11c>
+  DB  76,141,13,195,0,0,0                 ; lea           0xc3(%rip),%r9        # 2711c <_sk_store_565_hsw_lowp+0x11c>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,67,121,21,4,80,0                ; vpextrw       $0x0,%xmm8,(%r8,%rdx,2)
-  DB  233,167,0,0,0                       ; jmpq          27741 <_sk_store_565_hsw_lowp+0x115>
+  DB  233,167,0,0,0                       ; jmpq          27115 <_sk_store_565_hsw_lowp+0x115>
   DB  196,65,126,127,4,80                 ; vmovdqu       %ymm8,(%r8,%rdx,2)
-  DB  233,156,0,0,0                       ; jmpq          27741 <_sk_store_565_hsw_lowp+0x115>
+  DB  233,156,0,0,0                       ; jmpq          27115 <_sk_store_565_hsw_lowp+0x115>
   DB  196,67,121,21,68,80,4,2             ; vpextrw       $0x2,%xmm8,0x4(%r8,%rdx,2)
   DB  196,65,121,126,4,80                 ; vmovd         %xmm8,(%r8,%rdx,2)
-  DB  233,137,0,0,0                       ; jmpq          27741 <_sk_store_565_hsw_lowp+0x115>
+  DB  233,137,0,0,0                       ; jmpq          27115 <_sk_store_565_hsw_lowp+0x115>
   DB  196,67,121,21,68,80,12,6            ; vpextrw       $0x6,%xmm8,0xc(%r8,%rdx,2)
   DB  196,67,121,21,68,80,10,5            ; vpextrw       $0x5,%xmm8,0xa(%r8,%rdx,2)
   DB  196,67,121,21,68,80,8,4             ; vpextrw       $0x4,%xmm8,0x8(%r8,%rdx,2)
   DB  196,65,121,214,4,80                 ; vmovq         %xmm8,(%r8,%rdx,2)
-  DB  235,105                             ; jmp           27741 <_sk_store_565_hsw_lowp+0x115>
+  DB  235,105                             ; jmp           27115 <_sk_store_565_hsw_lowp+0x115>
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,67,121,21,76,80,20,2            ; vpextrw       $0x2,%xmm9,0x14(%r8,%rdx,2)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,67,121,21,76,80,18,1            ; vpextrw       $0x1,%xmm9,0x12(%r8,%rdx,2)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,67,121,21,76,80,16,0            ; vpextrw       $0x0,%xmm9,0x10(%r8,%rdx,2)
-  DB  235,55                              ; jmp           2773b <_sk_store_565_hsw_lowp+0x10f>
+  DB  235,55                              ; jmp           2710f <_sk_store_565_hsw_lowp+0x10f>
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,67,121,21,76,80,28,6            ; vpextrw       $0x6,%xmm9,0x1c(%r8,%rdx,2)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
@@ -37403,7 +37143,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  120,255                             ; js            2775d <_sk_store_565_hsw_lowp+0x131>
+  DB  120,255                             ; js            27131 <_sk_store_565_hsw_lowp+0x131>
   DB  255                                 ; (bad)
   DB  255,112,255                         ; pushq         -0x1(%rax)
   DB  255                                 ; (bad)
@@ -37513,13 +37253,13 @@
   DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
   DB  197,249,196,192,7                   ; vpinsrw       $0x7,%eax,%xmm0,%xmm0
   DB  196,227,125,56,193,1                ; vinserti128   $0x1,%xmm1,%ymm0,%ymm0
-  DB  196,226,125,121,13,190,195,0,0      ; vpbroadcastw  0xc3be(%rip),%ymm1        # 33cd4 <_sk_srcover_bgra_8888_sse2_lowp+0xab8>
+  DB  196,226,125,121,13,202,195,0,0      ; vpbroadcastw  0xc3ca(%rip),%ymm1        # 336b4 <_sk_srcover_bgra_8888_sse2_lowp+0xac4>
   DB  197,237,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm2
   DB  197,237,219,201                     ; vpand         %ymm1,%ymm2,%ymm1
   DB  197,237,113,208,5                   ; vpsrlw        $0x5,%ymm0,%ymm2
-  DB  196,226,125,121,29,169,195,0,0      ; vpbroadcastw  0xc3a9(%rip),%ymm3        # 33cd6 <_sk_srcover_bgra_8888_sse2_lowp+0xaba>
+  DB  196,226,125,121,29,181,195,0,0      ; vpbroadcastw  0xc3b5(%rip),%ymm3        # 336b6 <_sk_srcover_bgra_8888_sse2_lowp+0xac6>
   DB  197,237,219,211                     ; vpand         %ymm3,%ymm2,%ymm2
-  DB  196,226,125,121,29,158,195,0,0      ; vpbroadcastw  0xc39e(%rip),%ymm3        # 33cd8 <_sk_srcover_bgra_8888_sse2_lowp+0xabc>
+  DB  196,226,125,121,29,170,195,0,0      ; vpbroadcastw  0xc3aa(%rip),%ymm3        # 336b8 <_sk_srcover_bgra_8888_sse2_lowp+0xac8>
   DB  197,253,219,219                     ; vpand         %ymm3,%ymm0,%ymm3
   DB  197,253,113,208,13                  ; vpsrlw        $0xd,%ymm0,%ymm0
   DB  197,245,235,192                     ; vpor          %ymm0,%ymm1,%ymm0
@@ -37530,7 +37270,7 @@
   DB  197,229,113,211,2                   ; vpsrlw        $0x2,%ymm3,%ymm3
   DB  197,237,235,211                     ; vpor          %ymm3,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,121,29,108,195,0,0      ; vpbroadcastw  0xc36c(%rip),%ymm3        # 33cda <_sk_srcover_bgra_8888_sse2_lowp+0xabe>
+  DB  196,226,125,121,29,120,195,0,0      ; vpbroadcastw  0xc378(%rip),%ymm3        # 336ba <_sk_srcover_bgra_8888_sse2_lowp+0xaca>
   DB  255,224                             ; jmpq          *%rax
 
 PUBLIC _sk_load_4444_hsw_lowp
@@ -37544,24 +37284,24 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,37                              ; ja            279af <_sk_load_4444_hsw_lowp+0x3f>
+  DB  119,37                              ; ja            27383 <_sk_load_4444_hsw_lowp+0x3f>
   DB  197,253,239,192                     ; vpxor         %ymm0,%ymm0,%ymm0
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,112,1,0,0                 ; lea           0x170(%rip),%r9        # 27b08 <_sk_load_4444_hsw_lowp+0x198>
+  DB  76,141,13,112,1,0,0                 ; lea           0x170(%rip),%r9        # 274dc <_sk_load_4444_hsw_lowp+0x198>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  197,249,110,192                     ; vmovd         %eax,%xmm0
-  DB  233,8,1,0,0                         ; jmpq          27ab7 <_sk_load_4444_hsw_lowp+0x147>
+  DB  233,8,1,0,0                         ; jmpq          2748b <_sk_load_4444_hsw_lowp+0x147>
   DB  196,193,126,111,4,80                ; vmovdqu       (%r8,%rdx,2),%ymm0
-  DB  233,253,0,0,0                       ; jmpq          27ab7 <_sk_load_4444_hsw_lowp+0x147>
+  DB  233,253,0,0,0                       ; jmpq          2748b <_sk_load_4444_hsw_lowp+0x147>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,193,121,196,76,80,4,2           ; vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm0,%xmm1
   DB  196,227,117,56,192,1                ; vinserti128   $0x1,%xmm0,%ymm1,%ymm0
   DB  196,193,121,110,12,80               ; vmovd         (%r8,%rdx,2),%xmm1
   DB  196,227,125,2,193,1                 ; vpblendd      $0x1,%ymm1,%ymm0,%ymm0
-  DB  233,218,0,0,0                       ; jmpq          27ab7 <_sk_load_4444_hsw_lowp+0x147>
+  DB  233,218,0,0,0                       ; jmpq          2748b <_sk_load_4444_hsw_lowp+0x147>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,193,121,196,76,80,12,6          ; vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm0,%xmm1
   DB  196,227,117,56,192,1                ; vinserti128   $0x1,%xmm0,%ymm1,%ymm0
@@ -37571,7 +37311,7 @@
   DB  196,227,125,2,193,15                ; vpblendd      $0xf,%ymm1,%ymm0,%ymm0
   DB  196,193,122,126,12,80               ; vmovq         (%r8,%rdx,2),%xmm1
   DB  196,227,125,2,193,3                 ; vpblendd      $0x3,%ymm1,%ymm0,%ymm0
-  DB  233,155,0,0,0                       ; jmpq          27ab7 <_sk_load_4444_hsw_lowp+0x147>
+  DB  233,155,0,0,0                       ; jmpq          2748b <_sk_load_4444_hsw_lowp+0x147>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,193,121,196,76,80,20,2          ; vpinsrw       $0x2,0x14(%r8,%rdx,2),%xmm0,%xmm1
   DB  196,227,125,56,193,1                ; vinserti128   $0x1,%xmm1,%ymm0,%ymm0
@@ -37583,7 +37323,7 @@
   DB  196,227,125,56,193,1                ; vinserti128   $0x1,%xmm1,%ymm0,%ymm0
   DB  196,193,122,111,12,80               ; vmovdqu       (%r8,%rdx,2),%xmm1
   DB  196,227,117,2,192,240               ; vpblendd      $0xf0,%ymm0,%ymm1,%ymm0
-  DB  235,83                              ; jmp           27ab7 <_sk_load_4444_hsw_lowp+0x147>
+  DB  235,83                              ; jmp           2748b <_sk_load_4444_hsw_lowp+0x147>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,193,121,196,76,80,28,6          ; vpinsrw       $0x6,0x1c(%r8,%rdx,2),%xmm0,%xmm1
   DB  196,227,125,56,193,1                ; vinserti128   $0x1,%xmm1,%ymm0,%ymm0
@@ -37599,7 +37339,7 @@
   DB  196,227,117,2,192,192               ; vpblendd      $0xc0,%ymm0,%ymm1,%ymm0
   DB  197,245,113,208,12                  ; vpsrlw        $0xc,%ymm0,%ymm1
   DB  197,237,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm2
-  DB  196,226,125,121,29,18,194,0,0       ; vpbroadcastw  0xc212(%rip),%ymm3        # 33cdc <_sk_srcover_bgra_8888_sse2_lowp+0xac0>
+  DB  196,226,125,121,29,30,194,0,0       ; vpbroadcastw  0xc21e(%rip),%ymm3        # 336bc <_sk_srcover_bgra_8888_sse2_lowp+0xacc>
   DB  197,237,219,211                     ; vpand         %ymm3,%ymm2,%ymm2
   DB  197,189,113,208,4                   ; vpsrlw        $0x4,%ymm0,%ymm8
   DB  197,61,219,195                      ; vpand         %ymm3,%ymm8,%ymm8
@@ -37662,24 +37402,24 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,37                              ; ja            27b83 <_sk_load_4444_dst_hsw_lowp+0x3f>
+  DB  119,37                              ; ja            27557 <_sk_load_4444_dst_hsw_lowp+0x3f>
   DB  197,221,239,228                     ; vpxor         %ymm4,%ymm4,%ymm4
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,112,1,0,0                 ; lea           0x170(%rip),%r9        # 27cdc <_sk_load_4444_dst_hsw_lowp+0x198>
+  DB  76,141,13,112,1,0,0                 ; lea           0x170(%rip),%r9        # 276b0 <_sk_load_4444_dst_hsw_lowp+0x198>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  197,249,110,224                     ; vmovd         %eax,%xmm4
-  DB  233,8,1,0,0                         ; jmpq          27c8b <_sk_load_4444_dst_hsw_lowp+0x147>
+  DB  233,8,1,0,0                         ; jmpq          2765f <_sk_load_4444_dst_hsw_lowp+0x147>
   DB  196,193,126,111,36,80               ; vmovdqu       (%r8,%rdx,2),%ymm4
-  DB  233,253,0,0,0                       ; jmpq          27c8b <_sk_load_4444_dst_hsw_lowp+0x147>
+  DB  233,253,0,0,0                       ; jmpq          2765f <_sk_load_4444_dst_hsw_lowp+0x147>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,193,89,196,108,80,4,2           ; vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm4,%xmm5
   DB  196,227,85,56,228,1                 ; vinserti128   $0x1,%xmm4,%ymm5,%ymm4
   DB  196,193,121,110,44,80               ; vmovd         (%r8,%rdx,2),%xmm5
   DB  196,227,93,2,229,1                  ; vpblendd      $0x1,%ymm5,%ymm4,%ymm4
-  DB  233,218,0,0,0                       ; jmpq          27c8b <_sk_load_4444_dst_hsw_lowp+0x147>
+  DB  233,218,0,0,0                       ; jmpq          2765f <_sk_load_4444_dst_hsw_lowp+0x147>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,193,89,196,108,80,12,6          ; vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm4,%xmm5
   DB  196,227,85,56,228,1                 ; vinserti128   $0x1,%xmm4,%ymm5,%ymm4
@@ -37689,7 +37429,7 @@
   DB  196,227,93,2,229,15                 ; vpblendd      $0xf,%ymm5,%ymm4,%ymm4
   DB  196,193,122,126,44,80               ; vmovq         (%r8,%rdx,2),%xmm5
   DB  196,227,93,2,229,3                  ; vpblendd      $0x3,%ymm5,%ymm4,%ymm4
-  DB  233,155,0,0,0                       ; jmpq          27c8b <_sk_load_4444_dst_hsw_lowp+0x147>
+  DB  233,155,0,0,0                       ; jmpq          2765f <_sk_load_4444_dst_hsw_lowp+0x147>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,193,89,196,108,80,20,2          ; vpinsrw       $0x2,0x14(%r8,%rdx,2),%xmm4,%xmm5
   DB  196,227,93,56,229,1                 ; vinserti128   $0x1,%xmm5,%ymm4,%ymm4
@@ -37701,7 +37441,7 @@
   DB  196,227,93,56,229,1                 ; vinserti128   $0x1,%xmm5,%ymm4,%ymm4
   DB  196,193,122,111,44,80               ; vmovdqu       (%r8,%rdx,2),%xmm5
   DB  196,227,85,2,228,240                ; vpblendd      $0xf0,%ymm4,%ymm5,%ymm4
-  DB  235,83                              ; jmp           27c8b <_sk_load_4444_dst_hsw_lowp+0x147>
+  DB  235,83                              ; jmp           2765f <_sk_load_4444_dst_hsw_lowp+0x147>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,193,89,196,108,80,28,6          ; vpinsrw       $0x6,0x1c(%r8,%rdx,2),%xmm4,%xmm5
   DB  196,227,93,56,229,1                 ; vinserti128   $0x1,%xmm5,%ymm4,%ymm4
@@ -37717,7 +37457,7 @@
   DB  196,227,85,2,228,192                ; vpblendd      $0xc0,%ymm4,%ymm5,%ymm4
   DB  197,213,113,212,12                  ; vpsrlw        $0xc,%ymm4,%ymm5
   DB  197,205,113,212,8                   ; vpsrlw        $0x8,%ymm4,%ymm6
-  DB  196,226,125,121,61,64,192,0,0       ; vpbroadcastw  0xc040(%rip),%ymm7        # 33cde <_sk_srcover_bgra_8888_sse2_lowp+0xac2>
+  DB  196,226,125,121,61,76,192,0,0       ; vpbroadcastw  0xc04c(%rip),%ymm7        # 336be <_sk_srcover_bgra_8888_sse2_lowp+0xace>
   DB  197,205,219,247                     ; vpand         %ymm7,%ymm6,%ymm6
   DB  197,189,113,212,4                   ; vpsrlw        $0x4,%ymm4,%ymm8
   DB  197,61,219,199                      ; vpand         %ymm7,%ymm8,%ymm8
@@ -37776,13 +37516,13 @@
   DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  196,98,125,121,5,175,191,0,0        ; vpbroadcastw  0xbfaf(%rip),%ymm8        # 33ce0 <_sk_srcover_bgra_8888_sse2_lowp+0xac4>
+  DB  196,98,125,121,5,187,191,0,0        ; vpbroadcastw  0xbfbb(%rip),%ymm8        # 336c0 <_sk_srcover_bgra_8888_sse2_lowp+0xad0>
   DB  197,181,113,240,8                   ; vpsllw        $0x8,%ymm0,%ymm9
   DB  196,65,53,219,192                   ; vpand         %ymm8,%ymm9,%ymm8
   DB  197,181,113,241,4                   ; vpsllw        $0x4,%ymm1,%ymm9
-  DB  197,53,219,13,184,191,0,0           ; vpand         0xbfb8(%rip),%ymm9,%ymm9        # 33d00 <_sk_srcover_bgra_8888_sse2_lowp+0xae4>
+  DB  197,53,219,13,196,191,0,0           ; vpand         0xbfc4(%rip),%ymm9,%ymm9        # 336e0 <_sk_srcover_bgra_8888_sse2_lowp+0xaf0>
   DB  196,65,53,235,192                   ; vpor          %ymm8,%ymm9,%ymm8
-  DB  196,98,125,121,13,202,191,0,0       ; vpbroadcastw  0xbfca(%rip),%ymm9        # 33d20 <_sk_srcover_bgra_8888_sse2_lowp+0xb04>
+  DB  196,98,125,121,13,214,191,0,0       ; vpbroadcastw  0xbfd6(%rip),%ymm9        # 33700 <_sk_srcover_bgra_8888_sse2_lowp+0xb10>
   DB  196,65,109,219,201                  ; vpand         %ymm9,%ymm2,%ymm9
   DB  197,173,113,211,4                   ; vpsrlw        $0x4,%ymm3,%ymm10
   DB  196,65,53,235,202                   ; vpor          %ymm10,%ymm9,%ymm9
@@ -37791,31 +37531,31 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,31                              ; ja            27d93 <_sk_store_4444_hsw_lowp+0x7b>
+  DB  119,31                              ; ja            27767 <_sk_store_4444_hsw_lowp+0x7b>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,194,0,0,0                 ; lea           0xc2(%rip),%r9        # 27e40 <_sk_store_4444_hsw_lowp+0x128>
+  DB  76,141,13,194,0,0,0                 ; lea           0xc2(%rip),%r9        # 27814 <_sk_store_4444_hsw_lowp+0x128>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,67,121,21,4,80,0                ; vpextrw       $0x0,%xmm8,(%r8,%rdx,2)
-  DB  233,167,0,0,0                       ; jmpq          27e3a <_sk_store_4444_hsw_lowp+0x122>
+  DB  233,167,0,0,0                       ; jmpq          2780e <_sk_store_4444_hsw_lowp+0x122>
   DB  196,65,126,127,4,80                 ; vmovdqu       %ymm8,(%r8,%rdx,2)
-  DB  233,156,0,0,0                       ; jmpq          27e3a <_sk_store_4444_hsw_lowp+0x122>
+  DB  233,156,0,0,0                       ; jmpq          2780e <_sk_store_4444_hsw_lowp+0x122>
   DB  196,67,121,21,68,80,4,2             ; vpextrw       $0x2,%xmm8,0x4(%r8,%rdx,2)
   DB  196,65,121,126,4,80                 ; vmovd         %xmm8,(%r8,%rdx,2)
-  DB  233,137,0,0,0                       ; jmpq          27e3a <_sk_store_4444_hsw_lowp+0x122>
+  DB  233,137,0,0,0                       ; jmpq          2780e <_sk_store_4444_hsw_lowp+0x122>
   DB  196,67,121,21,68,80,12,6            ; vpextrw       $0x6,%xmm8,0xc(%r8,%rdx,2)
   DB  196,67,121,21,68,80,10,5            ; vpextrw       $0x5,%xmm8,0xa(%r8,%rdx,2)
   DB  196,67,121,21,68,80,8,4             ; vpextrw       $0x4,%xmm8,0x8(%r8,%rdx,2)
   DB  196,65,121,214,4,80                 ; vmovq         %xmm8,(%r8,%rdx,2)
-  DB  235,105                             ; jmp           27e3a <_sk_store_4444_hsw_lowp+0x122>
+  DB  235,105                             ; jmp           2780e <_sk_store_4444_hsw_lowp+0x122>
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,67,121,21,76,80,20,2            ; vpextrw       $0x2,%xmm9,0x14(%r8,%rdx,2)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,67,121,21,76,80,18,1            ; vpextrw       $0x1,%xmm9,0x12(%r8,%rdx,2)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,67,121,21,76,80,16,0            ; vpextrw       $0x0,%xmm9,0x10(%r8,%rdx,2)
-  DB  235,55                              ; jmp           27e34 <_sk_store_4444_hsw_lowp+0x11c>
+  DB  235,55                              ; jmp           27808 <_sk_store_4444_hsw_lowp+0x11c>
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,67,121,21,76,80,28,6            ; vpextrw       $0x6,%xmm9,0x1c(%r8,%rdx,2)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
@@ -37838,7 +37578,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  121,255                             ; jns           27e55 <_sk_store_4444_hsw_lowp+0x13d>
+  DB  121,255                             ; jns           27829 <_sk_store_4444_hsw_lowp+0x13d>
   DB  255                                 ; (bad)
   DB  255,113,255                         ; pushq         -0x1(%rcx)
   DB  255                                 ; (bad)
@@ -37951,7 +37691,7 @@
   DB  196,227,125,56,193,1                ; vinserti128   $0x1,%xmm1,%ymm0,%ymm0
   DB  197,245,113,208,12                  ; vpsrlw        $0xc,%ymm0,%ymm1
   DB  197,237,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm2
-  DB  196,226,125,121,29,10,189,0,0       ; vpbroadcastw  0xbd0a(%rip),%ymm3        # 33d22 <_sk_srcover_bgra_8888_sse2_lowp+0xb06>
+  DB  196,226,125,121,29,22,189,0,0       ; vpbroadcastw  0xbd16(%rip),%ymm3        # 33702 <_sk_srcover_bgra_8888_sse2_lowp+0xb12>
   DB  197,237,219,211                     ; vpand         %ymm3,%ymm2,%ymm2
   DB  197,189,113,208,4                   ; vpsrlw        $0x4,%ymm0,%ymm8
   DB  197,61,219,195                      ; vpand         %ymm3,%ymm8,%ymm8
@@ -37977,38 +37717,38 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,37                              ; ja            2808f <_sk_load_a8_hsw_lowp+0x3c>
+  DB  119,37                              ; ja            27a63 <_sk_load_a8_hsw_lowp+0x3c>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,220,0,0,0                 ; lea           0xdc(%rip),%r9        # 28154 <_sk_load_a8_hsw_lowp+0x101>
+  DB  76,141,13,220,0,0,0                 ; lea           0xdc(%rip),%r9        # 27b28 <_sk_load_a8_hsw_lowp+0x101>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  197,249,110,192                     ; vmovd         %eax,%xmm0
-  DB  233,175,0,0,0                       ; jmpq          2813e <_sk_load_a8_hsw_lowp+0xeb>
+  DB  233,175,0,0,0                       ; jmpq          27b12 <_sk_load_a8_hsw_lowp+0xeb>
   DB  196,193,122,111,4,16                ; vmovdqu       (%r8,%rdx,1),%xmm0
-  DB  233,164,0,0,0                       ; jmpq          2813e <_sk_load_a8_hsw_lowp+0xeb>
+  DB  233,164,0,0,0                       ; jmpq          27b12 <_sk_load_a8_hsw_lowp+0xeb>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,195,121,32,68,16,2,2            ; vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm0,%xmm0
   DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  197,249,110,200                     ; vmovd         %eax,%xmm1
   DB  196,227,121,14,193,1                ; vpblendw      $0x1,%xmm1,%xmm0,%xmm0
-  DB  233,132,0,0,0                       ; jmpq          2813e <_sk_load_a8_hsw_lowp+0xeb>
+  DB  233,132,0,0,0                       ; jmpq          27b12 <_sk_load_a8_hsw_lowp+0xeb>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,195,121,32,68,16,6,6            ; vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,195,121,32,68,16,5,5            ; vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,195,121,32,68,16,4,4            ; vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,193,121,110,12,16               ; vmovd         (%r8,%rdx,1),%xmm1
   DB  196,227,121,2,193,1                 ; vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  DB  235,90                              ; jmp           2813e <_sk_load_a8_hsw_lowp+0xeb>
+  DB  235,90                              ; jmp           27b12 <_sk_load_a8_hsw_lowp+0xeb>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,195,121,32,68,16,10,10          ; vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,195,121,32,68,16,9,9            ; vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,195,121,32,68,16,8,8            ; vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,193,122,126,12,16               ; vmovq         (%r8,%rdx,1),%xmm1
   DB  196,227,113,2,192,12                ; vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  DB  235,48                              ; jmp           2813e <_sk_load_a8_hsw_lowp+0xeb>
+  DB  235,48                              ; jmp           27b12 <_sk_load_a8_hsw_lowp+0xeb>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,195,121,32,68,16,14,14          ; vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,195,121,32,68,16,13,13          ; vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm0,%xmm0
@@ -38064,38 +37804,38 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,37                              ; ja            281cc <_sk_load_a8_dst_hsw_lowp+0x3c>
+  DB  119,37                              ; ja            27ba0 <_sk_load_a8_dst_hsw_lowp+0x3c>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,219,0,0,0                 ; lea           0xdb(%rip),%r9        # 28290 <_sk_load_a8_dst_hsw_lowp+0x100>
+  DB  76,141,13,219,0,0,0                 ; lea           0xdb(%rip),%r9        # 27c64 <_sk_load_a8_dst_hsw_lowp+0x100>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  197,249,110,224                     ; vmovd         %eax,%xmm4
-  DB  233,175,0,0,0                       ; jmpq          2827b <_sk_load_a8_dst_hsw_lowp+0xeb>
+  DB  233,175,0,0,0                       ; jmpq          27c4f <_sk_load_a8_dst_hsw_lowp+0xeb>
   DB  196,193,122,111,36,16               ; vmovdqu       (%r8,%rdx,1),%xmm4
-  DB  233,164,0,0,0                       ; jmpq          2827b <_sk_load_a8_dst_hsw_lowp+0xeb>
+  DB  233,164,0,0,0                       ; jmpq          27c4f <_sk_load_a8_dst_hsw_lowp+0xeb>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,195,89,32,100,16,2,2            ; vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm4,%xmm4
   DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  197,249,110,232                     ; vmovd         %eax,%xmm5
   DB  196,227,89,14,229,1                 ; vpblendw      $0x1,%xmm5,%xmm4,%xmm4
-  DB  233,132,0,0,0                       ; jmpq          2827b <_sk_load_a8_dst_hsw_lowp+0xeb>
+  DB  233,132,0,0,0                       ; jmpq          27c4f <_sk_load_a8_dst_hsw_lowp+0xeb>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,195,89,32,100,16,6,6            ; vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,195,89,32,100,16,5,5            ; vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,195,89,32,100,16,4,4            ; vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,193,121,110,44,16               ; vmovd         (%r8,%rdx,1),%xmm5
   DB  196,227,89,2,229,1                  ; vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  DB  235,90                              ; jmp           2827b <_sk_load_a8_dst_hsw_lowp+0xeb>
+  DB  235,90                              ; jmp           27c4f <_sk_load_a8_dst_hsw_lowp+0xeb>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,195,89,32,100,16,10,10          ; vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,195,89,32,100,16,9,9            ; vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,195,89,32,100,16,8,8            ; vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,193,122,126,44,16               ; vmovq         (%r8,%rdx,1),%xmm5
   DB  196,227,81,2,228,12                 ; vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  DB  235,48                              ; jmp           2827b <_sk_load_a8_dst_hsw_lowp+0xeb>
+  DB  235,48                              ; jmp           27c4f <_sk_load_a8_dst_hsw_lowp+0xeb>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,195,89,32,100,16,14,14          ; vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,195,89,32,100,16,13,13          ; vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm4,%xmm4
@@ -38150,7 +37890,7 @@
   DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  196,195,125,57,216,1                ; vextracti128  $0x1,%ymm3,%xmm8
-  DB  197,121,111,13,121,194,0,0          ; vmovdqa       0xc279(%rip),%xmm9        # 34560 <_sk_srcover_bgra_8888_sse2_lowp+0x1344>
+  DB  197,121,111,13,133,194,0,0          ; vmovdqa       0xc285(%rip),%xmm9        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0x1350>
   DB  196,66,57,0,193                     ; vpshufb       %xmm9,%xmm8,%xmm8
   DB  196,66,97,0,201                     ; vpshufb       %xmm9,%xmm3,%xmm9
   DB  196,65,49,108,192                   ; vpunpcklqdq   %xmm8,%xmm9,%xmm8
@@ -38158,28 +37898,28 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,28                              ; ja            2831c <_sk_store_a8_hsw_lowp+0x50>
+  DB  119,28                              ; ja            27cf0 <_sk_store_a8_hsw_lowp+0x50>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,146,0,0,0                 ; lea           0x92(%rip),%r9        # 2839c <_sk_store_a8_hsw_lowp+0xd0>
+  DB  76,141,13,146,0,0,0                 ; lea           0x92(%rip),%r9        # 27d70 <_sk_store_a8_hsw_lowp+0xd0>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,67,121,20,4,16,0                ; vpextrb       $0x0,%xmm8,(%r8,%rdx,1)
-  DB  235,121                             ; jmp           28395 <_sk_store_a8_hsw_lowp+0xc9>
+  DB  235,121                             ; jmp           27d69 <_sk_store_a8_hsw_lowp+0xc9>
   DB  196,65,122,127,4,16                 ; vmovdqu       %xmm8,(%r8,%rdx,1)
-  DB  235,113                             ; jmp           28395 <_sk_store_a8_hsw_lowp+0xc9>
+  DB  235,113                             ; jmp           27d69 <_sk_store_a8_hsw_lowp+0xc9>
   DB  196,67,121,20,68,16,2,2             ; vpextrb       $0x2,%xmm8,0x2(%r8,%rdx,1)
   DB  196,67,121,21,4,16,0                ; vpextrw       $0x0,%xmm8,(%r8,%rdx,1)
-  DB  235,96                              ; jmp           28395 <_sk_store_a8_hsw_lowp+0xc9>
+  DB  235,96                              ; jmp           27d69 <_sk_store_a8_hsw_lowp+0xc9>
   DB  196,67,121,20,68,16,6,6             ; vpextrb       $0x6,%xmm8,0x6(%r8,%rdx,1)
   DB  196,67,121,20,68,16,5,5             ; vpextrb       $0x5,%xmm8,0x5(%r8,%rdx,1)
   DB  196,67,121,20,68,16,4,4             ; vpextrb       $0x4,%xmm8,0x4(%r8,%rdx,1)
   DB  196,65,121,126,4,16                 ; vmovd         %xmm8,(%r8,%rdx,1)
-  DB  235,64                              ; jmp           28395 <_sk_store_a8_hsw_lowp+0xc9>
+  DB  235,64                              ; jmp           27d69 <_sk_store_a8_hsw_lowp+0xc9>
   DB  196,67,121,20,68,16,10,10           ; vpextrb       $0xa,%xmm8,0xa(%r8,%rdx,1)
   DB  196,67,121,20,68,16,9,9             ; vpextrb       $0x9,%xmm8,0x9(%r8,%rdx,1)
   DB  196,67,121,20,68,16,8,8             ; vpextrb       $0x8,%xmm8,0x8(%r8,%rdx,1)
-  DB  235,32                              ; jmp           2838f <_sk_store_a8_hsw_lowp+0xc3>
+  DB  235,32                              ; jmp           27d63 <_sk_store_a8_hsw_lowp+0xc3>
   DB  196,67,121,20,68,16,14,14           ; vpextrb       $0xe,%xmm8,0xe(%r8,%rdx,1)
   DB  196,67,121,20,68,16,13,13           ; vpextrb       $0xd,%xmm8,0xd(%r8,%rdx,1)
   DB  196,67,121,20,68,16,12,12           ; vpextrb       $0xc,%xmm8,0xc(%r8,%rdx,1)
@@ -38188,7 +37928,7 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  15,31,0                             ; nopl          (%rax)
-  DB  119,255                             ; ja            2839d <_sk_store_a8_hsw_lowp+0xd1>
+  DB  119,255                             ; ja            27d71 <_sk_store_a8_hsw_lowp+0xd1>
   DB  255                                 ; (bad)
   DB  255,144,255,255,255,136             ; callq         *-0x77000001(%rax)
   DB  255                                 ; (bad)
@@ -38325,38 +38065,38 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,37                              ; ja            285bb <_sk_load_g8_hsw_lowp+0x3c>
+  DB  119,37                              ; ja            27f8f <_sk_load_g8_hsw_lowp+0x3c>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,224,0,0,0                 ; lea           0xe0(%rip),%r9        # 28684 <_sk_load_g8_hsw_lowp+0x105>
+  DB  76,141,13,224,0,0,0                 ; lea           0xe0(%rip),%r9        # 28058 <_sk_load_g8_hsw_lowp+0x105>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  197,249,110,192                     ; vmovd         %eax,%xmm0
-  DB  233,175,0,0,0                       ; jmpq          2866a <_sk_load_g8_hsw_lowp+0xeb>
+  DB  233,175,0,0,0                       ; jmpq          2803e <_sk_load_g8_hsw_lowp+0xeb>
   DB  196,193,122,111,4,16                ; vmovdqu       (%r8,%rdx,1),%xmm0
-  DB  233,164,0,0,0                       ; jmpq          2866a <_sk_load_g8_hsw_lowp+0xeb>
+  DB  233,164,0,0,0                       ; jmpq          2803e <_sk_load_g8_hsw_lowp+0xeb>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,195,121,32,68,16,2,2            ; vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm0,%xmm0
   DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  197,249,110,200                     ; vmovd         %eax,%xmm1
   DB  196,227,121,14,193,1                ; vpblendw      $0x1,%xmm1,%xmm0,%xmm0
-  DB  233,132,0,0,0                       ; jmpq          2866a <_sk_load_g8_hsw_lowp+0xeb>
+  DB  233,132,0,0,0                       ; jmpq          2803e <_sk_load_g8_hsw_lowp+0xeb>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,195,121,32,68,16,6,6            ; vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,195,121,32,68,16,5,5            ; vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,195,121,32,68,16,4,4            ; vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,193,121,110,12,16               ; vmovd         (%r8,%rdx,1),%xmm1
   DB  196,227,121,2,193,1                 ; vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  DB  235,90                              ; jmp           2866a <_sk_load_g8_hsw_lowp+0xeb>
+  DB  235,90                              ; jmp           2803e <_sk_load_g8_hsw_lowp+0xeb>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,195,121,32,68,16,10,10          ; vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,195,121,32,68,16,9,9            ; vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,195,121,32,68,16,8,8            ; vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,193,122,126,12,16               ; vmovq         (%r8,%rdx,1),%xmm1
   DB  196,227,113,2,192,12                ; vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  DB  235,48                              ; jmp           2866a <_sk_load_g8_hsw_lowp+0xeb>
+  DB  235,48                              ; jmp           2803e <_sk_load_g8_hsw_lowp+0xeb>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,195,121,32,68,16,14,14          ; vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,195,121,32,68,16,13,13          ; vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm0,%xmm0
@@ -38366,7 +38106,7 @@
   DB  196,227,113,2,192,8                 ; vpblendd      $0x8,%xmm0,%xmm1,%xmm0
   DB  196,226,125,48,192                  ; vpmovzxbw     %xmm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,121,29,170,182,0,0      ; vpbroadcastw  0xb6aa(%rip),%ymm3        # 33d24 <_sk_srcover_bgra_8888_sse2_lowp+0xb08>
+  DB  196,226,125,121,29,182,182,0,0      ; vpbroadcastw  0xb6b6(%rip),%ymm3        # 33704 <_sk_srcover_bgra_8888_sse2_lowp+0xb14>
   DB  197,253,111,200                     ; vmovdqa       %ymm0,%ymm1
   DB  197,253,111,208                     ; vmovdqa       %ymm0,%ymm2
   DB  255,224                             ; jmpq          *%rax
@@ -38377,7 +38117,7 @@
   DB  255,66,255                          ; incl          -0x1(%rdx)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  126,255                             ; jle           28691 <_sk_load_g8_hsw_lowp+0x112>
+  DB  126,255                             ; jle           28065 <_sk_load_g8_hsw_lowp+0x112>
   DB  255                                 ; (bad)
   DB  255,118,255                         ; pushq         -0x1(%rsi)
   DB  255                                 ; (bad)
@@ -38415,38 +38155,38 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,37                              ; ja            286fc <_sk_load_g8_dst_hsw_lowp+0x3c>
+  DB  119,37                              ; ja            280d0 <_sk_load_g8_dst_hsw_lowp+0x3c>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,227,0,0,0                 ; lea           0xe3(%rip),%r9        # 287c8 <_sk_load_g8_dst_hsw_lowp+0x108>
+  DB  76,141,13,227,0,0,0                 ; lea           0xe3(%rip),%r9        # 2819c <_sk_load_g8_dst_hsw_lowp+0x108>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  197,249,110,224                     ; vmovd         %eax,%xmm4
-  DB  233,175,0,0,0                       ; jmpq          287ab <_sk_load_g8_dst_hsw_lowp+0xeb>
+  DB  233,175,0,0,0                       ; jmpq          2817f <_sk_load_g8_dst_hsw_lowp+0xeb>
   DB  196,193,122,111,36,16               ; vmovdqu       (%r8,%rdx,1),%xmm4
-  DB  233,164,0,0,0                       ; jmpq          287ab <_sk_load_g8_dst_hsw_lowp+0xeb>
+  DB  233,164,0,0,0                       ; jmpq          2817f <_sk_load_g8_dst_hsw_lowp+0xeb>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,195,89,32,100,16,2,2            ; vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm4,%xmm4
   DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  197,249,110,232                     ; vmovd         %eax,%xmm5
   DB  196,227,89,14,229,1                 ; vpblendw      $0x1,%xmm5,%xmm4,%xmm4
-  DB  233,132,0,0,0                       ; jmpq          287ab <_sk_load_g8_dst_hsw_lowp+0xeb>
+  DB  233,132,0,0,0                       ; jmpq          2817f <_sk_load_g8_dst_hsw_lowp+0xeb>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,195,89,32,100,16,6,6            ; vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,195,89,32,100,16,5,5            ; vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,195,89,32,100,16,4,4            ; vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,193,121,110,44,16               ; vmovd         (%r8,%rdx,1),%xmm5
   DB  196,227,89,2,229,1                  ; vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  DB  235,90                              ; jmp           287ab <_sk_load_g8_dst_hsw_lowp+0xeb>
+  DB  235,90                              ; jmp           2817f <_sk_load_g8_dst_hsw_lowp+0xeb>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,195,89,32,100,16,10,10          ; vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,195,89,32,100,16,9,9            ; vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,195,89,32,100,16,8,8            ; vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,193,122,126,44,16               ; vmovq         (%r8,%rdx,1),%xmm5
   DB  196,227,81,2,228,12                 ; vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  DB  235,48                              ; jmp           287ab <_sk_load_g8_dst_hsw_lowp+0xeb>
+  DB  235,48                              ; jmp           2817f <_sk_load_g8_dst_hsw_lowp+0xeb>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,195,89,32,100,16,14,14          ; vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,195,89,32,100,16,13,13          ; vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm4,%xmm4
@@ -38456,7 +38196,7 @@
   DB  196,227,81,2,228,8                  ; vpblendd      $0x8,%xmm4,%xmm5,%xmm4
   DB  196,226,125,48,228                  ; vpmovzxbw     %xmm4,%ymm4
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,121,61,107,181,0,0      ; vpbroadcastw  0xb56b(%rip),%ymm7        # 33d26 <_sk_srcover_bgra_8888_sse2_lowp+0xb0a>
+  DB  196,226,125,121,61,119,181,0,0      ; vpbroadcastw  0xb577(%rip),%ymm7        # 33706 <_sk_srcover_bgra_8888_sse2_lowp+0xb16>
   DB  197,253,111,236                     ; vmovdqa       %ymm4,%ymm5
   DB  197,253,111,244                     ; vmovdqa       %ymm4,%ymm6
   DB  255,224                             ; jmpq          *%rax
@@ -38470,7 +38210,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  123,255                             ; jnp           287d5 <_sk_load_g8_dst_hsw_lowp+0x115>
+  DB  123,255                             ; jnp           281a9 <_sk_load_g8_dst_hsw_lowp+0x115>
   DB  255                                 ; (bad)
   DB  255,115,255                         ; pushq         -0x1(%rbx)
   DB  255                                 ; (bad)
@@ -38498,12 +38238,12 @@
 
 PUBLIC _sk_luminance_to_alpha_hsw_lowp
 _sk_luminance_to_alpha_hsw_lowp LABEL PROC
-  DB  196,226,125,121,29,27,181,0,0       ; vpbroadcastw  0xb51b(%rip),%ymm3        # 33d28 <_sk_srcover_bgra_8888_sse2_lowp+0xb0c>
+  DB  196,226,125,121,29,39,181,0,0       ; vpbroadcastw  0xb527(%rip),%ymm3        # 33708 <_sk_srcover_bgra_8888_sse2_lowp+0xb18>
   DB  197,253,213,195                     ; vpmullw       %ymm3,%ymm0,%ymm0
-  DB  196,226,125,121,29,16,181,0,0       ; vpbroadcastw  0xb510(%rip),%ymm3        # 33d2a <_sk_srcover_bgra_8888_sse2_lowp+0xb0e>
+  DB  196,226,125,121,29,28,181,0,0       ; vpbroadcastw  0xb51c(%rip),%ymm3        # 3370a <_sk_srcover_bgra_8888_sse2_lowp+0xb1a>
   DB  197,245,213,203                     ; vpmullw       %ymm3,%ymm1,%ymm1
   DB  197,245,253,192                     ; vpaddw        %ymm0,%ymm1,%ymm0
-  DB  196,226,125,121,13,1,181,0,0        ; vpbroadcastw  0xb501(%rip),%ymm1        # 33d2c <_sk_srcover_bgra_8888_sse2_lowp+0xb10>
+  DB  196,226,125,121,13,13,181,0,0       ; vpbroadcastw  0xb50d(%rip),%ymm1        # 3370c <_sk_srcover_bgra_8888_sse2_lowp+0xb1c>
   DB  197,237,213,201                     ; vpmullw       %ymm1,%ymm2,%ymm1
   DB  197,253,253,193                     ; vpaddw        %ymm1,%ymm0,%ymm0
   DB  197,229,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm3
@@ -38600,7 +38340,7 @@
   DB  196,227,121,32,192,15               ; vpinsrb       $0xf,%eax,%xmm0,%xmm0
   DB  196,226,125,48,192                  ; vpmovzxbw     %xmm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,121,29,68,179,0,0       ; vpbroadcastw  0xb344(%rip),%ymm3        # 33d2e <_sk_srcover_bgra_8888_sse2_lowp+0xb12>
+  DB  196,226,125,121,29,80,179,0,0       ; vpbroadcastw  0xb350(%rip),%ymm3        # 3370e <_sk_srcover_bgra_8888_sse2_lowp+0xb1e>
   DB  197,253,111,200                     ; vmovdqa       %ymm0,%ymm1
   DB  197,253,111,208                     ; vmovdqa       %ymm0,%ymm2
   DB  255,224                             ; jmpq          *%rax
@@ -38609,13 +38349,13 @@
 _sk_scale_1_float_hsw_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,122,16,0                        ; vmovss        (%rax),%xmm8
-  DB  197,122,16,13,246,170,0,0           ; vmovss        0xaaf6(%rip),%xmm9        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
-  DB  196,98,57,169,13,189,170,0,0        ; vfmadd213ss   0xaabd(%rip),%xmm8,%xmm9        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  197,122,16,13,246,170,0,0           ; vmovss        0xaaf6(%rip),%xmm9        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  196,98,57,169,13,189,170,0,0        ; vfmadd213ss   0xaabd(%rip),%xmm8,%xmm9        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,193,122,44,193                  ; vcvttss2si    %xmm9,%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
   DB  196,66,125,121,192                  ; vpbroadcastw  %xmm8,%ymm8
   DB  197,189,213,192                     ; vpmullw       %ymm0,%ymm8,%ymm0
-  DB  196,98,125,121,13,10,179,0,0        ; vpbroadcastw  0xb30a(%rip),%ymm9        # 33d30 <_sk_srcover_bgra_8888_sse2_lowp+0xb14>
+  DB  196,98,125,121,13,22,179,0,0        ; vpbroadcastw  0xb316(%rip),%ymm9        # 33710 <_sk_srcover_bgra_8888_sse2_lowp+0xb20>
   DB  196,193,125,253,193                 ; vpaddw        %ymm9,%ymm0,%ymm0
   DB  197,253,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm0
   DB  197,189,213,201                     ; vpmullw       %ymm1,%ymm8,%ymm1
@@ -38634,12 +38374,12 @@
 _sk_lerp_1_float_hsw_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,122,16,0                        ; vmovss        (%rax),%xmm8
-  DB  197,122,16,13,140,170,0,0           ; vmovss        0xaa8c(%rip),%xmm9        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
-  DB  196,98,57,169,13,83,170,0,0         ; vfmadd213ss   0xaa53(%rip),%xmm8,%xmm9        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  197,122,16,13,140,170,0,0           ; vmovss        0xaa8c(%rip),%xmm9        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  196,98,57,169,13,83,170,0,0         ; vfmadd213ss   0xaa53(%rip),%xmm8,%xmm9        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,193,122,44,193                  ; vcvttss2si    %xmm9,%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
   DB  196,66,125,121,192                  ; vpbroadcastw  %xmm8,%ymm8
-  DB  196,98,125,121,13,166,178,0,0       ; vpbroadcastw  0xb2a6(%rip),%ymm9        # 33d32 <_sk_srcover_bgra_8888_sse2_lowp+0xb16>
+  DB  196,98,125,121,13,178,178,0,0       ; vpbroadcastw  0xb2b2(%rip),%ymm9        # 33712 <_sk_srcover_bgra_8888_sse2_lowp+0xb22>
   DB  196,65,53,249,208                   ; vpsubw        %ymm8,%ymm9,%ymm10
   DB  197,45,213,220                      ; vpmullw       %ymm4,%ymm10,%ymm11
   DB  197,189,213,192                     ; vpmullw       %ymm0,%ymm8,%ymm0
@@ -38674,38 +38414,38 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,38                              ; ja            28b2a <_sk_scale_u8_hsw_lowp+0x3d>
+  DB  119,38                              ; ja            284fe <_sk_scale_u8_hsw_lowp+0x3d>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,21,1,0,0                  ; lea           0x115(%rip),%r9        # 28c28 <_sk_scale_u8_hsw_lowp+0x13b>
+  DB  76,141,13,21,1,0,0                  ; lea           0x115(%rip),%r9        # 285fc <_sk_scale_u8_hsw_lowp+0x13b>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
-  DB  233,179,0,0,0                       ; jmpq          28bdd <_sk_scale_u8_hsw_lowp+0xf0>
+  DB  233,179,0,0,0                       ; jmpq          285b1 <_sk_scale_u8_hsw_lowp+0xf0>
   DB  196,65,122,111,4,16                 ; vmovdqu       (%r8,%rdx,1),%xmm8
-  DB  233,168,0,0,0                       ; jmpq          28bdd <_sk_scale_u8_hsw_lowp+0xf0>
+  DB  233,168,0,0,0                       ; jmpq          285b1 <_sk_scale_u8_hsw_lowp+0xf0>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,67,57,32,68,16,2,2              ; vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm8,%xmm8
   DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  197,121,110,200                     ; vmovd         %eax,%xmm9
   DB  196,67,57,14,193,1                  ; vpblendw      $0x1,%xmm9,%xmm8,%xmm8
-  DB  233,135,0,0,0                       ; jmpq          28bdd <_sk_scale_u8_hsw_lowp+0xf0>
+  DB  233,135,0,0,0                       ; jmpq          285b1 <_sk_scale_u8_hsw_lowp+0xf0>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,67,57,32,68,16,6,6              ; vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,67,57,32,68,16,5,5              ; vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,67,57,32,68,16,4,4              ; vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,65,121,110,12,16                ; vmovd         (%r8,%rdx,1),%xmm9
   DB  196,67,57,2,193,1                   ; vpblendd      $0x1,%xmm9,%xmm8,%xmm8
-  DB  235,92                              ; jmp           28bdd <_sk_scale_u8_hsw_lowp+0xf0>
+  DB  235,92                              ; jmp           285b1 <_sk_scale_u8_hsw_lowp+0xf0>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,67,57,32,68,16,10,10            ; vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,67,57,32,68,16,9,9              ; vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,67,57,32,68,16,8,8              ; vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,65,122,126,12,16                ; vmovq         (%r8,%rdx,1),%xmm9
   DB  196,67,49,2,192,12                  ; vpblendd      $0xc,%xmm8,%xmm9,%xmm8
-  DB  235,49                              ; jmp           28bdd <_sk_scale_u8_hsw_lowp+0xf0>
+  DB  235,49                              ; jmp           285b1 <_sk_scale_u8_hsw_lowp+0xf0>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,67,57,32,68,16,14,14            ; vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,67,57,32,68,16,13,13            ; vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm8,%xmm8
@@ -38715,7 +38455,7 @@
   DB  196,67,49,2,192,8                   ; vpblendd      $0x8,%xmm8,%xmm9,%xmm8
   DB  196,66,125,48,192                   ; vpmovzxbw     %xmm8,%ymm8
   DB  197,189,213,192                     ; vpmullw       %ymm0,%ymm8,%ymm0
-  DB  196,98,125,121,13,69,177,0,0        ; vpbroadcastw  0xb145(%rip),%ymm9        # 33d34 <_sk_srcover_bgra_8888_sse2_lowp+0xb18>
+  DB  196,98,125,121,13,81,177,0,0        ; vpbroadcastw  0xb151(%rip),%ymm9        # 33714 <_sk_srcover_bgra_8888_sse2_lowp+0xb24>
   DB  196,193,125,253,193                 ; vpaddw        %ymm9,%ymm0,%ymm0
   DB  197,253,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm0
   DB  197,189,213,201                     ; vpmullw       %ymm1,%ymm8,%ymm1
@@ -38736,7 +38476,7 @@
   DB  255,26                              ; lcall         *(%rdx)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,13,255,255,255,75               ; decl          0x4bffffff(%rip)        # 4c028c34 <_sk_srcover_bgra_8888_sse2_lowp+0x4bff5a18>
+  DB  255,13,255,255,255,75               ; decl          0x4bffffff(%rip)        # 4c028608 <_sk_srcover_bgra_8888_sse2_lowp+0x4bff5a18>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,67,255                          ; incl          -0x1(%rbx)
@@ -38773,38 +38513,38 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,38                              ; ja            28ca1 <_sk_lerp_u8_hsw_lowp+0x3d>
+  DB  119,38                              ; ja            28675 <_sk_lerp_u8_hsw_lowp+0x3d>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,58,1,0,0                  ; lea           0x13a(%rip),%r9        # 28dc4 <_sk_lerp_u8_hsw_lowp+0x160>
+  DB  76,141,13,58,1,0,0                  ; lea           0x13a(%rip),%r9        # 28798 <_sk_lerp_u8_hsw_lowp+0x160>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
-  DB  233,179,0,0,0                       ; jmpq          28d54 <_sk_lerp_u8_hsw_lowp+0xf0>
+  DB  233,179,0,0,0                       ; jmpq          28728 <_sk_lerp_u8_hsw_lowp+0xf0>
   DB  196,65,122,111,4,16                 ; vmovdqu       (%r8,%rdx,1),%xmm8
-  DB  233,168,0,0,0                       ; jmpq          28d54 <_sk_lerp_u8_hsw_lowp+0xf0>
+  DB  233,168,0,0,0                       ; jmpq          28728 <_sk_lerp_u8_hsw_lowp+0xf0>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,67,57,32,68,16,2,2              ; vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm8,%xmm8
   DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  197,121,110,200                     ; vmovd         %eax,%xmm9
   DB  196,67,57,14,193,1                  ; vpblendw      $0x1,%xmm9,%xmm8,%xmm8
-  DB  233,135,0,0,0                       ; jmpq          28d54 <_sk_lerp_u8_hsw_lowp+0xf0>
+  DB  233,135,0,0,0                       ; jmpq          28728 <_sk_lerp_u8_hsw_lowp+0xf0>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,67,57,32,68,16,6,6              ; vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,67,57,32,68,16,5,5              ; vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,67,57,32,68,16,4,4              ; vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,65,121,110,12,16                ; vmovd         (%r8,%rdx,1),%xmm9
   DB  196,67,57,2,193,1                   ; vpblendd      $0x1,%xmm9,%xmm8,%xmm8
-  DB  235,92                              ; jmp           28d54 <_sk_lerp_u8_hsw_lowp+0xf0>
+  DB  235,92                              ; jmp           28728 <_sk_lerp_u8_hsw_lowp+0xf0>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,67,57,32,68,16,10,10            ; vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,67,57,32,68,16,9,9              ; vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,67,57,32,68,16,8,8              ; vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,65,122,126,12,16                ; vmovq         (%r8,%rdx,1),%xmm9
   DB  196,67,49,2,192,12                  ; vpblendd      $0xc,%xmm8,%xmm9,%xmm8
-  DB  235,49                              ; jmp           28d54 <_sk_lerp_u8_hsw_lowp+0xf0>
+  DB  235,49                              ; jmp           28728 <_sk_lerp_u8_hsw_lowp+0xf0>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,67,57,32,68,16,14,14            ; vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,67,57,32,68,16,13,13            ; vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm8,%xmm8
@@ -38813,7 +38553,7 @@
   DB  196,67,49,34,76,16,8,2              ; vpinsrd       $0x2,0x8(%r8,%rdx,1),%xmm9,%xmm9
   DB  196,67,49,2,192,8                   ; vpblendd      $0x8,%xmm8,%xmm9,%xmm8
   DB  196,66,125,48,192                   ; vpmovzxbw     %xmm8,%ymm8
-  DB  196,98,125,121,13,212,175,0,0       ; vpbroadcastw  0xafd4(%rip),%ymm9        # 33d36 <_sk_srcover_bgra_8888_sse2_lowp+0xb1a>
+  DB  196,98,125,121,13,224,175,0,0       ; vpbroadcastw  0xafe0(%rip),%ymm9        # 33716 <_sk_srcover_bgra_8888_sse2_lowp+0xb26>
   DB  196,65,61,239,209                   ; vpxor         %ymm9,%ymm8,%ymm10
   DB  197,45,213,220                      ; vpmullw       %ymm4,%ymm10,%ymm11
   DB  197,189,213,192                     ; vpmullw       %ymm0,%ymm8,%ymm0
@@ -38845,7 +38585,7 @@
   DB  254                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  232,254,255,255,38                  ; callq         27028dcf <_sk_srcover_bgra_8888_sse2_lowp+0x26ff5bb3>
+  DB  232,254,255,255,38                  ; callq         270287a3 <_sk_srcover_bgra_8888_sse2_lowp+0x26ff5bb3>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,30                              ; lcall         *(%rsi)
@@ -38866,7 +38606,7 @@
   DB  255,52,255                          ; pushq         (%rdi,%rdi,8)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  124,255                             ; jl            28df1 <_sk_lerp_u8_hsw_lowp+0x18d>
+  DB  124,255                             ; jl            287c5 <_sk_lerp_u8_hsw_lowp+0x18d>
   DB  255                                 ; (bad)
   DB  255,116,255,255                     ; pushq         -0x1(%rdi,%rdi,8)
   DB  255,108,255,255                     ; ljmp          *-0x1(%rdi,%rdi,8)
@@ -38885,24 +38625,24 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,38                              ; ja            28e40 <_sk_scale_565_hsw_lowp+0x40>
+  DB  119,38                              ; ja            28814 <_sk_scale_565_hsw_lowp+0x40>
   DB  196,65,61,239,192                   ; vpxor         %ymm8,%ymm8,%ymm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,255,1,0,0                 ; lea           0x1ff(%rip),%r9        # 29028 <_sk_scale_565_hsw_lowp+0x228>
+  DB  76,141,13,255,1,0,0                 ; lea           0x1ff(%rip),%r9        # 289fc <_sk_scale_565_hsw_lowp+0x228>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
-  DB  233,12,1,0,0                        ; jmpq          28f4c <_sk_scale_565_hsw_lowp+0x14c>
+  DB  233,12,1,0,0                        ; jmpq          28920 <_sk_scale_565_hsw_lowp+0x14c>
   DB  196,65,126,111,4,80                 ; vmovdqu       (%r8,%rdx,2),%ymm8
-  DB  233,1,1,0,0                         ; jmpq          28f4c <_sk_scale_565_hsw_lowp+0x14c>
+  DB  233,1,1,0,0                         ; jmpq          28920 <_sk_scale_565_hsw_lowp+0x14c>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,65,57,196,76,80,4,2             ; vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm8,%xmm9
   DB  196,67,53,56,192,1                  ; vinserti128   $0x1,%xmm8,%ymm9,%ymm8
   DB  196,65,121,110,12,80                ; vmovd         (%r8,%rdx,2),%xmm9
   DB  196,67,61,2,193,1                   ; vpblendd      $0x1,%ymm9,%ymm8,%ymm8
-  DB  233,221,0,0,0                       ; jmpq          28f4c <_sk_scale_565_hsw_lowp+0x14c>
+  DB  233,221,0,0,0                       ; jmpq          28920 <_sk_scale_565_hsw_lowp+0x14c>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,65,57,196,76,80,12,6            ; vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm8,%xmm9
   DB  196,67,53,56,192,1                  ; vinserti128   $0x1,%xmm8,%ymm9,%ymm8
@@ -38912,7 +38652,7 @@
   DB  196,67,61,2,193,15                  ; vpblendd      $0xf,%ymm9,%ymm8,%ymm8
   DB  196,65,122,126,12,80                ; vmovq         (%r8,%rdx,2),%xmm9
   DB  196,67,61,2,193,3                   ; vpblendd      $0x3,%ymm9,%ymm8,%ymm8
-  DB  233,157,0,0,0                       ; jmpq          28f4c <_sk_scale_565_hsw_lowp+0x14c>
+  DB  233,157,0,0,0                       ; jmpq          28920 <_sk_scale_565_hsw_lowp+0x14c>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,65,57,196,76,80,20,2            ; vpinsrw       $0x2,0x14(%r8,%rdx,2),%xmm8,%xmm9
   DB  196,67,61,56,193,1                  ; vinserti128   $0x1,%xmm9,%ymm8,%ymm8
@@ -38924,7 +38664,7 @@
   DB  196,67,61,56,193,1                  ; vinserti128   $0x1,%xmm9,%ymm8,%ymm8
   DB  196,65,122,111,12,80                ; vmovdqu       (%r8,%rdx,2),%xmm9
   DB  196,67,53,2,192,240                 ; vpblendd      $0xf0,%ymm8,%ymm9,%ymm8
-  DB  235,84                              ; jmp           28f4c <_sk_scale_565_hsw_lowp+0x14c>
+  DB  235,84                              ; jmp           28920 <_sk_scale_565_hsw_lowp+0x14c>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,65,57,196,76,80,28,6            ; vpinsrw       $0x6,0x1c(%r8,%rdx,2),%xmm8,%xmm9
   DB  196,67,61,56,193,1                  ; vinserti128   $0x1,%xmm9,%ymm8,%ymm8
@@ -38938,13 +38678,13 @@
   DB  196,65,122,111,20,80                ; vmovdqu       (%r8,%rdx,2),%xmm10
   DB  196,67,45,56,201,1                  ; vinserti128   $0x1,%xmm9,%ymm10,%ymm9
   DB  196,67,53,2,192,192                 ; vpblendd      $0xc0,%ymm8,%ymm9,%ymm8
-  DB  196,98,125,121,13,227,173,0,0       ; vpbroadcastw  0xade3(%rip),%ymm9        # 33d38 <_sk_srcover_bgra_8888_sse2_lowp+0xb1c>
+  DB  196,98,125,121,13,239,173,0,0       ; vpbroadcastw  0xadef(%rip),%ymm9        # 33718 <_sk_srcover_bgra_8888_sse2_lowp+0xb28>
   DB  196,193,45,113,208,8                ; vpsrlw        $0x8,%ymm8,%ymm10
   DB  196,65,45,219,201                   ; vpand         %ymm9,%ymm10,%ymm9
   DB  196,193,45,113,208,5                ; vpsrlw        $0x5,%ymm8,%ymm10
-  DB  196,98,125,121,29,203,173,0,0       ; vpbroadcastw  0xadcb(%rip),%ymm11        # 33d3a <_sk_srcover_bgra_8888_sse2_lowp+0xb1e>
+  DB  196,98,125,121,29,215,173,0,0       ; vpbroadcastw  0xadd7(%rip),%ymm11        # 3371a <_sk_srcover_bgra_8888_sse2_lowp+0xb2a>
   DB  196,65,45,219,211                   ; vpand         %ymm11,%ymm10,%ymm10
-  DB  196,98,125,121,29,191,173,0,0       ; vpbroadcastw  0xadbf(%rip),%ymm11        # 33d3c <_sk_srcover_bgra_8888_sse2_lowp+0xb20>
+  DB  196,98,125,121,29,203,173,0,0       ; vpbroadcastw  0xadcb(%rip),%ymm11        # 3371c <_sk_srcover_bgra_8888_sse2_lowp+0xb2c>
   DB  196,65,61,219,219                   ; vpand         %ymm11,%ymm8,%ymm11
   DB  196,193,61,113,208,13               ; vpsrlw        $0xd,%ymm8,%ymm8
   DB  196,65,53,235,192                   ; vpor          %ymm8,%ymm9,%ymm8
@@ -38954,7 +38694,7 @@
   DB  196,193,45,113,243,3                ; vpsllw        $0x3,%ymm11,%ymm10
   DB  196,193,37,113,211,2                ; vpsrlw        $0x2,%ymm11,%ymm11
   DB  196,65,45,235,211                   ; vpor          %ymm11,%ymm10,%ymm10
-  DB  196,98,125,121,29,134,173,0,0       ; vpbroadcastw  0xad86(%rip),%ymm11        # 33d3e <_sk_srcover_bgra_8888_sse2_lowp+0xb22>
+  DB  196,98,125,121,29,146,173,0,0       ; vpbroadcastw  0xad92(%rip),%ymm11        # 3371e <_sk_srcover_bgra_8888_sse2_lowp+0xb2e>
   DB  196,65,101,239,227                  ; vpxor         %ymm11,%ymm3,%ymm12
   DB  196,65,69,239,219                   ; vpxor         %ymm11,%ymm7,%ymm11
   DB  196,65,37,101,220                   ; vpcmpgtw      %ymm12,%ymm11,%ymm11
@@ -38964,7 +38704,7 @@
   DB  196,66,21,62,232                    ; vpmaxuw       %ymm8,%ymm13,%ymm13
   DB  196,67,21,76,220,176                ; vpblendvb     %ymm11,%ymm12,%ymm13,%ymm11
   DB  197,189,213,192                     ; vpmullw       %ymm0,%ymm8,%ymm0
-  DB  196,98,125,121,5,82,173,0,0         ; vpbroadcastw  0xad52(%rip),%ymm8        # 33d40 <_sk_srcover_bgra_8888_sse2_lowp+0xb24>
+  DB  196,98,125,121,5,94,173,0,0         ; vpbroadcastw  0xad5e(%rip),%ymm8        # 33720 <_sk_srcover_bgra_8888_sse2_lowp+0xb30>
   DB  196,193,125,253,192                 ; vpaddw        %ymm8,%ymm0,%ymm0
   DB  197,253,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm0
   DB  197,181,213,201                     ; vpmullw       %ymm1,%ymm9,%ymm1
@@ -39026,24 +38766,24 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,38                              ; ja            290a4 <_sk_lerp_565_hsw_lowp+0x40>
+  DB  119,38                              ; ja            28a78 <_sk_lerp_565_hsw_lowp+0x40>
   DB  196,65,61,239,192                   ; vpxor         %ymm8,%ymm8,%ymm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,51,2,0,0                  ; lea           0x233(%rip),%r9        # 292c0 <_sk_lerp_565_hsw_lowp+0x25c>
+  DB  76,141,13,51,2,0,0                  ; lea           0x233(%rip),%r9        # 28c94 <_sk_lerp_565_hsw_lowp+0x25c>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
-  DB  233,12,1,0,0                        ; jmpq          291b0 <_sk_lerp_565_hsw_lowp+0x14c>
+  DB  233,12,1,0,0                        ; jmpq          28b84 <_sk_lerp_565_hsw_lowp+0x14c>
   DB  196,65,126,111,4,80                 ; vmovdqu       (%r8,%rdx,2),%ymm8
-  DB  233,1,1,0,0                         ; jmpq          291b0 <_sk_lerp_565_hsw_lowp+0x14c>
+  DB  233,1,1,0,0                         ; jmpq          28b84 <_sk_lerp_565_hsw_lowp+0x14c>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,65,57,196,76,80,4,2             ; vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm8,%xmm9
   DB  196,67,53,56,192,1                  ; vinserti128   $0x1,%xmm8,%ymm9,%ymm8
   DB  196,65,121,110,12,80                ; vmovd         (%r8,%rdx,2),%xmm9
   DB  196,67,61,2,193,1                   ; vpblendd      $0x1,%ymm9,%ymm8,%ymm8
-  DB  233,221,0,0,0                       ; jmpq          291b0 <_sk_lerp_565_hsw_lowp+0x14c>
+  DB  233,221,0,0,0                       ; jmpq          28b84 <_sk_lerp_565_hsw_lowp+0x14c>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,65,57,196,76,80,12,6            ; vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm8,%xmm9
   DB  196,67,53,56,192,1                  ; vinserti128   $0x1,%xmm8,%ymm9,%ymm8
@@ -39053,7 +38793,7 @@
   DB  196,67,61,2,193,15                  ; vpblendd      $0xf,%ymm9,%ymm8,%ymm8
   DB  196,65,122,126,12,80                ; vmovq         (%r8,%rdx,2),%xmm9
   DB  196,67,61,2,193,3                   ; vpblendd      $0x3,%ymm9,%ymm8,%ymm8
-  DB  233,157,0,0,0                       ; jmpq          291b0 <_sk_lerp_565_hsw_lowp+0x14c>
+  DB  233,157,0,0,0                       ; jmpq          28b84 <_sk_lerp_565_hsw_lowp+0x14c>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,65,57,196,76,80,20,2            ; vpinsrw       $0x2,0x14(%r8,%rdx,2),%xmm8,%xmm9
   DB  196,67,61,56,193,1                  ; vinserti128   $0x1,%xmm9,%ymm8,%ymm8
@@ -39065,7 +38805,7 @@
   DB  196,67,61,56,193,1                  ; vinserti128   $0x1,%xmm9,%ymm8,%ymm8
   DB  196,65,122,111,12,80                ; vmovdqu       (%r8,%rdx,2),%xmm9
   DB  196,67,53,2,192,240                 ; vpblendd      $0xf0,%ymm8,%ymm9,%ymm8
-  DB  235,84                              ; jmp           291b0 <_sk_lerp_565_hsw_lowp+0x14c>
+  DB  235,84                              ; jmp           28b84 <_sk_lerp_565_hsw_lowp+0x14c>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,65,57,196,76,80,28,6            ; vpinsrw       $0x6,0x1c(%r8,%rdx,2),%xmm8,%xmm9
   DB  196,67,61,56,193,1                  ; vinserti128   $0x1,%xmm9,%ymm8,%ymm8
@@ -39079,13 +38819,13 @@
   DB  196,65,122,111,20,80                ; vmovdqu       (%r8,%rdx,2),%xmm10
   DB  196,67,45,56,201,1                  ; vinserti128   $0x1,%xmm9,%ymm10,%ymm9
   DB  196,67,53,2,192,192                 ; vpblendd      $0xc0,%ymm8,%ymm9,%ymm8
-  DB  196,98,125,121,13,137,171,0,0       ; vpbroadcastw  0xab89(%rip),%ymm9        # 33d42 <_sk_srcover_bgra_8888_sse2_lowp+0xb26>
+  DB  196,98,125,121,13,149,171,0,0       ; vpbroadcastw  0xab95(%rip),%ymm9        # 33722 <_sk_srcover_bgra_8888_sse2_lowp+0xb32>
   DB  196,193,45,113,208,8                ; vpsrlw        $0x8,%ymm8,%ymm10
   DB  196,65,45,219,201                   ; vpand         %ymm9,%ymm10,%ymm9
   DB  196,193,45,113,208,5                ; vpsrlw        $0x5,%ymm8,%ymm10
-  DB  196,98,125,121,29,113,171,0,0       ; vpbroadcastw  0xab71(%rip),%ymm11        # 33d44 <_sk_srcover_bgra_8888_sse2_lowp+0xb28>
+  DB  196,98,125,121,29,125,171,0,0       ; vpbroadcastw  0xab7d(%rip),%ymm11        # 33724 <_sk_srcover_bgra_8888_sse2_lowp+0xb34>
   DB  196,65,45,219,211                   ; vpand         %ymm11,%ymm10,%ymm10
-  DB  196,98,125,121,29,101,171,0,0       ; vpbroadcastw  0xab65(%rip),%ymm11        # 33d46 <_sk_srcover_bgra_8888_sse2_lowp+0xb2a>
+  DB  196,98,125,121,29,113,171,0,0       ; vpbroadcastw  0xab71(%rip),%ymm11        # 33726 <_sk_srcover_bgra_8888_sse2_lowp+0xb36>
   DB  196,65,61,219,219                   ; vpand         %ymm11,%ymm8,%ymm11
   DB  196,193,61,113,208,13               ; vpsrlw        $0xd,%ymm8,%ymm8
   DB  196,65,53,235,192                   ; vpor          %ymm8,%ymm9,%ymm8
@@ -39095,7 +38835,7 @@
   DB  196,193,45,113,243,3                ; vpsllw        $0x3,%ymm11,%ymm10
   DB  196,193,37,113,211,2                ; vpsrlw        $0x2,%ymm11,%ymm11
   DB  196,65,45,235,211                   ; vpor          %ymm11,%ymm10,%ymm10
-  DB  196,98,125,121,29,44,171,0,0        ; vpbroadcastw  0xab2c(%rip),%ymm11        # 33d48 <_sk_srcover_bgra_8888_sse2_lowp+0xb2c>
+  DB  196,98,125,121,29,56,171,0,0        ; vpbroadcastw  0xab38(%rip),%ymm11        # 33728 <_sk_srcover_bgra_8888_sse2_lowp+0xb38>
   DB  196,65,101,239,227                  ; vpxor         %ymm11,%ymm3,%ymm12
   DB  196,65,69,239,219                   ; vpxor         %ymm11,%ymm7,%ymm11
   DB  196,65,37,101,220                   ; vpcmpgtw      %ymm12,%ymm11,%ymm11
@@ -39104,7 +38844,7 @@
   DB  196,66,53,62,234                    ; vpmaxuw       %ymm10,%ymm9,%ymm13
   DB  196,66,21,62,232                    ; vpmaxuw       %ymm8,%ymm13,%ymm13
   DB  196,67,21,76,220,176                ; vpblendvb     %ymm11,%ymm12,%ymm13,%ymm11
-  DB  196,98,125,121,37,252,170,0,0       ; vpbroadcastw  0xaafc(%rip),%ymm12        # 33d4a <_sk_srcover_bgra_8888_sse2_lowp+0xb2e>
+  DB  196,98,125,121,37,8,171,0,0         ; vpbroadcastw  0xab08(%rip),%ymm12        # 3372a <_sk_srcover_bgra_8888_sse2_lowp+0xb3a>
   DB  196,65,61,239,236                   ; vpxor         %ymm12,%ymm8,%ymm13
   DB  197,21,213,236                      ; vpmullw       %ymm4,%ymm13,%ymm13
   DB  197,189,213,192                     ; vpmullw       %ymm0,%ymm8,%ymm0
@@ -39175,7 +38915,7 @@
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  196,193,116,95,200                  ; vmaxps        %ymm8,%ymm1,%ymm1
   DB  196,193,124,95,192                  ; vmaxps        %ymm8,%ymm0,%ymm0
-  DB  196,98,125,24,5,184,161,0,0         ; vbroadcastss  0xa1b8(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,184,161,0,0         ; vbroadcastss  0xa1b8(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
   DB  196,193,116,93,200                  ; vminps        %ymm8,%ymm1,%ymm1
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -39190,7 +38930,7 @@
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  196,193,116,95,200                  ; vmaxps        %ymm8,%ymm1,%ymm1
   DB  196,193,124,95,192                  ; vmaxps        %ymm8,%ymm0,%ymm0
-  DB  196,98,125,24,5,124,161,0,0         ; vbroadcastss  0xa17c(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,124,161,0,0         ; vbroadcastss  0xa17c(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
   DB  196,193,116,93,200                  ; vminps        %ymm8,%ymm1,%ymm1
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -39198,10 +38938,10 @@
 
 PUBLIC _sk_mirror_x_1_hsw_lowp
 _sk_mirror_x_1_hsw_lowp LABEL PROC
-  DB  196,98,125,24,5,125,161,0,0         ; vbroadcastss  0xa17d(%rip),%ymm8        # 334e4 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
+  DB  196,98,125,24,5,125,161,0,0         ; vbroadcastss  0xa17d(%rip),%ymm8        # 32eb8 <_sk_srcover_bgra_8888_sse2_lowp+0x2c8>
   DB  196,193,124,88,192                  ; vaddps        %ymm8,%ymm0,%ymm0
   DB  196,193,116,88,200                  ; vaddps        %ymm8,%ymm1,%ymm1
-  DB  196,98,125,24,13,78,161,0,0         ; vbroadcastss  0xa14e(%rip),%ymm9        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,13,78,161,0,0         ; vbroadcastss  0xa14e(%rip),%ymm9        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,65,116,89,209                   ; vmulps        %ymm9,%ymm1,%ymm10
   DB  196,65,124,89,201                   ; vmulps        %ymm9,%ymm0,%ymm9
   DB  196,67,125,8,201,1                  ; vroundps      $0x1,%ymm9,%ymm9
@@ -39212,13 +38952,13 @@
   DB  196,193,116,92,202                  ; vsubps        %ymm10,%ymm1,%ymm1
   DB  196,193,116,88,200                  ; vaddps        %ymm8,%ymm1,%ymm1
   DB  196,193,124,88,192                  ; vaddps        %ymm8,%ymm0,%ymm0
-  DB  196,98,125,24,5,153,162,0,0         ; vbroadcastss  0xa299(%rip),%ymm8        # 33650 <_sk_srcover_bgra_8888_sse2_lowp+0x434>
+  DB  196,98,125,24,5,153,162,0,0         ; vbroadcastss  0xa299(%rip),%ymm8        # 33024 <_sk_srcover_bgra_8888_sse2_lowp+0x434>
   DB  196,193,124,84,192                  ; vandps        %ymm8,%ymm0,%ymm0
   DB  196,193,116,84,200                  ; vandps        %ymm8,%ymm1,%ymm1
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  196,193,116,95,200                  ; vmaxps        %ymm8,%ymm1,%ymm1
   DB  196,193,124,95,192                  ; vmaxps        %ymm8,%ymm0,%ymm0
-  DB  196,98,125,24,5,243,160,0,0         ; vbroadcastss  0xa0f3(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,243,160,0,0         ; vbroadcastss  0xa0f3(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
   DB  196,193,116,93,200                  ; vminps        %ymm8,%ymm1,%ymm1
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -39236,7 +38976,7 @@
   DB  197,197,239,255                     ; vpxor         %ymm7,%ymm7,%ymm7
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
   DB  73,131,248,2                        ; cmp           $0x2,%r8
-  DB  114,60                              ; jb            29461 <_sk_gradient_hsw_lowp+0x7a>
+  DB  114,60                              ; jb            28e35 <_sk_gradient_hsw_lowp+0x7a>
   DB  76,139,72,72                        ; mov           0x48(%rax),%r9
   DB  197,197,239,255                     ; vpxor         %ymm7,%ymm7,%ymm7
   DB  65,186,1,0,0,0                      ; mov           $0x1,%r10d
@@ -39248,9 +38988,9 @@
   DB  197,213,250,234                     ; vpsubd        %ymm2,%ymm5,%ymm5
   DB  73,255,194                          ; inc           %r10
   DB  77,57,208                           ; cmp           %r10,%r8
-  DB  117,224                             ; jne           29437 <_sk_gradient_hsw_lowp+0x50>
+  DB  117,224                             ; jne           28e0b <_sk_gradient_hsw_lowp+0x50>
   DB  73,131,248,8                        ; cmp           $0x8,%r8
-  DB  15,135,179,0,0,0                    ; ja            29514 <_sk_gradient_hsw_lowp+0x12d>
+  DB  15,135,179,0,0,0                    ; ja            28ee8 <_sk_gradient_hsw_lowp+0x12d>
   DB  76,139,64,8                         ; mov           0x8(%rax),%r8
   DB  76,139,72,16                        ; mov           0x10(%rax),%r9
   DB  196,193,124,16,24                   ; vmovups       (%r8),%ymm3
@@ -39287,7 +39027,7 @@
   DB  197,124,16,56                       ; vmovups       (%rax),%ymm15
   DB  196,66,69,22,231                    ; vpermps       %ymm15,%ymm7,%ymm12
   DB  196,194,85,22,255                   ; vpermps       %ymm15,%ymm5,%ymm7
-  DB  233,33,1,0,0                        ; jmpq          29635 <_sk_gradient_hsw_lowp+0x24e>
+  DB  233,33,1,0,0                        ; jmpq          29009 <_sk_gradient_hsw_lowp+0x24e>
   DB  76,139,64,8                         ; mov           0x8(%rax),%r8
   DB  76,139,72,16                        ; mov           0x10(%rax),%r9
   DB  197,229,118,219                     ; vpcmpeqd      %ymm3,%ymm3,%ymm3
@@ -39356,8 +39096,8 @@
   DB  196,98,117,168,12,36                ; vfmadd213ps   (%rsp),%ymm1,%ymm9
   DB  196,98,117,168,222                  ; vfmadd213ps   %ymm6,%ymm1,%ymm11
   DB  196,226,117,184,124,36,32           ; vfmadd231ps   0x20(%rsp),%ymm1,%ymm7
-  DB  196,226,125,24,5,139,158,0,0        ; vbroadcastss  0x9e8b(%rip),%ymm0        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
-  DB  196,226,125,24,13,82,158,0,0        ; vbroadcastss  0x9e52(%rip),%ymm1        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,226,125,24,5,139,158,0,0        ; vbroadcastss  0x9e8b(%rip),%ymm0        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  196,226,125,24,13,82,158,0,0        ; vbroadcastss  0x9e52(%rip),%ymm1        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,226,125,168,217                 ; vfmadd213ps   %ymm1,%ymm0,%ymm3
   DB  196,226,125,168,209                 ; vfmadd213ps   %ymm1,%ymm0,%ymm2
   DB  196,98,125,168,201                  ; vfmadd213ps   %ymm1,%ymm0,%ymm9
@@ -39367,7 +39107,7 @@
   DB  196,226,125,168,249                 ; vfmadd213ps   %ymm1,%ymm0,%ymm7
   DB  196,98,125,168,225                  ; vfmadd213ps   %ymm1,%ymm0,%ymm12
   DB  197,254,91,194                      ; vcvttps2dq    %ymm2,%ymm0
-  DB  197,253,111,37,182,166,0,0          ; vmovdqa       0xa6b6(%rip),%ymm4        # 33d60 <_sk_srcover_bgra_8888_sse2_lowp+0xb44>
+  DB  197,253,111,37,194,166,0,0          ; vmovdqa       0xa6c2(%rip),%ymm4        # 33740 <_sk_srcover_bgra_8888_sse2_lowp+0xb50>
   DB  196,226,125,0,196                   ; vpshufb       %ymm4,%ymm0,%ymm0
   DB  196,227,253,0,192,232               ; vpermq        $0xe8,%ymm0,%ymm0
   DB  197,254,91,203                      ; vcvttps2dq    %ymm3,%ymm1
@@ -39414,9 +39154,9 @@
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  77,137,193                          ; mov           %r8,%r9
   DB  73,255,201                          ; dec           %r9
-  DB  120,7                               ; js            297a9 <_sk_evenly_spaced_gradient_hsw_lowp+0x3f>
+  DB  120,7                               ; js            2917d <_sk_evenly_spaced_gradient_hsw_lowp+0x3f>
   DB  196,193,234,42,209                  ; vcvtsi2ss     %r9,%xmm2,%xmm2
-  DB  235,22                              ; jmp           297bf <_sk_evenly_spaced_gradient_hsw_lowp+0x55>
+  DB  235,22                              ; jmp           29193 <_sk_evenly_spaced_gradient_hsw_lowp+0x55>
   DB  77,137,202                          ; mov           %r9,%r10
   DB  73,209,234                          ; shr           %r10
   DB  65,131,225,1                        ; and           $0x1,%r9d
@@ -39429,7 +39169,7 @@
   DB  197,126,91,242                      ; vcvttps2dq    %ymm2,%ymm14
   DB  197,254,91,251                      ; vcvttps2dq    %ymm3,%ymm7
   DB  73,131,248,8                        ; cmp           $0x8,%r8
-  DB  15,135,179,0,0,0                    ; ja            29891 <_sk_evenly_spaced_gradient_hsw_lowp+0x127>
+  DB  15,135,179,0,0,0                    ; ja            29265 <_sk_evenly_spaced_gradient_hsw_lowp+0x127>
   DB  76,139,64,8                         ; mov           0x8(%rax),%r8
   DB  76,139,72,16                        ; mov           0x10(%rax),%r9
   DB  196,193,124,16,24                   ; vmovups       (%r8),%ymm3
@@ -39466,7 +39206,7 @@
   DB  197,124,16,56                       ; vmovups       (%rax),%ymm15
   DB  196,66,69,22,231                    ; vpermps       %ymm15,%ymm7,%ymm12
   DB  196,194,13,22,255                   ; vpermps       %ymm15,%ymm14,%ymm7
-  DB  233,32,1,0,0                        ; jmpq          299b1 <_sk_evenly_spaced_gradient_hsw_lowp+0x247>
+  DB  233,32,1,0,0                        ; jmpq          29385 <_sk_evenly_spaced_gradient_hsw_lowp+0x247>
   DB  76,139,64,8                         ; mov           0x8(%rax),%r8
   DB  76,139,72,16                        ; mov           0x10(%rax),%r9
   DB  197,236,87,210                      ; vxorps        %ymm2,%ymm2,%ymm2
@@ -39535,8 +39275,8 @@
   DB  196,98,117,168,12,36                ; vfmadd213ps   (%rsp),%ymm1,%ymm9
   DB  196,98,117,168,222                  ; vfmadd213ps   %ymm6,%ymm1,%ymm11
   DB  196,226,117,184,124,36,32           ; vfmadd231ps   0x20(%rsp),%ymm1,%ymm7
-  DB  196,226,125,24,5,15,155,0,0         ; vbroadcastss  0x9b0f(%rip),%ymm0        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
-  DB  196,226,125,24,13,214,154,0,0       ; vbroadcastss  0x9ad6(%rip),%ymm1        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,226,125,24,5,15,155,0,0         ; vbroadcastss  0x9b0f(%rip),%ymm0        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  196,226,125,24,13,214,154,0,0       ; vbroadcastss  0x9ad6(%rip),%ymm1        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,226,125,168,217                 ; vfmadd213ps   %ymm1,%ymm0,%ymm3
   DB  196,226,125,168,209                 ; vfmadd213ps   %ymm1,%ymm0,%ymm2
   DB  196,98,125,168,201                  ; vfmadd213ps   %ymm1,%ymm0,%ymm9
@@ -39546,7 +39286,7 @@
   DB  196,226,125,168,249                 ; vfmadd213ps   %ymm1,%ymm0,%ymm7
   DB  196,98,125,168,225                  ; vfmadd213ps   %ymm1,%ymm0,%ymm12
   DB  197,254,91,194                      ; vcvttps2dq    %ymm2,%ymm0
-  DB  197,253,111,37,90,163,0,0           ; vmovdqa       0xa35a(%rip),%ymm4        # 33d80 <_sk_srcover_bgra_8888_sse2_lowp+0xb64>
+  DB  197,253,111,37,102,163,0,0          ; vmovdqa       0xa366(%rip),%ymm4        # 33760 <_sk_srcover_bgra_8888_sse2_lowp+0xb70>
   DB  196,226,125,0,196                   ; vpshufb       %ymm4,%ymm0,%ymm0
   DB  196,227,253,0,192,232               ; vpermq        $0xe8,%ymm0,%ymm0
   DB  197,254,91,203                      ; vcvttps2dq    %ymm3,%ymm1
@@ -39590,12 +39330,12 @@
   DB  197,124,40,194                      ; vmovaps       %ymm2,%ymm8
   DB  196,98,125,168,195                  ; vfmadd213ps   %ymm3,%ymm0,%ymm8
   DB  196,226,117,168,211                 ; vfmadd213ps   %ymm3,%ymm1,%ymm2
-  DB  196,226,125,24,29,238,153,0,0       ; vbroadcastss  0x99ee(%rip),%ymm3        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
-  DB  196,98,125,24,29,181,153,0,0        ; vbroadcastss  0x99b5(%rip),%ymm11        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,226,125,24,29,238,153,0,0       ; vbroadcastss  0x99ee(%rip),%ymm3        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  196,98,125,24,29,181,153,0,0        ; vbroadcastss  0x99b5(%rip),%ymm11        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  196,194,101,168,211                 ; vfmadd213ps   %ymm11,%ymm3,%ymm2
   DB  196,66,101,168,195                  ; vfmadd213ps   %ymm11,%ymm3,%ymm8
   DB  196,65,126,91,192                   ; vcvttps2dq    %ymm8,%ymm8
-  DB  197,125,111,21,118,162,0,0          ; vmovdqa       0xa276(%rip),%ymm10        # 33da0 <_sk_srcover_bgra_8888_sse2_lowp+0xb84>
+  DB  197,125,111,21,130,162,0,0          ; vmovdqa       0xa282(%rip),%ymm10        # 33780 <_sk_srcover_bgra_8888_sse2_lowp+0xb90>
   DB  196,66,61,0,194                     ; vpshufb       %ymm10,%ymm8,%ymm8
   DB  196,67,253,0,192,232                ; vpermq        $0xe8,%ymm8,%ymm8
   DB  197,254,91,210                      ; vcvttps2dq    %ymm2,%ymm2
@@ -39658,7 +39398,7 @@
   DB  197,252,40,227                      ; vmovaps       %ymm3,%ymm4
   DB  197,252,40,217                      ; vmovaps       %ymm1,%ymm3
   DB  197,252,40,200                      ; vmovaps       %ymm0,%ymm1
-  DB  196,98,125,24,5,249,153,0,0         ; vbroadcastss  0x99f9(%rip),%ymm8        # 33650 <_sk_srcover_bgra_8888_sse2_lowp+0x434>
+  DB  196,98,125,24,5,249,153,0,0         ; vbroadcastss  0x99f9(%rip),%ymm8        # 33024 <_sk_srcover_bgra_8888_sse2_lowp+0x434>
   DB  196,65,116,84,200                   ; vandps        %ymm8,%ymm1,%ymm9
   DB  196,65,100,84,208                   ; vandps        %ymm8,%ymm3,%ymm10
   DB  196,65,108,84,216                   ; vandps        %ymm8,%ymm2,%ymm11
@@ -39672,20 +39412,20 @@
   DB  196,67,45,74,192,192                ; vblendvps     %ymm12,%ymm8,%ymm10,%ymm8
   DB  196,65,4,94,192                     ; vdivps        %ymm8,%ymm15,%ymm8
   DB  196,65,60,89,208                    ; vmulps        %ymm8,%ymm8,%ymm10
-  DB  196,98,125,24,29,81,153,0,0         ; vbroadcastss  0x9951(%rip),%ymm11        # 335f8 <_sk_srcover_bgra_8888_sse2_lowp+0x3dc>
-  DB  196,98,125,24,53,76,153,0,0         ; vbroadcastss  0x994c(%rip),%ymm14        # 335fc <_sk_srcover_bgra_8888_sse2_lowp+0x3e0>
+  DB  196,98,125,24,29,81,153,0,0         ; vbroadcastss  0x9951(%rip),%ymm11        # 32fcc <_sk_srcover_bgra_8888_sse2_lowp+0x3dc>
+  DB  196,98,125,24,53,76,153,0,0         ; vbroadcastss  0x994c(%rip),%ymm14        # 32fd0 <_sk_srcover_bgra_8888_sse2_lowp+0x3e0>
   DB  196,65,124,40,251                   ; vmovaps       %ymm11,%ymm15
   DB  196,66,45,168,254                   ; vfmadd213ps   %ymm14,%ymm10,%ymm15
   DB  196,193,52,89,193                   ; vmulps        %ymm9,%ymm9,%ymm0
   DB  196,66,125,168,222                  ; vfmadd213ps   %ymm14,%ymm0,%ymm11
-  DB  196,98,125,24,53,51,153,0,0         ; vbroadcastss  0x9933(%rip),%ymm14        # 33600 <_sk_srcover_bgra_8888_sse2_lowp+0x3e4>
+  DB  196,98,125,24,53,51,153,0,0         ; vbroadcastss  0x9933(%rip),%ymm14        # 32fd4 <_sk_srcover_bgra_8888_sse2_lowp+0x3e4>
   DB  196,66,125,168,222                  ; vfmadd213ps   %ymm14,%ymm0,%ymm11
   DB  196,66,45,168,254                   ; vfmadd213ps   %ymm14,%ymm10,%ymm15
-  DB  196,98,125,24,53,36,153,0,0         ; vbroadcastss  0x9924(%rip),%ymm14        # 33604 <_sk_srcover_bgra_8888_sse2_lowp+0x3e8>
+  DB  196,98,125,24,53,36,153,0,0         ; vbroadcastss  0x9924(%rip),%ymm14        # 32fd8 <_sk_srcover_bgra_8888_sse2_lowp+0x3e8>
   DB  196,66,45,168,254                   ; vfmadd213ps   %ymm14,%ymm10,%ymm15
   DB  196,66,125,168,222                  ; vfmadd213ps   %ymm14,%ymm0,%ymm11
   DB  196,193,52,89,195                   ; vmulps        %ymm11,%ymm9,%ymm0
-  DB  196,98,125,24,13,16,153,0,0         ; vbroadcastss  0x9910(%rip),%ymm9        # 33608 <_sk_srcover_bgra_8888_sse2_lowp+0x3ec>
+  DB  196,98,125,24,13,16,153,0,0         ; vbroadcastss  0x9910(%rip),%ymm9        # 32fdc <_sk_srcover_bgra_8888_sse2_lowp+0x3ec>
   DB  197,52,92,208                       ; vsubps        %ymm0,%ymm9,%ymm10
   DB  196,195,125,74,194,208              ; vblendvps     %ymm13,%ymm10,%ymm0,%ymm0
   DB  196,65,60,89,199                    ; vmulps        %ymm15,%ymm8,%ymm8
@@ -39693,14 +39433,14 @@
   DB  196,67,61,74,193,192                ; vblendvps     %ymm12,%ymm9,%ymm8,%ymm8
   DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
   DB  196,193,116,194,201,1               ; vcmpltps      %ymm9,%ymm1,%ymm1
-  DB  196,98,125,24,21,162,151,0,0        ; vbroadcastss  0x97a2(%rip),%ymm10        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  196,98,125,24,21,162,151,0,0        ; vbroadcastss  0x97a2(%rip),%ymm10        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  197,44,92,216                       ; vsubps        %ymm0,%ymm10,%ymm11
   DB  196,195,125,74,195,16               ; vblendvps     %ymm1,%ymm11,%ymm0,%ymm0
   DB  196,193,100,194,201,1               ; vcmpltps      %ymm9,%ymm3,%ymm1
   DB  196,193,44,92,216                   ; vsubps        %ymm8,%ymm10,%ymm3
   DB  196,227,61,74,203,16                ; vblendvps     %ymm1,%ymm3,%ymm8,%ymm1
   DB  196,193,108,194,217,1               ; vcmpltps      %ymm9,%ymm2,%ymm3
-  DB  196,98,125,24,5,124,151,0,0         ; vbroadcastss  0x977c(%rip),%ymm8        # 334cc <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
+  DB  196,98,125,24,5,124,151,0,0         ; vbroadcastss  0x977c(%rip),%ymm8        # 32ea0 <_sk_srcover_bgra_8888_sse2_lowp+0x2b0>
   DB  197,60,92,208                       ; vsubps        %ymm0,%ymm8,%ymm10
   DB  196,195,125,74,194,48               ; vblendvps     %ymm3,%ymm10,%ymm0,%ymm0
   DB  196,193,92,194,217,1                ; vcmpltps      %ymm9,%ymm4,%ymm3
@@ -39743,9 +39483,9 @@
   DB  65,254,202                          ; dec           %r10b
   DB  69,15,182,194                       ; movzbl        %r10b,%r8d
   DB  65,128,248,14                       ; cmp           $0xe,%r8b
-  DB  119,51                              ; ja            29e17 <_sk_srcover_rgba_8888_hsw_lowp+0x5c>
+  DB  119,51                              ; ja            297eb <_sk_srcover_rgba_8888_hsw_lowp+0x5c>
   DB  197,221,239,228                     ; vpxor         %ymm4,%ymm4,%ymm4
-  DB  76,141,29,237,2,0,0                 ; lea           0x2ed(%rip),%r11        # 2a0dc <_sk_srcover_rgba_8888_hsw_lowp+0x321>
+  DB  76,141,29,237,2,0,0                 ; lea           0x2ed(%rip),%r11        # 29ab0 <_sk_srcover_rgba_8888_hsw_lowp+0x321>
   DB  75,99,4,131                         ; movslq        (%r11,%r8,4),%rax
   DB  76,1,216                            ; add           %r11,%rax
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -39755,10 +39495,10 @@
   DB  255,224                             ; jmpq          *%rax
   DB  196,193,121,110,41                  ; vmovd         (%r9),%xmm5
   DB  197,221,239,228                     ; vpxor         %ymm4,%ymm4,%ymm4
-  DB  233,22,1,0,0                        ; jmpq          29f2d <_sk_srcover_rgba_8888_hsw_lowp+0x172>
+  DB  233,22,1,0,0                        ; jmpq          29901 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
   DB  196,193,126,111,41                  ; vmovdqu       (%r9),%ymm5
   DB  196,193,126,111,97,32               ; vmovdqu       0x20(%r9),%ymm4
-  DB  233,6,1,0,0                         ; jmpq          29f2d <_sk_srcover_rgba_8888_hsw_lowp+0x172>
+  DB  233,6,1,0,0                         ; jmpq          29901 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
   DB  196,193,121,110,97,8                ; vmovd         0x8(%r9),%xmm4
   DB  196,226,121,89,228                  ; vpbroadcastq  %xmm4,%xmm4
   DB  197,197,239,255                     ; vpxor         %ymm7,%ymm7,%ymm7
@@ -39767,7 +39507,7 @@
   DB  197,249,112,237,232                 ; vpshufd       $0xe8,%xmm5,%xmm5
   DB  196,227,93,2,237,3                  ; vpblendd      $0x3,%ymm5,%ymm4,%ymm5
   DB  197,253,111,231                     ; vmovdqa       %ymm7,%ymm4
-  DB  233,216,0,0,0                       ; jmpq          29f2d <_sk_srcover_rgba_8888_hsw_lowp+0x172>
+  DB  233,216,0,0,0                       ; jmpq          29901 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
   DB  196,193,121,110,97,24               ; vmovd         0x18(%r9),%xmm4
   DB  196,226,125,89,228                  ; vpbroadcastq  %xmm4,%ymm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -39783,7 +39523,7 @@
   DB  196,193,122,111,41                  ; vmovdqu       (%r9),%xmm5
   DB  196,227,85,2,236,240                ; vpblendd      $0xf0,%ymm4,%ymm5,%ymm5
   DB  197,125,127,196                     ; vmovdqa       %ymm8,%ymm4
-  DB  233,129,0,0,0                       ; jmpq          29f2d <_sk_srcover_rgba_8888_hsw_lowp+0x172>
+  DB  233,129,0,0,0                       ; jmpq          29901 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
   DB  196,193,121,110,97,40               ; vmovd         0x28(%r9),%xmm4
   DB  196,226,121,89,228                  ; vpbroadcastq  %xmm4,%xmm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -39793,7 +39533,7 @@
   DB  196,193,121,110,105,32              ; vmovd         0x20(%r9),%xmm5
   DB  196,227,93,2,229,1                  ; vpblendd      $0x1,%ymm5,%ymm4,%ymm4
   DB  196,193,126,111,41                  ; vmovdqu       (%r9),%ymm5
-  DB  235,76                              ; jmp           29f2d <_sk_srcover_rgba_8888_hsw_lowp+0x172>
+  DB  235,76                              ; jmp           29901 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
   DB  196,193,121,110,97,56               ; vmovd         0x38(%r9),%xmm4
   DB  196,226,125,89,228                  ; vpbroadcastq  %xmm4,%ymm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -39813,9 +39553,9 @@
   DB  196,227,69,14,236,170               ; vpblendw      $0xaa,%ymm4,%ymm7,%ymm5
   DB  196,227,77,14,228,170               ; vpblendw      $0xaa,%ymm4,%ymm6,%ymm4
   DB  196,226,93,43,237                   ; vpackusdw     %ymm5,%ymm4,%ymm5
-  DB  197,125,111,5,106,158,0,0           ; vmovdqa       0x9e6a(%rip),%ymm8        # 33dc0 <_sk_srcover_bgra_8888_sse2_lowp+0xba4>
+  DB  197,125,111,5,118,158,0,0           ; vmovdqa       0x9e76(%rip),%ymm8        # 337a0 <_sk_srcover_bgra_8888_sse2_lowp+0xbb0>
   DB  196,193,85,219,224                  ; vpand         %ymm8,%ymm5,%ymm4
-  DB  196,98,125,121,13,124,158,0,0       ; vpbroadcastw  0x9e7c(%rip),%ymm9        # 33de0 <_sk_srcover_bgra_8888_sse2_lowp+0xbc4>
+  DB  196,98,125,121,13,136,158,0,0       ; vpbroadcastw  0x9e88(%rip),%ymm9        # 337c0 <_sk_srcover_bgra_8888_sse2_lowp+0xbd0>
   DB  197,213,113,213,8                   ; vpsrlw        $0x8,%ymm5,%ymm5
   DB  197,197,114,215,16                  ; vpsrld        $0x10,%ymm7,%ymm7
   DB  197,205,114,214,16                  ; vpsrld        $0x10,%ymm6,%ymm6
@@ -39854,19 +39594,19 @@
   DB  196,193,53,114,243,16               ; vpslld        $0x10,%ymm11,%ymm9
   DB  196,65,53,235,202                   ; vpor          %ymm10,%ymm9,%ymm9
   DB  65,128,250,14                       ; cmp           $0xe,%r10b
-  DB  119,26                              ; ja            2a03e <_sk_srcover_rgba_8888_hsw_lowp+0x283>
-  DB  76,141,21,237,0,0,0                 ; lea           0xed(%rip),%r10        # 2a118 <_sk_srcover_rgba_8888_hsw_lowp+0x35d>
+  DB  119,26                              ; ja            29a12 <_sk_srcover_rgba_8888_hsw_lowp+0x283>
+  DB  76,141,21,237,0,0,0                 ; lea           0xed(%rip),%r10        # 29aec <_sk_srcover_rgba_8888_hsw_lowp+0x35d>
   DB  75,99,4,130                         ; movslq        (%r10,%r8,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,65,121,126,1                    ; vmovd         %xmm8,(%r9)
-  DB  233,151,0,0,0                       ; jmpq          2a0d5 <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
+  DB  233,151,0,0,0                       ; jmpq          29aa9 <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
   DB  196,65,126,127,1                    ; vmovdqu       %ymm8,(%r9)
   DB  196,65,126,127,73,32                ; vmovdqu       %ymm9,0x20(%r9)
-  DB  233,135,0,0,0                       ; jmpq          2a0d5 <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
+  DB  233,135,0,0,0                       ; jmpq          29aa9 <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
   DB  196,67,121,22,65,8,2                ; vpextrd       $0x2,%xmm8,0x8(%r9)
   DB  196,65,121,214,1                    ; vmovq         %xmm8,(%r9)
-  DB  235,121                             ; jmp           2a0d5 <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
+  DB  235,121                             ; jmp           29aa9 <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,67,121,22,73,24,2               ; vpextrd       $0x2,%xmm9,0x18(%r9)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
@@ -39874,12 +39614,12 @@
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,65,121,126,73,16                ; vmovd         %xmm9,0x10(%r9)
   DB  196,65,122,127,1                    ; vmovdqu       %xmm8,(%r9)
-  DB  235,76                              ; jmp           2a0d5 <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
+  DB  235,76                              ; jmp           29aa9 <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
   DB  196,67,121,22,73,40,2               ; vpextrd       $0x2,%xmm9,0x28(%r9)
   DB  196,67,121,22,73,36,1               ; vpextrd       $0x1,%xmm9,0x24(%r9)
   DB  196,65,121,126,73,32                ; vmovd         %xmm9,0x20(%r9)
   DB  196,65,126,127,1                    ; vmovdqu       %ymm8,(%r9)
-  DB  235,49                              ; jmp           2a0d5 <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
+  DB  235,49                              ; jmp           29aa9 <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
   DB  196,67,125,57,202,1                 ; vextracti128  $0x1,%ymm9,%xmm10
   DB  196,67,121,22,81,56,2               ; vpextrd       $0x2,%xmm10,0x38(%r9)
   DB  196,67,125,57,202,1                 ; vextracti128  $0x1,%ymm9,%xmm10
@@ -39918,10 +39658,10 @@
   DB  255                                 ; (bad)
   DB  255,64,254                          ; incl          -0x2(%rax)
   DB  255                                 ; (bad)
-  DB  255,45,254,255,255,26               ; ljmp          *0x1afffffe(%rip)        # 1b02a10f <_sk_srcover_bgra_8888_sse2_lowp+0x1aff6ef3>
+  DB  255,45,254,255,255,26               ; ljmp          *0x1afffffe(%rip)        # 1b029ae3 <_sk_srcover_bgra_8888_sse2_lowp+0x1aff6ef3>
   DB  254                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,5,254,255,255,28                ; incl          0x1cfffffe(%rip)        # 1d02a117 <_sk_srcover_bgra_8888_sse2_lowp+0x1cff6efb>
+  DB  255,5,254,255,255,28                ; incl          0x1cfffffe(%rip)        # 1d029aeb <_sk_srcover_bgra_8888_sse2_lowp+0x1cff6efb>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
@@ -39939,7 +39679,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  120,255                             ; js            2a13d <_sk_srcover_rgba_8888_hsw_lowp+0x382>
+  DB  120,255                             ; js            29b11 <_sk_srcover_rgba_8888_hsw_lowp+0x382>
   DB  255                                 ; (bad)
   DB  255,113,255                         ; pushq         -0x1(%rcx)
   DB  255                                 ; (bad)
@@ -39964,9 +39704,9 @@
   DB  65,254,202                          ; dec           %r10b
   DB  69,15,182,194                       ; movzbl        %r10b,%r8d
   DB  65,128,248,14                       ; cmp           $0xe,%r8b
-  DB  119,51                              ; ja            2a1b0 <_sk_srcover_bgra_8888_hsw_lowp+0x5c>
+  DB  119,51                              ; ja            29b84 <_sk_srcover_bgra_8888_hsw_lowp+0x5c>
   DB  197,221,239,228                     ; vpxor         %ymm4,%ymm4,%ymm4
-  DB  76,141,29,236,2,0,0                 ; lea           0x2ec(%rip),%r11        # 2a474 <_sk_srcover_bgra_8888_hsw_lowp+0x320>
+  DB  76,141,29,236,2,0,0                 ; lea           0x2ec(%rip),%r11        # 29e48 <_sk_srcover_bgra_8888_hsw_lowp+0x320>
   DB  75,99,4,131                         ; movslq        (%r11,%r8,4),%rax
   DB  76,1,216                            ; add           %r11,%rax
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -39976,10 +39716,10 @@
   DB  255,224                             ; jmpq          *%rax
   DB  196,193,121,110,41                  ; vmovd         (%r9),%xmm5
   DB  197,221,239,228                     ; vpxor         %ymm4,%ymm4,%ymm4
-  DB  233,22,1,0,0                        ; jmpq          2a2c6 <_sk_srcover_bgra_8888_hsw_lowp+0x172>
+  DB  233,22,1,0,0                        ; jmpq          29c9a <_sk_srcover_bgra_8888_hsw_lowp+0x172>
   DB  196,193,126,111,41                  ; vmovdqu       (%r9),%ymm5
   DB  196,193,126,111,97,32               ; vmovdqu       0x20(%r9),%ymm4
-  DB  233,6,1,0,0                         ; jmpq          2a2c6 <_sk_srcover_bgra_8888_hsw_lowp+0x172>
+  DB  233,6,1,0,0                         ; jmpq          29c9a <_sk_srcover_bgra_8888_hsw_lowp+0x172>
   DB  196,193,121,110,97,8                ; vmovd         0x8(%r9),%xmm4
   DB  196,226,121,89,228                  ; vpbroadcastq  %xmm4,%xmm4
   DB  197,197,239,255                     ; vpxor         %ymm7,%ymm7,%ymm7
@@ -39988,7 +39728,7 @@
   DB  197,249,112,237,232                 ; vpshufd       $0xe8,%xmm5,%xmm5
   DB  196,227,93,2,237,3                  ; vpblendd      $0x3,%ymm5,%ymm4,%ymm5
   DB  197,253,111,231                     ; vmovdqa       %ymm7,%ymm4
-  DB  233,216,0,0,0                       ; jmpq          2a2c6 <_sk_srcover_bgra_8888_hsw_lowp+0x172>
+  DB  233,216,0,0,0                       ; jmpq          29c9a <_sk_srcover_bgra_8888_hsw_lowp+0x172>
   DB  196,193,121,110,97,24               ; vmovd         0x18(%r9),%xmm4
   DB  196,226,125,89,228                  ; vpbroadcastq  %xmm4,%ymm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -40004,7 +39744,7 @@
   DB  196,193,122,111,41                  ; vmovdqu       (%r9),%xmm5
   DB  196,227,85,2,236,240                ; vpblendd      $0xf0,%ymm4,%ymm5,%ymm5
   DB  197,125,127,196                     ; vmovdqa       %ymm8,%ymm4
-  DB  233,129,0,0,0                       ; jmpq          2a2c6 <_sk_srcover_bgra_8888_hsw_lowp+0x172>
+  DB  233,129,0,0,0                       ; jmpq          29c9a <_sk_srcover_bgra_8888_hsw_lowp+0x172>
   DB  196,193,121,110,97,40               ; vmovd         0x28(%r9),%xmm4
   DB  196,226,121,89,228                  ; vpbroadcastq  %xmm4,%xmm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -40014,7 +39754,7 @@
   DB  196,193,121,110,105,32              ; vmovd         0x20(%r9),%xmm5
   DB  196,227,93,2,229,1                  ; vpblendd      $0x1,%ymm5,%ymm4,%ymm4
   DB  196,193,126,111,41                  ; vmovdqu       (%r9),%ymm5
-  DB  235,76                              ; jmp           2a2c6 <_sk_srcover_bgra_8888_hsw_lowp+0x172>
+  DB  235,76                              ; jmp           29c9a <_sk_srcover_bgra_8888_hsw_lowp+0x172>
   DB  196,193,121,110,97,56               ; vmovd         0x38(%r9),%xmm4
   DB  196,226,125,89,228                  ; vpbroadcastq  %xmm4,%ymm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -40034,9 +39774,9 @@
   DB  196,227,93,14,245,170               ; vpblendw      $0xaa,%ymm5,%ymm4,%ymm6
   DB  196,227,69,14,237,170               ; vpblendw      $0xaa,%ymm5,%ymm7,%ymm5
   DB  196,226,85,43,238                   ; vpackusdw     %ymm6,%ymm5,%ymm5
-  DB  197,125,111,5,17,155,0,0            ; vmovdqa       0x9b11(%rip),%ymm8        # 33e00 <_sk_srcover_bgra_8888_sse2_lowp+0xbe4>
+  DB  197,125,111,5,29,155,0,0            ; vmovdqa       0x9b1d(%rip),%ymm8        # 337e0 <_sk_srcover_bgra_8888_sse2_lowp+0xbf0>
   DB  196,193,85,219,240                  ; vpand         %ymm8,%ymm5,%ymm6
-  DB  196,98,125,121,13,35,155,0,0        ; vpbroadcastw  0x9b23(%rip),%ymm9        # 33e20 <_sk_srcover_bgra_8888_sse2_lowp+0xc04>
+  DB  196,98,125,121,13,47,155,0,0        ; vpbroadcastw  0x9b2f(%rip),%ymm9        # 33800 <_sk_srcover_bgra_8888_sse2_lowp+0xc10>
   DB  197,213,113,213,8                   ; vpsrlw        $0x8,%ymm5,%ymm5
   DB  197,221,114,212,16                  ; vpsrld        $0x10,%ymm4,%ymm4
   DB  197,197,114,215,16                  ; vpsrld        $0x10,%ymm7,%ymm7
@@ -40075,19 +39815,19 @@
   DB  196,193,53,114,243,16               ; vpslld        $0x10,%ymm11,%ymm9
   DB  196,65,53,235,202                   ; vpor          %ymm10,%ymm9,%ymm9
   DB  65,128,250,14                       ; cmp           $0xe,%r10b
-  DB  119,26                              ; ja            2a3d7 <_sk_srcover_bgra_8888_hsw_lowp+0x283>
-  DB  76,141,21,236,0,0,0                 ; lea           0xec(%rip),%r10        # 2a4b0 <_sk_srcover_bgra_8888_hsw_lowp+0x35c>
+  DB  119,26                              ; ja            29dab <_sk_srcover_bgra_8888_hsw_lowp+0x283>
+  DB  76,141,21,236,0,0,0                 ; lea           0xec(%rip),%r10        # 29e84 <_sk_srcover_bgra_8888_hsw_lowp+0x35c>
   DB  75,99,4,130                         ; movslq        (%r10,%r8,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,65,121,126,1                    ; vmovd         %xmm8,(%r9)
-  DB  233,151,0,0,0                       ; jmpq          2a46e <_sk_srcover_bgra_8888_hsw_lowp+0x31a>
+  DB  233,151,0,0,0                       ; jmpq          29e42 <_sk_srcover_bgra_8888_hsw_lowp+0x31a>
   DB  196,65,126,127,1                    ; vmovdqu       %ymm8,(%r9)
   DB  196,65,126,127,73,32                ; vmovdqu       %ymm9,0x20(%r9)
-  DB  233,135,0,0,0                       ; jmpq          2a46e <_sk_srcover_bgra_8888_hsw_lowp+0x31a>
+  DB  233,135,0,0,0                       ; jmpq          29e42 <_sk_srcover_bgra_8888_hsw_lowp+0x31a>
   DB  196,67,121,22,65,8,2                ; vpextrd       $0x2,%xmm8,0x8(%r9)
   DB  196,65,121,214,1                    ; vmovq         %xmm8,(%r9)
-  DB  235,121                             ; jmp           2a46e <_sk_srcover_bgra_8888_hsw_lowp+0x31a>
+  DB  235,121                             ; jmp           29e42 <_sk_srcover_bgra_8888_hsw_lowp+0x31a>
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,67,121,22,73,24,2               ; vpextrd       $0x2,%xmm9,0x18(%r9)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
@@ -40095,12 +39835,12 @@
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,65,121,126,73,16                ; vmovd         %xmm9,0x10(%r9)
   DB  196,65,122,127,1                    ; vmovdqu       %xmm8,(%r9)
-  DB  235,76                              ; jmp           2a46e <_sk_srcover_bgra_8888_hsw_lowp+0x31a>
+  DB  235,76                              ; jmp           29e42 <_sk_srcover_bgra_8888_hsw_lowp+0x31a>
   DB  196,67,121,22,73,40,2               ; vpextrd       $0x2,%xmm9,0x28(%r9)
   DB  196,67,121,22,73,36,1               ; vpextrd       $0x1,%xmm9,0x24(%r9)
   DB  196,65,121,126,73,32                ; vmovd         %xmm9,0x20(%r9)
   DB  196,65,126,127,1                    ; vmovdqu       %ymm8,(%r9)
-  DB  235,49                              ; jmp           2a46e <_sk_srcover_bgra_8888_hsw_lowp+0x31a>
+  DB  235,49                              ; jmp           29e42 <_sk_srcover_bgra_8888_hsw_lowp+0x31a>
   DB  196,67,125,57,202,1                 ; vextracti128  $0x1,%ymm9,%xmm10
   DB  196,67,121,22,81,56,2               ; vpextrd       $0x2,%xmm10,0x38(%r9)
   DB  196,67,125,57,202,1                 ; vextracti128  $0x1,%ymm9,%xmm10
@@ -40148,7 +39888,7 @@
   DB  255,6                               ; incl          (%rsi)
   DB  254                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,29,255,255,255,62               ; lcall         *0x3effffff(%rip)        # 3f02a4b4 <_sk_srcover_bgra_8888_sse2_lowp+0x3eff7298>
+  DB  255,29,255,255,255,62               ; lcall         *0x3effffff(%rip)        # 3f029e88 <_sk_srcover_bgra_8888_sse2_lowp+0x3eff7298>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,55                              ; pushq         (%rdi)
@@ -40166,7 +39906,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  121,255                             ; jns           2a4d5 <_sk_srcover_bgra_8888_hsw_lowp+0x381>
+  DB  121,255                             ; jns           29ea9 <_sk_srcover_bgra_8888_hsw_lowp+0x381>
   DB  255                                 ; (bad)
   DB  255,114,255                         ; pushq         -0x1(%rdx)
   DB  255                                 ; (bad)
@@ -40209,13 +39949,13 @@
   DB  73,137,246                          ; mov           %rsi,%r14
   DB  76,137,141,8,255,255,255            ; mov           %r9,-0xf8(%rbp)
   DB  76,57,203                           ; cmp           %r9,%rbx
-  DB  15,131,153,0,0,0                    ; jae           2a606 <_sk_start_pipeline_sse41_lowp+0x11a>
+  DB  15,131,153,0,0,0                    ; jae           29fda <_sk_start_pipeline_sse41_lowp+0x11a>
   DB  72,139,133,24,255,255,255           ; mov           -0xe8(%rbp),%rax
   DB  72,141,64,8                         ; lea           0x8(%rax),%rax
   DB  72,137,133,16,255,255,255           ; mov           %rax,-0xf0(%rbp)
   DB  76,57,189,16,255,255,255            ; cmp           %r15,-0xf0(%rbp)
   DB  72,139,149,24,255,255,255           ; mov           -0xe8(%rbp),%rdx
-  DB  119,62                              ; ja            2a5cd <_sk_start_pipeline_sse41_lowp+0xe1>
+  DB  119,62                              ; ja            29fa1 <_sk_start_pipeline_sse41_lowp+0xe1>
   DB  76,139,165,24,255,255,255           ; mov           -0xe8(%rbp),%r12
   DB  49,255                              ; xor           %edi,%edi
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
@@ -40234,10 +39974,10 @@
   DB  73,131,196,16                       ; add           $0x10,%r12
   DB  77,57,252                           ; cmp           %r15,%r12
   DB  73,137,212                          ; mov           %rdx,%r12
-  DB  118,201                             ; jbe           2a596 <_sk_start_pipeline_sse41_lowp+0xaa>
+  DB  118,201                             ; jbe           29f6a <_sk_start_pipeline_sse41_lowp+0xaa>
   DB  76,137,255                          ; mov           %r15,%rdi
   DB  72,41,215                           ; sub           %rdx,%rdi
-  DB  116,33                              ; je            2a5f6 <_sk_start_pipeline_sse41_lowp+0x10a>
+  DB  116,33                              ; je            29fca <_sk_start_pipeline_sse41_lowp+0x10a>
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  15,87,201                           ; xorps         %xmm1,%xmm1
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
@@ -40251,7 +39991,7 @@
   DB  65,255,213                          ; callq         *%r13
   DB  72,255,195                          ; inc           %rbx
   DB  72,59,157,8,255,255,255             ; cmp           -0xf8(%rbp),%rbx
-  DB  15,133,121,255,255,255              ; jne           2a57f <_sk_start_pipeline_sse41_lowp+0x93>
+  DB  15,133,121,255,255,255              ; jne           29f53 <_sk_start_pipeline_sse41_lowp+0x93>
   DB  15,40,181,32,255,255,255            ; movaps        -0xe0(%rbp),%xmm6
   DB  15,40,189,48,255,255,255            ; movaps        -0xd0(%rbp),%xmm7
   DB  68,15,40,133,64,255,255,255         ; movaps        -0xc0(%rbp),%xmm8
@@ -40290,7 +40030,7 @@
   DB  102,15,110,209                      ; movd          %ecx,%xmm2
   DB  102,15,112,210,0                    ; pshufd        $0x0,%xmm2,%xmm2
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
-  DB  15,88,21,245,151,0,0                ; addps         0x97f5(%rip),%xmm2        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  15,88,21,1,152,0,0                  ; addps         0x9801(%rip),%xmm2        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,40,218                           ; movaps        %xmm2,%xmm3
   DB  255,224                             ; jmpq          *%rax
@@ -40455,7 +40195,7 @@
 PUBLIC _sk_black_color_sse41_lowp
 _sk_black_color_sse41_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,58,149,0,0                 ; movaps        0x953a(%rip),%xmm3        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  15,40,29,70,149,0,0                 ; movaps        0x9546(%rip),%xmm3        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  15,87,201                           ; xorps         %xmm1,%xmm1
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
@@ -40464,7 +40204,7 @@
 PUBLIC _sk_white_color_sse41_lowp
 _sk_white_color_sse41_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,5,38,149,0,0                  ; movaps        0x9526(%rip),%xmm0        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  15,40,5,50,149,0,0                  ; movaps        0x9532(%rip),%xmm0        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  15,40,216                           ; movaps        %xmm0,%xmm3
@@ -40473,10 +40213,10 @@
 PUBLIC _sk_set_rgb_sse41_lowp
 _sk_set_rgb_sse41_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  243,15,16,21,217,139,0,0            ; movss         0x8bd9(%rip),%xmm2        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  243,15,16,21,217,139,0,0            ; movss         0x8bd9(%rip),%xmm2        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   DB  243,15,16,0                         ; movss         (%rax),%xmm0
   DB  243,15,89,194                       ; mulss         %xmm2,%xmm0
-  DB  243,68,15,16,5,152,139,0,0          ; movss         0x8b98(%rip),%xmm8        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  243,68,15,16,5,152,139,0,0          ; movss         0x8b98(%rip),%xmm8        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  243,65,15,88,192                    ; addss         %xmm8,%xmm0
   DB  243,68,15,44,192                    ; cvttss2si     %xmm0,%r8d
   DB  102,65,15,110,192                   ; movd          %r8d,%xmm0
@@ -40517,7 +40257,7 @@
 PUBLIC _sk_premul_sse41_lowp
 _sk_premul_sse41_lowp LABEL PROC
   DB  102,15,213,195                      ; pmullw        %xmm3,%xmm0
-  DB  102,68,15,111,5,114,148,0,0         ; movdqa        0x9472(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,5,126,148,0,0         ; movdqa        0x947e(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,192                   ; paddw         %xmm8,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,15,213,203                      ; pmullw        %xmm3,%xmm1
@@ -40532,7 +40272,7 @@
 PUBLIC _sk_premul_dst_sse41_lowp
 _sk_premul_dst_sse41_lowp LABEL PROC
   DB  102,15,213,231                      ; pmullw        %xmm7,%xmm4
-  DB  102,68,15,111,5,59,148,0,0          ; movdqa        0x943b(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,5,71,148,0,0          ; movdqa        0x9447(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,224                   ; paddw         %xmm8,%xmm4
   DB  102,15,113,212,8                    ; psrlw         $0x8,%xmm4
   DB  102,15,213,239                      ; pmullw        %xmm7,%xmm5
@@ -40572,7 +40312,7 @@
 
 PUBLIC _sk_invert_sse41_lowp
 _sk_invert_sse41_lowp LABEL PROC
-  DB  102,68,15,111,5,217,147,0,0         ; movdqa        0x93d9(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,5,229,147,0,0         ; movdqa        0x93e5(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,69,15,111,200                   ; movdqa        %xmm8,%xmm9
   DB  102,68,15,249,200                   ; psubw         %xmm0,%xmm9
   DB  102,69,15,111,208                   ; movdqa        %xmm8,%xmm10
@@ -40600,7 +40340,7 @@
 _sk_srcatop_sse41_lowp LABEL PROC
   DB  102,68,15,111,195                   ; movdqa        %xmm3,%xmm8
   DB  102,15,213,199                      ; pmullw        %xmm7,%xmm0
-  DB  102,15,111,29,125,147,0,0           ; movdqa        0x937d(%rip),%xmm3        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,15,111,29,137,147,0,0           ; movdqa        0x9389(%rip),%xmm3        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,68,15,111,203                   ; movdqa        %xmm3,%xmm9
   DB  102,69,15,249,200                   ; psubw         %xmm8,%xmm9
   DB  102,69,15,111,193                   ; movdqa        %xmm9,%xmm8
@@ -40630,7 +40370,7 @@
 _sk_dstatop_sse41_lowp LABEL PROC
   DB  102,68,15,111,196                   ; movdqa        %xmm4,%xmm8
   DB  102,68,15,213,195                   ; pmullw        %xmm3,%xmm8
-  DB  102,68,15,111,13,253,146,0,0        ; movdqa        0x92fd(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,9,147,0,0          ; movdqa        0x9309(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,69,15,253,193                   ; paddw         %xmm9,%xmm8
   DB  102,68,15,111,213                   ; movdqa        %xmm5,%xmm10
   DB  102,68,15,213,211                   ; pmullw        %xmm3,%xmm10
@@ -40657,7 +40397,7 @@
 PUBLIC _sk_srcin_sse41_lowp
 _sk_srcin_sse41_lowp LABEL PROC
   DB  102,15,213,199                      ; pmullw        %xmm7,%xmm0
-  DB  102,68,15,111,5,136,146,0,0         ; movdqa        0x9288(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,5,148,146,0,0         ; movdqa        0x9294(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,192                   ; paddw         %xmm8,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,15,213,207                      ; pmullw        %xmm7,%xmm1
@@ -40676,7 +40416,7 @@
 _sk_dstin_sse41_lowp LABEL PROC
   DB  102,15,111,196                      ; movdqa        %xmm4,%xmm0
   DB  102,15,213,195                      ; pmullw        %xmm3,%xmm0
-  DB  102,68,15,111,5,63,146,0,0          ; movdqa        0x923f(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,5,75,146,0,0          ; movdqa        0x924b(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,192                   ; paddw         %xmm8,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,15,111,205                      ; movdqa        %xmm5,%xmm1
@@ -40695,7 +40435,7 @@
 
 PUBLIC _sk_srcout_sse41_lowp
 _sk_srcout_sse41_lowp LABEL PROC
-  DB  102,68,15,111,5,246,145,0,0         ; movdqa        0x91f6(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,5,2,146,0,0           ; movdqa        0x9202(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,69,15,111,200                   ; movdqa        %xmm8,%xmm9
   DB  102,68,15,249,207                   ; psubw         %xmm7,%xmm9
   DB  102,65,15,213,193                   ; pmullw        %xmm9,%xmm0
@@ -40716,7 +40456,7 @@
 PUBLIC _sk_dstout_sse41_lowp
 _sk_dstout_sse41_lowp LABEL PROC
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
-  DB  102,68,15,111,5,159,145,0,0         ; movdqa        0x919f(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,5,171,145,0,0         ; movdqa        0x91ab(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,111,216                   ; movdqa        %xmm8,%xmm3
   DB  102,15,249,216                      ; psubw         %xmm0,%xmm3
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
@@ -40739,7 +40479,7 @@
 
 PUBLIC _sk_srcover_sse41_lowp
 _sk_srcover_sse41_lowp LABEL PROC
-  DB  102,68,15,111,13,69,145,0,0         ; movdqa        0x9145(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,81,145,0,0         ; movdqa        0x9151(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,69,15,111,193                   ; movdqa        %xmm9,%xmm8
   DB  102,68,15,249,195                   ; psubw         %xmm3,%xmm8
   DB  102,69,15,111,208                   ; movdqa        %xmm8,%xmm10
@@ -40766,7 +40506,7 @@
 
 PUBLIC _sk_dstover_sse41_lowp
 _sk_dstover_sse41_lowp LABEL PROC
-  DB  102,68,15,111,5,203,144,0,0         ; movdqa        0x90cb(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,5,215,144,0,0         ; movdqa        0x90d7(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,69,15,111,200                   ; movdqa        %xmm8,%xmm9
   DB  102,68,15,249,207                   ; psubw         %xmm7,%xmm9
   DB  102,65,15,213,193                   ; pmullw        %xmm9,%xmm0
@@ -40791,7 +40531,7 @@
 PUBLIC _sk_modulate_sse41_lowp
 _sk_modulate_sse41_lowp LABEL PROC
   DB  102,15,213,196                      ; pmullw        %xmm4,%xmm0
-  DB  102,68,15,111,5,100,144,0,0         ; movdqa        0x9064(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,5,112,144,0,0         ; movdqa        0x9070(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,192                   ; paddw         %xmm8,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,15,213,205                      ; pmullw        %xmm5,%xmm1
@@ -40808,7 +40548,7 @@
 
 PUBLIC _sk_multiply_sse41_lowp
 _sk_multiply_sse41_lowp LABEL PROC
-  DB  102,68,15,111,13,35,144,0,0         ; movdqa        0x9023(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,47,144,0,0         ; movdqa        0x902f(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,69,15,111,193                   ; movdqa        %xmm9,%xmm8
   DB  102,68,15,249,195                   ; psubw         %xmm3,%xmm8
   DB  102,69,15,111,208                   ; movdqa        %xmm8,%xmm10
@@ -40849,7 +40589,7 @@
 PUBLIC _sk_plus__sse41_lowp
 _sk_plus__sse41_lowp LABEL PROC
   DB  102,15,253,196                      ; paddw         %xmm4,%xmm0
-  DB  102,68,15,111,5,104,143,0,0         ; movdqa        0x8f68(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,5,116,143,0,0         ; movdqa        0x8f74(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,56,58,192                 ; pminuw        %xmm8,%xmm0
   DB  102,15,253,205                      ; paddw         %xmm5,%xmm1
   DB  102,65,15,56,58,200                 ; pminuw        %xmm8,%xmm1
@@ -40867,7 +40607,7 @@
   DB  102,15,111,196                      ; movdqa        %xmm4,%xmm0
   DB  102,15,253,193                      ; paddw         %xmm1,%xmm0
   DB  102,15,213,204                      ; pmullw        %xmm4,%xmm1
-  DB  102,68,15,111,21,34,143,0,0         ; movdqa        0x8f22(%rip),%xmm10        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,21,46,143,0,0         ; movdqa        0x8f2e(%rip),%xmm10        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,202                   ; paddw         %xmm10,%xmm1
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
   DB  102,15,249,193                      ; psubw         %xmm1,%xmm0
@@ -40897,7 +40637,7 @@
 PUBLIC _sk_xor__sse41_lowp
 _sk_xor__sse41_lowp LABEL PROC
   DB  102,68,15,111,195                   ; movdqa        %xmm3,%xmm8
-  DB  102,68,15,111,13,160,142,0,0        ; movdqa        0x8ea0(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,172,142,0,0        ; movdqa        0x8eac(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,69,15,111,209                   ; movdqa        %xmm9,%xmm10
   DB  102,68,15,249,215                   ; psubw         %xmm7,%xmm10
   DB  102,65,15,213,194                   ; pmullw        %xmm10,%xmm0
@@ -40938,7 +40678,7 @@
   DB  102,68,15,213,207                   ; pmullw        %xmm7,%xmm9
   DB  102,15,213,203                      ; pmullw        %xmm3,%xmm1
   DB  102,65,15,56,62,201                 ; pmaxuw        %xmm9,%xmm1
-  DB  102,68,15,111,13,231,141,0,0        ; movdqa        0x8de7(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,243,141,0,0        ; movdqa        0x8df3(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,201                   ; paddw         %xmm9,%xmm1
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
   DB  102,15,249,193                      ; psubw         %xmm1,%xmm0
@@ -40980,7 +40720,7 @@
   DB  102,68,15,213,207                   ; pmullw        %xmm7,%xmm9
   DB  102,15,213,203                      ; pmullw        %xmm3,%xmm1
   DB  102,65,15,56,58,201                 ; pminuw        %xmm9,%xmm1
-  DB  102,68,15,111,13,42,141,0,0         ; movdqa        0x8d2a(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,54,141,0,0         ; movdqa        0x8d36(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,201                   ; paddw         %xmm9,%xmm1
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
   DB  102,15,249,193                      ; psubw         %xmm1,%xmm0
@@ -41022,10 +40762,10 @@
   DB  102,68,15,213,207                   ; pmullw        %xmm7,%xmm9
   DB  102,15,213,203                      ; pmullw        %xmm3,%xmm1
   DB  102,65,15,56,58,201                 ; pminuw        %xmm9,%xmm1
-  DB  102,68,15,111,13,109,140,0,0        ; movdqa        0x8c6d(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,121,140,0,0        ; movdqa        0x8c79(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,201                   ; paddw         %xmm9,%xmm1
   DB  102,15,113,209,7                    ; psrlw         $0x7,%xmm1
-  DB  102,68,15,111,21,154,147,0,0        ; movdqa        0x939a(%rip),%xmm10        # 34570 <_sk_srcover_bgra_8888_sse2_lowp+0x1354>
+  DB  102,68,15,111,21,166,147,0,0        ; movdqa        0x93a6(%rip),%xmm10        # 33f50 <_sk_srcover_bgra_8888_sse2_lowp+0x1360>
   DB  102,65,15,219,202                   ; pand          %xmm10,%xmm1
   DB  102,15,249,193                      ; psubw         %xmm1,%xmm0
   DB  102,68,15,111,221                   ; movdqa        %xmm5,%xmm11
@@ -41065,10 +40805,10 @@
   DB  102,15,111,196                      ; movdqa        %xmm4,%xmm0
   DB  102,15,253,193                      ; paddw         %xmm1,%xmm0
   DB  102,15,213,204                      ; pmullw        %xmm4,%xmm1
-  DB  102,68,15,111,13,169,139,0,0        ; movdqa        0x8ba9(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,181,139,0,0        ; movdqa        0x8bb5(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,201                   ; paddw         %xmm9,%xmm1
   DB  102,15,113,209,7                    ; psrlw         $0x7,%xmm1
-  DB  102,68,15,111,21,214,146,0,0        ; movdqa        0x92d6(%rip),%xmm10        # 34570 <_sk_srcover_bgra_8888_sse2_lowp+0x1354>
+  DB  102,68,15,111,21,226,146,0,0        ; movdqa        0x92e2(%rip),%xmm10        # 33f50 <_sk_srcover_bgra_8888_sse2_lowp+0x1360>
   DB  102,65,15,219,202                   ; pand          %xmm10,%xmm1
   DB  102,15,249,193                      ; psubw         %xmm1,%xmm0
   DB  102,15,111,205                      ; movdqa        %xmm5,%xmm1
@@ -41103,14 +40843,14 @@
   DB  102,15,111,245                      ; movdqa        %xmm5,%xmm6
   DB  102,15,111,236                      ; movdqa        %xmm4,%xmm5
   DB  102,68,15,111,192                   ; movdqa        %xmm0,%xmm8
-  DB  102,68,15,111,29,1,139,0,0          ; movdqa        0x8b01(%rip),%xmm11        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,29,13,139,0,0         ; movdqa        0x8b0d(%rip),%xmm11        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,69,15,249,220                   ; psubw         %xmm12,%xmm11
   DB  102,65,15,111,227                   ; movdqa        %xmm11,%xmm4
   DB  102,65,15,213,224                   ; pmullw        %xmm8,%xmm4
   DB  102,68,15,111,251                   ; movdqa        %xmm3,%xmm15
   DB  102,69,15,249,248                   ; psubw         %xmm8,%xmm15
   DB  102,69,15,253,192                   ; paddw         %xmm8,%xmm8
-  DB  102,68,15,111,13,42,146,0,0         ; movdqa        0x922a(%rip),%xmm9        # 34580 <_sk_srcover_bgra_8888_sse2_lowp+0x1364>
+  DB  102,68,15,111,13,54,146,0,0         ; movdqa        0x9236(%rip),%xmm9        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0x1370>
   DB  102,68,15,111,243                   ; movdqa        %xmm3,%xmm14
   DB  102,69,15,239,241                   ; pxor          %xmm9,%xmm14
   DB  102,65,15,111,196                   ; movdqa        %xmm12,%xmm0
@@ -41157,7 +40897,7 @@
   DB  102,68,15,111,232                   ; movdqa        %xmm0,%xmm13
   DB  102,65,15,111,193                   ; movdqa        %xmm9,%xmm0
   DB  102,65,15,56,16,210                 ; pblendvb      %xmm0,%xmm10,%xmm2
-  DB  102,68,15,111,13,243,137,0,0        ; movdqa        0x89f3(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,255,137,0,0        ; movdqa        0x89ff(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,111,193                   ; movdqa        %xmm9,%xmm0
   DB  102,15,249,195                      ; psubw         %xmm3,%xmm0
   DB  102,15,111,248                      ; movdqa        %xmm0,%xmm7
@@ -41196,7 +40936,7 @@
   DB  72,131,236,24                       ; sub           $0x18,%rsp
   DB  102,68,15,111,231                   ; movdqa        %xmm7,%xmm12
   DB  102,68,15,111,192                   ; movdqa        %xmm0,%xmm8
-  DB  102,68,15,111,29,78,137,0,0         ; movdqa        0x894e(%rip),%xmm11        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,29,90,137,0,0         ; movdqa        0x895a(%rip),%xmm11        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,69,15,249,220                   ; psubw         %xmm12,%xmm11
   DB  102,65,15,111,195                   ; movdqa        %xmm11,%xmm0
   DB  102,65,15,213,192                   ; pmullw        %xmm8,%xmm0
@@ -41208,7 +40948,7 @@
   DB  102,68,15,249,252                   ; psubw         %xmm4,%xmm15
   DB  102,15,111,196                      ; movdqa        %xmm4,%xmm0
   DB  102,15,253,192                      ; paddw         %xmm0,%xmm0
-  DB  102,68,15,111,13,96,144,0,0         ; movdqa        0x9060(%rip),%xmm9        # 34580 <_sk_srcover_bgra_8888_sse2_lowp+0x1364>
+  DB  102,68,15,111,13,108,144,0,0        ; movdqa        0x906c(%rip),%xmm9        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0x1370>
   DB  102,69,15,111,212                   ; movdqa        %xmm12,%xmm10
   DB  102,68,15,213,211                   ; pmullw        %xmm3,%xmm10
   DB  102,69,15,213,254                   ; pmullw        %xmm14,%xmm15
@@ -41254,7 +40994,7 @@
   DB  102,15,253,210                      ; paddw         %xmm2,%xmm2
   DB  102,65,15,111,193                   ; movdqa        %xmm9,%xmm0
   DB  102,65,15,56,16,210                 ; pblendvb      %xmm0,%xmm10,%xmm2
-  DB  102,68,15,111,13,50,136,0,0         ; movdqa        0x8832(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,62,136,0,0         ; movdqa        0x883e(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,111,193                   ; movdqa        %xmm9,%xmm0
   DB  102,15,249,195                      ; psubw         %xmm3,%xmm0
   DB  102,15,111,248                      ; movdqa        %xmm0,%xmm7
@@ -41296,49 +41036,49 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,41                              ; ja            2b6c3 <_sk_load_8888_sse41_lowp+0x44>
+  DB  119,41                              ; ja            2b097 <_sk_load_8888_sse41_lowp+0x44>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,239,0,0,0                 ; lea           0xef(%rip),%r9        # 2b798 <_sk_load_8888_sse41_lowp+0x119>
+  DB  76,141,13,239,0,0,0                 ; lea           0xef(%rip),%r9        # 2b16c <_sk_load_8888_sse41_lowp+0x119>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  255,224                             ; jmpq          *%rax
   DB  102,65,15,110,20,144                ; movd          (%r8,%rdx,4),%xmm2
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  235,89                              ; jmp           2b71c <_sk_load_8888_sse41_lowp+0x9d>
+  DB  235,89                              ; jmp           2b0f0 <_sk_load_8888_sse41_lowp+0x9d>
   DB  243,65,15,111,20,144                ; movdqu        (%r8,%rdx,4),%xmm2
   DB  243,69,15,111,68,144,16             ; movdqu        0x10(%r8,%rdx,4),%xmm8
-  DB  235,74                              ; jmp           2b71c <_sk_load_8888_sse41_lowp+0x9d>
+  DB  235,74                              ; jmp           2b0f0 <_sk_load_8888_sse41_lowp+0x9d>
   DB  102,65,15,110,68,144,8              ; movd          0x8(%r8,%rdx,4),%xmm0
   DB  102,68,15,112,192,69                ; pshufd        $0x45,%xmm0,%xmm8
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  243,65,15,126,20,144                ; movq          (%r8,%rdx,4),%xmm2
   DB  102,65,15,58,14,208,240             ; pblendw       $0xf0,%xmm8,%xmm2
   DB  102,68,15,111,192                   ; movdqa        %xmm0,%xmm8
-  DB  235,37                              ; jmp           2b71c <_sk_load_8888_sse41_lowp+0x9d>
+  DB  235,37                              ; jmp           2b0f0 <_sk_load_8888_sse41_lowp+0x9d>
   DB  102,65,15,110,68,144,24             ; movd          0x18(%r8,%rdx,4),%xmm0
   DB  102,68,15,112,192,69                ; pshufd        $0x45,%xmm0,%xmm8
   DB  102,69,15,58,34,68,144,20,1         ; pinsrd        $0x1,0x14(%r8,%rdx,4),%xmm8
   DB  102,69,15,58,34,68,144,16,0         ; pinsrd        $0x0,0x10(%r8,%rdx,4),%xmm8
   DB  243,65,15,111,20,144                ; movdqu        (%r8,%rdx,4),%xmm2
-  DB  102,15,111,5,108,142,0,0            ; movdqa        0x8e6c(%rip),%xmm0        # 34590 <_sk_srcover_bgra_8888_sse2_lowp+0x1374>
+  DB  102,15,111,5,120,142,0,0            ; movdqa        0x8e78(%rip),%xmm0        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0x1380>
   DB  102,15,111,202                      ; movdqa        %xmm2,%xmm1
   DB  102,15,56,0,200                     ; pshufb        %xmm0,%xmm1
   DB  102,65,15,111,216                   ; movdqa        %xmm8,%xmm3
   DB  102,15,56,0,216                     ; pshufb        %xmm0,%xmm3
   DB  102,15,108,203                      ; punpcklqdq    %xmm3,%xmm1
-  DB  102,68,15,111,13,236,134,0,0        ; movdqa        0x86ec(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,248,134,0,0        ; movdqa        0x86f8(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,111,193                      ; movdqa        %xmm1,%xmm0
   DB  102,65,15,219,193                   ; pand          %xmm9,%xmm0
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
-  DB  102,68,15,111,21,69,142,0,0         ; movdqa        0x8e45(%rip),%xmm10        # 345a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1384>
+  DB  102,68,15,111,21,81,142,0,0         ; movdqa        0x8e51(%rip),%xmm10        # 33f80 <_sk_srcover_bgra_8888_sse2_lowp+0x1390>
   DB  102,15,111,218                      ; movdqa        %xmm2,%xmm3
   DB  102,65,15,56,0,218                  ; pshufb        %xmm10,%xmm3
   DB  102,69,15,111,216                   ; movdqa        %xmm8,%xmm11
   DB  102,69,15,56,0,218                  ; pshufb        %xmm10,%xmm11
   DB  102,65,15,108,219                   ; punpcklqdq    %xmm11,%xmm3
-  DB  102,68,15,111,21,50,142,0,0         ; movdqa        0x8e32(%rip),%xmm10        # 345b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
+  DB  102,68,15,111,21,62,142,0,0         ; movdqa        0x8e3e(%rip),%xmm10        # 33f90 <_sk_srcover_bgra_8888_sse2_lowp+0x13a0>
   DB  102,65,15,56,0,210                  ; pshufb        %xmm10,%xmm2
   DB  102,69,15,56,0,194                  ; pshufb        %xmm10,%xmm8
   DB  102,65,15,108,208                   ; punpcklqdq    %xmm8,%xmm2
@@ -41354,7 +41094,7 @@
   DB  58,255                              ; cmp           %bh,%bh
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  126,255                             ; jle           2b7a5 <_sk_load_8888_sse41_lowp+0x126>
+  DB  126,255                             ; jle           2b179 <_sk_load_8888_sse41_lowp+0x126>
   DB  255                                 ; (bad)
   DB  255,117,255                         ; pushq         -0x1(%rbp)
   DB  255                                 ; (bad)
@@ -41374,49 +41114,49 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,41                              ; ja            2b7f8 <_sk_load_8888_dst_sse41_lowp+0x44>
+  DB  119,41                              ; ja            2b1cc <_sk_load_8888_dst_sse41_lowp+0x44>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,242,0,0,0                 ; lea           0xf2(%rip),%r9        # 2b8d0 <_sk_load_8888_dst_sse41_lowp+0x11c>
+  DB  76,141,13,242,0,0,0                 ; lea           0xf2(%rip),%r9        # 2b2a4 <_sk_load_8888_dst_sse41_lowp+0x11c>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  255,224                             ; jmpq          *%rax
   DB  102,65,15,110,52,144                ; movd          (%r8,%rdx,4),%xmm6
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  235,89                              ; jmp           2b851 <_sk_load_8888_dst_sse41_lowp+0x9d>
+  DB  235,89                              ; jmp           2b225 <_sk_load_8888_dst_sse41_lowp+0x9d>
   DB  243,65,15,111,52,144                ; movdqu        (%r8,%rdx,4),%xmm6
   DB  243,69,15,111,68,144,16             ; movdqu        0x10(%r8,%rdx,4),%xmm8
-  DB  235,74                              ; jmp           2b851 <_sk_load_8888_dst_sse41_lowp+0x9d>
+  DB  235,74                              ; jmp           2b225 <_sk_load_8888_dst_sse41_lowp+0x9d>
   DB  102,65,15,110,100,144,8             ; movd          0x8(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  243,65,15,126,52,144                ; movq          (%r8,%rdx,4),%xmm6
   DB  102,65,15,58,14,240,240             ; pblendw       $0xf0,%xmm8,%xmm6
   DB  102,68,15,111,196                   ; movdqa        %xmm4,%xmm8
-  DB  235,37                              ; jmp           2b851 <_sk_load_8888_dst_sse41_lowp+0x9d>
+  DB  235,37                              ; jmp           2b225 <_sk_load_8888_dst_sse41_lowp+0x9d>
   DB  102,65,15,110,100,144,24            ; movd          0x18(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  102,69,15,58,34,68,144,20,1         ; pinsrd        $0x1,0x14(%r8,%rdx,4),%xmm8
   DB  102,69,15,58,34,68,144,16,0         ; pinsrd        $0x0,0x10(%r8,%rdx,4),%xmm8
   DB  243,65,15,111,52,144                ; movdqu        (%r8,%rdx,4),%xmm6
-  DB  102,15,111,37,55,141,0,0            ; movdqa        0x8d37(%rip),%xmm4        # 34590 <_sk_srcover_bgra_8888_sse2_lowp+0x1374>
+  DB  102,15,111,37,67,141,0,0            ; movdqa        0x8d43(%rip),%xmm4        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0x1380>
   DB  102,15,111,238                      ; movdqa        %xmm6,%xmm5
   DB  102,15,56,0,236                     ; pshufb        %xmm4,%xmm5
   DB  102,65,15,111,248                   ; movdqa        %xmm8,%xmm7
   DB  102,15,56,0,252                     ; pshufb        %xmm4,%xmm7
   DB  102,15,108,239                      ; punpcklqdq    %xmm7,%xmm5
-  DB  102,68,15,111,13,183,133,0,0        ; movdqa        0x85b7(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,195,133,0,0        ; movdqa        0x85c3(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,111,229                      ; movdqa        %xmm5,%xmm4
   DB  102,65,15,219,225                   ; pand          %xmm9,%xmm4
   DB  102,15,113,213,8                    ; psrlw         $0x8,%xmm5
-  DB  102,68,15,111,21,16,141,0,0         ; movdqa        0x8d10(%rip),%xmm10        # 345a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1384>
+  DB  102,68,15,111,21,28,141,0,0         ; movdqa        0x8d1c(%rip),%xmm10        # 33f80 <_sk_srcover_bgra_8888_sse2_lowp+0x1390>
   DB  102,15,111,254                      ; movdqa        %xmm6,%xmm7
   DB  102,65,15,56,0,250                  ; pshufb        %xmm10,%xmm7
   DB  102,69,15,111,216                   ; movdqa        %xmm8,%xmm11
   DB  102,69,15,56,0,218                  ; pshufb        %xmm10,%xmm11
   DB  102,65,15,108,251                   ; punpcklqdq    %xmm11,%xmm7
-  DB  102,68,15,111,21,253,140,0,0        ; movdqa        0x8cfd(%rip),%xmm10        # 345b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
+  DB  102,68,15,111,21,9,141,0,0          ; movdqa        0x8d09(%rip),%xmm10        # 33f90 <_sk_srcover_bgra_8888_sse2_lowp+0x13a0>
   DB  102,65,15,56,0,242                  ; pshufb        %xmm10,%xmm6
   DB  102,69,15,56,0,194                  ; pshufb        %xmm10,%xmm8
   DB  102,65,15,108,240                   ; punpcklqdq    %xmm8,%xmm6
@@ -41432,7 +41172,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  123,255                             ; jnp           2b8dd <_sk_load_8888_dst_sse41_lowp+0x129>
+  DB  123,255                             ; jnp           2b2b1 <_sk_load_8888_dst_sse41_lowp+0x129>
   DB  255                                 ; (bad)
   DB  255,114,255                         ; pushq         -0x1(%rdx)
   DB  255                                 ; (bad)
@@ -41467,20 +41207,20 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,27                              ; ja            2b972 <_sk_store_8888_sse41_lowp+0x86>
+  DB  119,27                              ; ja            2b346 <_sk_store_8888_sse41_lowp+0x86>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,87,0,0,0                  ; lea           0x57(%rip),%r9        # 2b9b8 <_sk_store_8888_sse41_lowp+0xcc>
+  DB  76,141,13,87,0,0,0                  ; lea           0x57(%rip),%r9        # 2b38c <_sk_store_8888_sse41_lowp+0xcc>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,69,15,126,4,144                 ; movd          %xmm8,(%r8,%rdx,4)
-  DB  235,63                              ; jmp           2b9b1 <_sk_store_8888_sse41_lowp+0xc5>
+  DB  235,63                              ; jmp           2b385 <_sk_store_8888_sse41_lowp+0xc5>
   DB  243,69,15,127,4,144                 ; movdqu        %xmm8,(%r8,%rdx,4)
   DB  243,69,15,127,76,144,16             ; movdqu        %xmm9,0x10(%r8,%rdx,4)
-  DB  235,48                              ; jmp           2b9b1 <_sk_store_8888_sse41_lowp+0xc5>
+  DB  235,48                              ; jmp           2b385 <_sk_store_8888_sse41_lowp+0xc5>
   DB  102,69,15,58,22,68,144,8,2          ; pextrd        $0x2,%xmm8,0x8(%r8,%rdx,4)
   DB  102,69,15,214,4,144                 ; movq          %xmm8,(%r8,%rdx,4)
-  DB  235,31                              ; jmp           2b9b1 <_sk_store_8888_sse41_lowp+0xc5>
+  DB  235,31                              ; jmp           2b385 <_sk_store_8888_sse41_lowp+0xc5>
   DB  102,69,15,58,22,76,144,24,2         ; pextrd        $0x2,%xmm9,0x18(%r8,%rdx,4)
   DB  102,69,15,58,22,76,144,20,1         ; pextrd        $0x1,%xmm9,0x14(%r8,%rdx,4)
   DB  102,69,15,126,76,144,16             ; movd          %xmm9,0x10(%r8,%rdx,4)
@@ -41522,49 +41262,49 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,41                              ; ja            2ba18 <_sk_load_bgra_sse41_lowp+0x44>
+  DB  119,41                              ; ja            2b3ec <_sk_load_bgra_sse41_lowp+0x44>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,242,0,0,0                 ; lea           0xf2(%rip),%r9        # 2baf0 <_sk_load_bgra_sse41_lowp+0x11c>
+  DB  76,141,13,242,0,0,0                 ; lea           0xf2(%rip),%r9        # 2b4c4 <_sk_load_bgra_sse41_lowp+0x11c>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  255,224                             ; jmpq          *%rax
   DB  102,65,15,110,4,144                 ; movd          (%r8,%rdx,4),%xmm0
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  235,89                              ; jmp           2ba71 <_sk_load_bgra_sse41_lowp+0x9d>
+  DB  235,89                              ; jmp           2b445 <_sk_load_bgra_sse41_lowp+0x9d>
   DB  243,65,15,111,4,144                 ; movdqu        (%r8,%rdx,4),%xmm0
   DB  243,69,15,111,68,144,16             ; movdqu        0x10(%r8,%rdx,4),%xmm8
-  DB  235,74                              ; jmp           2ba71 <_sk_load_bgra_sse41_lowp+0x9d>
+  DB  235,74                              ; jmp           2b445 <_sk_load_bgra_sse41_lowp+0x9d>
   DB  102,65,15,110,68,144,8              ; movd          0x8(%r8,%rdx,4),%xmm0
   DB  102,68,15,112,192,69                ; pshufd        $0x45,%xmm0,%xmm8
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  243,65,15,126,4,144                 ; movq          (%r8,%rdx,4),%xmm0
   DB  102,65,15,58,14,192,240             ; pblendw       $0xf0,%xmm8,%xmm0
   DB  102,68,15,111,193                   ; movdqa        %xmm1,%xmm8
-  DB  235,37                              ; jmp           2ba71 <_sk_load_bgra_sse41_lowp+0x9d>
+  DB  235,37                              ; jmp           2b445 <_sk_load_bgra_sse41_lowp+0x9d>
   DB  102,65,15,110,68,144,24             ; movd          0x18(%r8,%rdx,4),%xmm0
   DB  102,68,15,112,192,69                ; pshufd        $0x45,%xmm0,%xmm8
   DB  102,69,15,58,34,68,144,20,1         ; pinsrd        $0x1,0x14(%r8,%rdx,4),%xmm8
   DB  102,69,15,58,34,68,144,16,0         ; pinsrd        $0x0,0x10(%r8,%rdx,4),%xmm8
   DB  243,65,15,111,4,144                 ; movdqu        (%r8,%rdx,4),%xmm0
-  DB  102,15,111,21,23,139,0,0            ; movdqa        0x8b17(%rip),%xmm2        # 34590 <_sk_srcover_bgra_8888_sse2_lowp+0x1374>
+  DB  102,15,111,21,35,139,0,0            ; movdqa        0x8b23(%rip),%xmm2        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0x1380>
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
   DB  102,15,56,0,202                     ; pshufb        %xmm2,%xmm1
   DB  102,65,15,111,216                   ; movdqa        %xmm8,%xmm3
   DB  102,15,56,0,218                     ; pshufb        %xmm2,%xmm3
   DB  102,15,108,203                      ; punpcklqdq    %xmm3,%xmm1
-  DB  102,68,15,111,13,151,131,0,0        ; movdqa        0x8397(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,163,131,0,0        ; movdqa        0x83a3(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,111,209                      ; movdqa        %xmm1,%xmm2
   DB  102,65,15,219,209                   ; pand          %xmm9,%xmm2
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
-  DB  102,68,15,111,21,240,138,0,0        ; movdqa        0x8af0(%rip),%xmm10        # 345a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1384>
+  DB  102,68,15,111,21,252,138,0,0        ; movdqa        0x8afc(%rip),%xmm10        # 33f80 <_sk_srcover_bgra_8888_sse2_lowp+0x1390>
   DB  102,15,111,216                      ; movdqa        %xmm0,%xmm3
   DB  102,65,15,56,0,218                  ; pshufb        %xmm10,%xmm3
   DB  102,69,15,111,216                   ; movdqa        %xmm8,%xmm11
   DB  102,69,15,56,0,218                  ; pshufb        %xmm10,%xmm11
   DB  102,65,15,108,219                   ; punpcklqdq    %xmm11,%xmm3
-  DB  102,68,15,111,21,221,138,0,0        ; movdqa        0x8add(%rip),%xmm10        # 345b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
+  DB  102,68,15,111,21,233,138,0,0        ; movdqa        0x8ae9(%rip),%xmm10        # 33f90 <_sk_srcover_bgra_8888_sse2_lowp+0x13a0>
   DB  102,65,15,56,0,194                  ; pshufb        %xmm10,%xmm0
   DB  102,69,15,56,0,194                  ; pshufb        %xmm10,%xmm8
   DB  102,65,15,108,192                   ; punpcklqdq    %xmm8,%xmm0
@@ -41580,7 +41320,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  123,255                             ; jnp           2bafd <_sk_load_bgra_sse41_lowp+0x129>
+  DB  123,255                             ; jnp           2b4d1 <_sk_load_bgra_sse41_lowp+0x129>
   DB  255                                 ; (bad)
   DB  255,114,255                         ; pushq         -0x1(%rdx)
   DB  255                                 ; (bad)
@@ -41600,49 +41340,49 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,41                              ; ja            2bb50 <_sk_load_bgra_dst_sse41_lowp+0x44>
+  DB  119,41                              ; ja            2b524 <_sk_load_bgra_dst_sse41_lowp+0x44>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,242,0,0,0                 ; lea           0xf2(%rip),%r9        # 2bc28 <_sk_load_bgra_dst_sse41_lowp+0x11c>
+  DB  76,141,13,242,0,0,0                 ; lea           0xf2(%rip),%r9        # 2b5fc <_sk_load_bgra_dst_sse41_lowp+0x11c>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  255,224                             ; jmpq          *%rax
   DB  102,65,15,110,36,144                ; movd          (%r8,%rdx,4),%xmm4
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  235,89                              ; jmp           2bba9 <_sk_load_bgra_dst_sse41_lowp+0x9d>
+  DB  235,89                              ; jmp           2b57d <_sk_load_bgra_dst_sse41_lowp+0x9d>
   DB  243,65,15,111,36,144                ; movdqu        (%r8,%rdx,4),%xmm4
   DB  243,69,15,111,68,144,16             ; movdqu        0x10(%r8,%rdx,4),%xmm8
-  DB  235,74                              ; jmp           2bba9 <_sk_load_bgra_dst_sse41_lowp+0x9d>
+  DB  235,74                              ; jmp           2b57d <_sk_load_bgra_dst_sse41_lowp+0x9d>
   DB  102,65,15,110,100,144,8             ; movd          0x8(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  243,65,15,126,36,144                ; movq          (%r8,%rdx,4),%xmm4
   DB  102,65,15,58,14,224,240             ; pblendw       $0xf0,%xmm8,%xmm4
   DB  102,68,15,111,197                   ; movdqa        %xmm5,%xmm8
-  DB  235,37                              ; jmp           2bba9 <_sk_load_bgra_dst_sse41_lowp+0x9d>
+  DB  235,37                              ; jmp           2b57d <_sk_load_bgra_dst_sse41_lowp+0x9d>
   DB  102,65,15,110,100,144,24            ; movd          0x18(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  102,69,15,58,34,68,144,20,1         ; pinsrd        $0x1,0x14(%r8,%rdx,4),%xmm8
   DB  102,69,15,58,34,68,144,16,0         ; pinsrd        $0x0,0x10(%r8,%rdx,4),%xmm8
   DB  243,65,15,111,36,144                ; movdqu        (%r8,%rdx,4),%xmm4
-  DB  102,15,111,53,223,137,0,0           ; movdqa        0x89df(%rip),%xmm6        # 34590 <_sk_srcover_bgra_8888_sse2_lowp+0x1374>
+  DB  102,15,111,53,235,137,0,0           ; movdqa        0x89eb(%rip),%xmm6        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0x1380>
   DB  102,15,111,236                      ; movdqa        %xmm4,%xmm5
   DB  102,15,56,0,238                     ; pshufb        %xmm6,%xmm5
   DB  102,65,15,111,248                   ; movdqa        %xmm8,%xmm7
   DB  102,15,56,0,254                     ; pshufb        %xmm6,%xmm7
   DB  102,15,108,239                      ; punpcklqdq    %xmm7,%xmm5
-  DB  102,68,15,111,13,95,130,0,0         ; movdqa        0x825f(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,107,130,0,0        ; movdqa        0x826b(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,111,245                      ; movdqa        %xmm5,%xmm6
   DB  102,65,15,219,241                   ; pand          %xmm9,%xmm6
   DB  102,15,113,213,8                    ; psrlw         $0x8,%xmm5
-  DB  102,68,15,111,21,184,137,0,0        ; movdqa        0x89b8(%rip),%xmm10        # 345a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1384>
+  DB  102,68,15,111,21,196,137,0,0        ; movdqa        0x89c4(%rip),%xmm10        # 33f80 <_sk_srcover_bgra_8888_sse2_lowp+0x1390>
   DB  102,15,111,252                      ; movdqa        %xmm4,%xmm7
   DB  102,65,15,56,0,250                  ; pshufb        %xmm10,%xmm7
   DB  102,69,15,111,216                   ; movdqa        %xmm8,%xmm11
   DB  102,69,15,56,0,218                  ; pshufb        %xmm10,%xmm11
   DB  102,65,15,108,251                   ; punpcklqdq    %xmm11,%xmm7
-  DB  102,68,15,111,21,165,137,0,0        ; movdqa        0x89a5(%rip),%xmm10        # 345b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
+  DB  102,68,15,111,21,177,137,0,0        ; movdqa        0x89b1(%rip),%xmm10        # 33f90 <_sk_srcover_bgra_8888_sse2_lowp+0x13a0>
   DB  102,65,15,56,0,226                  ; pshufb        %xmm10,%xmm4
   DB  102,69,15,56,0,194                  ; pshufb        %xmm10,%xmm8
   DB  102,65,15,108,224                   ; punpcklqdq    %xmm8,%xmm4
@@ -41658,7 +41398,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  123,255                             ; jnp           2bc35 <_sk_load_bgra_dst_sse41_lowp+0x129>
+  DB  123,255                             ; jnp           2b609 <_sk_load_bgra_dst_sse41_lowp+0x129>
   DB  255                                 ; (bad)
   DB  255,114,255                         ; pushq         -0x1(%rdx)
   DB  255                                 ; (bad)
@@ -41693,20 +41433,20 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,27                              ; ja            2bcca <_sk_store_bgra_sse41_lowp+0x86>
+  DB  119,27                              ; ja            2b69e <_sk_store_bgra_sse41_lowp+0x86>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,87,0,0,0                  ; lea           0x57(%rip),%r9        # 2bd10 <_sk_store_bgra_sse41_lowp+0xcc>
+  DB  76,141,13,87,0,0,0                  ; lea           0x57(%rip),%r9        # 2b6e4 <_sk_store_bgra_sse41_lowp+0xcc>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,69,15,126,4,144                 ; movd          %xmm8,(%r8,%rdx,4)
-  DB  235,63                              ; jmp           2bd09 <_sk_store_bgra_sse41_lowp+0xc5>
+  DB  235,63                              ; jmp           2b6dd <_sk_store_bgra_sse41_lowp+0xc5>
   DB  243,69,15,127,4,144                 ; movdqu        %xmm8,(%r8,%rdx,4)
   DB  243,69,15,127,76,144,16             ; movdqu        %xmm9,0x10(%r8,%rdx,4)
-  DB  235,48                              ; jmp           2bd09 <_sk_store_bgra_sse41_lowp+0xc5>
+  DB  235,48                              ; jmp           2b6dd <_sk_store_bgra_sse41_lowp+0xc5>
   DB  102,69,15,58,22,68,144,8,2          ; pextrd        $0x2,%xmm8,0x8(%r8,%rdx,4)
   DB  102,69,15,214,4,144                 ; movq          %xmm8,(%r8,%rdx,4)
-  DB  235,31                              ; jmp           2bd09 <_sk_store_bgra_sse41_lowp+0xc5>
+  DB  235,31                              ; jmp           2b6dd <_sk_store_bgra_sse41_lowp+0xc5>
   DB  102,69,15,58,22,76,144,24,2         ; pextrd        $0x2,%xmm9,0x18(%r8,%rdx,4)
   DB  102,69,15,58,22,76,144,20,1         ; pextrd        $0x1,%xmm9,0x14(%r8,%rdx,4)
   DB  102,69,15,126,76,144,16             ; movd          %xmm9,0x10(%r8,%rdx,4)
@@ -41807,17 +41547,17 @@
   DB  102,65,15,196,202,5                 ; pinsrw        $0x5,%r10d,%xmm1
   DB  102,65,15,196,201,6                 ; pinsrw        $0x6,%r9d,%xmm1
   DB  102,15,196,200,7                    ; pinsrw        $0x7,%eax,%xmm1
-  DB  102,68,15,111,13,200,127,0,0        ; movdqa        0x7fc8(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,212,127,0,0        ; movdqa        0x7fd4(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,111,193                      ; movdqa        %xmm1,%xmm0
   DB  102,65,15,219,193                   ; pand          %xmm9,%xmm0
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
-  DB  102,68,15,111,21,33,135,0,0         ; movdqa        0x8721(%rip),%xmm10        # 345a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1384>
+  DB  102,68,15,111,21,45,135,0,0         ; movdqa        0x872d(%rip),%xmm10        # 33f80 <_sk_srcover_bgra_8888_sse2_lowp+0x1390>
   DB  102,15,111,218                      ; movdqa        %xmm2,%xmm3
   DB  102,65,15,56,0,218                  ; pshufb        %xmm10,%xmm3
   DB  102,69,15,111,216                   ; movdqa        %xmm8,%xmm11
   DB  102,69,15,56,0,218                  ; pshufb        %xmm10,%xmm11
   DB  102,65,15,108,219                   ; punpcklqdq    %xmm11,%xmm3
-  DB  102,68,15,111,21,14,135,0,0         ; movdqa        0x870e(%rip),%xmm10        # 345b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
+  DB  102,68,15,111,21,26,135,0,0         ; movdqa        0x871a(%rip),%xmm10        # 33f90 <_sk_srcover_bgra_8888_sse2_lowp+0x13a0>
   DB  102,65,15,56,0,210                  ; pshufb        %xmm10,%xmm2
   DB  102,69,15,56,0,194                  ; pshufb        %xmm10,%xmm8
   DB  102,65,15,108,208                   ; punpcklqdq    %xmm8,%xmm2
@@ -41900,17 +41640,17 @@
   DB  102,65,15,196,202,5                 ; pinsrw        $0x5,%r10d,%xmm1
   DB  102,65,15,196,201,6                 ; pinsrw        $0x6,%r9d,%xmm1
   DB  102,15,196,200,7                    ; pinsrw        $0x7,%eax,%xmm1
-  DB  102,68,15,111,13,48,126,0,0         ; movdqa        0x7e30(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,60,126,0,0         ; movdqa        0x7e3c(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,111,209                      ; movdqa        %xmm1,%xmm2
   DB  102,65,15,219,209                   ; pand          %xmm9,%xmm2
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
-  DB  102,68,15,111,21,137,133,0,0        ; movdqa        0x8589(%rip),%xmm10        # 345a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1384>
+  DB  102,68,15,111,21,149,133,0,0        ; movdqa        0x8595(%rip),%xmm10        # 33f80 <_sk_srcover_bgra_8888_sse2_lowp+0x1390>
   DB  102,15,111,216                      ; movdqa        %xmm0,%xmm3
   DB  102,65,15,56,0,218                  ; pshufb        %xmm10,%xmm3
   DB  102,69,15,111,216                   ; movdqa        %xmm8,%xmm11
   DB  102,69,15,56,0,218                  ; pshufb        %xmm10,%xmm11
   DB  102,65,15,108,219                   ; punpcklqdq    %xmm11,%xmm3
-  DB  102,68,15,111,21,118,133,0,0        ; movdqa        0x8576(%rip),%xmm10        # 345b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
+  DB  102,68,15,111,21,130,133,0,0        ; movdqa        0x8582(%rip),%xmm10        # 33f90 <_sk_srcover_bgra_8888_sse2_lowp+0x13a0>
   DB  102,65,15,56,0,194                  ; pshufb        %xmm10,%xmm0
   DB  102,69,15,56,0,194                  ; pshufb        %xmm10,%xmm8
   DB  102,65,15,108,192                   ; punpcklqdq    %xmm8,%xmm0
@@ -41934,23 +41674,23 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            2c098 <_sk_load_565_sse41_lowp+0x3c>
+  DB  119,34                              ; ja            2ba6c <_sk_load_565_sse41_lowp+0x3c>
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,196,0,0,0                 ; lea           0xc4(%rip),%r9        # 2c148 <_sk_load_565_sse41_lowp+0xec>
+  DB  76,141,13,196,0,0,0                 ; lea           0xc4(%rip),%r9        # 2bb1c <_sk_load_565_sse41_lowp+0xec>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
-  DB  235,74                              ; jmp           2c0e2 <_sk_load_565_sse41_lowp+0x86>
+  DB  235,74                              ; jmp           2bab6 <_sk_load_565_sse41_lowp+0x86>
   DB  243,65,15,111,4,80                  ; movdqu        (%r8,%rdx,2),%xmm0
-  DB  235,66                              ; jmp           2c0e2 <_sk_load_565_sse41_lowp+0x86>
+  DB  235,66                              ; jmp           2bab6 <_sk_load_565_sse41_lowp+0x86>
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  102,65,15,196,76,80,4,2             ; pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm1
   DB  102,65,15,110,4,80                  ; movd          (%r8,%rdx,2),%xmm0
   DB  102,15,58,14,193,252                ; pblendw       $0xfc,%xmm1,%xmm0
-  DB  235,40                              ; jmp           2c0e2 <_sk_load_565_sse41_lowp+0x86>
+  DB  235,40                              ; jmp           2bab6 <_sk_load_565_sse41_lowp+0x86>
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  102,65,15,196,76,80,12,6            ; pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm1
   DB  102,65,15,196,76,80,10,5            ; pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm1
@@ -41959,11 +41699,11 @@
   DB  102,15,58,14,193,240                ; pblendw       $0xf0,%xmm1,%xmm0
   DB  102,15,111,216                      ; movdqa        %xmm0,%xmm3
   DB  102,15,113,211,8                    ; psrlw         $0x8,%xmm3
-  DB  102,15,219,29,205,132,0,0           ; pand          0x84cd(%rip),%xmm3        # 345c0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
+  DB  102,15,219,29,217,132,0,0           ; pand          0x84d9(%rip),%xmm3        # 33fa0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b0>
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
   DB  102,15,113,209,5                    ; psrlw         $0x5,%xmm1
-  DB  102,15,219,13,204,132,0,0           ; pand          0x84cc(%rip),%xmm1        # 345d0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
-  DB  102,15,111,21,212,132,0,0           ; movdqa        0x84d4(%rip),%xmm2        # 345e0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
+  DB  102,15,219,13,216,132,0,0           ; pand          0x84d8(%rip),%xmm1        # 33fb0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c0>
+  DB  102,15,111,21,224,132,0,0           ; movdqa        0x84e0(%rip),%xmm2        # 33fc0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d0>
   DB  102,15,219,208                      ; pand          %xmm0,%xmm2
   DB  102,15,113,208,13                   ; psrlw         $0xd,%xmm0
   DB  102,15,235,195                      ; por           %xmm3,%xmm0
@@ -41976,7 +41716,7 @@
   DB  102,15,113,210,2                    ; psrlw         $0x2,%xmm2
   DB  102,15,235,211                      ; por           %xmm3,%xmm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,234,124,0,0                ; movaps        0x7cea(%rip),%xmm3        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  15,40,29,246,124,0,0                ; movaps        0x7cf6(%rip),%xmm3        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  255,224                             ; jmpq          *%rax
   DB  69,255                              ; rex.RB        (bad)
   DB  255                                 ; (bad)
@@ -41987,7 +41727,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  126,255                             ; jle           2c15d <_sk_load_565_sse41_lowp+0x101>
+  DB  126,255                             ; jle           2bb31 <_sk_load_565_sse41_lowp+0x101>
   DB  255                                 ; (bad)
   DB  255,114,255                         ; pushq         -0x1(%rdx)
   DB  255                                 ; (bad)
@@ -42004,23 +41744,23 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            2c1a0 <_sk_load_565_dst_sse41_lowp+0x3c>
+  DB  119,34                              ; ja            2bb74 <_sk_load_565_dst_sse41_lowp+0x3c>
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,196,0,0,0                 ; lea           0xc4(%rip),%r9        # 2c250 <_sk_load_565_dst_sse41_lowp+0xec>
+  DB  76,141,13,196,0,0,0                 ; lea           0xc4(%rip),%r9        # 2bc24 <_sk_load_565_dst_sse41_lowp+0xec>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
-  DB  235,74                              ; jmp           2c1ea <_sk_load_565_dst_sse41_lowp+0x86>
+  DB  235,74                              ; jmp           2bbbe <_sk_load_565_dst_sse41_lowp+0x86>
   DB  243,65,15,111,36,80                 ; movdqu        (%r8,%rdx,2),%xmm4
-  DB  235,66                              ; jmp           2c1ea <_sk_load_565_dst_sse41_lowp+0x86>
+  DB  235,66                              ; jmp           2bbbe <_sk_load_565_dst_sse41_lowp+0x86>
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  102,65,15,196,108,80,4,2            ; pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm5
   DB  102,65,15,110,36,80                 ; movd          (%r8,%rdx,2),%xmm4
   DB  102,15,58,14,229,252                ; pblendw       $0xfc,%xmm5,%xmm4
-  DB  235,40                              ; jmp           2c1ea <_sk_load_565_dst_sse41_lowp+0x86>
+  DB  235,40                              ; jmp           2bbbe <_sk_load_565_dst_sse41_lowp+0x86>
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  102,65,15,196,108,80,12,6           ; pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm5
   DB  102,65,15,196,108,80,10,5           ; pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm5
@@ -42029,11 +41769,11 @@
   DB  102,15,58,14,229,240                ; pblendw       $0xf0,%xmm5,%xmm4
   DB  102,15,111,252                      ; movdqa        %xmm4,%xmm7
   DB  102,15,113,215,8                    ; psrlw         $0x8,%xmm7
-  DB  102,15,219,61,197,131,0,0           ; pand          0x83c5(%rip),%xmm7        # 345c0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
+  DB  102,15,219,61,209,131,0,0           ; pand          0x83d1(%rip),%xmm7        # 33fa0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b0>
   DB  102,15,111,236                      ; movdqa        %xmm4,%xmm5
   DB  102,15,113,213,5                    ; psrlw         $0x5,%xmm5
-  DB  102,15,219,45,196,131,0,0           ; pand          0x83c4(%rip),%xmm5        # 345d0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
-  DB  102,15,111,53,204,131,0,0           ; movdqa        0x83cc(%rip),%xmm6        # 345e0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
+  DB  102,15,219,45,208,131,0,0           ; pand          0x83d0(%rip),%xmm5        # 33fb0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c0>
+  DB  102,15,111,53,216,131,0,0           ; movdqa        0x83d8(%rip),%xmm6        # 33fc0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d0>
   DB  102,15,219,244                      ; pand          %xmm4,%xmm6
   DB  102,15,113,212,13                   ; psrlw         $0xd,%xmm4
   DB  102,15,235,231                      ; por           %xmm7,%xmm4
@@ -42046,7 +41786,7 @@
   DB  102,15,113,214,2                    ; psrlw         $0x2,%xmm6
   DB  102,15,235,247                      ; por           %xmm7,%xmm6
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,61,226,123,0,0                ; movaps        0x7be2(%rip),%xmm7        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  15,40,61,238,123,0,0                ; movaps        0x7bee(%rip),%xmm7        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  255,224                             ; jmpq          *%rax
   DB  69,255                              ; rex.RB        (bad)
   DB  255                                 ; (bad)
@@ -42057,7 +41797,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  126,255                             ; jle           2c265 <_sk_load_565_dst_sse41_lowp+0x101>
+  DB  126,255                             ; jle           2bc39 <_sk_load_565_dst_sse41_lowp+0x101>
   DB  255                                 ; (bad)
   DB  255,114,255                         ; pushq         -0x1(%rdx)
   DB  255                                 ; (bad)
@@ -42072,10 +41812,10 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  102,68,15,111,192                   ; movdqa        %xmm0,%xmm8
   DB  102,65,15,113,240,8                 ; psllw         $0x8,%xmm8
-  DB  102,68,15,219,5,96,131,0,0          ; pand          0x8360(%rip),%xmm8        # 345f0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d4>
+  DB  102,68,15,219,5,108,131,0,0         ; pand          0x836c(%rip),%xmm8        # 33fd0 <_sk_srcover_bgra_8888_sse2_lowp+0x13e0>
   DB  102,68,15,111,201                   ; movdqa        %xmm1,%xmm9
   DB  102,65,15,113,241,3                 ; psllw         $0x3,%xmm9
-  DB  102,68,15,219,13,92,131,0,0         ; pand          0x835c(%rip),%xmm9        # 34600 <_sk_srcover_bgra_8888_sse2_lowp+0x13e4>
+  DB  102,68,15,219,13,104,131,0,0        ; pand          0x8368(%rip),%xmm9        # 33fe0 <_sk_srcover_bgra_8888_sse2_lowp+0x13f0>
   DB  102,69,15,235,200                   ; por           %xmm8,%xmm9
   DB  102,68,15,111,194                   ; movdqa        %xmm2,%xmm8
   DB  102,65,15,113,208,3                 ; psrlw         $0x3,%xmm8
@@ -42084,19 +41824,19 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,29                              ; ja            2c2e0 <_sk_store_565_sse41_lowp+0x74>
+  DB  119,29                              ; ja            2bcb4 <_sk_store_565_sse41_lowp+0x74>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,83,0,0,0                  ; lea           0x53(%rip),%r9        # 2c320 <_sk_store_565_sse41_lowp+0xb4>
+  DB  76,141,13,83,0,0,0                  ; lea           0x53(%rip),%r9        # 2bcf4 <_sk_store_565_sse41_lowp+0xb4>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,69,15,58,21,4,80,0              ; pextrw        $0x0,%xmm8,(%r8,%rdx,2)
-  DB  235,58                              ; jmp           2c31a <_sk_store_565_sse41_lowp+0xae>
+  DB  235,58                              ; jmp           2bcee <_sk_store_565_sse41_lowp+0xae>
   DB  243,69,15,127,4,80                  ; movdqu        %xmm8,(%r8,%rdx,2)
-  DB  235,50                              ; jmp           2c31a <_sk_store_565_sse41_lowp+0xae>
+  DB  235,50                              ; jmp           2bcee <_sk_store_565_sse41_lowp+0xae>
   DB  102,69,15,58,21,68,80,4,2           ; pextrw        $0x2,%xmm8,0x4(%r8,%rdx,2)
   DB  102,69,15,126,4,80                  ; movd          %xmm8,(%r8,%rdx,2)
-  DB  235,33                              ; jmp           2c31a <_sk_store_565_sse41_lowp+0xae>
+  DB  235,33                              ; jmp           2bcee <_sk_store_565_sse41_lowp+0xae>
   DB  102,69,15,58,21,68,80,12,6          ; pextrw        $0x6,%xmm8,0xc(%r8,%rdx,2)
   DB  102,69,15,58,21,68,80,10,5          ; pextrw        $0x5,%xmm8,0xa(%r8,%rdx,2)
   DB  102,69,15,58,21,68,80,8,4           ; pextrw        $0x4,%xmm8,0x8(%r8,%rdx,2)
@@ -42116,7 +41856,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  235,255                             ; jmp           2c331 <_sk_store_565_sse41_lowp+0xc5>
+  DB  235,255                             ; jmp           2bd05 <_sk_store_565_sse41_lowp+0xc5>
   DB  255                                 ; (bad)
   DB  255,226                             ; jmpq          *%rdx
   DB  255                                 ; (bad)
@@ -42191,11 +41931,11 @@
   DB  102,15,196,192,7                    ; pinsrw        $0x7,%eax,%xmm0
   DB  102,15,111,216                      ; movdqa        %xmm0,%xmm3
   DB  102,15,113,211,8                    ; psrlw         $0x8,%xmm3
-  DB  102,15,219,29,106,129,0,0           ; pand          0x816a(%rip),%xmm3        # 345c0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
+  DB  102,15,219,29,118,129,0,0           ; pand          0x8176(%rip),%xmm3        # 33fa0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b0>
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
   DB  102,15,113,209,5                    ; psrlw         $0x5,%xmm1
-  DB  102,15,219,13,105,129,0,0           ; pand          0x8169(%rip),%xmm1        # 345d0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
-  DB  102,15,111,21,113,129,0,0           ; movdqa        0x8171(%rip),%xmm2        # 345e0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
+  DB  102,15,219,13,117,129,0,0           ; pand          0x8175(%rip),%xmm1        # 33fb0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c0>
+  DB  102,15,111,21,125,129,0,0           ; movdqa        0x817d(%rip),%xmm2        # 33fc0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d0>
   DB  102,15,219,208                      ; pand          %xmm0,%xmm2
   DB  102,15,113,208,13                   ; psrlw         $0xd,%xmm0
   DB  102,15,235,195                      ; por           %xmm3,%xmm0
@@ -42208,7 +41948,7 @@
   DB  102,15,113,210,2                    ; psrlw         $0x2,%xmm2
   DB  102,15,235,211                      ; por           %xmm3,%xmm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,135,121,0,0                ; movaps        0x7987(%rip),%xmm3        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  15,40,29,147,121,0,0                ; movaps        0x7993(%rip),%xmm3        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  91                                  ; pop           %rbx
   DB  65,92                               ; pop           %r12
   DB  65,94                               ; pop           %r14
@@ -42227,23 +41967,23 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,35                              ; ja            2c4f0 <_sk_load_4444_sse41_lowp+0x3d>
+  DB  119,35                              ; ja            2bec4 <_sk_load_4444_sse41_lowp+0x3d>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,209,0,0,0                 ; lea           0xd1(%rip),%r9        # 2c5ac <_sk_load_4444_sse41_lowp+0xf9>
+  DB  76,141,13,209,0,0,0                 ; lea           0xd1(%rip),%r9        # 2bf80 <_sk_load_4444_sse41_lowp+0xf9>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
-  DB  235,76                              ; jmp           2c53c <_sk_load_4444_sse41_lowp+0x89>
+  DB  235,76                              ; jmp           2bf10 <_sk_load_4444_sse41_lowp+0x89>
   DB  243,69,15,111,4,80                  ; movdqu        (%r8,%rdx,2),%xmm8
-  DB  235,68                              ; jmp           2c53c <_sk_load_4444_sse41_lowp+0x89>
+  DB  235,68                              ; jmp           2bf10 <_sk_load_4444_sse41_lowp+0x89>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,65,15,196,68,80,4,2             ; pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm0
   DB  102,69,15,110,4,80                  ; movd          (%r8,%rdx,2),%xmm8
   DB  102,68,15,58,14,192,252             ; pblendw       $0xfc,%xmm0,%xmm8
-  DB  235,41                              ; jmp           2c53c <_sk_load_4444_sse41_lowp+0x89>
+  DB  235,41                              ; jmp           2bf10 <_sk_load_4444_sse41_lowp+0x89>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,65,15,196,68,80,12,6            ; pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm0
   DB  102,65,15,196,68,80,10,5            ; pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm0
@@ -42254,7 +41994,7 @@
   DB  102,15,113,209,12                   ; psrlw         $0xc,%xmm1
   DB  102,65,15,111,208                   ; movdqa        %xmm8,%xmm2
   DB  102,15,113,210,8                    ; psrlw         $0x8,%xmm2
-  DB  102,15,111,5,184,128,0,0            ; movdqa        0x80b8(%rip),%xmm0        # 34610 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  DB  102,15,111,5,196,128,0,0            ; movdqa        0x80c4(%rip),%xmm0        # 33ff0 <_sk_srcover_bgra_8888_sse2_lowp+0x1400>
   DB  102,15,219,208                      ; pand          %xmm0,%xmm2
   DB  102,65,15,111,216                   ; movdqa        %xmm8,%xmm3
   DB  102,15,113,211,4                    ; psrlw         $0x4,%xmm3
@@ -42300,23 +42040,23 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,35                              ; ja            2c605 <_sk_load_4444_dst_sse41_lowp+0x3d>
+  DB  119,35                              ; ja            2bfd9 <_sk_load_4444_dst_sse41_lowp+0x3d>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,208,0,0,0                 ; lea           0xd0(%rip),%r9        # 2c6c0 <_sk_load_4444_dst_sse41_lowp+0xf8>
+  DB  76,141,13,208,0,0,0                 ; lea           0xd0(%rip),%r9        # 2c094 <_sk_load_4444_dst_sse41_lowp+0xf8>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
-  DB  235,76                              ; jmp           2c651 <_sk_load_4444_dst_sse41_lowp+0x89>
+  DB  235,76                              ; jmp           2c025 <_sk_load_4444_dst_sse41_lowp+0x89>
   DB  243,69,15,111,4,80                  ; movdqu        (%r8,%rdx,2),%xmm8
-  DB  235,68                              ; jmp           2c651 <_sk_load_4444_dst_sse41_lowp+0x89>
+  DB  235,68                              ; jmp           2c025 <_sk_load_4444_dst_sse41_lowp+0x89>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,65,15,196,100,80,4,2            ; pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm4
   DB  102,69,15,110,4,80                  ; movd          (%r8,%rdx,2),%xmm8
   DB  102,68,15,58,14,196,252             ; pblendw       $0xfc,%xmm4,%xmm8
-  DB  235,41                              ; jmp           2c651 <_sk_load_4444_dst_sse41_lowp+0x89>
+  DB  235,41                              ; jmp           2c025 <_sk_load_4444_dst_sse41_lowp+0x89>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,65,15,196,100,80,12,6           ; pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm4
   DB  102,65,15,196,100,80,10,5           ; pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm4
@@ -42327,7 +42067,7 @@
   DB  102,15,113,213,12                   ; psrlw         $0xc,%xmm5
   DB  102,65,15,111,240                   ; movdqa        %xmm8,%xmm6
   DB  102,15,113,214,8                    ; psrlw         $0x8,%xmm6
-  DB  102,15,111,37,163,127,0,0           ; movdqa        0x7fa3(%rip),%xmm4        # 34610 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  DB  102,15,111,37,175,127,0,0           ; movdqa        0x7faf(%rip),%xmm4        # 33ff0 <_sk_srcover_bgra_8888_sse2_lowp+0x1400>
   DB  102,15,219,244                      ; pand          %xmm4,%xmm6
   DB  102,65,15,111,248                   ; movdqa        %xmm8,%xmm7
   DB  102,15,113,215,4                    ; psrlw         $0x4,%xmm7
@@ -42370,12 +42110,12 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  102,68,15,111,192                   ; movdqa        %xmm0,%xmm8
   DB  102,65,15,113,240,8                 ; psllw         $0x8,%xmm8
-  DB  102,68,15,219,5,32,127,0,0          ; pand          0x7f20(%rip),%xmm8        # 34620 <_sk_srcover_bgra_8888_sse2_lowp+0x1404>
+  DB  102,68,15,219,5,44,127,0,0          ; pand          0x7f2c(%rip),%xmm8        # 34000 <_sk_srcover_bgra_8888_sse2_lowp+0x1410>
   DB  102,68,15,111,201                   ; movdqa        %xmm1,%xmm9
   DB  102,65,15,113,241,4                 ; psllw         $0x4,%xmm9
-  DB  102,68,15,219,13,28,127,0,0         ; pand          0x7f1c(%rip),%xmm9        # 34630 <_sk_srcover_bgra_8888_sse2_lowp+0x1414>
+  DB  102,68,15,219,13,40,127,0,0         ; pand          0x7f28(%rip),%xmm9        # 34010 <_sk_srcover_bgra_8888_sse2_lowp+0x1420>
   DB  102,69,15,235,200                   ; por           %xmm8,%xmm9
-  DB  102,68,15,111,21,30,127,0,0         ; movdqa        0x7f1e(%rip),%xmm10        # 34640 <_sk_srcover_bgra_8888_sse2_lowp+0x1424>
+  DB  102,68,15,111,21,42,127,0,0         ; movdqa        0x7f2a(%rip),%xmm10        # 34020 <_sk_srcover_bgra_8888_sse2_lowp+0x1430>
   DB  102,68,15,219,210                   ; pand          %xmm2,%xmm10
   DB  102,68,15,111,195                   ; movdqa        %xmm3,%xmm8
   DB  102,65,15,113,208,4                 ; psrlw         $0x4,%xmm8
@@ -42385,19 +42125,19 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,29                              ; ja            2c763 <_sk_store_4444_sse41_lowp+0x87>
+  DB  119,29                              ; ja            2c137 <_sk_store_4444_sse41_lowp+0x87>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,84,0,0,0                  ; lea           0x54(%rip),%r9        # 2c7a4 <_sk_store_4444_sse41_lowp+0xc8>
+  DB  76,141,13,84,0,0,0                  ; lea           0x54(%rip),%r9        # 2c178 <_sk_store_4444_sse41_lowp+0xc8>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,69,15,58,21,4,80,0              ; pextrw        $0x0,%xmm8,(%r8,%rdx,2)
-  DB  235,58                              ; jmp           2c79d <_sk_store_4444_sse41_lowp+0xc1>
+  DB  235,58                              ; jmp           2c171 <_sk_store_4444_sse41_lowp+0xc1>
   DB  243,69,15,127,4,80                  ; movdqu        %xmm8,(%r8,%rdx,2)
-  DB  235,50                              ; jmp           2c79d <_sk_store_4444_sse41_lowp+0xc1>
+  DB  235,50                              ; jmp           2c171 <_sk_store_4444_sse41_lowp+0xc1>
   DB  102,69,15,58,21,68,80,4,2           ; pextrw        $0x2,%xmm8,0x4(%r8,%rdx,2)
   DB  102,69,15,126,4,80                  ; movd          %xmm8,(%r8,%rdx,2)
-  DB  235,33                              ; jmp           2c79d <_sk_store_4444_sse41_lowp+0xc1>
+  DB  235,33                              ; jmp           2c171 <_sk_store_4444_sse41_lowp+0xc1>
   DB  102,69,15,58,21,68,80,12,6          ; pextrw        $0x6,%xmm8,0xc(%r8,%rdx,2)
   DB  102,69,15,58,21,68,80,10,5          ; pextrw        $0x5,%xmm8,0xa(%r8,%rdx,2)
   DB  102,69,15,58,21,68,80,8,4           ; pextrw        $0x4,%xmm8,0x8(%r8,%rdx,2)
@@ -42495,7 +42235,7 @@
   DB  102,15,113,209,12                   ; psrlw         $0xc,%xmm1
   DB  102,65,15,111,208                   ; movdqa        %xmm8,%xmm2
   DB  102,15,113,210,8                    ; psrlw         $0x8,%xmm2
-  DB  102,15,111,5,36,125,0,0             ; movdqa        0x7d24(%rip),%xmm0        # 34610 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  DB  102,15,111,5,48,125,0,0             ; movdqa        0x7d30(%rip),%xmm0        # 33ff0 <_sk_srcover_bgra_8888_sse2_lowp+0x1400>
   DB  102,15,219,208                      ; pand          %xmm0,%xmm2
   DB  102,65,15,111,216                   ; movdqa        %xmm8,%xmm3
   DB  102,15,113,211,4                    ; psrlw         $0x4,%xmm3
@@ -42531,18 +42271,18 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            2c97e <_sk_load_a8_sse41_lowp+0x39>
+  DB  119,34                              ; ja            2c352 <_sk_load_a8_sse41_lowp+0x39>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,146,0,0,0                 ; lea           0x92(%rip),%r9        # 2c9fc <_sk_load_a8_sse41_lowp+0xb7>
+  DB  76,141,13,146,0,0,0                 ; lea           0x92(%rip),%r9        # 2c3d0 <_sk_load_a8_sse41_lowp+0xb7>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,216                      ; movd          %eax,%xmm3
-  DB  235,100                             ; jmp           2c9e2 <_sk_load_a8_sse41_lowp+0x9d>
+  DB  235,100                             ; jmp           2c3b6 <_sk_load_a8_sse41_lowp+0x9d>
   DB  102,65,15,56,48,28,16               ; pmovzxbw      (%r8,%rdx,1),%xmm3
-  DB  235,91                              ; jmp           2c9e2 <_sk_load_a8_sse41_lowp+0x9d>
+  DB  235,91                              ; jmp           2c3b6 <_sk_load_a8_sse41_lowp+0x9d>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,15,196,192,2                    ; pinsrw        $0x2,%eax,%xmm0
@@ -42550,7 +42290,7 @@
   DB  102,15,110,200                      ; movd          %eax,%xmm1
   DB  102,15,56,48,217                    ; pmovzxbw      %xmm1,%xmm3
   DB  102,15,58,14,216,252                ; pblendw       $0xfc,%xmm0,%xmm3
-  DB  235,54                              ; jmp           2c9e2 <_sk_load_a8_sse41_lowp+0x9d>
+  DB  235,54                              ; jmp           2c3b6 <_sk_load_a8_sse41_lowp+0x9d>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,15,196,192,6                    ; pinsrw        $0x6,%eax,%xmm0
@@ -42561,14 +42301,14 @@
   DB  102,65,15,110,12,16                 ; movd          (%r8,%rdx,1),%xmm1
   DB  102,15,56,48,217                    ; pmovzxbw      %xmm1,%xmm3
   DB  102,15,58,14,216,240                ; pblendw       $0xf0,%xmm0,%xmm3
-  DB  102,15,219,29,70,116,0,0            ; pand          0x7446(%rip),%xmm3        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,15,219,29,82,116,0,0            ; pand          0x7452(%rip),%xmm3        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
   DB  255,224                             ; jmpq          *%rax
   DB  15,31,0                             ; nopl          (%rax)
-  DB  119,255                             ; ja            2c9fd <_sk_load_a8_sse41_lowp+0xb8>
+  DB  119,255                             ; ja            2c3d1 <_sk_load_a8_sse41_lowp+0xb8>
   DB  255                                 ; (bad)
   DB  255,154,255,255,255,139             ; lcall         *-0x74000001(%rdx)
   DB  255                                 ; (bad)
@@ -42595,18 +42335,18 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            2ca51 <_sk_load_a8_dst_sse41_lowp+0x39>
+  DB  119,34                              ; ja            2c425 <_sk_load_a8_dst_sse41_lowp+0x39>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,143,0,0,0                 ; lea           0x8f(%rip),%r9        # 2cacc <_sk_load_a8_dst_sse41_lowp+0xb4>
+  DB  76,141,13,143,0,0,0                 ; lea           0x8f(%rip),%r9        # 2c4a0 <_sk_load_a8_dst_sse41_lowp+0xb4>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,248                      ; movd          %eax,%xmm7
-  DB  235,100                             ; jmp           2cab5 <_sk_load_a8_dst_sse41_lowp+0x9d>
+  DB  235,100                             ; jmp           2c489 <_sk_load_a8_dst_sse41_lowp+0x9d>
   DB  102,65,15,56,48,60,16               ; pmovzxbw      (%r8,%rdx,1),%xmm7
-  DB  235,91                              ; jmp           2cab5 <_sk_load_a8_dst_sse41_lowp+0x9d>
+  DB  235,91                              ; jmp           2c489 <_sk_load_a8_dst_sse41_lowp+0x9d>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,15,196,224,2                    ; pinsrw        $0x2,%eax,%xmm4
@@ -42614,7 +42354,7 @@
   DB  102,15,110,232                      ; movd          %eax,%xmm5
   DB  102,15,56,48,253                    ; pmovzxbw      %xmm5,%xmm7
   DB  102,15,58,14,252,252                ; pblendw       $0xfc,%xmm4,%xmm7
-  DB  235,54                              ; jmp           2cab5 <_sk_load_a8_dst_sse41_lowp+0x9d>
+  DB  235,54                              ; jmp           2c489 <_sk_load_a8_dst_sse41_lowp+0x9d>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,15,196,224,6                    ; pinsrw        $0x6,%eax,%xmm4
@@ -42625,13 +42365,13 @@
   DB  102,65,15,110,44,16                 ; movd          (%r8,%rdx,1),%xmm5
   DB  102,15,56,48,253                    ; pmovzxbw      %xmm5,%xmm7
   DB  102,15,58,14,252,240                ; pblendw       $0xf0,%xmm4,%xmm7
-  DB  102,15,219,61,115,115,0,0           ; pand          0x7373(%rip),%xmm7        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,15,219,61,127,115,0,0           ; pand          0x737f(%rip),%xmm7        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  15,87,246                           ; xorps         %xmm6,%xmm6
   DB  255,224                             ; jmpq          *%rax
-  DB  122,255                             ; jp            2cacd <_sk_load_a8_dst_sse41_lowp+0xb5>
+  DB  122,255                             ; jp            2c4a1 <_sk_load_a8_dst_sse41_lowp+0xb5>
   DB  255                                 ; (bad)
   DB  255,157,255,255,255,142             ; lcall         *-0x71000001(%rbp)
   DB  255                                 ; (bad)
@@ -42660,28 +42400,28 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,29                              ; ja            2cb1c <_sk_store_a8_sse41_lowp+0x34>
+  DB  119,29                              ; ja            2c4f0 <_sk_store_a8_sse41_lowp+0x34>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,131,0,0,0                 ; lea           0x83(%rip),%r9        # 2cb8c <_sk_store_a8_sse41_lowp+0xa4>
+  DB  76,141,13,131,0,0,0                 ; lea           0x83(%rip),%r9        # 2c560 <_sk_store_a8_sse41_lowp+0xa4>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,65,15,58,20,28,16,0             ; pextrb        $0x0,%xmm3,(%r8,%rdx,1)
-  DB  235,105                             ; jmp           2cb85 <_sk_store_a8_sse41_lowp+0x9d>
+  DB  235,105                             ; jmp           2c559 <_sk_store_a8_sse41_lowp+0x9d>
   DB  102,68,15,111,195                   ; movdqa        %xmm3,%xmm8
-  DB  102,68,15,56,0,5,53,122,0,0         ; pshufb        0x7a35(%rip),%xmm8        # 34560 <_sk_srcover_bgra_8888_sse2_lowp+0x1344>
+  DB  102,68,15,56,0,5,65,122,0,0         ; pshufb        0x7a41(%rip),%xmm8        # 33f40 <_sk_srcover_bgra_8888_sse2_lowp+0x1350>
   DB  102,69,15,214,4,16                  ; movq          %xmm8,(%r8,%rdx,1)
-  DB  235,82                              ; jmp           2cb85 <_sk_store_a8_sse41_lowp+0x9d>
+  DB  235,82                              ; jmp           2c559 <_sk_store_a8_sse41_lowp+0x9d>
   DB  102,65,15,58,20,92,16,2,4           ; pextrb        $0x4,%xmm3,0x2(%r8,%rdx,1)
   DB  102,68,15,111,195                   ; movdqa        %xmm3,%xmm8
-  DB  102,68,15,56,0,5,245,114,0,0        ; pshufb        0x72f5(%rip),%xmm8        # 33e40 <_sk_srcover_bgra_8888_sse2_lowp+0xc24>
+  DB  102,68,15,56,0,5,1,115,0,0          ; pshufb        0x7301(%rip),%xmm8        # 33820 <_sk_srcover_bgra_8888_sse2_lowp+0xc30>
   DB  102,69,15,58,21,4,16,0              ; pextrw        $0x0,%xmm8,(%r8,%rdx,1)
-  DB  235,48                              ; jmp           2cb85 <_sk_store_a8_sse41_lowp+0x9d>
+  DB  235,48                              ; jmp           2c559 <_sk_store_a8_sse41_lowp+0x9d>
   DB  102,65,15,58,20,92,16,6,12          ; pextrb        $0xc,%xmm3,0x6(%r8,%rdx,1)
   DB  102,65,15,58,20,92,16,5,10          ; pextrb        $0xa,%xmm3,0x5(%r8,%rdx,1)
   DB  102,65,15,58,20,92,16,4,8           ; pextrb        $0x8,%xmm3,0x4(%r8,%rdx,1)
   DB  102,68,15,111,195                   ; movdqa        %xmm3,%xmm8
-  DB  102,68,15,56,0,5,209,114,0,0        ; pshufb        0x72d1(%rip),%xmm8        # 33e50 <_sk_srcover_bgra_8888_sse2_lowp+0xc34>
+  DB  102,68,15,56,0,5,221,114,0,0        ; pshufb        0x72dd(%rip),%xmm8        # 33830 <_sk_srcover_bgra_8888_sse2_lowp+0xc40>
   DB  102,69,15,126,4,16                  ; movd          %xmm8,(%r8,%rdx,1)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -42790,18 +42530,18 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            2cd0e <_sk_load_g8_sse41_lowp+0x39>
+  DB  119,34                              ; ja            2c6e2 <_sk_load_g8_sse41_lowp+0x39>
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,150,0,0,0                 ; lea           0x96(%rip),%r9        # 2cd90 <_sk_load_g8_sse41_lowp+0xbb>
+  DB  76,141,13,150,0,0,0                 ; lea           0x96(%rip),%r9        # 2c764 <_sk_load_g8_sse41_lowp+0xbb>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
-  DB  235,100                             ; jmp           2cd72 <_sk_load_g8_sse41_lowp+0x9d>
+  DB  235,100                             ; jmp           2c746 <_sk_load_g8_sse41_lowp+0x9d>
   DB  102,65,15,56,48,4,16                ; pmovzxbw      (%r8,%rdx,1),%xmm0
-  DB  235,91                              ; jmp           2cd72 <_sk_load_g8_sse41_lowp+0x9d>
+  DB  235,91                              ; jmp           2c746 <_sk_load_g8_sse41_lowp+0x9d>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  102,15,196,200,2                    ; pinsrw        $0x2,%eax,%xmm1
@@ -42809,7 +42549,7 @@
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,15,56,48,192                    ; pmovzxbw      %xmm0,%xmm0
   DB  102,15,58,14,193,252                ; pblendw       $0xfc,%xmm1,%xmm0
-  DB  235,54                              ; jmp           2cd72 <_sk_load_g8_sse41_lowp+0x9d>
+  DB  235,54                              ; jmp           2c746 <_sk_load_g8_sse41_lowp+0x9d>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  102,15,196,200,6                    ; pinsrw        $0x6,%eax,%xmm1
@@ -42820,14 +42560,14 @@
   DB  102,65,15,110,4,16                  ; movd          (%r8,%rdx,1),%xmm0
   DB  102,15,56,48,192                    ; pmovzxbw      %xmm0,%xmm0
   DB  102,15,58,14,193,240                ; pblendw       $0xf0,%xmm1,%xmm0
-  DB  102,15,219,5,182,112,0,0            ; pand          0x70b6(%rip),%xmm0        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,15,219,5,194,112,0,0            ; pand          0x70c2(%rip),%xmm0        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,173,112,0,0                ; movaps        0x70ad(%rip),%xmm3        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  15,40,29,185,112,0,0                ; movaps        0x70b9(%rip),%xmm3        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
   DB  102,15,111,208                      ; movdqa        %xmm0,%xmm2
   DB  255,224                             ; jmpq          *%rax
   DB  15,31,0                             ; nopl          (%rax)
-  DB  115,255                             ; jae           2cd91 <_sk_load_g8_sse41_lowp+0xbc>
+  DB  115,255                             ; jae           2c765 <_sk_load_g8_sse41_lowp+0xbc>
   DB  255                                 ; (bad)
   DB  255,150,255,255,255,135             ; callq         *-0x78000001(%rsi)
   DB  255                                 ; (bad)
@@ -42854,18 +42594,18 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            2cde5 <_sk_load_g8_dst_sse41_lowp+0x39>
+  DB  119,34                              ; ja            2c7b9 <_sk_load_g8_dst_sse41_lowp+0x39>
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,147,0,0,0                 ; lea           0x93(%rip),%r9        # 2ce64 <_sk_load_g8_dst_sse41_lowp+0xb8>
+  DB  76,141,13,147,0,0,0                 ; lea           0x93(%rip),%r9        # 2c838 <_sk_load_g8_dst_sse41_lowp+0xb8>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
-  DB  235,100                             ; jmp           2ce49 <_sk_load_g8_dst_sse41_lowp+0x9d>
+  DB  235,100                             ; jmp           2c81d <_sk_load_g8_dst_sse41_lowp+0x9d>
   DB  102,65,15,56,48,36,16               ; pmovzxbw      (%r8,%rdx,1),%xmm4
-  DB  235,91                              ; jmp           2ce49 <_sk_load_g8_dst_sse41_lowp+0x9d>
+  DB  235,91                              ; jmp           2c81d <_sk_load_g8_dst_sse41_lowp+0x9d>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  102,15,196,232,2                    ; pinsrw        $0x2,%eax,%xmm5
@@ -42873,7 +42613,7 @@
   DB  102,15,110,224                      ; movd          %eax,%xmm4
   DB  102,15,56,48,228                    ; pmovzxbw      %xmm4,%xmm4
   DB  102,15,58,14,229,252                ; pblendw       $0xfc,%xmm5,%xmm4
-  DB  235,54                              ; jmp           2ce49 <_sk_load_g8_dst_sse41_lowp+0x9d>
+  DB  235,54                              ; jmp           2c81d <_sk_load_g8_dst_sse41_lowp+0x9d>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  102,15,196,232,6                    ; pinsrw        $0x6,%eax,%xmm5
@@ -42884,13 +42624,13 @@
   DB  102,65,15,110,36,16                 ; movd          (%r8,%rdx,1),%xmm4
   DB  102,15,56,48,228                    ; pmovzxbw      %xmm4,%xmm4
   DB  102,15,58,14,229,240                ; pblendw       $0xf0,%xmm5,%xmm4
-  DB  102,15,219,37,223,111,0,0           ; pand          0x6fdf(%rip),%xmm4        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,15,219,37,235,111,0,0           ; pand          0x6feb(%rip),%xmm4        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,61,214,111,0,0                ; movaps        0x6fd6(%rip),%xmm7        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  15,40,61,226,111,0,0                ; movaps        0x6fe2(%rip),%xmm7        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,111,236                      ; movdqa        %xmm4,%xmm5
   DB  102,15,111,244                      ; movdqa        %xmm4,%xmm6
   DB  255,224                             ; jmpq          *%rax
-  DB  118,255                             ; jbe           2ce65 <_sk_load_g8_dst_sse41_lowp+0xb9>
+  DB  118,255                             ; jbe           2c839 <_sk_load_g8_dst_sse41_lowp+0xb9>
   DB  255                                 ; (bad)
   DB  255,153,255,255,255,138             ; lcall         *-0x75000001(%rcx)
   DB  255                                 ; (bad)
@@ -42910,10 +42650,10 @@
 PUBLIC _sk_luminance_to_alpha_sse41_lowp
 _sk_luminance_to_alpha_sse41_lowp LABEL PROC
   DB  102,15,111,218                      ; movdqa        %xmm2,%xmm3
-  DB  102,15,213,5,196,119,0,0            ; pmullw        0x77c4(%rip),%xmm0        # 34650 <_sk_srcover_bgra_8888_sse2_lowp+0x1434>
-  DB  102,15,213,13,204,119,0,0           ; pmullw        0x77cc(%rip),%xmm1        # 34660 <_sk_srcover_bgra_8888_sse2_lowp+0x1444>
+  DB  102,15,213,5,208,119,0,0            ; pmullw        0x77d0(%rip),%xmm0        # 34030 <_sk_srcover_bgra_8888_sse2_lowp+0x1440>
+  DB  102,15,213,13,216,119,0,0           ; pmullw        0x77d8(%rip),%xmm1        # 34040 <_sk_srcover_bgra_8888_sse2_lowp+0x1450>
   DB  102,15,253,200                      ; paddw         %xmm0,%xmm1
-  DB  102,15,213,29,208,119,0,0           ; pmullw        0x77d0(%rip),%xmm3        # 34670 <_sk_srcover_bgra_8888_sse2_lowp+0x1454>
+  DB  102,15,213,29,220,119,0,0           ; pmullw        0x77dc(%rip),%xmm3        # 34050 <_sk_srcover_bgra_8888_sse2_lowp+0x1460>
   DB  102,15,253,217                      ; paddw         %xmm1,%xmm3
   DB  102,15,113,211,8                    ; psrlw         $0x8,%xmm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -42987,7 +42727,7 @@
   DB  102,15,58,32,192,7                  ; pinsrb        $0x7,%eax,%xmm0
   DB  102,15,56,48,192                    ; pmovzxbw      %xmm0,%xmm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,89,110,0,0                 ; movaps        0x6e59(%rip),%xmm3        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  15,40,29,101,110,0,0                ; movaps        0x6e65(%rip),%xmm3        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
   DB  102,15,111,208                      ; movdqa        %xmm0,%xmm2
   DB  91                                  ; pop           %rbx
@@ -43001,14 +42741,14 @@
 _sk_scale_1_float_sse41_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  243,68,15,16,0                      ; movss         (%rax),%xmm8
-  DB  243,68,15,89,5,255,100,0,0          ; mulss         0x64ff(%rip),%xmm8        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
-  DB  243,68,15,88,5,198,100,0,0          ; addss         0x64c6(%rip),%xmm8        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  243,68,15,89,5,255,100,0,0          ; mulss         0x64ff(%rip),%xmm8        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  243,68,15,88,5,198,100,0,0          ; addss         0x64c6(%rip),%xmm8        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  243,65,15,44,192                    ; cvttss2si     %xmm8,%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  242,69,15,112,192,0                 ; pshuflw       $0x0,%xmm8,%xmm8
   DB  102,69,15,112,192,80                ; pshufd        $0x50,%xmm8,%xmm8
   DB  102,65,15,213,192                   ; pmullw        %xmm8,%xmm0
-  DB  102,68,15,111,13,10,110,0,0         ; movdqa        0x6e0a(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,22,110,0,0         ; movdqa        0x6e16(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,193                   ; paddw         %xmm9,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,65,15,213,200                   ; pmullw        %xmm8,%xmm1
@@ -43027,13 +42767,13 @@
 _sk_lerp_1_float_sse41_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  243,68,15,16,0                      ; movss         (%rax),%xmm8
-  DB  243,68,15,89,5,135,100,0,0          ; mulss         0x6487(%rip),%xmm8        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
-  DB  243,68,15,88,5,78,100,0,0           ; addss         0x644e(%rip),%xmm8        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  243,68,15,89,5,135,100,0,0          ; mulss         0x6487(%rip),%xmm8        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  243,68,15,88,5,78,100,0,0           ; addss         0x644e(%rip),%xmm8        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  243,65,15,44,192                    ; cvttss2si     %xmm8,%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  242,69,15,112,192,0                 ; pshuflw       $0x0,%xmm8,%xmm8
   DB  102,69,15,112,192,80                ; pshufd        $0x50,%xmm8,%xmm8
-  DB  102,68,15,111,13,151,109,0,0        ; movdqa        0x6d97(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,163,109,0,0        ; movdqa        0x6da3(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,213,192                   ; pmullw        %xmm8,%xmm0
   DB  102,65,15,253,193                   ; paddw         %xmm9,%xmm0
   DB  102,65,15,213,200                   ; pmullw        %xmm8,%xmm1
@@ -43071,18 +42811,18 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,36                              ; ja            2d150 <_sk_scale_u8_sse41_lowp+0x3b>
+  DB  119,36                              ; ja            2cb24 <_sk_scale_u8_sse41_lowp+0x3b>
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,221,0,0,0                 ; lea           0xdd(%rip),%r9        # 2d218 <_sk_scale_u8_sse41_lowp+0x103>
+  DB  76,141,13,221,0,0,0                 ; lea           0xdd(%rip),%r9        # 2cbec <_sk_scale_u8_sse41_lowp+0x103>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
-  DB  235,111                             ; jmp           2d1bf <_sk_scale_u8_sse41_lowp+0xaa>
+  DB  235,111                             ; jmp           2cb93 <_sk_scale_u8_sse41_lowp+0xaa>
   DB  102,69,15,56,48,4,16                ; pmovzxbw      (%r8,%rdx,1),%xmm8
-  DB  235,102                             ; jmp           2d1bf <_sk_scale_u8_sse41_lowp+0xaa>
+  DB  235,102                             ; jmp           2cb93 <_sk_scale_u8_sse41_lowp+0xaa>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
   DB  102,68,15,196,200,2                 ; pinsrw        $0x2,%eax,%xmm9
@@ -43090,7 +42830,7 @@
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  102,69,15,56,48,192                 ; pmovzxbw      %xmm8,%xmm8
   DB  102,69,15,58,14,193,252             ; pblendw       $0xfc,%xmm9,%xmm8
-  DB  235,60                              ; jmp           2d1bf <_sk_scale_u8_sse41_lowp+0xaa>
+  DB  235,60                              ; jmp           2cb93 <_sk_scale_u8_sse41_lowp+0xaa>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
   DB  102,68,15,196,200,6                 ; pinsrw        $0x6,%eax,%xmm9
@@ -43101,9 +42841,9 @@
   DB  102,69,15,110,4,16                  ; movd          (%r8,%rdx,1),%xmm8
   DB  102,69,15,56,48,192                 ; pmovzxbw      %xmm8,%xmm8
   DB  102,69,15,58,14,193,240             ; pblendw       $0xf0,%xmm9,%xmm8
-  DB  102,68,15,219,5,104,108,0,0         ; pand          0x6c68(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,219,5,116,108,0,0         ; pand          0x6c74(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,213,192                   ; pmullw        %xmm8,%xmm0
-  DB  102,68,15,111,13,90,108,0,0         ; movdqa        0x6c5a(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,102,108,0,0        ; movdqa        0x6c66(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,193                   ; paddw         %xmm9,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,65,15,213,200                   ; pmullw        %xmm8,%xmm1
@@ -43128,7 +42868,7 @@
   DB  255,148,255,255,255,136,255         ; callq         *-0x770001(%rdi,%rdi,8)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  124,255                             ; jl            2d22d <_sk_scale_u8_sse41_lowp+0x118>
+  DB  124,255                             ; jl            2cc01 <_sk_scale_u8_sse41_lowp+0x118>
   DB  255                                 ; (bad)
   DB  255,107,255                         ; ljmp          *-0x1(%rbx)
   DB  255                                 ; (bad)
@@ -43144,18 +42884,18 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,36                              ; ja            2d26f <_sk_lerp_u8_sse41_lowp+0x3b>
+  DB  119,36                              ; ja            2cc43 <_sk_lerp_u8_sse41_lowp+0x3b>
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,30,1,0,0                  ; lea           0x11e(%rip),%r9        # 2d378 <_sk_lerp_u8_sse41_lowp+0x144>
+  DB  76,141,13,30,1,0,0                  ; lea           0x11e(%rip),%r9        # 2cd4c <_sk_lerp_u8_sse41_lowp+0x144>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
-  DB  235,111                             ; jmp           2d2de <_sk_lerp_u8_sse41_lowp+0xaa>
+  DB  235,111                             ; jmp           2ccb2 <_sk_lerp_u8_sse41_lowp+0xaa>
   DB  102,69,15,56,48,4,16                ; pmovzxbw      (%r8,%rdx,1),%xmm8
-  DB  235,102                             ; jmp           2d2de <_sk_lerp_u8_sse41_lowp+0xaa>
+  DB  235,102                             ; jmp           2ccb2 <_sk_lerp_u8_sse41_lowp+0xaa>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
   DB  102,68,15,196,200,2                 ; pinsrw        $0x2,%eax,%xmm9
@@ -43163,7 +42903,7 @@
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  102,69,15,56,48,192                 ; pmovzxbw      %xmm8,%xmm8
   DB  102,69,15,58,14,193,252             ; pblendw       $0xfc,%xmm9,%xmm8
-  DB  235,60                              ; jmp           2d2de <_sk_lerp_u8_sse41_lowp+0xaa>
+  DB  235,60                              ; jmp           2ccb2 <_sk_lerp_u8_sse41_lowp+0xaa>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
   DB  102,68,15,196,200,6                 ; pinsrw        $0x6,%eax,%xmm9
@@ -43174,8 +42914,8 @@
   DB  102,69,15,110,4,16                  ; movd          (%r8,%rdx,1),%xmm8
   DB  102,69,15,56,48,192                 ; pmovzxbw      %xmm8,%xmm8
   DB  102,69,15,58,14,193,240             ; pblendw       $0xf0,%xmm9,%xmm8
-  DB  102,68,15,219,5,73,107,0,0          ; pand          0x6b49(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
-  DB  102,68,15,111,21,64,107,0,0         ; movdqa        0x6b40(%rip),%xmm10        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,219,5,85,107,0,0          ; pand          0x6b55(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
+  DB  102,68,15,111,21,76,107,0,0         ; movdqa        0x6b4c(%rip),%xmm10        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,69,15,111,200                   ; movdqa        %xmm8,%xmm9
   DB  102,69,15,239,202                   ; pxor          %xmm10,%xmm9
   DB  102,69,15,111,217                   ; movdqa        %xmm9,%xmm11
@@ -43205,7 +42945,7 @@
   DB  102,65,15,111,216                   ; movdqa        %xmm8,%xmm3
   DB  255,224                             ; jmpq          *%rax
   DB  144                                 ; nop
-  DB  235,254                             ; jmp           2d378 <_sk_lerp_u8_sse41_lowp+0x144>
+  DB  235,254                             ; jmp           2cd4c <_sk_lerp_u8_sse41_lowp+0x144>
   DB  255                                 ; (bad)
   DB  255,17                              ; callq         *(%rcx)
   DB  255                                 ; (bad)
@@ -43237,23 +42977,23 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,35                              ; ja            2d3d6 <_sk_scale_565_sse41_lowp+0x42>
+  DB  119,35                              ; ja            2cdaa <_sk_scale_565_sse41_lowp+0x42>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,111,1,0,0                 ; lea           0x16f(%rip),%r9        # 2d530 <_sk_scale_565_sse41_lowp+0x19c>
+  DB  76,141,13,111,1,0,0                 ; lea           0x16f(%rip),%r9        # 2cf04 <_sk_scale_565_sse41_lowp+0x19c>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,68,15,110,200                   ; movd          %eax,%xmm9
-  DB  235,76                              ; jmp           2d422 <_sk_scale_565_sse41_lowp+0x8e>
+  DB  235,76                              ; jmp           2cdf6 <_sk_scale_565_sse41_lowp+0x8e>
   DB  243,69,15,111,12,80                 ; movdqu        (%r8,%rdx,2),%xmm9
-  DB  235,68                              ; jmp           2d422 <_sk_scale_565_sse41_lowp+0x8e>
+  DB  235,68                              ; jmp           2cdf6 <_sk_scale_565_sse41_lowp+0x8e>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,65,15,196,68,80,4,2             ; pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm0
   DB  102,69,15,110,12,80                 ; movd          (%r8,%rdx,2),%xmm9
   DB  102,68,15,58,14,200,252             ; pblendw       $0xfc,%xmm0,%xmm9
-  DB  235,41                              ; jmp           2d422 <_sk_scale_565_sse41_lowp+0x8e>
+  DB  235,41                              ; jmp           2cdf6 <_sk_scale_565_sse41_lowp+0x8e>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,65,15,196,68,80,12,6            ; pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm0
   DB  102,65,15,196,68,80,10,5            ; pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm0
@@ -43262,11 +43002,11 @@
   DB  102,68,15,58,14,200,240             ; pblendw       $0xf0,%xmm0,%xmm9
   DB  102,65,15,111,193                   ; movdqa        %xmm9,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
-  DB  102,15,219,5,140,113,0,0            ; pand          0x718c(%rip),%xmm0        # 345c0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
+  DB  102,15,219,5,152,113,0,0            ; pand          0x7198(%rip),%xmm0        # 33fa0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b0>
   DB  102,69,15,111,209                   ; movdqa        %xmm9,%xmm10
   DB  102,65,15,113,210,5                 ; psrlw         $0x5,%xmm10
-  DB  102,68,15,219,21,136,113,0,0        ; pand          0x7188(%rip),%xmm10        # 345d0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
-  DB  102,68,15,111,29,143,113,0,0        ; movdqa        0x718f(%rip),%xmm11        # 345e0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
+  DB  102,68,15,219,21,148,113,0,0        ; pand          0x7194(%rip),%xmm10        # 33fb0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c0>
+  DB  102,68,15,111,29,155,113,0,0        ; movdqa        0x719b(%rip),%xmm11        # 33fc0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d0>
   DB  102,69,15,219,217                   ; pand          %xmm9,%xmm11
   DB  102,65,15,113,209,13                ; psrlw         $0xd,%xmm9
   DB  102,68,15,235,200                   ; por           %xmm0,%xmm9
@@ -43278,7 +43018,7 @@
   DB  102,15,113,240,3                    ; psllw         $0x3,%xmm0
   DB  102,65,15,113,211,2                 ; psrlw         $0x2,%xmm11
   DB  102,68,15,235,216                   ; por           %xmm0,%xmm11
-  DB  102,15,111,5,237,112,0,0            ; movdqa        0x70ed(%rip),%xmm0        # 34580 <_sk_srcover_bgra_8888_sse2_lowp+0x1364>
+  DB  102,15,111,5,249,112,0,0            ; movdqa        0x70f9(%rip),%xmm0        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0x1370>
   DB  102,68,15,111,227                   ; movdqa        %xmm3,%xmm12
   DB  102,68,15,239,224                   ; pxor          %xmm0,%xmm12
   DB  102,15,239,199                      ; pxor          %xmm7,%xmm0
@@ -43291,7 +43031,7 @@
   DB  102,69,15,56,62,225                 ; pmaxuw        %xmm9,%xmm12
   DB  102,69,15,56,16,229                 ; pblendvb      %xmm0,%xmm13,%xmm12
   DB  102,69,15,213,200                   ; pmullw        %xmm8,%xmm9
-  DB  102,15,111,5,85,105,0,0             ; movdqa        0x6955(%rip),%xmm0        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,15,111,5,97,105,0,0             ; movdqa        0x6961(%rip),%xmm0        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,68,15,253,200                   ; paddw         %xmm0,%xmm9
   DB  102,65,15,113,209,8                 ; psrlw         $0x8,%xmm9
   DB  102,68,15,213,209                   ; pmullw        %xmm1,%xmm10
@@ -43343,23 +43083,23 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,35                              ; ja            2d58e <_sk_lerp_565_sse41_lowp+0x42>
+  DB  119,35                              ; ja            2cf62 <_sk_lerp_565_sse41_lowp+0x42>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,187,1,0,0                 ; lea           0x1bb(%rip),%r9        # 2d734 <_sk_lerp_565_sse41_lowp+0x1e8>
+  DB  76,141,13,187,1,0,0                 ; lea           0x1bb(%rip),%r9        # 2d108 <_sk_lerp_565_sse41_lowp+0x1e8>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,68,15,110,200                   ; movd          %eax,%xmm9
-  DB  235,76                              ; jmp           2d5da <_sk_lerp_565_sse41_lowp+0x8e>
+  DB  235,76                              ; jmp           2cfae <_sk_lerp_565_sse41_lowp+0x8e>
   DB  243,69,15,111,12,80                 ; movdqu        (%r8,%rdx,2),%xmm9
-  DB  235,68                              ; jmp           2d5da <_sk_lerp_565_sse41_lowp+0x8e>
+  DB  235,68                              ; jmp           2cfae <_sk_lerp_565_sse41_lowp+0x8e>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,65,15,196,68,80,4,2             ; pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm0
   DB  102,69,15,110,12,80                 ; movd          (%r8,%rdx,2),%xmm9
   DB  102,68,15,58,14,200,252             ; pblendw       $0xfc,%xmm0,%xmm9
-  DB  235,41                              ; jmp           2d5da <_sk_lerp_565_sse41_lowp+0x8e>
+  DB  235,41                              ; jmp           2cfae <_sk_lerp_565_sse41_lowp+0x8e>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,65,15,196,68,80,12,6            ; pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm0
   DB  102,65,15,196,68,80,10,5            ; pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm0
@@ -43368,11 +43108,11 @@
   DB  102,68,15,58,14,200,240             ; pblendw       $0xf0,%xmm0,%xmm9
   DB  102,65,15,111,193                   ; movdqa        %xmm9,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
-  DB  102,15,219,5,212,111,0,0            ; pand          0x6fd4(%rip),%xmm0        # 345c0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
+  DB  102,15,219,5,224,111,0,0            ; pand          0x6fe0(%rip),%xmm0        # 33fa0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b0>
   DB  102,69,15,111,209                   ; movdqa        %xmm9,%xmm10
   DB  102,65,15,113,210,5                 ; psrlw         $0x5,%xmm10
-  DB  102,68,15,219,21,208,111,0,0        ; pand          0x6fd0(%rip),%xmm10        # 345d0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
-  DB  102,68,15,111,29,215,111,0,0        ; movdqa        0x6fd7(%rip),%xmm11        # 345e0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
+  DB  102,68,15,219,21,220,111,0,0        ; pand          0x6fdc(%rip),%xmm10        # 33fb0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c0>
+  DB  102,68,15,111,29,227,111,0,0        ; movdqa        0x6fe3(%rip),%xmm11        # 33fc0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d0>
   DB  102,69,15,219,217                   ; pand          %xmm9,%xmm11
   DB  102,65,15,113,209,13                ; psrlw         $0xd,%xmm9
   DB  102,68,15,235,200                   ; por           %xmm0,%xmm9
@@ -43384,7 +43124,7 @@
   DB  102,15,113,240,3                    ; psllw         $0x3,%xmm0
   DB  102,65,15,113,211,2                 ; psrlw         $0x2,%xmm11
   DB  102,68,15,235,216                   ; por           %xmm0,%xmm11
-  DB  102,15,111,5,53,111,0,0             ; movdqa        0x6f35(%rip),%xmm0        # 34580 <_sk_srcover_bgra_8888_sse2_lowp+0x1364>
+  DB  102,15,111,5,65,111,0,0             ; movdqa        0x6f41(%rip),%xmm0        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0x1370>
   DB  102,68,15,111,227                   ; movdqa        %xmm3,%xmm12
   DB  102,68,15,239,224                   ; pxor          %xmm0,%xmm12
   DB  102,15,239,199                      ; pxor          %xmm7,%xmm0
@@ -43396,7 +43136,7 @@
   DB  102,69,15,56,62,227                 ; pmaxuw        %xmm11,%xmm12
   DB  102,69,15,56,62,225                 ; pmaxuw        %xmm9,%xmm12
   DB  102,69,15,56,16,229                 ; pblendvb      %xmm0,%xmm13,%xmm12
-  DB  102,68,15,111,45,161,103,0,0        ; movdqa        0x67a1(%rip),%xmm13        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,45,173,103,0,0        ; movdqa        0x67ad(%rip),%xmm13        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,111,193                   ; movdqa        %xmm9,%xmm0
   DB  102,65,15,239,197                   ; pxor          %xmm13,%xmm0
   DB  102,15,213,196                      ; pmullw        %xmm4,%xmm0
@@ -43451,7 +43191,7 @@
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  65,15,95,200                        ; maxps         %xmm8,%xmm1
   DB  65,15,95,192                        ; maxps         %xmm8,%xmm0
-  DB  68,15,40,5,44,103,0,0               ; movaps        0x672c(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,56,103,0,0               ; movaps        0x6738(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  65,15,93,192                        ; minps         %xmm8,%xmm0
   DB  65,15,93,200                        ; minps         %xmm8,%xmm1
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -43466,7 +43206,7 @@
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  65,15,95,200                        ; maxps         %xmm8,%xmm1
   DB  65,15,95,192                        ; maxps         %xmm8,%xmm0
-  DB  68,15,40,5,246,102,0,0              ; movaps        0x66f6(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,2,103,0,0                ; movaps        0x6702(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  65,15,93,192                        ; minps         %xmm8,%xmm0
   DB  65,15,93,200                        ; minps         %xmm8,%xmm1
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -43474,10 +43214,10 @@
 
 PUBLIC _sk_mirror_x_1_sse41_lowp
 _sk_mirror_x_1_sse41_lowp LABEL PROC
-  DB  68,15,40,5,66,103,0,0               ; movaps        0x6742(%rip),%xmm8        # 33ef0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  DB  68,15,40,5,78,103,0,0               ; movaps        0x674e(%rip),%xmm8        # 338d0 <_sk_srcover_bgra_8888_sse2_lowp+0xce0>
   DB  65,15,88,192                        ; addps         %xmm8,%xmm0
   DB  65,15,88,200                        ; addps         %xmm8,%xmm1
-  DB  68,15,40,13,194,102,0,0             ; movaps        0x66c2(%rip),%xmm9        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  68,15,40,13,206,102,0,0             ; movaps        0x66ce(%rip),%xmm9        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  68,15,40,209                        ; movaps        %xmm1,%xmm10
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
   DB  68,15,89,200                        ; mulps         %xmm0,%xmm9
@@ -43489,13 +43229,13 @@
   DB  65,15,92,202                        ; subps         %xmm10,%xmm1
   DB  65,15,88,200                        ; addps         %xmm8,%xmm1
   DB  65,15,88,192                        ; addps         %xmm8,%xmm0
-  DB  68,15,40,5,184,107,0,0              ; movaps        0x6bb8(%rip),%xmm8        # 343b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1194>
+  DB  68,15,40,5,196,107,0,0              ; movaps        0x6bc4(%rip),%xmm8        # 33d90 <_sk_srcover_bgra_8888_sse2_lowp+0x11a0>
   DB  65,15,84,192                        ; andps         %xmm8,%xmm0
   DB  65,15,84,200                        ; andps         %xmm8,%xmm1
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  65,15,95,200                        ; maxps         %xmm8,%xmm1
   DB  65,15,95,192                        ; maxps         %xmm8,%xmm0
-  DB  68,15,40,5,124,102,0,0              ; movaps        0x667c(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,136,102,0,0              ; movaps        0x6688(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  65,15,93,192                        ; minps         %xmm8,%xmm0
   DB  65,15,93,200                        ; minps         %xmm8,%xmm1
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -43521,7 +43261,7 @@
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
   DB  72,131,249,2                        ; cmp           $0x2,%rcx
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
-  DB  114,57                              ; jb            2d898 <_sk_gradient_sse41_lowp+0x78>
+  DB  114,57                              ; jb            2d26c <_sk_gradient_sse41_lowp+0x78>
   DB  72,139,80,72                        ; mov           0x48(%rax),%rdx
   DB  72,255,201                          ; dec           %rcx
   DB  72,131,194,4                        ; add           $0x4,%rdx
@@ -43536,7 +43276,7 @@
   DB  102,15,250,218                      ; psubd         %xmm2,%xmm3
   DB  72,131,194,4                        ; add           $0x4,%rdx
   DB  72,255,201                          ; dec           %rcx
-  DB  117,219                             ; jne           2d873 <_sk_gradient_sse41_lowp+0x53>
+  DB  117,219                             ; jne           2d247 <_sk_gradient_sse41_lowp+0x53>
   DB  102,72,15,58,22,219,1               ; pextrq        $0x1,%xmm3,%rbx
   DB  65,137,221                          ; mov           %ebx,%r13d
   DB  72,193,235,32                       ; shr           $0x20,%rbx
@@ -43615,14 +43355,14 @@
   DB  69,15,88,239                        ; addps         %xmm15,%xmm13
   DB  15,89,216                           ; mulps         %xmm0,%xmm3
   DB  15,88,223                           ; addps         %xmm7,%xmm3
-  DB  15,40,61,252,100,0,0                ; movaps        0x64fc(%rip),%xmm7        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  DB  15,40,61,8,101,0,0                  ; movaps        0x6508(%rip),%xmm7        # 33950 <_sk_srcover_bgra_8888_sse2_lowp+0xd60>
   DB  68,15,89,239                        ; mulps         %xmm7,%xmm13
   DB  15,89,223                           ; mulps         %xmm7,%xmm3
-  DB  68,15,40,61,253,99,0,0              ; movaps        0x63fd(%rip),%xmm15        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  68,15,40,61,9,100,0,0               ; movaps        0x6409(%rip),%xmm15        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  69,15,88,239                        ; addps         %xmm15,%xmm13
   DB  65,15,88,223                        ; addps         %xmm15,%xmm3
   DB  243,65,15,91,245                    ; cvttps2dq     %xmm13,%xmm6
-  DB  102,68,15,111,45,247,106,0,0        ; movdqa        0x6af7(%rip),%xmm13        # 34590 <_sk_srcover_bgra_8888_sse2_lowp+0x1374>
+  DB  102,68,15,111,45,3,107,0,0          ; movdqa        0x6b03(%rip),%xmm13        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0x1380>
   DB  102,65,15,56,0,245                  ; pshufb        %xmm13,%xmm6
   DB  243,68,15,91,195                    ; cvttps2dq     %xmm3,%xmm8
   DB  102,69,15,56,0,197                  ; pshufb        %xmm13,%xmm8
@@ -43725,9 +43465,9 @@
   DB  72,139,24                           ; mov           (%rax),%rbx
   DB  72,139,104,8                        ; mov           0x8(%rax),%rbp
   DB  72,255,203                          ; dec           %rbx
-  DB  120,7                               ; js            2dc7a <_sk_evenly_spaced_gradient_sse41_lowp+0x3a>
+  DB  120,7                               ; js            2d64e <_sk_evenly_spaced_gradient_sse41_lowp+0x3a>
   DB  243,72,15,42,211                    ; cvtsi2ss      %rbx,%xmm2
-  DB  235,21                              ; jmp           2dc8f <_sk_evenly_spaced_gradient_sse41_lowp+0x4f>
+  DB  235,21                              ; jmp           2d663 <_sk_evenly_spaced_gradient_sse41_lowp+0x4f>
   DB  73,137,216                          ; mov           %rbx,%r8
   DB  73,209,232                          ; shr           %r8
   DB  131,227,1                           ; and           $0x1,%ebx
@@ -43865,14 +43605,14 @@
   DB  15,40,100,36,48                     ; movaps        0x30(%rsp),%xmm4
   DB  68,15,89,196                        ; mulps         %xmm4,%xmm8
   DB  68,15,88,192                        ; addps         %xmm0,%xmm8
-  DB  15,40,5,209,95,0,0                  ; movaps        0x5fd1(%rip),%xmm0        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  DB  15,40,5,221,95,0,0                  ; movaps        0x5fdd(%rip),%xmm0        # 33950 <_sk_srcover_bgra_8888_sse2_lowp+0xd60>
   DB  15,89,216                           ; mulps         %xmm0,%xmm3
   DB  68,15,89,192                        ; mulps         %xmm0,%xmm8
-  DB  68,15,40,53,210,94,0,0              ; movaps        0x5ed2(%rip),%xmm14        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  68,15,40,53,222,94,0,0              ; movaps        0x5ede(%rip),%xmm14        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  69,15,88,198                        ; addps         %xmm14,%xmm8
   DB  65,15,88,222                        ; addps         %xmm14,%xmm3
   DB  243,15,91,219                       ; cvttps2dq     %xmm3,%xmm3
-  DB  102,15,111,5,206,101,0,0            ; movdqa        0x65ce(%rip),%xmm0        # 34590 <_sk_srcover_bgra_8888_sse2_lowp+0x1374>
+  DB  102,15,111,5,218,101,0,0            ; movdqa        0x65da(%rip),%xmm0        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0x1380>
   DB  102,15,56,0,216                     ; pshufb        %xmm0,%xmm3
   DB  243,69,15,91,192                    ; cvttps2dq     %xmm8,%xmm8
   DB  102,68,15,56,0,192                  ; pshufb        %xmm0,%xmm8
@@ -43882,7 +43622,7 @@
   DB  15,40,220                           ; movaps        %xmm4,%xmm3
   DB  68,15,89,203                        ; mulps         %xmm3,%xmm9
   DB  68,15,88,201                        ; addps         %xmm1,%xmm9
-  DB  15,40,13,129,95,0,0                 ; movaps        0x5f81(%rip),%xmm1        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  DB  15,40,13,141,95,0,0                 ; movaps        0x5f8d(%rip),%xmm1        # 33950 <_sk_srcover_bgra_8888_sse2_lowp+0xd60>
   DB  15,89,209                           ; mulps         %xmm1,%xmm2
   DB  68,15,89,201                        ; mulps         %xmm1,%xmm9
   DB  15,40,225                           ; movaps        %xmm1,%xmm4
@@ -43949,14 +43689,14 @@
   DB  15,89,216                           ; mulps         %xmm0,%xmm3
   DB  65,15,88,216                        ; addps         %xmm8,%xmm3
   DB  65,15,88,208                        ; addps         %xmm8,%xmm2
-  DB  68,15,40,21,121,94,0,0              ; movaps        0x5e79(%rip),%xmm10        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  DB  68,15,40,21,133,94,0,0              ; movaps        0x5e85(%rip),%xmm10        # 33950 <_sk_srcover_bgra_8888_sse2_lowp+0xd60>
   DB  65,15,89,210                        ; mulps         %xmm10,%xmm2
   DB  65,15,89,218                        ; mulps         %xmm10,%xmm3
-  DB  68,15,40,37,121,93,0,0              ; movaps        0x5d79(%rip),%xmm12        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  68,15,40,37,133,93,0,0              ; movaps        0x5d85(%rip),%xmm12        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  65,15,88,220                        ; addps         %xmm12,%xmm3
   DB  65,15,88,212                        ; addps         %xmm12,%xmm2
   DB  243,15,91,210                       ; cvttps2dq     %xmm2,%xmm2
-  DB  102,68,15,111,29,116,100,0,0        ; movdqa        0x6474(%rip),%xmm11        # 34590 <_sk_srcover_bgra_8888_sse2_lowp+0x1374>
+  DB  102,68,15,111,29,128,100,0,0        ; movdqa        0x6480(%rip),%xmm11        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0x1380>
   DB  102,65,15,56,0,211                  ; pshufb        %xmm11,%xmm2
   DB  243,68,15,91,195                    ; cvttps2dq     %xmm3,%xmm8
   DB  102,69,15,56,0,195                  ; pshufb        %xmm11,%xmm8
@@ -44028,7 +43768,7 @@
   DB  15,40,251                           ; movaps        %xmm3,%xmm7
   DB  15,40,242                           ; movaps        %xmm2,%xmm6
   DB  68,15,40,192                        ; movaps        %xmm0,%xmm8
-  DB  15,40,37,103,97,0,0                 ; movaps        0x6167(%rip),%xmm4        # 343b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1194>
+  DB  15,40,37,115,97,0,0                 ; movaps        0x6173(%rip),%xmm4        # 33d90 <_sk_srcover_bgra_8888_sse2_lowp+0x11a0>
   DB  68,15,40,233                        ; movaps        %xmm1,%xmm13
   DB  68,15,84,236                        ; andps         %xmm4,%xmm13
   DB  69,15,40,216                        ; movaps        %xmm8,%xmm11
@@ -44053,18 +43793,18 @@
   DB  69,15,94,251                        ; divps         %xmm11,%xmm15
   DB  65,15,40,199                        ; movaps        %xmm15,%xmm0
   DB  15,89,192                           ; mulps         %xmm0,%xmm0
-  DB  68,15,40,29,103,97,0,0              ; movaps        0x6167(%rip),%xmm11        # 34420 <_sk_srcover_bgra_8888_sse2_lowp+0x1204>
+  DB  68,15,40,29,115,97,0,0              ; movaps        0x6173(%rip),%xmm11        # 33e00 <_sk_srcover_bgra_8888_sse2_lowp+0x1210>
   DB  68,15,40,224                        ; movaps        %xmm0,%xmm12
   DB  69,15,89,227                        ; mulps         %xmm11,%xmm12
-  DB  68,15,88,37,103,97,0,0              ; addps         0x6167(%rip),%xmm12        # 34430 <_sk_srcover_bgra_8888_sse2_lowp+0x1214>
+  DB  68,15,88,37,115,97,0,0              ; addps         0x6173(%rip),%xmm12        # 33e10 <_sk_srcover_bgra_8888_sse2_lowp+0x1220>
   DB  68,15,89,224                        ; mulps         %xmm0,%xmm12
-  DB  15,40,45,108,97,0,0                 ; movaps        0x616c(%rip),%xmm5        # 34440 <_sk_srcover_bgra_8888_sse2_lowp+0x1224>
+  DB  15,40,45,120,97,0,0                 ; movaps        0x6178(%rip),%xmm5        # 33e20 <_sk_srcover_bgra_8888_sse2_lowp+0x1230>
   DB  68,15,88,229                        ; addps         %xmm5,%xmm12
   DB  68,15,89,224                        ; mulps         %xmm0,%xmm12
-  DB  15,40,37,109,97,0,0                 ; movaps        0x616d(%rip),%xmm4        # 34450 <_sk_srcover_bgra_8888_sse2_lowp+0x1234>
+  DB  15,40,37,121,97,0,0                 ; movaps        0x6179(%rip),%xmm4        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0x1240>
   DB  68,15,88,228                        ; addps         %xmm4,%xmm12
   DB  69,15,89,231                        ; mulps         %xmm15,%xmm12
-  DB  15,40,21,110,97,0,0                 ; movaps        0x616e(%rip),%xmm2        # 34460 <_sk_srcover_bgra_8888_sse2_lowp+0x1244>
+  DB  15,40,21,122,97,0,0                 ; movaps        0x617a(%rip),%xmm2        # 33e40 <_sk_srcover_bgra_8888_sse2_lowp+0x1250>
   DB  15,40,218                           ; movaps        %xmm2,%xmm3
   DB  65,15,92,212                        ; subps         %xmm12,%xmm2
   DB  65,15,40,194                        ; movaps        %xmm10,%xmm0
@@ -44073,7 +43813,7 @@
   DB  65,15,40,198                        ; movaps        %xmm14,%xmm0
   DB  15,89,192                           ; mulps         %xmm0,%xmm0
   DB  68,15,89,216                        ; mulps         %xmm0,%xmm11
-  DB  68,15,88,29,22,97,0,0               ; addps         0x6116(%rip),%xmm11        # 34430 <_sk_srcover_bgra_8888_sse2_lowp+0x1214>
+  DB  68,15,88,29,34,97,0,0               ; addps         0x6122(%rip),%xmm11        # 33e10 <_sk_srcover_bgra_8888_sse2_lowp+0x1220>
   DB  68,15,89,216                        ; mulps         %xmm0,%xmm11
   DB  68,15,88,221                        ; addps         %xmm5,%xmm11
   DB  68,15,89,216                        ; mulps         %xmm0,%xmm11
@@ -44084,7 +43824,7 @@
   DB  102,68,15,56,20,219                 ; blendvps      %xmm0,%xmm3,%xmm11
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  69,15,194,193,1                     ; cmpltps       %xmm9,%xmm8
-  DB  15,40,21,52,91,0,0                  ; movaps        0x5b34(%rip),%xmm2        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  15,40,21,64,91,0,0                  ; movaps        0x5b40(%rip),%xmm2        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  15,40,218                           ; movaps        %xmm2,%xmm3
   DB  65,15,92,212                        ; subps         %xmm12,%xmm2
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
@@ -44095,7 +43835,7 @@
   DB  102,68,15,56,20,219                 ; blendvps      %xmm0,%xmm3,%xmm11
   DB  15,40,198                           ; movaps        %xmm6,%xmm0
   DB  65,15,194,193,1                     ; cmpltps       %xmm9,%xmm0
-  DB  15,40,13,18,91,0,0                  ; movaps        0x5b12(%rip),%xmm1        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  15,40,13,30,91,0,0                  ; movaps        0x5b1e(%rip),%xmm1        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  15,40,209                           ; movaps        %xmm1,%xmm2
   DB  65,15,92,204                        ; subps         %xmm12,%xmm1
   DB  102,68,15,56,20,225                 ; blendvps      %xmm0,%xmm1,%xmm12
@@ -44146,48 +43886,48 @@
   DB  65,254,202                          ; dec           %r10b
   DB  69,15,182,202                       ; movzbl        %r10b,%r9d
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,38                              ; ja            2e44d <_sk_srcover_rgba_8888_sse41_lowp+0x4b>
+  DB  119,38                              ; ja            2de21 <_sk_srcover_rgba_8888_sse41_lowp+0x4b>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  76,141,29,21,2,0,0                  ; lea           0x215(%rip),%r11        # 2e648 <_sk_srcover_rgba_8888_sse41_lowp+0x246>
+  DB  76,141,29,21,2,0,0                  ; lea           0x215(%rip),%r11        # 2e01c <_sk_srcover_rgba_8888_sse41_lowp+0x246>
   DB  75,99,4,139                         ; movslq        (%r11,%r9,4),%rax
   DB  76,1,216                            ; add           %r11,%rax
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  255,224                             ; jmpq          *%rax
   DB  102,65,15,110,52,144                ; movd          (%r8,%rdx,4),%xmm6
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  235,89                              ; jmp           2e4a6 <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
+  DB  235,89                              ; jmp           2de7a <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
   DB  243,65,15,111,52,144                ; movdqu        (%r8,%rdx,4),%xmm6
   DB  243,69,15,111,68,144,16             ; movdqu        0x10(%r8,%rdx,4),%xmm8
-  DB  235,74                              ; jmp           2e4a6 <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
+  DB  235,74                              ; jmp           2de7a <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
   DB  102,65,15,110,100,144,8             ; movd          0x8(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  243,65,15,126,52,144                ; movq          (%r8,%rdx,4),%xmm6
   DB  102,65,15,58,14,240,240             ; pblendw       $0xf0,%xmm8,%xmm6
   DB  102,68,15,111,196                   ; movdqa        %xmm4,%xmm8
-  DB  235,37                              ; jmp           2e4a6 <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
+  DB  235,37                              ; jmp           2de7a <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
   DB  102,65,15,110,100,144,24            ; movd          0x18(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  102,69,15,58,34,68,144,20,1         ; pinsrd        $0x1,0x14(%r8,%rdx,4),%xmm8
   DB  102,69,15,58,34,68,144,16,0         ; pinsrd        $0x0,0x10(%r8,%rdx,4),%xmm8
   DB  243,65,15,111,52,144                ; movdqu        (%r8,%rdx,4),%xmm6
-  DB  102,15,111,37,226,96,0,0            ; movdqa        0x60e2(%rip),%xmm4        # 34590 <_sk_srcover_bgra_8888_sse2_lowp+0x1374>
+  DB  102,15,111,37,238,96,0,0            ; movdqa        0x60ee(%rip),%xmm4        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0x1380>
   DB  102,15,111,238                      ; movdqa        %xmm6,%xmm5
   DB  102,15,56,0,236                     ; pshufb        %xmm4,%xmm5
   DB  102,65,15,111,248                   ; movdqa        %xmm8,%xmm7
   DB  102,15,56,0,252                     ; pshufb        %xmm4,%xmm7
   DB  102,15,108,239                      ; punpcklqdq    %xmm7,%xmm5
-  DB  102,68,15,111,37,98,89,0,0          ; movdqa        0x5962(%rip),%xmm12        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,37,110,89,0,0         ; movdqa        0x596e(%rip),%xmm12        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,111,229                      ; movdqa        %xmm5,%xmm4
   DB  102,65,15,219,228                   ; pand          %xmm12,%xmm4
   DB  102,15,113,213,8                    ; psrlw         $0x8,%xmm5
-  DB  102,68,15,111,13,187,96,0,0         ; movdqa        0x60bb(%rip),%xmm9        # 345a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1384>
+  DB  102,68,15,111,13,199,96,0,0         ; movdqa        0x60c7(%rip),%xmm9        # 33f80 <_sk_srcover_bgra_8888_sse2_lowp+0x1390>
   DB  102,15,111,254                      ; movdqa        %xmm6,%xmm7
   DB  102,65,15,56,0,249                  ; pshufb        %xmm9,%xmm7
   DB  102,69,15,111,208                   ; movdqa        %xmm8,%xmm10
   DB  102,69,15,56,0,209                  ; pshufb        %xmm9,%xmm10
   DB  102,65,15,108,250                   ; punpcklqdq    %xmm10,%xmm7
-  DB  102,68,15,111,13,168,96,0,0         ; movdqa        0x60a8(%rip),%xmm9        # 345b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
+  DB  102,68,15,111,13,180,96,0,0         ; movdqa        0x60b4(%rip),%xmm9        # 33f90 <_sk_srcover_bgra_8888_sse2_lowp+0x13a0>
   DB  102,65,15,56,0,241                  ; pshufb        %xmm9,%xmm6
   DB  102,69,15,56,0,193                  ; pshufb        %xmm9,%xmm8
   DB  102,65,15,108,240                   ; punpcklqdq    %xmm8,%xmm6
@@ -44229,19 +43969,19 @@
   DB  102,15,97,195                       ; punpcklwd     %xmm3,%xmm0
   DB  102,65,15,235,196                   ; por           %xmm12,%xmm0
   DB  65,128,250,6                        ; cmp           $0x6,%r10b
-  DB  119,24                              ; ja            2e5f0 <_sk_srcover_rgba_8888_sse41_lowp+0x1ee>
-  DB  76,141,21,133,0,0,0                 ; lea           0x85(%rip),%r10        # 2e664 <_sk_srcover_rgba_8888_sse41_lowp+0x262>
+  DB  119,24                              ; ja            2dfc4 <_sk_srcover_rgba_8888_sse41_lowp+0x1ee>
+  DB  76,141,21,133,0,0,0                 ; lea           0x85(%rip),%r10        # 2e038 <_sk_srcover_rgba_8888_sse41_lowp+0x262>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,65,15,126,4,144                 ; movd          %xmm0,(%r8,%rdx,4)
-  DB  235,63                              ; jmp           2e62f <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
+  DB  235,63                              ; jmp           2e003 <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
   DB  243,65,15,127,4,144                 ; movdqu        %xmm0,(%r8,%rdx,4)
   DB  243,65,15,127,76,144,16             ; movdqu        %xmm1,0x10(%r8,%rdx,4)
-  DB  235,48                              ; jmp           2e62f <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
+  DB  235,48                              ; jmp           2e003 <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
   DB  102,65,15,58,22,68,144,8,2          ; pextrd        $0x2,%xmm0,0x8(%r8,%rdx,4)
   DB  102,65,15,214,4,144                 ; movq          %xmm0,(%r8,%rdx,4)
-  DB  235,31                              ; jmp           2e62f <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
+  DB  235,31                              ; jmp           2e003 <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
   DB  102,65,15,58,22,76,144,24,2         ; pextrd        $0x2,%xmm1,0x18(%r8,%rdx,4)
   DB  102,65,15,58,22,76,144,20,1         ; pextrd        $0x1,%xmm1,0x14(%r8,%rdx,4)
   DB  102,65,15,126,76,144,16             ; movd          %xmm1,0x10(%r8,%rdx,4)
@@ -44256,7 +43996,7 @@
   DB  248                                 ; clc
   DB  253                                 ; std
   DB  255                                 ; (bad)
-  DB  255,37,254,255,255,20               ; jmpq          *0x14fffffe(%rip)        # 1502e64f <_sk_srcover_bgra_8888_sse2_lowp+0x14ffb433>
+  DB  255,37,254,255,255,20               ; jmpq          *0x14fffffe(%rip)        # 1502e023 <_sk_srcover_bgra_8888_sse2_lowp+0x14ffb433>
   DB  254                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,88,254                          ; lcall         *-0x2(%rax)
@@ -44295,48 +44035,48 @@
   DB  65,254,202                          ; dec           %r10b
   DB  69,15,182,202                       ; movzbl        %r10b,%r9d
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,38                              ; ja            2e6cb <_sk_srcover_bgra_8888_sse41_lowp+0x4b>
+  DB  119,38                              ; ja            2e09f <_sk_srcover_bgra_8888_sse41_lowp+0x4b>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  76,141,29,23,2,0,0                  ; lea           0x217(%rip),%r11        # 2e8c8 <_sk_srcover_bgra_8888_sse41_lowp+0x248>
+  DB  76,141,29,23,2,0,0                  ; lea           0x217(%rip),%r11        # 2e29c <_sk_srcover_bgra_8888_sse41_lowp+0x248>
   DB  75,99,4,139                         ; movslq        (%r11,%r9,4),%rax
   DB  76,1,216                            ; add           %r11,%rax
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  255,224                             ; jmpq          *%rax
   DB  102,65,15,110,36,144                ; movd          (%r8,%rdx,4),%xmm4
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  235,89                              ; jmp           2e724 <_sk_srcover_bgra_8888_sse41_lowp+0xa4>
+  DB  235,89                              ; jmp           2e0f8 <_sk_srcover_bgra_8888_sse41_lowp+0xa4>
   DB  243,65,15,111,36,144                ; movdqu        (%r8,%rdx,4),%xmm4
   DB  243,69,15,111,68,144,16             ; movdqu        0x10(%r8,%rdx,4),%xmm8
-  DB  235,74                              ; jmp           2e724 <_sk_srcover_bgra_8888_sse41_lowp+0xa4>
+  DB  235,74                              ; jmp           2e0f8 <_sk_srcover_bgra_8888_sse41_lowp+0xa4>
   DB  102,65,15,110,100,144,8             ; movd          0x8(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  243,65,15,126,36,144                ; movq          (%r8,%rdx,4),%xmm4
   DB  102,65,15,58,14,224,240             ; pblendw       $0xf0,%xmm8,%xmm4
   DB  102,68,15,111,197                   ; movdqa        %xmm5,%xmm8
-  DB  235,37                              ; jmp           2e724 <_sk_srcover_bgra_8888_sse41_lowp+0xa4>
+  DB  235,37                              ; jmp           2e0f8 <_sk_srcover_bgra_8888_sse41_lowp+0xa4>
   DB  102,65,15,110,100,144,24            ; movd          0x18(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  102,69,15,58,34,68,144,20,1         ; pinsrd        $0x1,0x14(%r8,%rdx,4),%xmm8
   DB  102,69,15,58,34,68,144,16,0         ; pinsrd        $0x0,0x10(%r8,%rdx,4),%xmm8
   DB  243,65,15,111,36,144                ; movdqu        (%r8,%rdx,4),%xmm4
-  DB  102,15,111,53,100,94,0,0            ; movdqa        0x5e64(%rip),%xmm6        # 34590 <_sk_srcover_bgra_8888_sse2_lowp+0x1374>
+  DB  102,15,111,53,112,94,0,0            ; movdqa        0x5e70(%rip),%xmm6        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0x1380>
   DB  102,15,111,236                      ; movdqa        %xmm4,%xmm5
   DB  102,15,56,0,238                     ; pshufb        %xmm6,%xmm5
   DB  102,65,15,111,248                   ; movdqa        %xmm8,%xmm7
   DB  102,15,56,0,254                     ; pshufb        %xmm6,%xmm7
   DB  102,15,108,239                      ; punpcklqdq    %xmm7,%xmm5
-  DB  102,68,15,111,37,228,86,0,0         ; movdqa        0x56e4(%rip),%xmm12        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,37,240,86,0,0         ; movdqa        0x56f0(%rip),%xmm12        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,111,245                      ; movdqa        %xmm5,%xmm6
   DB  102,65,15,219,244                   ; pand          %xmm12,%xmm6
   DB  102,15,113,213,8                    ; psrlw         $0x8,%xmm5
-  DB  102,68,15,111,13,61,94,0,0          ; movdqa        0x5e3d(%rip),%xmm9        # 345a0 <_sk_srcover_bgra_8888_sse2_lowp+0x1384>
+  DB  102,68,15,111,13,73,94,0,0          ; movdqa        0x5e49(%rip),%xmm9        # 33f80 <_sk_srcover_bgra_8888_sse2_lowp+0x1390>
   DB  102,15,111,252                      ; movdqa        %xmm4,%xmm7
   DB  102,65,15,56,0,249                  ; pshufb        %xmm9,%xmm7
   DB  102,69,15,111,208                   ; movdqa        %xmm8,%xmm10
   DB  102,69,15,56,0,209                  ; pshufb        %xmm9,%xmm10
   DB  102,65,15,108,250                   ; punpcklqdq    %xmm10,%xmm7
-  DB  102,68,15,111,13,42,94,0,0          ; movdqa        0x5e2a(%rip),%xmm9        # 345b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1394>
+  DB  102,68,15,111,13,54,94,0,0          ; movdqa        0x5e36(%rip),%xmm9        # 33f90 <_sk_srcover_bgra_8888_sse2_lowp+0x13a0>
   DB  102,65,15,56,0,225                  ; pshufb        %xmm9,%xmm4
   DB  102,69,15,56,0,193                  ; pshufb        %xmm9,%xmm8
   DB  102,65,15,108,224                   ; punpcklqdq    %xmm8,%xmm4
@@ -44378,19 +44118,19 @@
   DB  102,15,97,195                       ; punpcklwd     %xmm3,%xmm0
   DB  102,65,15,235,196                   ; por           %xmm12,%xmm0
   DB  65,128,250,6                        ; cmp           $0x6,%r10b
-  DB  119,24                              ; ja            2e86e <_sk_srcover_bgra_8888_sse41_lowp+0x1ee>
-  DB  76,141,21,135,0,0,0                 ; lea           0x87(%rip),%r10        # 2e8e4 <_sk_srcover_bgra_8888_sse41_lowp+0x264>
+  DB  119,24                              ; ja            2e242 <_sk_srcover_bgra_8888_sse41_lowp+0x1ee>
+  DB  76,141,21,135,0,0,0                 ; lea           0x87(%rip),%r10        # 2e2b8 <_sk_srcover_bgra_8888_sse41_lowp+0x264>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,65,15,126,4,144                 ; movd          %xmm0,(%r8,%rdx,4)
-  DB  235,63                              ; jmp           2e8ad <_sk_srcover_bgra_8888_sse41_lowp+0x22d>
+  DB  235,63                              ; jmp           2e281 <_sk_srcover_bgra_8888_sse41_lowp+0x22d>
   DB  243,65,15,127,4,144                 ; movdqu        %xmm0,(%r8,%rdx,4)
   DB  243,65,15,127,76,144,16             ; movdqu        %xmm1,0x10(%r8,%rdx,4)
-  DB  235,48                              ; jmp           2e8ad <_sk_srcover_bgra_8888_sse41_lowp+0x22d>
+  DB  235,48                              ; jmp           2e281 <_sk_srcover_bgra_8888_sse41_lowp+0x22d>
   DB  102,65,15,58,22,68,144,8,2          ; pextrd        $0x2,%xmm0,0x8(%r8,%rdx,4)
   DB  102,65,15,214,4,144                 ; movq          %xmm0,(%r8,%rdx,4)
-  DB  235,31                              ; jmp           2e8ad <_sk_srcover_bgra_8888_sse41_lowp+0x22d>
+  DB  235,31                              ; jmp           2e281 <_sk_srcover_bgra_8888_sse41_lowp+0x22d>
   DB  102,65,15,58,22,76,144,24,2         ; pextrd        $0x2,%xmm1,0x18(%r8,%rdx,4)
   DB  102,65,15,58,22,76,144,20,1         ; pextrd        $0x1,%xmm1,0x14(%r8,%rdx,4)
   DB  102,65,15,126,76,144,16             ; movd          %xmm1,0x10(%r8,%rdx,4)
@@ -44465,13 +44205,13 @@
   DB  73,137,246                          ; mov           %rsi,%r14
   DB  76,137,141,8,255,255,255            ; mov           %r9,-0xf8(%rbp)
   DB  76,57,203                           ; cmp           %r9,%rbx
-  DB  15,131,153,0,0,0                    ; jae           2ea1a <_sk_start_pipeline_sse2_lowp+0x11a>
+  DB  15,131,153,0,0,0                    ; jae           2e3ee <_sk_start_pipeline_sse2_lowp+0x11a>
   DB  72,139,133,24,255,255,255           ; mov           -0xe8(%rbp),%rax
   DB  72,141,64,8                         ; lea           0x8(%rax),%rax
   DB  72,137,133,16,255,255,255           ; mov           %rax,-0xf0(%rbp)
   DB  76,57,189,16,255,255,255            ; cmp           %r15,-0xf0(%rbp)
   DB  72,139,149,24,255,255,255           ; mov           -0xe8(%rbp),%rdx
-  DB  119,62                              ; ja            2e9e1 <_sk_start_pipeline_sse2_lowp+0xe1>
+  DB  119,62                              ; ja            2e3b5 <_sk_start_pipeline_sse2_lowp+0xe1>
   DB  76,139,165,24,255,255,255           ; mov           -0xe8(%rbp),%r12
   DB  49,255                              ; xor           %edi,%edi
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
@@ -44490,10 +44230,10 @@
   DB  73,131,196,16                       ; add           $0x10,%r12
   DB  77,57,252                           ; cmp           %r15,%r12
   DB  73,137,212                          ; mov           %rdx,%r12
-  DB  118,201                             ; jbe           2e9aa <_sk_start_pipeline_sse2_lowp+0xaa>
+  DB  118,201                             ; jbe           2e37e <_sk_start_pipeline_sse2_lowp+0xaa>
   DB  76,137,255                          ; mov           %r15,%rdi
   DB  72,41,215                           ; sub           %rdx,%rdi
-  DB  116,33                              ; je            2ea0a <_sk_start_pipeline_sse2_lowp+0x10a>
+  DB  116,33                              ; je            2e3de <_sk_start_pipeline_sse2_lowp+0x10a>
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  15,87,201                           ; xorps         %xmm1,%xmm1
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
@@ -44507,7 +44247,7 @@
   DB  65,255,213                          ; callq         *%r13
   DB  72,255,195                          ; inc           %rbx
   DB  72,59,157,8,255,255,255             ; cmp           -0xf8(%rbp),%rbx
-  DB  15,133,121,255,255,255              ; jne           2e993 <_sk_start_pipeline_sse2_lowp+0x93>
+  DB  15,133,121,255,255,255              ; jne           2e367 <_sk_start_pipeline_sse2_lowp+0x93>
   DB  15,40,181,32,255,255,255            ; movaps        -0xe0(%rbp),%xmm6
   DB  15,40,189,48,255,255,255            ; movaps        -0xd0(%rbp),%xmm7
   DB  68,15,40,133,64,255,255,255         ; movaps        -0xc0(%rbp),%xmm8
@@ -44546,7 +44286,7 @@
   DB  102,15,110,209                      ; movd          %ecx,%xmm2
   DB  102,15,112,210,0                    ; pshufd        $0x0,%xmm2,%xmm2
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
-  DB  15,88,21,225,83,0,0                 ; addps         0x53e1(%rip),%xmm2        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  15,88,21,237,83,0,0                 ; addps         0x53ed(%rip),%xmm2        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,40,218                           ; movaps        %xmm2,%xmm3
   DB  255,224                             ; jmpq          *%rax
@@ -44711,7 +44451,7 @@
 PUBLIC _sk_black_color_sse2_lowp
 _sk_black_color_sse2_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,38,81,0,0                  ; movaps        0x5126(%rip),%xmm3        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  15,40,29,50,81,0,0                  ; movaps        0x5132(%rip),%xmm3        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  15,87,201                           ; xorps         %xmm1,%xmm1
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
@@ -44720,7 +44460,7 @@
 PUBLIC _sk_white_color_sse2_lowp
 _sk_white_color_sse2_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,5,18,81,0,0                   ; movaps        0x5112(%rip),%xmm0        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  15,40,5,30,81,0,0                   ; movaps        0x511e(%rip),%xmm0        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  15,40,216                           ; movaps        %xmm0,%xmm3
@@ -44729,10 +44469,10 @@
 PUBLIC _sk_set_rgb_sse2_lowp
 _sk_set_rgb_sse2_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  243,15,16,21,197,71,0,0             ; movss         0x47c5(%rip),%xmm2        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  243,15,16,21,197,71,0,0             ; movss         0x47c5(%rip),%xmm2        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
   DB  243,15,16,0                         ; movss         (%rax),%xmm0
   DB  243,15,89,194                       ; mulss         %xmm2,%xmm0
-  DB  243,68,15,16,5,132,71,0,0           ; movss         0x4784(%rip),%xmm8        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  243,68,15,16,5,132,71,0,0           ; movss         0x4784(%rip),%xmm8        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  243,65,15,88,192                    ; addss         %xmm8,%xmm0
   DB  243,68,15,44,192                    ; cvttss2si     %xmm0,%r8d
   DB  102,65,15,110,192                   ; movd          %r8d,%xmm0
@@ -44756,7 +44496,7 @@
 
 PUBLIC _sk_clamp_a_sse2_lowp
 _sk_clamp_a_sse2_lowp LABEL PROC
-  DB  102,68,15,111,5,216,87,0,0          ; movdqa        0x57d8(%rip),%xmm8        # 34580 <_sk_srcover_bgra_8888_sse2_lowp+0x1364>
+  DB  102,68,15,111,5,228,87,0,0          ; movdqa        0x57e4(%rip),%xmm8        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0x1370>
   DB  102,68,15,111,200                   ; movdqa        %xmm0,%xmm9
   DB  102,69,15,239,200                   ; pxor          %xmm8,%xmm9
   DB  102,68,15,111,211                   ; movdqa        %xmm3,%xmm10
@@ -44783,7 +44523,7 @@
 
 PUBLIC _sk_clamp_a_dst_sse2_lowp
 _sk_clamp_a_dst_sse2_lowp LABEL PROC
-  DB  102,68,15,111,5,98,87,0,0           ; movdqa        0x5762(%rip),%xmm8        # 34580 <_sk_srcover_bgra_8888_sse2_lowp+0x1364>
+  DB  102,68,15,111,5,110,87,0,0          ; movdqa        0x576e(%rip),%xmm8        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0x1370>
   DB  102,68,15,111,204                   ; movdqa        %xmm4,%xmm9
   DB  102,69,15,239,200                   ; pxor          %xmm8,%xmm9
   DB  102,68,15,111,215                   ; movdqa        %xmm7,%xmm10
@@ -44811,7 +44551,7 @@
 PUBLIC _sk_premul_sse2_lowp
 _sk_premul_sse2_lowp LABEL PROC
   DB  102,15,213,195                      ; pmullw        %xmm3,%xmm0
-  DB  102,68,15,111,5,152,79,0,0          ; movdqa        0x4f98(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,5,164,79,0,0          ; movdqa        0x4fa4(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,192                   ; paddw         %xmm8,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,15,213,203                      ; pmullw        %xmm3,%xmm1
@@ -44826,7 +44566,7 @@
 PUBLIC _sk_premul_dst_sse2_lowp
 _sk_premul_dst_sse2_lowp LABEL PROC
   DB  102,15,213,231                      ; pmullw        %xmm7,%xmm4
-  DB  102,68,15,111,5,97,79,0,0           ; movdqa        0x4f61(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,5,109,79,0,0          ; movdqa        0x4f6d(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,224                   ; paddw         %xmm8,%xmm4
   DB  102,15,113,212,8                    ; psrlw         $0x8,%xmm4
   DB  102,15,213,239                      ; pmullw        %xmm7,%xmm5
@@ -44866,7 +44606,7 @@
 
 PUBLIC _sk_invert_sse2_lowp
 _sk_invert_sse2_lowp LABEL PROC
-  DB  102,68,15,111,5,255,78,0,0          ; movdqa        0x4eff(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,5,11,79,0,0           ; movdqa        0x4f0b(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,69,15,111,200                   ; movdqa        %xmm8,%xmm9
   DB  102,68,15,249,200                   ; psubw         %xmm0,%xmm9
   DB  102,69,15,111,208                   ; movdqa        %xmm8,%xmm10
@@ -44894,7 +44634,7 @@
 _sk_srcatop_sse2_lowp LABEL PROC
   DB  102,68,15,111,195                   ; movdqa        %xmm3,%xmm8
   DB  102,15,213,199                      ; pmullw        %xmm7,%xmm0
-  DB  102,15,111,29,163,78,0,0            ; movdqa        0x4ea3(%rip),%xmm3        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,15,111,29,175,78,0,0            ; movdqa        0x4eaf(%rip),%xmm3        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,68,15,111,203                   ; movdqa        %xmm3,%xmm9
   DB  102,69,15,249,200                   ; psubw         %xmm8,%xmm9
   DB  102,69,15,111,193                   ; movdqa        %xmm9,%xmm8
@@ -44924,7 +44664,7 @@
 _sk_dstatop_sse2_lowp LABEL PROC
   DB  102,68,15,111,196                   ; movdqa        %xmm4,%xmm8
   DB  102,68,15,213,195                   ; pmullw        %xmm3,%xmm8
-  DB  102,68,15,111,13,35,78,0,0          ; movdqa        0x4e23(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,47,78,0,0          ; movdqa        0x4e2f(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,69,15,253,193                   ; paddw         %xmm9,%xmm8
   DB  102,68,15,111,213                   ; movdqa        %xmm5,%xmm10
   DB  102,68,15,213,211                   ; pmullw        %xmm3,%xmm10
@@ -44951,7 +44691,7 @@
 PUBLIC _sk_srcin_sse2_lowp
 _sk_srcin_sse2_lowp LABEL PROC
   DB  102,15,213,199                      ; pmullw        %xmm7,%xmm0
-  DB  102,68,15,111,5,174,77,0,0          ; movdqa        0x4dae(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,5,186,77,0,0          ; movdqa        0x4dba(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,192                   ; paddw         %xmm8,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,15,213,207                      ; pmullw        %xmm7,%xmm1
@@ -44970,7 +44710,7 @@
 _sk_dstin_sse2_lowp LABEL PROC
   DB  102,15,111,196                      ; movdqa        %xmm4,%xmm0
   DB  102,15,213,195                      ; pmullw        %xmm3,%xmm0
-  DB  102,68,15,111,5,101,77,0,0          ; movdqa        0x4d65(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,5,113,77,0,0          ; movdqa        0x4d71(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,192                   ; paddw         %xmm8,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,15,111,205                      ; movdqa        %xmm5,%xmm1
@@ -44989,7 +44729,7 @@
 
 PUBLIC _sk_srcout_sse2_lowp
 _sk_srcout_sse2_lowp LABEL PROC
-  DB  102,68,15,111,5,28,77,0,0           ; movdqa        0x4d1c(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,5,40,77,0,0           ; movdqa        0x4d28(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,69,15,111,200                   ; movdqa        %xmm8,%xmm9
   DB  102,68,15,249,207                   ; psubw         %xmm7,%xmm9
   DB  102,65,15,213,193                   ; pmullw        %xmm9,%xmm0
@@ -45010,7 +44750,7 @@
 PUBLIC _sk_dstout_sse2_lowp
 _sk_dstout_sse2_lowp LABEL PROC
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
-  DB  102,68,15,111,5,197,76,0,0          ; movdqa        0x4cc5(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,5,209,76,0,0          ; movdqa        0x4cd1(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,111,216                   ; movdqa        %xmm8,%xmm3
   DB  102,15,249,216                      ; psubw         %xmm0,%xmm3
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
@@ -45033,7 +44773,7 @@
 
 PUBLIC _sk_srcover_sse2_lowp
 _sk_srcover_sse2_lowp LABEL PROC
-  DB  102,68,15,111,13,107,76,0,0         ; movdqa        0x4c6b(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,119,76,0,0         ; movdqa        0x4c77(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,69,15,111,193                   ; movdqa        %xmm9,%xmm8
   DB  102,68,15,249,195                   ; psubw         %xmm3,%xmm8
   DB  102,69,15,111,208                   ; movdqa        %xmm8,%xmm10
@@ -45060,7 +44800,7 @@
 
 PUBLIC _sk_dstover_sse2_lowp
 _sk_dstover_sse2_lowp LABEL PROC
-  DB  102,68,15,111,5,241,75,0,0          ; movdqa        0x4bf1(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,5,253,75,0,0          ; movdqa        0x4bfd(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,69,15,111,200                   ; movdqa        %xmm8,%xmm9
   DB  102,68,15,249,207                   ; psubw         %xmm7,%xmm9
   DB  102,65,15,213,193                   ; pmullw        %xmm9,%xmm0
@@ -45085,7 +44825,7 @@
 PUBLIC _sk_modulate_sse2_lowp
 _sk_modulate_sse2_lowp LABEL PROC
   DB  102,15,213,196                      ; pmullw        %xmm4,%xmm0
-  DB  102,68,15,111,5,138,75,0,0          ; movdqa        0x4b8a(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,5,150,75,0,0          ; movdqa        0x4b96(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,192                   ; paddw         %xmm8,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,15,213,205                      ; pmullw        %xmm5,%xmm1
@@ -45102,7 +44842,7 @@
 
 PUBLIC _sk_multiply_sse2_lowp
 _sk_multiply_sse2_lowp LABEL PROC
-  DB  102,68,15,111,13,73,75,0,0          ; movdqa        0x4b49(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,85,75,0,0          ; movdqa        0x4b55(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,69,15,111,193                   ; movdqa        %xmm9,%xmm8
   DB  102,68,15,249,195                   ; psubw         %xmm3,%xmm8
   DB  102,69,15,111,208                   ; movdqa        %xmm8,%xmm10
@@ -45145,12 +44885,12 @@
   DB  102,68,15,111,193                   ; movdqa        %xmm1,%xmm8
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
   DB  102,15,253,204                      ; paddw         %xmm4,%xmm1
-  DB  102,68,15,111,21,213,82,0,0         ; movdqa        0x52d5(%rip),%xmm10        # 34680 <_sk_srcover_bgra_8888_sse2_lowp+0x1464>
+  DB  102,68,15,111,21,225,82,0,0         ; movdqa        0x52e1(%rip),%xmm10        # 34060 <_sk_srcover_bgra_8888_sse2_lowp+0x1470>
   DB  102,15,111,193                      ; movdqa        %xmm1,%xmm0
   DB  102,65,15,217,194                   ; psubusw       %xmm10,%xmm0
   DB  102,69,15,239,228                   ; pxor          %xmm12,%xmm12
   DB  102,65,15,117,196                   ; pcmpeqw       %xmm12,%xmm0
-  DB  102,68,15,111,29,105,74,0,0         ; movdqa        0x4a69(%rip),%xmm11        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,29,117,74,0,0         ; movdqa        0x4a75(%rip),%xmm11        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,219,200                      ; pand          %xmm0,%xmm1
   DB  102,65,15,223,195                   ; pandn         %xmm11,%xmm0
   DB  102,15,235,193                      ; por           %xmm1,%xmm0
@@ -45187,7 +44927,7 @@
   DB  102,15,111,196                      ; movdqa        %xmm4,%xmm0
   DB  102,15,253,193                      ; paddw         %xmm1,%xmm0
   DB  102,15,213,204                      ; pmullw        %xmm4,%xmm1
-  DB  102,68,15,111,21,201,73,0,0         ; movdqa        0x49c9(%rip),%xmm10        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,21,213,73,0,0         ; movdqa        0x49d5(%rip),%xmm10        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,202                   ; paddw         %xmm10,%xmm1
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
   DB  102,15,249,193                      ; psubw         %xmm1,%xmm0
@@ -45217,7 +44957,7 @@
 PUBLIC _sk_xor__sse2_lowp
 _sk_xor__sse2_lowp LABEL PROC
   DB  102,68,15,111,195                   ; movdqa        %xmm3,%xmm8
-  DB  102,68,15,111,13,71,73,0,0          ; movdqa        0x4947(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,83,73,0,0          ; movdqa        0x4953(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,69,15,111,209                   ; movdqa        %xmm9,%xmm10
   DB  102,68,15,249,215                   ; psubw         %xmm7,%xmm10
   DB  102,65,15,213,194                   ; pmullw        %xmm10,%xmm0
@@ -45257,7 +44997,7 @@
   DB  102,65,15,253,194                   ; paddw         %xmm10,%xmm0
   DB  102,68,15,213,215                   ; pmullw        %xmm7,%xmm10
   DB  102,68,15,213,227                   ; pmullw        %xmm3,%xmm12
-  DB  102,68,15,111,13,226,79,0,0         ; movdqa        0x4fe2(%rip),%xmm9        # 34580 <_sk_srcover_bgra_8888_sse2_lowp+0x1364>
+  DB  102,68,15,111,13,238,79,0,0         ; movdqa        0x4fee(%rip),%xmm9        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0x1370>
   DB  102,69,15,111,218                   ; movdqa        %xmm10,%xmm11
   DB  102,69,15,239,217                   ; pxor          %xmm9,%xmm11
   DB  102,65,15,111,204                   ; movdqa        %xmm12,%xmm1
@@ -45266,7 +45006,7 @@
   DB  102,68,15,219,225                   ; pand          %xmm1,%xmm12
   DB  102,65,15,223,202                   ; pandn         %xmm10,%xmm1
   DB  102,65,15,235,204                   ; por           %xmm12,%xmm1
-  DB  102,68,15,111,21,97,72,0,0          ; movdqa        0x4861(%rip),%xmm10        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,21,109,72,0,0         ; movdqa        0x486d(%rip),%xmm10        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,202                   ; paddw         %xmm10,%xmm1
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
   DB  102,15,249,193                      ; psubw         %xmm1,%xmm0
@@ -45320,7 +45060,7 @@
   DB  102,65,15,253,196                   ; paddw         %xmm12,%xmm0
   DB  102,68,15,213,231                   ; pmullw        %xmm7,%xmm12
   DB  102,68,15,213,211                   ; pmullw        %xmm3,%xmm10
-  DB  102,68,15,111,13,185,78,0,0         ; movdqa        0x4eb9(%rip),%xmm9        # 34580 <_sk_srcover_bgra_8888_sse2_lowp+0x1364>
+  DB  102,68,15,111,13,197,78,0,0         ; movdqa        0x4ec5(%rip),%xmm9        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0x1370>
   DB  102,69,15,111,220                   ; movdqa        %xmm12,%xmm11
   DB  102,69,15,239,217                   ; pxor          %xmm9,%xmm11
   DB  102,65,15,111,202                   ; movdqa        %xmm10,%xmm1
@@ -45329,7 +45069,7 @@
   DB  102,68,15,219,225                   ; pand          %xmm1,%xmm12
   DB  102,65,15,223,202                   ; pandn         %xmm10,%xmm1
   DB  102,65,15,235,204                   ; por           %xmm12,%xmm1
-  DB  102,68,15,111,21,56,71,0,0          ; movdqa        0x4738(%rip),%xmm10        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,21,68,71,0,0          ; movdqa        0x4744(%rip),%xmm10        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,202                   ; paddw         %xmm10,%xmm1
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
   DB  102,15,249,193                      ; psubw         %xmm1,%xmm0
@@ -45383,7 +45123,7 @@
   DB  102,65,15,253,196                   ; paddw         %xmm12,%xmm0
   DB  102,68,15,213,231                   ; pmullw        %xmm7,%xmm12
   DB  102,68,15,213,211                   ; pmullw        %xmm3,%xmm10
-  DB  102,68,15,111,13,144,77,0,0         ; movdqa        0x4d90(%rip),%xmm9        # 34580 <_sk_srcover_bgra_8888_sse2_lowp+0x1364>
+  DB  102,68,15,111,13,156,77,0,0         ; movdqa        0x4d9c(%rip),%xmm9        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0x1370>
   DB  102,69,15,111,220                   ; movdqa        %xmm12,%xmm11
   DB  102,69,15,239,217                   ; pxor          %xmm9,%xmm11
   DB  102,65,15,111,202                   ; movdqa        %xmm10,%xmm1
@@ -45392,10 +45132,10 @@
   DB  102,68,15,219,225                   ; pand          %xmm1,%xmm12
   DB  102,65,15,223,202                   ; pandn         %xmm10,%xmm1
   DB  102,65,15,235,204                   ; por           %xmm12,%xmm1
-  DB  102,68,15,111,21,15,70,0,0          ; movdqa        0x460f(%rip),%xmm10        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,21,27,70,0,0          ; movdqa        0x461b(%rip),%xmm10        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,202                   ; paddw         %xmm10,%xmm1
   DB  102,15,113,209,7                    ; psrlw         $0x7,%xmm1
-  DB  102,68,15,111,29,60,77,0,0          ; movdqa        0x4d3c(%rip),%xmm11        # 34570 <_sk_srcover_bgra_8888_sse2_lowp+0x1354>
+  DB  102,68,15,111,29,72,77,0,0          ; movdqa        0x4d48(%rip),%xmm11        # 33f50 <_sk_srcover_bgra_8888_sse2_lowp+0x1360>
   DB  102,65,15,219,203                   ; pand          %xmm11,%xmm1
   DB  102,15,249,193                      ; psubw         %xmm1,%xmm0
   DB  102,68,15,111,229                   ; movdqa        %xmm5,%xmm12
@@ -45448,10 +45188,10 @@
   DB  102,15,111,196                      ; movdqa        %xmm4,%xmm0
   DB  102,15,253,193                      ; paddw         %xmm1,%xmm0
   DB  102,15,213,204                      ; pmullw        %xmm4,%xmm1
-  DB  102,68,15,111,13,12,69,0,0          ; movdqa        0x450c(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,24,69,0,0          ; movdqa        0x4518(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,201                   ; paddw         %xmm9,%xmm1
   DB  102,15,113,209,7                    ; psrlw         $0x7,%xmm1
-  DB  102,68,15,111,21,57,76,0,0          ; movdqa        0x4c39(%rip),%xmm10        # 34570 <_sk_srcover_bgra_8888_sse2_lowp+0x1354>
+  DB  102,68,15,111,21,69,76,0,0          ; movdqa        0x4c45(%rip),%xmm10        # 33f50 <_sk_srcover_bgra_8888_sse2_lowp+0x1360>
   DB  102,65,15,219,202                   ; pand          %xmm10,%xmm1
   DB  102,15,249,193                      ; psubw         %xmm1,%xmm0
   DB  102,15,111,205                      ; movdqa        %xmm5,%xmm1
@@ -45486,7 +45226,7 @@
   DB  102,15,111,236                      ; movdqa        %xmm4,%xmm5
   DB  102,68,15,111,194                   ; movdqa        %xmm2,%xmm8
   DB  102,68,15,111,200                   ; movdqa        %xmm0,%xmm9
-  DB  102,15,111,21,101,68,0,0            ; movdqa        0x4465(%rip),%xmm2        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,15,111,21,113,68,0,0            ; movdqa        0x4471(%rip),%xmm2        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,68,15,111,226                   ; movdqa        %xmm2,%xmm12
   DB  102,68,15,249,231                   ; psubw         %xmm7,%xmm12
   DB  102,65,15,111,196                   ; movdqa        %xmm12,%xmm0
@@ -45499,7 +45239,7 @@
   DB  102,68,15,111,243                   ; movdqa        %xmm3,%xmm14
   DB  102,69,15,249,241                   ; psubw         %xmm9,%xmm14
   DB  102,69,15,253,201                   ; paddw         %xmm9,%xmm9
-  DB  102,15,111,21,113,75,0,0            ; movdqa        0x4b71(%rip),%xmm2        # 34580 <_sk_srcover_bgra_8888_sse2_lowp+0x1364>
+  DB  102,15,111,21,125,75,0,0            ; movdqa        0x4b7d(%rip),%xmm2        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0x1370>
   DB  102,15,111,199                      ; movdqa        %xmm7,%xmm0
   DB  102,68,15,111,215                   ; movdqa        %xmm7,%xmm10
   DB  102,15,111,231                      ; movdqa        %xmm7,%xmm4
@@ -45518,7 +45258,7 @@
   DB  102,68,15,219,232                   ; pand          %xmm0,%xmm13
   DB  102,65,15,223,193                   ; pandn         %xmm9,%xmm0
   DB  102,65,15,235,197                   ; por           %xmm13,%xmm0
-  DB  102,15,253,5,196,67,0,0             ; paddw         0x43c4(%rip),%xmm0        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,15,253,5,208,67,0,0             ; paddw         0x43d0(%rip),%xmm0        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,199                   ; paddw         %xmm15,%xmm0
   DB  102,69,15,111,204                   ; movdqa        %xmm12,%xmm9
   DB  102,68,15,213,201                   ; pmullw        %xmm1,%xmm9
@@ -45541,7 +45281,7 @@
   DB  102,65,15,219,249                   ; pand          %xmm9,%xmm7
   DB  102,68,15,223,201                   ; pandn         %xmm1,%xmm9
   DB  102,68,15,235,207                   ; por           %xmm7,%xmm9
-  DB  102,68,15,253,13,79,67,0,0          ; paddw         0x434f(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,253,13,91,67,0,0          ; paddw         0x435b(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,69,15,253,205                   ; paddw         %xmm13,%xmm9
   DB  102,69,15,213,224                   ; pmullw        %xmm8,%xmm12
   DB  102,69,15,111,251                   ; movdqa        %xmm11,%xmm15
@@ -45563,7 +45303,7 @@
   DB  102,68,15,219,210                   ; pand          %xmm2,%xmm10
   DB  102,65,15,223,208                   ; pandn         %xmm8,%xmm2
   DB  102,65,15,235,210                   ; por           %xmm10,%xmm2
-  DB  102,68,15,111,5,224,66,0,0          ; movdqa        0x42e0(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,5,236,66,0,0          ; movdqa        0x42ec(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,208                   ; paddw         %xmm8,%xmm2
   DB  102,65,15,253,215                   ; paddw         %xmm15,%xmm2
   DB  102,68,15,213,220                   ; pmullw        %xmm4,%xmm11
@@ -45591,7 +45331,7 @@
   DB  102,15,127,124,36,16                ; movdqa        %xmm7,0x10(%rsp)
   DB  102,68,15,111,193                   ; movdqa        %xmm1,%xmm8
   DB  102,68,15,111,248                   ; movdqa        %xmm0,%xmm15
-  DB  102,15,111,53,106,66,0,0            ; movdqa        0x426a(%rip),%xmm6        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,15,111,53,118,66,0,0            ; movdqa        0x4276(%rip),%xmm6        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,68,15,111,222                   ; movdqa        %xmm6,%xmm11
   DB  102,69,15,249,222                   ; psubw         %xmm14,%xmm11
   DB  102,65,15,111,203                   ; movdqa        %xmm11,%xmm1
@@ -45613,7 +45353,7 @@
   DB  102,15,253,201                      ; paddw         %xmm1,%xmm1
   DB  102,69,15,111,225                   ; movdqa        %xmm9,%xmm12
   DB  102,68,15,249,225                   ; psubw         %xmm1,%xmm12
-  DB  102,15,111,13,78,73,0,0             ; movdqa        0x494e(%rip),%xmm1        # 34580 <_sk_srcover_bgra_8888_sse2_lowp+0x1364>
+  DB  102,15,111,13,90,73,0,0             ; movdqa        0x495a(%rip),%xmm1        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0x1370>
   DB  102,69,15,111,238                   ; movdqa        %xmm14,%xmm13
   DB  102,68,15,239,233                   ; pxor          %xmm1,%xmm13
   DB  102,15,239,249                      ; pxor          %xmm1,%xmm7
@@ -45640,7 +45380,7 @@
   DB  102,68,15,213,197                   ; pmullw        %xmm5,%xmm8
   DB  102,15,111,229                      ; movdqa        %xmm5,%xmm4
   DB  102,15,253,228                      ; paddw         %xmm4,%xmm4
-  DB  102,15,111,61,205,72,0,0            ; movdqa        0x48cd(%rip),%xmm7        # 34580 <_sk_srcover_bgra_8888_sse2_lowp+0x1364>
+  DB  102,15,111,61,217,72,0,0            ; movdqa        0x48d9(%rip),%xmm7        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0x1370>
   DB  102,15,239,231                      ; pxor          %xmm7,%xmm4
   DB  102,65,15,101,229                   ; pcmpgtw       %xmm13,%xmm4
   DB  102,69,15,253,192                   ; paddw         %xmm8,%xmm8
@@ -45699,27 +45439,27 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,41                              ; ja            2fdcc <_sk_load_8888_sse2_lowp+0x44>
+  DB  119,41                              ; ja            2f7a0 <_sk_load_8888_sse2_lowp+0x44>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,22,1,0,0                  ; lea           0x116(%rip),%r9        # 2fec8 <_sk_load_8888_sse2_lowp+0x140>
+  DB  76,141,13,22,1,0,0                  ; lea           0x116(%rip),%r9        # 2f89c <_sk_load_8888_sse2_lowp+0x140>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  255,224                             ; jmpq          *%rax
   DB  243,65,15,16,28,144                 ; movss         (%r8,%rdx,4),%xmm3
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  235,102                             ; jmp           2fe32 <_sk_load_8888_sse2_lowp+0xaa>
+  DB  235,102                             ; jmp           2f806 <_sk_load_8888_sse2_lowp+0xaa>
   DB  102,65,15,16,28,144                 ; movupd        (%r8,%rdx,4),%xmm3
   DB  243,69,15,111,68,144,16             ; movdqu        0x10(%r8,%rdx,4),%xmm8
-  DB  235,87                              ; jmp           2fe32 <_sk_load_8888_sse2_lowp+0xaa>
+  DB  235,87                              ; jmp           2f806 <_sk_load_8888_sse2_lowp+0xaa>
   DB  102,65,15,110,68,144,8              ; movd          0x8(%r8,%rdx,4),%xmm0
   DB  102,68,15,112,192,69                ; pshufd        $0x45,%xmm0,%xmm8
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,69,15,18,4,144                  ; movlpd        (%r8,%rdx,4),%xmm8
   DB  102,65,15,40,216                    ; movapd        %xmm8,%xmm3
   DB  102,68,15,111,192                   ; movdqa        %xmm0,%xmm8
-  DB  235,52                              ; jmp           2fe32 <_sk_load_8888_sse2_lowp+0xaa>
+  DB  235,52                              ; jmp           2f806 <_sk_load_8888_sse2_lowp+0xaa>
   DB  102,65,15,110,68,144,24             ; movd          0x18(%r8,%rdx,4),%xmm0
   DB  102,68,15,112,192,69                ; pshufd        $0x45,%xmm0,%xmm8
   DB  243,65,15,16,68,144,20              ; movss         0x14(%r8,%rdx,4),%xmm0
@@ -45736,7 +45476,7 @@
   DB  102,15,114,240,16                   ; pslld         $0x10,%xmm0
   DB  102,15,114,224,16                   ; psrad         $0x10,%xmm0
   DB  102,15,107,200                      ; packssdw      %xmm0,%xmm1
-  DB  102,68,15,111,13,212,63,0,0         ; movdqa        0x3fd4(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,224,63,0,0         ; movdqa        0x3fe0(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,111,193                      ; movdqa        %xmm1,%xmm0
   DB  102,65,15,219,193                   ; pand          %xmm9,%xmm0
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
@@ -45787,27 +45527,27 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,41                              ; ja            2ff28 <_sk_load_8888_dst_sse2_lowp+0x44>
+  DB  119,41                              ; ja            2f8fc <_sk_load_8888_dst_sse2_lowp+0x44>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,22,1,0,0                  ; lea           0x116(%rip),%r9        # 30024 <_sk_load_8888_dst_sse2_lowp+0x140>
+  DB  76,141,13,22,1,0,0                  ; lea           0x116(%rip),%r9        # 2f9f8 <_sk_load_8888_dst_sse2_lowp+0x140>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  255,224                             ; jmpq          *%rax
   DB  243,65,15,16,60,144                 ; movss         (%r8,%rdx,4),%xmm7
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  235,102                             ; jmp           2ff8e <_sk_load_8888_dst_sse2_lowp+0xaa>
+  DB  235,102                             ; jmp           2f962 <_sk_load_8888_dst_sse2_lowp+0xaa>
   DB  102,65,15,16,60,144                 ; movupd        (%r8,%rdx,4),%xmm7
   DB  243,69,15,111,68,144,16             ; movdqu        0x10(%r8,%rdx,4),%xmm8
-  DB  235,87                              ; jmp           2ff8e <_sk_load_8888_dst_sse2_lowp+0xaa>
+  DB  235,87                              ; jmp           2f962 <_sk_load_8888_dst_sse2_lowp+0xaa>
   DB  102,65,15,110,100,144,8             ; movd          0x8(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,69,15,18,4,144                  ; movlpd        (%r8,%rdx,4),%xmm8
   DB  102,65,15,40,248                    ; movapd        %xmm8,%xmm7
   DB  102,68,15,111,196                   ; movdqa        %xmm4,%xmm8
-  DB  235,52                              ; jmp           2ff8e <_sk_load_8888_dst_sse2_lowp+0xaa>
+  DB  235,52                              ; jmp           2f962 <_sk_load_8888_dst_sse2_lowp+0xaa>
   DB  102,65,15,110,100,144,24            ; movd          0x18(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  243,65,15,16,100,144,20             ; movss         0x14(%r8,%rdx,4),%xmm4
@@ -45824,7 +45564,7 @@
   DB  102,15,114,244,16                   ; pslld         $0x10,%xmm4
   DB  102,15,114,228,16                   ; psrad         $0x10,%xmm4
   DB  102,15,107,236                      ; packssdw      %xmm4,%xmm5
-  DB  102,68,15,111,13,120,62,0,0         ; movdqa        0x3e78(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,132,62,0,0         ; movdqa        0x3e84(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,111,229                      ; movdqa        %xmm5,%xmm4
   DB  102,65,15,219,225                   ; pand          %xmm9,%xmm4
   DB  102,15,113,213,8                    ; psrlw         $0x8,%xmm5
@@ -45890,21 +45630,21 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,27                              ; ja            300c3 <_sk_store_8888_sse2_lowp+0x83>
+  DB  119,27                              ; ja            2fa97 <_sk_store_8888_sse2_lowp+0x83>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,98,0,0,0                  ; lea           0x62(%rip),%r9        # 30114 <_sk_store_8888_sse2_lowp+0xd4>
+  DB  76,141,13,98,0,0,0                  ; lea           0x62(%rip),%r9        # 2fae8 <_sk_store_8888_sse2_lowp+0xd4>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,69,15,126,12,144                ; movd          %xmm9,(%r8,%rdx,4)
-  DB  235,75                              ; jmp           3010e <_sk_store_8888_sse2_lowp+0xce>
+  DB  235,75                              ; jmp           2fae2 <_sk_store_8888_sse2_lowp+0xce>
   DB  243,69,15,127,12,144                ; movdqu        %xmm9,(%r8,%rdx,4)
   DB  243,69,15,127,68,144,16             ; movdqu        %xmm8,0x10(%r8,%rdx,4)
-  DB  235,60                              ; jmp           3010e <_sk_store_8888_sse2_lowp+0xce>
+  DB  235,60                              ; jmp           2fae2 <_sk_store_8888_sse2_lowp+0xce>
   DB  102,69,15,112,193,78                ; pshufd        $0x4e,%xmm9,%xmm8
   DB  102,69,15,126,68,144,8              ; movd          %xmm8,0x8(%r8,%rdx,4)
   DB  102,69,15,214,12,144                ; movq          %xmm9,(%r8,%rdx,4)
-  DB  235,39                              ; jmp           3010e <_sk_store_8888_sse2_lowp+0xce>
+  DB  235,39                              ; jmp           2fae2 <_sk_store_8888_sse2_lowp+0xce>
   DB  102,69,15,112,208,78                ; pshufd        $0x4e,%xmm8,%xmm10
   DB  102,69,15,126,84,144,24             ; movd          %xmm10,0x18(%r8,%rdx,4)
   DB  102,69,15,112,208,229               ; pshufd        $0xe5,%xmm8,%xmm10
@@ -45947,27 +45687,27 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,41                              ; ja            30174 <_sk_load_bgra_sse2_lowp+0x44>
+  DB  119,41                              ; ja            2fb48 <_sk_load_bgra_sse2_lowp+0x44>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,22,1,0,0                  ; lea           0x116(%rip),%r9        # 30270 <_sk_load_bgra_sse2_lowp+0x140>
+  DB  76,141,13,22,1,0,0                  ; lea           0x116(%rip),%r9        # 2fc44 <_sk_load_bgra_sse2_lowp+0x140>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  255,224                             ; jmpq          *%rax
   DB  243,65,15,16,28,144                 ; movss         (%r8,%rdx,4),%xmm3
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  235,102                             ; jmp           301da <_sk_load_bgra_sse2_lowp+0xaa>
+  DB  235,102                             ; jmp           2fbae <_sk_load_bgra_sse2_lowp+0xaa>
   DB  102,65,15,16,28,144                 ; movupd        (%r8,%rdx,4),%xmm3
   DB  243,69,15,111,68,144,16             ; movdqu        0x10(%r8,%rdx,4),%xmm8
-  DB  235,87                              ; jmp           301da <_sk_load_bgra_sse2_lowp+0xaa>
+  DB  235,87                              ; jmp           2fbae <_sk_load_bgra_sse2_lowp+0xaa>
   DB  102,65,15,110,68,144,8              ; movd          0x8(%r8,%rdx,4),%xmm0
   DB  102,68,15,112,192,69                ; pshufd        $0x45,%xmm0,%xmm8
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,69,15,18,4,144                  ; movlpd        (%r8,%rdx,4),%xmm8
   DB  102,65,15,40,216                    ; movapd        %xmm8,%xmm3
   DB  102,68,15,111,192                   ; movdqa        %xmm0,%xmm8
-  DB  235,52                              ; jmp           301da <_sk_load_bgra_sse2_lowp+0xaa>
+  DB  235,52                              ; jmp           2fbae <_sk_load_bgra_sse2_lowp+0xaa>
   DB  102,65,15,110,68,144,24             ; movd          0x18(%r8,%rdx,4),%xmm0
   DB  102,68,15,112,192,69                ; pshufd        $0x45,%xmm0,%xmm8
   DB  243,65,15,16,68,144,20              ; movss         0x14(%r8,%rdx,4),%xmm0
@@ -45984,7 +45724,7 @@
   DB  102,15,114,240,16                   ; pslld         $0x10,%xmm0
   DB  102,15,114,224,16                   ; psrad         $0x10,%xmm0
   DB  102,15,107,200                      ; packssdw      %xmm0,%xmm1
-  DB  102,68,15,111,13,44,60,0,0          ; movdqa        0x3c2c(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,56,60,0,0          ; movdqa        0x3c38(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,111,209                      ; movdqa        %xmm1,%xmm2
   DB  102,65,15,219,209                   ; pand          %xmm9,%xmm2
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
@@ -46035,27 +45775,27 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,41                              ; ja            302d0 <_sk_load_bgra_dst_sse2_lowp+0x44>
+  DB  119,41                              ; ja            2fca4 <_sk_load_bgra_dst_sse2_lowp+0x44>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,22,1,0,0                  ; lea           0x116(%rip),%r9        # 303cc <_sk_load_bgra_dst_sse2_lowp+0x140>
+  DB  76,141,13,22,1,0,0                  ; lea           0x116(%rip),%r9        # 2fda0 <_sk_load_bgra_dst_sse2_lowp+0x140>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  255,224                             ; jmpq          *%rax
   DB  243,65,15,16,60,144                 ; movss         (%r8,%rdx,4),%xmm7
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  235,102                             ; jmp           30336 <_sk_load_bgra_dst_sse2_lowp+0xaa>
+  DB  235,102                             ; jmp           2fd0a <_sk_load_bgra_dst_sse2_lowp+0xaa>
   DB  102,65,15,16,60,144                 ; movupd        (%r8,%rdx,4),%xmm7
   DB  243,69,15,111,68,144,16             ; movdqu        0x10(%r8,%rdx,4),%xmm8
-  DB  235,87                              ; jmp           30336 <_sk_load_bgra_dst_sse2_lowp+0xaa>
+  DB  235,87                              ; jmp           2fd0a <_sk_load_bgra_dst_sse2_lowp+0xaa>
   DB  102,65,15,110,100,144,8             ; movd          0x8(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,69,15,18,4,144                  ; movlpd        (%r8,%rdx,4),%xmm8
   DB  102,65,15,40,248                    ; movapd        %xmm8,%xmm7
   DB  102,68,15,111,196                   ; movdqa        %xmm4,%xmm8
-  DB  235,52                              ; jmp           30336 <_sk_load_bgra_dst_sse2_lowp+0xaa>
+  DB  235,52                              ; jmp           2fd0a <_sk_load_bgra_dst_sse2_lowp+0xaa>
   DB  102,65,15,110,100,144,24            ; movd          0x18(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  243,65,15,16,100,144,20             ; movss         0x14(%r8,%rdx,4),%xmm4
@@ -46072,7 +45812,7 @@
   DB  102,15,114,244,16                   ; pslld         $0x10,%xmm4
   DB  102,15,114,228,16                   ; psrad         $0x10,%xmm4
   DB  102,15,107,236                      ; packssdw      %xmm4,%xmm5
-  DB  102,68,15,111,13,208,58,0,0         ; movdqa        0x3ad0(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,220,58,0,0         ; movdqa        0x3adc(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,111,245                      ; movdqa        %xmm5,%xmm6
   DB  102,65,15,219,241                   ; pand          %xmm9,%xmm6
   DB  102,15,113,213,8                    ; psrlw         $0x8,%xmm5
@@ -46138,21 +45878,21 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,27                              ; ja            3046b <_sk_store_bgra_sse2_lowp+0x83>
+  DB  119,27                              ; ja            2fe3f <_sk_store_bgra_sse2_lowp+0x83>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,98,0,0,0                  ; lea           0x62(%rip),%r9        # 304bc <_sk_store_bgra_sse2_lowp+0xd4>
+  DB  76,141,13,98,0,0,0                  ; lea           0x62(%rip),%r9        # 2fe90 <_sk_store_bgra_sse2_lowp+0xd4>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,69,15,126,12,144                ; movd          %xmm9,(%r8,%rdx,4)
-  DB  235,75                              ; jmp           304b6 <_sk_store_bgra_sse2_lowp+0xce>
+  DB  235,75                              ; jmp           2fe8a <_sk_store_bgra_sse2_lowp+0xce>
   DB  243,69,15,127,12,144                ; movdqu        %xmm9,(%r8,%rdx,4)
   DB  243,69,15,127,68,144,16             ; movdqu        %xmm8,0x10(%r8,%rdx,4)
-  DB  235,60                              ; jmp           304b6 <_sk_store_bgra_sse2_lowp+0xce>
+  DB  235,60                              ; jmp           2fe8a <_sk_store_bgra_sse2_lowp+0xce>
   DB  102,69,15,112,193,78                ; pshufd        $0x4e,%xmm9,%xmm8
   DB  102,69,15,126,68,144,8              ; movd          %xmm8,0x8(%r8,%rdx,4)
   DB  102,69,15,214,12,144                ; movq          %xmm9,(%r8,%rdx,4)
-  DB  235,39                              ; jmp           304b6 <_sk_store_bgra_sse2_lowp+0xce>
+  DB  235,39                              ; jmp           2fe8a <_sk_store_bgra_sse2_lowp+0xce>
   DB  102,69,15,112,208,78                ; pshufd        $0x4e,%xmm8,%xmm10
   DB  102,69,15,126,84,144,24             ; movd          %xmm10,0x18(%r8,%rdx,4)
   DB  102,69,15,112,208,229               ; pshufd        $0xe5,%xmm8,%xmm10
@@ -46264,7 +46004,7 @@
   DB  102,15,114,241,16                   ; pslld         $0x10,%xmm1
   DB  102,15,114,225,16                   ; psrad         $0x10,%xmm1
   DB  102,15,107,200                      ; packssdw      %xmm0,%xmm1
-  DB  102,68,15,111,13,236,55,0,0         ; movdqa        0x37ec(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,248,55,0,0         ; movdqa        0x37f8(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,111,193                      ; movdqa        %xmm1,%xmm0
   DB  102,65,15,219,193                   ; pand          %xmm9,%xmm0
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
@@ -46372,7 +46112,7 @@
   DB  102,15,114,241,16                   ; pslld         $0x10,%xmm1
   DB  102,15,114,225,16                   ; psrad         $0x10,%xmm1
   DB  102,15,107,200                      ; packssdw      %xmm0,%xmm1
-  DB  102,68,15,111,13,13,54,0,0          ; movdqa        0x360d(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,25,54,0,0          ; movdqa        0x3619(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,111,209                      ; movdqa        %xmm1,%xmm2
   DB  102,65,15,219,209                   ; pand          %xmm9,%xmm2
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
@@ -46411,23 +46151,23 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            308d2 <_sk_load_565_sse2_lowp+0x3c>
+  DB  119,34                              ; ja            302a6 <_sk_load_565_sse2_lowp+0x3c>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,190,0,0,0                 ; lea           0xbe(%rip),%r9        # 3097c <_sk_load_565_sse2_lowp+0xe6>
+  DB  76,141,13,190,0,0,0                 ; lea           0xbe(%rip),%r9        # 30350 <_sk_load_565_sse2_lowp+0xe6>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
-  DB  235,66                              ; jmp           30914 <_sk_load_565_sse2_lowp+0x7e>
+  DB  235,66                              ; jmp           302e8 <_sk_load_565_sse2_lowp+0x7e>
   DB  243,65,15,111,4,80                  ; movdqu        (%r8,%rdx,2),%xmm0
-  DB  235,58                              ; jmp           30914 <_sk_load_565_sse2_lowp+0x7e>
+  DB  235,58                              ; jmp           302e8 <_sk_load_565_sse2_lowp+0x7e>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,65,15,196,68,80,4,2             ; pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm0
   DB  243,65,15,16,12,80                  ; movss         (%r8,%rdx,2),%xmm1
   DB  243,15,16,193                       ; movss         %xmm1,%xmm0
-  DB  235,34                              ; jmp           30914 <_sk_load_565_sse2_lowp+0x7e>
+  DB  235,34                              ; jmp           302e8 <_sk_load_565_sse2_lowp+0x7e>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,65,15,196,68,80,12,6            ; pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm0
   DB  102,65,15,196,68,80,10,5            ; pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm0
@@ -46435,11 +46175,11 @@
   DB  102,65,15,18,4,80                   ; movlpd        (%r8,%rdx,2),%xmm0
   DB  102,15,111,216                      ; movdqa        %xmm0,%xmm3
   DB  102,15,113,211,8                    ; psrlw         $0x8,%xmm3
-  DB  102,15,219,29,155,60,0,0            ; pand          0x3c9b(%rip),%xmm3        # 345c0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
+  DB  102,15,219,29,167,60,0,0            ; pand          0x3ca7(%rip),%xmm3        # 33fa0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b0>
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
   DB  102,15,113,209,5                    ; psrlw         $0x5,%xmm1
-  DB  102,15,219,13,154,60,0,0            ; pand          0x3c9a(%rip),%xmm1        # 345d0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
-  DB  102,15,111,21,162,60,0,0            ; movdqa        0x3ca2(%rip),%xmm2        # 345e0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
+  DB  102,15,219,13,166,60,0,0            ; pand          0x3ca6(%rip),%xmm1        # 33fb0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c0>
+  DB  102,15,111,21,174,60,0,0            ; movdqa        0x3cae(%rip),%xmm2        # 33fc0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d0>
   DB  102,15,219,208                      ; pand          %xmm0,%xmm2
   DB  102,15,113,208,13                   ; psrlw         $0xd,%xmm0
   DB  102,15,235,195                      ; por           %xmm3,%xmm0
@@ -46452,7 +46192,7 @@
   DB  102,15,113,210,2                    ; psrlw         $0x2,%xmm2
   DB  102,15,235,211                      ; por           %xmm3,%xmm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,184,52,0,0                 ; movaps        0x34b8(%rip),%xmm3        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  15,40,29,196,52,0,0                 ; movaps        0x34c4(%rip),%xmm3        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  255,224                             ; jmpq          *%rax
   DB  102,144                             ; xchg          %ax,%ax
   DB  75,255                              ; rex.WXB       (bad)
@@ -46480,23 +46220,23 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            309d4 <_sk_load_565_dst_sse2_lowp+0x3c>
+  DB  119,34                              ; ja            303a8 <_sk_load_565_dst_sse2_lowp+0x3c>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,188,0,0,0                 ; lea           0xbc(%rip),%r9        # 30a7c <_sk_load_565_dst_sse2_lowp+0xe4>
+  DB  76,141,13,188,0,0,0                 ; lea           0xbc(%rip),%r9        # 30450 <_sk_load_565_dst_sse2_lowp+0xe4>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
-  DB  235,66                              ; jmp           30a16 <_sk_load_565_dst_sse2_lowp+0x7e>
+  DB  235,66                              ; jmp           303ea <_sk_load_565_dst_sse2_lowp+0x7e>
   DB  243,65,15,111,36,80                 ; movdqu        (%r8,%rdx,2),%xmm4
-  DB  235,58                              ; jmp           30a16 <_sk_load_565_dst_sse2_lowp+0x7e>
+  DB  235,58                              ; jmp           303ea <_sk_load_565_dst_sse2_lowp+0x7e>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,65,15,196,100,80,4,2            ; pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm4
   DB  243,65,15,16,44,80                  ; movss         (%r8,%rdx,2),%xmm5
   DB  243,15,16,229                       ; movss         %xmm5,%xmm4
-  DB  235,34                              ; jmp           30a16 <_sk_load_565_dst_sse2_lowp+0x7e>
+  DB  235,34                              ; jmp           303ea <_sk_load_565_dst_sse2_lowp+0x7e>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,65,15,196,100,80,12,6           ; pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm4
   DB  102,65,15,196,100,80,10,5           ; pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm4
@@ -46504,11 +46244,11 @@
   DB  102,65,15,18,36,80                  ; movlpd        (%r8,%rdx,2),%xmm4
   DB  102,15,111,252                      ; movdqa        %xmm4,%xmm7
   DB  102,15,113,215,8                    ; psrlw         $0x8,%xmm7
-  DB  102,15,219,61,153,59,0,0            ; pand          0x3b99(%rip),%xmm7        # 345c0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
+  DB  102,15,219,61,165,59,0,0            ; pand          0x3ba5(%rip),%xmm7        # 33fa0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b0>
   DB  102,15,111,236                      ; movdqa        %xmm4,%xmm5
   DB  102,15,113,213,5                    ; psrlw         $0x5,%xmm5
-  DB  102,15,219,45,152,59,0,0            ; pand          0x3b98(%rip),%xmm5        # 345d0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
-  DB  102,15,111,53,160,59,0,0            ; movdqa        0x3ba0(%rip),%xmm6        # 345e0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
+  DB  102,15,219,45,164,59,0,0            ; pand          0x3ba4(%rip),%xmm5        # 33fb0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c0>
+  DB  102,15,111,53,172,59,0,0            ; movdqa        0x3bac(%rip),%xmm6        # 33fc0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d0>
   DB  102,15,219,244                      ; pand          %xmm4,%xmm6
   DB  102,15,113,212,13                   ; psrlw         $0xd,%xmm4
   DB  102,15,235,231                      ; por           %xmm7,%xmm4
@@ -46521,7 +46261,7 @@
   DB  102,15,113,214,2                    ; psrlw         $0x2,%xmm6
   DB  102,15,235,247                      ; por           %xmm7,%xmm6
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,61,182,51,0,0                 ; movaps        0x33b6(%rip),%xmm7        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  15,40,61,194,51,0,0                 ; movaps        0x33c2(%rip),%xmm7        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  255,224                             ; jmpq          *%rax
   DB  77,255                              ; rex.WRB       (bad)
   DB  255                                 ; (bad)
@@ -46543,10 +46283,10 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  102,68,15,111,192                   ; movdqa        %xmm0,%xmm8
   DB  102,65,15,113,240,8                 ; psllw         $0x8,%xmm8
-  DB  102,68,15,219,5,52,59,0,0           ; pand          0x3b34(%rip),%xmm8        # 345f0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d4>
+  DB  102,68,15,219,5,64,59,0,0           ; pand          0x3b40(%rip),%xmm8        # 33fd0 <_sk_srcover_bgra_8888_sse2_lowp+0x13e0>
   DB  102,68,15,111,201                   ; movdqa        %xmm1,%xmm9
   DB  102,65,15,113,241,3                 ; psllw         $0x3,%xmm9
-  DB  102,68,15,219,13,48,59,0,0          ; pand          0x3b30(%rip),%xmm9        # 34600 <_sk_srcover_bgra_8888_sse2_lowp+0x13e4>
+  DB  102,68,15,219,13,60,59,0,0          ; pand          0x3b3c(%rip),%xmm9        # 33fe0 <_sk_srcover_bgra_8888_sse2_lowp+0x13f0>
   DB  102,69,15,235,200                   ; por           %xmm8,%xmm9
   DB  102,68,15,111,194                   ; movdqa        %xmm2,%xmm8
   DB  102,65,15,113,208,3                 ; psrlw         $0x3,%xmm8
@@ -46555,21 +46295,21 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,31                              ; ja            30b0e <_sk_store_565_sse2_lowp+0x76>
+  DB  119,31                              ; ja            304e2 <_sk_store_565_sse2_lowp+0x76>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,95,0,0,0                  ; lea           0x5f(%rip),%r9        # 30b58 <_sk_store_565_sse2_lowp+0xc0>
+  DB  76,141,13,95,0,0,0                  ; lea           0x5f(%rip),%r9        # 3052c <_sk_store_565_sse2_lowp+0xc0>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,68,15,126,192                   ; movd          %xmm8,%eax
   DB  102,65,137,4,80                     ; mov           %ax,(%r8,%rdx,2)
-  DB  235,70                              ; jmp           30b54 <_sk_store_565_sse2_lowp+0xbc>
+  DB  235,70                              ; jmp           30528 <_sk_store_565_sse2_lowp+0xbc>
   DB  243,69,15,127,4,80                  ; movdqu        %xmm8,(%r8,%rdx,2)
-  DB  235,62                              ; jmp           30b54 <_sk_store_565_sse2_lowp+0xbc>
+  DB  235,62                              ; jmp           30528 <_sk_store_565_sse2_lowp+0xbc>
   DB  102,65,15,197,192,2                 ; pextrw        $0x2,%xmm8,%eax
   DB  102,65,137,68,80,4                  ; mov           %ax,0x4(%r8,%rdx,2)
   DB  102,69,15,126,4,80                  ; movd          %xmm8,(%r8,%rdx,2)
-  DB  235,42                              ; jmp           30b54 <_sk_store_565_sse2_lowp+0xbc>
+  DB  235,42                              ; jmp           30528 <_sk_store_565_sse2_lowp+0xbc>
   DB  102,65,15,197,192,6                 ; pextrw        $0x6,%xmm8,%eax
   DB  102,65,137,68,80,12                 ; mov           %ax,0xc(%r8,%rdx,2)
   DB  102,65,15,197,192,5                 ; pextrw        $0x5,%xmm8,%eax
@@ -46686,11 +46426,11 @@
   DB  102,15,108,193                      ; punpcklqdq    %xmm1,%xmm0
   DB  102,15,111,216                      ; movdqa        %xmm0,%xmm3
   DB  102,15,113,211,8                    ; psrlw         $0x8,%xmm3
-  DB  102,15,219,29,221,56,0,0            ; pand          0x38dd(%rip),%xmm3        # 345c0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
+  DB  102,15,219,29,233,56,0,0            ; pand          0x38e9(%rip),%xmm3        # 33fa0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b0>
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
   DB  102,15,113,209,5                    ; psrlw         $0x5,%xmm1
-  DB  102,15,219,13,220,56,0,0            ; pand          0x38dc(%rip),%xmm1        # 345d0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
-  DB  102,15,111,21,228,56,0,0            ; movdqa        0x38e4(%rip),%xmm2        # 345e0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
+  DB  102,15,219,13,232,56,0,0            ; pand          0x38e8(%rip),%xmm1        # 33fb0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c0>
+  DB  102,15,111,21,240,56,0,0            ; movdqa        0x38f0(%rip),%xmm2        # 33fc0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d0>
   DB  102,15,219,208                      ; pand          %xmm0,%xmm2
   DB  102,15,113,208,13                   ; psrlw         $0xd,%xmm0
   DB  102,15,235,195                      ; por           %xmm3,%xmm0
@@ -46703,7 +46443,7 @@
   DB  102,15,113,210,2                    ; psrlw         $0x2,%xmm2
   DB  102,15,235,211                      ; por           %xmm3,%xmm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,250,48,0,0                 ; movaps        0x30fa(%rip),%xmm3        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  15,40,29,6,49,0,0                   ; movaps        0x3106(%rip),%xmm3        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  91                                  ; pop           %rbx
   DB  65,92                               ; pop           %r12
   DB  65,94                               ; pop           %r14
@@ -46722,23 +46462,23 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,36                              ; ja            30d7e <_sk_load_4444_sse2_lowp+0x3e>
+  DB  119,36                              ; ja            30752 <_sk_load_4444_sse2_lowp+0x3e>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,199,0,0,0                 ; lea           0xc7(%rip),%r9        # 30e30 <_sk_load_4444_sse2_lowp+0xf0>
+  DB  76,141,13,199,0,0,0                 ; lea           0xc7(%rip),%r9        # 30804 <_sk_load_4444_sse2_lowp+0xf0>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
-  DB  235,69                              ; jmp           30dc3 <_sk_load_4444_sse2_lowp+0x83>
+  DB  235,69                              ; jmp           30797 <_sk_load_4444_sse2_lowp+0x83>
   DB  243,69,15,111,4,80                  ; movdqu        (%r8,%rdx,2),%xmm8
-  DB  235,61                              ; jmp           30dc3 <_sk_load_4444_sse2_lowp+0x83>
+  DB  235,61                              ; jmp           30797 <_sk_load_4444_sse2_lowp+0x83>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  102,69,15,196,68,80,4,2             ; pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm8
   DB  243,65,15,16,4,80                   ; movss         (%r8,%rdx,2),%xmm0
   DB  243,68,15,16,192                    ; movss         %xmm0,%xmm8
-  DB  235,35                              ; jmp           30dc3 <_sk_load_4444_sse2_lowp+0x83>
+  DB  235,35                              ; jmp           30797 <_sk_load_4444_sse2_lowp+0x83>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  102,69,15,196,68,80,12,6            ; pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm8
   DB  102,69,15,196,68,80,10,5            ; pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm8
@@ -46748,7 +46488,7 @@
   DB  102,15,113,209,12                   ; psrlw         $0xc,%xmm1
   DB  102,65,15,111,208                   ; movdqa        %xmm8,%xmm2
   DB  102,15,113,210,8                    ; psrlw         $0x8,%xmm2
-  DB  102,15,111,5,49,56,0,0              ; movdqa        0x3831(%rip),%xmm0        # 34610 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  DB  102,15,111,5,61,56,0,0              ; movdqa        0x383d(%rip),%xmm0        # 33ff0 <_sk_srcover_bgra_8888_sse2_lowp+0x1400>
   DB  102,15,219,208                      ; pand          %xmm0,%xmm2
   DB  102,65,15,111,216                   ; movdqa        %xmm8,%xmm3
   DB  102,15,113,211,4                    ; psrlw         $0x4,%xmm3
@@ -46778,7 +46518,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  125,255                             ; jge           30e45 <_sk_load_4444_sse2_lowp+0x105>
+  DB  125,255                             ; jge           30819 <_sk_load_4444_sse2_lowp+0x105>
   DB  255                                 ; (bad)
   DB  255,112,255                         ; pushq         -0x1(%rax)
   DB  255                                 ; (bad)
@@ -46795,23 +46535,23 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,36                              ; ja            30e8a <_sk_load_4444_dst_sse2_lowp+0x3e>
+  DB  119,36                              ; ja            3085e <_sk_load_4444_dst_sse2_lowp+0x3e>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,199,0,0,0                 ; lea           0xc7(%rip),%r9        # 30f3c <_sk_load_4444_dst_sse2_lowp+0xf0>
+  DB  76,141,13,199,0,0,0                 ; lea           0xc7(%rip),%r9        # 30910 <_sk_load_4444_dst_sse2_lowp+0xf0>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
-  DB  235,69                              ; jmp           30ecf <_sk_load_4444_dst_sse2_lowp+0x83>
+  DB  235,69                              ; jmp           308a3 <_sk_load_4444_dst_sse2_lowp+0x83>
   DB  243,69,15,111,4,80                  ; movdqu        (%r8,%rdx,2),%xmm8
-  DB  235,61                              ; jmp           30ecf <_sk_load_4444_dst_sse2_lowp+0x83>
+  DB  235,61                              ; jmp           308a3 <_sk_load_4444_dst_sse2_lowp+0x83>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  102,69,15,196,68,80,4,2             ; pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm8
   DB  243,65,15,16,36,80                  ; movss         (%r8,%rdx,2),%xmm4
   DB  243,68,15,16,196                    ; movss         %xmm4,%xmm8
-  DB  235,35                              ; jmp           30ecf <_sk_load_4444_dst_sse2_lowp+0x83>
+  DB  235,35                              ; jmp           308a3 <_sk_load_4444_dst_sse2_lowp+0x83>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  102,69,15,196,68,80,12,6            ; pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm8
   DB  102,69,15,196,68,80,10,5            ; pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm8
@@ -46821,7 +46561,7 @@
   DB  102,15,113,213,12                   ; psrlw         $0xc,%xmm5
   DB  102,65,15,111,240                   ; movdqa        %xmm8,%xmm6
   DB  102,15,113,214,8                    ; psrlw         $0x8,%xmm6
-  DB  102,15,111,37,37,55,0,0             ; movdqa        0x3725(%rip),%xmm4        # 34610 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  DB  102,15,111,37,49,55,0,0             ; movdqa        0x3731(%rip),%xmm4        # 33ff0 <_sk_srcover_bgra_8888_sse2_lowp+0x1400>
   DB  102,15,219,244                      ; pand          %xmm4,%xmm6
   DB  102,65,15,111,248                   ; movdqa        %xmm8,%xmm7
   DB  102,15,113,215,4                    ; psrlw         $0x4,%xmm7
@@ -46851,7 +46591,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  125,255                             ; jge           30f51 <_sk_load_4444_dst_sse2_lowp+0x105>
+  DB  125,255                             ; jge           30925 <_sk_load_4444_dst_sse2_lowp+0x105>
   DB  255                                 ; (bad)
   DB  255,112,255                         ; pushq         -0x1(%rax)
   DB  255                                 ; (bad)
@@ -46866,12 +46606,12 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  102,68,15,111,192                   ; movdqa        %xmm0,%xmm8
   DB  102,65,15,113,240,8                 ; psllw         $0x8,%xmm8
-  DB  102,68,15,219,5,164,54,0,0          ; pand          0x36a4(%rip),%xmm8        # 34620 <_sk_srcover_bgra_8888_sse2_lowp+0x1404>
+  DB  102,68,15,219,5,176,54,0,0          ; pand          0x36b0(%rip),%xmm8        # 34000 <_sk_srcover_bgra_8888_sse2_lowp+0x1410>
   DB  102,68,15,111,201                   ; movdqa        %xmm1,%xmm9
   DB  102,65,15,113,241,4                 ; psllw         $0x4,%xmm9
-  DB  102,68,15,219,13,160,54,0,0         ; pand          0x36a0(%rip),%xmm9        # 34630 <_sk_srcover_bgra_8888_sse2_lowp+0x1414>
+  DB  102,68,15,219,13,172,54,0,0         ; pand          0x36ac(%rip),%xmm9        # 34010 <_sk_srcover_bgra_8888_sse2_lowp+0x1420>
   DB  102,69,15,235,200                   ; por           %xmm8,%xmm9
-  DB  102,68,15,111,21,162,54,0,0         ; movdqa        0x36a2(%rip),%xmm10        # 34640 <_sk_srcover_bgra_8888_sse2_lowp+0x1424>
+  DB  102,68,15,111,21,174,54,0,0         ; movdqa        0x36ae(%rip),%xmm10        # 34020 <_sk_srcover_bgra_8888_sse2_lowp+0x1430>
   DB  102,68,15,219,210                   ; pand          %xmm2,%xmm10
   DB  102,68,15,111,195                   ; movdqa        %xmm3,%xmm8
   DB  102,65,15,113,208,4                 ; psrlw         $0x4,%xmm8
@@ -46881,21 +46621,21 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,31                              ; ja            30fe1 <_sk_store_4444_sse2_lowp+0x89>
+  DB  119,31                              ; ja            309b5 <_sk_store_4444_sse2_lowp+0x89>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,96,0,0,0                  ; lea           0x60(%rip),%r9        # 3102c <_sk_store_4444_sse2_lowp+0xd4>
+  DB  76,141,13,96,0,0,0                  ; lea           0x60(%rip),%r9        # 30a00 <_sk_store_4444_sse2_lowp+0xd4>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,68,15,126,192                   ; movd          %xmm8,%eax
   DB  102,65,137,4,80                     ; mov           %ax,(%r8,%rdx,2)
-  DB  235,70                              ; jmp           31027 <_sk_store_4444_sse2_lowp+0xcf>
+  DB  235,70                              ; jmp           309fb <_sk_store_4444_sse2_lowp+0xcf>
   DB  243,69,15,127,4,80                  ; movdqu        %xmm8,(%r8,%rdx,2)
-  DB  235,62                              ; jmp           31027 <_sk_store_4444_sse2_lowp+0xcf>
+  DB  235,62                              ; jmp           309fb <_sk_store_4444_sse2_lowp+0xcf>
   DB  102,65,15,197,192,2                 ; pextrw        $0x2,%xmm8,%eax
   DB  102,65,137,68,80,4                  ; mov           %ax,0x4(%r8,%rdx,2)
   DB  102,69,15,126,4,80                  ; movd          %xmm8,(%r8,%rdx,2)
-  DB  235,42                              ; jmp           31027 <_sk_store_4444_sse2_lowp+0xcf>
+  DB  235,42                              ; jmp           309fb <_sk_store_4444_sse2_lowp+0xcf>
   DB  102,65,15,197,192,6                 ; pextrw        $0x6,%xmm8,%eax
   DB  102,65,137,68,80,12                 ; mov           %ax,0xc(%r8,%rdx,2)
   DB  102,65,15,197,192,5                 ; pextrw        $0x5,%xmm8,%eax
@@ -46914,7 +46654,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  233,255,255,255,221                 ; jmpq          ffffffffde031040 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddffde24>
+  DB  233,255,255,255,221                 ; jmpq          ffffffffde030a14 <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffddffde24>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,209                             ; callq         *%rcx
@@ -47009,7 +46749,7 @@
   DB  102,15,113,209,12                   ; psrlw         $0xc,%xmm1
   DB  102,65,15,111,208                   ; movdqa        %xmm8,%xmm2
   DB  102,15,113,210,8                    ; psrlw         $0x8,%xmm2
-  DB  102,15,111,5,74,52,0,0              ; movdqa        0x344a(%rip),%xmm0        # 34610 <_sk_srcover_bgra_8888_sse2_lowp+0x13f4>
+  DB  102,15,111,5,86,52,0,0              ; movdqa        0x3456(%rip),%xmm0        # 33ff0 <_sk_srcover_bgra_8888_sse2_lowp+0x1400>
   DB  102,15,219,208                      ; pand          %xmm0,%xmm2
   DB  102,65,15,111,216                   ; movdqa        %xmm8,%xmm3
   DB  102,15,113,211,4                    ; psrlw         $0x4,%xmm3
@@ -47045,19 +46785,19 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            31258 <_sk_load_a8_sse2_lowp+0x39>
+  DB  119,34                              ; ja            30c2c <_sk_load_a8_sse2_lowp+0x39>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,140,0,0,0                 ; lea           0x8c(%rip),%r9        # 312d0 <_sk_load_a8_sse2_lowp+0xb1>
+  DB  76,141,13,140,0,0,0                 ; lea           0x8c(%rip),%r9        # 30ca4 <_sk_load_a8_sse2_lowp+0xb1>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,216                      ; movd          %eax,%xmm3
-  DB  235,97                              ; jmp           312b9 <_sk_load_a8_sse2_lowp+0x9a>
+  DB  235,97                              ; jmp           30c8d <_sk_load_a8_sse2_lowp+0x9a>
   DB  243,65,15,126,28,16                 ; movq          (%r8,%rdx,1),%xmm3
   DB  102,15,96,216                       ; punpcklbw     %xmm0,%xmm3
-  DB  235,85                              ; jmp           312b9 <_sk_load_a8_sse2_lowp+0x9a>
+  DB  235,85                              ; jmp           30c8d <_sk_load_a8_sse2_lowp+0x9a>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  102,15,196,216,2                    ; pinsrw        $0x2,%eax,%xmm3
@@ -47065,7 +46805,7 @@
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,15,96,192                       ; punpcklbw     %xmm0,%xmm0
   DB  243,15,16,216                       ; movss         %xmm0,%xmm3
-  DB  235,51                              ; jmp           312b9 <_sk_load_a8_sse2_lowp+0x9a>
+  DB  235,51                              ; jmp           30c8d <_sk_load_a8_sse2_lowp+0x9a>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  102,15,196,216,6                    ; pinsrw        $0x6,%eax,%xmm3
@@ -47076,14 +46816,14 @@
   DB  102,65,15,110,4,16                  ; movd          (%r8,%rdx,1),%xmm0
   DB  102,15,96,192                       ; punpcklbw     %xmm0,%xmm0
   DB  242,15,16,216                       ; movsd         %xmm0,%xmm3
-  DB  102,15,219,29,111,43,0,0            ; pand          0x2b6f(%rip),%xmm3        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,15,219,29,123,43,0,0            ; pand          0x2b7b(%rip),%xmm3        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  15,87,201                           ; xorps         %xmm1,%xmm1
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
   DB  255,224                             ; jmpq          *%rax
   DB  102,144                             ; xchg          %ax,%ax
-  DB  125,255                             ; jge           312d1 <_sk_load_a8_sse2_lowp+0xb2>
+  DB  125,255                             ; jge           30ca5 <_sk_load_a8_sse2_lowp+0xb2>
   DB  255                                 ; (bad)
   DB  255,163,255,255,255,148             ; jmpq          *-0x6b000001(%rbx)
   DB  255                                 ; (bad)
@@ -47112,19 +46852,19 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            31325 <_sk_load_a8_dst_sse2_lowp+0x39>
+  DB  119,34                              ; ja            30cf9 <_sk_load_a8_dst_sse2_lowp+0x39>
   DB  102,15,239,255                      ; pxor          %xmm7,%xmm7
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,139,0,0,0                 ; lea           0x8b(%rip),%r9        # 3139c <_sk_load_a8_dst_sse2_lowp+0xb0>
+  DB  76,141,13,139,0,0,0                 ; lea           0x8b(%rip),%r9        # 30d70 <_sk_load_a8_dst_sse2_lowp+0xb0>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,248                      ; movd          %eax,%xmm7
-  DB  235,97                              ; jmp           31386 <_sk_load_a8_dst_sse2_lowp+0x9a>
+  DB  235,97                              ; jmp           30d5a <_sk_load_a8_dst_sse2_lowp+0x9a>
   DB  243,65,15,126,60,16                 ; movq          (%r8,%rdx,1),%xmm7
   DB  102,15,96,248                       ; punpcklbw     %xmm0,%xmm7
-  DB  235,85                              ; jmp           31386 <_sk_load_a8_dst_sse2_lowp+0x9a>
+  DB  235,85                              ; jmp           30d5a <_sk_load_a8_dst_sse2_lowp+0x9a>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,239,255                      ; pxor          %xmm7,%xmm7
   DB  102,15,196,248,2                    ; pinsrw        $0x2,%eax,%xmm7
@@ -47132,7 +46872,7 @@
   DB  102,15,110,224                      ; movd          %eax,%xmm4
   DB  102,15,96,224                       ; punpcklbw     %xmm0,%xmm4
   DB  243,15,16,252                       ; movss         %xmm4,%xmm7
-  DB  235,51                              ; jmp           31386 <_sk_load_a8_dst_sse2_lowp+0x9a>
+  DB  235,51                              ; jmp           30d5a <_sk_load_a8_dst_sse2_lowp+0x9a>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,15,239,255                      ; pxor          %xmm7,%xmm7
   DB  102,15,196,248,6                    ; pinsrw        $0x6,%eax,%xmm7
@@ -47143,14 +46883,14 @@
   DB  102,65,15,110,36,16                 ; movd          (%r8,%rdx,1),%xmm4
   DB  102,15,96,224                       ; punpcklbw     %xmm0,%xmm4
   DB  242,15,16,252                       ; movsd         %xmm4,%xmm7
-  DB  102,15,219,61,162,42,0,0            ; pand          0x2aa2(%rip),%xmm7        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,15,219,61,174,42,0,0            ; pand          0x2aae(%rip),%xmm7        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,87,228                           ; xorps         %xmm4,%xmm4
   DB  15,87,237                           ; xorps         %xmm5,%xmm5
   DB  15,87,246                           ; xorps         %xmm6,%xmm6
   DB  255,224                             ; jmpq          *%rax
   DB  144                                 ; nop
-  DB  126,255                             ; jle           3139d <_sk_load_a8_dst_sse2_lowp+0xb1>
+  DB  126,255                             ; jle           30d71 <_sk_load_a8_dst_sse2_lowp+0xb1>
   DB  255                                 ; (bad)
   DB  255,164,255,255,255,149,255         ; jmpq          *-0x6a0001(%rdi,%rdi,8)
   DB  255                                 ; (bad)
@@ -47178,42 +46918,42 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,29                              ; ja            313ec <_sk_store_a8_sse2_lowp+0x34>
+  DB  119,29                              ; ja            30dc0 <_sk_store_a8_sse2_lowp+0x34>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,147,0,0,0                 ; lea           0x93(%rip),%r9        # 3146c <_sk_store_a8_sse2_lowp+0xb4>
+  DB  76,141,13,147,0,0,0                 ; lea           0x93(%rip),%r9        # 30e40 <_sk_store_a8_sse2_lowp+0xb4>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,15,126,216                      ; movd          %xmm3,%eax
   DB  65,136,4,16                         ; mov           %al,(%r8,%rdx,1)
-  DB  235,123                             ; jmp           31467 <_sk_store_a8_sse2_lowp+0xaf>
-  DB  102,68,15,111,5,59,42,0,0           ; movdqa        0x2a3b(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  235,123                             ; jmp           30e3b <_sk_store_a8_sse2_lowp+0xaf>
+  DB  102,68,15,111,5,71,42,0,0           ; movdqa        0x2a47(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,68,15,219,195                   ; pand          %xmm3,%xmm8
   DB  102,69,15,103,192                   ; packuswb      %xmm8,%xmm8
   DB  102,69,15,214,4,16                  ; movq          %xmm8,(%r8,%rdx,1)
-  DB  235,96                              ; jmp           31467 <_sk_store_a8_sse2_lowp+0xaf>
+  DB  235,96                              ; jmp           30e3b <_sk_store_a8_sse2_lowp+0xaf>
   DB  102,15,197,195,2                    ; pextrw        $0x2,%xmm3,%eax
   DB  65,136,68,16,2                      ; mov           %al,0x2(%r8,%rdx,1)
-  DB  102,68,15,111,5,22,42,0,0           ; movdqa        0x2a16(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,5,34,42,0,0           ; movdqa        0x2a22(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,68,15,219,195                   ; pand          %xmm3,%xmm8
   DB  102,69,15,103,192                   ; packuswb      %xmm8,%xmm8
   DB  102,68,15,126,192                   ; movd          %xmm8,%eax
   DB  102,65,137,4,16                     ; mov           %ax,(%r8,%rdx,1)
-  DB  235,55                              ; jmp           31467 <_sk_store_a8_sse2_lowp+0xaf>
+  DB  235,55                              ; jmp           30e3b <_sk_store_a8_sse2_lowp+0xaf>
   DB  102,15,197,195,6                    ; pextrw        $0x6,%xmm3,%eax
   DB  65,136,68,16,6                      ; mov           %al,0x6(%r8,%rdx,1)
   DB  102,15,197,195,5                    ; pextrw        $0x5,%xmm3,%eax
   DB  65,136,68,16,5                      ; mov           %al,0x5(%r8,%rdx,1)
   DB  102,15,197,195,4                    ; pextrw        $0x4,%xmm3,%eax
   DB  65,136,68,16,4                      ; mov           %al,0x4(%r8,%rdx,1)
-  DB  102,68,15,111,5,217,41,0,0          ; movdqa        0x29d9(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,5,229,41,0,0          ; movdqa        0x29e5(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,68,15,219,195                   ; pand          %xmm3,%xmm8
   DB  102,69,15,103,192                   ; packuswb      %xmm8,%xmm8
   DB  102,69,15,126,4,16                  ; movd          %xmm8,(%r8,%rdx,1)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  144                                 ; nop
-  DB  118,255                             ; jbe           3146d <_sk_store_a8_sse2_lowp+0xb5>
+  DB  118,255                             ; jbe           30e41 <_sk_store_a8_sse2_lowp+0xb5>
   DB  255                                 ; (bad)
   DB  255,165,255,255,255,155             ; jmpq          *-0x64000001(%rbp)
   DB  255                                 ; (bad)
@@ -47334,19 +47074,19 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            31629 <_sk_load_g8_sse2_lowp+0x39>
+  DB  119,34                              ; ja            30ffd <_sk_load_g8_sse2_lowp+0x39>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,147,0,0,0                 ; lea           0x93(%rip),%r9        # 316a8 <_sk_load_g8_sse2_lowp+0xb8>
+  DB  76,141,13,147,0,0,0                 ; lea           0x93(%rip),%r9        # 3107c <_sk_load_g8_sse2_lowp+0xb8>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
-  DB  235,97                              ; jmp           3168a <_sk_load_g8_sse2_lowp+0x9a>
+  DB  235,97                              ; jmp           3105e <_sk_load_g8_sse2_lowp+0x9a>
   DB  243,65,15,126,4,16                  ; movq          (%r8,%rdx,1),%xmm0
   DB  102,15,96,192                       ; punpcklbw     %xmm0,%xmm0
-  DB  235,85                              ; jmp           3168a <_sk_load_g8_sse2_lowp+0x9a>
+  DB  235,85                              ; jmp           3105e <_sk_load_g8_sse2_lowp+0x9a>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,15,196,192,2                    ; pinsrw        $0x2,%eax,%xmm0
@@ -47354,7 +47094,7 @@
   DB  102,15,110,200                      ; movd          %eax,%xmm1
   DB  102,15,96,200                       ; punpcklbw     %xmm0,%xmm1
   DB  243,15,16,193                       ; movss         %xmm1,%xmm0
-  DB  235,51                              ; jmp           3168a <_sk_load_g8_sse2_lowp+0x9a>
+  DB  235,51                              ; jmp           3105e <_sk_load_g8_sse2_lowp+0x9a>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,15,196,192,6                    ; pinsrw        $0x6,%eax,%xmm0
@@ -47365,14 +47105,14 @@
   DB  102,65,15,110,12,16                 ; movd          (%r8,%rdx,1),%xmm1
   DB  102,15,96,200                       ; punpcklbw     %xmm0,%xmm1
   DB  242,15,16,193                       ; movsd         %xmm1,%xmm0
-  DB  102,15,219,5,158,39,0,0             ; pand          0x279e(%rip),%xmm0        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,15,219,5,170,39,0,0             ; pand          0x27aa(%rip),%xmm0        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,149,39,0,0                 ; movaps        0x2795(%rip),%xmm3        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  15,40,29,161,39,0,0                 ; movaps        0x27a1(%rip),%xmm3        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
   DB  102,15,111,208                      ; movdqa        %xmm0,%xmm2
   DB  255,224                             ; jmpq          *%rax
   DB  15,31,0                             ; nopl          (%rax)
-  DB  118,255                             ; jbe           316a9 <_sk_load_g8_sse2_lowp+0xb9>
+  DB  118,255                             ; jbe           3107d <_sk_load_g8_sse2_lowp+0xb9>
   DB  255                                 ; (bad)
   DB  255,156,255,255,255,141,255         ; lcall         *-0x720001(%rdi,%rdi,8)
   DB  255                                 ; (bad)
@@ -47398,19 +47138,19 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            316fd <_sk_load_g8_dst_sse2_lowp+0x39>
+  DB  119,34                              ; ja            310d1 <_sk_load_g8_dst_sse2_lowp+0x39>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,147,0,0,0                 ; lea           0x93(%rip),%r9        # 3177c <_sk_load_g8_dst_sse2_lowp+0xb8>
+  DB  76,141,13,147,0,0,0                 ; lea           0x93(%rip),%r9        # 31150 <_sk_load_g8_dst_sse2_lowp+0xb8>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
-  DB  235,97                              ; jmp           3175e <_sk_load_g8_dst_sse2_lowp+0x9a>
+  DB  235,97                              ; jmp           31132 <_sk_load_g8_dst_sse2_lowp+0x9a>
   DB  243,65,15,126,36,16                 ; movq          (%r8,%rdx,1),%xmm4
   DB  102,15,96,224                       ; punpcklbw     %xmm0,%xmm4
-  DB  235,85                              ; jmp           3175e <_sk_load_g8_dst_sse2_lowp+0x9a>
+  DB  235,85                              ; jmp           31132 <_sk_load_g8_dst_sse2_lowp+0x9a>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,15,196,224,2                    ; pinsrw        $0x2,%eax,%xmm4
@@ -47418,7 +47158,7 @@
   DB  102,15,110,232                      ; movd          %eax,%xmm5
   DB  102,15,96,232                       ; punpcklbw     %xmm0,%xmm5
   DB  243,15,16,229                       ; movss         %xmm5,%xmm4
-  DB  235,51                              ; jmp           3175e <_sk_load_g8_dst_sse2_lowp+0x9a>
+  DB  235,51                              ; jmp           31132 <_sk_load_g8_dst_sse2_lowp+0x9a>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,15,196,224,6                    ; pinsrw        $0x6,%eax,%xmm4
@@ -47429,14 +47169,14 @@
   DB  102,65,15,110,44,16                 ; movd          (%r8,%rdx,1),%xmm5
   DB  102,15,96,232                       ; punpcklbw     %xmm0,%xmm5
   DB  242,15,16,229                       ; movsd         %xmm5,%xmm4
-  DB  102,15,219,37,202,38,0,0            ; pand          0x26ca(%rip),%xmm4        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,15,219,37,214,38,0,0            ; pand          0x26d6(%rip),%xmm4        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,61,193,38,0,0                 ; movaps        0x26c1(%rip),%xmm7        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  15,40,61,205,38,0,0                 ; movaps        0x26cd(%rip),%xmm7        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,111,236                      ; movdqa        %xmm4,%xmm5
   DB  102,15,111,244                      ; movdqa        %xmm4,%xmm6
   DB  255,224                             ; jmpq          *%rax
   DB  15,31,0                             ; nopl          (%rax)
-  DB  118,255                             ; jbe           3177d <_sk_load_g8_dst_sse2_lowp+0xb9>
+  DB  118,255                             ; jbe           31151 <_sk_load_g8_dst_sse2_lowp+0xb9>
   DB  255                                 ; (bad)
   DB  255,156,255,255,255,141,255         ; lcall         *-0x720001(%rdi,%rdi,8)
   DB  255                                 ; (bad)
@@ -47455,10 +47195,10 @@
 PUBLIC _sk_luminance_to_alpha_sse2_lowp
 _sk_luminance_to_alpha_sse2_lowp LABEL PROC
   DB  102,15,111,218                      ; movdqa        %xmm2,%xmm3
-  DB  102,15,213,5,172,46,0,0             ; pmullw        0x2eac(%rip),%xmm0        # 34650 <_sk_srcover_bgra_8888_sse2_lowp+0x1434>
-  DB  102,15,213,13,180,46,0,0            ; pmullw        0x2eb4(%rip),%xmm1        # 34660 <_sk_srcover_bgra_8888_sse2_lowp+0x1444>
+  DB  102,15,213,5,184,46,0,0             ; pmullw        0x2eb8(%rip),%xmm0        # 34030 <_sk_srcover_bgra_8888_sse2_lowp+0x1440>
+  DB  102,15,213,13,192,46,0,0            ; pmullw        0x2ec0(%rip),%xmm1        # 34040 <_sk_srcover_bgra_8888_sse2_lowp+0x1450>
   DB  102,15,253,200                      ; paddw         %xmm0,%xmm1
-  DB  102,15,213,29,184,46,0,0            ; pmullw        0x2eb8(%rip),%xmm3        # 34670 <_sk_srcover_bgra_8888_sse2_lowp+0x1454>
+  DB  102,15,213,29,196,46,0,0            ; pmullw        0x2ec4(%rip),%xmm3        # 34050 <_sk_srcover_bgra_8888_sse2_lowp+0x1460>
   DB  102,15,253,217                      ; paddw         %xmm1,%xmm3
   DB  102,15,113,211,8                    ; psrlw         $0x8,%xmm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -47549,7 +47289,7 @@
   DB  102,15,196,197,3                    ; pinsrw        $0x3,%ebp,%xmm0
   DB  102,65,15,96,192                    ; punpcklbw     %xmm8,%xmm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,6,37,0,0                   ; movaps        0x2506(%rip),%xmm3        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  15,40,29,18,37,0,0                  ; movaps        0x2512(%rip),%xmm3        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
   DB  102,15,111,208                      ; movdqa        %xmm0,%xmm2
   DB  91                                  ; pop           %rbx
@@ -47563,14 +47303,14 @@
 _sk_scale_1_float_sse2_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  243,68,15,16,0                      ; movss         (%rax),%xmm8
-  DB  243,68,15,89,5,172,27,0,0           ; mulss         0x1bac(%rip),%xmm8        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
-  DB  243,68,15,88,5,115,27,0,0           ; addss         0x1b73(%rip),%xmm8        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  243,68,15,89,5,172,27,0,0           ; mulss         0x1bac(%rip),%xmm8        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  243,68,15,88,5,115,27,0,0           ; addss         0x1b73(%rip),%xmm8        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  243,65,15,44,192                    ; cvttss2si     %xmm8,%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  242,69,15,112,192,0                 ; pshuflw       $0x0,%xmm8,%xmm8
   DB  102,69,15,112,192,80                ; pshufd        $0x50,%xmm8,%xmm8
   DB  102,65,15,213,192                   ; pmullw        %xmm8,%xmm0
-  DB  102,68,15,111,13,183,36,0,0         ; movdqa        0x24b7(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,195,36,0,0         ; movdqa        0x24c3(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,193                   ; paddw         %xmm9,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,65,15,213,200                   ; pmullw        %xmm8,%xmm1
@@ -47589,13 +47329,13 @@
 _sk_lerp_1_float_sse2_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  243,68,15,16,0                      ; movss         (%rax),%xmm8
-  DB  243,68,15,89,5,52,27,0,0            ; mulss         0x1b34(%rip),%xmm8        # 334f8 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
-  DB  243,68,15,88,5,251,26,0,0           ; addss         0x1afb(%rip),%xmm8        # 334c8 <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
+  DB  243,68,15,89,5,52,27,0,0            ; mulss         0x1b34(%rip),%xmm8        # 32ecc <_sk_srcover_bgra_8888_sse2_lowp+0x2dc>
+  DB  243,68,15,88,5,251,26,0,0           ; addss         0x1afb(%rip),%xmm8        # 32e9c <_sk_srcover_bgra_8888_sse2_lowp+0x2ac>
   DB  243,65,15,44,192                    ; cvttss2si     %xmm8,%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  242,69,15,112,192,0                 ; pshuflw       $0x0,%xmm8,%xmm8
   DB  102,69,15,112,192,80                ; pshufd        $0x50,%xmm8,%xmm8
-  DB  102,68,15,111,13,68,36,0,0          ; movdqa        0x2444(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,80,36,0,0          ; movdqa        0x2450(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,213,192                   ; pmullw        %xmm8,%xmm0
   DB  102,65,15,253,193                   ; paddw         %xmm9,%xmm0
   DB  102,65,15,213,200                   ; pmullw        %xmm8,%xmm1
@@ -47633,19 +47373,19 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,36                              ; ja            31aa3 <_sk_scale_u8_sse2_lowp+0x3b>
+  DB  119,36                              ; ja            31477 <_sk_scale_u8_sse2_lowp+0x3b>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,218,0,0,0                 ; lea           0xda(%rip),%r9        # 31b68 <_sk_scale_u8_sse2_lowp+0x100>
+  DB  76,141,13,218,0,0,0                 ; lea           0xda(%rip),%r9        # 3153c <_sk_scale_u8_sse2_lowp+0x100>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
-  DB  235,109                             ; jmp           31b10 <_sk_scale_u8_sse2_lowp+0xa8>
+  DB  235,109                             ; jmp           314e4 <_sk_scale_u8_sse2_lowp+0xa8>
   DB  243,69,15,126,4,16                  ; movq          (%r8,%rdx,1),%xmm8
   DB  102,68,15,96,192                    ; punpcklbw     %xmm0,%xmm8
-  DB  235,96                              ; jmp           31b10 <_sk_scale_u8_sse2_lowp+0xa8>
+  DB  235,96                              ; jmp           314e4 <_sk_scale_u8_sse2_lowp+0xa8>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  102,68,15,196,192,2                 ; pinsrw        $0x2,%eax,%xmm8
@@ -47653,7 +47393,7 @@
   DB  102,68,15,110,200                   ; movd          %eax,%xmm9
   DB  102,68,15,96,200                    ; punpcklbw     %xmm0,%xmm9
   DB  243,69,15,16,193                    ; movss         %xmm9,%xmm8
-  DB  235,57                              ; jmp           31b10 <_sk_scale_u8_sse2_lowp+0xa8>
+  DB  235,57                              ; jmp           314e4 <_sk_scale_u8_sse2_lowp+0xa8>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  102,68,15,196,192,6                 ; pinsrw        $0x6,%eax,%xmm8
@@ -47664,9 +47404,9 @@
   DB  102,69,15,110,12,16                 ; movd          (%r8,%rdx,1),%xmm9
   DB  102,68,15,96,200                    ; punpcklbw     %xmm0,%xmm9
   DB  242,69,15,16,193                    ; movsd         %xmm9,%xmm8
-  DB  102,68,15,219,5,23,35,0,0           ; pand          0x2317(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,219,5,35,35,0,0           ; pand          0x2323(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,213,192                   ; pmullw        %xmm8,%xmm0
-  DB  102,68,15,111,13,9,35,0,0           ; movdqa        0x2309(%rip),%xmm9        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,13,21,35,0,0          ; movdqa        0x2315(%rip),%xmm9        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,253,193                   ; paddw         %xmm9,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,65,15,213,200                   ; pmullw        %xmm8,%xmm1
@@ -47706,19 +47446,19 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,36                              ; ja            31bbf <_sk_lerp_u8_sse2_lowp+0x3b>
+  DB  119,36                              ; ja            31593 <_sk_lerp_u8_sse2_lowp+0x3b>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,30,1,0,0                  ; lea           0x11e(%rip),%r9        # 31cc8 <_sk_lerp_u8_sse2_lowp+0x144>
+  DB  76,141,13,30,1,0,0                  ; lea           0x11e(%rip),%r9        # 3169c <_sk_lerp_u8_sse2_lowp+0x144>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
-  DB  235,109                             ; jmp           31c2c <_sk_lerp_u8_sse2_lowp+0xa8>
+  DB  235,109                             ; jmp           31600 <_sk_lerp_u8_sse2_lowp+0xa8>
   DB  243,69,15,126,4,16                  ; movq          (%r8,%rdx,1),%xmm8
   DB  102,68,15,96,192                    ; punpcklbw     %xmm0,%xmm8
-  DB  235,96                              ; jmp           31c2c <_sk_lerp_u8_sse2_lowp+0xa8>
+  DB  235,96                              ; jmp           31600 <_sk_lerp_u8_sse2_lowp+0xa8>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  102,68,15,196,192,2                 ; pinsrw        $0x2,%eax,%xmm8
@@ -47726,7 +47466,7 @@
   DB  102,68,15,110,200                   ; movd          %eax,%xmm9
   DB  102,68,15,96,200                    ; punpcklbw     %xmm0,%xmm9
   DB  243,69,15,16,193                    ; movss         %xmm9,%xmm8
-  DB  235,57                              ; jmp           31c2c <_sk_lerp_u8_sse2_lowp+0xa8>
+  DB  235,57                              ; jmp           31600 <_sk_lerp_u8_sse2_lowp+0xa8>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  102,68,15,196,192,6                 ; pinsrw        $0x6,%eax,%xmm8
@@ -47737,8 +47477,8 @@
   DB  102,69,15,110,12,16                 ; movd          (%r8,%rdx,1),%xmm9
   DB  102,68,15,96,200                    ; punpcklbw     %xmm0,%xmm9
   DB  242,69,15,16,193                    ; movsd         %xmm9,%xmm8
-  DB  102,68,15,219,5,251,33,0,0          ; pand          0x21fb(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
-  DB  102,68,15,111,21,242,33,0,0         ; movdqa        0x21f2(%rip),%xmm10        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,219,5,7,34,0,0            ; pand          0x2207(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
+  DB  102,68,15,111,21,254,33,0,0         ; movdqa        0x21fe(%rip),%xmm10        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,69,15,111,200                   ; movdqa        %xmm8,%xmm9
   DB  102,69,15,239,202                   ; pxor          %xmm10,%xmm9
   DB  102,69,15,111,217                   ; movdqa        %xmm9,%xmm11
@@ -47768,9 +47508,9 @@
   DB  102,65,15,111,216                   ; movdqa        %xmm8,%xmm3
   DB  255,224                             ; jmpq          *%rax
   DB  15,31,0                             ; nopl          (%rax)
-  DB  235,254                             ; jmp           31cc8 <_sk_lerp_u8_sse2_lowp+0x144>
+  DB  235,254                             ; jmp           3169c <_sk_lerp_u8_sse2_lowp+0x144>
   DB  255                                 ; (bad)
-  DB  255,21,255,255,255,4                ; callq         *0x4ffffff(%rip)        # 5031cd0 <_sk_srcover_bgra_8888_sse2_lowp+0x4ffeab4>
+  DB  255,21,255,255,255,4                ; callq         *0x4ffffff(%rip)        # 50316a4 <_sk_srcover_bgra_8888_sse2_lowp+0x4ffeab4>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,84,255,255                      ; callq         *-0x1(%rdi,%rdi,8)
@@ -47799,23 +47539,23 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            31d32 <_sk_scale_565_sse2_lowp+0x4e>
+  DB  119,34                              ; ja            31706 <_sk_scale_565_sse2_lowp+0x4e>
   DB  102,15,239,246                      ; pxor          %xmm6,%xmm6
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,234,1,0,0                 ; lea           0x1ea(%rip),%r9        # 31f08 <_sk_scale_565_sse2_lowp+0x224>
+  DB  76,141,13,234,1,0,0                 ; lea           0x1ea(%rip),%r9        # 318dc <_sk_scale_565_sse2_lowp+0x224>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,15,110,240                      ; movd          %eax,%xmm6
-  DB  235,67                              ; jmp           31d75 <_sk_scale_565_sse2_lowp+0x91>
+  DB  235,67                              ; jmp           31749 <_sk_scale_565_sse2_lowp+0x91>
   DB  243,65,15,111,52,80                 ; movdqu        (%r8,%rdx,2),%xmm6
-  DB  235,59                              ; jmp           31d75 <_sk_scale_565_sse2_lowp+0x91>
+  DB  235,59                              ; jmp           31749 <_sk_scale_565_sse2_lowp+0x91>
   DB  102,15,239,246                      ; pxor          %xmm6,%xmm6
   DB  102,65,15,196,116,80,4,2            ; pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm6
   DB  243,69,15,16,12,80                  ; movss         (%r8,%rdx,2),%xmm9
   DB  243,65,15,16,241                    ; movss         %xmm9,%xmm6
-  DB  235,34                              ; jmp           31d75 <_sk_scale_565_sse2_lowp+0x91>
+  DB  235,34                              ; jmp           31749 <_sk_scale_565_sse2_lowp+0x91>
   DB  102,15,239,246                      ; pxor          %xmm6,%xmm6
   DB  102,65,15,196,116,80,12,6           ; pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm6
   DB  102,65,15,196,116,80,10,5           ; pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm6
@@ -47823,11 +47563,11 @@
   DB  102,65,15,18,52,80                  ; movlpd        (%r8,%rdx,2),%xmm6
   DB  102,68,15,111,222                   ; movdqa        %xmm6,%xmm11
   DB  102,65,15,113,211,8                 ; psrlw         $0x8,%xmm11
-  DB  102,68,15,219,29,55,40,0,0          ; pand          0x2837(%rip),%xmm11        # 345c0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
+  DB  102,68,15,219,29,67,40,0,0          ; pand          0x2843(%rip),%xmm11        # 33fa0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b0>
   DB  102,68,15,111,206                   ; movdqa        %xmm6,%xmm9
   DB  102,65,15,113,209,5                 ; psrlw         $0x5,%xmm9
-  DB  102,68,15,219,13,51,40,0,0          ; pand          0x2833(%rip),%xmm9        # 345d0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
-  DB  102,68,15,111,21,58,40,0,0          ; movdqa        0x283a(%rip),%xmm10        # 345e0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
+  DB  102,68,15,219,13,63,40,0,0          ; pand          0x283f(%rip),%xmm9        # 33fb0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c0>
+  DB  102,68,15,111,21,70,40,0,0          ; movdqa        0x2846(%rip),%xmm10        # 33fc0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d0>
   DB  102,68,15,219,214                   ; pand          %xmm6,%xmm10
   DB  102,15,113,214,13                   ; psrlw         $0xd,%xmm6
   DB  102,65,15,235,243                   ; por           %xmm11,%xmm6
@@ -47839,7 +47579,7 @@
   DB  102,65,15,113,243,3                 ; psllw         $0x3,%xmm11
   DB  102,65,15,113,210,2                 ; psrlw         $0x2,%xmm10
   DB  102,69,15,235,211                   ; por           %xmm11,%xmm10
-  DB  102,68,15,111,37,150,39,0,0         ; movdqa        0x2796(%rip),%xmm12        # 34580 <_sk_srcover_bgra_8888_sse2_lowp+0x1364>
+  DB  102,68,15,111,37,162,39,0,0         ; movdqa        0x27a2(%rip),%xmm12        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0x1370>
   DB  102,68,15,111,235                   ; movdqa        %xmm3,%xmm13
   DB  102,69,15,239,236                   ; pxor          %xmm12,%xmm13
   DB  102,68,15,111,223                   ; movdqa        %xmm7,%xmm11
@@ -47880,7 +47620,7 @@
   DB  102,68,15,213,201                   ; pmullw        %xmm1,%xmm9
   DB  102,68,15,213,210                   ; pmullw        %xmm2,%xmm10
   DB  102,68,15,213,219                   ; pmullw        %xmm3,%xmm11
-  DB  102,15,111,5,120,31,0,0             ; movdqa        0x1f78(%rip),%xmm0        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,15,111,5,132,31,0,0             ; movdqa        0x1f84(%rip),%xmm0        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,253,240                      ; paddw         %xmm0,%xmm6
   DB  102,68,15,253,200                   ; paddw         %xmm0,%xmm9
   DB  102,68,15,253,208                   ; paddw         %xmm0,%xmm10
@@ -47933,23 +47673,23 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            31f72 <_sk_lerp_565_sse2_lowp+0x4e>
+  DB  119,34                              ; ja            31946 <_sk_lerp_565_sse2_lowp+0x4e>
   DB  102,15,239,210                      ; pxor          %xmm2,%xmm2
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,46,2,0,0                  ; lea           0x22e(%rip),%r9        # 3218c <_sk_lerp_565_sse2_lowp+0x268>
+  DB  76,141,13,46,2,0,0                  ; lea           0x22e(%rip),%r9        # 31b60 <_sk_lerp_565_sse2_lowp+0x268>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,15,110,208                      ; movd          %eax,%xmm2
-  DB  235,67                              ; jmp           31fb5 <_sk_lerp_565_sse2_lowp+0x91>
+  DB  235,67                              ; jmp           31989 <_sk_lerp_565_sse2_lowp+0x91>
   DB  243,65,15,111,20,80                 ; movdqu        (%r8,%rdx,2),%xmm2
-  DB  235,59                              ; jmp           31fb5 <_sk_lerp_565_sse2_lowp+0x91>
+  DB  235,59                              ; jmp           31989 <_sk_lerp_565_sse2_lowp+0x91>
   DB  102,15,239,210                      ; pxor          %xmm2,%xmm2
   DB  102,65,15,196,84,80,4,2             ; pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm2
   DB  243,69,15,16,12,80                  ; movss         (%r8,%rdx,2),%xmm9
   DB  243,65,15,16,209                    ; movss         %xmm9,%xmm2
-  DB  235,34                              ; jmp           31fb5 <_sk_lerp_565_sse2_lowp+0x91>
+  DB  235,34                              ; jmp           31989 <_sk_lerp_565_sse2_lowp+0x91>
   DB  102,15,239,210                      ; pxor          %xmm2,%xmm2
   DB  102,65,15,196,84,80,12,6            ; pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm2
   DB  102,65,15,196,84,80,10,5            ; pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm2
@@ -47957,11 +47697,11 @@
   DB  102,65,15,18,20,80                  ; movlpd        (%r8,%rdx,2),%xmm2
   DB  102,68,15,111,218                   ; movdqa        %xmm2,%xmm11
   DB  102,65,15,113,211,8                 ; psrlw         $0x8,%xmm11
-  DB  102,68,15,219,29,247,37,0,0         ; pand          0x25f7(%rip),%xmm11        # 345c0 <_sk_srcover_bgra_8888_sse2_lowp+0x13a4>
+  DB  102,68,15,219,29,3,38,0,0           ; pand          0x2603(%rip),%xmm11        # 33fa0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b0>
   DB  102,68,15,111,202                   ; movdqa        %xmm2,%xmm9
   DB  102,65,15,113,209,5                 ; psrlw         $0x5,%xmm9
-  DB  102,68,15,219,13,243,37,0,0         ; pand          0x25f3(%rip),%xmm9        # 345d0 <_sk_srcover_bgra_8888_sse2_lowp+0x13b4>
-  DB  102,68,15,111,21,250,37,0,0         ; movdqa        0x25fa(%rip),%xmm10        # 345e0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c4>
+  DB  102,68,15,219,13,255,37,0,0         ; pand          0x25ff(%rip),%xmm9        # 33fb0 <_sk_srcover_bgra_8888_sse2_lowp+0x13c0>
+  DB  102,68,15,111,21,6,38,0,0           ; movdqa        0x2606(%rip),%xmm10        # 33fc0 <_sk_srcover_bgra_8888_sse2_lowp+0x13d0>
   DB  102,68,15,219,210                   ; pand          %xmm2,%xmm10
   DB  102,15,113,210,13                   ; psrlw         $0xd,%xmm2
   DB  102,65,15,235,211                   ; por           %xmm11,%xmm2
@@ -47973,7 +47713,7 @@
   DB  102,65,15,113,243,3                 ; psllw         $0x3,%xmm11
   DB  102,65,15,113,210,2                 ; psrlw         $0x2,%xmm10
   DB  102,69,15,235,211                   ; por           %xmm11,%xmm10
-  DB  102,68,15,111,37,86,37,0,0          ; movdqa        0x2556(%rip),%xmm12        # 34580 <_sk_srcover_bgra_8888_sse2_lowp+0x1364>
+  DB  102,68,15,111,37,98,37,0,0          ; movdqa        0x2562(%rip),%xmm12        # 33f60 <_sk_srcover_bgra_8888_sse2_lowp+0x1370>
   DB  102,68,15,111,235                   ; movdqa        %xmm3,%xmm13
   DB  102,69,15,239,236                   ; pxor          %xmm12,%xmm13
   DB  102,68,15,111,223                   ; movdqa        %xmm7,%xmm11
@@ -48012,7 +47752,7 @@
   DB  102,69,15,235,222                   ; por           %xmm14,%xmm11
   DB  102,15,111,194                      ; movdqa        %xmm2,%xmm0
   DB  102,15,213,209                      ; pmullw        %xmm1,%xmm2
-  DB  102,68,15,111,5,66,29,0,0           ; movdqa        0x1d42(%rip),%xmm8        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,5,78,29,0,0           ; movdqa        0x1d4e(%rip),%xmm8        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,65,15,239,192                   ; pxor          %xmm8,%xmm0
   DB  102,15,213,196                      ; pmullw        %xmm4,%xmm0
   DB  102,65,15,253,208                   ; paddw         %xmm8,%xmm2
@@ -48075,7 +47815,7 @@
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  65,15,95,200                        ; maxps         %xmm8,%xmm1
   DB  65,15,95,192                        ; maxps         %xmm8,%xmm0
-  DB  68,15,40,5,212,28,0,0               ; movaps        0x1cd4(%rip),%xmm8        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,5,224,28,0,0               ; movaps        0x1ce0(%rip),%xmm8        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  65,15,93,192                        ; minps         %xmm8,%xmm0
   DB  65,15,93,200                        ; minps         %xmm8,%xmm1
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -48091,7 +47831,7 @@
   DB  69,15,194,208,1                     ; cmpltps       %xmm8,%xmm10
   DB  68,15,40,216                        ; movaps        %xmm0,%xmm11
   DB  69,15,194,217,1                     ; cmpltps       %xmm9,%xmm11
-  DB  68,15,40,37,156,28,0,0              ; movaps        0x1c9c(%rip),%xmm12        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,37,168,28,0,0              ; movaps        0x1ca8(%rip),%xmm12        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,84,220                        ; andps         %xmm12,%xmm11
   DB  69,15,84,212                        ; andps         %xmm12,%xmm10
   DB  69,15,87,237                        ; xorps         %xmm13,%xmm13
@@ -48108,10 +47848,10 @@
 
 PUBLIC _sk_mirror_x_1_sse2_lowp
 _sk_mirror_x_1_sse2_lowp LABEL PROC
-  DB  68,15,40,5,196,28,0,0               ; movaps        0x1cc4(%rip),%xmm8        # 33ef0 <_sk_srcover_bgra_8888_sse2_lowp+0xcd4>
+  DB  68,15,40,5,208,28,0,0               ; movaps        0x1cd0(%rip),%xmm8        # 338d0 <_sk_srcover_bgra_8888_sse2_lowp+0xce0>
   DB  65,15,88,192                        ; addps         %xmm8,%xmm0
   DB  65,15,88,200                        ; addps         %xmm8,%xmm1
-  DB  68,15,40,21,68,28,0,0               ; movaps        0x1c44(%rip),%xmm10        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  68,15,40,21,80,28,0,0               ; movaps        0x1c50(%rip),%xmm10        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  68,15,40,217                        ; movaps        %xmm1,%xmm11
   DB  69,15,89,218                        ; mulps         %xmm10,%xmm11
   DB  68,15,89,208                        ; mulps         %xmm0,%xmm10
@@ -48121,7 +47861,7 @@
   DB  69,15,91,233                        ; cvtdq2ps      %xmm9,%xmm13
   DB  69,15,194,213,1                     ; cmpltps       %xmm13,%xmm10
   DB  69,15,194,220,1                     ; cmpltps       %xmm12,%xmm11
-  DB  68,15,40,13,36,28,0,0               ; movaps        0x1c24(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,13,48,28,0,0               ; movaps        0x1c30(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,84,217                        ; andps         %xmm9,%xmm11
   DB  69,15,84,209                        ; andps         %xmm9,%xmm10
   DB  69,15,87,246                        ; xorps         %xmm14,%xmm14
@@ -48133,7 +47873,7 @@
   DB  65,15,92,204                        ; subps         %xmm12,%xmm1
   DB  65,15,88,200                        ; addps         %xmm8,%xmm1
   DB  65,15,88,192                        ; addps         %xmm8,%xmm0
-  DB  68,15,40,5,16,33,0,0                ; movaps        0x2110(%rip),%xmm8        # 343b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1194>
+  DB  68,15,40,5,28,33,0,0                ; movaps        0x211c(%rip),%xmm8        # 33d90 <_sk_srcover_bgra_8888_sse2_lowp+0x11a0>
   DB  65,15,84,192                        ; andps         %xmm8,%xmm0
   DB  65,15,84,200                        ; andps         %xmm8,%xmm1
   DB  65,15,95,206                        ; maxps         %xmm14,%xmm1
@@ -48161,7 +47901,7 @@
   DB  102,15,239,210                      ; pxor          %xmm2,%xmm2
   DB  73,131,248,2                        ; cmp           $0x2,%r8
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
-  DB  114,56                              ; jb            3232f <_sk_gradient_sse2_lowp+0x73>
+  DB  114,56                              ; jb            31d03 <_sk_gradient_sse2_lowp+0x73>
   DB  72,139,88,72                        ; mov           0x48(%rax),%rbx
   DB  73,255,200                          ; dec           %r8
   DB  72,131,195,4                        ; add           $0x4,%rbx
@@ -48176,7 +47916,7 @@
   DB  102,15,250,220                      ; psubd         %xmm4,%xmm3
   DB  72,131,195,4                        ; add           $0x4,%rbx
   DB  73,255,200                          ; dec           %r8
-  DB  117,219                             ; jne           3230a <_sk_gradient_sse2_lowp+0x4e>
+  DB  117,219                             ; jne           31cde <_sk_gradient_sse2_lowp+0x4e>
   DB  102,15,112,227,78                   ; pshufd        $0x4e,%xmm3,%xmm4
   DB  102,73,15,126,225                   ; movq          %xmm4,%r9
   DB  69,137,200                          ; mov           %r9d,%r8d
@@ -48319,10 +48059,10 @@
   DB  15,88,221                           ; addps         %xmm5,%xmm3
   DB  69,15,89,207                        ; mulps         %xmm15,%xmm9
   DB  68,15,88,204                        ; addps         %xmm4,%xmm9
-  DB  15,40,53,133,25,0,0                 ; movaps        0x1985(%rip),%xmm6        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  DB  15,40,53,145,25,0,0                 ; movaps        0x1991(%rip),%xmm6        # 33950 <_sk_srcover_bgra_8888_sse2_lowp+0xd60>
   DB  15,89,222                           ; mulps         %xmm6,%xmm3
   DB  68,15,89,206                        ; mulps         %xmm6,%xmm9
-  DB  15,40,37,135,24,0,0                 ; movaps        0x1887(%rip),%xmm4        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  15,40,37,147,24,0,0                 ; movaps        0x1893(%rip),%xmm4        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  68,15,88,204                        ; addps         %xmm4,%xmm9
   DB  15,88,220                           ; addps         %xmm4,%xmm3
   DB  243,15,91,219                       ; cvttps2dq     %xmm3,%xmm3
@@ -48417,9 +48157,9 @@
   DB  72,139,24                           ; mov           (%rax),%rbx
   DB  72,139,104,8                        ; mov           0x8(%rax),%rbp
   DB  72,255,203                          ; dec           %rbx
-  DB  120,7                               ; js            3277e <_sk_evenly_spaced_gradient_sse2_lowp+0x3a>
+  DB  120,7                               ; js            32152 <_sk_evenly_spaced_gradient_sse2_lowp+0x3a>
   DB  243,72,15,42,211                    ; cvtsi2ss      %rbx,%xmm2
-  DB  235,21                              ; jmp           32793 <_sk_evenly_spaced_gradient_sse2_lowp+0x4f>
+  DB  235,21                              ; jmp           32167 <_sk_evenly_spaced_gradient_sse2_lowp+0x4f>
   DB  73,137,216                          ; mov           %rbx,%r8
   DB  73,209,232                          ; shr           %r8
   DB  131,227,1                           ; and           $0x1,%ebx
@@ -48574,10 +48314,10 @@
   DB  15,40,68,36,48                      ; movaps        0x30(%rsp),%xmm0
   DB  68,15,89,192                        ; mulps         %xmm0,%xmm8
   DB  68,15,88,193                        ; addps         %xmm1,%xmm8
-  DB  15,40,13,6,21,0,0                   ; movaps        0x1506(%rip),%xmm1        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  DB  15,40,13,18,21,0,0                  ; movaps        0x1512(%rip),%xmm1        # 33950 <_sk_srcover_bgra_8888_sse2_lowp+0xd60>
   DB  15,89,217                           ; mulps         %xmm1,%xmm3
   DB  68,15,89,193                        ; mulps         %xmm1,%xmm8
-  DB  15,40,13,8,20,0,0                   ; movaps        0x1408(%rip),%xmm1        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  15,40,13,20,20,0,0                  ; movaps        0x1414(%rip),%xmm1        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  68,15,88,193                        ; addps         %xmm1,%xmm8
   DB  15,88,217                           ; addps         %xmm1,%xmm3
   DB  243,15,91,219                       ; cvttps2dq     %xmm3,%xmm3
@@ -48594,7 +48334,7 @@
   DB  15,40,240                           ; movaps        %xmm0,%xmm6
   DB  68,15,89,206                        ; mulps         %xmm6,%xmm9
   DB  68,15,88,204                        ; addps         %xmm4,%xmm9
-  DB  15,40,5,170,20,0,0                  ; movaps        0x14aa(%rip),%xmm0        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  DB  15,40,5,182,20,0,0                  ; movaps        0x14b6(%rip),%xmm0        # 33950 <_sk_srcover_bgra_8888_sse2_lowp+0xd60>
   DB  15,89,208                           ; mulps         %xmm0,%xmm2
   DB  68,15,89,200                        ; mulps         %xmm0,%xmm9
   DB  68,15,88,201                        ; addps         %xmm1,%xmm9
@@ -48671,10 +48411,10 @@
   DB  15,89,216                           ; mulps         %xmm0,%xmm3
   DB  65,15,88,216                        ; addps         %xmm8,%xmm3
   DB  65,15,88,208                        ; addps         %xmm8,%xmm2
-  DB  68,15,40,21,109,19,0,0              ; movaps        0x136d(%rip),%xmm10        # 33f70 <_sk_srcover_bgra_8888_sse2_lowp+0xd54>
+  DB  68,15,40,21,121,19,0,0              ; movaps        0x1379(%rip),%xmm10        # 33950 <_sk_srcover_bgra_8888_sse2_lowp+0xd60>
   DB  65,15,89,210                        ; mulps         %xmm10,%xmm2
   DB  65,15,89,218                        ; mulps         %xmm10,%xmm3
-  DB  68,15,40,29,109,18,0,0              ; movaps        0x126d(%rip),%xmm11        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  68,15,40,29,121,18,0,0              ; movaps        0x1279(%rip),%xmm11        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  65,15,88,219                        ; addps         %xmm11,%xmm3
   DB  65,15,88,211                        ; addps         %xmm11,%xmm2
   DB  243,15,91,210                       ; cvttps2dq     %xmm2,%xmm2
@@ -48766,7 +48506,7 @@
   DB  15,40,218                           ; movaps        %xmm2,%xmm3
   DB  15,40,209                           ; movaps        %xmm1,%xmm2
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
-  DB  68,15,40,37,30,22,0,0               ; movaps        0x161e(%rip),%xmm12        # 343b0 <_sk_srcover_bgra_8888_sse2_lowp+0x1194>
+  DB  68,15,40,37,42,22,0,0               ; movaps        0x162a(%rip),%xmm12        # 33d90 <_sk_srcover_bgra_8888_sse2_lowp+0x11a0>
   DB  68,15,40,194                        ; movaps        %xmm2,%xmm8
   DB  69,15,84,196                        ; andps         %xmm12,%xmm8
   DB  68,15,40,217                        ; movaps        %xmm1,%xmm11
@@ -48800,26 +48540,26 @@
   DB  69,15,89,246                        ; mulps         %xmm14,%xmm14
   DB  65,15,40,195                        ; movaps        %xmm11,%xmm0
   DB  15,89,192                           ; mulps         %xmm0,%xmm0
-  DB  68,15,40,37,1,22,0,0                ; movaps        0x1601(%rip),%xmm12        # 34420 <_sk_srcover_bgra_8888_sse2_lowp+0x1204>
+  DB  68,15,40,37,13,22,0,0               ; movaps        0x160d(%rip),%xmm12        # 33e00 <_sk_srcover_bgra_8888_sse2_lowp+0x1210>
   DB  68,15,40,232                        ; movaps        %xmm0,%xmm13
   DB  69,15,89,236                        ; mulps         %xmm12,%xmm13
   DB  69,15,89,230                        ; mulps         %xmm14,%xmm12
-  DB  68,15,40,61,253,21,0,0              ; movaps        0x15fd(%rip),%xmm15        # 34430 <_sk_srcover_bgra_8888_sse2_lowp+0x1214>
+  DB  68,15,40,61,9,22,0,0                ; movaps        0x1609(%rip),%xmm15        # 33e10 <_sk_srcover_bgra_8888_sse2_lowp+0x1220>
   DB  69,15,88,231                        ; addps         %xmm15,%xmm12
   DB  69,15,88,239                        ; addps         %xmm15,%xmm13
   DB  68,15,89,232                        ; mulps         %xmm0,%xmm13
   DB  69,15,89,230                        ; mulps         %xmm14,%xmm12
-  DB  68,15,40,61,245,21,0,0              ; movaps        0x15f5(%rip),%xmm15        # 34440 <_sk_srcover_bgra_8888_sse2_lowp+0x1224>
+  DB  68,15,40,61,1,22,0,0                ; movaps        0x1601(%rip),%xmm15        # 33e20 <_sk_srcover_bgra_8888_sse2_lowp+0x1230>
   DB  69,15,88,231                        ; addps         %xmm15,%xmm12
   DB  69,15,88,239                        ; addps         %xmm15,%xmm13
   DB  68,15,89,232                        ; mulps         %xmm0,%xmm13
   DB  69,15,89,230                        ; mulps         %xmm14,%xmm12
-  DB  15,40,5,238,21,0,0                  ; movaps        0x15ee(%rip),%xmm0        # 34450 <_sk_srcover_bgra_8888_sse2_lowp+0x1234>
+  DB  15,40,5,250,21,0,0                  ; movaps        0x15fa(%rip),%xmm0        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0x1240>
   DB  68,15,88,224                        ; addps         %xmm0,%xmm12
   DB  68,15,88,232                        ; addps         %xmm0,%xmm13
   DB  69,15,89,235                        ; mulps         %xmm11,%xmm13
   DB  69,15,89,224                        ; mulps         %xmm8,%xmm12
-  DB  15,40,5,231,21,0,0                  ; movaps        0x15e7(%rip),%xmm0        # 34460 <_sk_srcover_bgra_8888_sse2_lowp+0x1244>
+  DB  15,40,5,243,21,0,0                  ; movaps        0x15f3(%rip),%xmm0        # 33e40 <_sk_srcover_bgra_8888_sse2_lowp+0x1250>
   DB  68,15,40,192                        ; movaps        %xmm0,%xmm8
   DB  65,15,92,197                        ; subps         %xmm13,%xmm0
   DB  65,15,84,194                        ; andps         %xmm10,%xmm0
@@ -48831,7 +48571,7 @@
   DB  69,15,86,200                        ; orps          %xmm8,%xmm9
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  65,15,194,200,1                     ; cmpltps       %xmm8,%xmm1
-  DB  15,40,5,211,15,0,0                  ; movaps        0xfd3(%rip),%xmm0        # 33e80 <_sk_srcover_bgra_8888_sse2_lowp+0xc64>
+  DB  15,40,5,223,15,0,0                  ; movaps        0xfdf(%rip),%xmm0        # 33860 <_sk_srcover_bgra_8888_sse2_lowp+0xc70>
   DB  68,15,40,216                        ; movaps        %xmm0,%xmm11
   DB  65,15,92,194                        ; subps         %xmm10,%xmm0
   DB  15,84,193                           ; andps         %xmm1,%xmm0
@@ -48844,7 +48584,7 @@
   DB  65,15,86,211                        ; orps          %xmm11,%xmm2
   DB  68,15,40,219                        ; movaps        %xmm3,%xmm11
   DB  69,15,194,216,1                     ; cmpltps       %xmm8,%xmm11
-  DB  68,15,40,13,171,15,0,0              ; movaps        0xfab(%rip),%xmm9        # 33e90 <_sk_srcover_bgra_8888_sse2_lowp+0xc74>
+  DB  68,15,40,13,183,15,0,0              ; movaps        0xfb7(%rip),%xmm9        # 33870 <_sk_srcover_bgra_8888_sse2_lowp+0xc80>
   DB  69,15,40,209                        ; movaps        %xmm9,%xmm10
   DB  68,15,92,201                        ; subps         %xmm1,%xmm9
   DB  69,15,84,203                        ; andps         %xmm11,%xmm9
@@ -48899,26 +48639,26 @@
   DB  65,254,202                          ; dec           %r10b
   DB  69,15,182,202                       ; movzbl        %r10b,%r9d
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,38                              ; ja            32fb8 <_sk_srcover_rgba_8888_sse2_lowp+0x4b>
+  DB  119,38                              ; ja            3298c <_sk_srcover_rgba_8888_sse2_lowp+0x4b>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  76,141,29,70,2,0,0                  ; lea           0x246(%rip),%r11        # 331e4 <_sk_srcover_rgba_8888_sse2_lowp+0x277>
+  DB  76,141,29,70,2,0,0                  ; lea           0x246(%rip),%r11        # 32bb8 <_sk_srcover_rgba_8888_sse2_lowp+0x277>
   DB  75,99,4,139                         ; movslq        (%r11,%r9,4),%rax
   DB  76,1,216                            ; add           %r11,%rax
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  255,224                             ; jmpq          *%rax
   DB  243,65,15,16,60,144                 ; movss         (%r8,%rdx,4),%xmm7
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  235,102                             ; jmp           3301e <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
+  DB  235,102                             ; jmp           329f2 <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
   DB  102,65,15,16,60,144                 ; movupd        (%r8,%rdx,4),%xmm7
   DB  243,69,15,111,68,144,16             ; movdqu        0x10(%r8,%rdx,4),%xmm8
-  DB  235,87                              ; jmp           3301e <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
+  DB  235,87                              ; jmp           329f2 <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
   DB  102,65,15,110,100,144,8             ; movd          0x8(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,69,15,18,4,144                  ; movlpd        (%r8,%rdx,4),%xmm8
   DB  102,65,15,40,248                    ; movapd        %xmm8,%xmm7
   DB  102,68,15,111,196                   ; movdqa        %xmm4,%xmm8
-  DB  235,52                              ; jmp           3301e <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
+  DB  235,52                              ; jmp           329f2 <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
   DB  102,65,15,110,100,144,24            ; movd          0x18(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  243,65,15,16,100,144,20             ; movss         0x14(%r8,%rdx,4),%xmm4
@@ -48935,7 +48675,7 @@
   DB  102,15,114,244,16                   ; pslld         $0x10,%xmm4
   DB  102,15,114,228,16                   ; psrad         $0x10,%xmm4
   DB  102,15,107,236                      ; packssdw      %xmm4,%xmm5
-  DB  102,68,15,111,37,232,13,0,0         ; movdqa        0xde8(%rip),%xmm12        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,37,244,13,0,0         ; movdqa        0xdf4(%rip),%xmm12        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,111,229                      ; movdqa        %xmm5,%xmm4
   DB  102,65,15,219,228                   ; pand          %xmm12,%xmm4
   DB  102,15,113,213,8                    ; psrlw         $0x8,%xmm5
@@ -48993,20 +48733,20 @@
   DB  102,15,105,193                      ; punpckhwd     %xmm1,%xmm0
   DB  102,15,235,194                      ; por           %xmm2,%xmm0
   DB  65,128,250,6                        ; cmp           $0x6,%r10b
-  DB  119,24                              ; ja            33180 <_sk_srcover_rgba_8888_sse2_lowp+0x213>
-  DB  76,141,21,145,0,0,0                 ; lea           0x91(%rip),%r10        # 33200 <_sk_srcover_rgba_8888_sse2_lowp+0x293>
+  DB  119,24                              ; ja            32b54 <_sk_srcover_rgba_8888_sse2_lowp+0x213>
+  DB  76,141,21,145,0,0,0                 ; lea           0x91(%rip),%r10        # 32bd4 <_sk_srcover_rgba_8888_sse2_lowp+0x293>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,69,15,126,36,144                ; movd          %xmm12,(%r8,%rdx,4)
-  DB  235,73                              ; jmp           331c9 <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
+  DB  235,73                              ; jmp           32b9d <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
   DB  243,69,15,127,36,144                ; movdqu        %xmm12,(%r8,%rdx,4)
   DB  243,65,15,127,68,144,16             ; movdqu        %xmm0,0x10(%r8,%rdx,4)
-  DB  235,58                              ; jmp           331c9 <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
+  DB  235,58                              ; jmp           32b9d <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
   DB  102,65,15,112,196,78                ; pshufd        $0x4e,%xmm12,%xmm0
   DB  102,65,15,126,68,144,8              ; movd          %xmm0,0x8(%r8,%rdx,4)
   DB  102,69,15,214,36,144                ; movq          %xmm12,(%r8,%rdx,4)
-  DB  235,37                              ; jmp           331c9 <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
+  DB  235,37                              ; jmp           32b9d <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
   DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
   DB  102,65,15,126,76,144,24             ; movd          %xmm1,0x18(%r8,%rdx,4)
   DB  102,15,112,200,229                  ; pshufd        $0xe5,%xmm0,%xmm1
@@ -49041,7 +48781,7 @@
   DB  254                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  120,255                             ; js            33201 <_sk_srcover_rgba_8888_sse2_lowp+0x294>
+  DB  120,255                             ; js            32bd5 <_sk_srcover_rgba_8888_sse2_lowp+0x294>
   DB  255                                 ; (bad)
   DB  255,156,255,255,255,143,255         ; lcall         *-0x700001(%rdi,%rdi,8)
   DB  255                                 ; (bad)
@@ -49070,26 +48810,26 @@
   DB  65,254,202                          ; dec           %r10b
   DB  69,15,182,202                       ; movzbl        %r10b,%r9d
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,38                              ; ja            33267 <_sk_srcover_bgra_8888_sse2_lowp+0x4b>
+  DB  119,38                              ; ja            32c3b <_sk_srcover_bgra_8888_sse2_lowp+0x4b>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  76,141,29,67,2,0,0                  ; lea           0x243(%rip),%r11        # 33490 <_sk_srcover_bgra_8888_sse2_lowp+0x274>
+  DB  76,141,29,67,2,0,0                  ; lea           0x243(%rip),%r11        # 32e64 <_sk_srcover_bgra_8888_sse2_lowp+0x274>
   DB  75,99,4,139                         ; movslq        (%r11,%r9,4),%rax
   DB  76,1,216                            ; add           %r11,%rax
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  255,224                             ; jmpq          *%rax
   DB  243,65,15,16,60,144                 ; movss         (%r8,%rdx,4),%xmm7
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  235,102                             ; jmp           332cd <_sk_srcover_bgra_8888_sse2_lowp+0xb1>
+  DB  235,102                             ; jmp           32ca1 <_sk_srcover_bgra_8888_sse2_lowp+0xb1>
   DB  102,65,15,16,60,144                 ; movupd        (%r8,%rdx,4),%xmm7
   DB  243,69,15,111,68,144,16             ; movdqu        0x10(%r8,%rdx,4),%xmm8
-  DB  235,87                              ; jmp           332cd <_sk_srcover_bgra_8888_sse2_lowp+0xb1>
+  DB  235,87                              ; jmp           32ca1 <_sk_srcover_bgra_8888_sse2_lowp+0xb1>
   DB  102,65,15,110,100,144,8             ; movd          0x8(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,69,15,18,4,144                  ; movlpd        (%r8,%rdx,4),%xmm8
   DB  102,65,15,40,248                    ; movapd        %xmm8,%xmm7
   DB  102,68,15,111,196                   ; movdqa        %xmm4,%xmm8
-  DB  235,52                              ; jmp           332cd <_sk_srcover_bgra_8888_sse2_lowp+0xb1>
+  DB  235,52                              ; jmp           32ca1 <_sk_srcover_bgra_8888_sse2_lowp+0xb1>
   DB  102,65,15,110,100,144,24            ; movd          0x18(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  243,65,15,16,100,144,20             ; movss         0x14(%r8,%rdx,4),%xmm4
@@ -49106,7 +48846,7 @@
   DB  102,15,114,244,16                   ; pslld         $0x10,%xmm4
   DB  102,15,114,228,16                   ; psrad         $0x10,%xmm4
   DB  102,15,107,236                      ; packssdw      %xmm4,%xmm5
-  DB  102,68,15,111,37,57,11,0,0          ; movdqa        0xb39(%rip),%xmm12        # 33e30 <_sk_srcover_bgra_8888_sse2_lowp+0xc14>
+  DB  102,68,15,111,37,69,11,0,0          ; movdqa        0xb45(%rip),%xmm12        # 33810 <_sk_srcover_bgra_8888_sse2_lowp+0xc20>
   DB  102,15,111,245                      ; movdqa        %xmm5,%xmm6
   DB  102,65,15,219,244                   ; pand          %xmm12,%xmm6
   DB  102,15,113,213,8                    ; psrlw         $0x8,%xmm5
@@ -49164,20 +48904,20 @@
   DB  102,15,105,193                      ; punpckhwd     %xmm1,%xmm0
   DB  102,15,235,194                      ; por           %xmm2,%xmm0
   DB  65,128,250,6                        ; cmp           $0x6,%r10b
-  DB  119,24                              ; ja            3342f <_sk_srcover_bgra_8888_sse2_lowp+0x213>
-  DB  76,141,21,142,0,0,0                 ; lea           0x8e(%rip),%r10        # 334ac <_sk_srcover_bgra_8888_sse2_lowp+0x290>
+  DB  119,24                              ; ja            32e03 <_sk_srcover_bgra_8888_sse2_lowp+0x213>
+  DB  76,141,21,142,0,0,0                 ; lea           0x8e(%rip),%r10        # 32e80 <_sk_srcover_bgra_8888_sse2_lowp+0x290>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,69,15,126,36,144                ; movd          %xmm12,(%r8,%rdx,4)
-  DB  235,73                              ; jmp           33478 <_sk_srcover_bgra_8888_sse2_lowp+0x25c>
+  DB  235,73                              ; jmp           32e4c <_sk_srcover_bgra_8888_sse2_lowp+0x25c>
   DB  243,69,15,127,36,144                ; movdqu        %xmm12,(%r8,%rdx,4)
   DB  243,65,15,127,68,144,16             ; movdqu        %xmm0,0x10(%r8,%rdx,4)
-  DB  235,58                              ; jmp           33478 <_sk_srcover_bgra_8888_sse2_lowp+0x25c>
+  DB  235,58                              ; jmp           32e4c <_sk_srcover_bgra_8888_sse2_lowp+0x25c>
   DB  102,65,15,112,196,78                ; pshufd        $0x4e,%xmm12,%xmm0
   DB  102,65,15,126,68,144,8              ; movd          %xmm0,0x8(%r8,%rdx,4)
   DB  102,69,15,214,36,144                ; movq          %xmm12,(%r8,%rdx,4)
-  DB  235,37                              ; jmp           33478 <_sk_srcover_bgra_8888_sse2_lowp+0x25c>
+  DB  235,37                              ; jmp           32e4c <_sk_srcover_bgra_8888_sse2_lowp+0x25c>
   DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
   DB  102,65,15,126,76,144,24             ; movd          %xmm1,0x18(%r8,%rdx,4)
   DB  102,15,112,200,229                  ; pshufd        $0xe5,%xmm0,%xmm1
@@ -49210,7 +48950,7 @@
   DB  254                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  123,255                             ; jnp           334ad <_sk_srcover_bgra_8888_sse2_lowp+0x291>
+  DB  123,255                             ; jnp           32e81 <_sk_srcover_bgra_8888_sse2_lowp+0x291>
   DB  255                                 ; (bad)
   DB  255,159,255,255,255,146             ; lcall         *-0x6d000001(%rdi)
   DB  255                                 ; (bad)
@@ -49243,14 +48983,14 @@
   DB  252                                 ; cld
   DB  190,0,0,128,191                     ; mov           $0xbf800000,%esi
   DB  0,0                                 ; add           %al,(%rax)
-  DB  224,64                              ; loopne        3352c <.literal4+0x64>
+  DB  224,64                              ; loopne        32f00 <.literal4+0x64>
   DB  154                                 ; (bad)
   DB  153                                 ; cltd
   DB  153                                 ; cltd
   DB  62,61,10,23,63,174                  ; ds            cmp $0xae3f170a,%eax
-  DB  71,225,61                           ; rex.RXB       loope 33535 <.literal4+0x6d>
+  DB  71,225,61                           ; rex.RXB       loope 32f09 <.literal4+0x6d>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  127,67                              ; jg            3353f <.literal4+0x77>
+  DB  127,67                              ; jg            32f13 <.literal4+0x77>
   DB  0,0                                 ; add           %al,(%rax)
   DB  128,127,145,131                     ; cmpb          $0x83,-0x6f(%rdi)
   DB  158                                 ; sahf
@@ -49285,7 +49025,7 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  8,33                                ; or            %ah,(%rcx)
   DB  132,55                              ; test          %dh,(%rdi)
-  DB  224,7                               ; loopne        33559 <.literal4+0x91>
+  DB  224,7                               ; loopne        32f2d <.literal4+0x91>
   DB  0,0                                 ; add           %al,(%rax)
   DB  33,8                                ; and           %ecx,(%rax)
   DB  2,58                                ; add           (%rdx),%bh
@@ -49296,8 +49036,8 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  0,52,255                            ; add           %dh,(%rdi,%rdi,8)
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            3356c <.literal4+0xa4>
-  DB  119,115                             ; ja            335e1 <.literal4+0x119>
+  DB  127,0                               ; jg            32f40 <.literal4+0xa4>
+  DB  119,115                             ; ja            32fb5 <.literal4+0x119>
   DB  248                                 ; clc
   DB  194,117,191                         ; retq          $0xbf75
   DB  191,63,249,68,180                   ; mov           $0xb444f93f,%edi
@@ -49320,12 +49060,12 @@
   DB  190,80,128,3,62                     ; mov           $0x3e038050,%esi
   DB  31                                  ; (bad)
   DB  215                                 ; xlat          %ds:(%rbx)
-  DB  118,63                              ; jbe           335f7 <.literal4+0x12f>
+  DB  118,63                              ; jbe           32fcb <.literal4+0x12f>
   DB  246,64,83,63                        ; testb         $0x3f,0x53(%rax)
   DB  0,0                                 ; add           %al,(%rax)
   DB  248                                 ; clc
   DB  65,0,0                              ; add           %al,(%r8)
-  DB  124,66                              ; jl            33606 <.literal4+0x13e>
+  DB  124,66                              ; jl            32fda <.literal4+0x13e>
   DB  0,240                               ; add           %dh,%al
   DB  0,0                                 ; add           %al,(%rax)
   DB  137,136,136,55,0,15                 ; mov           %ecx,0xf003788(%rax)
@@ -49335,9 +49075,9 @@
   DB  137,136,136,59,15,0                 ; mov           %ecx,0xf3b88(%rax)
   DB  0,0                                 ; add           %al,(%rax)
   DB  137,136,136,61,0,0                  ; mov           %ecx,0x3d88(%rax)
-  DB  112,65                              ; jo            33629 <.literal4+0x161>
+  DB  112,65                              ; jo            32ffd <.literal4+0x161>
   DB  0,255                               ; add           %bh,%bh
-  DB  127,71                              ; jg            33633 <.literal4+0x16b>
+  DB  127,71                              ; jg            33007 <.literal4+0x16b>
   DB  208                                 ; (bad)
   DB  179,89                              ; mov           $0x59,%bl
   DB  62,89                               ; ds            pop %rcx
@@ -49355,15 +49095,15 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  128,0,0                             ; addb          $0x0,(%rax)
   DB  0,191,0,0,192,191                   ; add           %bh,-0x40400000(%rdi)
-  DB  114,28                              ; jb            33636 <.literal4+0x16e>
+  DB  114,28                              ; jb            3300a <.literal4+0x16e>
   DB  199                                 ; (bad)
   DB  62,0,0                              ; add           %al,%ds:(%rax)
   DB  192,63,85                           ; sarb          $0x55,(%rdi)
   DB  85                                  ; push          %rbp
   DB  149                                 ; xchg          %eax,%ebp
   DB  191,57,142,99,61                    ; mov           $0x3d638e39,%edi
-  DB  114,249                             ; jb            33623 <.literal4+0x15b>
-  DB  127,63                              ; jg            3366b <_sk_srcover_bgra_8888_sse2_lowp+0x44f>
+  DB  114,249                             ; jb            32ff7 <.literal4+0x15b>
+  DB  127,63                              ; jg            3303f <_sk_srcover_bgra_8888_sse2_lowp+0x44f>
   DB  3,0                                 ; add           (%rax),%eax
   DB  0,0                                 ; add           %al,(%rax)
   DB  18,120,57                           ; adc           0x39(%rax),%bh
@@ -49379,7 +49119,7 @@
   DB  56,255                              ; cmp           %bh,%bh
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            33655 <.literal4+0x18d>
+  DB  127,0                               ; jg            33029 <.literal4+0x18d>
   DB  0,128,56,0,64,254                   ; add           %al,-0x1bfffc8(%rax)
   DB  255                                 ; .byte         0xff
 
@@ -49417,16 +49157,16 @@
   DB  0,1                                 ; add           %al,(%rcx)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a0336a8 <_sk_srcover_bgra_8888_sse2_lowp+0xa00048c>
+  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a033088 <_sk_srcover_bgra_8888_sse2_lowp+0xa000498>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 120336b0 <_sk_srcover_bgra_8888_sse2_lowp+0x12000494>
+  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 12033090 <_sk_srcover_bgra_8888_sse2_lowp+0x120004a0>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a0336b8 <_sk_srcover_bgra_8888_sse2_lowp+0x1a00049c>
+  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a033098 <_sk_srcover_bgra_8888_sse2_lowp+0x1a0004a8>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 30336c0 <_sk_srcover_bgra_8888_sse2_lowp+0x30004a4>
+  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 30330a0 <_sk_srcover_bgra_8888_sse2_lowp+0x30004b0>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,6                               ; incl          (%rsi)
@@ -49469,16 +49209,16 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  1,255                               ; add           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a033708 <_sk_srcover_bgra_8888_sse2_lowp+0xa0004ec>
+  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a0330e8 <_sk_srcover_bgra_8888_sse2_lowp+0xa0004f8>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 12033710 <_sk_srcover_bgra_8888_sse2_lowp+0x120004f4>
+  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 120330f0 <_sk_srcover_bgra_8888_sse2_lowp+0x12000500>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a033718 <_sk_srcover_bgra_8888_sse2_lowp+0x1a0004fc>
+  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a0330f8 <_sk_srcover_bgra_8888_sse2_lowp+0x1a000508>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 3033720 <_sk_srcover_bgra_8888_sse2_lowp+0x3000504>
+  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 3033100 <_sk_srcover_bgra_8888_sse2_lowp+0x3000510>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,6                               ; incl          (%rsi)
@@ -49521,16 +49261,16 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  1,255                               ; add           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a033768 <_sk_srcover_bgra_8888_sse2_lowp+0xa00054c>
+  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a033148 <_sk_srcover_bgra_8888_sse2_lowp+0xa000558>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 12033770 <_sk_srcover_bgra_8888_sse2_lowp+0x12000554>
+  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 12033150 <_sk_srcover_bgra_8888_sse2_lowp+0x12000560>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a033778 <_sk_srcover_bgra_8888_sse2_lowp+0x1a00055c>
+  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a033158 <_sk_srcover_bgra_8888_sse2_lowp+0x1a000568>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 3033780 <_sk_srcover_bgra_8888_sse2_lowp+0x3000564>
+  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 3033160 <_sk_srcover_bgra_8888_sse2_lowp+0x3000570>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,6                               ; incl          (%rsi)
@@ -49573,16 +49313,16 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  1,255                               ; add           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a0337c8 <_sk_srcover_bgra_8888_sse2_lowp+0xa0005ac>
+  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a0331a8 <_sk_srcover_bgra_8888_sse2_lowp+0xa0005b8>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 120337d0 <_sk_srcover_bgra_8888_sse2_lowp+0x120005b4>
+  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 120331b0 <_sk_srcover_bgra_8888_sse2_lowp+0x120005c0>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a0337d8 <_sk_srcover_bgra_8888_sse2_lowp+0x1a0005bc>
+  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a0331b8 <_sk_srcover_bgra_8888_sse2_lowp+0x1a0005c8>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 30337e0 <_sk_srcover_bgra_8888_sse2_lowp+0x30005c4>
+  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 30331c0 <_sk_srcover_bgra_8888_sse2_lowp+0x30005d0>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,6                               ; incl          (%rsi)
@@ -49625,16 +49365,16 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  1,255                               ; add           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a033828 <_sk_srcover_bgra_8888_sse2_lowp+0xa00060c>
+  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a033208 <_sk_srcover_bgra_8888_sse2_lowp+0xa000618>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 12033830 <_sk_srcover_bgra_8888_sse2_lowp+0x12000614>
+  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 12033210 <_sk_srcover_bgra_8888_sse2_lowp+0x12000620>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a033838 <_sk_srcover_bgra_8888_sse2_lowp+0x1a00061c>
+  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a033218 <_sk_srcover_bgra_8888_sse2_lowp+0x1a000628>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 3033840 <_sk_srcover_bgra_8888_sse2_lowp+0x3000624>
+  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 3033220 <_sk_srcover_bgra_8888_sse2_lowp+0x3000630>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,6                               ; incl          (%rsi)
@@ -49677,16 +49417,16 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  1,255                               ; add           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a033888 <_sk_srcover_bgra_8888_sse2_lowp+0xa00066c>
+  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a033268 <_sk_srcover_bgra_8888_sse2_lowp+0xa000678>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 12033890 <_sk_srcover_bgra_8888_sse2_lowp+0x12000674>
+  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 12033270 <_sk_srcover_bgra_8888_sse2_lowp+0x12000680>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a033898 <_sk_srcover_bgra_8888_sse2_lowp+0x1a00067c>
+  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a033278 <_sk_srcover_bgra_8888_sse2_lowp+0x1a000688>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 30338a0 <_sk_srcover_bgra_8888_sse2_lowp+0x3000684>
+  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 3033280 <_sk_srcover_bgra_8888_sse2_lowp+0x3000690>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,6                               ; incl          (%rsi)
@@ -49729,16 +49469,16 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  1,255                               ; add           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a0338e8 <_sk_srcover_bgra_8888_sse2_lowp+0xa0006cc>
+  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a0332c8 <_sk_srcover_bgra_8888_sse2_lowp+0xa0006d8>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 120338f0 <_sk_srcover_bgra_8888_sse2_lowp+0x120006d4>
+  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 120332d0 <_sk_srcover_bgra_8888_sse2_lowp+0x120006e0>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a0338f8 <_sk_srcover_bgra_8888_sse2_lowp+0x1a0006dc>
+  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a0332d8 <_sk_srcover_bgra_8888_sse2_lowp+0x1a0006e8>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 3033900 <_sk_srcover_bgra_8888_sse2_lowp+0x30006e4>
+  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 30332e0 <_sk_srcover_bgra_8888_sse2_lowp+0x30006f0>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,6                               ; incl          (%rsi)
@@ -49781,16 +49521,16 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  1,255                               ; add           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a033948 <_sk_srcover_bgra_8888_sse2_lowp+0xa00072c>
+  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a033328 <_sk_srcover_bgra_8888_sse2_lowp+0xa000738>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 12033950 <_sk_srcover_bgra_8888_sse2_lowp+0x12000734>
+  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 12033330 <_sk_srcover_bgra_8888_sse2_lowp+0x12000740>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a033958 <_sk_srcover_bgra_8888_sse2_lowp+0x1a00073c>
+  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a033338 <_sk_srcover_bgra_8888_sse2_lowp+0x1a000748>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 3033960 <_sk_srcover_bgra_8888_sse2_lowp+0x3000744>
+  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 3033340 <_sk_srcover_bgra_8888_sse2_lowp+0x3000750>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,6                               ; incl          (%rsi)
@@ -49833,16 +49573,16 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  1,255                               ; add           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a0339a8 <_sk_srcover_bgra_8888_sse2_lowp+0xa00078c>
+  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a033388 <_sk_srcover_bgra_8888_sse2_lowp+0xa000798>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 120339b0 <_sk_srcover_bgra_8888_sse2_lowp+0x12000794>
+  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 12033390 <_sk_srcover_bgra_8888_sse2_lowp+0x120007a0>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a0339b8 <_sk_srcover_bgra_8888_sse2_lowp+0x1a00079c>
+  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a033398 <_sk_srcover_bgra_8888_sse2_lowp+0x1a0007a8>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 30339c0 <_sk_srcover_bgra_8888_sse2_lowp+0x30007a4>
+  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 30333a0 <_sk_srcover_bgra_8888_sse2_lowp+0x30007b0>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,6                               ; incl          (%rsi)
@@ -49885,16 +49625,16 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  1,255                               ; add           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a033a08 <_sk_srcover_bgra_8888_sse2_lowp+0xa0007ec>
+  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a0333e8 <_sk_srcover_bgra_8888_sse2_lowp+0xa0007f8>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 12033a10 <_sk_srcover_bgra_8888_sse2_lowp+0x120007f4>
+  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 120333f0 <_sk_srcover_bgra_8888_sse2_lowp+0x12000800>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a033a18 <_sk_srcover_bgra_8888_sse2_lowp+0x1a0007fc>
+  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a0333f8 <_sk_srcover_bgra_8888_sse2_lowp+0x1a000808>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 3033a20 <_sk_srcover_bgra_8888_sse2_lowp+0x3000804>
+  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 3033400 <_sk_srcover_bgra_8888_sse2_lowp+0x3000810>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,6                               ; incl          (%rsi)
@@ -50246,7 +49986,7 @@
   DB  0,255                               ; add           %bh,%bh
   DB  0,0                                 ; add           %al,(%rax)
   DB  248                                 ; clc
-  DB  224,255                             ; loopne        33cd3 <.const+0x673>
+  DB  224,255                             ; loopne        336b3 <.const+0x673>
   DB  248                                 ; clc
   DB  0,63                                ; add           %bh,(%rdi)
   DB  0,31                                ; add           %bl,(%rdi)
@@ -50507,11 +50247,11 @@
   DB  0,128,191,0,0,128                   ; add           %al,-0x7fffff41(%rax)
   DB  191,0,0,224,64                      ; mov           $0x40e00000,%edi
   DB  0,0                                 ; add           %al,(%rax)
-  DB  224,64                              ; loopne        33f48 <.literal16+0x118>
+  DB  224,64                              ; loopne        33928 <.literal16+0x118>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  224,64                              ; loopne        33f4c <.literal16+0x11c>
+  DB  224,64                              ; loopne        3392c <.literal16+0x11c>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  224,64                              ; loopne        33f50 <.literal16+0x120>
+  DB  224,64                              ; loopne        33930 <.literal16+0x120>
   DB  154                                 ; (bad)
   DB  153                                 ; cltd
   DB  153                                 ; cltd
@@ -50531,13 +50271,13 @@
   DB  10,23                               ; or            (%rdi),%dl
   DB  63                                  ; (bad)
   DB  174                                 ; scas          %es:(%rdi),%al
-  DB  71,225,61                           ; rex.RXB       loope 33f71 <.literal16+0x141>
+  DB  71,225,61                           ; rex.RXB       loope 33951 <.literal16+0x141>
   DB  174                                 ; scas          %es:(%rdi),%al
-  DB  71,225,61                           ; rex.RXB       loope 33f75 <.literal16+0x145>
+  DB  71,225,61                           ; rex.RXB       loope 33955 <.literal16+0x145>
   DB  174                                 ; scas          %es:(%rdi),%al
-  DB  71,225,61                           ; rex.RXB       loope 33f79 <.literal16+0x149>
+  DB  71,225,61                           ; rex.RXB       loope 33959 <.literal16+0x149>
   DB  174                                 ; scas          %es:(%rdi),%al
-  DB  71,225,61                           ; rex.RXB       loope 33f7d <.literal16+0x14d>
+  DB  71,225,61                           ; rex.RXB       loope 3395d <.literal16+0x14d>
   DB  255,0                               ; incl          (%rax)
   DB  0,0                                 ; add           %al,(%rax)
   DB  255,0                               ; incl          (%rax)
@@ -50548,10 +50288,10 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  1,255                               ; add           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a033f58 <_sk_srcover_bgra_8888_sse2_lowp+0xa000d3c>
+  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a033938 <_sk_srcover_bgra_8888_sse2_lowp+0xa000d48>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,13,255,255,255,2                ; decl          0x2ffffff(%rip)        # 3033f60 <_sk_srcover_bgra_8888_sse2_lowp+0x3000d44>
+  DB  255,13,255,255,255,2                ; decl          0x2ffffff(%rip)        # 3033940 <_sk_srcover_bgra_8888_sse2_lowp+0x3000d50>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,6                               ; incl          (%rsi)
@@ -50566,11 +50306,11 @@
   DB  255,0                               ; incl          (%rax)
   DB  0,127,67                            ; add           %bh,0x43(%rdi)
   DB  0,0                                 ; add           %al,(%rax)
-  DB  127,67                              ; jg            33fbb <.literal16+0x18b>
+  DB  127,67                              ; jg            3399b <.literal16+0x18b>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  127,67                              ; jg            33fbf <.literal16+0x18f>
+  DB  127,67                              ; jg            3399f <.literal16+0x18f>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  127,67                              ; jg            33fc3 <.literal16+0x193>
+  DB  127,67                              ; jg            339a3 <.literal16+0x193>
   DB  0,0                                 ; add           %al,(%rax)
   DB  128,127,0,0                         ; cmpb          $0x0,0x0(%rdi)
   DB  128,127,0,0                         ; cmpb          $0x0,0x0(%rdi)
@@ -50726,13 +50466,13 @@
   DB  132,55                              ; test          %dh,(%rdi)
   DB  8,33                                ; or            %ah,(%rcx)
   DB  132,55                              ; test          %dh,(%rdi)
-  DB  224,7                               ; loopne        340d9 <.literal16+0x2a9>
+  DB  224,7                               ; loopne        33ab9 <.literal16+0x2a9>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  224,7                               ; loopne        340dd <.literal16+0x2ad>
+  DB  224,7                               ; loopne        33abd <.literal16+0x2ad>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  224,7                               ; loopne        340e1 <.literal16+0x2b1>
+  DB  224,7                               ; loopne        33ac1 <.literal16+0x2b1>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  224,7                               ; loopne        340e5 <.literal16+0x2b5>
+  DB  224,7                               ; loopne        33ac5 <.literal16+0x2b5>
   DB  0,0                                 ; add           %al,(%rax)
   DB  33,8                                ; and           %ecx,(%rax)
   DB  2,58                                ; add           (%rdx),%bh
@@ -50786,17 +50526,17 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  52,255                              ; xor           $0xff,%al
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            34154 <.literal16+0x324>
+  DB  127,0                               ; jg            33b34 <.literal16+0x324>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            34158 <.literal16+0x328>
+  DB  127,0                               ; jg            33b38 <.literal16+0x328>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            3415c <.literal16+0x32c>
+  DB  127,0                               ; jg            33b3c <.literal16+0x32c>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            34160 <.literal16+0x330>
-  DB  119,115                             ; ja            341d5 <.literal16+0x3a5>
+  DB  127,0                               ; jg            33b40 <.literal16+0x330>
+  DB  119,115                             ; ja            33bb5 <.literal16+0x3a5>
   DB  248                                 ; clc
   DB  194,119,115                         ; retq          $0x7377
   DB  248                                 ; clc
@@ -50807,7 +50547,7 @@
   DB  194,117,191                         ; retq          $0xbf75
   DB  191,63,117,191,191                  ; mov           $0xbfbf753f,%edi
   DB  63                                  ; (bad)
-  DB  117,191                             ; jne           34139 <.literal16+0x309>
+  DB  117,191                             ; jne           33b19 <.literal16+0x309>
   DB  191,63,117,191,191                  ; mov           $0xbfbf753f,%edi
   DB  63                                  ; (bad)
   DB  249                                 ; stc
@@ -50819,7 +50559,7 @@
   DB  249                                 ; stc
   DB  68,180,62                           ; rex.R         mov $0x3e,%spl
   DB  163,233,220,63,163,233,220,63,163   ; movabs        %eax,0xa33fdce9a33fdce9
-  DB  233,220,63,163,233                  ; jmpq          ffffffffe9a6817a <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffe9a34f5e>
+  DB  233,220,63,163,233                  ; jmpq          ffffffffe9a67b5a <_sk_srcover_bgra_8888_sse2_lowp+0xffffffffe9a34f6a>
   DB  220,63                              ; fdivrl        (%rdi)
   DB  81                                  ; push          %rcx
   DB  140,242                             ; mov           %?,%edx
@@ -50909,16 +50649,16 @@
   DB  128,3,62                            ; addb          $0x3e,(%rbx)
   DB  31                                  ; (bad)
   DB  215                                 ; xlat          %ds:(%rbx)
-  DB  118,63                              ; jbe           342c3 <.literal16+0x493>
+  DB  118,63                              ; jbe           33ca3 <.literal16+0x493>
   DB  31                                  ; (bad)
   DB  215                                 ; xlat          %ds:(%rbx)
-  DB  118,63                              ; jbe           342c7 <.literal16+0x497>
+  DB  118,63                              ; jbe           33ca7 <.literal16+0x497>
   DB  31                                  ; (bad)
   DB  215                                 ; xlat          %ds:(%rbx)
-  DB  118,63                              ; jbe           342cb <.literal16+0x49b>
+  DB  118,63                              ; jbe           33cab <.literal16+0x49b>
   DB  31                                  ; (bad)
   DB  215                                 ; xlat          %ds:(%rbx)
-  DB  118,63                              ; jbe           342cf <.literal16+0x49f>
+  DB  118,63                              ; jbe           33caf <.literal16+0x49f>
   DB  246,64,83,63                        ; testb         $0x3f,0x53(%rax)
   DB  246,64,83,63                        ; testb         $0x3f,0x53(%rax)
   DB  246,64,83,63                        ; testb         $0x3f,0x53(%rax)
@@ -50939,13 +50679,13 @@
   DB  65,0,0                              ; add           %al,(%r8)
   DB  248                                 ; clc
   DB  65,0,0                              ; add           %al,(%r8)
-  DB  124,66                              ; jl            34306 <.literal16+0x4d6>
+  DB  124,66                              ; jl            33ce6 <.literal16+0x4d6>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  124,66                              ; jl            3430a <.literal16+0x4da>
+  DB  124,66                              ; jl            33cea <.literal16+0x4da>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  124,66                              ; jl            3430e <.literal16+0x4de>
+  DB  124,66                              ; jl            33cee <.literal16+0x4de>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  124,66                              ; jl            34312 <.literal16+0x4e2>
+  DB  124,66                              ; jl            33cf2 <.literal16+0x4e2>
   DB  0,240                               ; add           %dh,%al
   DB  0,0                                 ; add           %al,(%rax)
   DB  0,240                               ; add           %dh,%al
@@ -50991,25 +50731,25 @@
   DB  136,136,61,137,136,136              ; mov           %cl,-0x777776c3(%rax)
   DB  61,137,136,136,61                   ; cmp           $0x3d888889,%eax
   DB  0,0                                 ; add           %al,(%rax)
-  DB  112,65                              ; jo            34395 <.literal16+0x565>
+  DB  112,65                              ; jo            33d75 <.literal16+0x565>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  112,65                              ; jo            34399 <.literal16+0x569>
+  DB  112,65                              ; jo            33d79 <.literal16+0x569>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  112,65                              ; jo            3439d <.literal16+0x56d>
+  DB  112,65                              ; jo            33d7d <.literal16+0x56d>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  112,65                              ; jo            343a1 <.literal16+0x571>
+  DB  112,65                              ; jo            33d81 <.literal16+0x571>
   DB  0,128,0,0,0,128                     ; add           %al,-0x80000000(%rax)
   DB  0,0                                 ; add           %al,(%rax)
   DB  0,128,0,0,0,128                     ; add           %al,-0x80000000(%rax)
   DB  0,0                                 ; add           %al,(%rax)
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            34373 <.literal16+0x543>
+  DB  127,0                               ; jg            33d53 <.literal16+0x543>
   DB  0,255                               ; add           %bh,%bh
-  DB  127,0                               ; jg            34377 <.literal16+0x547>
+  DB  127,0                               ; jg            33d57 <.literal16+0x547>
   DB  0,255                               ; add           %bh,%bh
-  DB  127,0                               ; jg            3437b <.literal16+0x54b>
+  DB  127,0                               ; jg            33d5b <.literal16+0x54b>
   DB  0,255                               ; add           %bh,%bh
-  DB  127,0                               ; jg            3437f <.literal16+0x54f>
+  DB  127,0                               ; jg            33d5f <.literal16+0x54f>
   DB  0,0                                 ; add           %al,(%rax)
   DB  4,0                                 ; add           $0x0,%al
   DB  0,0                                 ; add           %al,(%rax)
@@ -51035,13 +50775,13 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  127,255                             ; jg            343b8 <.literal16+0x588>
+  DB  127,255                             ; jg            33d98 <.literal16+0x588>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  127,255                             ; jg            343bc <.literal16+0x58c>
+  DB  127,255                             ; jg            33d9c <.literal16+0x58c>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            343c1 <.literal16+0x591>
+  DB  127,0                               ; jg            33da1 <.literal16+0x591>
   DB  0,128,56,0,0,128                    ; add           %al,-0x7fffffc8(%rax)
   DB  56,0                                ; cmp           %al,(%rax)
   DB  0,128,56,0,0,128                    ; add           %al,-0x7fffffc8(%rax)
@@ -51055,13 +50795,13 @@
   DB  64,254                              ; rex           (bad)
   DB  255,0                               ; incl          (%rax)
   DB  255                                 ; (bad)
-  DB  127,71                              ; jg            3442b <.literal16+0x5fb>
+  DB  127,71                              ; jg            33e0b <.literal16+0x5fb>
   DB  0,255                               ; add           %bh,%bh
-  DB  127,71                              ; jg            3442f <.literal16+0x5ff>
+  DB  127,71                              ; jg            33e0f <.literal16+0x5ff>
   DB  0,255                               ; add           %bh,%bh
-  DB  127,71                              ; jg            34433 <.literal16+0x603>
+  DB  127,71                              ; jg            33e13 <.literal16+0x603>
   DB  0,255                               ; add           %bh,%bh
-  DB  127,71                              ; jg            34437 <.literal16+0x607>
+  DB  127,71                              ; jg            33e17 <.literal16+0x607>
   DB  208                                 ; (bad)
   DB  179,89                              ; mov           $0x59,%bl
   DB  62,208                              ; ds            (bad)
@@ -51126,13 +50866,13 @@
   DB  192,191,0,0,192,191,0               ; sarb          $0x0,-0x40400000(%rdi)
   DB  0,192                               ; add           %al,%al
   DB  191,0,0,192,191                     ; mov           $0xbfc00000,%edi
-  DB  114,28                              ; jb            344ae <.literal16+0x67e>
+  DB  114,28                              ; jb            33e8e <.literal16+0x67e>
   DB  199                                 ; (bad)
-  DB  62,114,28                           ; jb,pt         344b2 <.literal16+0x682>
+  DB  62,114,28                           ; jb,pt         33e92 <.literal16+0x682>
   DB  199                                 ; (bad)
-  DB  62,114,28                           ; jb,pt         344b6 <.literal16+0x686>
+  DB  62,114,28                           ; jb,pt         33e96 <.literal16+0x686>
   DB  199                                 ; (bad)
-  DB  62,114,28                           ; jb,pt         344ba <.literal16+0x68a>
+  DB  62,114,28                           ; jb,pt         33e9a <.literal16+0x68a>
   DB  199                                 ; (bad)
   DB  62,85                               ; ds            push %rbp
   DB  85                                  ; push          %rbp
@@ -51151,15 +50891,15 @@
   DB  0,192                               ; add           %al,%al
   DB  63                                  ; (bad)
   DB  57,142,99,61,57,142                 ; cmp           %ecx,-0x71c6c29d(%rsi)
-  DB  99,61,57,142,99,61                  ; movslq        0x3d638e39(%rip),%edi        # 3d66d305 <_sk_srcover_bgra_8888_sse2_lowp+0x3d63a0e9>
+  DB  99,61,57,142,99,61                  ; movslq        0x3d638e39(%rip),%edi        # 3d66cce5 <_sk_srcover_bgra_8888_sse2_lowp+0x3d63a0f5>
   DB  57,142,99,61,114,249                ; cmp           %ecx,-0x68dc29d(%rsi)
-  DB  127,63                              ; jg            34513 <.literal16+0x6e3>
-  DB  114,249                             ; jb            344cf <.literal16+0x69f>
-  DB  127,63                              ; jg            34517 <.literal16+0x6e7>
-  DB  114,249                             ; jb            344d3 <.literal16+0x6a3>
-  DB  127,63                              ; jg            3451b <.literal16+0x6eb>
-  DB  114,249                             ; jb            344d7 <.literal16+0x6a7>
-  DB  127,63                              ; jg            3451f <.literal16+0x6ef>
+  DB  127,63                              ; jg            33ef3 <.literal16+0x6e3>
+  DB  114,249                             ; jb            33eaf <.literal16+0x69f>
+  DB  127,63                              ; jg            33ef7 <.literal16+0x6e7>
+  DB  114,249                             ; jb            33eb3 <.literal16+0x6a3>
+  DB  127,63                              ; jg            33efb <.literal16+0x6eb>
+  DB  114,249                             ; jb            33eb7 <.literal16+0x6a7>
+  DB  127,63                              ; jg            33eff <.literal16+0x6ef>
   DB  3,0                                 ; add           (%rax),%eax
   DB  0,0                                 ; add           %al,(%rax)
   DB  3,0                                 ; add           (%rax),%eax
@@ -51183,9 +50923,9 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,45,16,17,192,45                 ; ljmp          *0x2dc01110(%rip)        # 2dc35615 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc023f9>
+  DB  255,45,16,17,192,45                 ; ljmp          *0x2dc01110(%rip)        # 2dc34ff5 <_sk_srcover_bgra_8888_sse2_lowp+0x2dc02405>
   DB  16,17                               ; adc           %dl,(%rcx)
-  DB  192,45,16,17,192,45,16              ; shrb          $0x10,0x2dc01110(%rip)        # 2dc3561e <_sk_srcover_bgra_8888_sse2_lowp+0x2dc02402>
+  DB  192,45,16,17,192,45,16              ; shrb          $0x10,0x2dc01110(%rip)        # 2dc34ffe <_sk_srcover_bgra_8888_sse2_lowp+0x2dc0240e>
   DB  17,192                              ; adc           %eax,%eax
   DB  18,120,57                           ; adc           0x39(%rax),%bh
   DB  64,18,120,57                        ; adc           0x39(%rax),%dil
@@ -51289,14 +51029,14 @@
   DB  0,248                               ; add           %bh,%al
   DB  0,248                               ; add           %bh,%al
   DB  0,248                               ; add           %bh,%al
-  DB  224,255                             ; loopne        34601 <.literal16+0x7d1>
-  DB  224,255                             ; loopne        34603 <.literal16+0x7d3>
-  DB  224,255                             ; loopne        34605 <.literal16+0x7d5>
-  DB  224,255                             ; loopne        34607 <.literal16+0x7d7>
-  DB  224,255                             ; loopne        34609 <.literal16+0x7d9>
-  DB  224,255                             ; loopne        3460b <.literal16+0x7db>
-  DB  224,255                             ; loopne        3460d <.literal16+0x7dd>
-  DB  224,255                             ; loopne        3460f <.literal16+0x7df>
+  DB  224,255                             ; loopne        33fe1 <.literal16+0x7d1>
+  DB  224,255                             ; loopne        33fe3 <.literal16+0x7d3>
+  DB  224,255                             ; loopne        33fe5 <.literal16+0x7d5>
+  DB  224,255                             ; loopne        33fe7 <.literal16+0x7d7>
+  DB  224,255                             ; loopne        33fe9 <.literal16+0x7d9>
+  DB  224,255                             ; loopne        33feb <.literal16+0x7db>
+  DB  224,255                             ; loopne        33fed <.literal16+0x7dd>
+  DB  224,255                             ; loopne        33fef <.literal16+0x7df>
   DB  15,0,15                             ; str           (%rdi)
   DB  0,15                                ; add           %cl,(%rdi)
   DB  0,15                                ; add           %cl,(%rdi)
@@ -51369,9 +51109,9 @@
   DB  4,0                                 ; add           $0x0,%al
   DB  0,0                                 ; add           %al,(%rax)
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            346ab <.literal8+0x1b>
+  DB  127,0                               ; jg            3408b <.literal8+0x1b>
   DB  0,255                               ; add           %bh,%bh
-  DB  127,0                               ; jg            346af <.literal8+0x1f>
+  DB  127,0                               ; jg            3408f <.literal8+0x1f>
   DB  0,0                                 ; add           %al,(%rax)
   DB  128,0,0                             ; addb          $0x0,(%rax)
   DB  0                                   ; .byte         0x0
diff --git a/src/jumper/SkJumper_stages.cpp b/src/jumper/SkJumper_stages.cpp
index 980c8c2..96c0cd5 100644
--- a/src/jumper/SkJumper_stages.cpp
+++ b/src/jumper/SkJumper_stages.cpp
@@ -866,7 +866,7 @@
 
 // Used by load_ and store_ stages to get to the right (dx,dy) starting point of contiguous memory.
 template <typename T>
-SI T* ptr_at_xy(const SkJumper_MemoryCtx* ctx, int dx, int dy) {
+SI T* ptr_at_xy(const SkJumper_MemoryCtx* ctx, size_t dx, size_t dy) {
     return (T*)ctx->pixels + dy*ctx->stride + dx;
 }